Zum Hauptinhalt springen

Was es ist

Token-Limits und Budgets ist der Bereich des Admin Panels, in dem Administratoren die Ausgaben des Arbeitsbereichs für KI-Nutzung sehen und steuern. Er öffnet sich unter Admin Panel → Token-Limits und ist die einzige Stelle in PANTA OS, an der Token-bezogene Konfiguration stattfindet. Die Seite hat drei Bereiche: Ausgaben & Budget (die Sicht auf Ebene des Arbeitsbereichs), Modell-Limits (optionale Obergrenzen pro Modell) und Ausgaben pro Modell (eine Aufschlüsselung der Ausgaben nach Modell im aktuellen Zyklus).
Diese Seite behandelt die tägliche Verwaltung der Budgets. Für die strategische Übersicht, wie PANTA OS Token-Management angeht, siehe Token-Management.
Images Documentations (2) 4

Warum es wichtig ist

KI-Kosten wachsen mit der Nutzung. Ohne Limits ist das Wachstum unsichtbar, bis die Rechnung kommt. Der Tab Token-Limits gibt Administratoren einen festen Rahmen zum Arbeiten und zusätzlich optionale Werkzeuge, um den Verbrauch pro Modell zu formen.

Vorhersehbarkeit

Das Plan-Budget ist durch deinen PANTA OS Plan festgelegt, sodass Ausgaben den vereinbarten Rahmen nicht überraschend überschreiten können.

Sichtbarkeit pro Zyklus

Die Seite zeigt, was im aktuellen Abrechnungszyklus ausgegeben wurde, gegen das, was erlaubt ist, mit einem Fortschrittsanzeiger.

Steuerung pro Modell

Optionale Modell-Limits deckeln den Verbrauch einzelner Modelle. Nützlich, wenn ein teures Modell die Rechnung treibt.

Automatischer Fallback

Wenn ein Modell-Limit erreicht wird, können Anfragen automatisch an ein günstigeres Modell weitergeleitet werden, sodass die Arbeit ohne manuelles Eingreifen weitergeht.

So nutzt du es

Admin Panel öffnen

Klicke auf Admin unten in der Seitenleiste. Nur für Administratoren sichtbar.

Token-Limits öffnen

Wechsle zum Tab Token-Limits in der Tab-Leiste des Admin Panels.

Status des aktuellen Zyklus lesen

Der Bereich Ausgaben & Budget oben zeigt die aktive Abrechnungsperiode, den bisher im Zyklus ausgegebenen Betrag, das Plan-Budget und den Überschreitungs-Spielraum.

Über automatischen Fallback entscheiden

Schalte “Bei erreichtem Modell-Limit automatisch zu einem günstigeren Modell wechseln” ein, damit die Arbeit weitergeht, wenn ein Modell-Limit erreicht wird. Speichere die Änderung mit Speichern.

Modell-Limits bei Bedarf setzen

Gib im Bereich Modell-Limits einen Euro-Betrag ein und aktiviere den Schalter für jedes Modell, dessen Verbrauch du deckeln möchtest.

Tatsächliche Modell-Ausgaben prüfen

Der Bereich Ausgaben pro Modell schlüsselt den aktuellen Zyklus nach Modell auf, in Euro und als prozentualer Anteil an den Gesamtausgaben.

Ausgaben & Budget

Der obere Bereich ist der Überblick auf Ebene des Arbeitsbereichs. Er ist die zentrale Wahrheitsquelle für die Ausgaben im Zyklus.

Aktuelle Abrechnungsperiode

Der aktive Abrechnungszyklus, oben rechts im Bereich als Datumsbereich angezeigt.

In diesem Zyklus ausgegeben

Der bisher im Zyklus tatsächlich verbrauchte Betrag, in Euro.

Plan-Budget

Das Budget des Arbeitsbereichs für den Zyklus, gesetzt durch den PANTA OS Plan. Nur zum Lesen; das Schlosssymbol zeigt, dass dieser Wert in der UI nicht editierbar ist.

Überschreitungs-Limit

Ein zusätzlicher Überschreitungs-Spielraum oberhalb des Plan-Budgets. Ebenfalls nur zum Lesen; das Schlosssymbol zeigt, dass dieser Wert in der UI nicht editierbar ist.

Fortschrittsbalken

Ein visueller Anzeiger des Zyklus-Fortschritts mit dem Verhältnis von Ausgegeben zu Erlaubt und einer Prozentangabe. Der Status darunter (“Innerhalb des Plan-Budgets”) zeigt, ob du noch im Plan bist oder bereits den Überschreitungs-Spielraum nutzt.

Monatliche Rücksetzung

Der Abrechnungszyklus setzt sich monatlich an dem Kalendertag zurück, an dem dein Plan begonnen hat.

Der Schalter für automatischen Fallback

Unter dem Budget-Überblick sitzt ein einzelner Schalter: “Bei erreichtem Modell-Limit automatisch zu einem günstigeren Modell wechseln”.

Automatischer Fallback

Wenn ein Modell-Limit erreicht ist und dieser Schalter aktiv ist, leitet PANTA OS neue Anfragen automatisch an ein günstigeres Modell weiter. Nutzer arbeiten weiter, ohne einen Fehler zu sehen. Wenn der Schalter deaktiviert ist, schlagen Anfragen an ein gedeckeltes Modell fehl, sobald das Limit erreicht ist. Änderungen mit Speichern rechts im Bereich übernehmen.

Modell-Limits

Der Bereich Modell-Limits setzt optionale Obergrenzen pro Modell. Die UI beschreibt ihn so: “Optional: Setze ein Euro-Limit pro Zyklus für ein bestimmtes Modell. Wenn das Limit erreicht ist, werden Anfragen automatisch an ein günstigeres Modell weitergeleitet (oder blockiert, wenn keines verfügbar ist). Leer lassen, um den geteilten Organisationsbudget-Pool zu nutzen.” Die Tabelle listet jedes im Arbeitsbereich verfügbare Modell mit vier Spalten:

Modell

Der Modellname (zum Beispiel Claude Sonnet 4.5, GPT-4o, GPT-5, GPT-5 Mini, GPT-5.4 Mini).

In diesem Zyklus

Der Betrag, den der Arbeitsbereich in diesem Modell im aktuellen Zyklus ausgegeben hat, in Euro.

Limit

Ein Eingabefeld für das Euro-Limit pro Zyklus für dieses Modell. Leer lassen, um den geteilten Budget-Pool des Arbeitsbereichs ohne modellspezifische Obergrenze zu nutzen.

Aktiviert

Schalter, der das Modell-Limit aktiviert. Nutze ihn zusammen mit dem Limit-Wert.

Ausgaben pro Modell (dieser Zyklus)

Der untere Bereich schlüsselt die tatsächlichen Ausgaben des Zyklus nach Modell auf.

Ausgaben pro Modell

Jedes Modell, das im Zyklus Verbrauch erzeugt hat, wird mit dem Euro-Betrag und dem prozentualen Anteil an den Gesamtausgaben des Zyklus gelistet.

Nutze sie, um Kostentreiber zu finden

Modelle oben in der Liste sind die größten Beitragenden zu deiner Rechnung. Vergleiche mit der Tabelle Modell-Limits, um zu entscheiden, welche Modelle gedeckelt werden sollten.

Zentrale Einstellungen und Optionen

Plan-Budget

Zyklus-Budget des Arbeitsbereichs. Durch PANTA OS Plan gesetzt; in der UI nicht editierbar.

Überschreitungs-Limit

Zusätzlicher Überschreitungs-Spielraum. Durch PANTA OS Plan gesetzt; in der UI nicht editierbar.

Schalter für automatischen Fallback

Einzelner Schalter auf Ebene des Arbeitsbereichs, der Anfragen an ein günstigeres Modell weiterleitet, wenn ein Modell-Limit erreicht ist.

Euro-Obergrenzen pro Modell

Optionale Obergrenze pro Modell. Leer lassen, um den geteilten Pool des Arbeitsbereichs zu nutzen.

Monatliche Rücksetzung

Der Abrechnungszyklus setzt sich monatlich an dem Kalendertag zurück, an dem dein Plan begonnen hat.

Aufschlüsselung der Ausgaben pro Modell

Euro und Prozent pro Modell im aktuellen Zyklus, für direkte Sichtbarkeit auf Kostentreiber.

Tipps und Best Practices

  • Lass den automatischen Fallback standardmäßig aktiv. Er ist der Unterschied zwischen Nutzern, die einen Fehler sehen, und Nutzern, die weiterarbeiten, und die Plattform wählt immer ein erlaubtes Modell.
  • Deckele nur die Modelle, die Kosten treiben. Nutze Ausgaben pro Modell, um sie zu identifizieren; Limits auf günstigen Modellen erzeugen Reibung, ohne Geld zu sparen.
  • Beobachte den Fortschrittsbalken gegen Ende des Zyklus. Wenn du dich dem Plan-Budget näherst, ist in den letzten Tagen damit zu rechnen, dass der Überschreitungs-Spielraum genutzt wird.
  • Prüfe die Seite wöchentlich während eines Rollouts. Einen unerwarteten Anstieg eines Modells früh zu erkennen, ist günstiger, als es im nächsten Abrechnungszyklus zu entdecken.
  • Wenn das Plan-Budget zu eng wirkt, ist das Gespräch mit deinem PANTA OS Kundenkontakt der richtige Schritt, nicht eine Änderung in der UI. Plan-Budget und Überschreitungs-Limit sind Entscheidungen auf Planebene.
Token-Limits in PANTA OS gelten nur auf Ebene des Arbeitsbereichs und pro Modell. Es gibt keine Token-Obergrenzen pro Team, pro Nutzer oder pro Assistent. Die Ausgabensteuerung läuft über den Planrahmen, die Modell-Limits und den automatischen Fallback.

Hilfecenter

Öffne das Admin Panel unten in der Seitenleiste und wechsle dann zum Tab Token-Limits. Dies ist die einzige Stelle in PANTA OS, an der Token-Konfiguration stattfindet.
Nein. Plan-Budget und Überschreitungs-Limit werden durch deinen PANTA OS Plan gesetzt und sind in der UI nur zum Lesen (gekennzeichnet durch das Schlosssymbol). Um einen der Werte anzuheben, wende dich an deinen PANTA OS Kundenkontakt für eine Plan-Änderung.
Nein. Token-Limits existieren nur auf Ebene des Arbeitsbereichs (Plan-Budget plus Überschreitung) und auf Ebene des Modells. Es gibt keine Obergrenze pro Team, pro Nutzer oder pro Assistent.
Wenn der Schalter für automatischen Fallback aktiv ist, werden neue Anfragen an ein günstigeres verfügbares Modell weitergeleitet und die Arbeit geht weiter. Wenn der Schalter deaktiviert ist, schlagen Anfragen am gedeckelten Modell fehl, bis sich der Zyklus zurücksetzt.
Das Limit ist erreicht und neue Anfragen werden blockiert. Um im selben Zyklus weiterzuarbeiten, muss der Planrahmen mit deinem PANTA OS Kundenkontakt erhöht werden.
Der Abrechnungszyklus setzt sich monatlich an dem Kalendertag zurück, an dem dein Plan begonnen hat.
Scrolle zu Ausgaben pro Modell unten im Tab Token-Limits. Jedes Modell, das im aktuellen Zyklus Verbrauch erzeugt hat, wird mit seinem Euro-Betrag und prozentualen Anteil an den Gesamtausgaben gelistet.
Zuletzt geändert am 5. Juni 2026