Ausgabensteuerung für Arbeitsbereich und einzelne Modelle im Admin Panel im Tab Token-Limits. Plan-Budget, Überschreitungs-Spielraum und automatischer Fallback.
Token-Limits und Budgets ist der Bereich des Admin Panels, in dem Administratoren die Ausgaben des Arbeitsbereichs für KI-Nutzung sehen und steuern. Er öffnet sich unter Admin Panel → Token-Limits und ist die einzige Stelle in PANTA OS, an der Token-bezogene Konfiguration stattfindet.Die Seite hat drei Bereiche: Ausgaben & Budget (die Sicht auf Ebene des Arbeitsbereichs), Modell-Limits (optionale Obergrenzen pro Modell) und Ausgaben pro Modell (eine Aufschlüsselung der Ausgaben nach Modell im aktuellen Zyklus).
Diese Seite behandelt die tägliche Verwaltung der Budgets. Für die strategische Übersicht, wie PANTA OS Token-Management angeht, siehe Token-Management.
KI-Kosten wachsen mit der Nutzung. Ohne Limits ist das Wachstum unsichtbar, bis die Rechnung kommt. Der Tab Token-Limits gibt Administratoren einen festen Rahmen zum Arbeiten und zusätzlich optionale Werkzeuge, um den Verbrauch pro Modell zu formen.
Vorhersehbarkeit
Das Plan-Budget ist durch deinen PANTA OS Plan festgelegt, sodass Ausgaben den vereinbarten Rahmen nicht überraschend überschreiten können.
Sichtbarkeit pro Zyklus
Die Seite zeigt, was im aktuellen Abrechnungszyklus ausgegeben wurde, gegen das, was erlaubt ist, mit einem Fortschrittsanzeiger.
Steuerung pro Modell
Optionale Modell-Limits deckeln den Verbrauch einzelner Modelle. Nützlich, wenn ein teures Modell die Rechnung treibt.
Automatischer Fallback
Wenn ein Modell-Limit erreicht wird, können Anfragen automatisch an ein günstigeres Modell weitergeleitet werden, sodass die Arbeit ohne manuelles Eingreifen weitergeht.
Klicke auf Admin unten in der Seitenleiste. Nur für Administratoren sichtbar.
Token-Limits öffnen
Wechsle zum Tab Token-Limits in der Tab-Leiste des Admin Panels.
Status des aktuellen Zyklus lesen
Der Bereich Ausgaben & Budget oben zeigt die aktive Abrechnungsperiode, den bisher im Zyklus ausgegebenen Betrag, das Plan-Budget und den Überschreitungs-Spielraum.
Über automatischen Fallback entscheiden
Schalte “Bei erreichtem Modell-Limit automatisch zu einem günstigeren Modell wechseln” ein, damit die Arbeit weitergeht, wenn ein Modell-Limit erreicht wird. Speichere die Änderung mit Speichern.
Modell-Limits bei Bedarf setzen
Gib im Bereich Modell-Limits einen Euro-Betrag ein und aktiviere den Schalter für jedes Modell, dessen Verbrauch du deckeln möchtest.
Tatsächliche Modell-Ausgaben prüfen
Der Bereich Ausgaben pro Modell schlüsselt den aktuellen Zyklus nach Modell auf, in Euro und als prozentualer Anteil an den Gesamtausgaben.
Der obere Bereich ist der Überblick auf Ebene des Arbeitsbereichs. Er ist die zentrale Wahrheitsquelle für die Ausgaben im Zyklus.
Aktuelle Abrechnungsperiode
Der aktive Abrechnungszyklus, oben rechts im Bereich als Datumsbereich angezeigt.
In diesem Zyklus ausgegeben
Der bisher im Zyklus tatsächlich verbrauchte Betrag, in Euro.
Plan-Budget
Das Budget des Arbeitsbereichs für den Zyklus, gesetzt durch den PANTA OS Plan. Nur zum Lesen; das Schlosssymbol zeigt, dass dieser Wert in der UI nicht editierbar ist.
Überschreitungs-Limit
Ein zusätzlicher Überschreitungs-Spielraum oberhalb des Plan-Budgets. Ebenfalls nur zum Lesen; das Schlosssymbol zeigt, dass dieser Wert in der UI nicht editierbar ist.
Fortschrittsbalken
Ein visueller Anzeiger des Zyklus-Fortschritts mit dem Verhältnis von Ausgegeben zu Erlaubt und einer Prozentangabe. Der Status darunter (“Innerhalb des Plan-Budgets”) zeigt, ob du noch im Plan bist oder bereits den Überschreitungs-Spielraum nutzt.
Monatliche Rücksetzung
Der Abrechnungszyklus setzt sich monatlich an dem Kalendertag zurück, an dem dein Plan begonnen hat.
Unter dem Budget-Überblick sitzt ein einzelner Schalter: “Bei erreichtem Modell-Limit automatisch zu einem günstigeren Modell wechseln”.
Automatischer Fallback
Wenn ein Modell-Limit erreicht ist und dieser Schalter aktiv ist, leitet PANTA OS neue Anfragen automatisch an ein günstigeres Modell weiter. Nutzer arbeiten weiter, ohne einen Fehler zu sehen. Wenn der Schalter deaktiviert ist, schlagen Anfragen an ein gedeckeltes Modell fehl, sobald das Limit erreicht ist. Änderungen mit Speichern rechts im Bereich übernehmen.
Der Bereich Modell-Limits setzt optionale Obergrenzen pro Modell. Die UI beschreibt ihn so: “Optional: Setze ein Euro-Limit pro Zyklus für ein bestimmtes Modell. Wenn das Limit erreicht ist, werden Anfragen automatisch an ein günstigeres Modell weitergeleitet (oder blockiert, wenn keines verfügbar ist). Leer lassen, um den geteilten Organisationsbudget-Pool zu nutzen.”Die Tabelle listet jedes im Arbeitsbereich verfügbare Modell mit vier Spalten:
Modell
Der Modellname (zum Beispiel Claude Sonnet 4.5, GPT-4o, GPT-5, GPT-5 Mini, GPT-5.4 Mini).
In diesem Zyklus
Der Betrag, den der Arbeitsbereich in diesem Modell im aktuellen Zyklus ausgegeben hat, in Euro.
Limit
Ein Eingabefeld für das Euro-Limit pro Zyklus für dieses Modell. Leer lassen, um den geteilten Budget-Pool des Arbeitsbereichs ohne modellspezifische Obergrenze zu nutzen.
Aktiviert
Schalter, der das Modell-Limit aktiviert. Nutze ihn zusammen mit dem Limit-Wert.
Der untere Bereich schlüsselt die tatsächlichen Ausgaben des Zyklus nach Modell auf.
Ausgaben pro Modell
Jedes Modell, das im Zyklus Verbrauch erzeugt hat, wird mit dem Euro-Betrag und dem prozentualen Anteil an den Gesamtausgaben des Zyklus gelistet.
Nutze sie, um Kostentreiber zu finden
Modelle oben in der Liste sind die größten Beitragenden zu deiner Rechnung. Vergleiche mit der Tabelle Modell-Limits, um zu entscheiden, welche Modelle gedeckelt werden sollten.
Lass den automatischen Fallback standardmäßig aktiv. Er ist der Unterschied zwischen Nutzern, die einen Fehler sehen, und Nutzern, die weiterarbeiten, und die Plattform wählt immer ein erlaubtes Modell.
Deckele nur die Modelle, die Kosten treiben. Nutze Ausgaben pro Modell, um sie zu identifizieren; Limits auf günstigen Modellen erzeugen Reibung, ohne Geld zu sparen.
Beobachte den Fortschrittsbalken gegen Ende des Zyklus. Wenn du dich dem Plan-Budget näherst, ist in den letzten Tagen damit zu rechnen, dass der Überschreitungs-Spielraum genutzt wird.
Prüfe die Seite wöchentlich während eines Rollouts. Einen unerwarteten Anstieg eines Modells früh zu erkennen, ist günstiger, als es im nächsten Abrechnungszyklus zu entdecken.
Wenn das Plan-Budget zu eng wirkt, ist das Gespräch mit deinem PANTA OS Kundenkontakt der richtige Schritt, nicht eine Änderung in der UI. Plan-Budget und Überschreitungs-Limit sind Entscheidungen auf Planebene.
Token-Limits in PANTA OS gelten nur auf Ebene des Arbeitsbereichs und pro Modell. Es gibt keine Token-Obergrenzen pro Team, pro Nutzer oder pro Assistent. Die Ausgabensteuerung läuft über den Planrahmen, die Modell-Limits und den automatischen Fallback.
Öffne das Admin Panel unten in der Seitenleiste und wechsle dann zum Tab Token-Limits. Dies ist die einzige Stelle in PANTA OS, an der Token-Konfiguration stattfindet.
Kann ich das Plan-Budget selbst ändern
Nein. Plan-Budget und Überschreitungs-Limit werden durch deinen PANTA OS Plan gesetzt und sind in der UI nur zum Lesen (gekennzeichnet durch das Schlosssymbol). Um einen der Werte anzuheben, wende dich an deinen PANTA OS Kundenkontakt für eine Plan-Änderung.
Kann ich ein Budget für einen einzelnen Nutzer oder ein Team setzen
Nein. Token-Limits existieren nur auf Ebene des Arbeitsbereichs (Plan-Budget plus Überschreitung) und auf Ebene des Modells. Es gibt keine Obergrenze pro Team, pro Nutzer oder pro Assistent.
Was passiert, wenn ein Modell-Limit erreicht ist
Wenn der Schalter für automatischen Fallback aktiv ist, werden neue Anfragen an ein günstigeres verfügbares Modell weitergeleitet und die Arbeit geht weiter. Wenn der Schalter deaktiviert ist, schlagen Anfragen am gedeckelten Modell fehl, bis sich der Zyklus zurücksetzt.
Was passiert, wenn Plan-Budget und Überschreitung vollständig verbraucht sind
Das Limit ist erreicht und neue Anfragen werden blockiert. Um im selben Zyklus weiterzuarbeiten, muss der Planrahmen mit deinem PANTA OS Kundenkontakt erhöht werden.
Wann setzt sich der Zyklus zurück
Der Abrechnungszyklus setzt sich monatlich an dem Kalendertag zurück, an dem dein Plan begonnen hat.
Wie sehe ich, welches Modell am meisten kostet
Scrolle zu Ausgaben pro Modell unten im Tab Token-Limits. Jedes Modell, das im aktuellen Zyklus Verbrauch erzeugt hat, wird mit seinem Euro-Betrag und prozentualen Anteil an den Gesamtausgaben gelistet.