Was es ist
Token-Management ist die Art und Weise, wie PANTA OS KI-Ausgaben planbar hält. Das Konzept besteht aus drei Komponenten: einem Budget auf Ebene des Arbeitsbereichs, das durch den PANTA OS Plan festgelegt wird, optionalen Limits pro Modell, die von Administratoren konfiguriert werden, und einem automatischen Fallback, der Anfragen an ein günstigeres Modell weiterleitet, sobald ein Limit erreicht ist. Ein zweiter Tab, Analysen, ergänzt die Token-Limits um ein Nutzungs-Dashboard für Assistenten und Apps sowie um einen CSV-Export.-(2).png?fit=max&auto=format&n=bxdWHin1js2LVo8f&q=85&s=01a88ac6ae48a913cb13334143b5fa50)
Warum es wichtig ist
KI-Kosten wachsen mit der Verbreitung. Ohne Struktur bleibt dieses Wachstum unsichtbar, bis die nächste Rechnung kommt. Mit Struktur hat die Leitung einen planbaren Rahmen, Administratoren haben die Werkzeuge, um den Verbrauch zu steuern, und Nutzer können ohne manuellen Eingriff weiterarbeiten, wenn ein Limit erreicht ist.Planbare Ausgaben
Das Plan-Budget ist durch deinen PANTA OS Plan fest vorgegeben. Die Ausgaben können den vereinbarten Rahmen nicht überraschend überschreiten.
Kontrolle pro Modell
Optionale Limits pro Modell erlauben es Administratoren, den Verbrauch einzelner Modelle zu drosseln, besonders bei den teuersten.
Kontinuität für Nutzer
Der automatische Fallback leitet Anfragen an ein günstigeres Modell weiter, sobald ein Modell-Limit erreicht ist, damit Nutzer mitten in einer Aufgabe keinen Fehler sehen.
Übersicht an einem Ort
Der Tab Token-Limits im Admin Panel zeigt auf einen Blick die Ausgaben des aktuellen Zyklus, die Aufschlüsselung pro Modell und den aktiven Abrechnungszeitraum.
Die drei Komponenten
Plan-Budget
Das Zyklus-Budget des Arbeitsbereichs, das durch den PANTA OS Plan festgelegt wird. In der Oberfläche schreibgeschützt; Änderungen erfolgen über den PANTA OS Kundenkontakt.
Mehrverbrauchs-Limit
Ein zusätzliches Kontingent über das Plan-Budget hinaus. Ebenfalls auf Planebene und in der Oberfläche schreibgeschützt.
Limits pro Modell
Optionale Euro-Limits pro Modell und Zyklus, festgelegt von Administratoren. Nützlich, wenn ein Modell die Rechnung treibt.
Automatischer Fallback
Ein Schalter auf Ebene des Arbeitsbereichs, der Anfragen an ein günstigeres Modell weiterleitet, sobald ein Modell-Limit erreicht ist. Hält die Arbeit ohne manuellen Eingriff am Laufen.
So funktioniert es in der Praxis
Der Plan definiert den Rahmen
Geplantes Budget und Mehrverbrauchs-Limits kommen mit deinem PANTA OS Plan. Administratoren sehen die Werte im Admin Panel unter Token-Limits, bearbeiten sie aber nicht in der Oberfläche. Mehrverbrauchs-Limits werden von Administratoren bestätigt, aber vom PANTA OS Team festgelegt.
Administratoren begrenzen optional einzelne Modelle
Für Modelle, die Kosten treiben, können Administratoren in der Tabelle der Modell-Limits ein Euro-Limit pro Zyklus festlegen. Das Setzen eines Limits ist optional; bleibt es leer, zieht das Modell aus dem gemeinsamen Budget-Pool des Arbeitsbereichs.
Der automatische Fallback entscheidet, was beim Limit passiert
Ist der Schalter aktiviert, wird eine Anfrage, die das Modell-Limit erreicht, an ein verfügbares günstigeres Modell weitergeleitet, und der Nutzer sieht keinen Fehler. Ist er deaktiviert, schlägt die Anfrage fehl, bis der Zyklus zurückgesetzt wird.
Wo du die Zahlen siehst
Der Tab Token-Limits im Admin Panel zeigt drei Bereiche:Ausgaben & Budget
Ausgaben des aktuellen Zyklus, Plan-Budget, Mehrverbrauchs-Limit und eine Fortschrittsanzeige mit dem Verhältnis von Ausgegebenem zu Erlaubtem.
Modell-Limits
Tabelle pro Modell mit dem Verbrauch des aktuellen Zyklus, einem optionalen Euro-Limit und einem Schalter zum Aktivieren.
Ausgaben nach Modell
Eine Aufschlüsselung der Zyklus-Ausgaben nach Modell in Euro und als Prozentsatz der Gesamtausgaben. Nützlich, um Kostentreiber zu erkennen.
Schalter für automatischen Fallback
Ein einzelner Schalter auf Ebene des Arbeitsbereichs, der das Verhalten steuert, wenn ein Modell-Limit erreicht ist.
Analysen-Dashboard
Der Tab Analysen im Admin Panel ergänzt die Token-Limits um Nutzungsansichten mit Fokus auf Verbreitung und Wert.Top-Workflows nach Nutzung
Ein Balkendiagramm der am häufigsten genutzten Apps im Arbeitsbereich.
Top-Assistenten nach Nutzung
Eine Rangliste der am häufigsten genutzten Assistenten mit ihren Anfragezahlen und den gesamten Token-Werten.
Zeit bis zum ersten Wert
Ein Diagramm, das zeigt, wie schnell neue Nutzer eine produktive Nutzung erreichen, mit einem Median-TTFV-Wert.
Schnellaktionen
Zwei Schnellzugriffe: Nutzer verwalten öffnet die Nutzerverwaltung; Analysen-Export lädt einen Nutzungsbericht als CSV herunter.
Tipps und Best Practices
- Lass den automatischen Fallback standardmäßig aktiviert. Der Unterschied zwischen Nutzern, die auf einen Fehler stoßen, und Nutzern, die weiterarbeiten, ist erheblich; die Plattform wählt immer ein erlaubtes Modell.
- Begrenze nur die Modelle, die Kosten treiben. Limits auf günstige Modelle erzeugen Reibung, ohne Geld zu sparen.
- Sieh dir den Tab Token-Limits während der Einführung wöchentlich an. Eine unerwartete Spitze bei einem bestimmten Modell früh zu erkennen, ist am besten.
- Sprich für Änderungen am Plan-Budget mit deinem PANTA OS Kundenkontakt. Plan-Budget und Mehrverbrauch sind Entscheidungen auf Planebene, keine Änderungen in der Oberfläche.
Hilfecenter
Kann ich ein Budget für einen einzelnen Nutzer oder ein Team festlegen
Kann ich ein Budget für einen einzelnen Nutzer oder ein Team festlegen
Nein. Token-Limits bestehen auf Ebene des Arbeitsbereichs (Plan-Budget und Mehrverbrauch) und auf Ebene pro Modell. Es gibt kein Limit pro Team, pro Nutzer oder pro Assistent.
Was passiert, wenn ein Modell-Limit erreicht ist
Was passiert, wenn ein Modell-Limit erreicht ist
Ist der automatische Fallback aktiviert, werden neue Anfragen an diesem Modell an ein verfügbares günstigeres Modell weitergeleitet, und die Arbeit läuft weiter. Ist der Schalter deaktiviert, schlagen Anfragen am begrenzten Modell fehl, bis der Zyklus zurückgesetzt wird.
Kann ich das Plan-Budget selbst ändern
Kann ich das Plan-Budget selbst ändern
Nein. Plan-Budget und Mehrverbrauchs-Limit sind Werte auf Planebene, in der Oberfläche mit einem Schloss-Symbol gekennzeichnet. Um eines von beiden zu ändern, wende dich bezüglich einer Planänderung an deine PANTA OS Kundenbetreuung.
Wann wird der Abrechnungszyklus zurückgesetzt
Wann wird der Abrechnungszyklus zurückgesetzt
Der Abrechnungszyklus wird an demselben Kalendertag jedes Monats zurückgesetzt, basierend auf dem Datum, an dem dein Plan begonnen hat.
Wo wird die praktische Konfiguration vorgenommen
Wo wird die praktische Konfiguration vorgenommen
Im Admin Panel unter Token-Limits. Dort findest du die Limits pro Modell, den Schalter für den automatischen Fallback und die Zyklus-Ansicht.
