> ## Documentation Index
> Fetch the complete documentation index at: https://help.pantaos.com/llms.txt
> Use this file to discover all available pages before exploring further.

# Token-Management

> Wie PANTA OS KI-Ausgaben angeht: ein Plan-Budget, optionale Limits pro Modell und ein automatischer Fallback, damit die Arbeit weiterläuft.

## Was es ist

Token-Management ist die Art und Weise, wie PANTA OS KI-Ausgaben planbar hält. Das Konzept besteht aus drei Komponenten: einem Budget auf Ebene des Arbeitsbereichs, das durch den PANTA OS Plan festgelegt wird, optionalen Limits pro Modell, die von Administratoren konfiguriert werden, und einem automatischen Fallback, der Anfragen an ein günstigeres Modell weiterleitet, sobald ein Limit erreicht ist. Ein zweiter Tab, Analysen, ergänzt die Token-Limits um ein Nutzungs-Dashboard für Assistenten und Apps sowie um einen CSV-Export.

<Frame>
  <img src="https://mintcdn.com/panta/bxdWHin1js2LVo8f/images/Panta-Dokumentationen-(DE)-(2).png?fit=max&auto=format&n=bxdWHin1js2LVo8f&q=85&s=01a88ac6ae48a913cb13334143b5fa50" alt="Panta Dokumentationen (DE) (2)" width="1920" height="1080" data-path="images/Panta-Dokumentationen-(DE)-(2).png" />
</Frame>

Diese Seite ist der strategische Überblick. Die konkrete Konfiguration im Alltag erfolgt im Admin Panel unter Token-Limits.

## Warum es wichtig ist

KI-Kosten wachsen mit der Verbreitung. Ohne Struktur bleibt dieses Wachstum unsichtbar, bis die nächste Rechnung kommt. Mit Struktur hat die Leitung einen planbaren Rahmen, Administratoren haben die Werkzeuge, um den Verbrauch zu steuern, und Nutzer können ohne manuellen Eingriff weiterarbeiten, wenn ein Limit erreicht ist.

<CardGroup cols={2}>
  <Card title="Planbare Ausgaben" icon="shield">
    Das Plan-Budget ist durch deinen PANTA OS Plan fest vorgegeben. Die Ausgaben können den vereinbarten Rahmen nicht überraschend überschreiten.
  </Card>

  <Card title="Kontrolle pro Modell" icon="brain">
    Optionale Limits pro Modell erlauben es Administratoren, den Verbrauch einzelner Modelle zu drosseln, besonders bei den teuersten.
  </Card>

  <Card title="Kontinuität für Nutzer" icon="play">
    Der automatische Fallback leitet Anfragen an ein günstigeres Modell weiter, sobald ein Modell-Limit erreicht ist, damit Nutzer mitten in einer Aufgabe keinen Fehler sehen.
  </Card>

  <Card title="Übersicht an einem Ort" icon="eye">
    Der Tab Token-Limits im Admin Panel zeigt auf einen Blick die Ausgaben des aktuellen Zyklus, die Aufschlüsselung pro Modell und den aktiven Abrechnungszeitraum.
  </Card>
</CardGroup>

## Die drei Komponenten

<CardGroup cols={2}>
  <Card title="Plan-Budget" icon="lock">
    Das Zyklus-Budget des Arbeitsbereichs, das durch den PANTA OS Plan festgelegt wird. In der Oberfläche schreibgeschützt; Änderungen erfolgen über den PANTA OS Kundenkontakt.
  </Card>

  <Card title="Mehrverbrauchs-Limit" icon="lock">
    Ein zusätzliches Kontingent über das Plan-Budget hinaus. Ebenfalls auf Planebene und in der Oberfläche schreibgeschützt.
  </Card>

  <Card title="Limits pro Modell" icon="brain">
    Optionale Euro-Limits pro Modell und Zyklus, festgelegt von Administratoren. Nützlich, wenn ein Modell die Rechnung treibt.
  </Card>

  <Card title="Automatischer Fallback" icon="rotate-cw">
    Ein Schalter auf Ebene des Arbeitsbereichs, der Anfragen an ein günstigeres Modell weiterleitet, sobald ein Modell-Limit erreicht ist. Hält die Arbeit ohne manuellen Eingriff am Laufen.
  </Card>
</CardGroup>

## So funktioniert es in der Praxis

<Steps>
  <Step title="Der Plan definiert den Rahmen" icon="lock">
    Geplantes Budget und Mehrverbrauchs-Limits kommen mit deinem PANTA OS Plan. Administratoren sehen die Werte im Admin Panel unter Token-Limits, bearbeiten sie aber nicht in der Oberfläche. Mehrverbrauchs-Limits werden von Administratoren bestätigt, aber vom PANTA OS Team festgelegt.
  </Step>

  <Step title="Administratoren begrenzen optional einzelne Modelle" icon="brain">
    Für Modelle, die Kosten treiben, können Administratoren in der Tabelle der Modell-Limits ein Euro-Limit pro Zyklus festlegen. Das Setzen eines Limits ist optional; bleibt es leer, zieht das Modell aus dem gemeinsamen Budget-Pool des Arbeitsbereichs.
  </Step>

  <Step title="Der automatische Fallback entscheidet, was beim Limit passiert" icon="rotate-cw">
    Ist der Schalter aktiviert, wird eine Anfrage, die das Modell-Limit erreicht, an ein verfügbares günstigeres Modell weitergeleitet, und der Nutzer sieht keinen Fehler. Ist er deaktiviert, schlägt die Anfrage fehl, bis der Zyklus zurückgesetzt wird.
  </Step>

  <Step title="Der Zyklus wird monatlich zurückgesetzt" icon="rotate-ccw">
    Alle Zähler werden monatlich an dem Kalendertag zurückgesetzt, an dem dein Plan begonnen hat.
  </Step>
</Steps>

## Wo du die Zahlen siehst

Der Tab Token-Limits im Admin Panel zeigt drei Bereiche:

<CardGroup cols={2}>
  <Card title="Ausgaben & Budget" icon="trending-up">
    Ausgaben des aktuellen Zyklus, Plan-Budget, Mehrverbrauchs-Limit und eine Fortschrittsanzeige mit dem Verhältnis von Ausgegebenem zu Erlaubtem.
  </Card>

  <Card title="Modell-Limits" icon="brain">
    Tabelle pro Modell mit dem Verbrauch des aktuellen Zyklus, einem optionalen Euro-Limit und einem Schalter zum Aktivieren.
  </Card>

  <Card title="Ausgaben nach Modell" icon="coins">
    Eine Aufschlüsselung der Zyklus-Ausgaben nach Modell in Euro und als Prozentsatz der Gesamtausgaben. Nützlich, um Kostentreiber zu erkennen.
  </Card>

  <Card title="Schalter für automatischen Fallback" icon="rotate-cw">
    Ein einzelner Schalter auf Ebene des Arbeitsbereichs, der das Verhalten steuert, wenn ein Modell-Limit erreicht ist.
  </Card>
</CardGroup>

## Analysen-Dashboard

Der Tab Analysen im Admin Panel ergänzt die Token-Limits um Nutzungsansichten mit Fokus auf Verbreitung und Wert.

<CardGroup cols={2}>
  <Card title="Top-Workflows nach Nutzung" icon="arrow-big-up">
    Ein Balkendiagramm der am häufigsten genutzten Apps im Arbeitsbereich.
  </Card>

  <Card title="Top-Assistenten nach Nutzung" icon="list">
    Eine Rangliste der am häufigsten genutzten Assistenten mit ihren Anfragezahlen und den gesamten Token-Werten.
  </Card>

  <Card title="Zeit bis zum ersten Wert" icon="clock">
    Ein Diagramm, das zeigt, wie schnell neue Nutzer eine produktive Nutzung erreichen, mit einem Median-TTFV-Wert.
  </Card>

  <Card title="Schnellaktionen" icon="zap">
    Zwei Schnellzugriffe: Nutzer verwalten öffnet die Nutzerverwaltung; Analysen-Export lädt einen Nutzungsbericht als CSV herunter.
  </Card>
</CardGroup>

## Tipps und Best Practices

* Lass den automatischen Fallback standardmäßig aktiviert. Der Unterschied zwischen Nutzern, die auf einen Fehler stoßen, und Nutzern, die weiterarbeiten, ist erheblich; die Plattform wählt immer ein erlaubtes Modell.
* Begrenze nur die Modelle, die Kosten treiben. Limits auf günstige Modelle erzeugen Reibung, ohne Geld zu sparen.
* Sieh dir den Tab Token-Limits während der Einführung wöchentlich an. Eine unerwartete Spitze bei einem bestimmten Modell früh zu erkennen, ist am besten.
* Sprich für Änderungen am Plan-Budget mit deinem PANTA OS Kundenkontakt. Plan-Budget und Mehrverbrauch sind Entscheidungen auf Planebene, keine Änderungen in der Oberfläche.

<Tip>
  PANTA OS bietet keine Token-Limits pro Team oder pro Nutzer. Die Ausgabenkontrolle erfolgt über das Plan-Budget, die Limits pro Modell und den automatischen Fallback. Das Modell ist bewusst einfach gehalten, um die Administration überschaubar zu halten.
</Tip>

## Hilfecenter

<AccordionGroup>
  <Accordion title="Kann ich ein Budget für einen einzelnen Nutzer oder ein Team festlegen" icon="users">
    Nein. Token-Limits bestehen auf Ebene des Arbeitsbereichs (Plan-Budget und Mehrverbrauch) und auf Ebene pro Modell. Es gibt kein Limit pro Team, pro Nutzer oder pro Assistent.
  </Accordion>

  <Accordion title="Was passiert, wenn ein Modell-Limit erreicht ist" icon="rotate-cw">
    Ist der automatische Fallback aktiviert, werden neue Anfragen an diesem Modell an ein verfügbares günstigeres Modell weitergeleitet, und die Arbeit läuft weiter. Ist der Schalter deaktiviert, schlagen Anfragen am begrenzten Modell fehl, bis der Zyklus zurückgesetzt wird.
  </Accordion>

  <Accordion title="Kann ich das Plan-Budget selbst ändern" icon="lock">
    Nein. Plan-Budget und Mehrverbrauchs-Limit sind Werte auf Planebene, in der Oberfläche mit einem Schloss-Symbol gekennzeichnet. Um eines von beiden zu ändern, wende dich bezüglich einer Planänderung an deine PANTA OS Kundenbetreuung.
  </Accordion>

  <Accordion title="Wann wird der Abrechnungszyklus zurückgesetzt" icon="rotate-ccw">
    Der Abrechnungszyklus wird an demselben Kalendertag jedes Monats zurückgesetzt, basierend auf dem Datum, an dem dein Plan begonnen hat.
  </Accordion>

  <Accordion title="Wo wird die praktische Konfiguration vorgenommen" icon="settings">
    Im Admin Panel unter Token-Limits. Dort findest du die Limits pro Modell, den Schalter für den automatischen Fallback und die Zyklus-Ansicht.
  </Accordion>
</AccordionGroup>
