Token-Limits und Budgets halten KI-Ausgaben vorhersehbar und im Verhältnis zum Wert, den KI liefert. Caps setzen, Alerts erhalten, Kontrolle behalten.Documentation Index
Fetch the complete documentation index at: https://help.pantaos.com/llms.txt
Use this file to discover all available pages before exploring further.
Die Hierarchie
- Workspace — die Decke für die ganze Organisation
- Team — Anteile pro Abteilung
- Person — Caps für Einzelne (selten nötig)
- Assistent — Caps für inhärent teure Assistenten
Budget setzen
Durchsetzungs-Modi
Soft Cap
Soft Cap
Bei Überschreitung warnen, nicht blockieren. Hilfreich in frühen Rollouts, in denen Sie lernen wollen, bevor Sie hart durchsetzen.
Hard Cap
Hard Cap
KI-Aufrufe blockieren, die das Budget überschreiten würden. Nutzer:innen sehen eine klare Meldung und können bei Admins eskalieren.
Drosselungs-Cap
Drosselungs-Cap
Operationen erlauben, aber bei Überschreitung auf günstigere Modelle herabstufen. Guter Mittelweg.
Befristete Anhebungen
Kampagnen-Boost
Kurzfristige Anhebung während eines Launches oder Quartals-Pushs. Mit Enddatum.
Projekt-Allokation
Eigenes Budget für ein Projekt, geteilt von seinen Mitgliedern.
Power-User-Ausnahme
Cap einer einzelnen Person bei temporär hohem Volumenbedarf anheben.
Workspace-Surge
Workspace-Cap für einen Monat anheben — mit klarem Audit-Trail.
Spar-Tipps
Mittelklasse als Default
Die meisten Chats brauchen nicht das größte Modell. Top-Klasse für Assistenten reservieren, die sie brauchen.
System-Prompts kürzen
Lange Prompts werden bei jeder Runde abgerechnet. Straffen.
Teure Assistenten deckeln
Pro-Assistenten-Caps verhindern, dass schwere Nutzung das Team-Budget aufbraucht.
Monatlich prüfen
30 Minuten pro Monat reichen, um Verbrauch im Griff zu halten.
