Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://help.pantaos.com/llms.txt

Use this file to discover all available pages before exploring further.

Token-Limits und Budgets halten KI-Ausgaben vorhersehbar und im Verhältnis zum Wert, den KI liefert. Caps setzen, Alerts erhalten, Kontrolle behalten.

Die Hierarchie

Budgets stapeln:
  • Workspace — die Decke für die ganze Organisation
  • Team — Anteile pro Abteilung
  • Person — Caps für Einzelne (selten nötig)
  • Assistent — Caps für inhärent teure Assistenten
Eine Anfrage muss unter jedem geltenden Budget passen, um durchzulaufen.

Budget setzen

Einstellungen → Budgets öffnen

Nur für Admins.

Ebene wählen

Workspace, Team, Person oder Assistent.

Cap und Periode setzen

Monatlich am häufigsten; quartalsweise passt für projektbasierte Teams.

Alerts konfigurieren

50 %, 80 %, 100 % — Slack, E-Mail oder In-App.

Durchsetzung wählen

Soft (nur warnen) oder Hard (bei 100 % blockieren).

Durchsetzungs-Modi

Bei Überschreitung warnen, nicht blockieren. Hilfreich in frühen Rollouts, in denen Sie lernen wollen, bevor Sie hart durchsetzen.
KI-Aufrufe blockieren, die das Budget überschreiten würden. Nutzer:innen sehen eine klare Meldung und können bei Admins eskalieren.
Operationen erlauben, aber bei Überschreitung auf günstigere Modelle herabstufen. Guter Mittelweg.

Befristete Anhebungen

Kampagnen-Boost

Kurzfristige Anhebung während eines Launches oder Quartals-Pushs. Mit Enddatum.

Projekt-Allokation

Eigenes Budget für ein Projekt, geteilt von seinen Mitgliedern.

Power-User-Ausnahme

Cap einer einzelnen Person bei temporär hohem Volumenbedarf anheben.

Workspace-Surge

Workspace-Cap für einen Monat anheben — mit klarem Audit-Trail.

Spar-Tipps

Mittelklasse als Default

Die meisten Chats brauchen nicht das größte Modell. Top-Klasse für Assistenten reservieren, die sie brauchen.

System-Prompts kürzen

Lange Prompts werden bei jeder Runde abgerechnet. Straffen.

Teure Assistenten deckeln

Pro-Assistenten-Caps verhindern, dass schwere Nutzung das Team-Budget aufbraucht.

Monatlich prüfen

30 Minuten pro Monat reichen, um Verbrauch im Griff zu halten.