Zum Hauptinhalt springen

Was diese Seite abdeckt

Der Begriff „Künstliche Intelligenz“ deckt fünfzig Jahre Forschung und ein Dutzend verschiedener Technologien ab, von denen die meisten nicht mehr im Zentrum der Aufmerksamkeit stehen. Diese Seite befasst sich mit dem Teil von KI, der für Organisationen heute zählt: große Sprachmodelle und die Assistenten, die auf ihnen aufsetzen, darunter die in PANTA OS. Alles andere, vom Schachprogramm der Neunzigerjahre bis zum Empfehlungssystem der frühen 2000er, prägt das Vokabular im Hintergrund, aber nicht die aktuellen Entscheidungen. Das Ziel der Seite ist klar: genug technische Grundlage, um mit Engineers zu sprechen, ohne zu bluffen, genug betriebswirtschaftlicher Rahmen, um mit der Geschäftsleitung zu sprechen, ohne zu hand wavingen, und genug Ehrlichkeit, damit die Grenzen der Technologie sichtbar bleiben, neben ihren Stärken.

Wie moderne KI tatsächlich funktioniert

Der Kern hinter den heutigen Frontier KI Systemen ist einfacher, als das Marketing nahelegt. Ein großes Sprachmodell ist eine statistische Maschine, die das nächste Token vorhersagt. Gegeben eine Sequenz von Wörtern, produziert es eine Wahrscheinlichkeitsverteilung darüber, was als Nächstes kommen sollte, zieht daraus, hängt das gewählte Token an, und wiederholt. Alles andere, das Reasoning, das Schreiben, die Planung, der Code, ergibt sich daraus, diese Vorhersage sehr gut in sehr großem Maßstab zu machen. Drei Zutaten machen das möglich:
  • Skala der Trainingsdaten. Die größten Modelle werden auf Billionen von Wörtern aus Büchern, Code, Webseiten, wissenschaftlichen Papern und mehr trainiert. Die Vielfalt der Daten ist die Quelle der Breite an Fähigkeiten.
  • Skala der Parameter. Die numerischen Gewichte im Modell zählen in Hunderten von Milliarden. Jedes einzelne wird im Training so angepasst, dass die Vorhersagen des Modells den Mustern in den Daten entsprechen.
  • Skala der Rechenleistung. Das Training eines Frontier Modells dauert Monate auf Zehntausenden von Spezialchips. Die Kosten liegen im Bereich von Hunderten Millionen Dollar.
Nach dieser Vortrainingsphase wird das Modell in einer zweiten Phase verfeinert, durch Instruction Tuning und Reinforcement Learning from Human Feedback, in der Menschen die Ausgaben bewerten und das Modell lernt, die von Menschen bevorzugten Antworten zu bevorzugen. Das ist der Unterschied zwischen einem rohen Text Predictor und einem Assistenten, der Anweisungen folgt, schädliche Anfragen ablehnt und in nützlicher Form antwortet. Das Ergebnis ist ein System, das mehr gelesen hat, als ein Mensch je könnte, in Bruchteilen einer Sekunde Mustererkennung über dieses Material betreibt und flüssige Ausgaben in Dutzenden Sprachen und Registern produziert. Es ist auch ein System ohne Gedächtnis zwischen Gesprächen, ohne echtes Modell der Welt, ohne innere Überzeugung darüber, was wahr ist, und ohne Fähigkeit, aus deinen Interaktionen zu lernen.
Ein nützliches mentales Modell: Eine Frontier KI ist die belesenste Praktikantin der Welt. Außergewöhnliches Faktenwissen, vielfältige Stilkenntnis, große Hilfsbereitschaft, selbstbewusst auch in unbekanntem Terrain, und sie braucht klare Anweisungen und eine Supervision, die die Arbeit prüft.

Foundation Models und was darauf aufsetzt

Der Begriff Foundation Model bezeichnet die großen vortrainierten Modelle, die als Ausgangspunkt für alles andere dienen. Sie sind von Haus aus generalistisch, ohne spezifische Aufgabe im Training, und werden anschließend für die jeweilige Anwendung adaptiert.

Large Language Models

Text rein, Text raus. Das Rückgrat von Chat Assistenten, Drafting Tools, Zusammenfassung, Klassifikation und dem meisten, womit Business User in Berührung kommen.

Multimodale Modelle

Text, Bild, Audio, Video als Eingabe oder Ausgabe. Dieselbe Architektur, erweitert um andere Datentypen.

Code Modelle

Spezialvarianten, die auf Code Repositories trainiert sind. Eingesetzt in Copiloten, Code Review und Developer Assistenten.

Embedding Modelle

Verwandeln Text in numerische Vektoren, die Bedeutung erfassen. Der verborgene Motor hinter Suche, Retrieval und Empfehlung.

Reasoning Modelle

Eine neue Generation, die vor der Antwort einen internen Reasoning Pass läuft, und Latenz gegen Genauigkeit bei schweren Problemen tauscht.

Open Weight Modelle

Modelle, deren Gewichte öffentlich verfügbar sind, was Self Hosting, Fine Tuning und Inspektion erlaubt.
Eine praktische Plattform wie PANTA OS sitzt eine Schicht über den Foundation Models. Sie trainiert kein eigenes Modell von Grund auf; sie komponiert die existierenden zu Assistenten, Apps und Workflows, mit dem System Prompt, der Wissensdatenbank, den Tools und der Governance, die darum gebaut sind.

Generative KI gegenüber klassischem Machine Learning

Eine häufige Verwirrung. Beide sind KI; sie verhalten sich sehr unterschiedlich. Klassisches Machine Learning ist aufgabenspezifisch. Daten werden für ein einzelnes Problem gesammelt, ein Modell darauf trainiert, und dieses Modell macht genau das eine: Churn vorhersagen, Bilder klassifizieren, Betrug erkennen. Das Modell ist eng, der Entwicklungszyklus ist lang, und die Ausgabe ist üblicherweise eine Zahl oder ein Label. Generative KI ist generalistisch. Dasselbe Foundation Model kann einen Vertrag entwerfen, ein Transkript zusammenfassen, ein Ticket klassifizieren, ein Dokument übersetzen und Code schreiben. Es wird nicht für jede Aufgabe neu trainiert; die Aufgabe wird in einem Prompt beschrieben. Der Entwicklungszyklus kollabiert von Monaten auf Stunden. Der Trade Off: Klassische Modelle, gut gebaut für ihre spezifische Aufgabe, sind nach wie vor zuverlässiger und günstiger zu betreiben für genau diese Aufgabe. Generative KI glänzt dort, wo der Wert generalistischer Anwendbarkeit den Verlust an Spezialisierung aufwiegt, was die meiste Wissensarbeit umfasst, aber nicht die meisten engen Vorhersageprobleme.

Schlüsselbegriffe in einfacher Sprache

Ein kurzes Glossar, das den Großteil dessen abdeckt, was im Gespräch vorkommt.
  • Token. Die Einheit Text, die ein Modell verarbeitet. Im Schnitt etwa drei Viertel eines deutschen Worts. Ein Dokument von 1000 Wörtern liegt bei rund 1400 Token.
  • Context Window. Die maximale Anzahl Token, die ein Modell auf einmal berücksichtigen kann, inklusive Prompt, bisherigem Verlauf und Antwort. Moderne Modelle verarbeiten Hunderttausende Token; einige reichen in die Millionen.
  • Prompt. Die Eingabe an das Modell. Der Prompt ist für eine generative KI, was Code für ein klassisches Programm ist.
  • System Prompt. Eine persistente Anweisung, die Rolle, Verhalten und Constraints des Modells über die gesamte Konversation hinweg festlegt.
  • Fine Tuning. Ein Foundation Model auf eigenen Daten weiter zu trainieren, damit es sich an Domäne oder Stil anpasst.
  • RAG (Retrieval Augmented Generation). Statt Fine Tuning lässt man das Modell zur Anfragezeit eine Wissensdatenbank durchsuchen und seine Antwort in dem verankern, was es findet. Das Muster hinter jedem PANTA OS Assistenten mit Knowledge Base.
  • Agent. Ein Modell, das planen, Tools aufrufen und in der Welt handeln kann, nicht nur Text produzieren.
  • Halluzination. Eine flüssige und selbstbewusste Ausgabe, die zufällig falsch ist. Kein Bug, sondern eine Eigenschaft der Funktionsweise.
  • Temperature. Eine Einstellung, die steuert, wie sehr das Modell von seinem wahrscheinlichsten nächsten Token abweicht. Niedriger ist deterministischer, höher ist variantenreicher.

Wann KI einsetzen, und wann nicht

Die ehrliche Version der Produktivitätsfrage. KI liefert Wert für manche Aufgaben, für andere nicht, und die besten Teams lernen früh, zwischen beiden zu unterscheiden.

Starker Fit

Drafting, Zusammenfassen, Übersetzen, Klassifizieren, strukturierte Daten extrahieren, Fragen zu Dokumenten beantworten, Boilerplate erzeugen, Brainstorming, Routinecode schreiben.

Schwacher Fit

Aufgaben mit Echtzeitdaten, die das Modell nicht gesehen hat, Berechnungen, die Exaktheit verlangen, Urteile mit hohen Folgen und ohne Aufsicht, alles, wo Falschheit nicht akzeptabel ist.
Ein nützlicher Test vor der Automatisierung einer Aufgabe mit KI: Würde eine kompetente Generalistin, die über deine Domäne gelesen hat, aber nicht darin arbeitet, einen brauchbaren ersten Entwurf produzieren? Wenn ja, dann fast sicher auch die KI. Wenn nein, braucht die Aufgabe wahrscheinlich eine Spezialistin oder ein anderes Werkzeug.

Häufige Missverständnisse

Einige Muster, die immer wieder auftreten, wenn Teams mit KI beginnen, und was tatsächlich gilt.
Tut sie nicht. Ein Sprachmodell produziert plausiblen Text durch Mustererkennung in seinen Trainingsdaten. Es hat keine innere Erfahrung, kein Modell der Realität, keine Wünsche. Die Flüssigkeit ist real; das Verständnis dahinter ist eine nützliche Illusion. Das Modell als kluges Wesen statt als mächtigen Mustererkenner zu behandeln, führt zu vorhersehbaren Fehlern.
Der Rahmen ist falsch. KI ersetzt Aufgaben, nicht Rollen. Die Rollen, die sich am wenigsten ändern, sind die, die hauptsächlich aus Urteil, Beziehung und körperlicher Präsenz bestehen. Die Rollen, die sich am stärksten ändern, sind die, die hauptsächlich aus klar definierter und prüfbarer Sprachverarbeitung bestehen. In der Praxis erweitert KI deutlich mehr Rollen, als sie ersetzt, aber sie verändert das tägliche Aussehen dieser Rollen substanziell.
Nicht so, wie man vielleicht erwarten würde. Das Modell selbst lernt nicht aus einzelnen Interaktionen. Was sich ändern kann, ist der Kontext: ein Memory Feature, eine Knowledge Base, ein Fine Tune. Foundation Models sind zwischen Trainingsläufen statisch, und Trainingsläufe finden selten statt.
Bis vor kurzem zumeist wahr. Heute weniger. Kleinere spezialisierte Modelle können größere generalistische Modelle bei engen Aufgaben einholen oder schlagen, und Reasoning Modelle haben gezeigt, dass das Wie des Trainings mehr zählt als das Wie groß. Das richtige Modell hängt von der Aufgabe, dem Latenzbudget und den Kosten ab.
Nein. Das Feld bewegt sich in Monaten. Das Modell, das heute am besten ist, ist selten das beste in einem Jahr, die Preise ändern sich, die Fehlermodi verschieben sich. Behandle KI Kompetenz als bewegliches Ziel und baue die Prozesse so, dass sie den Wandel absorbieren, statt um einen einzelnen Anbieter oder ein einzelnes Modell einzufrieren.
Das teuerste Missverständnis. Moderne Modelle produzieren gleich selbstbewusste Ausgaben, egal ob richtig oder falsch, weil sie keine innere Gewissheit haben, die sie kommunizieren könnten. Selbstbewusstsein ist eine Eigenschaft der Flüssigkeit, kein Signal für Genauigkeit. Die Minderung sind prüfbare Workflows und Grounding in Quellmaterial, nicht bessere Prompts.

Eine brauchbare Grundlinie

Drei Aussagen, die in fast jeder Konversation über KI in Organisationen gelten:
  1. Die Technologie ist genuin transformativ für Sprach- und Wissensarbeit, und die Gewinne sind groß für Teams, die sie gut nutzen lernen.
  2. Die Technologie ist auch genuin fehleranfällig, und die Kosten unkontrollierter Nutzung skalieren mit der Tragweite der Aufgabe.
  3. Der Unterschied zwischen Organisationen, die den Wert heben, und denen, die es nicht tun, ist selten das Modell. Es ist die Disziplin um das Modell herum: klare Anwendungsfälle, strukturierte Prompts, geerdetes Wissen, prüfbare Ausgaben und eine Kultur, die sowohl die Chancen als auch die Grenzen ernst nimmt.
Zuletzt geändert am 18. Mai 2026