🧠 Wie funktioniert ein LLM?

Eine einfache Erklärung – ohne Mathe, ohne Informatik-Studium.

Die Kurzversion

Ein Large Language Model (LLM) ist im Kern eine gigantische Wort-Vorhersage-Maschine. Es liest, was bisher geschrieben steht, und berechnet: Welches Wort kommt als nächstes am wahrscheinlichsten?

Das klingt simpel – aber wenn man das mit Milliarden von Textbeispielen trainiert, entsteht etwas, das verblüffend „intelligent" wirkt.

Schritt für Schritt

1. Training: Lesen, lesen, lesen

Bevor ein LLM antworten kann, wird es trainiert. Dabei liest es riesige Mengen Text – Bücher, Webseiten, Artikel, Foren, Code. Nicht um Fakten auswendig zu lernen, sondern um Sprachmuster zu erkennen:

Welche Wörter folgen typischerweise aufeinander?
Wie sind Sätze aufgebaut?
Welche Themen hängen zusammen?

2. Das Prinzip: Nächstes Wort vorhersagen

Während des Trainings bekommt das Modell immer wieder einen Satzanfang und muss das nächste Wort erraten. Liegt es falsch, werden seine internen „Stellschrauben" (Parameter) leicht angepasst.

Beispiel: Eingabe: „Die Katze sitzt auf dem …"
Das Modell lernt: „Dach" oder „Sofa" sind wahrscheinlich. „Wolke" oder „Dienstag" eher nicht.

Das passiert Milliarden Male. Am Ende hat das Modell ein feines Gespür dafür, wie Sprache funktioniert.

3. Parameter: Die Stellschrauben

Ein LLM besteht aus Milliarden von Zahlen (Parametern), die während des Trainings justiert werden. GPT-4 hat geschätzt über eine Billion davon. Diese Zahlen kodieren keine Fakten direkt – sie kodieren statistische Zusammenhänge zwischen Wörtern und Konzepten.

4. Antworten generieren: Wort für Wort

Wenn du eine Frage stellst, erzeugt das Modell die Antwort ein Wort nach dem anderen:

Es liest deinen Text (den „Prompt")
Es berechnet das wahrscheinlichste nächste Wort
Es hängt dieses Wort an und wiederholt den Vorgang
So entsteht Wort für Wort ein ganzer Text

Wichtig: Das Modell „denkt" nicht wie ein Mensch nach. Es hat kein Bewusstsein, keine Meinung und kein Verständnis. Es ist extrem gut darin, Sprachmuster zu reproduzieren – mehr nicht.

Eine Analogie

Stell dir die Autokorrektur auf deinem Handy vor. Sie schlägt das nächste Wort vor, basierend auf dem, was du bisher getippt hast. Ein LLM macht im Prinzip dasselbe – nur millionenfach besser, weil es mit unvorstellbar viel mehr Text trainiert wurde und viel mehr Kontext berücksichtigen kann.

Was ein LLM nicht ist

Keine Suchmaschine – es durchsucht nicht das Internet, sondern nutzt Muster aus dem Training
Keine Datenbank – es speichert keine Fakten in Tabellen, sondern in statistischen Gewichten
Kein denkendes Wesen – es simuliert Sprache, versteht aber nichts im menschlichen Sinn
Nicht immer korrekt – weil es auf Wahrscheinlichkeit basiert, kann es plausibel klingende Fehler machen (Halluzinationen)

Warum wirkt es trotzdem so schlau?

Weil Sprache unglaublich viel Information transportiert. Wer Sprachmuster perfekt beherrscht, kann:

Fragen beantworten (weil Antworten typische Sprachmuster haben)
Zusammenfassen (weil Zusammenfassungen einem Muster folgen)
Übersetzen (weil parallele Texte Muster zwischen Sprachen zeigen)
Code schreiben (weil Code auch nur eine Sprache mit Mustern ist)

Das Ergebnis wirkt intelligent – ist aber im Kern „nur" extrem gute Mustererkennung auf Sprache.

Gefällt dir diese Seite?

← Zurück zur KI-Übersicht