Eine einfache Erklärung – ohne Mathe, ohne Informatik-Studium.
Ein Large Language Model (LLM) ist im Kern eine gigantische Wort-Vorhersage-Maschine. Es liest, was bisher geschrieben steht, und berechnet: Welches Wort kommt als nächstes am wahrscheinlichsten?
Das klingt simpel – aber wenn man das mit Milliarden von Textbeispielen trainiert, entsteht etwas, das verblüffend „intelligent" wirkt.
Bevor ein LLM antworten kann, wird es trainiert. Dabei liest es riesige Mengen Text – Bücher, Webseiten, Artikel, Foren, Code. Nicht um Fakten auswendig zu lernen, sondern um Sprachmuster zu erkennen:
Während des Trainings bekommt das Modell immer wieder einen Satzanfang und muss das nächste Wort erraten. Liegt es falsch, werden seine internen „Stellschrauben" (Parameter) leicht angepasst.
Das passiert Milliarden Male. Am Ende hat das Modell ein feines Gespür dafür, wie Sprache funktioniert.
Ein LLM besteht aus Milliarden von Zahlen (Parametern), die während des Trainings justiert werden. GPT-4 hat geschätzt über eine Billion davon. Diese Zahlen kodieren keine Fakten direkt – sie kodieren statistische Zusammenhänge zwischen Wörtern und Konzepten.
Wenn du eine Frage stellst, erzeugt das Modell die Antwort ein Wort nach dem anderen:
Stell dir die Autokorrektur auf deinem Handy vor. Sie schlägt das nächste Wort vor, basierend auf dem, was du bisher getippt hast. Ein LLM macht im Prinzip dasselbe – nur millionenfach besser, weil es mit unvorstellbar viel mehr Text trainiert wurde und viel mehr Kontext berücksichtigen kann.
Weil Sprache unglaublich viel Information transportiert. Wer Sprachmuster perfekt beherrscht, kann:
Das Ergebnis wirkt intelligent – ist aber im Kern „nur" extrem gute Mustererkennung auf Sprache.
Gefällt dir diese Seite?