Warum Googles KI Google nicht buchstabieren kann

Die anhaltende Schwäche von Googles generativer Suchfunktion bei elementaren Rechtschreib- und Zählaufgaben offenbart eine fundamentale Schicht in der Architektur heutiger Large Language Models.

Betroffenes System

Hauptsächlich betroffen ist AI Overview, die auf dem LLM Gemini basierende generative Suchfunktion, die seit 2024 in die Google-Suche integriert ist.

Aktuelle Beobachtungen

Im Mai 2026 dokumentierten Nutzer wiederholt fehlerhafte Ausgaben:

Auf die Frage nach der Anzahl der „P“ in „Google“ antwortete die KI mit „zwei“.
Bei der Buchstabierung von „journalism“ wurde „j-o-u-r-n-a-d-i-s-m“ angegeben.
Ein Test mit dem Wort „astronomical“ führte zur Angabe von „genau 2 e’s“ und der fehlerhaften Buchstabierung „a-s-t-r-e-n-o-m-i-c-a-e-l“.
Der Nachname des US-Präsidenten wurde teilweise korrekt in der Buchstabenanzahl, jedoch falsch als „t-r-p-u-m“ buchstabiert.

Historischer Kontext

Das Phänomen ist bekannt. Bereits 2024 ging die Frage nach der Anzahl der „r“ in „strawberry“ viral und etablierte sich als Running Gag in der KI-Community zum Test neuer Modelle.

Architekturelle Ursache: Tokenisierung

Large Language Models verarbeiten Text nicht buchstabenweise, sondern in Tokens – Einheiten, die ganze Wörter, Silben oder Zeichengruppen repräsentieren. Die Modelle erzeugen numerische Embeddings, die primär semantische Beziehungen und Kontext kodieren. Ein inhärentes Verständnis der sequenziellen Zeichenstruktur fehlt.

Matthew Guzdial, Assistenzprofessor an der University of Alberta, bestätigt, dass LLMs Eingaben in eine Kodierung übersetzen, ohne Buchstaben wie Menschen zu „lesen“. Gemini selbst erklärte, es betrachte Wörter als ganzheitliche Token und fokussiere sich auf Bedeutung und Relationen statt auf einzelne Zeichen.

Googles Haltung

Google hat die Problematik anerkannt und arbeitet an Verbesserungen. Experten weisen jedoch darauf hin, dass die Token-basierte Kernarchitektur eine vollständige Lösung strukturell erschweren könnte.

Trotz erheblicher Fortschritte bei der Reduktion früherer Halluzinationen seit dem Start von AI Overviews im Jahr 2024 bleiben Rechtschreib- und Zählaufgaben eine bestehende Schwachstelle.

Systemische Implikationen

Solche Fehler, auch wenn sie trivial wirken, berühren die strukturelle Integrität des Vertrauensinterfaces zwischen Nutzer und KI-generierten Suchergebnissen. Sie erinnern an die Grenzen der aktuellen Architektur: Hohe Leistung in komplexen Domänen steht neben grundlegenden Defiziten in elementaren symbolischen Operationen.

Quelle: TechCrunch AI

FAQ

Warum kann Gemini Wörter nicht korrekt buchstabieren?
Weil Large Language Models Text in Tokens statt in einzelne Buchstaben zerlegen und kein natives Verständnis der Zeichenreihenfolge besitzen.

Ist das Problem neu?
Nein. Ähnliche Fehler sind seit mindestens 2024 bekannt und dienen in der KI-Community als standardisierter Test neuer Modelle.

Kann das Problem vollständig behoben werden?
Forscher bezweifeln eine perfekte Lösung innerhalb der aktuellen Token-basierten Architektur. Google arbeitet dennoch an Verbesserungen.

Warum sind solche trivialen Fehler relevant?
Sie untergraben das Vertrauen in KI-gestützte Suchergebnisse und verdeutlichen die Grenzen der zugrundeliegenden Systemarchitektur.

Veröffentlicht am