Kapitel 2: Theoretische Grundlagen – Wie KIs “denken” und “lesen”

Um eine Webseite für eine KI zu optimieren, müssen wir die menschliche Perspektive verlassen. Eine KI “liest” keine Texte, um sich an ihnen zu erfreuen; sie verarbeitet Datenströme, um statistische Wahrscheinlichkeiten für die nächste Informationseinheit zu berechnen.

2.1 Die Transformer-Revolution: Das Ende der Linearität

Der Durchbruch moderner LLMs basiert auf der Transformer-Architektur (vorgestellt von Google im Jahr 2017). Vor dem Transformer verarbeiteten KIs Texte linear (Wort für Wort). Das Problem: Bei langen Sätzen “vergass” die KI den Anfang des Satzes.

Der Attention-Mechanismus (Selbstaufmerksamkeit)

Das Herzstück des Transformers ist die Self-Attention. Sie erlaubt es dem Modell, jedes Wort in einem Satz gleichzeitig mit jedem anderen Wort in Beziehung zu setzen.

Beispiel für LLMO: Betrachten wir den Satz: “Die Bank war aufgrund der schlechten Zinspolitik geschlossen.” Die KI nutzt Attention, um das Wort “Bank” massiv mit “Zinspolitik” zu verknüpfen. Dadurch weiss sie sofort, dass es sich um ein Finanzinstitut handelt und nicht um ein Sitzmöbel.

Strategische Ableitung: Wenn Ihre Webseite über “Nachhaltigkeit” schreibt, aber 80 % des Textes allgemeine Marketingfloskeln enthält, wird die “Attention” der KI verwässert. Die KI ordnet Ihre Seite mathematisch einem “Rauschen” zu, statt einem spezifischen Experten-Vektor.

2.2 Tokenisierung: Wenn Wörter zu Zahlen werden

Bevor ein LLM einen Text verarbeitet, zerlegt es ihn in Tokens. Ein Token ist nicht zwangsläufig ein ganzes Wort. Es kann ein Wortteil, ein Präfix oder ein Suffix sein.

Warum Token-Effizienz über Branding entscheidet

Häufige Wörter wie “Cloud” sind meist 1 Token. Ein komplexer, künstlicher Markenname wie “Xylo-Phonix-Logistics” könnte in 6 oder mehr Tokens zerlegt werden.

  • Das Problem: Je mehr Tokens ein Begriff verbraucht, desto mehr Rechenkapazität benötigt die KI. In einem begrenzten Kontext-Fenster werden komplexe, fragmentierte Begriffe eher vernachlässigt oder falsch assoziiert.
  • LLMO-Regel: Prüfen Sie Ihren Markennamen und Ihre Kernbegriffe auf ihre Token-Dichte. Ein Name, der für die KI “einfach” ist, hat eine höhere Chance, korrekt in Zusammenfassungen übernommen zu werden.

2.3 Embeddings und Vektorräume: Die Landkarte des Wissens

Dies ist das wichtigste Konzept für die strategische Positionierung. Sobald die Tokens verarbeitet sind, werden sie in einen hochdimensionalen Vektorraum (Embeddings) projiziert.

Stellen Sie sich diesen Raum als ein riesiges Universum vor. Begriffe, die semantisch verwandt sind, liegen nah beieinander. “Kaffee” liegt nah bei “Tasse”, “Bohne” und “Morgen”. “Kaffee” liegt sehr weit weg von “Betonmischer”.

Die LLMO-Strategie: Ihr Ziel ist es, den Content Ihrer Webseite so zu gestalten, dass der Vektor Ihrer Marke eine minimale Distanz zum Vektor der Problemstellung Ihrer Kunden hat. Wenn ein Nutzer fragt “Wie sichere ich mein Unternehmen gegen Cyberangriffe ab?”, muss Ihre Marke im Vektorraum der KI unmittelbar neben dem Konzept “Cybersecurity-Lösung” schweben.

2.4 RAG (Retrieval-Augmented Generation): Die Brücke zum Web

Ein LLM ist nach seinem Training “eingefroren”. Es weiss nichts über Ereignisse nach seinem Trainings-Cutoff. Damit ChatGPT oder Gemini dennoch aktuelle Antworten geben können, nutzen sie RAG.

  1. Retrieval: Die KI sucht im Web nach aktuellen Informationen zu einer Anfrage.
  2. Augmentation: Die gefundenen Textpassagen werden als “Kontext” in den Prompt geladen.
  3. Generation: Die KI generiert die Antwort basierend auf ihrem Wissen UND dem neuen Kontext.
Warum RAG der “Heilige Gral” des LLMO ist: Durch RAG haben Sie die Chance, auch in Modellen präsent zu sein, die vor Jahren trainiert wurden. Wenn Ihre Seite technisch so optimiert ist, dass ein RAG-System Ihre Fakten leicht extrahieren kann, werden Sie zur “Echtzeit-Quelle” der KI.

Mini-Case Study: Die Vektor-Korrektur von “FinTech-Alpha”

Szenario: Das Unternehmen FinTech-Alpha bot eine Software für Krypto-Steuern an. In KI-Abfragen wurde die Firma jedoch oft im Kontext von “Investment-Beratung” oder “Trading-Plattformen” genannt – ein rechtliches Risiko für das Unternehmen.

LLMO-Massnahme: Das Team analysierte die semantische Nachbarschaft. Sie stellten fest, dass ihre Texte zu viele Begriffe wie “Gewinnmaximierung” und “Markttrends” enthielten. Sie schrieben den Content um und fokussierten sich auf Linguistische Anker wie “Compliance-Bericht”, “Steuererklärung-Automatisierung” und “Finanzamts-Konformität”.

Ergebnis: Innerhalb von drei Monaten verschob sich der Vektor der Marke in den KI-Modellen. Bei Anfragen zu “Steuer-Software” wurde FinTech-Alpha nun als Top-Quelle genannt.

Checkliste: Das Theoretische Fundament

  • Token-Audit: Haben wir unseren Markennamen und unsere Kernprodukte mit einem Tokenizer (z. B. OpenAI Tiktoken) geprüft?
  • Semantische Nachbarschaft: In welcher “Nachbarschaft” im Vektorraum wollen wir liegen? (z. B. “Sicherheit”, “Luxus”, “Effizienz”).
  • Kontext-Reinheit: Sind unsere Texte frei von widersprüchlichen semantischen Signalen?
  • RAG-Readiness: Sind unsere wichtigsten Fakten so aktuell und zugänglich, dass ein RAG-System sie innerhalb von Millisekunden erfassen kann?

Typische Fehler & Mythen

  • Mythos: “KIs verstehen die Bedeutung von Wörtern wie wir.” → Realität: KIs verstehen statistische Korrelationen. Sie “wissen” nicht, was ein Auto ist, aber sie wissen, dass “Auto” oft mit “Reifen” und “fahren” zusammen vorkommt.
  • Fehler: Zu blumige Sprache. Metaphern wie “Wir sind der Leuchtturm in der Brandung des Marktes” verwirren KIs. Sie ordnen Sie schlimmstenfalls dem Vektorraum “Schifffahrt” oder “Architektur” zu.
Strategische Handlungsempfehlung: Betrachten Sie Ihren Content als eine Ansammlung mathematischer Vektoren. Jedes Wort, das Sie wählen, zieht Ihre Marke in eine bestimmte Richtung auf der Landkarte des Wissens. Seien Sie präzise, seien Sie technisch korrekt und vermeiden Sie semantische Verwässerung.
Andreas Reisch

LLMO-Unterstützung?

Suchen Sie einen Experten im Bereich LLMO oder KI-Sichtbarkeit? Kontaktieren Sie mich unverbindlich.