Kapitel 2: Theoretische Grundlagen – Wie KIs “denken” und “lesen”
Um eine Webseite für eine KI zu optimieren, müssen wir die menschliche Perspektive verlassen. Eine KI “liest” keine Texte, um sich an ihnen zu erfreuen; sie verarbeitet Datenströme, um statistische Wahrscheinlichkeiten für die nächste Informationseinheit zu berechnen.
2.1 Die Transformer-Revolution: Das Ende der Linearität
Der Durchbruch moderner LLMs basiert auf der Transformer-Architektur (vorgestellt von Google im Jahr 2017). Vor dem Transformer verarbeiteten KIs Texte linear (Wort für Wort). Das Problem: Bei langen Sätzen “vergass” die KI den Anfang des Satzes.
Der Attention-Mechanismus (Selbstaufmerksamkeit)
Das Herzstück des Transformers ist die Self-Attention. Sie erlaubt es dem Modell, jedes Wort in einem Satz gleichzeitig mit jedem anderen Wort in Beziehung zu setzen.
Beispiel für LLMO: Betrachten wir den Satz: “Die Bank war aufgrund der schlechten Zinspolitik geschlossen.” Die KI nutzt Attention, um das Wort “Bank” massiv mit “Zinspolitik” zu verknüpfen. Dadurch weiss sie sofort, dass es sich um ein Finanzinstitut handelt und nicht um ein Sitzmöbel.
2.2 Tokenisierung: Wenn Wörter zu Zahlen werden
Bevor ein LLM einen Text verarbeitet, zerlegt es ihn in Tokens. Ein Token ist nicht zwangsläufig ein ganzes Wort. Es kann ein Wortteil, ein Präfix oder ein Suffix sein.
Warum Token-Effizienz über Branding entscheidet
Häufige Wörter wie “Cloud” sind meist 1 Token. Ein komplexer, künstlicher Markenname wie “Xylo-Phonix-Logistics” könnte in 6 oder mehr Tokens zerlegt werden.
- Das Problem: Je mehr Tokens ein Begriff verbraucht, desto mehr Rechenkapazität benötigt die KI. In einem begrenzten Kontext-Fenster werden komplexe, fragmentierte Begriffe eher vernachlässigt oder falsch assoziiert.
- LLMO-Regel: Prüfen Sie Ihren Markennamen und Ihre Kernbegriffe auf ihre Token-Dichte. Ein Name, der für die KI “einfach” ist, hat eine höhere Chance, korrekt in Zusammenfassungen übernommen zu werden.
2.3 Embeddings und Vektorräume: Die Landkarte des Wissens
Dies ist das wichtigste Konzept für die strategische Positionierung. Sobald die Tokens verarbeitet sind, werden sie in einen hochdimensionalen Vektorraum (Embeddings) projiziert.
Stellen Sie sich diesen Raum als ein riesiges Universum vor. Begriffe, die semantisch verwandt sind, liegen nah beieinander. “Kaffee” liegt nah bei “Tasse”, “Bohne” und “Morgen”. “Kaffee” liegt sehr weit weg von “Betonmischer”.
2.4 RAG (Retrieval-Augmented Generation): Die Brücke zum Web
Ein LLM ist nach seinem Training “eingefroren”. Es weiss nichts über Ereignisse nach seinem Trainings-Cutoff. Damit ChatGPT oder Gemini dennoch aktuelle Antworten geben können, nutzen sie RAG.
- Retrieval: Die KI sucht im Web nach aktuellen Informationen zu einer Anfrage.
- Augmentation: Die gefundenen Textpassagen werden als “Kontext” in den Prompt geladen.
- Generation: Die KI generiert die Antwort basierend auf ihrem Wissen UND dem neuen Kontext.
Mini-Case Study: Die Vektor-Korrektur von “FinTech-Alpha”
Szenario: Das Unternehmen FinTech-Alpha bot eine Software für Krypto-Steuern an. In KI-Abfragen wurde die Firma jedoch oft im Kontext von “Investment-Beratung” oder “Trading-Plattformen” genannt – ein rechtliches Risiko für das Unternehmen.
LLMO-Massnahme: Das Team analysierte die semantische Nachbarschaft. Sie stellten fest, dass ihre Texte zu viele Begriffe wie “Gewinnmaximierung” und “Markttrends” enthielten. Sie schrieben den Content um und fokussierten sich auf Linguistische Anker wie “Compliance-Bericht”, “Steuererklärung-Automatisierung” und “Finanzamts-Konformität”.
Ergebnis: Innerhalb von drei Monaten verschob sich der Vektor der Marke in den KI-Modellen. Bei Anfragen zu “Steuer-Software” wurde FinTech-Alpha nun als Top-Quelle genannt.
Checkliste: Das Theoretische Fundament
- Token-Audit: Haben wir unseren Markennamen und unsere Kernprodukte mit einem Tokenizer (z. B. OpenAI Tiktoken) geprüft?
- Semantische Nachbarschaft: In welcher “Nachbarschaft” im Vektorraum wollen wir liegen? (z. B. “Sicherheit”, “Luxus”, “Effizienz”).
- Kontext-Reinheit: Sind unsere Texte frei von widersprüchlichen semantischen Signalen?
- RAG-Readiness: Sind unsere wichtigsten Fakten so aktuell und zugänglich, dass ein RAG-System sie innerhalb von Millisekunden erfassen kann?
Typische Fehler & Mythen
- Mythos: “KIs verstehen die Bedeutung von Wörtern wie wir.” → Realität: KIs verstehen statistische Korrelationen. Sie “wissen” nicht, was ein Auto ist, aber sie wissen, dass “Auto” oft mit “Reifen” und “fahren” zusammen vorkommt.
- Fehler: Zu blumige Sprache. Metaphern wie “Wir sind der Leuchtturm in der Brandung des Marktes” verwirren KIs. Sie ordnen Sie schlimmstenfalls dem Vektorraum “Schifffahrt” oder “Architektur” zu.