AI Crawling Guide

Autor: Thomas Hullin, TH Analytica
Stand: März 2026
Kategorie: Technischer Leitfaden
Technische Referenz Crawling Best Practices

Wie KI-Systeme Websites crawlen

KI-Systeme wie ChatGPT, Google Gemini, Perplexity und Claude nutzen spezialisierte Crawler (Bots), um Webseiten zu erfassen, zu analysieren und als potenzielle Wissensquellen zu bewerten.

Wichtige KI-Crawler (Stand März 2026)

Crawler User-Agent System
GPTBot GPTBot OpenAI ChatGPT
ChatGPT-User ChatGPT-User OpenAI ChatGPT (User-Anfragen)
Google-Extended Google-Extended Google Gemini / Bard
PerplexityBot PerplexityBot Perplexity AI
ClaudeBot ClaudeBot / Claude-Web Anthropic Claude

Was KI-Crawler suchen

1. Strukturierte Entitätsinformationen

2. Semantische Klarheit

3. Trust Signals

4. AI Structure Files

Technische Best Practices

✓ Erlauben Sie KI-Crawler explizit

Standardmäßig sollten KI-Crawler Zugriff haben, es sei denn, Sie wollen bewusst nicht von KI-Systemen erfasst werden.

# robots.txt - Beispiel für erlaubtes Crawling
User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ClaudeBot
Allow: /

⚠ Häufige Fehler, die KI-Crawler blockieren

AI Structure Files implementieren

/llms.txt - Strukturierte Entitätsinformationen

Eine Textdatei mit klaren, strukturierten Informationen über Ihre Organisation, Produkte oder Dienstleistungen.

# TH Analytica - Entity Definition
Name: TH Analytica
Type: Organization
Field: AI Visibility, AI Readiness
Location: Lenk, Switzerland
Contact: thhullin@gmail.com
Website: https://th-analytica.com

Services:
- AI Readiness Analysis
- AI Visibility Optimization
- Generative Engine Optimization (GEO)

/ai.txt - KI-Zugriffs-Policy

Klare Angaben, wie KI-Systeme Ihre Inhalte nutzen dürfen.

User-agent: *
Allow: /

AI-Usage: allowed-for-analysis-and-answer-generation
AI-Training: disallowed
Policy: https://th-analytica.com/.well-known/ai-policy.json
Contact: thhullin@gmail.com

/ai-policy.json - Maschinenlesbare Policy

{
  "@context": "https://schema.org",
  "@type": "CreativeWork",
  "name": "AI Policy - TH Analytica",
  "usageInfo": {
    "allowAnalysis": true,
    "allowAnswerGeneration": true,
    "allowTraining": false
  },
  "license": "All rights reserved",
  "contact": "thhullin@gmail.com"
}

Crawling-Frequenz und Verhalten

KI-Crawler verhalten sich unterschiedlich:

Monitoring und Validierung

Wie Sie prüfen, ob KI-Crawler Ihre Seite besuchen

Weiterführende Ressourcen

Autor: Thomas Hullin
Funktion: Founder & AI Visibility Specialist, TH Analytica
Kontakt: thhullin@gmail.com
Stand: März 2026