Claude System Prompt Leak: Wann "suchen" LLMs wirklich im Internet

Was du vorab wissen solltest:

Was ist passiert?
Am 22. Mai 2025 wurde auf GitHub ein internes Claude-System Prompt veröffentlicht, im RepositoryCL4R1T4S von @elder_plinius. Hier auch der Beitrag auf X dazu. Das Dokument ist wesentlich detaillierter als die offizielle Dokumentation von Anthropic – und zeigt erstmals, wie Claude 4 intern gesteuert wird.

Was ist ein Systemprompt?
Der Systemprompt ist die interne Steuerzentrale eines KI-Modells. Er definiert, wie das Modell denkt, wie es antwortet, welchen Ton es anschlägt, wann es Websuche nutzt und wie es mit sensiblen Themen (z. B. Politik, Gewalt, Gesundheit) umgeht.

Was macht das für SEOs spannend?
Die grosse Frage für uns ist: Wie kommt meine Seite in eine KI-Antwort? Der Leak gibt uns erstmals eine konkrete Vorstellung davon, wann Claude Inhalte nennt, wann es verlinkt – und wann nicht.

Entscheidender Punkt für SEO:
Claude greift nur dann auf das Web zu, wenn das interne Modell nicht genug weiss. Nur dann werden überhaupt externe Inhalte angesehen – und nur dann hast du eine Chance, erwähnt oder verlinkt zu werden.

Kleiner Hinweis vorab:
Der Prompt ist im sogenannten Markup-Format geschrieben. Das bedeutet: Es gibt viele technische Elemente und Code-Schnipsel, die auf den ersten Blick kompliziert wirken – besonders, wenn du mit Programmierung nichts am Hut hast. Das wichtigste aus dem Prompt hab ich dir aber markiert.

Du kannst diese Codeblöcke einfach überspringen. Ich erkläre dir die wichtigsten Stellen verständlich und auf den Punkt. Damit du aber nachvollziehen kannst, woher meine Infos stammen, binde ich immer wieder die Originaltexte aus dem Leak ein.

Suchanleitung für Claude 4 – “Search_instruction”

Das, was uns aus SEO-Sicht am meisten interessiert, ist ein Element, das sich “search_instruction” nennt. Dabei finden wir, wie und wann Claude die Online-Suche verwendet.

Claude ist – genau wie ChatGPT – ein hybrides KI-System (unter Generative Engine Optimization (GEO) erklärt kannst du die verschiedenen KI-Systeme nochmal nachlesen). Das heisst, Das System wurde mit Trainingsdaten gefüttert, die die Basis seines Wissens bilden. Zusätzlich hat es die Fähigkeit, dieses Wissen durch eine Websuche zu erweitern.

Allerdings ist das Suchen viel mehr Aufwand, als einfach nur das eigene Wissen zu verwenden. Deshalb bekommt das System ganz genau vorgegeben, wann es überhaupt auf die Suche zurückgreifen soll.

Nachdem unsere Webseite nur zitiert werden kann, wenn auf die Suche zurückgegriffen wird, ist das genau der Teil der uns am meisten interessiert. Was wir im Claude-Systemprompt-Leak unter diesem Punkt finden, ist für GEO und SEO daher besonders wertvoll – weil es uns einen Einblick gibt, wie Claude überhaupt Inhalte auswählt.

Nun schauen wir uns gemeinsam an, was unter <search_insturctions> steht – und was das konkret für uns bedeutet.

Einleitung der <search_instructions>

Claude has access to web_search and other tools for info retrieval. The web_search tool uses a search engine and returns results in <function_results> tags. Use web_search only when information is beyond the knowledge cutoff, the topic is rapidly changing, or the query requires real-time data. Claude answers from its own extensive knowledge first for stable information. For time-sensitive topics or when users explicitly need current information, search immediately. If ambiguous whether a search is needed, answer directly but offer to search. Claude intelligently adapts its search approach based on the complexity of the query, dynamically scaling from 0 searches when it can answer using its own knowledge to thorough research with over 5 tool calls for complex queries. When internal tools google_drive_search, slack, asana, linear, or others are available, use these tools to find relevant information about the user or their company.
CRITICAL: Always respect copyright by NEVER reproducing large 20+ word chunks of content from search results, to ensure legal compliance and avoid harming copyright holders.

Gleich in den Ersten Zeilen finden wir richtig wichtige Informationen für uns.

Textzeile	Was heisst das für uns?
*“The web_search tool uses a search engine and returns results”*	LLMs greifen zum Suchen von Informationen auf Suchmaschinen zurück. Das heisst, um erwähnt zu werden, müssen wir hier ranken. Das kennen wir doch woher oder?
*“Claude answers from its own extensive knowledge first for stable information”*	Es wird zuerst auf die Trainingsdaten zugegriffen – wenn diese die Frage nicht beantworten können, wird erst gesucht. Wir müssen also uns auf Content konzentrieren, der gesucht wird – was das ist? Kommt noch …
*“NEVER reproducing large 20+ word chunks of content from search results”*	Auch das ist wichtig zu verstehen, denn wir werden niemals direkt zitiert für mehr als 20 Wörter, um kein Plagiat zu erzeugen.

Das Suchverhalten: core_search_behaviors

In diesem Modul verstehen wir nun, wie Claude sucht beziehungsweise unter welchen Bedingungen.

Always follow these principles when responding to queries:
1. Avoid tool calls if not needed: If Claude can answer without tools, respond without using ANY tools. Most queries do not require tools. ONLY use tools when Claude lacks sufficient knowledge — e.g., for rapidly-changing topics or internal/company-specific info.
2. Search the web when needed: For queries about current/latest/recent information or rapidly-changing topics (daily/monthly updates like prices or news), search immediately. For stable information that changes yearly or less frequently, answer directly from knowledge without searching. When in doubt or if it is unclear whether a search is needed, answer the user directly but OFFER to search.
3. Scale the number of tool calls to query complexity: Adjust tool usage based on query difficulty. Use 1 tool call for simple questions needing 1 source, while complex tasks require comprehensive research with 5 or more tool calls. Use the minimum number of tools needed to answer, balancing efficiency with quality.
4. Use the best tools for the query: Infer which tools are most appropriate for the query and use those tools. Prioritize internal tools for personal/company data. When internal tools are available, always use them for relevant queries and combine with web tools if needed. If necessary internal tools are unavailable, flag which ones are missing and suggest enabling them in the tools menu.	If tools like Google Drive are unavailable but needed, inform the user and suggest enabling them.

Claude verwendet nur die Suche, wenn die Informationen im eigenen Wissen nicht vorhanden sind. Das ist dasselbe wie vorher, was aber hier noch spannend ist, ist, wann Claude denkt, dass sein Wissen nicht reicht.

Wann sollte gesucht werden und wann greift Claude auf Trainingsdaten zurück?

Wenn die Information etwas Aktuelles ist oder ein Thema, das sich super schnell ändert, so wie zum Beispiel Preise, dann sollte direkt gesucht werden:

“current/latest/recent information or rapidly-changing topics (daily/monthly updates like prices or news),”

Hingegen, wenn die Information eigentlich im Jahr gleich bleibt, wird wieder sein Wissen herangezogen.

“stable information that changes yearly or less frequently”

Und wenn die KI sich nicht sicher ist, wird zuerst mal das eigene Wissen herangezogen, aber vorgeschlagen dem User man könnte ja auch Suchen:

“When in doubt … OFFER to search.”

Die Kategorien von Prompts: query_complexity_categories

In diesem Bereich haben wir seinen Entscheidungsbaum, mit dem Claude entschiedet, ob sein Wissen ausreicht oder nicht.

Use the appropriate number of tool calls for different types of queries by following this decision tree:
IF info about the query is stable (rarely changes and Claude knows the answer well) → never search, answer directly without using tools ELSE IF there are terms/entities in the query that Claude does not know about → single search immediately ELSE IF info about the query changes frequently (daily/monthly) OR query has temporal indicators (current/latest/recent):
* Simple factual query or can answer with one source → single search
* Complex multi-aspect query or needs multiple sources → research, using 2-20 tool calls depending on query complexity ELSE → answer the query directly first, but then offer to search
Follow the category descriptions below to determine when to use search.

Es gibt für Claude also 3 mögliche Szenarien.

Die Information ist stabil und ändert sich nicht → Es wird nicht gesucht
Die Begriffe oder Themen kennt Claude nicht → Eine einfache Suche mit einer Quelle als Ergebnis
Es handelt sich um ein aktuelles Thema oder das im Tag/Monat sich ändert → Suchen, je nach Komplexität eine einfache Suche mit einem Ergebnis oder eine komplexe Recherche mit 2-20 Ergebnissen.

Suchkategorien, damit Claude eine Entscheidung trifft

Never_search_category

Jetzt wirds spannend den hier haben wir Kategorien, bei denen wir keine Chance haben erwähnt zu werden, da niemals gesucht wird. Das heisst, für GEO sind diese Themen irrelevant.

For queries in the Never Search category, always answer directly without searching or using any tools. Never search for queries about timeless info, fundamental concepts, or general knowledge that Claude can answer without searching. This category includes:
* Info with a slow or no rate of change (remains constant over several years, unlikely to have changed since knowledge cutoff)
* Fundamental explanations, definitions, theories, or facts about the world
* Well-established technical knowledgeExamples of queries that should NEVER result in a search:
* help me code in language (for loop Python)
* explain concept (eli5 special relativity)
* what is thing (tell me the primary colors)
* stable fact (capital of France?)* history / old events (when Constitution signed, how bloody mary was created)
* math concept (Pythagorean theorem)
* create project (make a Spotify clone)
* casual chat (hey what's up)

Folgende Bereiche sind dabei betroffen

Evergreen Content

Also Inhalte die sich nicht ändern über die Zeit. Für sowas braucht er deinen Websitecontent nicht. Während das im SEO immer super tolle Themen waren, siehts bei GEO eher schelcht dafür aus.

Basics, Definitionen, Theorien

Bye, bye Glossare und einfache Konzepte erklären. Wir müssen mit unserem Webinhalt wenn er zitiert werden sollte also ganz in eine andere Richtung.

Bekanntes technischen Know How

Auch das etwas, das wir vielleicht gerne mit unserem Content angegangen sind.

Das sind für unsere Webseite mal die wichtigsten Sachen. Der Rest ist eher klar – Code, Geschichte, fixe Fakten, mathematische Konzepte, etc…

Do_not_search_but_offer_category

Während das von vorher Dinge waren wo NIEMALS und unter keinen Umständen gesucht wird. GIbt es noch so eine Grauzone. In diesem Fall wird zuerst aus dem eigenen Wissen ene Antwort generiert, aber dem User angeboten das ganze zu ergänzen mit einer Suche wenn er das gerne hätte.

For queries in the Do Not Search But Offer category, ALWAYS (1) first provide the best answer using existing knowledge, then (2) offer to search for more current information, WITHOUT using any tools in the immediate response. 
If Claude can give a solid answer to the query without searching, but more recent information may help, always give the answer first and then offer to search. If Claude is uncertain about whether to search, just give a direct attempted answer to the query, and then offer to search for more info. 
Examples of query types where Claude should NOT search, but should offer to search after answering directly:
* Statistical data, percentages, rankings, lists, trends, or metrics that update on an annual basis or slower (e.g. population of cities, trends in renewable energy, UNESCO heritage sites, leading companies in AI research) - Claude already knows without searching and should answer directly first, but can offer to search for updates
* People, topics, or entities Claude already knows about, but where changes may have occurred since knowledge cutoff (e.g. well-known people like Amanda Askell, what countries require visas for US citizens) 
When Claude can answer the query well without searching, always give this answer first and then offer to search if more recent info would be helpful. Never respond with only an offer to search without attempting an answer.

Das betrifft zum Beispiel:

Listen, Rankings

Das ist wichtig den für CahtGPT hilft es aktuell sehr wohl noch Listen wie zum Beispiel “Beste SEO Agentur Schweiz” zu erstellen. Aber Claude startet hier wohl erst mit einer Liste aus seinem Wissen. Da sieht man das nicht alle genau gleich sind, und man oft probieren muss.

Statistik und Metriken

Wie ich schon oft erwähnt habe ist für Statistiken Perplexity einfach unschlagbar. Und wie wir sehen versucht Claude hier nicht gleich deinen tollen Beitrag heranzuziehen – aber vielleicht in einem nächsten Schritt schon.

Personen & Themen (Entitäten)

Auch das ist super wichtig zu bedenken. Wenn du die Über uns Seite updatest heisst das nicht das diese neuen Daten direkt ausgelesen werden. Vielleicht weiss Claude nämlich schon genug über dich und genügt sich mit dem was er schon weiss…. Allerdings wird angeboten nach neueren Wissen zu suchen.

Single_search_category

Nun sind wir bei den Kategorien die gesucht werden – aber wo Claude sich mit einer Suche und einem Ergebnis eigentlich zufrieden gibt. Es wird also keine ganze Recherche gestartet sondern eine einfache Suche.

If queries are in this Single Search category, use web_search or another relevant tool ONE time immediately. Often are simple factual queries needing current information that can be answered with a single authoritative source, whether using external or internal tools. 
Characteristics of single search queries:
* Requires real-time data or info that changes very frequently (daily/weekly/monthly)
* Likely has a single, definitive answer that can be found with a single primary source - e.g. binary questions with yes/no answers or queries seeking a specific fact, doc, or figure
* Simple internal queries (e.g. one Drive/Calendar/Gmail search)
* Claude may not know the answer to the query or does not know about terms or entities referred to in the question, but is likely to find a good answer with a single search
Examples of queries that should result in only 1 immediate tool call:
* Current conditions, forecasts, or info on rapidly changing topics (e.g., what's the weather)
* Recent event results or outcomes (who won yesterday's game?)
* Real-time rates or metrics (what's the current exchange rate?)
* Recent competition or election results (who won the canadian election?)* Scheduled events or appointments (when is my next meeting?)
* Finding items in the user's internal tools (where is that document/ticket/email?)
* Queries with clear temporal indicators that implies the user wants a search (what are the trends for X in 2025?)
* Questions about technical topics that change rapidly and require the latest information (current best practices for Next.js apps?)
* Price or rate queries (what's the price of X?)
* Implicit or explicit request for verification on topics that change quickly (can you verify this info from the news?)
* For any term, concept, entity, or reference that Claude does not know, use tools to find more info rather than making assumptions (example: "Tofes 17" - claude knows a little about this, but should ensure its knowledge is accurate using 1 web search)
If there are time-sensitive events that likely changed since the knowledge cutoff - like elections - Claude should always search to verify.Use a single search for all queries in this category. Never run multiple tool calls for queries like this, and instead just give the user the answer based on one search and offer to search more if results are insufficient. Never say unhelpful phrases that deflect without providing value - instead of just saying 'I don't have real-time data' when a query is about recent info, search immediately and provide the current information.

Diese können wir mehr oder weniger so zusammenfassen:

Alles was aktuell ist: Ergebnisse von Spielen oder Wahlen, alles was News ist, aktuelle Konditionen wie das Wetter, Veranstaltungen
Begriffe und Konzepte, die Claude nicht kennt
Prompts mit einer klaren Zeitangabe (zum Beispiel 2025)
Preise und Preislisten
Wenn gesagt wird, dass es News sind, die gesucht werden sollte

Research_category

Diese Kategorie ist nun wo Claude wirklich in die Tiefe geht, und sich mehrere Seiten ansieht um die beste Antwort aus diesen zu generieren.

Queries in the Research category need 2-20 tool calls, using multiple sources for comparison, validation, or synthesis. Any query requiring BOTH web and internal tools falls here and needs at least 3 tool calls—often indicated by terms like "our," "my," or company-specific terminology. Tool priority: (1) internal tools for company/personal data, (2) web_search/web_fetch for external info, (3) combined approach for comparative queries (e.g., "our performance vs industry"). Use all relevant tools as needed for the best answer. Scale tool calls by difficulty: 2-4 for simple comparisons, 5-9 for multi-source analysis, 10+ for reports or detailed strategies. Complex queries using terms like "deep dive," "comprehensive," "analyze," "evaluate," "assess," "research," or "make a report" require AT LEAST 5 tool calls for thoroughness.

Research query examples (from simpler to more complex):
* reviews for [recent product]? (iPhone 15 reviews?)
* compare [metrics] from multiple sources (mortgage rates from major banks?)
* prediction on [current event/decision]? (Fed's next interest rate move?) (use around 5 web_search + 1 web_fetch)
* find all [internal content] about [topic] (emails about Chicago office move?)
* What tasks are blocking [project] and when is our next meeting about it? (internal tools like gdrive and gcal)
* Create a comparative analysis of [our product] versus competitors
* what should my focus be today (use google_calendar + gmail + slack + other internal tools to analyze the user's meetings, tasks, emails and priorities)
* How does [our performance metric] compare to [industry benchmarks]? (Q4 revenue vs industry trends?)
* Develop a [business strategy] based on market trends and our current position
* research [complex topic] (market entry plan for Southeast Asia?) (use 10+ tool calls: multiple web_search and web_fetch plus internal tools)*
* Create an [executive-level report] comparing [our approach] to [industry approaches] with quantitative analysis
* average annual revenue of companies in the NASDAQ 100? what % of companies and what # in the nasdaq have revenue below $2B? what percentile does this place our company in? actionable ways we can increase our revenue? (for complex queries like this, use 15-20 tool calls across both internal tools and web tools)

For queries requiring even more extensive research (e.g. complete reports with 100+ sources), provide the best answer possible using under 20 tool calls, then suggest that the user use Advanced Research by clicking the research button to do 10+ minutes of even deeper research on the query.

Hier fällt eigentlich einfach alles rein, was etwas komplexer ist oder was eindeutig nicht nur eine Antwort will (Vergleiche, Bewertungen oder so etwas zum Beispiel).

In fett hab ich dir oben die für uns am interessantesten Beispiele markiert.

Das wäre zum Beispiel:

Wenn der Kunde unser Angebot zu dem vom Konkurrenten vergleichen will.
Produkte zueinander vergleichen
Benchmarks, Industrie News, Statistiken und sehr spezifische Informationen

Was noch super spannend ist sind die “terms” – also die Begriffe, die eine noch tiefere Rescherhce auslösen: Complex queries using terms like «deep dive,» «comprehensive,» «analyze,» «evaluate,» «assess,» «research,» or «make a report»

Also wenn wir in unserem Prompt etwas verwenden wir “recherchiere”, “analysiere”, “tauche tiefer ein ins Thema”, “mach eine Report” dann weiss Claude mit dieser Anweisung: Achtung hier werd ich etwas mehr suchen müssen.

Was dir vielleicht auch auffällt, es geht bei diesem Prompt nicht nur um die Suche im Internet, sondern allgemeine Suche mit seinen Tools – das kann eben auch in verbundenen Drive sein. Aber das ist für uns SEOs nun eher weniger interessant.

Zusammenfassung der wichtigsten Punkte

Was lernen wir nun also für unsere KI-SEO-Optimierung aus dem Leak der Systemprompts von Claude?

Die Internetsuche wird nur genutzt, wenn es unbedingt nötig ist. Claude greift zuerst auf sein internes Wissen aus den Trainingsdaten zurück.
Claude unterscheidet vier Kategorien für die Nutzung der Websuche:
1. Niemals suchen:
  Themen, die sich kaum ändern – z. B. Fakten, Konzepte, Grundlagenwissen oder Evergreen-Content – führen nie zu einer Suche. Diese Inhalte werden nicht zitiert.
2. Suche vorschlagen zur Vertiefung:
  Claude beantwortet die Frage mit dem vorhandenen Wissen, schlägt aber eine zusätzliche Websuche vor. Das betrifft z. B. Personen oder Unternehmen, Listen & Rankings, Metriken und Statistiken.
3. Einfache Suche:
  Dazu zählen aktuelle Themen wie News, Spielergebnisse, neue Begriffe oder Preise mit Zeitbezug (z. B. „2025“). Wenn Claude etwas nicht kennt, wird eine schnelle Suche angestossen.
4. Komplexe Suche:
  Diese erfolgt bei Vergleichen – z. B. Produktvergleiche, Konkurrenzanalysen oder Benchmarks.

All das zeigt uns, wie wir unsere Inhalte gestalten müssen, um in KI-Suchmaschinen wie Claude oder ChatGPT Search erwähnt zu werden.

Wenn du tiefer einsteigen willst – hier sind ein paar passende Beiträge auf dem Blog:

Und hey – trag dich in meinen Newsletter ein. Vielleicht gibt’s bald die ultimative GEO-Checkliste. Vielleicht auch nicht. Aber was du auf jeden Fall bekommst: exklusive Inhalte und erste Tests, die ich gerade mit meinen Kunden mache – direkt in deine Inbox.

Und mein Newsletter? Hier kannst du dich anmelden:

Wann „suchen“ LLMs im Internet? – Antworten aus dem Claude System Prompt Leak