「ChatGPTに自社名を聞いてみたら、一切出てこなかった」
Webサイト運営者からよく聞く話です。SEOはそれなりにやってきたつもりなのに、AI検索では存在しないも同然——そんな焦りを感じている方も多いのではないでしょうか。
最近は「AI出現率チェックツール」と呼ばれるサービスが登場し始めており、「自社がどれだけAI回答に登場するか」を計測しようという動きも出ています。気持ちはわかります。でも今の段階では、計測より対策が先です。
なぜなら、AI検索の回答は毎回変わります。同じ質問をChatGPTに投げても、今日と明日で違う結果が返ってくることはざらにあります。再現性が低い数字を追いかけるより、「引用されやすいサイトの条件を整える」ことに時間を使うほうが明らかにROIが高い。
その条件は、突き詰めると3つの対策に帰結します。
対策1:llms.txtを設置する
llms.txtとは何か
Webの仕組みに少し詳しい方なら、robots.txtはご存知のはずです。「このページはクローラーに見せる/見せない」を制御するファイルです。その後、sitemap.xmlが普及し、「サイト内にどんなページがあるか」を検索エンジンに伝える標準的な手段になりました。
llms.txtは、その次にくる第3のWeb標準です。
2024年、AI研究機関「Answer.AI」のJeremy Howard氏が提唱したこの仕様は、「AIクローラーがサイトをより正確に理解するための要約ガイド」として機能します。
通常のWebページはHTMLで書かれており、ナビゲーションメニュー、広告、フッター、JavaScriptコードなど、大量の「ノイズ」が含まれています。人間はそのノイズを視覚的に無視できますが、AIが情報を抽出しようとすると余計な要素が邪魔をします。
llms.txtはMarkdown形式で書かれた、シンプルな「サイト案内書」です。AIに「うちのサイトはこういう構成で、重要なページはこれです」と直接伝えることができます。
llms.txtの書き方
ファイルはサイトルート(https://example.com/llms.txt)に設置します。以下が基本的な構成です。
# サービス名 / 運営会社名
> サービスの概要を1〜2文で説明します。ターゲットユーザーや提供価値を簡潔に。
## 主要ページ
- [サービストップ](https://example.com/): サービス全体の概要
- [料金プラン](https://example.com/pricing/): 各プランの詳細と比較
- [使い方ガイド](https://example.com/how-to-use/): 初期設定から活用方法まで
- [よくある質問](https://example.com/faq/): ユーザーからの質問と回答
- [事例・実績](https://example.com/case-studies/): 導入事例と成果
## Optional
- [ブログ](https://example.com/blog/): Web制作・SEOに関する技術記事
- [運営会社情報](https://example.com/about/): 会社概要・スタッフ情報
ポイントは「厳選」することです。全ページを列挙するのではなく、サービスの理解に直結する10〜20ページに絞ります。AIに「このサイトで最も重要な情報はここにある」と伝えることが目的なので、不要なページを含めると逆効果です。
llms-full.txtと.well-known/llms.txtも設定する
実はllms.txtには派生形があります。
<strong>llms-full.txt</strong>は詳細版で、各ページの本文内容まで含めた完全版です。ページ数が多いサイトや、コンテンツの深さをAIに伝えたい場合に有効です。
また、<strong>/.well-known/llms.txt</strong>というパスを参照するAIクローラーも存在します。robots.txtの.well-known版と思ってください。サーバーの.htaccessやnginx.confで、/.well-known/llms.txtへのアクセスを/llms.txtにリダイレクトする設定を追加しておくと、より多くのAIクローラーに対応できます。
対策2:構造化データ(JSON-LD)を充実させる
なぜ構造化データがAI引用に効くのか
「構造化データ」とは、ページの内容を機械が読みやすい形式で記述したメタ情報です。JSON-LDはその記述形式のひとつで、現在最も推奨されている方法です。
2026年の調査では、スキーママークアップ(構造化データ)を実装したページは、AI回答に引用される確率が約2.5倍高いというデータが報告されています。
これには理由があります。ChatGPTやPerplexityは、Webページを処理する際に構造化データを「信頼性の高い情報源」として扱います。HTMLの本文テキストは解釈の余地があいまいですが、JSON-LDで明示された情報はそのまま構造的なデータとして処理されるため、回答生成に使いやすいのです。
優先的に実装すべきスキーマ
FAQPage(最優先)
Q&Aペアの形式で書かれた情報は、AIの回答形式と相性が良く、そのまま引用されやすい構造です。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "llms.txtはどこに設置すればいいですか?",
"acceptedAnswer": {
"@type": "Answer",
"text": "サイトルート(https://example.com/llms.txt)に設置します。また、/.well-known/llms.txtへのリダイレクトも設定しておくと、より多くのAIクローラーに対応できます。"
}
},
{
"@type": "Question",
"name": "robots.txtでAIクローラーをブロックするとどうなりますか?",
"acceptedAnswer": {
"@type": "Answer",
"text": "AIクローラーがページを取得できなくなるため、AI検索で引用される機会が大幅に減ります。公開ページはAllow設定にすることを推奨します。"
}
}
]
}
</script>
HowTo
手順を伴う解説記事に有効です。「○○の手順」「○○のやり方」という形式のコンテンツに追加することで、AIが手順を整理して引用しやすくなります。
WebApplication / Organization
サービスや運営会社の基本情報を構造化します。AIが「このサービスは何をするものか」「誰が運営しているか」を正確に理解するための土台です。
BreadcrumbList
サイト内の階層構造を示します。AIがサイトの構造を把握するのに役立ちます。
OGPの設定を全ページに個別で行う
構造化データと合わせて重要なのが、OGP(Open Graph Protocol)タグの設定です。AIはページのメタ情報も参照するため、全ページに個別のog:title・og:description・og:imageを設定することが基本になります。
特にog:imageにはwidthとheightを明示してください。
<meta property="og:title" content="ページ固有のタイトル" />
<meta property="og:description" content="このページが扱う内容の要約(120〜160文字程度)" />
<meta property="og:image" content="https://example.com/images/ogp-page-name.jpg" />
<meta property="og:image:width" content="1200" />
<meta property="og:image:height" content="630" />
<meta name="twitter:card" content="summary_large_image" />
対策3:robots.txtでAIクローラーを「歓迎」する
多くのサイトがAIクローラーをブロックしている
2023年以降、プライバシーやコンテンツ利用への懸念から、robots.txtでAIクローラーをブロックするサイトが急増しました。気持ちはわかりますが、これはトレードオフです。
ブロックすれば、AI検索で引用されなくなります。
自社サイトを学習データに使われたくない、という判断もあり得ます。しかしAI検索でビジネスの認知を取りたいなら、公開している情報についてはAIクローラーにアクセスを許可する設定が基本です。
推奨するrobots.txt設定
User-agent: GPTBot
Allow: /
Disallow: /wp-admin/
Disallow: /wp-login.php
User-agent: ChatGPT-User
Allow: /
User-agent: Claude-Web
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Applebot-Extended
Allow: /
# llms.txtの場所
# https://example.com/llms.txt
User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-login.php
主要なAIクローラーのbot名は以下の通りです。
| サービス | ボット名 |
|---|---|
| ChatGPT(OpenAI) | GPTBot、ChatGPT-User |
| Claude(Anthropic) | Claude-Web |
| Perplexity | PerplexityBot |
| Apple(Siri等) | Applebot-Extended |
wp-adminなどの管理画面はブロックしつつ、コンテンツページは全体的に開放するのが基本の考え方です。また、コメント行にllms.txtの場所を記載しておくと、クローラーがllms.txtを参照しやすくなります。
「AI出現率チェック」が今は優先順位として低い理由
ここで、冒頭の話に戻ります。AI出現率チェックツールは「自社がAI検索にどれだけ出ているか」を計測するサービスです。将来的にAI検索が主流になれば、重要なKPIになる可能性は十分あります。
ただし今の段階で優先する理由は薄いです。理由は3つ。
①再現性がない
同じ質問でも、モデルのバージョン・プロンプトの微妙な差異・タイミングによって回答が変わります。今日の数字が明日も同じとは限りません。
②改善アクションは同じ
仮に出現率を計測して「低い」とわかったとしても、打つべき手はllms.txtの設置・構造化データの充実・コンテンツ品質の向上です。つまり計測しなくても、対策の方向性は変わりません。
③投資対効果の問題
API経由で大量のクエリを投げて計測するサービスはコストがかかります。その費用を、コンテンツの改善や構造化データの整備に使うほうが、確実な改善につながります。
まとめ:実装チェックリスト
今日からできる対策を一覧にまとめます。優先度の高いものから順に取り組んでください。
必須(高優先度)
- [ ]
/llms.txtをサイトルートに設置(重要な10〜20ページに厳選) - [ ]
/.well-known/llms.txtへのリダイレクト設定 - [ ]
robots.txtでGPTBot・Claude-Web・PerplexityBot等をAllow - [ ]
robots.txtにllms.txtの場所をコメントで記載
構造化データ(中優先度)
- [ ]
FAQPageスキーマを全LP(トップページ含む)に追加 - [ ]
Organizationスキーマで運営情報を構造化 - [ ]
WebApplicationスキーマでサービス概要を記述 - [ ]
HowToスキーマで使い方・手順コンテンツを構造化 - [ ]
BreadcrumbListでサイト階層を明示
OGP・メタ情報(中優先度)
- [ ] 全ページに個別の
og:title・og:descriptionを設定 - [ ]
og:imageにwidth/heightを明示(1200×630px推奨) - [ ]
twitter:cardをsummary_large_imageに設定
発展(任意)
- [ ]
/llms-full.txtを作成(本文内容込みの詳細版) - [ ] 主要ページの
VideoObjectスキーマ追加(動画コンテンツがある場合)
これらの対策は、AI検索への対応として語られることが多いですが、実際には通常のSEOにも直結する施策です。構造化データはリッチリザルト表示に影響し、OGPはSNS経由の流入にも関わります。「AI対策」として取り組みながら、サイト全体の品質向上につながるのが、この3つの対策を優先すべき理由でもあります。
自社サイトの構造化データ実装状況を確認したい方へ
どのページにどのスキーマが実装されているか、OGP設定に漏れがないかなどは、CodeQuest.work SEO_CHECKで無料で診断できます。45項目以上の診断項目をもとに、今の実装状況をすぐに把握できます。
まずは自社サイトの現状確認から始めてみてください。