AI検索で自社サイトが引用されない?今すぐできる3つの対策【llms.txt・構造化データ・robots.txt】


「ChatGPTに自社名を聞いてみたら、一切出てこなかった」

Webサイト運営者からよく聞く話です。SEOはそれなりにやってきたつもりなのに、AI検索では存在しないも同然——そんな焦りを感じている方も多いのではないでしょうか。

最近は「AI出現率チェックツール」と呼ばれるサービスが登場し始めており、「自社がどれだけAI回答に登場するか」を計測しようという動きも出ています。気持ちはわかります。でも今の段階では、計測より対策が先です。

なぜなら、AI検索の回答は毎回変わります。同じ質問をChatGPTに投げても、今日と明日で違う結果が返ってくることはざらにあります。再現性が低い数字を追いかけるより、「引用されやすいサイトの条件を整える」ことに時間を使うほうが明らかにROIが高い。

その条件は、突き詰めると3つの対策に帰結します。


対策1:llms.txtを設置する

llms.txtとは何か

Webの仕組みに少し詳しい方なら、robots.txtはご存知のはずです。「このページはクローラーに見せる/見せない」を制御するファイルです。その後、sitemap.xmlが普及し、「サイト内にどんなページがあるか」を検索エンジンに伝える標準的な手段になりました。

llms.txtは、その次にくる第3のWeb標準です。

2024年、AI研究機関「Answer.AI」のJeremy Howard氏が提唱したこの仕様は、「AIクローラーがサイトをより正確に理解するための要約ガイド」として機能します。

通常のWebページはHTMLで書かれており、ナビゲーションメニュー、広告、フッター、JavaScriptコードなど、大量の「ノイズ」が含まれています。人間はそのノイズを視覚的に無視できますが、AIが情報を抽出しようとすると余計な要素が邪魔をします。

llms.txtはMarkdown形式で書かれた、シンプルな「サイト案内書」です。AIに「うちのサイトはこういう構成で、重要なページはこれです」と直接伝えることができます。

llms.txtの書き方

ファイルはサイトルート(https://example.com/llms.txt)に設置します。以下が基本的な構成です。

# サービス名 / 運営会社名

> サービスの概要を1〜2文で説明します。ターゲットユーザーや提供価値を簡潔に。

## 主要ページ

- [サービストップ](https://example.com/): サービス全体の概要
- [料金プラン](https://example.com/pricing/): 各プランの詳細と比較
- [使い方ガイド](https://example.com/how-to-use/): 初期設定から活用方法まで
- [よくある質問](https://example.com/faq/): ユーザーからの質問と回答
- [事例・実績](https://example.com/case-studies/): 導入事例と成果

## Optional

- [ブログ](https://example.com/blog/): Web制作・SEOに関する技術記事
- [運営会社情報](https://example.com/about/): 会社概要・スタッフ情報

ポイントは「厳選」することです。全ページを列挙するのではなく、サービスの理解に直結する10〜20ページに絞ります。AIに「このサイトで最も重要な情報はここにある」と伝えることが目的なので、不要なページを含めると逆効果です。

llms-full.txtと.well-known/llms.txtも設定する

実はllms.txtには派生形があります。

<strong>llms-full.txt</strong>は詳細版で、各ページの本文内容まで含めた完全版です。ページ数が多いサイトや、コンテンツの深さをAIに伝えたい場合に有効です。

また、<strong>/.well-known/llms.txt</strong>というパスを参照するAIクローラーも存在します。robots.txt.well-known版と思ってください。サーバーの.htaccessnginx.confで、/.well-known/llms.txtへのアクセスを/llms.txtにリダイレクトする設定を追加しておくと、より多くのAIクローラーに対応できます。


対策2:構造化データ(JSON-LD)を充実させる

なぜ構造化データがAI引用に効くのか

「構造化データ」とは、ページの内容を機械が読みやすい形式で記述したメタ情報です。JSON-LDはその記述形式のひとつで、現在最も推奨されている方法です。

2026年の調査では、スキーママークアップ(構造化データ)を実装したページは、AI回答に引用される確率が約2.5倍高いというデータが報告されています。

これには理由があります。ChatGPTやPerplexityは、Webページを処理する際に構造化データを「信頼性の高い情報源」として扱います。HTMLの本文テキストは解釈の余地があいまいですが、JSON-LDで明示された情報はそのまま構造的なデータとして処理されるため、回答生成に使いやすいのです。

優先的に実装すべきスキーマ

FAQPage(最優先)

Q&Aペアの形式で書かれた情報は、AIの回答形式と相性が良く、そのまま引用されやすい構造です。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "llms.txtはどこに設置すればいいですか?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "サイトルート(https://example.com/llms.txt)に設置します。また、/.well-known/llms.txtへのリダイレクトも設定しておくと、より多くのAIクローラーに対応できます。"
      }
    },
    {
      "@type": "Question",
      "name": "robots.txtでAIクローラーをブロックするとどうなりますか?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "AIクローラーがページを取得できなくなるため、AI検索で引用される機会が大幅に減ります。公開ページはAllow設定にすることを推奨します。"
      }
    }
  ]
}
</script>

HowTo

手順を伴う解説記事に有効です。「○○の手順」「○○のやり方」という形式のコンテンツに追加することで、AIが手順を整理して引用しやすくなります。

WebApplication / Organization

サービスや運営会社の基本情報を構造化します。AIが「このサービスは何をするものか」「誰が運営しているか」を正確に理解するための土台です。

BreadcrumbList

サイト内の階層構造を示します。AIがサイトの構造を把握するのに役立ちます。

OGPの設定を全ページに個別で行う

構造化データと合わせて重要なのが、OGP(Open Graph Protocol)タグの設定です。AIはページのメタ情報も参照するため、全ページに個別のog:titleog:descriptionog:imageを設定することが基本になります。

特にog:imageにはwidthheightを明示してください。

<meta property="og:title" content="ページ固有のタイトル" />
<meta property="og:description" content="このページが扱う内容の要約(120〜160文字程度)" />
<meta property="og:image" content="https://example.com/images/ogp-page-name.jpg" />
<meta property="og:image:width" content="1200" />
<meta property="og:image:height" content="630" />
<meta name="twitter:card" content="summary_large_image" />

対策3:robots.txtでAIクローラーを「歓迎」する

多くのサイトがAIクローラーをブロックしている

2023年以降、プライバシーやコンテンツ利用への懸念から、robots.txtでAIクローラーをブロックするサイトが急増しました。気持ちはわかりますが、これはトレードオフです。

ブロックすれば、AI検索で引用されなくなります。

自社サイトを学習データに使われたくない、という判断もあり得ます。しかしAI検索でビジネスの認知を取りたいなら、公開している情報についてはAIクローラーにアクセスを許可する設定が基本です。

推奨するrobots.txt設定

User-agent: GPTBot
Allow: /
Disallow: /wp-admin/
Disallow: /wp-login.php

User-agent: ChatGPT-User
Allow: /

User-agent: Claude-Web
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Applebot-Extended
Allow: /

# llms.txtの場所
# https://example.com/llms.txt

User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-login.php

主要なAIクローラーのbot名は以下の通りです。

サービスボット名
ChatGPT(OpenAI)GPTBotChatGPT-User
Claude(Anthropic)Claude-Web
PerplexityPerplexityBot
Apple(Siri等)Applebot-Extended

wp-adminなどの管理画面はブロックしつつ、コンテンツページは全体的に開放するのが基本の考え方です。また、コメント行にllms.txtの場所を記載しておくと、クローラーがllms.txtを参照しやすくなります。


「AI出現率チェック」が今は優先順位として低い理由

ここで、冒頭の話に戻ります。AI出現率チェックツールは「自社がAI検索にどれだけ出ているか」を計測するサービスです。将来的にAI検索が主流になれば、重要なKPIになる可能性は十分あります。

ただし今の段階で優先する理由は薄いです。理由は3つ。

①再現性がない
同じ質問でも、モデルのバージョン・プロンプトの微妙な差異・タイミングによって回答が変わります。今日の数字が明日も同じとは限りません。

②改善アクションは同じ
仮に出現率を計測して「低い」とわかったとしても、打つべき手はllms.txtの設置・構造化データの充実・コンテンツ品質の向上です。つまり計測しなくても、対策の方向性は変わりません。

③投資対効果の問題
API経由で大量のクエリを投げて計測するサービスはコストがかかります。その費用を、コンテンツの改善や構造化データの整備に使うほうが、確実な改善につながります。


まとめ:実装チェックリスト

今日からできる対策を一覧にまとめます。優先度の高いものから順に取り組んでください。

必須(高優先度)

  • [ ] /llms.txt をサイトルートに設置(重要な10〜20ページに厳選)
  • [ ] /.well-known/llms.txt へのリダイレクト設定
  • [ ] robots.txt でGPTBot・Claude-Web・PerplexityBot等をAllow
  • [ ] robots.txt にllms.txtの場所をコメントで記載

構造化データ(中優先度)

  • [ ] FAQPage スキーマを全LP(トップページ含む)に追加
  • [ ] Organization スキーマで運営情報を構造化
  • [ ] WebApplication スキーマでサービス概要を記述
  • [ ] HowTo スキーマで使い方・手順コンテンツを構造化
  • [ ] BreadcrumbList でサイト階層を明示

OGP・メタ情報(中優先度)

  • [ ] 全ページに個別のog:titleog:descriptionを設定
  • [ ] og:imagewidth / height を明示(1200×630px推奨)
  • [ ] twitter:cardsummary_large_image に設定

発展(任意)

  • [ ] /llms-full.txt を作成(本文内容込みの詳細版)
  • [ ] 主要ページの VideoObject スキーマ追加(動画コンテンツがある場合)

これらの対策は、AI検索への対応として語られることが多いですが、実際には通常のSEOにも直結する施策です。構造化データはリッチリザルト表示に影響し、OGPはSNS経由の流入にも関わります。「AI対策」として取り組みながら、サイト全体の品質向上につながるのが、この3つの対策を優先すべき理由でもあります。


自社サイトの構造化データ実装状況を確認したい方へ

どのページにどのスキーマが実装されているか、OGP設定に漏れがないかなどは、CodeQuest.work SEO_CHECKで無料で診断できます。45項目以上の診断項目をもとに、今の実装状況をすぐに把握できます。

まずは自社サイトの現状確認から始めてみてください。