← Yohaku の都市 / 読み物

RAGって結局なに? 自分の資料でAIに答えさせる仕組みを、やさしく

AIは社内資料も最新情報も知らない。RAGは“答える前に調べさせる”ことで、出典つきの答えを返す仕組み。図でやさしく。

更新 2026-06-01 ・ 関連州: vectors

#AI#信頼性・正確さ#検索・知識

「社内の資料やマニュアルについて、AIに正しく答えてほしい」——そう思ったとき、答えになるのが RAG です。

ふつうのAIは、学習した時点の一般知識しか持っていません。あなたの会社の文書も、昨日のニュースも知らないし、知らないことは“それっぽく”でっち上げてしまう(→ ハルシネーション)。RAG は、これを正面から解く、いま最も実用的な仕組みのひとつです。

考え方:答える前に、調べさせる

RAG(Retrieval-Augmented Generation/検索拡張生成)は、名前のとおり二段構え。まず質問に関連する文書を検索(Retrieval)し、それを手元の資料として生成(Generation)に渡します。AIは“記憶”ではなく“目の前の資料”を根拠に答えるので、最新情報にも社内文書にも、出典つきで答えられます。

ベクトルDBあなたの資料あなたの質問① 関連資料を検索② AIが生成③ 出典つきの回答
RAG の流れ:質問に対し、まず関連資料を検索し、その資料を根拠にAIが生成する。だから答えに出典がつく——“記憶”ではなく“目の前の資料”で答える仕組み。

仕組みは、ざっくり3ステップ

① 下ごしらえ 手元の文書を細かく分け、埋め込み(意味を表す数値)に変換して、ベクトルデータベースに保管します。

② 検索 質問が来たら、それも埋め込みに変えて、意味の近い文書を高速に探し出す。キーワード一致ではなく“意味”で探すのがミソです。

③ 生成 見つけた文書を質問と一緒にAIへ渡し、「この資料に基づいて答えて」と頗む。だから答えに出典がつきます。

向いている場面・注意点

社内ナレッジへの質問応答、最新情報を要するサポート、根拠の明示が要る業務に向きます。一方で、検索で“ピント外れ”の資料を拾うと答えも外れる。文書の整え方と検索の精度が、品質を左右します。完璧な記憶装置ではなく、優秀な調べもの係——そう捉えると過不足なく使えます。

もっと深く(関連用語)

RAG埋め込みベクトルデータベースハルシネーション

参考文献・出典

  1. Lewis et al., “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”(2020)— arXiv:2005.11401
  2. Ji et al., “Survey of Hallucination in Natural Language Generation”(2022)— arXiv:2202.03629
  3. 各ベクトルDBの公式ドキュメント(Pinecone / Weaviate / Qdrant ほか)。図・定義はYohaku編集部による整理(editorial, 2026-06)。

▶ vectors 判定エンジンで、あなたの用途・状況に合わせて採点する

数字は出典つきのスナップショット。評価関数による透明な判定であり、特定製品の推奨ではない。Yohaku — 判定の都市。