RAGって結局なに？自分の資料でAIに答えさせる仕組みを、やさしく

AIは社内資料も最新情報も知らない。RAGは“答える前に調べさせる”ことで、出典つきの答えを返す仕組み。図でやさしく。

「社内の資料やマニュアルについて、AIに正しく答えてほしい」——そう思ったとき、答えになるのが RAG です。

ふつうのAIは、学習した時点の一般知識しか持っていません。あなたの会社の文書も、昨日のニュースも知らないし、知らないことは“それっぽく”でっち上げてしまう（→ ハルシネーション）。RAG は、これを正面から解く、いま最も実用的な仕組みのひとつです。

考え方：答える前に、調べさせる

RAG（Retrieval-Augmented Generation／検索拡張生成）は、名前のとおり二段構え。まず質問に関連する文書を検索（Retrieval）し、それを手元の資料として生成（Generation）に渡します。AIは“記憶”ではなく“目の前の資料”を根拠に答えるので、最新情報にも社内文書にも、出典つきで答えられます。

RAG の流れ：質問に対し、まず関連資料を検索し、その資料を根拠にAIが生成する。だから答えに出典がつく——“記憶”ではなく“目の前の資料”で答える仕組み。

仕組みは、ざっくり3ステップ

① 下ごしらえ　手元の文書を細かく分け、埋め込み（意味を表す数値）に変換して、ベクトルデータベースに保管します。

② 検索　質問が来たら、それも埋め込みに変えて、意味の近い文書を高速に探し出す。キーワード一致ではなく“意味”で探すのがミソです。

③ 生成　見つけた文書を質問と一緒にAIへ渡し、「この資料に基づいて答えて」と頗む。だから答えに出典がつきます。

向いている場面・注意点

社内ナレッジへの質問応答、最新情報を要するサポート、根拠の明示が要る業務に向きます。一方で、検索で“ピント外れ”の資料を拾うと答えも外れる。文書の整え方と検索の精度が、品質を左右します。完璧な記憶装置ではなく、優秀な調べもの係——そう捉えると過不足なく使えます。

もっと深く（関連用語）

RAG ・埋め込み・ベクトルデータベース・ハルシネーション

参考文献・出典

数字は出典つきのスナップショット。評価関数による透明な判定であり、特定製品の推奨ではない。Yohaku — 判定の都市。

RAGって結局なに？ 自分の資料でAIに答えさせる仕組みを、やさしく