「社内の資料やマニュアルについて、AIに正しく答えてほしい」——そう思ったとき、答えになるのが RAG です。
ふつうのAIは、学習した時点の一般知識しか持っていません。あなたの会社の文書も、昨日のニュースも知らないし、知らないことは“それっぽく”でっち上げてしまう(→ ハルシネーション)。RAG は、これを正面から解く、いま最も実用的な仕組みのひとつです。
考え方:答える前に、調べさせる
RAG(Retrieval-Augmented Generation/検索拡張生成)は、名前のとおり二段構え。まず質問に関連する文書を検索(Retrieval)し、それを手元の資料として生成(Generation)に渡します。AIは“記憶”ではなく“目の前の資料”を根拠に答えるので、最新情報にも社内文書にも、出典つきで答えられます。
仕組みは、ざっくり3ステップ
① 下ごしらえ 手元の文書を細かく分け、埋め込み(意味を表す数値)に変換して、ベクトルデータベースに保管します。
② 検索 質問が来たら、それも埋め込みに変えて、意味の近い文書を高速に探し出す。キーワード一致ではなく“意味”で探すのがミソです。
③ 生成 見つけた文書を質問と一緒にAIへ渡し、「この資料に基づいて答えて」と頗む。だから答えに出典がつきます。
向いている場面・注意点
社内ナレッジへの質問応答、最新情報を要するサポート、根拠の明示が要る業務に向きます。一方で、検索で“ピント外れ”の資料を拾うと答えも外れる。文書の整え方と検索の精度が、品質を左右します。完璧な記憶装置ではなく、優秀な調べもの係——そう捉えると過不足なく使えます。
もっと深く(関連用語)
RAG ・ 埋め込み ・ ベクトルデータベース ・ ハルシネーション