The English version of quarkus.io is the official project site. Translated sites are community supported on a best-effort basis.

コンテキストRAG (複数ソース、再ランク付け、注入)

高度なコンテキストRAGは、複数ソースからの情報検索、再ランク付け、コンテンツ注入技術を組み込むことで、コアなフローズンRAGパターンを拡張します。これは、情報がさまざまなシステムに分散している可能性があり、正確性、関連性、説明可能性を確保するためにより洗練された手法が必要となる、より複雑な企業シナリオ向けに設計されています。これにより、動的な情報処理、複雑なクエリ処理が可能になり、監査可能な決定のためのより明確な系譜が提供されるため、高いリスクを伴うアプリケーションに最適です。

主なユースケース

  • 複雑なクエリ: 複数のソースからの統合を必要とする複雑な問題に対応します。
  • 動的な情報: リアルタイムの更新を組み込むことで、急速に変化するデータ環境に対応します。
  • 高精度なニーズ: 再ランク付けと注入により、より正確で関連性の高い回答が保証されます。
  • 監査可能な決定: 生成された応答について明確な系譜とコンテキストを提供し、コンプライアンスとデバッグに不可欠です。

アーキテクチャの概要

このプロセスはユーザーのクエリから始まり、まずクエリ変換器によって、より効果的な検索のために洗練または強化されます。変換されたクエリは、次にクエリルーティングに渡され、どの知識ソースをターゲットにするかを決定します。非構造化データの場合、取り込みパイプラインは基本的なRAGアーキテクチャ (ドキュメントは分割され、埋め込み化され、ベクトルストアに保存されます) と同じですが、コンテキストRAGは、構造化データベース、API、検索インデックスなどの複数ソースに情報検索を拡張します。

クエリルーティングは、クエリを複数の検索ソースに同時に指示する役割を担います。これらのソースには以下が含まれます:

  • ベクトル検索器: ベクトルストアからセマンティックな類似性に基づいて情報を検索します。
  • Web/検索検索器: Webまたは外部の検索エンジンから情報を収集します。
  • データベース検索器: 構造化データベースから関連データを抽出します。
  • 全文検索器: 文書コーパス全体でキーワードに基づいた検索を実行します。

これらの多様なソースから検索されたすべての情報は、その後、アグリゲーター/再ランク付け器に供給されます。このコンポーネントは、元のクエリへの関連性に基づいて、検索されたコンテンツを結合し、優先順位を付けます。

集約され、再ランク付けされたコンテンツは、コンテンツ注入器 (プロンプトビルダー)に渡されます。このコンポーネントは、検索されたコンテキストを元のユーザーのクエリと一緒に組み込むことで、大規模言語モデル (LLM) のために強化されたプロンプトを構築します。

最後に、LLMは提供されたコンテキストを使用して回答を生成するため、オーグメンテーションされたプロンプトを処理します。回答と並行して、システムは透明性と検証のために検索されたソースセグメントを返すことができますが、これらは厳密な引用ではなく、補助的なコンテキストと見なされるべきです。

コンテキストRAGクエリ画像 コンテキストRAGクエリ画像

スケーラビリティとパフォーマンス

AIソリューションのスケーリングとパフォーマンスの最適化を効率的に行うことは、企業での採用と運用上の成功にとって不可欠です。この設計図は高レベルのガイダンスを提供するに過ぎませんが、ソリューションの非機能要件と、これらの概念に対処する方法も検討することを強く推奨します:

  • ドメイン/テナントシャーディング: ベクトルストアからセマンティックな類似性に基づいて情報を検索します。
  • キャッシュ: パフォーマンス向上のために、クエリベクトルとトップKヒットをキャッシュします。
  • 非同期取り込み: 非同期取り込みを活用して、埋め込みをバッチ処理し、デルタをストリームします。
  • リーンプロンプト: コンテキストのためのトークン予算を優先し、プロンプトを簡潔に保ちます。

セキュリティー

セキュアな企業AIソリューションを設計することは、機密データを保護し、組織の完全性を維持するためにプロアクティブなアプローチを求められます。以下は、ソリューションを構築する際にさらに調査すべき、重要なセキュリティーの考慮事項とアーキテクチャパターンに関する最初の考察です。

  • 検索時の認可: コンテキストを注入する前に、ユーザー/テナントのクレームでフィルタリングします。
  • 監査系譜: チャンク→ドキュメント→ソースの連携をタイムスタンプと共に保存します。
  • PII制御: 埋め込みとプロンプトの前に、機密性の高いスパンを編集またはマスクします。
  • 応答の保護: データ漏洩やポリシー違反がないか事後的にフィルタリングします。