The English version of quarkus.io is the official project site. Translated sites are community supported on a best-effort basis.

Chain-of-Thought (CoT) 推論

Chain-of-Thought (CoT) ブループリントのアーキテクチャは、大規模言語モデル (LLM) を明示的な中間ステップを通じてガイドし、複雑な問題を解決し、推論を改善し、その意思決定に透明性を提供することに焦点を当てています。

主なユースケース

  • 推論の改善: 複雑な問題を分解して、論理的誤りを減らします。
  • 透明性: 意思決定に関するオプションの説明を提供します。
  • トレーニングとイネーブルメント: 概念の「何を」だけでなく、「なぜ」を説明します。
  • 意思決定支援: 投資、ベンダー選定、リスク評価を支援します。
  • トラブルシューティング: 運用およびエンジニアリングにおいて、構造化された診断を容易にします。
  • ポリシー適用: 追跡可能なステップで複数条項のルールを適用します。

アーキテクチャの概要

CoT アーキテクチャは、プロセスを開始する「ユーザー クエリ」から始まります。このクエリは、「Quarkus CoT サービス」によって受信され、このサービスが推論フロー全体のオーケストレーターとして機能します。Quarkus サービス内で、LangChain4j を活用したコアの Chain-of-Thought ロジックが実行されます。

CoT アーキテクチャ図 CoT アーキテクチャ図

「LangChain4j」パッケージは、CoT プロセスの連続するステップをカプセル化します。

ステップ1: 要因分析:
この最初のステップでは、LLM が複雑なユーザー クエリを構成要素に分解し、主要な要因を特定し、初期分析を実行します。これには、問題の理解、関連データポイントの特定、またはタスクの範囲の定義が含まれる場合があります。
ステップ2: オプションの統合:
ステップ1の分析に基づいて、LLM はクエリに関連するさまざまなオプション、潜在的な解決策、または異なる視点を統合します。このステップは、モデルが結論に達する前にさまざまな思考経路を探る能力を示しています。
ステップ3: 推奨:
最終ステップでは、LLM は前のステップで実行された分析と統合に基づいて、「推奨」または決定的な回答を策定します。この推奨が CoT プロセスの最終出力となります。

最後に、応答がユーザーに返され、透明性が必要な場合には中間推論ステップを含めるオプションが提供されます。Quarkus はシングルプロンプトまたはマルチプロンプトのチェーンの実行をオーケストレーションし、LangChain4j はプロンプトを構築し、各ステップでの推論出力をキャプチャするための抽象化を提供します。この構造化されたフローにより、複雑なタスクにおける LLM のパフォーマンスが向上し、必要に応じて回答がどのように導き出されたかを示す監査可能な記録が提供されます。

さらなるパターン

Chain-of-Thought 推論におけるさらなるパターンは、基本的なシングルプロンプトのアプローチを超えて、より洗練された制御と統合を提供します。「シングルプロンプト CoT」は、たとえば「段階的に考える」といった単一の指示によって LLM が思考プロセスと最終回答の両方を返すように導く、簡潔な推論の引き出し方を提供します。

より高度なシナリオでは、「Program-of-Thought」の恩恵を受けます。これは、複数の連結されたプロンプトを含み、あるステップの出力が次のステップに供給され、多くの場合、精度を高めるためのオプションの検証ステップが含まれます。

最後に、「ハイブリッド」アプローチは、CoT と Retrieval-Augmented Generation (RAG) を組み合わせ、推論プロセスを事実情報に基づいて確立することで、LLM の論理的ステップが関連データによってサポートされていることを保証します。これらのパターンは、CoT の適用方法に柔軟性をもたらし、アーキテクトが特定のエンタープライズ AI アプリケーションに必要な制御レベルと事実に基づいた基盤を選択できるようにします。

ガードレールとプライバシー

エンタープライズ環境向けの Chain-of-Thought (CoT) ソリューションを設計するには、ガードレールとプライバシーの慎重な検討が必要です。以下の点は、責任ある安全な AI 展開を確実にするためにソフトウェアアーキテクトが考慮しなければならない重要な側面の一部を示しています。これらの考慮事項は、推論の透明性を管理し、回答の一貫性を維持し、CoT プロセス内でのデータ漏洩を制御するために不可欠です。

  • 推論の開示: Chain of Thought (CoT) を開示するか、内部に留めるかを決定します。
  • 一貫性チェック: 最終検証プロンプトを実装するか、決定論的な後処理ルールを適用します。
  • トークン予算管理: 中間的な冗長性を制限し、ステップ間で要約します。