Question 1

RAGの精度は、なぜ本番で落ちるのですか？

Accepted Answer

デモはAIコード生成やノーコードで簡単に動きますが、業務データに当てた瞬間に精度が40〜60%台で頭打ちになることが多くあります。原因はモデルの性能ではなく、ベクトル検索単体では固有名詞・型番・条文番号を取りこぼすこと、自動チャンク分割が文書構造を無視すること、そして評価軸が無いまま「なんとなく」進めてしまうことにあります。Cognisantはデータ設計・検索設計・評価・運用の4層を積み上げ、大手総合商社の案件では正答率を38.8%から93.6%まで引き上げました。

Question 2

Forward Deployed Engineer（FDE）とは何ですか？

Accepted Answer

お客様の現場・実データ・業務に入り込み、PoCで終わらせず「使われる」ところまで伴走する開発の動き方です。問題はもうモデルの性能ではなく、デモから本番へと現場の業務に接続しきれないことにあります。だからこそ世界の最前線はForward Deployedへ動いており、OpenAIもAnthropicもこの体制に舵を切りました。Cognisantは創業時からこの動き方を実践しています。

Question 3

「動くRAG」と「使えるRAG」は何が違うのですか？

Accepted Answer

「動くRAG」はデモでは動くものの、運用設計・評価セット・検索設計・データ設計が欠けており、本番精度は40〜60%台に留まります。「使えるRAG」は、データ設計・ハイブリッド検索（ベクトル+キーワード+リランキング）・評価駆動の改善・運用設計の4レイヤーを丁寧に積み上げ、業務文書で93.6%の正答率と、半年後も使い続けられる運用性を両立します。

Question 4

PoCで終わらせないために、具体的に何をするのですか？

Accepted Answer

要件定義の段階でROI評価軸を言語化し、業務シナリオに沿った49問の評価セットを用意します。検索精度・回答品質・ツール選定の各レイヤーを数値で計測し、ボトルネックを特定してから改善を打つサイクルを回します。さらに、インデックス更新フロー・データ品質監視・精度の定点観測といった運用設計までを納品物に含め、社内文書や業務ルールの変化にも耐えられる状態にします。

Question 5

どのように精度を93.6%まで高めたのですか？

Accepted Answer

大手総合商社の週次レポートAI検索では、Agentic RAG（LangGraph）とハイブリッド検索、文書構造別チャンク、自動評価パイプラインを組み合わせました。意味的な近さはベクトル検索で、固有名詞・型番・条文番号はキーワード検索で押さえ、リランキングで最終的な順位を整える3段構成です。49問の業務シナリオ評価で、正答率38.8%→93.6%、総合品質スコア2.37→4.55/5.00へと改善しました。

Question 6

閉域環境やセキュリティ要件にも対応できますか？

Accepted Answer

はい。セキュリティポリシーに応じて国内クラウドや閉域環境へのデプロイに対応します。LLMの基盤モデルからベクトル検索、評価、監視まで、要件に合わせて構成を選定します。まずは発注前提ではない30分のオンライン相談で、現在の構成と課題をお聞きした上で、精度改善の方向性と概算感をお伝えします。

「動くRAG」ではなく、
「使えるRAG」を。

「動くRAG」と「使えるRAG」は、
まったく別物です。

デモは動く。本番で崩れる。

業務文書で93.6%。半年後も使える。

なぜ、AIは「作っても使われない」のか。

大手総合商社で実証した、劇的な精度改善。

93.6%を出した「4層」の設計原則。

3ステップで、3つの壁を超える。

要件定義 & 評価設計

データ & 検索設計

評価駆動 & 運用設計

業界別の伴走事例 — RAG/LLM 10件+

納品物とテックスタック、まとめて1枚で。

よくある質問

RAGの精度は、なぜ本番で落ちるのですか？

Forward Deployed Engineer（FDE）とは何ですか？

「動くRAG」と「使えるRAG」は何が違うのですか？

PoCで終わらせないために、具体的に何をするのですか？

どのように精度を93.6%まで高めたのですか？

閉域環境やセキュリティ要件にも対応できますか？

RAGの精度でお困りなら、
まず現状を整理しませんか。

「動くRAG」ではなく、「使えるRAG」を。

「動くRAG」と「使えるRAG」は、まったく別物です。

デモは動く。本番で崩れる。

業務文書で93.6%。半年後も使える。

なぜ、AIは「作っても使われない」のか。

大手総合商社で実証した、劇的な精度改善。

93.6%を出した「4層」の設計原則。

3ステップで、3つの壁を超える。

要件定義 & 評価設計

データ & 検索設計

評価駆動 & 運用設計

業界別の伴走事例 — RAG/LLM 10件+

納品物とテックスタック、まとめて1枚で。

よくある質問

RAGの精度は、なぜ本番で落ちるのですか？

Forward Deployed Engineer（FDE）とは何ですか？

「動くRAG」と「使えるRAG」は何が違うのですか？

PoCで終わらせないために、具体的に何をするのですか？

どのように精度を93.6%まで高めたのですか？

閉域環境やセキュリティ要件にも対応できますか？

RAGの精度でお困りなら、まず現状を整理しませんか。

「動くRAG」ではなく、
「使えるRAG」を。

「動くRAG」と「使えるRAG」は、
まったく別物です。

RAGの精度でお困りなら、
まず現状を整理しませんか。