AI導入・PoC
AIのPoC止まりはなぜ起きるのか——「本番化する会社」との分かれ目と、抜け出す進め方
AIのPoCで、デモは動いた。評価の数字も出た。それでも本番化の話が進まないことがあります。予算の時期が変わり、推進していた担当者が異動し、判断がつかないまま「次の期に検討」に回る。止まった理由を社内できちんと説明できる人は、多くありません。
「PoC止まり」で検索された方は、いまこの状態にいるのだと思います。念のため書いておくと、これは珍しいことではありません。ある調査では、企業は平均してPoCの半分近くを、本番に乗せる前に取りやめています(S&P Global, 2025)。原因の多くはチームの力不足ではなく、始め方にあります。この記事では、何が違うのか、止まったところからどう進めるのかを、順番に説明します。
止まる理由は、技術より「進め方」に多い
PoCが本番に乗らないとき、最初に疑われるのは精度です。「業務で使うには精度が足りなかった」。実際そういう場合もあります。ただ、精度そのものより、その手前で決めていなかったことのほうが、止まる原因としては多い、というのが実装側の実感です。
決めていないことは、だいたい3つに分かれます。ひとつ、このPoCは何ができたら成功なのか。ふたつ、その成否を何で測るのか。みっつ、本番で誰が運用し、月々いくらかかり、精度が落ちたら誰が直すのか。この3つが曖昧なまま「とりあえず動かしてみる」で始めると、デモが動いても、本番にする判断の材料が最後まで揃いません。数字はあるのに決められない、という状態は、ここから来ています。
この3つを、順に「分かれ目」として見ていきます。ご自身のPoCがどこで引っかかっているか、照らし合わせながら読んでください。
分かれ目1:目的と合格ラインを、始める前に決めているか
止まるPoCの多くは、「AIで何かできないか」から始まっています。目的が「試すこと」自体になっていて、何ができたら本番に進めるのかが決まっていない。これだと、終わったときに成功とも失敗とも言えません。
本番に進めた会社は、始める前に3つを言葉にしています。誰のどの作業が楽になれば成功なのか。合格ラインは何点で、それは誰が判断するのか。そして、その一つの用途に絞る。あれもこれもと欲張らず、いちばん効くところを一つだけ選びます。範囲が狭いほど、合否ははっきりします。
ここが曖昧なまま進むと、報告会で「精度80%」という数字が出ても、その80%が業務で足りるのかを誰も判断できません。まず、目的と合格ラインを一枚の紙に書けるか。書けないなら、技術の前にそこを決め直すのが先です。
分かれ目2:良し悪しを測る道具を、持っているか
PoCが止まったとき、いちばん困るのは「なぜ止まったか説明できない」ことです。精度が足りないのか、足りているのに使い勝手が悪いのか、そもそも対象の選び方が違ったのか。切り分けられないと、次の一手が打てません。
切り分けるには、測る道具がいります。具体的には、業務で実際に来る質問を集めた評価セットです。代表的な質問を数十問そろえ、正解を決めておく。すると、いまが何点で、どの質問を落としていて、直したら何点上がったのかが数字で見えます。ここで、止まったままの会社と進める会社が、いちばんはっきり分かれます。
私たちが大手総合商社の週次レポート検索に取り組んだときも、最初にやったのは評価セットを作ることでした。49問の評価セットで測りながら直していき、正答率は38.8%から93.6%まで上がりました。ここで大事なのは93.6%という結果よりも、「どの質問を、なぜ落としているか」が毎回見えていたことです。見えているから直せる。評価セットの作り方はRAGは「測れないと上がらない」——評価セットの作り方に、この案件の詳細は商社の文書検索で正答率を38.8%→93.6%にした4層設計に書いています。RAGで精度が出ないときの、症状から原因を引く診断は症状からRAGの原因を引く診断ガイドにまとめています。
分かれ目3:本番で「誰が・いくらで・保てるか」を描けているか
精度が合格ラインに届いても、そこから本番に進めない、という止まり方も実はよくあります。多くは運用が理由です。本番でこのAIを誰が回すのか、月々いくらかかるのか、精度が落ちたとき誰がどう気づいて直すのか。ここが描けていないと、動くものがあっても「運用の当てがない」で見送りになります。
とくにコストは見落とされます。PoCでは無視できたAPIの単価も、全社で毎日、いくつもの用途で使えば総額はふくらむ。Gartnerは、生成AIプロジェクトの少なくとも3割がPoCの後に中止されると見込み、その理由の一つに「本番で膨らむ運用コスト」を挙げています(Gartner, 2024)。技術的にはうまくいっているのに、採算が合わずに止まる。これも、始め方で避けられた止まり方です。
本番に進める会社は、運用を後回しにしません。誰の仕事として引き取るか、費用の上限をどこに置くか、精度の低下をどう見張るか。あわせて、人の確認を「一時的な手間」で終わらせず、計画的に減らす設計にします。まず人が結果を確認してループに挟み、評価で基準を満たすことを確かめ、満たしたら確認を薄くし、最後は人が全部を見なくても回る状態にしていく。この「作って終わりにしない」段取りは、営業支援のAIでも同じでした(「使われる」営業AIの作り方)。運用は、本番にした後で考えるものではなく、本番にするかを決めるための材料です。
止まったところから、どう動かすか
3つの分かれ目を踏まえると、止まった状態から進める順番は次のようになります。特別なことはありません。
まず、現在地を確かめます。いまのPoCが3つのうちどこで引っかかっているのか。目的が曖昧なのか、測る道具がないのか、運用の設計がないのか。ここを取り違えると、いらないところに手を入れて時間を使います。
次に、いちばん効く一つを、使える最小限で本番に乗せます。PoCで広げた範囲を全部本番にしようとすると、また止まります。効果がはっきりしている一つに絞り、小さく本番に出して、そこから育てるほうが進みます。
最後に、評価で人の確認を卒業していきます。測る道具ができていれば、確認を薄くしても品質が保てるかを数字で確かめられます。ここまで来て初めて、「作って終わり」ではない運用になります。
まず、現在地から
止まったPoCを動かす最初の一歩は、現在地の確認です。とはいえ、動いている最中に自分たちのどこに穴があるかを見極めるのは、案外むずかしい。
そこで、無料のAI活用診断を用意しています。いくつかの質問に答えると、いまの状況の見立てと、次の一手のイメージがその場で出ます。すでにPoCがある方には、立て直しの観点で現在地を整理します。診断だけで方針が固まらなければ、30分の無料相談で、止まっているポイントを一緒に切り分けます。この時点で費用は発生しません。
止まっているのは、力不足のせいではありません。始め方を決め直せば、動かせます。
この記事は、AIツールを活用して作成し、Cognisant編集部がファクトチェック・編集・監修を行っています。掲載している数値は実際の支援案件で計測した公開可能な実績で、クライアントは業種表記としています。