研修効果測定の代表的なモデル比較|カークパトリック・フィリップス・LTEM・SCMを解説

研修効果測定とは何か、なぜ今求められているのか
研修を実施したあと、「本当に効果があったのだろうか」と感じたことはないでしょうか。受講者のアンケートでは満足度が高かったのに、現場の行動が変わった手応えがない。あるいは、上司から「研修の費用対効果を示してほしい」と求められ、どう答えればよいか迷った経験を持つ人材育成担当者は少なくないはずです。
研修効果測定とは、実施した研修プログラムが受講者の学習・行動・業績にどのような変化をもたらしたかを体系的に把握するプロセスです。単なるアンケートの集計ではなく、「研修投資が組織のビジネス目標にどうつながっているか」を明らかにすることが本質的な目的です。
研修効果を可視化することで、経営層への説明責任を果たせるだけでなく、次の研修プログラムの改善にもつながります。そのための出発点として、世界的に活用されている代表的なモデルを理解しておくことが重要です。この記事では、カークパトリック、フィリップス、LTEM、SCM(サクセスケース・メソッド)、そしてGP Strategiesのアプローチを解説し、それぞれの特徴と使い分けを整理します。
なお、効果測定を実施するためには、研修設計の段階から目標を明確にしておく必要があります。設計の基礎については研修ニーズのヒアリング方法|把握から設計につなげる3つのアプローチもあわせてご参照ください。
カークパトリックの4段階モデル
世界で最も広く知られる研修効果測定のフレームワークが、ドナルド・カークパトリックが1959年に提唱した「4段階モデル」です。研修の効果を4つのレベルで段階的に評価するという考え方は、その後の多くのモデルの原型となりました。
▲ カークパトリックの4段階モデル(下から上へ積み上がる構造)
このモデルの特徴は、評価(Level 1)→学習(Level 2)→行動(Level 3)→成果(Level 4)という階段状の構造にあります。受講者の反応を起点にしながら、最終的には組織のビジネス成果とのつながりを問う設計になっています。
後継のジムとウェンディ・カークパトリックは「ニュー カークパトリックモデル」として発展版を提唱しました。この更新版では、Level 3の「行動」を中心に据え、研修前から職場での行動定着を意識した設計・フォローの重要性を強調しています。「Monitor(監視)& Adjust(調整)」というサイクルを明示し、単なる評価ではなく継続的な改善プロセスとして位置づけたことが大きな違いです。
カークパトリックモデルは汎用性が高く、どの業界・規模の組織でも導入しやすい点が強みです。一方で「Level 4の成果は研修以外の要因も多く、因果関係の証明が難しい」という限界も指摘されています。この課題に正面から向き合ったのが、次のフィリップスモデルです。
フィリップスの5段階モデル(ROI方法論)
ジャック・フィリップスとパッティー・フィリップスが開発した5段階モデルは、カークパトリックの4段階にLevel 5「費用対効果(ROI)」を加えたものです。研修への投資額に対して、金銭的なリターンがどれだけあったかを定量化しようとする点が最大の特徴です。
▲ フィリップスの5段階モデル(Level 0はインプット計測)
フィリップスモデルの核心:V型モデル(ROI Methodology)
フィリップスモデルが他のモデルと決定的に異なるのは「V型モデル」と呼ばれる設計思想にあります。多くの人材育成担当者が「研修を実施してから測定する」という順序で考えがちですが、フィリップスはその逆を主張します。まず最終的に達成したいビジネス成果を明確にし、そこから逆算して研修を設計するという考え方です。
成果から逆算して研修を設計
情報収集して各レベルを評価
上位のビジネスニーズから出発し、段階的に「何を学ばせれば行動が変わり、成果につながるか」を逆算して研修を設計する
研修後に各レベルの情報を収集し、下(反応)から上(ROI)へと積み上げて研修効果の全体像を把握する
▲ V型モデル:左から下に向かって研修を企画し、右側で下から上に向かって測定する
V型モデルの重要な点は「企画と測定が鏡のように対応している」ことです。例えば、企画段階でLevel 3(職場活用)の目標を設定したなら、研修後にも同じLevel 3で「実際に職場で活用できているか」を確認します。企画の時点で測定の設計も同時に行うことで、後から「何を測ればよかったか分からない」という状況を防ぎます。これがフィリップスモデルを研修設計から効果測定まで一貫して使える理由です。
PLAN→DO→SEE→ACTIONの4フェーズ
V型モデルの流れをより実践的なプロセスに落とし込んだのが「PLAN→DO→SEE→ACTION」の4フェーズです。ROI Methodologyの12のステップはすべてこの4フェーズに整理されます。
▲ PLAN→DO→SEE→ACTIONの4フェーズ(ROI Methodologyの12ステップを整理)
このプロセスで特に重要なのはSEEフェーズの「因果関係の明確化」です。研修後に成果が出たとしても、それが研修の効果なのか、市場環境の変化なのか、個人の努力なのかを区別しなければ経営層への説明力が弱くなります。フィリップスはコントロールグループの設定・受講者への事後ヒアリング・上司評価の活用など複数の手法で研修の「純粋な貢献度」を推計することを推奨しています。
フィリップスが示す「どのレベルまで測るか」の目安
すべての研修プログラムをLevel 5まで測定することは現実的ではありません。フィリップスらは以下の目安を提示しています。
この目安が示すように、費用対効果(Level 5)まで測定するのは全体の5〜10%の重点プログラムに絞るのが現実的です。一方でLevel 1の受講後アンケートはほぼ全プログラムで実施し、Level 2の学習確認も6〜9割のプログラムで行うことが推奨されています。重要なのは、全てを完璧に測ろうとするのではなく、各プログラムの目的・重要度に応じて測定レベルをV型モデルの企画段階で事前に決めておくことです。
LTEM(ラーニング・トランスファー・エバリュエーション・モデル)
LTEMは、ウィル・トールハイマーが2018年に発表した比較的新しいモデルです。「カークパトリックモデルの問題点に関する研究を何年も読んで飽きた。より良いものを自分でつくることにした」という強烈な動機から生まれました。最大の特徴は、知識のインプットよりも「職場でのスキル定着」を評価の中心に置いた点にあります。
信号機の3色で「測る意味のある指標」を判別する
LTEMでは、各段階を信号機の色で分類しています。赤は「効果を測る指標として不十分、測る意味があまりない」、黄色は「測っても良いが不十分」、緑は「効果測定のために重要な指標」を示します。この色分けによって、担当者が「何を測れば本当に研修効果を把握できるか」を直感的に判断できる設計になっています。
ここから下:補助的指標(単独では不十分)
ここから下:単独では効果測定に不十分
緑:効果測定に重要
黄:補助的に有効
赤:単独では不十分
▲ LTEMの8段階モデル(信号機カラーで測定価値を分類)
LTEMが特に重視するのはTier 6以上、つまり「業務に近い状況で実際に判断・行動できるか」を時間をおいて確認することです。研修直後の知識テストではなく、数日・数週間後に業務シナリオに基づいたアセスメントや、実際の職場での行動観察を重視します。このアプローチは、日本企業でよく行われる「研修直後の満足度アンケート」だけでは不十分だという問題意識と重なります。
研修効果の測定方法をより体系的に整備したい方は、研修効果測定のやり方|実践できる3つのステップを解説も参考にしてください。
SCM(サクセスケース・メソッド):成果が出た事例に絞って深く掘り下げる
ロバート・O・ブリンカホフが提唱したSCM(Success Case Method)は、「全受講者を均一に測定する」のではなく、「成果が出た事例と出なかった事例を選んで深くヒアリングする」という逆転の発想のアプローチです。測定コストを抑えながら、現場で実際に機能している要因と障害を素早く把握できる点が強みです。
受講者を3つのゾーンに分類する
SCMの出発点は、受講者を研修後の行動によって3つのグループに分類することです。
▲ SCMの3ゾーン分類(成果が出る受講者は全体の20%未満が多い)
重要な示唆として、成果が出る受講者の割合は全体の20%未満にとどまることが多く、その主な理由は「職場環境」と「上司のサポート」にあるとされています。つまり研修の内容だけでなく、研修後の現場支援が成果を左右するのです。
SCMの5ステップ
SCMは5つのステップで進めます。
マップ
作成
研修設計フェーズ
データ収集
分析・深掘り
まとめ
報告・改善
Step 1の「インパクトマップ」では、「知識・スキルの習得 → 職場での行動変容 → 業務成果 → ビジネスゴールへの貢献」という因果の連鎖を事前に図式化します。これにより、後の測定で「何を確認すればよいか」が明確になります。Step 3のインタビューでは、成果が出た受講者(全体の15%程度)に絞り、「何が成功要因だったか」「職場環境や上司のサポートはどうだったか」を深掘りします。
Step 5の結果発表では、「データよりストーリー」「過去の結果より今後の改善」「Whatよりなぜ(Why)」「研修の評価より現場支援の提言」を優先することが推奨されています。効果測定の目的は評価だけでなく、次の研修と現場支援をより良くすることにあるという哲学が反映されています。
弊社では研修後のフォローアップ支援も行っています。研修内容の職場定着に課題を感じている方は、お気軽にご相談ください。
インパクトマップ:研修と経営をつなぐ設計図
SCMのStep 1でも活用するインパクトマップは、研修投資がどのようなメカニズムで組織の成果につながるかを視覚的に整理する手法です。カークパトリックモデルやフィリップスモデルとも共通する「研修→行動→成果→ビジネスゴール」という論理の流れを、実際の業務に即したかたちで具体化します。
できるようになること
行動変容
▲ インパクトマップの構造と具体例
インパクトマップを作成する際のポイントは、左から右へ「もしこれができれば、あれが起きる」という因果の流れが論理的に説明できること、そして右から左へ逆算して「この成果のためにはどんな行動が必要か」という研修設計の根拠が示せることです。ステークホルダーと一緒にこのマップを確認し、「流れが自然か? KPIが分かりやすいか?」を議論することが、経営層の理解と協力を得るうえで効果的です。
GP Strategiesのアプローチ:Measurement Mapで成果を語る
世界最大級の研修会社GP Strategiesは、2021年から独自の効果測定メソッドの発信を強化しています。その中核にあるのが「Measurement Map」と呼ばれる手法で、「育成施策 → 先行指標 → ビジネス成果」という3段階のつながりを明確にすることを重視しています。
Measurement Mapの特徴は、測定の設計と「ストーリーとして語れるか」を同時に問う点にあります。マップが完成したら左から右(投資から成果へ)・右から左(成果から逆算)の両方向で説明できるかを確認し、「流れが自然か」「因果のつながりは明確か」「KPIは分かりやすいか」をステークホルダーと検証します。データを羅列するだけでなく、経営的なストーリーとして説明できる状態を目指す点は、SCMの「データよりストーリー」という哲学と共鳴しています。
4つのモデルの比較と使い分け
ここまで紹介してきた各モデルには、それぞれ異なる強みと適した場面があります。どれが「正解」というわけではなく、組織の状況や測定の目的に応じて選択・組み合わせることが重要です。
(4段階)
(5段階・ROI)
(8段階)
(サクセスケース)
効果測定でよくある落とし穴
研修効果測定を導入しようとする際には、いくつかの典型的な失敗パターンがあります。フィリップスらが指摘するよくある落とし穴として、まず「頑張りすぎて自分で自分の首を絞める」があります。すべての研修をLevel 5まで測ろうとすると、測定業務自体が膨大になり、本来の研修設計・実施のリソースを圧迫します。前述の「どのレベルまで測るか」の目安を参考に、測定範囲を現実的に絞ることが大切です。
次に「平均値ばかり大事にする」という落とし穴があります。アンケートの平均スコアを報告するだけでは、「なぜ成果が出たのか」「何が障害だったのか」という改善に必要な情報が見えません。SCMが示すように、成果が出た少数の事例を深く掘り下げることで、平均値からは見えない重要な示唆が得られます。
また「研修自慢をしてしまう」という傾向も注意が必要です。測定の目的は研修の成果を誇示することではなく、次の改善につなげることです。「研修が良かった」という評価よりも「職場での行動がどう変わったか」「どんな支援があれば定着するか」というアクション指向の問いが、経営層にとって価値ある情報です。
測定設計と研修設計を連動させる方法については、研修ニーズのヒアリング方法で詳しく解説しています。ぜひあわせてご覧ください。
よくある質問
研修効果測定は必ずすべきですか?小規模な研修でも必要でしょうか?
すべての研修で高いレベルの測定が必要というわけではありません。フィリップスが示す目安のように、受講後アンケート(Level 1)はほぼすべての研修で実施する一方、費用対効果(Level 5)の測定は重点プログラムの5〜10%に絞るのが現実的です。小規模な研修でも、アクションプランや短いフォローアップアンケートを取り入れるだけで、定着支援と効果確認を同時に行うことができます。
カークパトリックとフィリップスはどう使い分ければよいですか?
カークパトリックは「研修の効果を4つの視点で構造的に把握する」汎用的なフレームワークとして使いやすく、まず効果測定の文化を組織に浸透させる際に有効です。フィリップスはそれに費用対効果(ROI)の計算を加えたもので、経営層への投資対効果の説明が求められる重点プログラムや、大規模な研修投資の判断材料が必要な場面に適しています。多くの場合、日常的にはカークパトリックで運用し、特定の重要プログラムにのみフィリップスのROI分析を適用するという組み合わせが現実的です。
LTEMを実践するには何から始めればよいですか?
まず自社の研修で「何を測っているか」を棚卸しすることから始めてください。多くの場合、受講後アンケート(Tier 3相当)や出席記録(Tier 1・2相当)に集中しており、実際のスキル定着(Tier 6・7)は測れていないことに気づきます。次のステップとして、主要な研修プログラムで「研修から数週間後に業務シナリオに基づいた確認テストやロールプレイを行う」という仕組みを一つ試してみることをお勧めします。
SCMのインタビューはどのくらいの時間と人数が必要ですか?
SCMのインタビューは、成果が出た受講者(全体の15%程度)と成果が出なかった受講者の一部を対象に行います。インタビュー1件あたり30〜60分程度が目安で、各グループ3〜5名へのヒアリングから十分な示唆を得られることが多いです。全受講者を対象にした大規模調査と比べ、圧倒的に少ないリソースで「成果が出るメカニズム」と「障害となっている要因」を把握できる点がSCMの強みです。
研修効果測定の結果を経営層にどう報告すればよいですか?
SCMとGP Strategiesが共通して強調するのは「データよりストーリー」という原則です。数値の羅列ではなく、「ある受講者がこの研修でどうスキルを習得し、職場でどう行動し、どんな成果を出したか」という具体的な成功事例(インパクトプロフィール)を中心に据えることで、経営層の理解と関心を引き出しやすくなります。また「過去の評価」より「今後の改善提案」を主役にした報告が、次の投資判断につながりやすいです。
研修効果測定の設計・導入をお考えの方へ
「研修をやりっぱなしにせず、成果につなげたい」「経営層へ研修投資の効果を示したい」というご要望に、研修設計の段階からご支援します。カークパトリック・フィリップス・SCMなど、貴社の状況に合った効果測定の設計についてお気軽にご相談ください。







