Kirkpatrick 4段階モデルの本当の使い方|引退講演から学ぶ
2011年、研修効果測定の世界的権威であるドナルド・カークパトリック氏が、米国で開かれた人材育成の国際会議(ASTD ICE、現ATD国際会議)で引退講演に立ちました。1960年代に自ら築いた「研修効果測定の4段階モデル」を、半世紀にわたって磨き続けた末の、最後の講義です。
このモデルは今も研修効果測定の世界標準です。しかし現場では、多くの人材育成担当者がこれを「研修が終わったあとに下から順に測る道具」として使い、結局はレベル1の満足度アンケートだけで終わってしまいます。「研修の満足度は高いのに、事業の成果につながっている実感がない」という悩みは、この使い方から生まれます。
ところが、引退講演でカークパトリック氏本人が最後に強調したのは「測り方」ではなく「設計の順番」でした。本記事では、引退講演で語られた本来の使い方から、その後のモデル自体の進化、そして2023年の国際規格化までをたどり、4段階モデルの本当の使い方を整理します。
カークパトリックの4段階モデルとは
4段階モデルは、研修の効果を「満足度」「習得度」「行動変容」「事業成果」という4つの段階(レベル)に分けて評価する考え方です。下にいくほど測りやすく、上にいくほど事業に近づきます。まずは各レベルが「何を測るのか」を押さえておきましょう。
カークパトリックの4段階|各レベルが測る対象
反応(Reaction)|研修満足度
受講者が研修をどう感じたかを、終了直後のアンケートで測ります。最も手軽で、最も多く実施されている段階です。
学習(Learning)|知識・スキルの習得度
必要な知識やスキルが身についたかを、テストやデモンストレーションで測ります。研修の「中」で完結する段階です。
行動(Behavior)|職場での行動変容
学んだことを職場で実際に使っているかを測ります。研修の成果が事業に変わる分岐点でありながら、最も測られていない段階です。
成果(Results)|事業へのインパクト
行動の変化が、売上・品質・離職率といった事業のKPIにつながったかを測ります。経営層が最も知りたい段階です。
この4段階を眺めると、ひとつの傾向が見えてきます。手軽に測れるL1・L2は「研修の中」で完結しますが、事業に近いL3・L4は「研修のあと、職場で」起こることを測らなければなりません。多くの研修がL1の満足度アンケートで止まってしまうのは、測りやすさと事業へのインパクトが逆向きになっているからです。次の章では、なぜこの「下から測る」使い方が満足度止まりを生むのかを掘り下げます。
なぜ研修は「満足度アンケート」で終わるのか
多くの現場では、研修が終わってからL1(満足度)→L2(習得度)→L3(行動)→L4(成果)と「下から順に」測ろうとします。ところが実際にはL1のアンケートで力尽きてしまいます。理由ははっきりしています。L1とL2は研修会場で完結するため測りやすいのに対し、L3の職場での行動は、人材育成担当者が直接コントロールできない場所で起こるからです。測りにくいものは後回しになり、結局「満足度は高かった」という報告で1年が終わります。
この傾向は、予算の使われ方にもそのまま表れます。ATDの調査によると、効果測定の予算は次のように配分されています。
研修効果測定の予算は、どの段階に使われているか(ATD調査)
予算の約7割が段階1〜2に集中し、事業に近い段階3〜4は後回しになっている
ここに偏りがある:予算の約7割が「研修の中」で測れるL1・L2に向かい、事業の成果を左右するL3・L4には合わせて4分の1しか使われていない。
つまり、お金も労力も「研修の中」に集中し、本当に効かせたい「職場での行動」と「事業成果」にはほとんど届いていません。満足度が高いのに成果が見えないのは、担当者の努力不足ではなく、測る場所が事業から遠いところに偏っているためです。後にカークパトリック家自身が示した改訂版(ニューワールド・カークパトリックモデル)でも、この「実施後にL1・L2偏重で測り始めること」は、避けるべき代表的な落とし穴のひとつとして指摘されています。
では、どうすればこの偏りから抜け出せるのか。鍵は、引退講演でカークパトリック氏が最後に強調した「設計の順番」にあります。次の章で、その逆転の発想を見ていきます。
本当の使い方①:成果(L4)から逆算して設計する
引退講演でカークパトリック氏が最も強調したのは、「測るとき」と「設計するとき」では4段階をたどる向きが逆になる、という点でした。研修の効果を測るときは、L1からL4へ「下から」積み上げます。しかし研修を設計するときは、L4からL1へ「上から」逆算するのが正しい順番だというのです。
つまり、最初に「研修後、職場でどんな事業成果を出したいか(L4)」を決め、そこから必要な行動(L3)、知識・スキル(L2)、研修体験(L1)へと降りていく。ゴールを先に固めるからこそ、満足度を上げるためだけの研修にならずに済みます。
この逆算の発想は、難しい統計の知識がなくても始められます。改訂版モデルを率いたジェームズ・カークパトリック氏は、効果測定は突き詰めると次の3つの問いに答えるだけでよい、と整理しています。
研修の目標を達成したか?
最初に決めたL4の成果(期待)に応えられたかを問う。ここが出発点になる。
達成していないなら、なぜか?
原因を特定して、次の研修や職場フォローを改善する材料にする。
達成できたなら、なぜか?
成功要因をつかみ、社内に共有して再現できるようにする。
ゴール(L4)を先に言葉にしておけば、この3つの問いはそのまま答えやすくなります。逆に、満足度アンケートだけを集めていると、3つのどれにも答えられません。設計の順番を変えるだけで、研修は「やって終わり」から「成果につながったかを語れるもの」へと変わります。とはいえ、ここで決めたL3の行動を放置すれば成果は出ません。次の章では、最も測られにくいL3をどう支え、どう測るかを見ていきます。
本当の使い方②:レベル3(職場の行動)を放置しない
引退講演でカークパトリック氏が強調したもうひとつの要点が、L3(職場での行動)を放置しないことでした。研修で学んだことが職場で使われて初めて、L4の事業成果が生まれます。逆に言えば、L3が動かなければ、どれだけ満足度が高くても成果はゼロのままです。ところがL3は人材育成担当者の目の届かない職場で起こるため、最も見過ごされてきました。
ここで参考になるのが、世界最大級の産油企業サウジアラムコが導入したL3の評価票です。研修後に職場で何をするかを5つのステップとして評価票に明記し、上司を巻き込みながら行動と成果を記録していきます。アンケートを1枚配って終わりにするのではなく、「測る道具」そのものに上司との対話を組み込んでいる点が特徴です。
レベル3を測る評価票の5ステップ(サウジアラムコの例)
上司と面談
アクションプランを合意
実践して記入
結果を評価票に書く
成果を議論
上司と効果を話す
上司が署名
コメントを記入
部門へ提出
記録として残す
この5ステップが優れているのは、L3を測る行為が、そのまま上司を巻き込む仕掛けになっている点です。上司と面談し、結果を議論し、署名をもらう。この流れを評価票に組み込むだけで、現場が自律的に「研修を成果につなげる」方向に動き始めます。測定は、成果を確認する作業であると同時に、成果を生む装置にもなるのです。
L3を測る方法は、評価票だけではありません。行動観察とチェックリスト、研修前後の行動の差分、受講者・上司・同僚の三者へのインタビューなど、アンケート以外の手段を組み合わせることで精度が上がります。すべてをアンケートで済ませようとすることも、改訂版モデルが指摘する落とし穴のひとつです。なお、成功した受講者の事例を起点に効果を測る手法は、サクセスケース・メソッド(SCM)の記事で詳しく解説しています。
もうひとつ、L3とL4でつまずきやすいのが「いつ測るか」です。各レベルは、測るのにふさわしいタイミングが異なります。
4段階を測るタイミングの目安
L2 学習:理解度をテストや演習で確認する
L1 反応:満足度アンケートで研修体験を測る
L3 行動:職場での実践を観察・面談で測る
L4 成果:事業KPIの変化を測る
このタイミングを押さえると、L3・L4は研修が終わってしばらく経ってから測るべきものだとわかります。研修直後にアンケートを配って終わりにしていては、行動も成果も決して捕まえられません。逆算で設計し、時間を置いてL3・L4を追いかける。この2つが、引退講演で語られた本当の使い方の中心でした。そして、この考え方はカークパトリック氏の引退後、モデル自体の改訂へとつながっていきます。次の章で見ていきましょう。
モデル自体の進化:ニューワールド・カークパトリックモデル
引退講演で語られた「逆算で設計し、L3を支える」という思想は、その後カークパトリック家自身の手でモデルの改訂へとつながります。息子のジェームズ・カークパトリック氏と妻のウェンディ・カークパトリック氏が中心となって整理したのが、ニューワールド・カークパトリックモデルです。4つのレベルという骨格は変わりませんが、中身は大きくアップデートされました。
最大の変化は2つ。ひとつは、レベルを単純に上る「階段」というイメージをやめたこと。もうひとつは、L3(行動)を最重要の段階として前面に押し出したことです。各レベルの具体的な変化を、従来版と並べて見てみましょう。
とくに注目したいのが、L4の「ROIからROEへ」という変化です。ROI(Return on Investment)は研修費用に対する金額リターンを計算する考え方ですが、現場ではきれいに数字化できないことが多く、測定が止まる原因になりがちでした。これに対しROE(Return on Expectations)は、「経営層がこの研修に最初に期待した結果に、どこまで応えられたか」を問います。L4の成果をお金の計算ではなく期待への到達度で捉え直すことで、無理なく測れて、しかも経営に伝わりやすくなりました。
このROEの発想は、本記事の前半で見た「成果から逆算する設計」と表裏一体です。最初に経営層の期待(L4)を言葉にしておけば、最後にその期待への到達度を測るだけで成果を語れます。引退講演で示された使い方が、モデルそのものの改訂として公式に組み込まれた——それがニューワールド・カークパトリックモデルだと言えます。ただし、ここまでの設計と測定を機能させるには、もうひとつ欠かせない要素があります。職場と経営を巻き込む「橋」です。次の章で見ていきます。
経営に橋を架ける:4つの架け橋と3つの落とし穴
ここまでの内容を、ニューワールド・カークパトリックモデルが警告する「3つの落とし穴」として整理しておきましょう。①研修が終わってから測り始める(設計時に逆算しない)、②満足度と習得度(L1・L2)に予算を使い切る、③すべてをアンケートで測ろうとする——この3つを避けるだけでも、効果測定は大きく前進します。
しかし、落とし穴を避けるだけでは足りません。研修の成果は職場で生まれ、その価値を判断するのは経営層だからです。ジェームズ・カークパトリック氏は、人材育成部門が成果につなげるために架けるべき「4つの架け橋」を提唱しています。誰を巻き込むかが、それぞれの架け橋に対応します。
合意の架け橋|同僚・チームへ
効果測定が会社にとって大切だと共有し、複数の観点で測る(ブレンド評価)という考え方を受け入れてもらう。
戦略の架け橋|経営層へ
育成を事業のパートナーとして捉える利点を伝え、研修の推進者として動いてもらう。
戦術の架け橋|現場の上司へ
まず上司の職場の事情を理解し、研修にとどまらない価値を示して、部下のフォローに協力してもらう。
実践の架け橋|受講者へ
L1・L2で満足せず、L3・L4へ目を向けさせ、職場で行動を起こすよう後押しする。
4つの架け橋に共通するのは、効果測定を人材育成部門だけの作業で終わらせず、同僚・経営層・上司・受講者を巻き込む点です。とくに経営層を巻き込む意義は、データを見ると一目瞭然です。研修効果測定の権威ジャック・フィリップス氏の調査は、経営層が知りたい情報と、人材育成チームが実際に報告している情報との間に、大きな隔たりがあることを示しています。
「事業成果(L4)」の情報をめぐる経営層と現場のすれ違い
経営層が知りたい度合い vs 人材育成チームが実際に報告している割合
経営層が最も知りたい「成果」の情報は、ほとんど報告に上がっていない。満足度の報告ばかりが届き、肝心の事業成果が伝わっていない状態。
経営層は研修の「成果」を知りたがっているのに、現場から届くのは満足度の報告ばかり。このすれ違いがある限り、研修はいつまでも「コスト」と見なされ、予算削減の対象になります。逆に、4つの架け橋で経営層や上司を巻き込み、L3・L4という上位の情報を届けられれば、研修は「投資」として認識されます。測って終わりではなく、測った結果を、相手が知りたい言葉で届ける。ここまでが、4段階モデルの本当の使い方です。
では、この使い方は2026年の今、どこまで広がっているのでしょうか。意外なことに、カークパトリックの考え方は国際規格にも組み込まれています。次の章で確認します。
2026年の今:国際規格にも組み込まれたカークパトリック
ここまで見てきた「本当の使い方」は、2026年の今もまったく古びていません。それどころか、カークパトリックの考え方は国際規格にも組み込まれています。2023年、ISO(国際標準化機構)が「ISO/TS 30437 人的資源管理 学習と能力開発の指標」を発表しました。この規格が定める3つの指標のうち2つは、そのままカークパトリックの4レベルに対応しています。
1960年代に生まれた4段階モデルが、半世紀以上を経て国際規格の土台になっている。この事実は、カークパトリックが「古い理論」ではなく、今も現役の世界標準であることを示しています。研修効果測定をどう報告すべきか経営層に問いかけたいとき、「国際規格でもこう定められている」という後ろ盾は説得材料になります。
ただし、ISO/TS 30437をそのまま使えば成果が測れるわけではありません。この規格は実施効率(受講者数や費用)の指標が多く、肝心のL2(習得)やL3(活用)を測る指標は手薄だという指摘もあります。実施効率はLMSで自動的に集められる一方、本当に手間をかけるべきL2・L3はおろそかになりがちです。規格はあくまで「効果を測りましょう」という後押しとして使い、何をどう測るかは、本記事で見てきた逆算設計とL3フォローという「本当の使い方」を、担当者自身が握っておく必要があります。
まとめ:カークパトリック4段階モデルの本当の使い方
カークパトリックの4段階モデルは、満足度アンケートを集めるための道具ではありません。引退講演で本人が最後に伝えた本当の使い方は、次の3点に集約されます。第一に、成果(L4)から逆算して研修を設計すること。第二に、最も測られにくいL3(職場での行動)を、上司を巻き込みながら支え、時間を置いて測ること。第三に、ニューワールド版が示すように経営層や現場へ「橋」を架け、相手が知りたい上位の情報を届けることです。
この3点を押さえれば、研修は「やって終わり」から「成果につながったかを語れるもの」へ変わります。半世紀以上を経て国際規格にも組み込まれたこのモデルを、ぜひ「下から測る道具」ではなく「上から設計する地図」として使ってみてください。
よくある質問
カークパトリックの4段階モデルとは何ですか?
研修の効果を「反応(満足度)」「学習(習得度)」「行動(職場での活用)」「成果(事業インパクト)」の4つの段階で評価する考え方です。1960年代にドナルド・カークパトリックが提唱し、今も研修効果測定の世界標準として使われています。
4段階モデルの「本当の使い方」とは何ですか?
測るときはL1からL4へ下から積み上げますが、設計するときは成果(L4)から逆算して上から決めるのが本来の使い方です。加えて、最も見過ごされやすいL3(職場での行動)を放置せず、上司を巻き込んで支えることが成果への分岐点になります。
ニューワールド・カークパトリックモデルとは何ですか?
ジェームズ・カークパトリック氏とウェンディ・カークパトリック氏による改訂版です。L3(行動)を最重要に据え、L1にエンゲージメント、L2に態度・自信・意欲を加え、L4を費用対効果(ROI)から「経営層の期待にどこまで応えられたか」(ROE=Return on Expectations)へと広げました。
レベル3(行動)はどうやって測ればいいですか?
アンケートだけに頼らず、行動観察とチェックリスト、研修前後の行動の差分、受講者・上司・同僚の三者へのインタビューを組み合わせると精度が上がります。測るタイミングは、研修の約3ヶ月後が目安です。
カークパトリックとフィリップスのROIは何が違いますか?
カークパトリックは4段階で評価します。フィリップスはその上に「費用対効果(レベル5)」を加えた5段階モデルです。研修の投資対効果を金額で示したい場合には、フィリップスのROI手法が用いられます。
研修を「やって終わり」にしない設計を、一緒に
アイディア社は、成果から逆算した研修設計と効果測定をご支援しています。自社の研修をL3(職場での行動)・L4(事業成果)までつなげたい方は、お気軽にご相談ください。世界の最新事例をまとめた無料レポートもご用意しています。
関連コンテンツ
関連 ブログ
関連 研修プログラム
関連 事例
関連 イベント
-
[2024年度版]学習効果が高く、現場で成果が出る研修設計とは?人材育成の担当者がおさえておきたい4つのポイント「BIG人材育成フォーラム 2024」
開催日程2024年10月8日(火) 10:05-12:00 -
[2023年度版]効果検証済み!主体性を育み現場で活躍できる人材を育成する研修設計とは? 「1-2-3年目 社員育成フォーラム 2023」
開催日程2023年9月12日(火) 10:05-12:00














