東京大学高大接続研究開発センター・東京大学大学院教育学研究科 宇佐美慧
Center for Research and Development on Transition from Secondary to Higher Education, University of Tokyo.
Graduate School of Education, University of Tokyo. Satoshi Usami

研究テーマ

 教育学・心理学・経済学・医学領域に関わる,幅広い意味での人間行動や心理現象全般を扱うための統計手法の理論と応用的側面に関心があります.まだまだ不勉強ですが,問題意識を幅広く持ち,現実の問題の解決に役立つような研究を目指していきたいと考えています.最近では理論研究は特に下記の1,3を, また応用研究では下記の5を通して,分析・開発に関わらせて頂いています.
1, 縦断データ解析手法の研究
2, 論述式試験の運用に関わる測定論的問題の研究
3, 階層データにおけるサンプルサイズ決定や検定の方法論についての研究
4, 人間の意志決定・行動パタンを表現する心理計量モデル開発の研究
5, 医学検査・心理検査・人事試験開発の研究



1, 縦断データ解析手法の研究

 複数の対象(個人)に関して複数回収集されたデータは,一般に縦断データと呼ばれます.例えば,高齢者の身体能力がどのように変化していくかを追跡的に調査して得られたデータは縦断データです.このような縦断データに対して,時間経過に伴う変化のパタンや変化の個人差を統計モデルを用いて記述するための方法論に興味があります.
 現在は特に,データの背後にある,(加齢に伴って身体能力が低下する人もいれば,ほとんど低下しない人もいる,と言ったような)複数の変化のパタンをあぶり出し,それと同時に個人を分類するための手法である潜在曲線混合モデル(Latent Growth Curve Mixture Model: LGCMM)や構造方程式モデル決定木(Structural Equation Model Trees: SEM Trees)という方法論における対象の分類・モデル選択の問題,他にもモデル表現(特に潜在変化得点モデルと呼ばれる統計モデル)と因果推論,欠測処理(横断データに基づく縦断的な相関情報の推定・復元)に関わる研究テーマに興味があります.
 関連して,非階層クラスタ分析などのクラスタリング手法の開発にも興味があります.現在では,全国高齢者縦断調査や精神保健調査などの社会調査,および双生児研究に関わる応用研究にも取り組んでいます.   

2, 論述式試験の運用に関わる測定論的問題の研究

 「資格社会」という言葉にも表れているように,今ほどテストのもつ社会的な影響力が顕著な時代は過去にもなかったように思います.私たちがテストを受けたときに頻繁に目にする,「解答を以下のア―オの中から一つ選びなさい.」といったような 多肢選択式のテスト項目(問題)は,その解答が当該のテストの中で一義的に決まっているという意味で客観式のテスト項目と呼ばれます.客観式テストは,言うまでもなく,入学試験は勿論のこと,人事試験や心理検査などの様々な場面で活用されています.
 一方で,客観式のテスト項目では難しい,例えば思考能力・表現力と呼ばれるような,「高次の能力」の測定・評価を如何に実現するかは,昨今の 大学入学希望者学力評価テスト(仮称;新テスト)に代表される大学入試や人事試験の領域を中心に常に大きな関心が寄せられています.そのための具体的な一つの方策が,(小)論文試験(記述式・論述式テスト),面接試験,パフォーマンステストと呼ばれるテスト形式を用いることです.しかし,一般的にも認識されているように,これらのテスト形式は「テストを通して測定・評価している能力の実体が不明瞭である(=妥当性の問題)」,「そのとき受験した問題内容や採点者の違いによる偶然性の影響を受けて採点結果が変動してしまう(=信頼性の問題)」,「文字の美しい答案は高い評価を受けやすい(=バイアスの問題)」という評価の測定論上の問題が付きまといます.
 私は,このような測定論上の問題が現実的にどの程度深刻であるのかを,特に小論文試験をはじめとした論述式試験のデータを通して定量的に示すこと,またその結果を踏まえて測定論的な観点からテストの作成方法や採点方法等に関して具体的で現実的な対応策を考えていくこと,の二点に関わる研究テーマに興味があります.現在では,民間企業を主体とした,論述式・記述式のテスト項目を用いた能力試験の開発支援を行っています.
 また,人事試験や資格試験に代表される大規模な試験では,各受験者がたまたま受けた試験問題の難易度や内容に極力左右されない,公平で尚且つ高精度の評価を実現する目的で,項目反応理論(Item Response Theory:IRT)と呼ばれる方法論の普及が進んでいます. 例えば,国際的な英語能力試験として知られているTOEFLでもIRTが応用されています.私は,論文試験,面接試験,パフォーマンステストのようなテスト形式へのIRTの応用を意図した,特にモデル開発に関わる研究テーマにも興味があります.

3, 階層データにおけるサンプルサイズ決定や検定の方法論についての研究

 社会科学の分野においては,収集された個人(例えば,生徒,患者,市民)の測定データが,それを包含するより高次の抽出単位である集団(例えば,学校,病院,地域)を介して得られている場合が非常に多くあります.このような,個人のデータが集団に対してネストされている(=入れ子構造になっている)データは階層データと呼ばれ,また階層データのための統計モデルに階層線形モデル(Hierarchical Linear Model: HLM)があります.
 このような階層データは実験研究・調査研究の双方において多く見られます.例えば,実験研究では,開発された数学用の新指導プログラムの効果を検証するために,学校単位で実験参加者を募り,新指導プログラムを受ける実験群と,従来と同じ指導プログラムを受ける統制群に分けて,群間差(=実験効果)の有無を検証する場合です.
 私は,このような階層データにおいて,「どの程度のデータ数(=サンプルサイズ)があれば真に存在する実験効果の有無やその大きさを正確に評価できるか」という問題に興味があります.この問題は一見極めて素朴なものですが,実は,真の実験効果が実用上十分に大きいにもかかわらず,サンプルサイズが少なかったために実験効果を統計的に立証できなかった例が山積していることは古くから問題となっており,現実的にも重要度の高い研究テーマです.この問題に関しては,必要なサンプルサイズを計算するための公式の導出や,数表や計算用のプログラムの作成など,応用上の利便性を重視した研究を行っています. また,広義には縦断データも階層データの範疇に含めて扱えますが,縦断的なデザインを通して収集された実験データについて実験効果を検証する際に必要なサンプルサイズを推定する簡便法についても研究を進めています.さらに,現在は文脈効果のような集団効果を調査研究を通して推定する場合や,またmixed-effects model(混合効果モデル)を用いて実験効果の有無や縦断的な変化の有無を検定する場合のサンプルサイズの推定法や第一種の過誤(帰無仮説が真の時に,誤ってそれを棄却する確率)の問題についても研究を進めています.

4, 人間の意志決定・行動パタンを表現する心理計量モデル開発の研究

 人の行う意志決定や行動には,様々な個人差や偶然性が伴います.例えば,「りんごとみかん,どちらの果物が好きか」という素朴な問いがあったときに,人によって好み(味覚)が異なるためにその回答結果が異なることは勿論ですが,同じ個人でも,その時の気分や体調など様々な偶然性の影響を受けて判断の非一貫性が生じます.私はこのような,人の行う意志決定や行動において生じる個人差や偶然性を,統計モデルを通して表現・説明するという研究テーマに関心を持っています.
 特に,上の「りんごとみかん,どちらの果物が好きか」というような二つの選択肢から一つを選ぶような評定データである一対比較データ(paired-comparison data)というデータの場合や,他にも展開データ(unfolding data)と呼ばれるデータのための統計モデル開発に関心があり,官能検査データやスポーツデータの解析,他にもパーソナリティ検査など心理検査の作成といった応用を試みています.さらに,このような統計モデルの開発において,ベイズ統計と呼ばれる理論や計算機統計学(e.g., マルコフ連鎖モンテカルロ法,ブートストラップ法,ベイジアンブートストラップ法)を駆使したサンプリング手法を応用することにも関心があります.

5, 医学検査・心理検査・人事試験開発の研究

 テストと言うと学校場面・入試場面でのテストをイメージされるかもしれませんが,資格試験や人事試験,また性格検査や臨床検査に代表される様々な心理検査・医学検査についても,広くはテストという言葉の範疇に含まれるものです.そして,もっと一般的に言えば,テストは人の性格・適性・能力・興味の水準やその個人差を記述・評価するための「測定道具」として位置付けられます.
 道具の良さの程度を一般に品質と言いますが,上の「2, 小論文試験の運用に関わる測定論的問題の研究」の内容にも関係しますように,テストも測定道具である以上,異なるテストであれば,それらの信頼性・妥当性が担保されている程度には差異があり,その結果,測定論的な意味でのテストの品質には大きな違いが生じます.したがって,品質の高いテストを作成する必要性があるのは勿論のこと,テストの品質を維持するために,必要に応じて評価・改良を行う作業が重要になってきます.
 測定論的な観点からテストの品質を評価するための大きな理論体系にテスト理論がありますが,私はテスト理論に関わる研究成果を活かして,医学検査・心理検査・人事試験を中心としたテストの開発実践に携わることに関心があります.特に医学検査・心理検査については,世界的に利用されている知能検査であるウェクスラー成人知能検査(WAIS)やウェクスラー児童用知能検査(WISC),またASA旭出式社会適応スキル検査や,発達障害の疑いのある幼児の対人行動を多面的に評価するための対人コミュニケーション行動観察フォーマット(FOSCOM),そして幼児を対象としたひらがな文字の意味理解能力を評価するためのひらがな文字検査HITSSの開発に取り組んでいます. 他にも,人事試験,性格検査・英語能力試験の開発に取り組んでいます.