5.能力は示せるか、測れるか
2人が同じテストを受けました。得点は以下の通りです。どちらが優れていると言えますか。
Aさん Bさん
英語 85 60
国語 85 60
数学 60 100
Aさんの合計が230点、Bさんの合計が220点やから、Aさん…といえるでしょうか。例えば、Bさんが数学で100点を取ったことは、Aさんが幅広くそこそこの点数を取ったことより価値があるとも言えなくもありません。
テストの中身を見てみないことには何とも言えません。各科目の難易度や受けた人の得点分布、設問や科目ごとのテストの能力を識別する精度の違いを考慮しなければ、優劣はわかりません。単純に「点数だけ」を合計することに、あまり意味はないのです。
実際、学校の定期テストだと科目ごとの難易度も単元も毎回バラバラで、合計点は数字としての意味をあまりもちません。しかし、合計点の順位は学力の序列を示したかのように影響力を持ちます。(もっとも、テストの順位を出さない学校も増えていますね。)
このように単純に得点の合計点の多い少ないで優劣を決める考え方を、中村(2018)は「素点合計主義」と呼んでいます。点数を合計して順位をつけることは当たり前に行われていますから、合計すればいいのだと自然に考える人が多いでしょう。
「学力テストしてみた」的な企画のTVや動画だと、各教科の問題の基準がバラバラでカオスなテストをして、合計点で順位決めているものが多いです。楽しむ分には別にいいのですが、その結果は学力(ましては頭の良さ/悪さ)を測れては決していない、ということです。もちろんそうした企画の点数は必ずしも公平である必要はありませんが、いかに「素点合計主義」が一般に浸透しているかを示す好例だと思います。
今回のテーマは「能力は示せるか、測れるか」です。前回まで取り上げたコミュニケーション能力や「新しい能力」に比べて、明確に数値で表現されている能力にみえる学力も、正確に示す・測ることは難しいのです。
2.採点はブレる
先ほどは合計したものが学力を示せるか、という話でした。次は、そもそも合計する前、個々のテストは学力を正確に測れるか、という話です。
1つに配点の問題もあります。何に比重を置いてその教科の能力とみなすかは、さっきと似た合計することの問題が生じます。多くの試験の配点は、絶対不変のものではなく、配点基準を決める人物か変われば変わりうるものです。
しかし、それ以前の段階にも問題はあります。個々の問題の採点自体が、明快に白黒つけられるものとは限らない点です。
採点基準の問題としては、漢字の「とめ」や「はらい」まで気にするかとか、算数で単位をつけてないとダメとか、しばしば話題にあがります。
一見、これらの問題は基準が曖昧やったり、人によって違ったりするから問題なのであって、基準を明確にすれば解決するように思えます。
ところが、現実は、明確な基準を設定しても採点がブレることが珍しくないのです。
以下は、2020年度からセンター試験に代わり行われる「大学入学共通テスト」で導入予定でしたが結局見送りとなった記述式問題のモニター調査(実験段階)の問題です。 大学1年生600名が回答しました。(今回は一部の紹介となりますが、気になる方はwebで公開されていますのでご参照ください。)
【文章】
最近、うちの周りもそうだけど、空き家が多くなってきたよね。この間も、少し向こうの空き家の裏口のカギが壊されたりしたそうだけど、このままだと治安の面が不安だ。それが取り壊されても、その跡地に『街並み保存地区』っていう名前にふさわしくない建物が建てられてしまうかもしれない。地元の企業がまちづくりの提案をしているという話も出ているしね。そこで市としては、ここでガイドラインを示して景観を守ることで、この一帯を観光資源にしていきたいという計画らしいね。つまり、一石二鳥を狙った訳さ。
【問】
問1.会話文中の傍線部「一石二鳥」とは、この場合街並み保存地区が何によってどうなることを指すか、「一石」と「二鳥」の内容がわかるように四〇字以内で答えよ(ただし、句読点を含む)。
【正答例】 景観を守るガイドラインによって,治安が維持され観光資源として活用されること。(38字)
【正答の条件】①40字以内で書いているもの ②「一石」の内容として「ガイドラインの導入」または「景観を守ること」に触れているもの ③「観光資源」及び,「空き家対策」または「治安の維持」に触れているもの。
【解答状況】
正答:43.8% 部分正答:50.6% 誤答:5.4% 無回答:0.2%
解答例と採点基準がこのようになっており、正当と部分正当、誤答で判定されます。 問は文字数も多くありませんし、一見それほど採点がブレると思えませんが、 この問題、実際の採点と解答者の自己採点の一致率は71.8%でした。
この問題だけでなく、多くの問題は大体7割程度の一致率でした。
しかし、採点がブレるのは、解答がいくつも考えられる国語だからではないかと思う方も多いでしょう。
では、解答が明確に思える数学はどうでしょうか。カクヨムでは問を示すのが難しいので、問についてはこちら(https://www.dnc.ac.jp/albums/abm00009385.pdf)の27ページ目、問(1)(ⅱ)をご覧ください。正答例が以下のような問題です。
【正答】
(正答例①)0 < S ≦ 9
(正答例②)S > 0 かつ S ≦ 9
【正答の条件】
S > 0 かつ S ≦ 9 であることを記述している。
そもそもこれはマーク式でもできる問題なのですが…、この問題、実際の採点と解答者の自己採点の一致率は87.6%でした。 試験において、1割の人にズレが生じるのは大きな意味を持ちますね。(これはさすがに自己採点した方に問題があるのではないか、とさすがに思えます。)
実際の採点プロセスでは国語にしてもここまでの確率でブレは生じないと思いますが、後の試行調査で採点業者が複数人チェック体制で採点をしても、後で共通テスト主催側が抽出して確認すると、採点が修正されることがありました。
着目すべきは、客観的な採点基準をもってしても、人の採点というのはある程度のブレが生じてしまうという事実です。
明確にヒューマンエラーと言えるものから、判断基準の解釈が人によって違うものまで様々あるでしょうが、それらひっくるめて採点というのは絶対的ではなく脆さを含んでいるものと言えます。
3.ごく限定的な条件でしか測れない
能力を示す・測るのは難しいことを、テストの点数で考えてきました。それでは、もっと明確に示せそうな「100メートルを走る能力」を考えてみます。
これはタイムが明確に出るから、100メートルと距離が限定されている限りでは能力は示せそうに思えてしまいます。
一見そうですが、実際の条件は「100メートル」を「走る」だけではありません。陸上競技において記録は自分の能力のみで走った場合のみ認めるべきだ、という規範的な考え方があります。例えば、追い風2メートルを超えると記録は参考記録となり公認されません。(テストでも、基本は助けを借りてはいけない前提がありますね。)
しかし、追い風2.0メートルは自力か、これは大変微妙です。ここには絶対的な基準はなく、ただどこかで線引きしないといけないから設定しているに過ぎません。風速計の設置位置や計測時間も規定されていますが、これもなるべく妥当な設定に過ぎないのです。どこまでが「純粋な」能力かっていうのは、匙加減にならざるをえない。
他にも、スタートの合図からの反応時間が0.100秒未満の場合は不正スタート(フライング)の判定となります。これは、人間は構造上音を聞いてから反応するのに0.1秒はかかる、これ以上早い反応は失格覚悟で合図を聞く前に動かないと無理だ、という理屈です。
しかし、明確に0.1秒未満の反応は不可能だという証明はできておらず、卓越した反応する能力を持つ人間もいるだろうと議論になっています。実際に反応時間0.099秒で失格になる選手もいます。
現行ルールでは、0.1秒未満は「純粋」な反応する能力と「認められない」のです。
また、陸上競技では指定された薬物を摂取すれば、ドーピングとして違反となります。何らかの制限をしなければ、命の危険を冒してでも記録を上げようとする人が出てきますからね。そうした観点から、アンチ・ドーピングの考え方は重要です。その中で、サプリメントや風邪薬などから意図せず指定薬物を摂取することで失格になることもあります。
今回の能力測定の話で大事なのは、こうした制約の中で測定されている、ということです。
他にも、計測機器やトラックといった様々な条件を整備した上で、陸上100メートルの公認記録が出せます。ただ走れば測れるのではなく、そこには能力評価のための様々な思想が入り込んでいるのです。
そもそも、スタートの制約などある陸上競技で100メートル走る能力と、そのあたりの道路で日常的に100メートル走る能力は、違ってきます。
もちろん、その条件の中で生まれた100メートルの公認記録は「走力」の1つの印といえます。陸上ですごい記録出せる人は、そこら辺の道路を走っても速いでしょう。
重要なのは、一見単純明快な100メートル走る能力であっても、どこかで恣意的に線引きや調整をしなければ、比較可能なものとして測定できないということです。
コミュニケーション能力など抽象度が高い能力であればなおさら、恣意的な線引きや調整、条件付けをしないと測定できません。そして、測定したものはあくまでその限定的な条件の中での結果、ということを踏まえなければなりません。
条件を限定しないと測れないけれども、限定すればするほど見えるものは少なくなりますし、発揮されないパフォーマンスも増えます。
測定された条件を考えずに、ある数値だけ見て安易に「学力が」とか、ましてや「コミュ力が」高い/低いとか決めつけては、時にはとんでもない誤解をしてしまう危険性もあります。
(6.能力で決まる社会の成立 ~近代と前近代の違い~ につづく)
【第5章の参考文献】
◆大学入試センター「『大学入学共通テスト(仮称)』記述式問題のモデル問題例」2018年5月16日
◆大学入試センター「第1回、第2回 モニター調査実施結果の概要について」2018年5月16日
◆大学入試センター「大学入学共通テスト導入に向けた試行調査(プレテスト)(平成30年度(2018年度)実施)の結果報告」2019年4月4日
◆中村高康『暴走する能力主義 ――教育と現代社会の病理』ちくま新書、2018年
◆日本陸上競技連盟『陸上競技ルールブック<2019年度版>』ベースボール・マガジン社
☆本文は、2019年7月に公開した自作動画「ゆかりアカデミー 能力とは何か⑤」の内容を加筆修正し、2020年3月に投稿したものです。
2020年3月 がくまるい
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます