![]() |
2020年度 英語教育学Ⅶ |
Chapter 3: Kinds of test and testing (pp. 11-28)
R.M
■Test purposes: language testingを行う目的について
l Proficiency tests (熟達度テスト)
ある言語における人々の能力を測定するテスト
したがって、テストを受ける人たちが取っている可能性のある言語コース (授業) の内容や目的でなく、熟達度が高いとみなされるためにその言語でその人たちができるようにならなければならないことの詳述に基づいている。
この際に、proficientという語が何を意味しているかが問題になる。
大学の入試試験や国連の通訳者としてうまく役目を果たせるかどうかを診断するためのテスト:proficientはある特定の目的のための十分な言語運用力があることを意味する。多かれ少なかれ特定の目的のために言語能力を測定しようとしている。
ケンブリッジ大学英語検定機構のB2 FirstやC2 Proficiency試験:学習過程などを念頭に置いていない熟達度テストで、proficientの概念はより一般的になる。
全ての熟達度テストは、受験者が以前受けたことのあるコースに基づいていないという点で共通しており、言語授業の内容と方法にかなり影響を及ぼしている。
熟達度テストの波及効果は有益でもあり有害でもあるが、著者自身は、広く使用されている熟達度テストの効果はより有害だと考えている。
l Achievement tests (到達度テスト)
熟達度テストに比べて、言語授業に直接関連しており、その目的は個々の生徒や学生のグループまたは授業自体が目的を達成するのにどれくらい成功したかを確認することである。以下の2種類に分類可能。
Ø final achievement test:学習過程の終わりに実施されるテスト
Ø progress achievement
test:生徒の進捗を測るテスト
l Diagnostic tests (診断テスト)
学習者の強みや弱みを特定するために使用され、どんな学習を行うべきかを確かめることが意図される。
生徒の文法構造の運用力の詳細な分析を得ることは容易ではない (e.g., 現在完了と単純過去の違いを習得しているかどうか)。生徒が選んだ例が多く必要であり、可能なら受容的な能力だけでなく発表的な能力を測定する項目を含むのが望ましい。
よって、純粋に診断目的で作成されたテストはほとんどなく、あまり詳しい情報や信頼できる情報はない傾向にある。
注意に値するのは、DIALANGで、14のヨーロッパ言語でのバージョンを提供しており、リーディング・ライティング・リスニング・文法構造・語彙の5つのモジュールがある。
l Placement tests (プレイスメントテスト)
生徒の能力に最も適切な教育プログラムに生徒を分類するためのテスト
一般的に様々なレベルのクラス分けに用いられる。
教育プログラムに最適であるテストだと (教育) 組織が確認した場合にのみ使用されることが推奨される。そのため全ての組織に適切であるわけではない。例外は、語学学校で使用のために設計されたテスト(学校の教育プログラムと類似しているため)。
最も成功したプレイスメントテストは、特定の状況のために作成されたもので、オーダーメイドのものである。
誤りは比較的容易に訂正されるので、正確性はhigh-stake test (利害関係の大きいテスト) より重要ではない。
l Screening tests (選抜テスト)
より長く複雑なテストを行う際に、かかる時間や費用が不要である場合それらを削減するために行われる。
我々の経験した例では、海外の英語使用の大学で、入学予定の生徒がそのまま大学に進学できるか、あるいは最長1年間フルタイムで英語を勉強しなければならないかを、長時間のhigh-stakes熟達度テストで効率的に決定した。これまでの経験から、新入生のほとんどが熟達度テストに落ちることがわかっていたので、最初に簡単な多肢選択式のテストを行いました。このスクリーニングテストの限界点は、その限界点に達していない学生が熟達度テストに合格できないと確信できるレベルに設定された。それ以上の点数を取った生徒は、熟達度テストの受験が許可された。
■Test Features
l Direct versus indirect
testing (直接テスト vs 間接テスト)
測定した技能を正確に受験者に行わせる必要があるテストは、直接テストと言われる。
Ø どれくらい上手く作文を書けるかを知りたい場合に、受験者に英作文を書かせる。どれくらい上手く発音できるかを知りたい場合は、受験者に話させる。
Ø 使用するタスクとテキストは、できるだけオーセンティックなものが望ましい。
Ø 以下の3点に魅力がある。①測定したい能力がはっきりしている場合、我々の判断の根拠になる受験者の行動を誘発する条件を比較的簡単に作りやすい。②発表的技能の場合、生徒のパフォーマンスの評価と解釈も非常に簡単である。③テストの練習に育成したい技能の練習が含まれるので、肯定的な波及効果が期待される。
Ø 熟達度テストや最終到達度テストは、直接テストに依存している。
関心のある技能の根底にある能力を測定するテストは、間接テストと呼ばれる。
Ø ライティング能力を測定する際に、何箇所かに下線を引いてその部分のどれが間違いなのかを受験者に判断させる。
Ø 最大の魅力は、潜在的に不定形の多数の能力を支える有限の能力の代表的なサンプルをテストできる可能性があると思われること。
Ø 間接テストの方が代表となるサンプル数が多いので、直接テストよりも結果を一般的しやすい。
Ø 実際のパフォーマンスと我々が関心のある技能パフォーマンスとの間の関係の強みが弱く確かでないことが問題。
直接テストは得られたサンプルから意味ある推論を正確にするのがより容易になり、間接テストは代表的なサンプルを集めやすい。
Semi-direct testの例:スピーキングテストがあり、受験者はある刺激に反応しその反応が録音され、それを基に後で採点する。
l Discrete point versus
integrative testing (個別項目テスティング vs 統合的テスティング)
個別項目テスティングは、1回につき1つの要素を1項目ずつテストすることを指す。
Ø 特定の文法構造をテストする一連の項目の形式を取る(e.g., 冠詞の用法についての多肢選択式のテスト)。
統合 (総合)
的テスティングは、タスクを完了する際に多くの言語要素を組み合わせることを受験者に求めるテストを指す。
Ø 講義を聞きながらメモを取る、ディクテーション、クローズテスト。
l Norm-referenced versus
criterion-referenced testing (集団基準準拠テスティング vs 目標基準準拠テスティング)
集団基準準拠テスティング:生徒がどのようにテストでうまくいったかを聞いたときに、受験者の60%より良い場合というような情報が与えられるように作成されたテスト。受験者と他の受験者の得点を関連させている。
目標基準準拠テスティング:実際にある言語において受験者が出来ていることについて測定する。
l Objective testing versus
subjective testing (客観的テスティング vs 主観的テスティング)
ここでは、採点方法で区別される。
採点者側に判断が求められない場合は、客観的テスト。多肢選択式のテストの採点など
判断が求められる場合は、主観的テスト。英作文やリーディングにおける質問に対する短い解答の採点など。
一般的に、採点が主観的でないほど同じテストを採点した人の間で点数の一致度が多くなる。
■Means of test delivery
l Paper-and-pencil tests
最も成功したプレイスメントテストは、特定の状況のために作成されたもので、オーダーメイドのものである。
従来の言語テストで、紙で印刷され受験者はペンや鉛筆で解答する。
欠点は主に2つある
柔軟性に欠けること。項目順序が固定されており、通常は易から難の順番で、受験者はすべての項目に回答する必要がある。受験者の能力に関する情報を集める一番の経済的な方法ではない。
話し言葉(スピーキング)の能力を測定できないこと。
l Face-to-face tests (対面式テスト)
1人以上の試験官と1人以上の受験者で実施される。多くがスピーキングのテスト。
より柔軟である。すなわち試験官は受験者の反応に適応することで可能であるので、スピーキング能力を測定できる。
欠点は、時間と労力そして試験官に報酬が支払われる場合にはお金がかかること。
l Computer-based tests
インターネットやイントラネット(組織内ネットワーク)、スタンドアローン(ネットワークに接続されておらず独立して使用されている)のコンピュータで実施される。
利点は、いつでも受けれて、たいてい試験官が要らず、結果が即座に報告されること。また適応力のあるテストでもある。すなわち受験者の能力に関する情報を効果的に収集することができる。そこでは受験者のレベルを踏まえた上で適切なレベルの問題を提示している。
欠点は、スピーキング能力の重要な要素である、他の話者との対話能力を測定することができないこと。同様に、採点がコンピュータプログラムのみで行われている場合、筆記の採点において意味を考慮することは難しいと考えられる。
オンライン試験では、安全性を保障するために特別注意を払う必要がある。
■Communicative language testing
多くがこのテストに関して書かれている。
議論は、コミュニケーションに参加する能力を測定することの望ましさ及びその際の最も良い方法に集中している。この書籍では、我々がテストしたいのはたいていコミュニケーション能力である。結果として、コミュニケーション能力の議論で最も重要だと考えているものは、一貫して見られるものである。
したがって、それぞれの見出しの要約は不要である。最初の提案者の1人が近年書いているように、おそらくCommunicative language
testingというフレーズに関して最も重要なことは、それが歴史にとても明確に属しているということである。
■Discussion Questions (from READER ACTIVITIES):
→Consider a number of
language tests with which you are familiar. For each of them, answer the
following questions:
(1)
Which
items ore objective, and which are subjective? Can you order the subjective
items according to degree of subjectivity? (どの項目が主観的で、どの項目が客観的なのか。主観性の程度に沿って、主観的な項目を並べて下さい。)
(2)
Does
the test measure communicative abilities? Would you describe it as a communicative
test? Justify your answers. (そのテストはコミュニケーション能力を測定するのか。コミュニカティブテストとしてそれを見なしているのか。自身の答えを正当化してください。)