![]() |
2019年度 異文化言語教育評価論 |
Ch8. Developing assessment task templates (後半 pp. 97~)
Step 3: Modifying a TLU task to develop an assessment
task template
・ Target language use (TLU) タスク自体はテストに適していない
→ TLUタスクをテストに修正する必要がある
1. TLUタスクはテストとしてそのままでは実用的でない
理由:時間・特別なマテリアル・複雑な手順が必要
2. 個人のテスト記録をとることができないのでそのままでは使えない
理由:グループ活動をさせたときには、そのなかで個人を評価することは難しい
3. 安全な方法(情報が漏れたりしない方法)でテストをし、テスト前にほかの生徒と情報の交換ができないようにしなくてはいけない
理由:生徒のパフォーマンスは生徒自身の能力レベルに基づいて測ることが大切
(特にhigh-stakes
decisionとして使われるときにはなおさら)
4. タスクの主題についてすでに知っている生徒もいるので、TLUタスクはそのままでは使えない
理由:すでに知っている内容だと生徒の言語パフォーマンステストに影響を与えるから
☞Assessment task template: 多くの活動、手順、task特性を共有する、違ったテストを作る原型。このテンプレートには①活動・手順 ②タスク特性 ③記録法が含まれる。
・ TLUタスクをテストにする際の確認事項
1. テストする能力のパフォーマンスを引き出しているか?
2. TLUタスクに一致しているか?
3. 一貫したテスト記録をしているか?
4. 実用的か?
Step 3a:
Modifying the activities and procedures of the TLU task
Table 8.4. グループ活動から個々のスピーキング力を測定するための修正例
Table 8.1. (TLUタスク)とTable 8.4. テストの違い
・ 前日にテスト手順について説明
・ テスト前にペアにもう一度説明
→全員が適切で同じ情報を共有(impartiality:公平性)
・ メモを取ってはいけない
・ 話す時間は1分
→どの生徒も同じ方法でテストが行われる(consistency:一貫性)
→個人を点数化できる(meaningfulness:有意味性)
・ テスト前後、ペアは別々のところにいること
→答えを共有できない(impartiality)
・ テストをペアで行い、時間の短縮(practicality:実用性)
・ TLUとテストで扱う絵は違う
→(先行知識を介さない)スピーキングを測るテスト(meaningfulness)
・ どの生徒も準備は30秒
→どの生徒に対しても同じ方法でテストを実施(consistency)
→時間短縮(practicality)
Step 3b:
Modifying the TCs of the TLU task
Table 8.5. 修正タスク/テストの特徴テンプレート
→個々のスピーキングの点数を測るために修正
Table 8.6. TLUタスクの特徴と修正タスクテンプレートの特徴の比較
・ Settings: 違い
修正前:教師と生徒またはグループでのやり取り・メモを取ってもよい
修正後:生徒2名・メモは教師がとる
: 共通点 動物の絵・教室での実施・授業時間内
・ Input: 違い
修正前:教師や生徒同士の口頭でのやり取り
修正後:TLUタスクと使用する絵を変える・メモ禁止
:共通点 教師による説明
・ Expected response: 違い
修正前:様々な返答がある・30秒の発話時間
修正後:限定された返答の種類・1分の発話時間
: 共通点 応答については動物の描写・主題内容同じ
Step 4: Developing a method for recording/scoring
students’ performance
さらに点数化するならその方法も考える必要がある
Table 8.7. スピーキングテストの評価基準・算出方法・手順
Specifying a scoring method
点数化するなら記録方法に点数化方法も考えておかないといけない
Table 8.8. 記録用紙例
1列目:見るべきスピーキングの観点 2~4列目:点数化基準 5列目:コメント欄
Step 5: Evaluating the modified task/assessment task
template in terms of assessment qualities
テストの質から修正タスクを見直す
・ 測定したいものを測定できたか(meaningfulness)
◎ 修正タスクではサンプルを長く取るために生徒の発話時間を増やした
✖ ある動物について知っている生徒もいた。
→ 純粋なスピーキング能力を測れなかったかも
・ TLUと一致していたか(generalizability)
◎ 比較的マイナーチェンジしかしなかったのでTLUと一致
・ バイアスを避けられたか(impartiality)
◎ 授業を基本にテストを実施
◎ 生徒のクラス内での人間関係を教師は把握
◎ Inputのフォーマットと同じ
・ 一貫性は保たれたか(consistency)
◎ 手順についての説明は同じ言い方
◎ 動物の絵
◎ 発話時間は全員同じ
◎ 点数基準も同じ
✖ いくつかの絵は複雑だったり、細かすぎだったりしたかも
✖ 多くの生徒に点数をつけると注意力が教師の中で変わってくるかも
✖ ハロー効果の影響はないか
→いい点数の生徒が続いた後で普通の生徒が来た時、低めにつけていないか。逆もパターンも。
・ 実用的であったか(practicality)
◎ 必要なものは手に入った
◎ 他のトピックで行う場合も比較的時間がかからないで行える
一度テンプレートを使用してテストを作成してしまえば、meaningfulness, generalizability, impartiality, consistencyのあるものになる。しかも実用的で、あらゆるテストに応用できる。
Discussion Point
テストを授業時間内でペアで実施した場合、初めのペアと最後のペアの生徒で時間差が生まれる。つまり、後の方が練習時間(もしかしたら割きに終わっていた生徒からの情報漏れ)などで有利になってしまわないか?その場合の対処法を考えてください。