筑波大学 人文社会科学研究科                                                現代語・現代文化専攻                                           平井 明代研究室



2019年度  異文化言語教育評価論

 

Ch8. Developing assessment task templates (後半 pp. 97)   

 

Step 3: Modifying a TLU task to develop an assessment task template

 


  Target language use (TLU) タスク自体はテストに適していない

TLUタスクをテストに修正する必要がある

 

   1. TLUタスクはテストとしてそのままでは実用的でない

     理由:時間・特別なマテリアル・複雑な手順が必要

  2. 個人のテスト記録をとることができないのでそのままでは使えない

     理由:グループ活動をさせたときには、そのなかで個人を評価することは難しい

  3. 安全な方法(情報が漏れたりしない方法)でテストをし、テスト前にほかの生徒と情報の交換ができないようにしなくてはいけない

     理由:生徒のパフォーマンスは生徒自身の能力レベルに基づいて測ることが大切

        (特にhigh-stakes decisionとして使われるときにはなおさら)

  4. タスクの主題についてすでに知っている生徒もいるので、TLUタスクはそのままでは使えない

    理由:すでに知っている内容だと生徒の言語パフォーマンステストに影響を与えるから

 

   Assessment task template: 多くの活動、手順、task特性を共有する、違ったテストを作る原型。このテンプレートには①活動・手順 ②タスク特性 ③記録法が含まれる。

 

  TLUタスクをテストにする際の確認事項

 

1. テストする能力のパフォーマンスを引き出しているか?

2. TLUタスクに一致しているか?

3. 一貫したテスト記録をしているか?

4. 実用的か?

 

Step 3a: Modifying the activities and procedures of the TLU task

 

  Table 8.4. グループ活動から個々のスピーキング力を測定するための修正例

 

  Table 8.1. TLUタスク)とTable 8.4. テストの違い

  前日にテスト手順について説明

  テスト前にペアにもう一度説明

→全員が適切で同じ情報を共有(impartiality:公平性)

  メモを取ってはいけない

  話す時間は1

→どの生徒も同じ方法でテストが行われる(consistency:一貫性)

→個人を点数化できる(meaningfulness:有意味性)

  テスト前後、ペアは別々のところにいること

→答えを共有できない(impartiality

  テストをペアで行い、時間の短縮(practicality:実用性)

  TLUとテストで扱う絵は違う

   →(先行知識を介さない)スピーキングを測るテスト(meaningfulness

  どの生徒も準備は30

   →どの生徒に対しても同じ方法でテストを実施(consistency

   →時間短縮(practicality

 

Step 3b: Modifying the TCs of the TLU task

 

    Table 8.5. 修正タスク/テストの特徴テンプレート

       →個々のスピーキングの点数を測るために修正

 

  Table 8.6. TLUタスクの特徴と修正タスクテンプレートの特徴の比較

  Settings: 違い 

修正前:教師と生徒またはグループでのやり取り・メモを取ってもよい

修正後:生徒2名・メモは教師がとる

                  : 共通点 動物の絵・教室での実施・授業時間内

         

  Input: 違い

修正前:教師や生徒同士の口頭でのやり取り

修正後:TLUタスクと使用する絵を変える・メモ禁止

:共通点 教師による説明

 

  Expected response: 違い

      修正前:様々な返答がある・30秒の発話時間

   修正後:限定された返答の種類・1分の発話時間

      : 共通点 応答については動物の描写・主題内容同じ

 

Step 4: Developing a method for recording/scoring students’ performance

 生徒の答えの記録も修正

さらに点数化するならその方法も考える必要がある

 

   Table 8.7. スピーキングテストの評価基準・算出方法・手順

 

 Specifying a scoring method

    点数化するなら記録方法に点数化方法も考えておかないといけない

 

   Table 8.8. 記録用紙例

     1列目:見るべきスピーキングの観点 2~4列目:点数化基準 5列目:コメント欄

Step 5: Evaluating the modified task/assessment task template in terms of assessment qualities 

 

テストの質から修正タスクを見直す

 

  測定したいものを測定できたか(meaningfulness

◎ 修正タスクではサンプルを長く取るために生徒の発話時間を増やした

✖ ある動物について知っている生徒もいた。

→ 純粋なスピーキング能力を測れなかったかも

 

  TLUと一致していたか(generalizability

  比較的マイナーチェンジしかしなかったのでTLUと一致

 

  バイアスを避けられたか(impartiality

 授業を基本にテストを実施

 生徒のクラス内での人間関係を教師は把握

  Inputのフォーマットと同じ

 

  一貫性は保たれたか(consistency

  手順についての説明は同じ言い方

  動物の絵

  発話時間は全員同じ

  点数基準も同じ

✖ いくつかの絵は複雑だったり、細かすぎだったりしたかも

✖ 多くの生徒に点数をつけると注意力が教師の中で変わってくるかも

✖ ハロー効果の影響はないか

            →いい点数の生徒が続いた後で普通の生徒が来た時、低めにつけていないか。逆もパターンも。

 

  実用的であったか(practicality

  必要なものは手に入った

  他のトピックで行う場合も比較的時間がかからないで行える

一度テンプレートを使用してテストを作成してしまえば、meaningfulness, generalizability, impartiality, consistencyのあるものになる。しかも実用的で、あらゆるテストに応用できる。

 

 

Discussion Point

  テストを授業時間内でペアで実施した場合、初めのペアと最後のペアの生徒で時間差が生まれる。つまり、後の方が練習時間(もしかしたら割きに終わっていた生徒からの情報漏れ)などで有利になってしまわないか?その場合の対処法を考えてください。