ABOUT/CONTACT

SEMINAR

SLAA
（Second Language Acquisition & Assessment Research Group）

FOR STUDENTS

TEASY

LINK

2018年度　　異文化言語教育評価論

Introduction

n これまでに紹介してきたメタ認知的アプローチに基づくリスニング指導の目的は、自律的な学習者（self-regulated learners）を育てることだが、それが達成されたか知るには定期的に評価（測定）を行う必要がある。

n 評価の目的は次の3つである。

① 学習者・教師・保護者に学習の成果を伝えること。

② クラス分け等のために、学習者のレベルを把握すること。

③ カリキュラムの有効性を知ること。

n 評価の種類は、自己評価（self-assessment）のようなインフォーマルなものから、標準化テスト（standardized tests）のようなフォーマルなものまで幅広いが、得られた結果をもとに学習者の習熟度を測るという点では変わりない。

n 学習者を評価に参加させることはよい。自身の学習を振り返る機会を与え、自律的な学習者になる手助けができる。

n 本章ではメタ認知の枠組みから評価のあり方について述べる。まず「形成的評価（formative assessment）」と「総括的評価（summative assessment）」の違いについて言及し、次にそれぞれのアプローチについてテスト評価の5つの重要な観点（validity, reliability, authenticity, washback, practicality）を考えたい。

Approaches to Assessment: Formative and Summative

n 「形成的評価」は指導の途中段階で行うもので、教師が授業を改善したり、学習者が自分の学習成果を振り返したりするのが目的である。一方「総括的評価」は一連の指導のあとに行うもので、指導がどれほど効果的だったか評価するのが目的である。２つの評価の特徴の違いをまとめたのがTable 12.1である。

（表は次頁につづく）

n 「形成的評価」は学習のプロセス（the process of learning）を重視した評価である。すなわち、指導や学習の改善を目的としているため継続的（continuous）であり、そのプロセスへの学習者の参加も不可欠である。自己評価やピア評価、教師による観察といったインフォーマルな評価方法がとられることが多いのも特徴である。

n 「総括的評価」は学習のプロダクト（the product of learning）を重視した評価である。すなわち、指導の最終段階において目標を達成できたか知ることが目的であるため定期的（periodic）であり、学習者の唯一の役割はテストを受けることである。到達度テストや熟達度テストに加え、ハイステークスな標準化テストがよく用いられる。

n 以上の特徴を踏まえ、以下では各評価の具体例を紹介する。

Formative Assessment of L2 Listening

n 形成的評価は主にlearner checklists, questionnaires, listening diaries, teacher checklists, interviews, portfoliosを用いて行われる。以下ではそれぞれについて述べる（quizzesやunit testsを用いることもあるが、これらは総括的評価の項目で扱うことにする）。

Learner Checklists

n 学習者チェックリスト（Figure 12.1）にはリスニング時の重要なストラテジーが盛り込まれていて、リスニングの前後に答えることで学習者がそれらに意識を向けられるようになっている。「Before Listening」はリスニングの前に、「After Listening」はリスニングの後に、「TO IMPROVE ～」はその日の指導が終わった後に書く。

n このチェックリストはYes/Noで答えるものである。D1～D5はDate 1～Date 5の意味で、時間を追って記録できるようになっている。教師のフィードバックを記入する欄を設けて、授業での観察をもとに学習者が正直に答えているか確かめたり、今後の学習への助言をしたりしてもよい。

n このチェックリストは簡単に答えられるため、下位の学習者や言葉による表現が苦手な学習者（less verbal learners）に特に有効である（上位学習者むけのチェックリストは既に挙げた）。記入が終わったチェックリストは後述のポートフォリオに入れて保管させるとよい。

Questionnaires

n アンケートの例は前掲のMALQ（Metacognitive Awareness Listening Questionnaire; See Figure 5.4 on pp. 95-96）である。アンケートの利点は簡単に実施できるため定期的に行える点で、学習者の自己評価や教師による診断（diagnosis）にも役立つ。

（MALQ, p.95より転載）

Listening Diaries

n 日記やジャーナルも授業内外における学習の成果を評価するのに役立つ。形式は原則自由だが、教師がいつ何について書けばよいか一定の枠組みや指針を与えたほうがいいだろう。形成的評価の意義を高めるためには、教師が定期的にフィードバックするのが好ましい。日記を通して個々の学習者に支援を行ったり、学習者全体の成長を確かめたりできる。

〈フィードバックすべきポイント〉

・入念な準備をしているとき

・授業外での学習をしているとき

・リスニングのパフォーマンスを振り返っているとき

・リスニングのプロセスや理解度を振り返っているとき

・リスニングストラテジーを計画したり、使用したりしているとき

・Ｌ2の聞き手としての自分のイメージを持っているとき

Teacher Checklists

n 教師用チェックリストを用いた観察による評価は、一方向的なリスニングにおいては得られるものが少ないが、インタビューなど双方向的なリスニングでは有益な情報が得られる。Figure 12.2はチェックリストの例で、明確化ストラテジー（clarification strategies）の使用などについて記録できるようになっている。双方向的なリスニングの場合は、スピーキングについての評価項目を立ててもよい。学習者は聞き手と話し手の役割を交互に行うので、普通は一度に2名しか評価対象にしない。

Interviews

n 1対1の面接は学習者の能力について深い洞察ができる。次の2つの方法がある。

n 思考発話法（think-alouds）は、教師の働きかけにより、学習者がリスニング中にどのような認知作業を行っていたか話させるもので、これによって彼らが抱える課題や使用可能な（または使用不可能な）ストラテジーを探ることができる。

n 刺激想起法（stimulated recalls）は、会話を撮影した動画やMALQなどのアンケートへの回答に基づいて質問する方法である。Figure 12.3は教師と学習者のやりとりの例で、アンケートへ答えることが徐々に学習者の内省する力を高めていたことがわかる。

Portfolios

n ポートフォリオは評価に用いた学習の成果を集めたもので、振り返りや目標設定に活用できる。4技能に適用可能。

n 学習成果をただ集めたものは形成的評価とは言えず、過去や未来の学習に対する内省的要素を取り入れることで強力な形成的評価のツールとなる。そのような特徴をもったポートフォリオの代表例が「ヨーロッパ言語ポートフォリオ（European Language Portfolio；ELP）」である。ELPは次の3つの要素で構成される。

（1）言語パスポート（language passport）：言語の経験や取得した資格を要約したもの。

（2）言語バイオグラフィー（language biography）：学習者が目標に向けて学習を計画・内省し、成長を評価できるようにデザインしたもの。

（3）資料集（dossier）：学習者の熟達度がわかる作品（work）を集めたもの。

言語パスポートの例？

https://francescodamiani.wordpress.com/curriculum/competenze-linguistiche/passaporto-delle-lingue/

n ELPによる評価はCEFRに基づく。CEFRは学習者の熟達度をA1からC2の6段階に分けており、この枠組みは世界共通の指針になりつつある。

n Figure 12.4は汎用的なリスニング能力をレベル別に記述したもので、これがELPのPart 1（Passport）やPart 2（Biography）の基礎となる。Figure 12.5はネイティブとの双方向的会話における能力を記述したものである。

n ELPのPart 2（Biography）は記述子が細かく設定されており、それらをもとに学習者は目標を立てたり成長を測ったりできるので形成的評価に特に有効である。Figure 12.6はSwiss ELPで設定されているリスニングのB1レベルの記述子である。

（表は次頁につづく）

n 以上のELPの説明からもわかるように、ポートフォリオは単なる言語サンプルや自己評価の集合ではなく、CEFRの枠組みを用いて目標設定したり、成長を記録したりするのに役立つ形成的評価のツールである。

n 自己報告型の評価は学習に不可欠だが、CEFRに準拠したテストや、IELTSのように国際的に認知されたベンチマークによって補完されなければいけない。これらのテストで得られた資格証書（certificate）もPart 3（Dossier）に収めたり、Part 1（Passport）の更新に使ったりしてその後の学習に生かすことができる。

Dynamic Listening Assessment

n Dynamic Listening Assessmentは、学習と評価は不可分であるという考えに則っている。すなわち教師は、学習者がリスニングでつまずいたときに仲介（mediation）を行うことで支援しながら、同時に評価も行う。これは面接のプロセスに似ている。Figure 12.7の仏語学習者の例からもわかるように、言語だけでなく文化についての説明（ブリュッセルはベルギーの首都？）も行われる。

n この評価は1対1で行うため、個々の学習者の課題を見つけやすいという利点があり、このことはAbleeva（2010）の研究でも示唆されている。

Formative Assessment Tools: Summary

n 以上で紹介した形成的評価の方法は、リスニングのプロセスを評価したり、メタ認知能力を向上させたりするのに有効である。だからといってリスニングのプロダクト（product）である理解（comprehension）を度外視しているわけではない。形成的評価ツールはマーク式の小テストとの相性もよい。

n 大切なのはプロセス中心の評価（process-based assessment）とプロダクト中心の評価（product-based assessment）を織り交ぜることで、それによって指導や学習の振り返りが適切に行えるのである。

Summative Assessment of L2 Listening

n このセクションでは総括的評価の方法として、小テスト（quizzes）、到達度テスト（achievement tests）、熟達度テスト（proficiency tests）、大規模標準化テスト（large-scale standardized tests）を手短に紹介する。

Quizzes

n 小テストは普段のリスニング活動の一環としても行え、目的によって形成的評価と総括的評価のどちらにも使える。学習中の項目への理解に対してフィードバックすることが目的なら前者、単元の評価として点数を与えることが目的なら後者になる。

Achievement Tests

n 到達度テストは単元を通して学習者が学んだことを測るのに用いられる。形式は、多肢選択式や自由回答（open-ended）の問題、表を埋める問題、絵を選んだり並び替えたりする問題など様々である。これらは上述の小テストと似ており、実施するタイミングによっては形成的評価にも活用できる。

Proficiency Tests

n 熟達度テストは学習者の一般的な言語能力を測るのが目的である。団体で開発したものもあれば、大規模標準化テストもこの目的で実施される。入学審査、クラス分け、修了審査などのために学習者のレベルを知ることが目的であるため、必然的に総括的評価として行われる。

n レベルを判断する際は、CEFRやIELTSといった言語参照枠に照らし合わせる。

Large-Scale Standardized Tests

n 学習のある段階において、学習者は入学審査や就職などのために、TOEFLやIELTSといった大規模標準化テストを受験することがある。到達度テストと異なるのは、学校や個人のあいだで得点を比較できるようにするため、一貫した手順と採点方法で行われることである。

n 卒業などテストの結果が受験者に大きな影響を及ぼすほど、高い妥当性と信頼性が求められる。

Summative Assessment Tools: Summary

n 総括的評価の目的は様々な受益者（学習者、親、教師、教育管理者）に学習者の能力を知らせることである。学習のプロセスを測ることは興味の範囲外であり、プロダクトのみが関心事となる。

Choosing Formative and Summative Assessment Tools for L2 Listening

n Brown and Abeywickrama（2010）は、テストなどの測定ツールの質を決める重要な指標として、下記の5つを提案した。

1. Validity（妥当性）：どれくらい測りたいものを正確に測れているか。

2. Reliability（信頼性）：どれくらい信頼できるか。

3. Authenticity（真正性）：どれくらい実際の言語使用を反映しているか。

4. Washback（波及効果）：どれくらい学習者に有益なフィードバックを与え、指導に影響するか。

5. Practicality（実用性）：運用上の制限があるなか、どれくらいクラスで実施可能か。

n 本章の最後ではこれらの5つの指標と、2つの評価（形成的、総括的）との関わりを述べる。Table 12.2は、2つの評価を使用する際に留意すべき点をまとめたものである。

Validity

n 妥当性は、テストが測るべきものをどれくらい測っているかを指す。したがってL2リスニングが測るべきものは理解度であり、聴力や背景知識などではない。妥当性の重要な側面はconstruct validity, content validity, predictive validityの3つである。

n 構成概念妥当性（construct validity）は、測定ツールが依拠する理論がどれくらい明確で細かく定められているかに関わる。言語使用の文脈が限られているのなら構成概念を定義しやすいが、汎用的なリスニング能力を測る場合は定義が難しい。そこでBuck（2001）はデフォルトの構成概念（default listening construct）として、次の3つの能力を提案している。

（1）現実の話し言葉を自動的かつリアルタイムで処理する能力。

（2）テクストに含まれる言語的情報を理解する能力。

（3）文章の内容から推論する能力。

n Wagner（2002）はビデオを用いたテストにおける構成概念を検討した。その結果、先に挙げたBuckの（2）と（3）の能力が抽出され、Buckの主張を支持する結果となった。

n 内容的妥当性（content validity）は、教師が測りたい知識やスキルを測定ツールが測っているかどうかを指す。例えばアカデミック・リスニングは、日常生活のリスニングと測るべきスキルが異なるため、授業を通して習得したスキルがきちんと測れるようにしなければいけない。

n 内容的妥当性は表面的妥当性（face validity）と密接に関連している。表面的妥当性は、測るべき能力を測っているかどうか学習者が主観で判断したものである。表面的妥当性が十分でなければ学習者の動機付けにも影響するため、事前に同僚に確認してもらうなどの配慮が必要である。

n 予測的妥当性（predictive validity）は、測定ツールがどれくらい実生活でのリスニングパフォーマンスを予測できるかを指す。CEFRのB1レベルには次のような能力が記述されており、測定ツールはこれらを測れるよう作成されなければならない。

職場、学校、余暇などで日頃から出会う馴染みのある話題（短いものも含む）に関する、明瞭で標準的な発話の要点を理解できる。

時に特定の単語や表現について繰り返しを求めなければいけないが、日々の会話で自分に向けられた発話に明確についていくことができる。

n まとめると、それぞれの妥当性は密接に関連しており、近年は、構成概念妥当性が他を包括する、統合された1つの概念として捉えられる傾向がある。これらの妥当性を満たす測定ツールは目的の能力を測ることができ、結果としてCEFRのような言語参照枠に照らし合わせることもできるだろう。

Validity in Formative and Summative Assessments

n リスニングの評価は、学習者の年齢や生活経験を踏まえ、現実の言語使用を反映したものでなければならない。Buck（1997）によれば、（1）実際の話し言葉の特徴を反映したテクストを用いること、（2）現実の生活で遭遇するタスクを用いること、（3）コミュニケーションのために情報を理解するという本来のリスニングの目的を反映させること、の3つが大事だという。

n 現実には教室で行うリスニングは未来の言語使用を想定したもので、目の前のニーズに基づいたものではないが、学習時のタスクと評価時のタスクを同じにすることで学習者は動機づけられ、高い表面的妥当性も得られる。

n 形成的評価と指導が密接に関連していると妥当性を確保しやすい。形成的評価によって学習者の課題がわかれば次の指導目標が明確になり、自ずと評価すべき能力も絞られるからである。

n 総括的評価は、到達度テストにしても熟達度テストにしても、形成的評価より汎用的になる。この場合、妥当性はどれくらい評価の内容とタスクが、汎用的なリスニング能力と合致しているかに依存する。

n また総括的評価は、汎用的だからといって全ての能力を測定できるわけではなく、評価するスキルを代表的なものに厳選する必要がある。また総括的評価の目的はリスニング力の伸びをモニターすることではないため、メタ認知の向上を目標とした講座では妥当性を確保しにくくなる。

Reliability

n 信頼性は、同じような条件下でどれくらい一貫した結果が得られるかを指し、受験者に影響の大きいハイステークスなテストにとって欠かせないものである。Brown and Abeywickrama（2010）によれば信頼性は、学習者、教師、テスト運営、テスト自体、それぞれに影響されるという。

n 学習者関連の要因（learner-related factors）には、疲れ、病気、ストレスがある。心配も重要な要因だが、その軽減方法はこれまでの章で述べた。

n 教師関連の要因（teacher-related factors）は採点時の先入観で、これは特に自由回答や筆記再生など採点に解釈が必要となるタスクで起こる。これを避けるには、少なくとも2人の評価者に評価させ、基準が一貫しているか評価者間信頼性を定期的に調べるとよい。

n 運営関連の要因（administration-related factors）は、テスト結果に影響を及ぼす環境的要因を指す。受験者全員が音響信号を同じように聞こえるようノイズは排除すべきである。

n テスト関連の要因（test-related factors）は、受験者の理解度をテストが正確に測れるかどうかを指す。答えが曖昧で複数あるような問題は信頼性を損なう。

Reliability in Formative and Summative Assessment

n 形成的評価は自己評価やピア評価を通して行うことが多いため、信頼性の確保が難しい。1種類のタスクでは評価に必要な情報は得にくいため、多様な測定ツールやタスクを用いることで信頼性も向上するだろう。

n 形成的評価の実践は未開拓の分野である。これから実証研究によって信頼性の高い、成長に対する指標が登場するだろう。

n 形成的評価の信頼性は、複数の評価方法（例：MALQ＋小テスト＋リスニング日記）を組み合わせることで向上する。

n これは総括的評価でも同様である。重要な判断が一度の試験の結果でなされることが多いが、信頼性ある評価とは言えないかもしれない。

n リスニングは、音響信号が不安定であることや、認知活動が複雑かつ観察不能であることなどが原因で評価が難しい技能である。タスクで得られた結果をもとにリスニング能力を推測するしかないため、評価の結果が重要であるほど信頼性も高くないといけない。

n リスニングは観察可能ではないため他の方法によって測る必要があるが、リーディングやライティングなどの他の能力が介在してはいけない。そのため回答させるときは言葉以外の方法（例：絵を並べ替える、マップをたどる）で行わせるべきである。また記憶容量も干渉要因であるが、メモをとらせることで影響を軽減することができ、表面的妥当性も保つことができる。

Authenticity

n 真正性はテクストやタスクに現実の言語使用がどれくらい反映されているかを指す。真正性のあるテクストとは計画されていない発話（unplanned speech）を含むもので、8章で述べたように余剰性やためらいなどがある。真正性のあるタスクとは理解した情報を転移（transfer）させる類のもので、例えば会話を聞いたあとにカレンダーを埋めるといった現実生活に即したタスクがよい。

Authenticity in Formative and Summative Assessment

n 形成的評価は真正性の確保がしやすい。なぜなら形成的評価では学習した単元の内容に即したものが評価されるからである。一方、総括的評価は真正性の確保は難しい。なぜなら広範な内容が扱われるため、学習者の生活とはかけ離れた内容が出題されることもあるためである。

n 総括的評価における真正性は話者の訛りや方言に影響される可能性がある。一方形成的評価でこれらは問題になりにくい。なぜなら授業で方言の学習が行われ、その成果がすぐに評価されることが多いからである。

Washback

n 波及効果は評価が教室での指導に与える影響のことで、その影響はカリキュラム、教師、学習者の行動や姿勢に及ぶ。授業の学習活動と評価の内容が一致していれば良い波及効果をもたらすが、そうでなければ負の効果（＝テストの役に立たないから活動に取り組まない）をもたらす。

n フィードバックをまめに行える形成的評価は良い波及効果を期待しやすい。そのためにはただ目標を達成したかどうかだけ学習者に伝えるよりも、学習者が得意とすることや苦手とすることも伝えたがほうがよい。

Washback in Formative and Summative Assessment

n 形成的評価がプラスの波及効果を生むと、学習者は自身の学習方法やストラテジー使用を振り返るようになり学習者の動機付けも高まる。これはDeci and Ryan（1985）の主張とも一致する。

n 形成的評価がもたらすプラスの波及効果は心配（anxiety）の軽減にも役立つ。また、形成的評価において学習と評価が一体だと、波及効果と表面的妥当性の両方が高まる。

n 一方、学習者へのフィードバックが必ずしも行われない総括的評価にプラスの波及効果を求める場合は、教師による特別な配慮が必要である（例：面接をして成績について説明するなど）。

Practicaility

n 実用性とは、ある測定ツールが特定の教室や指導のコンテクストでどれだけ実行可能かということである。時間が最大の要因だが、設備なども考慮されるべき要因である。

Practicaility in Formative and Summative Assessment

n リスニングの評価は、リーディングやライティングのそれよりも複雑な実用面の課題を抱えている。形成的評価ではフィードバックに時間がかかるため、実用性を確保するにはシステマチックに行う必要がある。

n 総括的評価ではむしろテストの作成に手間がかかる。商用テストを用いるのはコスト削減に有効かもしれないが、どのようなテストを用いれば学習目標と一致させられるのか悩んだり、標準化テストを使う場合はその運営手順を覚えないといけないといった課題が生じる。

Formative and Summative Assessment: Other Considerations

n 形成的評価と総括的評価にはそれぞれ利点があり、どのような使い方をすればよいかはクラスの状況や教員による。

n リスニングの評価に影響する要因について研究者の関心が集まっている。例えばCheng（2004）はどのような解答方式（response format）がテスト成績を向上させるか検証し、open-ended questions＜traditional multiple-choice items＜multiple-choice cloze itemsの順に成績が高くなることを明らかにした。

n 内容理解問題において問いが口頭で読まれる場合、文章を聞く前と後どちらなのかで結果は変わってくる。Tsui and Fullilove（1998）の調査では、文章の前に問いを聞いたほうが、後に問いを聞いた場合より正答率が高いことがわかった。またYanagawa and Green（2008）の調査では、「事前に問いだけ聞いたグループ」と「事前に問いと選択肢の両方を聞いたグループ」の理解度には差がないが、「事前に選択肢のみ聞いたグループ」の理解度は他の2グループに比べて有意に低いことが明らかとなった。

n 一般的に、形成的評価を活用するほどリスニングプロセスに対するメタ認知の能力は向上する。8年にわたり日本人EFL学習者の英語力を追跡したRoss（2005）の研究では、プロダクト重視の総括的評価から、プロセス重視の形成的評価にシフトさせた結果、リスニング能力が伸びたことが報告されている。この研究では自己評価やピア評価を主な形成的評価の方法として採用していた。

n 以上3つの研究結果は、形成的評価が（リーディングではなく）リスニング能力の向上に寄与したことを示している。このような結果が得られた理由についてRoss（2005）は、自己評価やピア評価、協働学習などを通して学習者の参加（learner engagement）が増えたことで学習者のやる気が高まったためで、形成的評価が間接的に成績向上に影響したと述べた。

Summary

n 評価が学習者、教師、学校管理者にとって有益であるためには、評価を学習活動とみなす必要がある。

n 本章では形成的評価の価値を強調したが、この評価には成長を測るだけでなく、熟達した聞き手になるのに不可欠なメタ認知の知識を高める効果も期待できる。

n 日頃から形成的評価を行い、要所で総括的評価を織り交ぜて行うのが最も良い。形成的評価を行うのは負担かもしれないが、学習活動に組み込めば実施しやすい。

n 形成的評価であれ総括的評価であれ、測定ツールの質は妥当性、信頼性、真正性、波及効果、実用性の観点から評価する必要がある。リスニングのプロセスとプロダクト両方に重きを置きながら評価が慎重に行われれば、学習は促進されるだろう。

Discussion Questions and Tasks

1．“All tests are assessments but not all assessments are tests” (Brown & Abeywickrama, 2010, p. 123). What does this statement mean to you? Discuss its relevance for the assessment of L2 listening.

この言葉が意味するのは「テストを行えばその結果は必ず評価に活用できるが、評価する方法は必ずしもテストだけではない」ということである。リスニングの能力を評価するためにテストだけを行ってプロダクト（＝テストの成績）に教師が注目ばかりしていると、学習者が学習意欲や自信を失ってしまう可能性がある。テスト以外の方法も用いて日々成長を測ったり、リスニングのプロセスに焦点を当てた指導をしたりすることで学習者は意欲を保つことができ、自ら学び成長できるようになる。

2. Given what you now know about listening processes, can you explain the results of the research studies dealing with multiple-choice test formats (pp. 265-66)?

(a ) Cheng (2004)

Open-ended questionsの成績が最も低かった理由は、選択肢が与えられていないため自分で答えを考えないといけないからである。Traditional multiple-choice itemsに比べてmultiple-choice cloze itemsの成績が良かったのは、クローズテストを行うにはスクリプトを提示しなければいけないため、事実上リーディングテストだからだと思われる。

(b) Yanagawa and Green (2008)

どちらの調査においても、質問を予め聞く機会があったグループの成績が、なかったグループの成績より良かったのは、質問を予め聞くことで聞き取るべき内容がしぼられ、注意資源を効率よく使えたからだと思われる。

3. Examine a listening test for the types of listening passages, tasks, and response formats used. Evaluate the test from the perspective of the five criteria discussed in this chapter.

私が現在開発中の「ワードカウントテスト」で検討する。

（1）妥当性：ディクテーションとの相関は中程度で有意だったが、TOEFLリスニングとの相関が有意だったものの.20と低かったため、内容理解度を測るテストとしては妥当性が十分とは言えない。

（2）信頼性：信頼性係数αが.45であったことから十分とは言えない。原因は、あてずっぽうで正解できてしまうことや、問題数の少なさだと思われる。

（3）真正性：実際の言語使用の場面で語を数えるということは滅多にしないため低いと言える。

（4）波及効果：ねらいは学習者が語彙認識の訓練をするようになるかだが、アンケートで前向きな回答がいくつか見られたことから一定の波及効果はあると思われる。

（5）実用性：問題作成と採点にかかるコストが非常に小さいため、実用性は極めて高い。

4. Examine the listening activities in a textbook and accompanying learner exercise book. Are there any formative assessment activities included? What does the teacher’s guide include with regard to strategy development and formative assessment?

開隆堂のSunshine English Course 3（平成27年・第4版）で分析。リスニングに特化したユニットはListening 1-3の3つがあり、いずれも文章を聞いて絵を選ぶ問題など理解度に主眼を置いたタスクしかない。形成的評価に用いるには、教師の工夫が不可欠である。

5. How can one combine assessment of both product and process in one formative assessment instrument? Take a listening activity from the textbook you examined and create a formative assessment instrument that allows for assessment of both process and product.

（どのようにすれば一度の形成的評価でプロダクトとプロセスの評価を組み合わせることができますか？調査した参考書からリスニング活動を1つ選び、そのような評価を可能にする形成的評価の方法を考えてみてください。）

東京書籍 New Horizon English Course 3 (平成23年版) p. 51より

M2チーム（佐々木さん、鈴木さん、前田君）の回答：

プロダクトは思考発話法で、プロセスはリコールやアンケートで評価するのがよいのではないか。

M1チーム（関根くん、結束さん、稲岡くん、西田くん）の回答：

プロダクトは小テストで内容理解問題を与えるのがよいのではないか。

混合チーム（江下さん、岡くん、小口くん）の回答：

プロセスはチェックリストで評価するのが経済的ではないか。

n プロローグではL2リスニングに関わる幾つかの通念について、本書の読者がどのような考えを持っているか尋ねた。それらの考えに変化があったか最後に確認し、本書を終えたいと思う。

1. Compared to the other language skills, listening is a passive activity

n リスニングプロセスは観察できないが、聞き手は意味の構築のために多くの認知処理を行っている。それには言語処理や背景知識の活用等が含まれ、好ましくない環境では多大な労力を聞き手に強いる。

n 一般のイメージとは対照的に、リスニングは労力の要る活動で、聞き手は能動的である。このことは言語知識が不足したL2学習者になお当てはまる。

n 学習者は受け身的になりがちだが、言語やメタ認知などに関わる知識を駆使して自ら理解しようとすれば理解できると気づくべきである。そのプロセスを客観的に把握することが大切で、planning, predicting, monitoring, problem-solving, evaluationという一連の学習手順が有効なのはそういう理由による。

2. The important thing in teaching instruction is that students get the right answer

n リスニングで正確に理解することは重要な目的だが、プロダクトばかり重視していても学習者の成長は見込めない。それどころか正確さを追求し過ぎると学習者に不安を与えることとなり、作動記憶に負の影響を及ぼす可能性がある。

n ライティング同様、リスニングでもプロセスを学ぶ機会が必要である。教師の適切な支援や足場掛けがあれば、学び始めたばかりの者でも熟達した聞き手の特徴を理解できるだろう。

n メタ認知に関わる活動を日々の授業に取り入れることで、自律的な学習を促すことができる。授業外の学習を通して、学習者はストラテジーやリスニング力の向上に貢献する要因などに気づけるだろう。

3. Learner anxiety is a major obstacle in L2 listening

n 学習者の不安の主な原因は、リスニングは難しいという認識と、正確に理解しなければいけないという重圧の2種類である。これらが自信の低下につながり、成長を阻害する要因となる。

n これを回避する方法はリスニングのプロセスに焦点を当てた指導を行うことである。教師に評価されることへの不安を除去できれば、学習者は作動記憶をフルに活用でき、自分のリスニング力への自信も芽生えるだろう。

n リスニングの事前活動も不安の軽減に有効である。背景知識を活性化したり、トピックについて討論を行うことで、語の認識や区切りがしやすくなる。

n どのような状況下で不安を感じるかわかれば、学習者は対処法を見つけることができるだろう。一方で、適度な不安は理解を促進することも忘れてはならない。

4. Listening means understanding words, so teachers just need to help learners understand all the words in the sound stream

n 語彙知識がリスニングで重要な役割を占めるというのは事実である。そのため語彙認識の訓練を行うのは大事なことだと言える。

n 事前活動のディスカッションは語彙認識を促進する。学習者はしばしば音と文字のつながりを理解しておらず、それが原因で語彙を認識できないときがある。

n リスニング後の言語形式に特化した活動は発音知識や音韻ルールの習得に有効である。このような活動を通して、学習者は連続発話で聞き取れなかった単語が実は知っている単語だと気づくだろう。

n 研究によって、学習者のなかには推論によって言語知識の不足を上手に補える者がいることがわかっている。このような聞き手を育てるにはメタ認知に関する指導が有効である。

5. Teaching listening through video is better than audio alone

n 視覚情報によって情意面の利点が得られることは明白だが、理解も助けるかどうかについてはそれほど明らかでない。特に視覚情報と聴覚情報にずれがある場合、理解の妨げとなる可能性がある。下位の学習者にとってこれらの情報の合致は重要だが、上位学習者になれば背景知識を使ってそのずれを補正することも可能である。

n 動画を用いた研究の多くは評価のコンテクストで行われている。動画を評価マテリアルとして用いる場合は、言語情報を理解しないと回答できないようになっているか留意する必要がある。

n もし動画を授業外でも用いるなら、ニュースやコメディーの違いを教えるなど、学習者のメディアリテラシーを育てる必要がある。

6. Learners who have good listening ability in their first language will also become good L2 listeners

n L1能力がL2リスニングに与える影響についての研究は近年始まったばかりである。それらの研究からL1能力も数ある要因の1つであることがわかっており、特にL1とL2が似たような言語的特徴を有している場合に転移しやすいようだ。

n 熟達したL2の聞き手はL1のリスニングスキルを転用できるが、熟達していない聞き手もメタ認知についての指導を受けることで同じ恩恵を受けられる可能性がある。

n L1がどう影響するか知ることは大事である。なぜなら我々はL2のリスニング力を測定する際、意図せずL1の能力を測っている可能性があるからである。

7. Interactive listening, in conversation with another speaker, is more difficult than one-way listening (i.e., radio and television)

n 相互的なリスニングは一方向的なリスニングよりも易しい場合が多い。なぜなら前者では相手に明確化を求めることができたり、背景知識を共有したりできるからである。

n 一方、相互的リスニングは一方向的なリスニングと同じかそれ以上に難しい場合もある。その理由は理解と産出の両方に注意資源を充てないといけないからである。

n 相互的リスニングは社会的・情意的要求度が高い場合がある。話者の関係によってはリスクをとろうとする姿勢や動機づけが変化する。また、相互的リスニングは対面式のコミュニケーションになるため、表情など非言語情報を読み取る能力も必要になる。

8. When teachers provide learners with the context for a listening activity, they give away too much information

n ラジオをつけたときなどを除き、現実生活のリスニングは普通文脈があり、既有知識と結びつけることで理解を図る。授業で文脈情報を与えることはこのプロセスに適っている。

n 文脈情報を与えると学習者の様々な知識（＝背景知識、テクスト/談話知識、メタ認知的知識）を活性化することができる。

n 文脈情報はディスカッション、リーディング、視覚教材などを通して与えられる。文脈情報は学習者の認知的負担や心配を軽減できる。

9. Letting students listen on their own, according to their interests, is the best way to develop listening skills

n 授業外のリスニングは成長に貢献するが、運に任せては効果が期待できない。授業内でメタ認知的ツールを扱うことで学習者の自学習に対する意欲や自信を向上させることができる。

n 教室内の活動を現実生活のリスニング経験と結びつけると、学習者は真正性の高いコミュニケーションの場面を経験でき、メタ認知の能力も高まる。様々なジャンルの構造を学ぶことは1つの方法である。

n リスニングプロジェクトは学習者に授業外の学習習慣を身につけさせたり、すでに習慣のあった者の学習効率を高めたりできる。教師やピアと意見を交わす機会があることで、フォーマルとインフォーマルの均衡がとれた学習になる。

10. Captions and subtitles are useful tools for learning to listen

n L2の字幕（captions）やスーパー（subtitles）を用いると、学習者の言語に対する意識が高まり、語彙認識力の向上や語彙知識の獲得につながる。

n しかし内容理解の努力をする前にこれらを提示してしまうと、リーディングの活動になってしまう恐れがある。そのため字幕やスーパーは一度聞いたあとに提示したほうがよい。このことはスクリプトの配付でも同じである。

n 現実生活のリスニングでは聞き手は文字を見ることができないため、音響情報や文脈情報のみを頼りに理解することを覚えなければならない。字幕やスーパーを見ながら行う練習がどれほど効果的か探るため、更なる研究が必要である。