米崎里(2016)「スピーキングテストの形式が学習者の情意面に及ぼす影響―直接テストと半直接テストの比較を通して―」鳴門英語研究, 26 , 161-173.
【概要】
大学一年生85名を対象に、直接スピーキングテスト、半直接スピーキングテストを実施する。それと併せてテストについて、自由記述を含むアンケートを行い、学習者の情意面において直接テストと半直接テストの違いを明らかにする。
【リサーチクエスチョン】
1.直接スピーキングテストと半直接スピーキングテストでは、学習者の反応や認識はどう
異なるのか。
2.学習者は、直接スピーキングテストと半直接スピーキングテストではどちらの形式を
好むのか。
【実験方法】
参加者:
大学生一年生85名。うち、薬学部49名(以下グループ1)、生命工学36名(以下グループ2)。
構成:
テスト内容はHirai&Koizumi(2009)が中級レベルの英語学習者を対象として作成したStory Retelling Speaking Test を用いた。ただし内容は初見でなく、授業内で学習した英文内容をリテリングし、その後の内容に関する質問に答える形式をとった。質問は、「このストーリーが好きか否か、その理由も併せて答えよ」、「どの登場人物が好きか、その理由も併せて答えよ」以上の2つ。グループ1は最初に直接テストを行い、後に半直接テストを行った。グループ2の順序はグループ1と逆である。
直接スピーキングテスト:
準備ができた者から調査者と一対一で対面テストを行った。
半直接スピーキングテスト:
ICレコーダーを10台用意し、準備ができた者から録音を行った。質問内容を書いた紙を渡して質問に答える形式をとった。
分析方法:
アンケートを用いる。直接テスト、半直接テストアンケート内容は同じである。以下の7項目5件法、自身にとって直接テストと半直接テスト、どちらが好ましいかという質問とその回答の理由に関する自由記述という内容である。
7項目 ①テスト中の緊張度
②テスト内容の公平さ
③テスト内容の難易度
④テスト内容の好意性
⑤テスト中の自身の実力の発揮ぐあい
⑥テストの有益性
⑦英語力の上達
5件法 5:「とてもそう思う」
4:「そう思う」
3:「どちらともいえない」
2:「そう思わない」
1:「まったくそう思わない」
【実験結果】
有意差が認められた項目は緊張度・難易度・好意性・実力の発揮以上の4つである。それらはみな、半直接テストより直接テストのほうが高い値を示した。
自由記述欄
・「先生がいる場合は(質問に対する答えがこれでいいのか)表情でわかるけれども、ICレ
コーダーに録音するだけではこれでいいのかわからず不安だった」
・半直接テストの方が難しく感じた理由に「失敗したときやりなおせないから」などもあげられた。
自身にとって直接テストと半直接テスト、どちらが好ましいかという質問に対する答えは直接テストが45.9%、半直接テストが20.0%、どちらともいえないが34.1%であった。直接テストが好ましい理由に、「先生のリアクションがあったほうが安心するから」「先生としたほうが間違えても頑張ろうと思える」「先生が相槌をうってくれたので安心して話せた」といったコメントがみられた。半直接テストを好む理由には「自分のペースで進めることができる」といったコメントがみられた。
【結論・考察】
直接テストのほうが半直接テストより好ましいという結果になった。直接テストを好む主な理由としては、対話する相手がいる、ということであった。Krashen(1985)の情意フィルター仮説によると、学習者の情意面と言語習得には密接な関係がある。情意フィルターは言語テストにおいても作用し、学習者の情意面がテストに影響を及ぼすと考えられる。本研究における課題が3点ある。その3つを以下に挙げる。
・授業担当者が試験官であったことが、直接テストのほうが好ましいという結果に影響を及
ぼしているかもしれない。試験官が初対面の人であった場合も試す必要がある。
・今回のスピーキングテストではスコアを研究対象としなかった。スコアと情意面を併せて
調査することも必要である。
・今回の参加者はスピーキングテストに慣れていない。スピーキングテストに慣れた学習者
に対しても試す必要がある。
Yujia Zhou. (2008). A comparison of speech
samples of monologic tasks in speaking tests between computer-delivered and
face-to-face modes. The Japan Language Testing Association, 11, 189-208.
【概要】
今回の実験ではコンピュータデリバリー形式とフェイストゥーフェイス形式において、実験参加者のモノロジックタスクにおける言語パフォーマンスの有意な違いを見つけることを目的としている。さらにはテスト形式と実験参加者がどれだけ流暢にしゃべるか、の関係について調べることも目的としている。今回の実験では79人の日本のEFLの生徒が二つのモデルから提供される二つのモノロジックタスク参加した。参加者のスピーチサンプルを流暢さ、正確さ、複雑さ以上3つの指標を以て比較した。
【リサーチクエスチョン】
1. コンピュータ形式とフェイストゥーフェイス形式によってデリバーされるモノロジッ
クタスクにおける言語学的パフォーマンスの違いはどのようになるか。
2.参加者の熟達度とデリバリー形式の相互作用はどのようになるか。
その際に用いる指標は流暢さ・正確さ・複雑さ以上の3つである。
<仮説>
●リサーチクエスチョン1に関して
・参加者は聞き手がいるとき、正確さ・複雑さより意味を優先させる。
●リサーチクエスチョン2に関して
・熟達度が低い参加者のスピーチサンプルはよりデリバリー形式のちがいによる影響を
うける
【実験方法】
参加者:
参加者は日本人、79人のEFL生徒。内、61名は大学生(81%)18名は二つの高校の高校生(19%)。19名が男性(24%)60名が女性(76%)。大学生の専攻は、英語以外の外国語(36%)、英語・英文学(13%)、医療・家政学(28%)。高校生の内訳は、男子校(13%)、共学(10%)。全ての生徒はボランティアで参加し、日本の大学生と高校生の広い範囲を良く代表していると考えられる。
構成:
コンピュータデリバリーモノロジックタスク:
二つのモノロジックタスクを用いた。意見タスクと物語タスクである。意見タスクで参加者に与える時間は1分。意見タスクではグラフを与える。そして、グラフの情報に基づいて、トピックについて参加者は意見を述べる。物語タスクで与える時間は2分。物語タスクにおいては、「アメリカ人女性が質問し、そしてあらかじめ設定されたシンプルなフィードバックを行うビデオ」を与える。準備ができたら参加者はタスクに対するレスポンスを、スクリーン上の“スタート”アイコンをクリックすることでレコードし始める。レコードされたレスポンスは発音・文法・流暢さ・語彙において5段階評価で二重に採点される。
フェイストゥーフェイスのモノロジックタスク:
フェイストゥーフェイスのタスクはコンピュータデリバリーと同じ内容、同じフォーマットを用いて構成される。一対一で行われる。この著者(中国人女性)は全てのフェイストゥーフェイスのテストにインタビュアーとして参加した。物語タスクでは、インタビュアーは質問する役割、コンピュータデリバータスクにおいてビデオキャラクターがしたのと同じようなフィードバックを行う役割を担う。インタビュアーは、準備時間、反応時間の時間を定める、そしてICレコーダーを用いて参加者のレスポンスを録音する。コンピュータデリバリーのタスクと同じように採点する。
計画と手順:
参加者はランダムに、均衡にデザインされた2つのグループに割り当てられる。
グループA:(n=41)先にコンピュータ形式、次にフェイストゥーフェイス形式。
グループB:(n=38)最初にフェイストゥーフェイス形式、次にコンピュータ形式。
二つのテストは7から10日のインターバルを置いて実施した。
起こり得るデリバリー形式と熟達度の相互作用の効果を考察するために、参加者はコンピュータデリバリータスクで合成されたスコアに基づいて3つのグループに分類する。
分析測定:
流暢さ:吃音、反復、言い直し、発話始めのミス、有声ポーズ、無声ポーズの数
正確さ:1節あたりのミスを含まない節、1AS-ユニット*あたりのミスを含まないAS-ユニ
ットの数
複雑さ:1AS-ユニットあたりの節、1AS-ユニットあたりのミスの含まない従属節、1AS-ユ
ニットあたりの語、Guiraud’s Index、語彙密度インデックス、加重語彙密度インデックスの数
統計分析:
サブジェクト内のファクターとしてのデリバリー形式、サブジェクト間のファクターとしての流暢さレベルを用いた二通りの方法で、流暢さ、正確さ、複雑さという指標を以て処理した。
※AS-ユニット…Analysis
of Speech Unitの略。一人の発話者による発話で、独立した節、もしくは従属節ユニット、加えてどちらか一方と結びついた従属節から構成される。
【実験結果】
●リサーチクエスチョン1に関して
・コンピュータデリバリー形式
流暢さ:有声ポーズが多く使用される。
正確さ:有意差はみられなかった。正確さはデリバリー形式の違いに左右されない。
複雑さ:有意差はみられなかった。複雑さはデリバリー形式の違いに左右されない。
・フェイストゥーフェイス形式
流暢さ:吃音の中の反復ワードが多く使用される。
正確さ:有意差はみられなかった。正確さはデリバリー形式の違いに左右されない。
複雑さ:有意差はみられなかった。複雑さはデリバリー形式の違いに左右されない。
●リサーチクエスチョン2に関して
・流暢さ・正確さ・複雑さ、どの指標においてもタスクのデリバリー形式の違いと参加者
の熟達度との間に有意差はみられなかった。
【結論・考察】
●リサーチクエスチョン1に関して
流暢さ:有声ポーズの観点からみるとフェイストゥーフェイス形式のほうが流暢に話す。
これは仮説と一致する。反復ワードの観点からみるとコンピュータデリバリー
形式の方が流暢に話す。これは仮説と一致しない。インタビュアーと対面すると
き参加者が高いレベルで神経質になる、それが参加者をためらわせどもらせ、ひ
いてはより多くの反復ワードを使わせたと考えられる。
正確さ・複雑さ:デリバリー形式の違いに左右されない。
まとめると、参加者は聞き手がいるとき、正確さ・複雑さより意味を優先させるという仮説はこの実験によって部分的にしか補強されなかった。流暢さ・正確さ・複雑さの三つはトレードオフの関係ではないかもしれない。
●リサーチクエスチョン2に関して
・デリバリー形式の違いと参加者の熟達度との間に相互作用はないという結果になった。
この結果は仮説と一致しない。
・条件を変えれば、デリバリー形式の違いと参加者の熟達度との間に相互作用を認めるこ
とができるかもしれない。
→今回低いレベルと評価された参加者ののオーラル熟達度が、十分に低くなかったか
もしれない。参加者を高校生低学年、中学生の間から増員すればデリバリー形式と参
加者の熟達度の間に相互作用が検出されるかもしれない。
→参加者の分類の基準がモノロジックの評価のスコアだったことにも同様に注意しな
ければならない。一般的な熟達度基準を用いることは異なる結果を生むかもしれな
い。
【米崎里(2016)に関する考察】
・半直接テストを支持する生徒の理由に注目すると、そのほとんどが、実際のスピーキング
における難しさが排除されているから、という趣旨のものである。これは、半直接テストは実際のスピーキング力に結び付かないおそれがあることを示唆している。
・質問が読み上げられるのと紙面上の質問を読むのとでは情意面においても、また求められ
るスキルも変わってくると思われるので、その点を研究対象に加えてもよいのではない
か。
・今回の実験では直接テストvs半直接テストという対立で展開したが、特に半直接テスト
の形式はさまざまな種類が考えられ、半直接テスト内の異なる形式間によっても情意面
に差異がみられるのではないか。今回の半直接テストの実験結果を以て半直接テスト全
体の実験結果とみなすのは正確さにかけるのではないか。
【Yujia Zhou. (2008) に関する考察】
・コンピュータデリバリー形式では面接官がアメリカ人女性、フェイストゥーフェイス形式
では面接官が中国人である。この違いが結果に影響を及ぼしている可能性がある。その点
に関して条件をそろえて実験してみると結果が変わるのではないか。
【二つの研究にまたがる考察】
・参加者が面接官に対して質問をする、というタスクが設定されていない。質問すること
をタスクに含めるとしたら、そのときの評価基準も新しく考える必要があり、またそのタ
スクの変化に伴いパフォーマンスも変化しうるのでその点についても研究する価値はあ
る。
・実際のスピーキング力を測るという観点においてはフェイストゥーフェイス形式が最適であることは両者の研究ともに一致して結論がでている。しかし半直接式のスピーキングテストであっても、その短所を把握した上で利用すれば、テスト実施者の負担を大幅に減らすことができる。実際大規模テストにおいてはすでに半直接式のテストを用いているものもある。その場合、テスト実施者は、そのテスト結果がどの程度の能力を示しているかということをテスト受験者に対して明らかにすべきである。そのためには、より明確に半直接テストの欠点を洗い出す必要がある。