筑波大学 人文社会科学研究科                                                現代語・現代文化専攻                                           平井 明代研究室



2017年度  異文化言語教育評価論


Enayat, M, J., Babaii, E. (2018). Reliable predictors of reduced redundancy test performance: The interaction between lexical bonds and test takers’ depth and breadth of vocabulary knowledge. Language Teaching, 121?144.

 

Abstract

 本研究では,テスト受験者の語彙の深さ/広さがreduced redundancy testにおけるdamaged textsを補完する間のlexical bondsの効果的な使用に貢献するか検証した。こうする中で,Vocabulary Levels Test (VLT) Word Associated Test (WAT), highlowlexical bondsC-test85名のupper-intermediate50名のlower-intermediate EFL学習者を対象に実施された。重回帰分析の結果,(a) 語彙の深さと広さは語彙熟達度レベルによって異なる役割を担っていること,(b) 語彙の深さはhigh-bondなテキストの良い予測するものとなる,(c) 言語熟達度上位群の受験者は文脈の手がかりとしてlexical bondを効果的に使用できることが示唆された。この発見は語彙の深さを向上する必要性が指摘された。

 

■多くの研究者は,ESL/EFLの研究において語彙知識の重要さについて強調している。

■語彙知識の構成素としては,広さと深さの2分法が提案されている (Henriksen, 1999; Read, 2000)

     広さとは,学習者が知っている語のサイズや数 (Nation, 2001) を表し,

     深さとは,学習した語をどのくらい知っているかという質を表す (Read, 1993, 2000)

■深さと広さの間の関係性の議論において,Henriksen (1999) は学習者はlexical unitの意味を獲得すべきだけでなく,そのネットワークに気づく必要もあると述べている。

     Lexical unitを取り囲むネットワークは,syntagmaticparadigmatic2つのタイプの関係性を包含する (Schoonen & Verhallen, 2008)

     Syntagmatic relationsはある単語が同じ文中の他の単語と持つliner relationsである (e.g., desk-study, desk-book, desk-pen)

     Paradigmatic relationsclass inclusionによって階層化,特色づけられる関係性 (e.g., bird-animal, bird-sparrow) である。

■多くの研究では,語彙知識の広さと深さの読解などにおける役割を検証している (e.g., Nassaji, 2004, 2006; Qian, 2002; Shiotsu & Weir, 2007; Zhang & Annual, 2008)

     しかし,Bachman2002)が主張するように,受験者のパフォーマンスは次の3つの要因によって影響を受けうる: a) タスクそれ自体の特徴, (b) 受験者の特質, (c) 受験者とタスクの特徴の相互作用 (p. 469)。前者2つは多くの研究で調査されているが,最後の1つは十分には検証されていない。

■受験者のパフォーマンスに影響を与えるテキストの特徴の1つとして,lexical bondがある。

     これは,lexical cohesionにとても関連している。Lexical bondHoey (1991) によって導入,適宜課されている。これは,2~3の意味的に関連した語の意味によってグループ化されたlexical linksによって作られる。Hoeyによれば,23lexical links1つのlexical bondを形成すると信じている。

The C-test and lexical cohesion

C-testRaatz and Klein-Braley (1991) によって作成され,cloze testのように, reduced redundancy principleを操作するように意図されている (Babaii & Jalali Moghaddam, 2006)

     このタイプのテストにおいては,受験者の言語能力は言語のメッセージがいくつかのノイズや他の種類の阻害によってdeformedされたときに測定される (Babaii & Ansary, 2001)

     C-testでは,テキストは何語か除去される。

C-testは言語熟達度を測定する有効な手立てだと主張されている (Eckes & Grotjahn, 2006; Lee-Ellis, 2009)

C-testは受験者のmicro-level (Stemmer, 1991) macro-level (Babaii & Ansary, 2001; Babaii & Jalali Moghaddam, 2006; Hastings, 2002; Sigott, 2004) をタップする。この処理はテキストのtextual featuresに関連している。

・ 高い熟達度の学習者はテキストや文脈の手がかりからより益を得ていて,低い熟達度の学習者はより局所的な手がかりを使用していたことが,発話プロトコルデータから得られている (Babaii & Fatahi-Majd, 2014)

C-testsの項目の困難さに影響する要因も特定されている。

     例えば,type-token rationや文の長さの平均がテキストの難しさつまり、C-testの難しさを予測する (Klein-Braley, 1985)。文の長さや統語 (Dornyei & Katona, 1992)Mutilated structureや機能語は内容語よりも空欄補充することが容易。

 

Methodology

■協力者は135名のイラン人大学生 (18?24)Oxford Quich Placement Test (OQPT, 2004) によって,lower-intermediate 50名とupper-intermediate 85名に分けられた。

WAT: Read (1993) によって作成された。語彙知識の深さの受容的な側面を測ることができる。Syntagmatic, paradigmatic, analyticな関係を測定する。

VLT: Nation (1983) が作成。受験者の語彙サイズを,4つの語頻度レベルの内容語の知識を測定することで測ることができる (Read, 2000)

Adelex Analyser (ADA): ADAはテキストの難しさを測定できるオンラインツールである。ADELEX (assessing and Developing Lexis through the Internet) チームのメンバーによって作成された。7つの頻度レベルとBNC, Bank of English, Longman Corpus Network databaseからの,bandsに基づき,英語テキストのlexical profileを検証できる。Lexical density, lexical frequencyのように語彙の難しさを測定。

Hoey’s (1991) lexical analysis: 繰り返し,類義語,superordinate, subordinate, meronymy (tree-trunk), hyponymy (tree-oak), co-hyponymy (oak-pine), co-meronymy (trunk-branch), antonymy (awake-asleep)のような語彙間の意味的な関係性を特定できる。

C-Test: Hoey (1991) の分類をもとに,lexical linkbondsをカウントした。Low/high-bond textが各4つずつ予備実験に準備された。Rater trainingをした2名が,Hoey (1991) の分類に基づき,lexical bondsの数をカウントした。(r = .935)

ADAのツールを使用することで,低頻度語がテキスト中に出てしまい理解し損ねてしまったりするという語の頻度リストに基づいたテキストのlexical difficultyを測定することができる。

C-test作成のため,選定されたテキストはKlein-Braley (1997) のガイドラインに基づいた。

 

Procedure

OQPT (熟達度測定) VLTWAT (語彙知識測定) C-test

■分析は,重回帰分析が行われた。受験者の語彙知識の深さと広さが貢献するかを確認。

 

Results

■語彙知識の深さと広さはEFL学習者の合計のC-testパフォーマンスに寄与するか,C-testlexical bondの高低に寄与するかがRQ

■以上を検証するため,重回帰分析を行ったが,この重回帰での比較は同じC-testを使用するため,Bonferroniの調整が行われ,それゆえに結果はType I errorを統制するために.0166レベルを有意差として報告する。

■以下はlower-intermediate studentsのパフォーマンスの重回帰分析の結果である。

Enter methodを用いた重回帰の結果より,全体のモデルはC-testのパフォーマンスにおいて8%の説明率であった。統計的に有意ではなかった, R2 =.081, F = 2.07, p > .016.

     C-test全体のパフォーマンスを予測する変数として,語彙知識の広さ (β=.046, t = .313, p > .016) と深さ (β=.266, t = 1.793, p > .016) は有意ではなかった。

     C-testLow-bond sub-testに関しては,語彙知識の広さと深さは有意でなかった (β=.171, t = 1.128, p > .016; β=.067, t = .445, p > .016.)enter methodを用いたところ,4%の変数しか説明できていなかった (R2 =.041, F = 1.016, p > .016)

     語彙知識の広さ (β=.299, t = 2.032, p > .016) も深さ (β=.011, F = .077, p > .016) も両方とも有意にはC-testhigh-bond subtestのパフォーマンスを説明できていなかった。

Upper-intermediate群の結果は以下の通りである。記述統計はTable 6に記されている。

Table 7に示されているように,語彙知識の深さのみが組み込まれているstep wise methodのモデルでは,C-testのパフォーマンスをL%の変数が説明できていた (R2 =.128, F = 12.193, p < .01)

     語彙知識の深さは有意にC-testのパフォーマンスを予測した (β=.358, F = 3.492, p < .01)

     C-testLow-bond sub-testについても予測変数の説明率を検証した (R2 =.088, F = 8.006, p < .01)。語彙知識の深さが唯一の有意な予測変数であった (β=.297, t = 2.829, p < .01)

     C-testの内のhigh-bond sub-testについてもmodel 1において語彙知識の深さのみが唯一の予測変数であった。有意であった独立変数において11%の変数について説明していた (R2 =.109, F = 10.185, p < .01)

     加えて,単一の変数としての語彙知識の深さは有意にhigh-bond subtestのパフォーマンスを予測していた (β=.331, t = 3.191, p < .01)

Word frequency levels and C-test performance

VLTの結果を用い,lower-intermediate studentsC-test パフォーマンスへの語彙サイズの役割を説明する。

     ボンフェローニの調整はここにおいても使用された。

Stepwise methodが用いられた。Table 8において示されているように,5000語の頻度レベルのみが予測変数として有意であった。

     C-testにおいて19%に近い変数を説明していた (R2 =.188, F = 11.107, p < .01)500語レベルの頻度スコアはC-testのパフォーマンスを有意に説明していた (β=.433, t = 3.333, p < .01)

     全語の頻度レベルが組み込まれたモデルでは,有意でなかった変数の11%を説明していた (R2 =.110, F = 1.396, p > .016)2000, 3000, 4000, 5000, 1,000語頻度レベルはlow-bond C-testのパフォーマンスを説明するには有意でなかった。

     High-bond C-testにおいては,このモデルは変数の22%を有意に説明できていた (R2 =.219, F = 13.481, p < .01)

Upper-intermediate studentsC-testパフォーマンスにVLTの各レベルのスコアが寄与するか重回帰分析を用いて検証した。結果はTable 9に記されている。

     協力者の10,000語頻度レベルのスコアがC-testのパフォーマンスを説明していたことが示唆された (β=.314, t= 3.009, p < .01)。モデルの10%の変数を説明できていた (R2 =.098, F = 9.056, p < .01)

     C-testlow-bond sub-testのパフォーマンスに10,000語レベルの頻度のスコアは予測変数となっていた (β=.314, F = 3.009, p < .01)

     C-testsub-testにおいては,low-bondC-testのパフォーマンスの8% (R2 =.080, F = 7.176, p < .01), high-bondのパフォーマンスにおいては7% (R2 =.076, F = 6.823, p < .016)を説明していた。どちらのsub-testにおいても有意にパフォーマンスを説明していた (low: β=.282, t= 2.679, p < .01; high: =β=.276, t= 2.612, p < .016)

Discussion

Lower-intermediate群のパフォーマンスの分析より,語彙知識の深さ・広さともにC-testhigh/low-bondsub-testのパフォーマンスをを予測しないことが示唆された。

■一方,high-intermediate群のパフォーマンスにおいては,語彙知識の深さがC-test及び2つのsub-testのパフォーマンスを有意に説明していた。

■以上の結果は,C-testを受験する間に受験者が使用するストラテジーと読み手の個人差に関する先行研究の支持をしている。

     文脈の推測とテキスト中の周りから得られる情報を使う⇒ 言語熟達レベルと相関している (Hastings, 2002; Klein-Braley, 1994; Sigott, 2004)

C-test takingストラテジーにおいて,文脈的な手がかりの使用は,マクロレベル処理の例であるといわれている (Babaii & Anssary, 2001)

     Lexical bondの使用はhigh-levelやマクロレベル処理の例だとされている。

     本実験の結果から,C-testの受験はこのタイプの処理を含んでいることが示された。

■本研究の結果より,upper-intermediate studentsは意味的な知識を使用でき,深い知識を用いてhigh-bond C-testの文脈的な手がかりを用いることができると示唆された。先行研究の結果を踏まえると,lower-intermediate studentsは文脈的手がかりを用いるためのL2semantic networkが欠如していることが予測できる。

■本研究の結果は,語彙知識の深さはlexical-bondsの使用とよく相関することを示した。語の深さに関連する語の意味的な知識は学習者がテキスト中の空欄を埋める手がかりとしてlexical cohesionを使用する手助けとなることが示された。

VLTの頻度レベルの役割の観点からは,より熟達した受験者は相対的に低い熟達度の受験者と比較して,大きなvocabulary storageを処理した可能性が示唆された。

 

考察

本研究は,C-testの成績に語彙知識の2側面 (深さ・広さ) がどのようにかかわっているかを,言語熟達度の高・低のグループに分けて検証した論文であった。C-testが読解熟達度を予測する/しないと意見が分かれる中,新たな側面からC-testの妥当性を検証した点で,新規性のある論文だと感じた。しかしながら,先述のように,C-testは読解熟達度を予測するかどうかは見解が分かれるところであり,現在では,使用するC-testの妥当性が確保されたときにのみ読解熟達度を予測するテストとして使用できるという (Mizumoto, Ikeda, & Takeuchi, 2016)。本研究では,Oxford Quick Placement Test (2004) を使用し,全体的な言語熟達度を測定していた (インターネットで探してみたが,サンプルを見るにはアカウントが必要であるようだ)。そのため,必ずしも熟達度を測ったことが必要でなかったとは言い切れない。しかし全体的な言語熟達度にしてしまったために,具体的に英語熟達度のどの側面 (i.e., 4技能) C-testのパフォーマンスに寄与するのかは曖昧になってしまったように感じた。加え,WATVLTで測れるのは,受容的な語彙知識であり,これらで測定できる語彙知識は言語熟達度の中でも,リスニングやリーディングとの関連が深いようにも思える。一方,C-testは読解しながらテキストそのものに空いた空欄を補充するものであり,産出的な語彙の知識も重要であると考えられる。そのため,4技能に分けてみるなどしてより細かくどの技能の熟達度が高いとどのような結果になるかを見たり,産出的な語彙知識のC-testパフォーマンスへの寄与も見ていくことが必要だと考える。さらには,本研究ではかなりの人数を協力者としていたが,言語熟達度をupperlower-intermediate2群に分割してしまった。そのため,全体では100名を超えるものの,個別にみると各群100名をきっているため,少し統計としてサンプル数が不足していたようにも感じる。以上のような限界点があるものの,upper-intermediate studentのみに見られたにとどまったが,語彙知識の深さが,C-testの成績に寄与する可能性が明らかになったことはとても示唆に富むと考える。一般に高校生などは語彙知識の広さを単語帳などで習得していこうとしがちである。しかし,この結果より,語彙の深い知識を身につけていくことの重要性が改めて見出されたと考える。