筑波大学 人文社会科学研究科                                                現代語・現代文化専攻                                           平井 明代研究室



2017年度  異文化言語教育評価論

Plonsky, L. (2015). Advancing quantitative methods in second language research. New York: Routledge.

Chapter 10 Structural equation modeling in L2 research (pp, 213-242)

 

L2学習やL2使用には様々な要因が存在し,それらは複雑な関係性を持っている.そのような関係性は二変量相関ではとても記述しきれない.構造方程式モデリング(Structural equation modeling; SEM)はそのような多変量の関係性を調査するための枠組みを与えるものである.

 

Conceptual Motivation

SEMは因果モデリング(causal modeling)や共分散構造分析(covariance structure analysis),LISREL analysisとしても知られ,その特徴としてモデリングを必要とすることが挙げられる.すなわち,研究者は測定された変数と潜在変数(構成概念)の関係を明らかにする必要がある.

SEMは研究者にシンプルな二変量の関係や回帰モデルで説明できる関係を超えたより複雑な関係性を明らかにできる“道具箱”を提供する.

SEMはモデルの確認や探索など様々な理論展開の段階で用いられ,Joreskog and Sorbom (1996)は段階を3つに分けて説明している.

1.          モデルの確認:1つのモデルが正しいか(説明できているか)を判断する.

2.          モデルの選択:複数のモデルのうち,最も説明できているモデルを選ぶ.

3.          モデルの改善:元となるモデルを改善するために行う.

■モデル構築の結果が最終的なモデルではなく,異なるデータを用いてモデルの確認を繰り返し行うべきである.

SEMの可能性は際限がなく,SEMによるアプローチの柔軟さがより魅力的なものにするため,近年L2研究においてSEMを用いたものが増えてきている.

SEML2研究における多くのリサーチクエスチョンに応えることができる分析の集合体であり,技能の下位スキルの得点から複雑な構成概念を予測,または説明することができる.

■モデリングは構成概念がどのように互いに影響を与えるかを線を引きながら図式化することから始める.

■従来の方法では,潜在変数は円形または楕円形で表され,観測変数は四角で表される(Figure 10.2-10.3).

SEMは非常に柔軟なため,複数の従属変数と独立変数を扱うことができる.これらの変数は連続変数や順序変数,離散量のいずれも可能であり,これらは観測変数または潜在変数として示される.

■どの変数やそれらの関係をSEM分析で扱うかは研究者次第である.

 

Two Parts of a Model: Measurement and structure

■理論変数間の関係を検証することもSEM分析の一部であり,「構造モデル(structural model)」と呼ばれる.構造モデルでは予測される理論変数間の関係を設計でき,2つの競合する仮説モデル(Figure 10.1)を比較することができる.

l   ■しかしながら,このような問題を扱うためには潜在する理論的変数を計測する測定手法が妥当性・信頼性を満たしている必要がある.

■したがって,SEMではそれぞれの構成概念や理論的変数を測定するモデリングが重要であり,このような測定の関係を「測定モデル(measurement model)」と呼ぶ(Figure 10.2).

■モデルの測定に関する部分は心理測定の問題だと感じるかもしれないが,妥当性研究において構成概念の操作化は中心的なものである.

 

Underlying Factors

■変数の根本にある構造を調査したいとき,要因の数や要因間の関係の仮説を検証するためにSEMを用いることができる.

■鍵となるのは「仮説を検定すること」である.これはdata-drivenである探索的因子分析(exploratory factor analysis; EFA)や主成分分析(principal component analysis; PCA)とは異なるものであり,SEMの枠組みのメリットは選択した要因間の関係もモデル化できることである.

Figure 10.3では9つのL2能力テストの得点が(a) L2言語能力という単一の潜在的要因のよって説明されるモデルと,(b) メタ認知,語彙,統語の3つの潜在的要因によって説明されるモデルの2つの競合するモデルの例である.双頭の矢印は共分散(covariance)を,eはエラーを示す.

 

Advantages of SEM                          

SEMの利点は3つあげることができる.

1.          SEMの利点の一つとして,自身のデータに対し仮説立てられたモデルに適合するかを検証することができ,存在する2つの競合モデルの適合度の差を見ることができる.

2.          研究者は多かれ少なかれ,観測変数と潜在変数の間の関係に関して仮説を立てることになるだろう.

3.          いわゆる誤りのない(error-free)潜在変数を用いて本質的な仮説検証を行うことができる.

SEMは因子分析や(重)回帰分析といった様々な分析を合わせたものだと言われることもある.しかしながら,大量のサンプルサイズや一定の条件を満たすデータ,分析の明確な計画などを必要とする.

 

General Consideration in SEM Analysis

■本節ではテストの得点や反応時間といった連続データや間隔データのモデル化に焦点を当てる.

 

Data Preparation

■まず,連続変数は多変量正規分布に従わなければならない.つまり,各々の変量は正規分布にしたがっていることが条件となる.

■これには歪度と尖度の確認が含まれる.また,外れ値の影響も受ける.

■他の分野と同様にL2研究でもデータセットが完璧であることはほとんどない.データの欠損に対しては利用できるデータから予測したりlikewise deletionといった方法が用いられる.

likewise deletionの使用は(a) データの欠損が完全にランダムであること,(b) 検定力を失わないくらいのサンプル数を有していることといった条件もある.

■欠損値をサンプルの平均値で補う方法もあるが,それは分散が小さくなることを意味するため欠陥もある.

■多くのSEMソフトウェアパッケージには欠損値を補ういくつかの方法が備わっているため,それら用いると良いだろう.

Designing a Model

■データ収集の後,分析で最もexcitingな段階が始まる.そう,モデルの設計である.このプロセスは理論的背景や理論的予測によってガイドされるべきであり,2つの段階に分けられる.

■1つ目は測定モデルの検証であり,前提となっている潜在変数が,予測されている通りにテスト得点に測定することが可能かを判断することができる.

■この段階では潜在変数間に特定の関係を仮定しないため,特定のモデルが合わない(misfit)原因は潜在変数と観測変数に関する仮定側にある.

■潜在変数自体はスケールを持っているわけではないのでz値などに標準化したり,観測変数の中から変数を1つ選び,そのスケールと同じにするといった対処法(参考尺度)が考えられる.

■測定モデルが適合しており,全ての観測変数が潜在変数によって説明できる場合,次の段階へ進む.構造モデルの検証である.

■潜在変数間の関係性をモデリングすることで,単一モデルまたは競合するモデルの理論的構成概念に関する仮説を検証し,最適なモデルを選択することができる.

■変数間の関係には多数の可能性が存在するため,データに対してモデルを調節しようとする

■過適合(overfitting)のリスクを避けるために計画をする必要がある.(適合度をあげようとしすぎない)

■モデルを構築する構成要素は変数(parameters)であり,基本的にはそれらは分散と共分散から成る.

■変数をモデリングするとき,我々は3つの選択肢がある.

1.          変数を特定の値に固定する.2変数間に共分散がなく,変数を推定する必要がない場合は共分散を0とすることができる.また,潜在変数を標準化したい時は分散を1とすることができる.

2.          変数を自由なものと設定し,変数の値をプログラムに推定させる.これは潜在変数同士に相関があることが予想され,共分散を知りたい時に使用し,共分散を自由な変数とする.

3.          変数を異なる変数と同じにする.共分散と回帰,分散が同じであると仮定することができる.例えば,テストAとテストBが心理測定という点で同じであれば,それらの誤差分散と潜在変数の回帰が同じであることを意味する.

 

Fitting and Evaluating a Model

■モデル内の仮説を操作した後,そのモデルがデータに適合するかを検証する.

SEM分析では観測変数の共分散行列を推定し,実際の共分散行列と比較する.このさい,自由変数と制限付き変数の最初の予測がプログラムによって算出される.

■観測された共分散行列と推定された共分散行列に基づき,再算出された共分散行列と観測された共分散行列の差を最小化するために自由変数と制限付き変数の最初の予測は2回目の反復で調整される.

プログラムは,反復によって最尤度関数に基づき観測された行列と再算出された行列の違いが最小限になる変数の値を推定する.

プログラムは反復をやめ,得られた結果を報告する.その後,我々はモデルが十分にデータに適合しているかを判断する.モデルの適合度を評価する方法はいくつかあるため,単純なyes/noといった問題ではない.

統計ではp値と自由度を用いるカイ2乗検定がある.カイ2条検定はサンプルサイズだけでなく変数の数にも敏感であるため,研究者の多くは有意検定ではなく記述統計の指標として用いる.カイ2乗値を自由度で割った値が2以下であればモデルは適合していると言える.

SEM分析の記述的適合度指標は,入力された共分散行列と再算出された行列の差に基づいて行われるもの(e.g., standardized root mean square residual; SRMR)や推定される変数の数を考慮に入れたもの(e.g., the root mean square error of approximation; RMSEA)など,カイ2乗値以外にも存在する.

その他の方法として,検証するモデルと変数間に関係がないと仮定した“null”モデルとの比較に基づいたものがあり,これらはnonnormed fit index (NNFI) Trucker-Lewis indexcomparative fix index (CFI)と呼ばれる.

また,モデルの変数そのものを確認するという方法もある.これはモデルには適合しているものの同時に局所的に不適合が見られる際に用いられる.

 

Pitfalls

SEMを用いるリスクの一つは,ある固定された変数を自由と定めることによってカイ2乗値がどのように変化するかを示す修正指標の助けを借りて1つのモデルを果てしなくいじってしまうことである.こうなってしまうともはやp値に意味はないだろう.

SEMを用いる最も有益なアプローチは2つの競合するモデルを選択する場合だろう.この場合は,どちらかのモデルや理論的立場を指し示すことができる.

全ての場合において最もよい実践とは最終的なモデルに至るまでの全ての段階を報告することである.

 

A SEM Analysis Step by Step

省略