4日目第1時限 データ収集法の諸問題(1) 測定法の性質

1 自計式と他計式

 調査票を用いる調査の実施方法は大きく分けると,回答者が自分で回答を記入する自計式調査(自記式ともいう)と,調査員が回答を聴き取って記入する他計式調査(回答者からみて他人が行うという意味,他記式ともいう)の2種類がある。自計式とは,英語の self-administered survey を直訳したものである。しかし,self が回答者自身を指している。他計式は自計式の反対語として日本で考えられた言葉である。

 自計式(回答者記入方式)
 (1) 集合調査
 (2) 留置調査
 (3) 郵送調査

 他計式(調査員記入方式)
 (1) 個別面接調査
 (2) 電話調査

 自計式は、概して費用が低廉。しかし、本人でない人が回答する可能性があるので、本人の意見をたずねるのには不向き。


2 測定法の性質 measurements

 測定尺度の水準

 尺度とは,調査結果に系統的に数字を割り当てたものである。性別であれば男に1,女に2という番号をつけるが,男の1や女の2は単なる分類番号であり,数量としての意味はない。これに対して,年齢では20歳に20,50歳に50という番号をつけると,分類番号としての意味ばかりでなく数量としても意味をもつ。尺度には,分類番号としての意味しかもたない低い水準のものと,数量としての意味をもつ高い水準のものがあり,水準の低い方から(1)名義尺度,(2)順序尺度,(3)間隔尺度,(4)比率尺度の4つに区分している。水準の高い尺度はそれより低い水準の尺度の性質をすべて持っている。水準の高い尺度になるほど多様な統計手法を用いた分析が可能であるから,どのような分析を行う予定であるか調査の設計段階で考えて,それに適した尺度で質問の回答形式を考える必要がる。変数の特性に適した尺度を採用しなければならないが,同じ変数を水準の異なる尺度で測定できる場合がある。例えば,所得調査では収入金額,収入階級,上・中・下のランクで聞くことができる。コンピュータを用いれば高い水準で測定したものをそれより低い水準に容易に再分類できるので,一般的方針としては,同じものを測る場合にはより高い水準の尺度を用いることが推奨される。なお,名義尺度と順序尺度をまとめて質的データ,間隔尺度と比率尺度をまとめて量的データと呼ぶことも多い。

(1) 名義尺度(nominal scale)

 名義尺度とは,数字が分類番号としての意味しか持たない尺度のことをいう。世帯の家族類型を「ひとり暮らし世帯」,「核家族世帯」,「三世代世帯」に分け,各々1,2,3という数字を割り当てる場合がそれである。「ひとり暮らし世帯」よりも「核家族世帯」や「三世代世帯」の方が世帯員数は多いけれども,「核家族世帯」よりも「三世代世帯」の方が世帯員数が多いとは一概には言えないから,割り当てた数字は大小を表さないただの分類番号でしかない。この尺度は数量として意味を持たないから,足し算や引き算ができず,分類ごとに集計して分布を検討するのが主な分析方法である。

(2) 順序尺度(ordinal scale)

 この尺度は,数字が大小,高低の順序を表すが,隣り合う数字の間隔が等差ではない性質をもつ。学歴を「中学校卒」,「高等学校卒」,「短大卒」,「大学卒以上」と分類し,各々1,2,3,4の数字を割り当てる。すると,この数字の順番に就学年数は長くなっている。健康状態を,「非常に悪い」,「どちらかといえば悪い」,「普通」,「どちらかといえば健康」,「まったく健康」と分類しこの順に1,2,3,4,5の数字を割り当てると健康状態の順序を表すことになる。しかし,学歴の場合も健康状態の場合も,1と2の差と,2と3の差など隣り合う数字の差はどれも1であるとはいえ,実質的な差は同じではない。尺度値の間隔が等差ではないので足し算引き算はできないが,順位を活用した分析を行うことができる。

(3) 間隔尺度(interval scale)

 この尺度は,尺度の間隔は等差であるが,絶対的原点を持たない。この尺度上の0という値は「何もない」状態を表わさないのである。例としては,知能指数(IQ)がある。IQ尺度の間隔は等差であると考えられている。100と101の間の1も,150と151の間の1も等しい大きさである。しかし,0という値をとったからといって知能が「ない」のではない。あるテストで0となった人でも,もっと難易度の低いテストを使えばより高い得点がとれるのだから,0という値は便宜的なものである。尺度が等差であるから足し算引き算はできるが,絶対的原点がないから掛け算や割り算はできない。IQが100の人と150の人を比較して差が50とはいえるけれども1.5倍の差があるとはいえない。なぜなら,難易度の低いテストで150と200になれば倍率は1.3倍になってしまい,同じ状態の者同士が違う倍率で表されてしまうのである。社会測定に用いるいろいろな構成尺度は絶対的原点をもたない間隔尺度として取り扱われるものが多い。例えば,幸福感を測定する尺度で0点をとったからといって,まったく幸福でないとはいえないだろう。この尺度の得点は足し算割り算はできるので,平均値ならびにそれを発展させたほとんどの統計分析が可能である。

(4) 比率尺度(ratio scale)

 比率尺度は,絶対的原点をもち,かつ,尺度値の間隔が等差になっているものである。したがって,加減乗除の四則演算が可能である。所得金額0円は所得が「ない」ことを表し,月額10万円と20万円,20万円と40万円では2倍の所得差があると表現することもできる。世帯人員では,「5人世帯」は「1人世帯」より4人多いともいえるし,5倍大きいともいえるわけである。尺度値を倍率で表すことができることから比率尺度と呼ぶ。

 測定法の信頼性と妥当性

信頼性
 信頼性のあるデータとは、繰り返し調査しても同じ結果が得られること。
1 信頼性が損なわれる原因
 (1)質問の言葉遣い(wording)が悪いために質問の意味を取り違えてしまう
 (2)質問する人が与える印象によって回答が変わる可能性がある(性別や服装など)
 (3)データ処理の段階でのコーディング・ミス(同じ回答に違うコードをつけてしまう)
 (4)質問内容−意見を問う質問で、特に意見がない人やその問題について情報をもっていない場合、適当に答えてしまう。

2 信頼性をテストする方法
 (1)ひとつの質問で現象を捉える場合
    test-retest法(繰り返し調査法)
同一人に、2,3週間の時間をおいて同一の質問をし、結果を比較する。
    問題点
    @同じ人に同じ質問を繰り返すのは実際に難しい(断られる)
 解決策は、調査相手全体でなく小さなサンプルを取り出して繰り返し調査をする。
    A記憶 質問にどう答えたかを記憶している人は2回目にも同じ答えをする。
    
 (2)複数の質問(尺度,scale)でひとつの現象や概念(例,介護負担)を捉える場合
こちらの方は、複雑な計算をする方法がある。よく使われるのはα係数

3 信頼性を高めるには
 (1)質問のワーディングを念入りに
 (2)調査員の訓練
 (3)コーディング・ガイドの作成
 (4)「わからない」ないし「どちらともいえない」という選択肢をおいて、無理に意見を求めない

妥当性
 妥当性あるデータとは、捉えたいことがらを捉えているデータのこと。
 例、社会的地位を捉えるために、学歴を質問することは妥当だろうか。
1 妥当性を検討する3つの基礎的方法
 (1)基準妥当性 criterion validity
 (2)内容妥当性 content validity
 (3)構成概念妥当性 construct validity

 (1)基準妥当性 criterion validity
新しい尺度で概念を捉えたい場合に、その概念について従来から使われている尺度と比較してみる。新旧の尺度に対する人々の回答に強い相関関係がみられたら、新尺度は妥当であると判断する。
 問題点
 新旧の尺度に相関関係が見られない場合、それは旧尺度が妥当でないためか、新尺度が妥当でないためか判断できない。旧尺度の妥当性が確立されていないと具合が悪い。ところが、旧い尺度が不満足なので新しい尺度を作成しているのだから、旧いもの基準に新しいものを評価するのは自己矛盾。 
 (2)内容妥当性 content validity
 尺度は概念の一側面だけを測定したものでないかどうかを検討する。高齢者を介護する家族の負担を捉えようとして、身体疲労を質問した場合、それは、負担ではなく疲労を調べただけのものになる。身体面、精神面、活動面など負担には多様な側面がありそうだ。この問題は、測定しようとしている概念がきちんと定義されているかどうかが要となる。
 (3)構成概念妥当性 construct validity


質問文の諸注意

質問項目と選択肢(アイテム,カテゴリー)

 尺度