3日目第2時限  サンプリングの方法

 実際のサンプリングは壺から碁石を抜き取るようには簡単にいかない。本章は,その実際の方法を解説する。サンプリングは,母集団の定義から始まる。次に確率抽出法と非確率抽出法のどちらで行うかを決める。調査の目的を最優先して決めるのが原則だが,実際に確率抽出法を使える条件があるかないかが決定的な要因である,次に,標本の大きさを決める。これは,標本理論面からの検討と費用面からの検討が必要である。次に,具体的なサンプリングのやりかたを決める。調査地域の広さなどが種類の選択に影響する。

1 標本設計

(1) 母集団の決定

 母集団とユニバース  これまでは母集団という言葉を比較的ルーズに使ってきた。ここで厳密に考えてみたい。調査によってその内容を明らかにしたい究極の対象を母集団として説明してきたが,厳密にはユニーバースと母集団に区別される。たとえば,日本の老人の幸福感の調査では日本の老人全員が対象であるはずだが,果たして全員の名簿があるかとなると,名簿に載っていない人もあれば載ったまま死亡した人もある。現実に把握できるかどうかを別にした理想の対象集団をユニバースという。これに対して,時間と場所を特定したうえで実際にサンプリング可能な集団が母集団である。

 母集団の転移  第2の注意点として,ついつい犯してしまいやすい誤りとして,調査の途中で母集団が変わってしまう問題がある。重度の障害を持つ人の生活実態や意見を調べる調査では,本人に質問したり質問紙に記入してもらうことが障害の故に難しく,家族に質問せざるを得ないことがある。家族に障害者本人の状況を聞くぶんには問題ないが,途中で家族の苦労や意見を聞き始めると,母集団は障害者なのかその家族なのかわからなくなってしまう。家族名後からではなく障害者名簿から抽出したはずなのに,こうした母集団の取り違えが案外簡単に行われる状況があるので注意したい。母集団を途中で変えてしまうと,標本理論を適用することはできない。

 抽出の枠  母集団から標本を抽出するにはもとになる名簿が必要である。母集団の台帳を抽出の枠 sampling frame という。枠を調達できなければ,確率抽出法はあきらめなければならない。最大限の手だてを尽くして枠を準備するのが調査者の責任であるが,対象が特殊な福祉問題をもつ人々の調査では,そうした人々をあまねく網羅した名簿は役所でも持っていないことが多い。このような場合には,確率抽出をあきらめるか,部分的ではあっても名簿搭載者を母集団とみなす逆の定義をして,その名簿限りの集団について確率抽出法を用いることになる。

(2) 標本の大きさの決定

 標本誤差と調査費用  標本の大きさ sample size をいかに決めるべきか。あまり大きな誤差のある標本では困る。福祉ニーズ出現率の調査で,5 %の誤差があるようなものは福祉計画に大きな狂いが出る。しかし,地域内に障害者施設を建設することの賛否を問う住民調査では, 5 %ぐらいの誤差があっても大勢がわかればよいこともある。

 標本の大きさを決める要因は,第1には標本誤差の許容水準であり,次には費用である。いくら理想的な標本設計だとはいっても,費用が不足するほど大きすぎては実施できない。ただし,別の章で説明するように,費用のかかる訪問面接調査をやめて電話調査にするとか郵送調査にするなど費用を軽減する道は他にもあるので,この段階では標本誤差の観点から必要標本数を求めて,その後で費用を考慮した実施の方法を考えた方がよい。

 必要標本数の公式  標本誤差から必要標本数を求めるには,標本の大きさから標本誤差を求める公式を標本誤差から標本の大きさを求める式に逆転すればよい。信頼度 95 %における標本の大きさを求める式は次の通りである。この式の母比率 P や母分散は実際には不明であるから,過去の類似の調査や資料等を参考にして予想値を代入する。また,標本誤差は,その標本調査でどの程度の誤差を覚悟するかという許容水準となる誤差の大きさである。 

[標本の大きさを求める公式:有限母集団]

   比率の場合 平均値の場合 

(5) 

ただし,Nは母集団の大きさ
    nは標本の大きさ
    Pは母比率の予想値
    eは信頼度 95 %での標本誤差の許容値 

[標本の大きさを求める公式:無限母集団]

  この式の計算は煩雑なので,パソコンの表計算ソフトに式を埋め込んでおいて標本設計の条件となる数値を入力すれば必要標本数が自動的に計算されるようにするとよい。

1 万人の高齢者母集団から要介護高齢者の比率を求める調査を行うこととして,(5)式からnを求めてみよう。式を解くためには母比率 P ,標準誤差 e を決めなければならない。母比率Pはわからないので予想値 10 としてみる。許容できる標本誤差 e はニーズ推定にあまり大きな誤差は困るので 2 を限度とする。これらの数値を(5)式に代入すると,

という計算結果が得られる。つまり, 1 万人の中から無作為に 795 人を抽出すれば,母比率±2 %の範囲から 95 %の確率で標本を得ることができる。調査の回収率を 75 程度と見込めば 1,000 人を抽出しておいたほうがよい。

 標本の大きさに影響する要因  標本の大きさに影響する主な要因は,許容標本誤差と予想される母比率の大きさである。母集団からの抽出率が大きいほど標本誤差が小さい(精度がよい)と考えやすいが,これば誤解である。その例を示す。

 要介護高齢者の例で,母集団の大きさが違う場合と標本誤差の許容値が違う場合に必要となる標本の大きさnを計算したのが 表 1 である。 

表 1 母集団規模と許容標本誤差別にみた必要な標本の大きさn
母比率予想が 10 %(例:要介護高齢者の比率)で信頼度 95 %の場合

母集団

標本誤差 1

標本誤差 2

標本誤差 3

標本誤差 4

5,000

2,044

737

357

207

10,000

2,569

796

370

212

50,000

3,234

850

381

215

100,000

3,342

857

383

216

1,000,000

3,446

864

384

216

10,000,000

3,456

864

384

216

  この表からわかる特徴をまとめると,標本の大きさの決定には,

 @ 母集団の大きさはあまり関係がなく
 A 標本誤差の大きさが決定的な影響を与えており
 B 標本誤差を半分にするには標本を約4倍にすべきことである。
 標本の大きさに影響を与えるもう一つの要因は予想される母比率(母分散)の大きさである。標本の大きさが等しければ予想母比率が 50 %であるとき標本誤差は最も大きくなる。通常の調査では,母比率の違ういろいろな調査項目が盛り込まれている。したがって,ある項目にでは許容標本誤差の範囲内であっても他の項目では誤差が大きすぎるということが起こる。予想母比率が 50 %のときが最も条件が厳しいので,個々の調査項目について標本数を計算するのではなく,母比率 50 %の予想で許容標本誤差を満たす標本数を求めておけば,それ以外の調査項目ではより小さな標本誤差になるので心配はない。

2 確率抽出法の種類

(1) 単純無作為抽出法

 確率抽出法の原理は,母集団に含まれるすべての個体が標本に選ばれるチャンス (確率)を等しくもつようにすることであった。特定の個体が他の個体よりも大きいチャンスで選ばれるようなことがあってはならない。そのためには,母集団の個体数分のくじを作って箱の中に入れてよくかき混ぜ順次くじを引いてもらい,当たりくじを引き当てれば標本となるようにする。この原則を忠実に実行するのが単純無作為抽出法 simple random sampling である。
              
            表
- 乱数表の一部分

79152

53829

77250

20190

56536

18760

69942

44560

38750

83635

56540

64900

42912

13953

68328

83378

63369

71381

39564

05615

42451

46939

38689

58625

08342

30459

85863

20781

83544

86140

15707

96256

23068

13782

08467

スネデカー・コクラン『統計的方法』岩波書店 501頁より引用 

 実際にはくじ引きの代わりに乱数表 random number table を用いる。表 - はその一部を引用したものである。母集団のリストに一連番号を振った後で乱数表を引き,出てきた番号とリストの番号が一致する個体を標本に採用する。母集団が 1 万人であればリストに 1 番から 10,000 番までの一連番号をつけたいところだが, 0 番から 9,999 番とした方が都合がよい。というのは,リストの一番最後の個体を 10,000 番とすると,乱数表から 5 桁の数字を引かなければならないが,それだと 10,000 より大きい数字ばかりが延々と出てきて効率が悪い。次に,表 - の乱数表の出発点と進行方向(上下左右)を無作為に決める。鉛筆を落として落下した地点から始めるのもよい。ここでは,解説の便宜のため左上端から出発して下へ進むことにする。母集団リストの最後の番号は 9,999 であるから,乱数表の左端から 4 桁分の数字を読む。この表では最初の数字は 7915 であるから,母集団リストの 7,915番の個体がサンプルに選ばれる。順次下方向へ 4 桁の数字をたどると,1538, 8594, 6114, 0521 と続くから,その番号の個体をサンプルとして採用する。一番下まで読んだら上にもどり,最初の 4 桁の隣の 4 桁を読んでいく。この例では,2538 番となる。必要な個体数 1,000 人分が確保されるまで,この作業を繰り返す。一度出てきた番号と同じものが出てきたら飛ばして次を読む。

 乱数表とは, 0 から 9 までの数字がなんの規則性もなく無作為に並んだ表である。表 - では数字が 5 桁区切りで記入されているが,これは見やすくするためのであり,本来は 1 桁づつのものである。 2 桁づつ記入されたものなどいろいろある。数字が 10,000 個記入されているとすれば 0 から 9 までの 10 種類の数字が 1,000 個ずつ入るように作られている。1円玉に 0 から 9 までの数字を別々に記入して箱に入れてよくかき混ぜ一枚引く,出てきた数字を記録したら箱に戻す,という作業を繰り返すと数字が無作為に並んだ乱数表ができあがる。宝くじの当選番号を決めるのと同じやり方である。実際には精巧な装置で作られたものが日本工業規格の統計数値表として市販されている。

(2) 系統抽出法(等間隔抽出法)

 単純無作為抽出法は,母集団が大きくなると一連番号を振るだけでも大変な作業であり,標本が大きくなると乱数表で出てきた番号を整理するのも大変で,実行は極めて煩雑かつ困難になる。系統抽出法 systematic sampling は,単純無作為抽出法の原理を変えずに,やり方を簡便にした便利な方法である。英語を直訳してこの名前が付けられてはいるが,等間隔抽出法という別名のほうがこの方法の内容を率直に表している。
 例えば,母集団 1 万人のなかから 1,000 人を選ぶには,10 人に 1 人を選べばよい。母集団リストに並んでいる最初の 10 人の中から乱数表で 1 人を選び,あとは 10 人間隔で採用していけばよいから,乱数表を引くのは1回だけである。最初の 1 人を選び出す乱数をスタート乱数という。抽出間隔は母集団の数を標本数で割ればよいが,割り切れずに余りがでるときは余りを切り捨てた数を抽出間隔にする。切り上げてしまうと,目的の標本数に足りなくなるからである。余りを切り捨てた抽出間隔を用いると途中で必要な標本数に達するが,最後までサンプリングを続けることが大事である。途中でやめると,その後ろに並んでいる個体は最初から選ばれるチャンスがなかったことになり,等確率性の原則が崩れてしまうからである。最後まで続けて余分がでたら,選ばれた標本全体の中から切り捨てるものを無作為に選ぶ。
 この方法の固有の欠点としては,母集団の配列のなかに何らかの周期性があり,その周期が抽出間隔と同じかその整数倍である場合,特殊な個体だけが選ばれる偏った標本になってしまうことである。例えば,5階建てアパートの立ち並ぶ住宅団地で,住居環境に関する世帯調査を企画したとする。総世帯 500 世帯から 100 世帯を選ぶことにすると,抽出間隔は5である。団地の世帯名簿の最初から5世帯目までの中からスタート乱数を求め,その世帯を起点に5世帯間隔で抽出した。このとき,団地の世帯名簿が1階から5階の順に記入されていると,スタート乱数が5であれば5階に居住する世帯のみが選ばれてしまう。団地の居住環境調査とはいいながら,その実は5階居住者の居住環境調査になってしまう。このような場合は,抽出間隔を変更するか母集団リストの配列を変えるか,どちらかの対策を行う。

(3) 層化抽出法

 単純無作為抽出法の原理を維持しながら,同じ標本数であれば標本誤差を小さくするできる方法が層別抽出法 stratified random sampling である。母集団を層別に分けることができる場合には,この方法を用いるべきである。まず,母集団を層の中では均質で層と層の間は異質になるように分けておいて,各層から無作為に系統抽出を行う。母集団が個人の集まりである場合の最も典型的な層別の基準は男女と年齢階級である。そこで,母集団リストを男女の層にわけて,さらに,男女の各層を年齢別に並べ替えたうえで単純無作為抽出なり系統抽出を行えば,男女と年齢については母集団の構成と同じ割合の標本が抽出される。これを,比例割当という。こうすることで,男女や年齢によって異なる行動や意見などその他の特性についても誤差の小さい標本を得ることができるのである。母集団の各層からどの割合で標本を抽出するかについては理論的に各種の方法が考案されているが,実際には困難な面があるので,結局は比例割当を用いることが多い。

(4) 2段抽出法(多段抽出法)

 調査対象者の居住する地域が広範であると,調査員が飛び離れた地域に出向くことが困難である他,単純無作為抽出法などによって直接標本を選ぶのも難しい。住民調査では,対象となるすべての市町村役場に出向いて住民台帳を閲覧して枠を調達しなけれなばらないが,それが全国であるとか東京都全体であるとか広域にわたる場合は実際的でない。郵送調査や電話調査では,調査相手がどこに住んでいようと距離は問題ないのであるが,抽出の枠を準備することができないのである。

 このようなときは,サンプリングを2段階にわけて,第1段階で調査する地点を選び(第1次抽出単位 primary sampling unit),第2段階では選ばれた地点の中から個人(第2次抽出単位 secondary sampling unit)を選ぶ。2段抽出 two-stage sampling というが,3段階や4段階になることもあるだろうから多段抽出法 multi-stage sampling ともいう。抽出段階が多くなるほど標本誤差は大きなる。2段抽出法では単純無作為抽出法よりも1.5 倍ほど大きい標本誤差になると言われているから,誤差を同程度にとどめるためには標本を 2.5 培程度に大きさくした方がよい。

 第1段階と第2段階の選び方にはいくつかの方法がある。確率比例抽出法 probability proportionate sampling は,第1段階では人口に比例した確率で地点を無作為に抽出し,第2段階では各地点の人口にかかわりなく同数のサンプルを無作為に取り出すものである。第1次抽出単位が市町村であれば,対象となるすべての市町村の人口の総和を分母として各市町村の人口を割って得られる確率で市町村を選ぶ。したがって,人口の大きい市町村の選ばれる確率が高い。第2段階では,選ばれた市町村の大きさに関わりなく同数の個人を選ぶから,市町村の人口が大きいほど個人の選ばれる確率は小さい。しかし,第1次抽出の確率と第2次抽出の確率をかけ算すると,最終的に個人が選ばれる確率はすべての地域で等しくなる。この方法は,調査地点のサンプル数が等しくなるので調査の実施管理がやりやすい。
 副次抽出法 sub-sampling は,第1段階では人口の大きさに関わりなく等確率で地点を抽出する。したがって,各地点の人口や母集団の大きさはわかっていなくてもよい。第2段階では,抽出された地点の人口に比例して個人を無作為に抽出する。確率比例抽出法とは反対の方法であり,手続きが簡単な長所があるが,最終標本の大きさが調査地点によって異なるので調査の実施管理が難しいうえに標本誤差の計算が面倒になる欠点がある。

(5) 層別2段抽出法

 2段抽出法の第 1 次抽出単位には大都市,小都市,町村とか工業地域,商業地域,農村地域など性質の異なる地域が含まれている。地域を偏りなく選ぶためには,最初に地域を人口規模とか産業構造などの指標を用いて性質別に層に分けておき,各層から地域を抽出した後で,第 2 次抽出を行うのが層別 2 段抽出法 stratified two-stage sampling である。全国を対象とする標本調査では一般にこの方法が用いられている。 

3 非確率抽出法の種類

 確率抽出法にはいろいろな種類があったが,それらに共通する特徴は母集団のリストから等確率で無作為に抽出するということである。しかし,ホームレスの調査で母集団リストを期待しても無理であるように,社会福祉調査では確率抽出法を使えない調査対象が多い。要介護高齢者や障害者全員の名簿も存在しないであろう。要介護高齢者の日常生活と生活環境を詳しく知らなければ,どういった福祉サービスが必要かわからないから,確率抽出法が使えないからといって,調査をやめるわけにはいかないのである。このような場合の標本抽出法を非確率抽出法という。非確率抽出法には,確率抽出法の代用として標本の代表性確保をねらったクォータ法 quota sampling と,代表性にこだわらない有意抽出法 purposive sampling や便宜的抽出法 available sampling がある。 

(1) クォータ・サンプリング

 クォータ・サンプリングの日本語訳は比例割当法であるが,層別抽出法の比例割当と紛らわしいので英語のまま呼ぶことが多い。

 

(2) 有意抽出法

 

(3) 便宜的抽出法

4 コンピュータ分析の落とし穴

 パソコンの高機能化と普及が進むに連れて統計分析のソフトウェアが各種発売されるようになり,ちょっと練習するだけで,コンピュータによる分析が誰にでも簡単に行えるようになった。代表的なソフトウェアに SPSS SAS と呼ばれるものがあり,高度な統計分析を一瞬のうちに実行してくれる。実習室のパソコンにこれらのソフトウェアを搭載している大学が多くなった。極めて強力で便利なツールだが,落とし穴もある。

 これらのソフトウェアは,すべてのデータは無作為抽出法による標本であるとみなしているから,標準誤差や信頼区間などのような標本誤差関連の数値を自動的に計算してくれる。自分のデータが確率標本でもないのに,そうしたものを論文や報告書に書いてしまうことがある。コンピュータが計算したのだから間違いないだろう,という罪のない誤った思い込みもあるし,そうした数値をくっつけることで,自分の調査が科学的であるかのようにみせかけたいという誤った誘惑にまどわされないとも限らない。全数調査であれば,調査の進め方を誤っていない限り,誤差はないのであるからそのようなものに惑わされないようにしたい。非確率標本であれば,誤差は計算できないのだから,やはりそうした数値に惑わされてはいけない。代表標本でもないのに粉飾を施すのは科学への冒涜であり,自己の無知をさらけだすことでもある。くれぐれも注意したい。