第2日目2時間目 標本調査法でわかること

1 全数調査と標本調査

 代表性  チャールズ・ブースやシーボーム・ラウントリーの貧困調査以前に貧困者の生活実態やその数に関する調査が行われていなかったわけではない。社会主義者ハインドマンは,ロンドンの人口の 25%が貧困者であるとする調査結果を発表していた。しかし,それらはロンドンのある特定地域の実態ということはできても,ロンドン全体の姿を表したものと言えるだけの根拠をもたなかった。これに対して,ブースやラウントリーの貧困調査はロンドン市民やヨーク市民全体を代表するデータであった。これが,彼らの貧困調査が科学的社会調査の始まりといわれる理由の一つである。社会調査が科学的であるための一つの条件は,その調査によって明らかにされた結果が,その調査によって究極に知りたい対象全体を代表し一般化できる性質を備えていることである。

 全数調査  調査結果に代表性を持たせる一つの方法は,調査の対象全体を悉く調べることである。こうした調査を全数調査または悉皆(しっかい)調査という。ブースは,各地区を担当する学務委員から世帯に関する情報を集めるという間接的な方法ではあったが,ロンドンの 420 万人の全住民を調べあげたのであり,ラウントリーの場合は調査員と共に自らも個別訪問を行って 4 5 千人のヨークの全住民を調べあげたのであった。まさに,彼らの調査は全数調査といえるもので,このためにその結果は代表性を持ち説得力があったのである。しかし彼らの調査にしても,英国全体を代表するものではなかった。全数調査の論理からいえば英国国民全部を調べあげねばならないが,国勢調査のように国家の力で莫大な費用をかけることなしには,とてもできることではないのである。

 標本調査  この隘路を抜け出す方法が標本調査である。調査によって究極に知りたい集団を構成する個体すべての集まりを母集団 population といい,そこから選びだした一部分が標本 sample である。1918 年にはボウリィ(Bowley, A. L.)が住民の一部を抽出して行う標本調査を実施し,英国全体の貧困率を推定しているが,1928 年にはフィッシャー(Fisher, R. A.)によって統計学における標本理論が確立され,標本調査の数学的基礎が形成された。標本は母集団の一部分であるからどうしも誤差がつきまとう。しかし,その誤差を計算して,母集団の比率や平均値などを一定の確率のもとで推定できるのであれば,代表性をもつと考えるのである。

 全数調査と標本調査の選択  調査の設計に当たって全数調査と標本調査のどちらを選択すべきかは,母集団の大きさと調査予算に依存する。予算的に実施可能な大きさの母集団であれば,標本抽出の手間も省けるし推計値の計算のような面倒なこともいらないので,全数調査を実施すればよいであろう。しかし,全国の高齢者とか,ある大都市に住んでいる身体障害者全員などというように調査対象の規模がきわめて大きい場合には,全数調査には次の欠点がある。@ 十分に訓練された調査員を大量に確保することが難しい。A 質問技術の必要な複雑な内容の調査を行うことが難しい。B 集計作業が膨大で時間を要するため,質問の数が少数に限られる。C 調査対象全員が説明なしに理解できる単純な内容の質問に限られる。標本調査では,全数調査のもつ上記の欠点が解消されるが,標本を無作為に抽出するためには母集団を構成する全員のリストが必要である。例えば,身体障害者全員の住所,氏名の記載されたリスト,あるいは,痴呆性高齢者全員のリストなどがなければ無作為抽出法を用いることはできず,後に述べる有意抽出法を用いるが,この場合には代表性が確保できないジレンマが生ずる。

 標本は母集団の小さな見本である。良い見本は,見かけは小さくても中身は本物と同じかよく似たものでなければならない。これを代表性のある標本という。標本理論でいう代表性は,選手宣誓を行う選手代表のように特徴のある代表者ではなく,小型ではあるが母集団によく似た平凡な集団であることを間違えないようにしたい。見栄えのよいものとか品質のよいものばかりを選ぶのはルール違反であるから,選び方が偏らないよう注意する。母集団から標本を抜き取ることを標本抽出 sampling という。英語のままサンプリングという場合が多い。サンプリングには,確率抽出法 probability sampling と非確率抽出法 non-probability sampling の2つがある。確率抽出法は,無作為抽出法 random sampling ともいうが,近年の文献では確率抽出法と呼ぶことが多い。母集団に含まれるどの個体も標本として抜き取られるチャンス(確率)が等しくなるように抽出するのがこの方法の根本原理である。一方,非確率抽出法は,有意抽出法 purposive sampling ともいう。このうち,標本の代表性を確保できるのは確率抽出法のみである。最初に標本調査の実例を紹介した後,確率抽出法の原理を本節で,サンプリングの方法を次節で解説する。

2 標本調査の実例

 最初に,母集団をうまく代表できた標本の実例を3つ紹介する。

(1) 投票予測

 投票予測は,標本調査の代表性を検討する好材料である。有権者全体から一部の標本を選び選挙直前に投票意向を調査し,これと投票結果を比較すれば,予測の当否がすぐに判明するからである。事実,標本調査は米国で大統領選挙の当落予測に用いられて発展した歴史がある。初めのころは,大きな標本を調査すれば代表性があると考えられ,1936 年の大統領選では,ついに 200 万人に葉書調査を実施したマスコミ機関 (『リテラリー・ダイジェスト』誌)も現れた。しかし,この雑誌の予測は見事に外れ,ルーズベルトの当選を予測することができなかった。その理由は,標本の選び方にあった。当時としては富裕階層に属する自動車所有者名簿や電話設置者名簿から選らんだので,労働者層が標本に含まれる割合が少なく,有権者全体を代表していなかったのである。

 1950 年代になると選び方を慎重に行えば母集団を代表できる方法,すなわち,確率理論を用いた無作為抽出法が広く用いられるようになった。今日では, 1,500 程度の標本からわずかな誤差で当選者を正確に予測する調査が各マスコミ機関によって行われている。共和党のブッシュと民主党のデュカキスが戦った 1988 の大統領選挙における各調査機関の予測と投票結果は 表 3-1 の通りである。実際の投票結果は,ブッシュが 54 %,デュカキスが 46 の得票でブッシュの勝利であったが,各世論調査とも 2 以内の誤差でブッシュの当選を予測している。

表 3-1 1988 年アメリカ大統領選挙の予想得票率と投票結果(%)

 

   調査機関

ブッシュ候補

デュカキス候補

ギャラップ世論調査所

56

44

NBC 放送・ワシントンポスト

55

45

CBS 放送・ニューヨークタイムズ

55

45

投票結果

54

46

CNN 放送・ロサンジルスタイムズ

54

46

NBC 放送・ウォールストリートジャーナル

53

47

ハリス世論調査所

53

47

出所) Rubin, A. & E. Babbie, (1993), Research Methods for
Social Work,
2nd Edition, P. 218 より引用

 

(2) 国勢調査の抽出集計速報

 わが国の国勢調査は1億2千万人という極めて膨大な人口の調査であるため集計に大変な時間がかかる。そこで,迅速に結果を知るために 100 分の1 の世帯を無作為に抽出して速報値を発表している。この速報値をやがて発表される確定値と比較することによって,標本の代表性を検討することができる。1995 年の国勢調査の 1 %抽出集計と全数集計結果のうち,人口の性別および年齢3階級分布を比較すると 表 3ー2 の通りである。抽出速報と全数集計を左右見比べてみると,大きな誤差でも 0.1 %ないし0.3 %でしかない。1億2千万人全員を調べる意味がどこにあるのかわからないほど,両者は一致している。

表 3-2 国勢調査の 1 %抽出速報と全数集計結果の比較(1995 年,単位%)

 

項目

1%抽出速報

全数集計

性別     男

48.9

49.0

       女

51.1

51.0

年齢階級  0-15

15.9

15.9

     15-64

69.2

69.4

     65 歳以上

14.8

14.5

    出所)『平成 7 年国勢調査抽出速報』および『平成 7 年国勢調査報告』
       第2巻全国編
(総務庁統計局)
    備考) 年齢階級分布は年齢不詳があるため,合計が100にならない。

(3) 地域高齢者調査

 次に,通常の標本調査の事例を紹介する。筆者らは,1989 12 月に東京都保谷市在住の 65 歳以上男女 9,000 から5分の1の 1,800 を無作為に抽出して標本調査を実施した。有効回収票は 80.0 1500 であった。若干の時間のズレはあるが,翌年 10 に行われた国勢調査を母集団とみなして標本調査の結果と比較したのが 表 3-3 である。

3-3 保谷市市高齢者標本調査と国勢調査の比較(65 歳以上, 1990 )

 

項目

保谷市高齢者

標本調査

国勢調査

保谷市分

性別     男

 

 

       女

 

 

 

 

 

     

 

 

     

 

 

    出所) 『平成2年国勢調査報告・東京都編』(総務庁統計局)