平均とか標準偏差を計算する 

 さあ,ここからやっと分析らしくなってきます。

 まず,各項目の平均値や標準偏差,最大値,最小値などを計算してみましょう。(ただし,計算しても意味のないものもあります。全て数値データとして入力してあるので,sexの得点(?)の平均値も計算することができます。このような平均値に,どれほどの意味があるのかわかりますよね)?

 以下の手順でダイアログボックスを開きます。

 分析
  → 記述統計
   → 記述統計

 そうすると,「記述統計」ダイアログボックスが出てきます。左には変数のリストが,真ん中右側あたりに何も入っていない「変数」という名前のボックスがありますね。そこで例えば,年齢(変数名は「年齢」)の平均値などを求めたいとすれば,「年齢」を選択し,中央の矢印ボタンをクリックします。そうすれば,年齢が「変数」のボックスに移ってきます。この状態で「OK」をクリックすれば,SPSSは計算をはじめ,結果をSPSSビューアに表示してきます。サンプルデータを使って計算すると,以下のようになります。出力は日本語なので,解説するまでもないでしょう。

記述統計量

度数
最小値
最大値
平均値
標準偏差

年齢

199

18

24

19.65

1.15

有効なケースの数 (リストごと)

199

 また複数の変数について,一度に計算させることもできます。左側のリストから計算したい変数を同時に「変数」ボックスに移して計算すればよいだけの話です。

 さらに「記述統計」ダイアログボックスで「変数」を選択し,右にある「オプション」ボタンをクリックすると,計算させる統計量を制御することができます。「表示順」「平均値による昇順」「平均値による降順」などは,結構便利なオプションではないでしょうか。サンプルデータのa1からa5を使い,「平均値による昇順」オプションをチェックして計算した結果が以下のものです。(なお,変数名の大文字小文字は区別しないので,「名前」では小文字になっていても,出力結果は大文字で出てきます)

記述統計量

度数
最小値
最大値
平均値
標準偏差

A5

200

1

4

2.17

.92

A3

200

1

4

2.19

.79

A4

199

1

4

2.48

.76

A1

200

1

4

2.57

.77

A2

200

1

4

2.76

.80

有効なケースの数 (リストごと)

199

 なお,「有効なケースの数 (リストごと)」というのは,計算に利用した全ての変数に対して欠損値を持たないケース数です。

■グループごとに平均値などを計算する

 以下の手順でダイアログボックスを開きます。

  分析
   → 平均の比較
    → グループの平均

 このダイアログボックスでは,平均を求める変数を「従属変数」のところへ,グループを分ける変数をその下にある「独立変数」のところへ矢印ボタンで移動させます。つまり,a1の平均値を性別に計算したければ,a1を「従属変数」へ,性別の変数を「独立変数」へ移動させるということです。これで,性別にa1の平均値などを算出してくれます。

 さらに,性別だけでなく学年別も加えて算出したい場合(つまり,1年生男子,1年生女子,2年生男子…などと分けたい場合)は,例えば,まず学年の変数を「独立変数」へ移動させます。すると,その枠の右上にある「次」というボタンがアクティブになります。この「次」をクリックすると,「独立変数」枠が新しくなります。そして「独立変数」を囲んでいた枠の「層1対象1」「層2対象2」になったことが確認できるでしょう。ここで新しくなった「独立変数」に性別の変数を移動させてやります。これで「OK」をクリックすれば,それぞれのグループ別に平均値などを計算してくれます。

 ちなみに,デフォルトでは平均値,標準偏差,ケースの数だけを計算するのですが,「オプション」を使えば,最小値や最大値も計算させることができます。

■ちょっとした発展

 「記述統計」ダイアログボックス内にある,「標準化された値を変数として保存」をチェックすると,標準化された得点(Z得点)を計算し,保存してくれます。これを実行した後に,「データエディタ」「変数ビュー」を見ると,変数名の前にZを付けた名前(例えばa1ならばZa1)で新しい変数が保存されているのがわかります。

***********シンタックス

「記述統計」のコマンドとしては,DESCRIPTIVES が使われています。使い方は以下のような感じです。

DESCRIPTIVES_VARIABLES=変数名_/STATISTICS=求める統計指標.

となります。半角アケの部分が見えにくいので,_(アンダーバー)にしてあります。/STATISTICS=以下の部分は続けて書いても構わないのですが,見やすくするために行替えをすることが多いです。続いているので,ピリオドは最後だけです。

●「a2」の平均値,標準偏差,最小値,最大値を求める。

DESCRIPTIVES VARIABLES=a2
 /STATISTICS=MEAN STDDEV MIN MAX.

●「a1」「a8」「a9」平均値,標準偏差を求める。

DESCRIPTIVES VARIABLES=a1 a8 a9
 /STATISTICS=MEAN STDDEV.

●「a1」から「a5」の平均値,標準偏差,最小値,最大値を求め,それを平均値の昇順に並び替える。

DESCRIPTIVES VARIABLES=a1 to a5
 /STATISTICS=MEAN STDDEV MIN MAX
 /SORT=MEAN (A).

●「a2」の平均値,標準偏差,最小値,最大値を求め,標準得点を保存する。

DESCRIPTIVES VARIABLES=a2
 /SAVE
 /STATISTICS=MEAN STDDEV MIN MAX.

「グループの平均」を使った場合は,シンタックスではMEANS使われます。

MEANS_TABLES=平均を求める変数_BY_グループを分ける変数_/CELLS_求める統計指標.

半角アケの部分が見えにくいので,_(アンダーバー)にしてあります。

●「a2」の性別(変数名は「sex」)の平均値,人数,標準偏差を求める。

MEANS TABLES=a2 BY sex
 /CELLS MEAN COUNT STDDEV.

●「a2」について,性別に学年別(変数は「grade」)も加えて平均値,人数,標準偏差,最小値,最大値を求める場合(つまり,1年生男子,1年生女子,2年生男子…などと分けたい場合)。

MEANS TABLES=a2 BY grade BY sex
 /CELLS MEAN COUNT STDDEV MIN MAX.