統計検定準1級に合格したので勉強法など公開します

日本統計学会公式認定　統計検定準1級対応　統計学実践ワークブック

この過去問には当然しっかりと取り組む必要がありますが、この過去問だけだと問題を暗記してしまい、いわゆる過学習してしまいます。

過学習は問題（データ）の量を増やすと改善されるので、過学習を防ぐためにワークブック（下のリンク）の問題も例題を含めてやり込む必要があります。

posted with ヨメレバ

日本統計学会学術図書出版社 2020年05月29日頃

ワークブックの8割くらいの問題を自力で解けるようにしておかないと合格は厳しいかもしれません。

理解を深めるために

先程理解が重要だと書きましたが、理解を深めるために勉強後半で過去問の論述問題にも挑戦すると良いでしょう。

完全に解ける必要はありませんが、論述問題に取り組むとワークブックに書いてある内容の理解が進む気が個人的にはしました。

ワークブックの論述問題に関連する章を熟読しながら論述問題に取り組むと良いでしょう。

また論述問題にも取り組むことで、過学習も抑えられます。

ワークブックを重視すべき

過去問を難易度が高すぎる2021年と論述問題を除いて95%程度完成させることは前提で、それプラス、ワークブックに過去問以上に取り組む必要があると思います。（2021年の問題も取り組んだほうが良い）

これを言う理由は察してください。（ワークブックの内容が試験に・・・）

マーカーを引くのは意味が無いという有名人もいますが、個人的にはマーカー推奨です。

どの分野のページをどれくらいやり込んだのか一目瞭然になるし、逆にどの分野のページが手薄なのかも見れば分かるようになります。

気休めだと言われますが、気が休まるなら良いのでは。

何度も読み返すうちに、なんとなく読み飛ばしていた条件が実は重要だったなんてこともあり、そういうところは気付いたときにマーカーを引きます。

マーカーは重要度順に赤・黃・青だけ使っていますが、2度目に統計検定準1級に受験した際に出題された知識や問題にはオレンジのマーカーを臨時で引きました。

マーカー不要論については、おそらく根拠になっている論文の実験デザインが良くないと思っています。

具体的な知識編

共分散と相関係数の公式など、基本的な公式は覚えて即座に思い出せるようにしておく必要があります。

$$
Cov(X, Y) = E(XY) – E(X)E(Y) \\
\rho(X, Y) = \frac{Cov(X, Y)}{\sqrt{V(X)V(Y)}}
$$

基本的な公式については息をするように式変形できることが、試験にも重要ですし、勉強段階でも基本的な式変形ができることが勉強スピードを上げるのに繋がります。

いくつか重要な公式を上げます。

$$
V(X) = E(X^2) – E(X)^2
$$

この公式はとても重要です。一瞬で思い出せる必要があります。覚え方としては「分散は二乗の平均引く平均の二乗」と呪文のように覚えましょう。

分散と共分散の関係について

$$
V(X \pm Y) = V(X) + V(Y) \pm 2Cov(X, Y) \\
V(X + Y + Z) = V(X) + V(Y) + V(Z) + 2Cov(X, Y) + 2Cov(X, Z) + 2Cov(Y, Z)
$$

共分散について

$$
Cov(aX, Y) = aCov(X, Y)
$$

↑これは、共分散は定数を外に出せるとおぼえましょう。

$$
Cov(X + a, Y + b) = Cov(X, Y)
$$

↑これは、共分散については分散と同様に定数を無視できるとおぼえましょう。

$$
Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z) \\
Cov(X + Y, Z + W) = Cov(X, Z) + Cov(X, W) + Cov(Y, Z) + Cov(Y, W)
$$

↑これは、共分散は分配法則のような演算ができると覚えましょう。

以下のような式も逐次的に考えて処理できるようにしましょう。

$$
\begin{eqnarray}
V(aX + bY) &=& V(aX) + V(bY) + 2Cov(aX, bY) \\
&=& a^2 V(X) + b^2 V(Y) + 2abCov(X, Y)
\end{eqnarray}
$$

独立に注意

確率変数が独立である、という条件に注意しましょう。

いくつかの数式がとても簡単になります。例えば

$$
V(X \pm Y) = V(X) + V(Y)
$$

これは前節で紹介した分散の式の$ Cov(X, Y) $がXとYが独立だと0になることから導けます。

また、先程最初に紹介した以下の式から

$$
Cov(X, Y) = E(XY) – E(X)E(Y) \\
E(XY) = E(X)E(Y) + Cov(X, Y) \\
E(XY) = E(X)E(Y)
$$

確率変数XとYが独立だと積の期待値E(XY)がE(X)E(Y)に単純に分解できるということです。
逆に独立でない場合、共分散が関わってくるため単純に分解できないことに注意しましょう。
この知識は意外にも重要です。

勉強方法編

ワークブックは1つの章に1冊の本の内容を凝縮したような書き方をされているので、ワークブック単体ではかなり理解が難しいです。

そこで、主な章ごとに分かりやすい書籍を紹介していきます。

それらの書籍に迂回して最終的にワークブックに戻る方が、急がば回れで速いです。

多変量解析（回帰分析・主成分分析・因子分析・判別分析）

まず2冊紹介します。

多変量解析がわかる

posted with ヨメレバ

涌井良幸/涌井貞美技術評論社 2011年05月

posted with ヨメレバ

石井俊全ベレ出版 2014年06月20日頃

「多変量解析がわかる (ファーストブック)」という本と、「まずはこの一冊から意味がわかる多変量解析」という本です。

どちらも回帰分析・主成分分析・因子分析・判別分析について詳しく解説されています。

慣れるまでは難しいかもしれませんが、ワークブックよりは遥かに分かりやすいと思います。ワークブックはこれらのわき道の本を読んだ後、最終的な知識の整理のために読むと良いでしょう。

回帰分析と因子分析については以下のマンガでわかるシリーズもおすすめです。

マンガでわかる統計学（回帰分析編）

posted with ヨメレバ

高橋信/トレンド・プロオーム社 2005年09月25日頃

posted with ヨメレバ

高橋信/井上いろはオーム社 2006年10月

マンガで読みやすいですが、後半に行くに連れて結構本格的になってくるので少し気合を入れて読む必要があります。良い意味で雰囲気だけの説明になっていない。数式も結構出ます。

マンガでわかるシリーズは回帰分析や因子分析について、何も知識が無い状態から大まかに手法の全体像を把握するのに適していると思います。あーだいたいこういう手法なんだなー、という理解に手早く到達でき、後半は本格的な解説もあります。

時系列解析

頻出分野なので対策をしておくと良いでしょう。

おすすめの本は「経済・ファイナンスデータの計量時系列分析」という本です。
時系列分析の入門書として有名らしく「沖本本」という通称がついているそうです。

経済・ファイナンスデータの計量時系列分析

posted with ヨメレバ

沖本竜義朝倉書店 2010年02月01日頃

前の方から1/4か1/3程度読めば、統計検定準1級に必要な知識は身につくと思います。

時系列解析について少し語らせてもらうと、間違っていたらコメントで指摘していただきたいのですが、自己共分散・自己相関係数がかなり重要だということを理解すると良いと思います。

統計検定準1級では自己回帰過程・移動平均過程など、いくつかの確率過程が出てきますが、それら種類がある理由は目的の自己相関の形（コレログラムの形）を実現するために色々な確率過程があるということを理解することです。

もっと詳しく説明するとラグ1、つまり1つ前の値とだけ自己相関が高い確率過程を実現したいなら1次の移動平均過程を用いれば良いですし、2つ前や3つ前、それ以前とも減衰する自己相関を持つ確率過程を考えたいのなら自己回帰過程を用いるという感じです。

移動平均過程が次数より大きなラグで自己相関を持たないことは、沖本本を良く読めば当たり前に感じるはずです。

自己相関と偏自己相関から確率過程の次数を考える問題は頻出ですが、このあたりについて当たり前となるまで理解すると合格確率はグンと上がると思います。

ベイズ法

これまた頻出です。

他にも本はありますが、多くても迷うかもしれないので、特におすすめの2冊を紹介します。

マンガでわかるベイズ統計学

posted with ヨメレバ

高橋　信/上地優歩/ウェルテ株式会社オーム社 2017年11月25日頃

posted with ヨメレバ

涌井良幸日本実業出版社 2009年11月