ディープラーニングのための数学を本格的に勉強できる本や動画

ディープラーニング数学 ディープラーニング

この記事の目指すレベル・対象読者

まず、この記事の目指すレベルを提示します。

  • 最新のAI(主にディープラーニング)論文を読めるようになる
  • 最新のAI(主にディープラーニング)論文に基づいて実装(プログラミング)できるようになる
  • ディープラーニングについて、イメージの理解だけではなく、数式による理解ができるようになる
  • ディープラーニングについて、自分のタスクを解決するための実装(プログラミング)をできるようになる

このようなちょっと難しい内容を目指すので、手軽にディープラーニング関連の数学を理解したい方向けではありません。
上のリストのような能力を、それなりの学習コストを払って習得したい方向けのロードマップ記事となっております。

基本方針

この記事や関連記事で、プログラミングスクールやオンラインスクールの紹介はしません。

その主な理由は、私自身がプログラミングスクールなどに入ったことがないからです。
よく知らないものの紹介をしたくないからです。

代わりに「本」の紹介をバンバンしていくつもりです。
勉強が効率的に進み、挫折しづらい「本のロードマップ」を示します。

「本」だけではなく、参考になるYouTube動画などの資料を適切なタイミングで示します。

この記事および関連記事で可能な限り「挫折ポイント」を解消するつもりです。

これは、おそらくですが、紹介する本を全て買ったとしても、スクールの学費に遠く及ばないでしょう。

では、色々と勉強しなければならないことはありますが、1つずつ解説していきます。

行列・線形代数

行列の知識、さらには大学で勉強する線形代数の知識が必要です。

ディープラーニングのほとんどの計算が行列計算であること、またディープラーニングの枠を超えて機械学習について学びたくなった時にも、行列・線形代数の知識は必須になってきます。

大学の線形代数に行列の内容は含まれているので、線形代数を勉強すれば良いでしょう。

線形代数の勉強ロードマップは次のようになります。

線形代数ロードマップ①

まず、ベースとする本は「マセマ 線形代数」がオススメです。
「マセマ 線形代数」に対応した演習書の「マセマ 演習 線形代数」という本もあるので、併用すると効果が高いでしょう。
「マセマ 線形代数」単体にも演習問題は付いているので、不足に感じたら演習書も揃えると良いでしょう。

挫折ポイント解説

マセマをオススメしましたが、マセマはちょっと背伸びした目標設定になっているかもしれません。

マセマで問題無く進めていける方は良いのですが、そうではない方、難しいと感じる方がおられると思います。
そのような方には、下の本をマセマを読み進める前に読むと良いかもしれません。

マンガでわかる線形代数」という本です。

マンガで数学を解説した本には当たり外れがあるのですが、この本は個人的に当たりだと思います。
大雑把に線形代数の全体像を捉えることができ、全体像を捉えることができると線形代数のハードルがかなり下がります。

線形代数ロードマップ②

「マセマ 線形代数」を中心に読み進め、勉強に詰まったら次のYouTube再生リストの動画が参考になるかもしれません。
※下の3つとも、動画単体ではなく再生リストへのリンクとなっています。

ディープラーニングを理解することを目標にした場合、線形代数の中にも重視すべき項目、そうじゃない項目があるので、それについて解説します。

まず、「行列式」については、そこまで深く理解する必要はないです。2次と3次の行列について、行列式の値を求められるくらいで良いでしょう。
「ジョルダン標準形」についても、理解していなくても問題はありません。

逆に、「行列」の基本的な計算の仕方は身に付けておく必要があります。
「行列の対角化」もかなり重要事項です。

線形代数については、「マセマ 線形代数」に書かれている内容を80%程度理解すれば、とりあえずのところはディープラーニングの勉強で困ることは、ほぼ無くなります。

挫折ポイント解説

ディープラーニングの勉強をしていると、ベクトルや行列による微分が頻繁に現れますが、それらは線形代数の教科書では滅多に説明されていません。機械学習の本の巻末の付録に定義が載っているくらいです。

このベクトルや行列による微分は、ほとんどの本でまともに解説されていない割に頻出なので、下の解説記事が少し参考になるでしょう。

微分積分

ここからは微分積分のロードマップを示します。

まず、なぜ微分積分を学ぶのかについてですが、ディープラーニングについて言えば、ディープラーニングそのものが、ほとんど微分の技術だからです。
ゆえに、微分を理解せずにディープラーニングを理解するのは不可能です。

補足:では積分はそこまで必要ではないかと言うと、そうでもありません。ディープラーニングを突き詰めていくと統計を学ぶ必要があるのですが、統計は積分がかなり重要になってくるからです。)

微分積分ロードマップ①

ここから高校の数学Ⅲの微分積分を前提にしたいのですが、文系の方など勉強していない方のためにオススメの本を1冊紹介しておきます。「坂田アキラの 数IIIの微分積分が面白いほどわかる本 (坂田アキラの理系シリーズ)」という本です。

以降、数学Ⅲの微分積分は前提にして、大学レベルの微分積分の話をしていきます。

まず、ベースとする本は線形代数と同様にマセマの「マセマ 微分積分」がオススメです。
これも、対応する演習書の「マセマ 演習 微分積分」があります。
「マセマ 微分積分」の演習だけでは足りないと思ったら演習書を購入すると良いでしょう。

要注意挫折ポイント解説

基本的に「マセマ 微分積分」を中心に読み進めていけば良いのですが、初っ端から要注意の挫折ポイントがあります。

それは「ε – N論法」と「ε – δ論法」です。
この2つは初見では理解するのが非常に難しく、多くの大学生が挫折してしまう有名挫折ポイントなのですが、ディープラーニングを理解するという点において「ε – N論法」と「ε – δ論法」を理解する必要はあまりありません。

一度は目を通して理解に挑戦するのも必要ですが、理解できなかったら放っておいて大丈夫です。
もちろん、大学の試験で出題され、大学の試験対策をしなければならないのなら話は別です。

微分積分ロードマップ②

話をロードマップに戻します。

こちらも線形代数と同様に有用なYouTube動画・再生リストがあるので紹介します。
※下の2つとも、動画単体ではなく再生リストへのリンクとなっています。

ディープラーニングを勉強する上で、微分積分の重視すべき項目、そうじゃない項目について解説します。

まず、先ほども言いましたが「ε – N論法」と「ε – δ論法」は重要ではないです。
マセマでは結構ページが割かれている「ロピタルの定理」もあまり重要ではありません。

逆に「テイラー展開」「マクローリン展開」は応用範囲も広く重要です。
2変数関数の微分・重積分ともにかなり重要です。

挫折ポイント解説

「2変数関数の微分・重積分ともにかなり重要」と言いましたが、関数の入力変数の数が、高校までの1つから2個以上になる大きな発想の飛躍について、個人的にマセマだけでは理解が及ばなかったので、参考になった本を紹介しておきます。

キーポイント 多変数の微分積分: キーポイント 多変数の微分積分 (理工系数学のキーポイント 7)」という本です。

いきなり多変数になって意味がどうしても分からなかったら参考にしてみて下さい。

微分積分については、「マセマ 微分積分」に書かれている内容の内、先ほど紹介した重視すべき項目をしっかり理解していれば大丈夫だと思います。

確率・統計

ここからは確率・統計のロードマップを示します。

確率・統計はディープラーニングを理解するためにも必要ですが、それ以上に論文に書かれている数式を理解するために必須であると判断したため、ここでロードマップを示します。

今の高校生は、確率・統計を勉強しているようです。そのような方は、適宜自分に不要だと思った手順をスキップして下さい。

確率・統計ロードマップ①

まず、確率・統計初心者が最初に読むべき本は「マンガでわかる統計学入門」という本です。

※この手順は、読者のレベルに応じてスキップ可能です。次のマセマから読み始めて、難しかったらマンガに戻ることも可能です。

マンガで数学を解説した本には当たり外れがあると先ほども言いましたが、この本も当たりだと思います。

マンガなので読みやすく、短い時間で統計学の全体像を捉えることができると思います。

この本で、まずは7、8割の理解を目指すと良いでしょう。

確率・統計ロードマップ②

次に読むべき本は「マセマ 確率統計」です。
これも、対応する演習書の「マセマ 演習 確率統計」があります。
必要に応じて演習書の購入を検討して下さい。

動画も紹介しておきます。

※下の2つはチャンネルへのリンクと、再生リストへのリンクです。

まとめ

ここまでの内容を真面目に取り組めば、最初に提示した「この記事の目指すレベル」のリストについて、数学面での障壁はかなり取り除けたと思います。

最新の論文を読むためには、さらに「英語」を勉強したりする必要がありますが、数学面での障壁を取り除けていることは、大きなメリットです。

コメント

タイトルとURLをコピーしました