私は、Kaggleのコンペでスコアが上がらなくなってきたら、他の人のカーネルを見ます。
その結果、「最適化」「微分」「ベイズ」などの見慣れない言葉が出てきて、さらにわからなくなります。
そもそも、どのような考えで特徴量を作れば良いのか、わかっていなかったりします。
一度、思考の整理したい。
そんなときに出会ったのが、江崎貴裕さん著書「データ分析のための数理モデル入門」という本です。
データーサイエンス初心者、kaggleでスコアが伸び悩んだときに読むと良いかもしれません。
「データ分析のための数理モデル入門」の概要
著者:
東京大学先端科学技術研究センター
江崎貴裕
アマゾンレビュー:
5点満点中4.3という高得点
この本は、機械学習を始めデータ分析に必要な知識を網羅的に解説してくれています。本の内容のほとんどが図解で読みやすいといえます。
たとえば、以下のような内容です(ほんの一部です)。
- 線型モデル
- 微分方程式モデル
- 確率論
- マルコフ課程
- 待ち行列理論
- 正規分布
- 時系列モデル
- 分類問題
- 回帰問題
- ニューラルネットワーク
- 次元削除
- ディープラーニング
- 強化学習
- モデルの最適化
「データ分析のための数理モデル入門」を選んだ理由
私が「データ分析のための数理モデル入門」を選んだ理由は、ざっくり以下の通りです。
- Kaggleで得点が伸び悩んだ
- 「最適化」「微分」「そもそもなんで行列が出てくるの?」わかっているようでわかっていないところを整理したい
- Twitterで評判だった
どんな人にオススメ?
本の内容は大変わかりやすく、網羅的にかいてある印象です。
こんな人にオススメです
- kaggleでスコアが伸びや悩んだときに読む
- データーサイエンス初心者でどこから手をつけたら良いかわからない
- AIを学べるプログラミングスクールにいく前に前知識として学習しておきたい
AI系のスクールについては、以下の通り。
合わせて読みたい!
https://programming-info.dream-target.jp/aijobcolle-study
感想
本を読んだ感想を網羅します。
- わかりやすい!
- 図解がたくさんあってわかりやすい
- 一般事例を使ってわかりやすく解説している
- 大事なところは黄色い線で補足している
- 微分の意味がアヤフヤだったが、「変化量」というキーワードで納得
- 機械学習のロジックは、概要がわかる程度
- ロジックについて深掘りしたいときは、機械学習専門の本を読むと良い
- 基礎的な統計学の知識を整理できた
- 正規分布、回帰分析など、よくわからないときに読むと整理できる
- 正規分布、標準偏差、分散についても整理できた
- kaggleでスコアが上がらないときに参考になった
- 無駄な特徴量はモデルに含まない(当たり前の話しだが再確認できた)
- 最適化問題のところがスコアアップの役に立つ
- 本のヒントをKaggleに反映させたら、スコアアップした。
- 最初から読む必要は無い
- 本の構成としては、最初から読む必要は無い。知りたいところから読めば良いので時間短縮になる
まとめ
「データ分析のための数理モデル入門」は、データサイエンスの観点からオススメといえます。もし気になったら、手に取ってみてはいかがでしょうか?