« 『宇宙に外側はあるか』 | トップページ | 『関ヶ原』 »

2017.09.04

『数式を使わないデータマイニング入門』

Kindle Unlimitedにあった新書。例によって数年前の光文社新書です。

今回は、データマイニング。2006年発行の本だから、まだAIとかデータサイエンティスト云々が流行っていなかった頃だと思います。でも、簡潔に整理されて書かれているので、別に古びてはいないですね。流行に流されていない分、読みやすいと思います。

相関関係と因果関係は同じではないのですが、比較的混同されがち。最初のほうは、その辺をとっつきやすい話題で説明してくれます。このへん、わかっているつもりなんですが、実際に仕事の現場では間違ってしまいやすいんですよね。この手の文書を何度も読んで、トレーニングを繰り返すしかないようです。

で、本書はそこから具体的にデータマイニング手法を説明していきます。目次で言うと
落としどころを探る - 回帰分析
効率的に判断する - 決定木
分けることは分かること - クラスタ分析
複雑な分類 - 自己組織化マップ
買い物かごの中身は? - 連関規則
神経をまねしてみる - ニューラルネット

最後のほうのニューラルネットあたりは、かなり新しいですね。本書執筆時点ではAIブームは訪れてなかったでしょうが、データマイニングにおいて期待の技術だったということなのでしょう。AI技術がある程度枯れてきてこそ、本物のデータサイエンティストが登場しそうな気もします。

最後に、個人情報と監視社会に関する著者の考えが示されています。もうすっかり僕の行動なんかはGoogleやAmazonに補足されてしまっているのですが、この状況に11年前から警鐘を鳴らされていたんですね。

|

« 『宇宙に外側はあるか』 | トップページ | 『関ヶ原』 »

コメント

コメントを書く



(ウェブ上には掲載しません)




« 『宇宙に外側はあるか』 | トップページ | 『関ヶ原』 »