バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

『女子高生乱子によるベイズ統計学入門講座』を読みました(恵贈お礼)

前書き

 縁あって著者の方々より、共立出版さんの『自然科学研究のためのR入門 - 再現可能なレポート執筆実践』と『女子高生乱子によるベイズ統計学入門講座』(「とある弁当屋の統計技師」の第3巻)の2冊をご恵贈いただきました。
 この場を借りて改めて感謝いたします。ありがとうございます。

 f:id:yamano357:20190315001605j:plain


 一緒にいただきました『自然科学研究のためのR入門 - 再現可能なレポート執筆実践』はコードを実行しながら読ませていただこうと、『女子高生乱子によるベイズ統計学入門講座』から手に取りましたが。
 女子高生乱子さんがわかりやすくベイズ統計を解説してくれるだけでなく、全体を通して切れ味の鋭い地の文とセリフでも読者を楽しませてくれます。特に1章で出てくる「学振と博士」や「相関と疑似相関」の話、「データ分析のわからない教授」に「標本と昆虫採集、母集団」の例え、そしてExcel整形とExcel方眼紙などなど。実際にデータ分析に携わる方々に「刺さり」すぎて、ここだけを読み終えるまでに死んでしまうのではないかと何度も心配になりました。

 本書は美麗なイラストや前述の文章表現が気になってしまいそうですが、もちろんベイズ統計もしっかりと解説しています。できるだけ数式を避けた説明と例題に前述した面白さが相まって、高校や大学1-2年生の学生から社会人までの幅広い層が統計学やデータ分析に興味を持ち、そこからベイズ統計の門を叩く入門に最適ではないでしょうか。

内容と感想

 具体的な内容は次の流れで進んでいきます。

 1から2章までは本書で解決する課題の背景と、その手立てとして提示するベイズ統計に興味を抱かせる内容になっており。
 3章で黒髪乱子さんが満を辞して登場して、ベイズ定理の基本を説明してくれます。そこから7章まではケーススタディで、例題を用いて事後確率の計算を学びます。
 また、8章は小休憩のようにベイズに関する話は出てきませんが、形態素解析結果が図で登場します。小説では初めてではないでしょうか。
 なお、本書の内容と関係ありませんが、8章末にある乱子さんの挿絵はあざとくていいですね。

 閑話休題

 9章からは確率分布と尤度の話となり、10章では7章の例(『ヤル男』度)で事後分布の計算をします。
 このあたりから乱子先生の独壇場になり始め、続く11章では10章と同じ例題で事後確率算出を解説。さらには「共役事前分布」や「混合モデル」、マルコフ連鎖モンテカルロ(MCMC)にも少し触れます。
 11章末からストーリーは佳境となり、著者推定を先行例に取り上げて分散分析した結果とp値を12章にて出しますが、これではダメだとMCMCを用いた階層モデルによる分析結果を13章で提示。
 そして、オチとなる14章の後日談に着地します。

 これだけの内容をストーリー仕立てで語るには1冊ではあまりにも短すぎではないかと後半の11章以降からの難易度上昇と駆け足になった印象から受けましたが、全体を通して丁寧に説明しています。
 イラストと例題でベイズ統計を解説する書籍には『図解・ベイズ統計「超」入門』がありますが、こちらは本書における10章までに相当するような内容です。事後確率の計算をもっと例題と会話で学びたい人は合わせて読むと良いかもしれませんが、p値による検定ではなくてベイズをなぜ使うかという点は強調していません。ベイズ流の考え方を感じたいなら、ぜひとも本書を最後まで読みましょう。
 また、終盤のシミュレーション結果を出す部分を実際にどんな風にやるか、イメージしにくい人も少なくないかと思います。そんな方はExcelMCMCする『道具としてのベイズ統計』という書籍もありますが、本書でも推薦しているWonderful Rシリーズの『StanとRでベイズ統計モデリング』(通称アヒル本)がオススメです。本書とともにいただいた『自然科学研究のためのR入門 - 再現可能なレポート執筆実践』も同じWonderful Rシリーズで、本シリーズの続刊が期待されますね。
 もちろん本書の続編として、ベイズ統計実践や機械学習などに関する作品が出るのも心待ちしております。
 それにしても、RでMCMCする女子高校生、想像すると萌えですね。

 最後になりますが、著書をお送りいただいた先生方と出版社の方々に再度感謝いたします。


参考


その他

 読んでいて誤字や表現違いと感じた文などがありましたので、まとめておきます。  

 P27 「取り替えられてえいる」 -> 「取り替えられている」
 P31 「嫌がらせを送ってくる」 -> 「嫌がらせをする」 or 「嫌がらせメールを送ってくる」
 P178 「Rで学ぶベイズ統計学」 -> 「Rで学ぶベイズ統計学入門」