バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

『女子高生乱子によるベイズ統計学入門講座』を読みました(恵贈お礼)

前書き 縁あって著者の方々より、共立出版さんの『自然科学研究のためのR入門 - 再現可能なレポート執筆実践』と『女子高生乱子によるベイズ統計学入門講座』(「とある弁当屋の統計技師」の第3巻)の2冊をご恵贈いただきました。 この場を借りて改めて感謝…

失われたtidyを求めて

はじめに この記事は「tidyポエム Advent Calendar 2017」の7日目の記事です(ほんとうにポエムです)。 adventar.org

『グラフをつくる前に読む本』を読みました(恵贈お礼)

前書き ビジネスデータ分析では特にそうなのですが、分析して終わりではなく、分析してからが始まりです。良い結果にしろ悪い結果にしろ、再現性はあるのか、偶然なのか、何を変えれば良い結果につながるのか、そうした検討事項を次の施策で検証するという作…

広がる宇宙の話

R

概要 この記事はR Advent Calendar 2016の14日目の記事です。Rで言語処理する話ばかりしているので、今年は宇宙の話をします。 急速に広がる宇宙。R界の「宇宙」といえば、tidyverseですね。ということで、CRAN巡りまたはRパッケージ探しが趣味である自分がt…

Japan.R 2015にてLT発表しました

概要 記事を書くのが遅くなりましたが、12月5日に開催されたJapan.RのLTセッションにて、『Rと形態素解析』というタイトルで形態素解析の説明と、Rで形態素解析ならびにわかち書きする方法を紹介しました。総ページ数80オーバーでしたが、なんとか無事に終え…

"An R package for creating and exploring word2vec and other vector models"を試す(+ GloVeと比較)

前書き Rでword2vecが適用できるという{wordVectors}がGitHub上に公開されたので、早速試してみました(+「言語処理100本ノックの課題でGloVeによる結果と比較」)。 オリジナルのword2vecのC実装を.C()でラップした{tmcn.word2vec}を修正したもので、モデ…

Rによる言語処理100本ノック後半まとめと全体での総括

はじめに Rによる言語処理100本ノック(2015版)を最後まで終えることができたので、後半のまとめ記事と全体総括を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第6章:英語テキストの処理 第7章:データベース 第8章:…

第51回R勉強会@東京(TokyoR)にてLT発表しました

概要 10月10日に開催されたTokyoRのLTセッションにて、『Rでいろんな言語』というタイトルでRからPythonを呼ぶパッケージ{PythonInR}を紹介しました。発表の途中でスクリーンが砂嵐になるというトラブルに見舞われましたが、なんとか無事に時間内に収めるこ…

第4回「NLP勉強会」を開催しました #NLPStudy

はじめに 去る9月23日(水)に株式会社ドワンゴ様歌舞伎座タワー本社にて、第4回言語処理勉強会(ハッシュタグ「#NLPStudy」)を開催しました。 会場提供ならびにご案内をしていただいたドワンゴ様、まことにありがとうございます。 また、発表者の皆様、ボ…

"ranger: A Fast Implementation of Random Forests"のメモ書き

前書き とあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。 パッケージ自体は下記リンクをご…

第50回R勉強会@東京(TokyoR)にてLT発表しました

祝50回 50回という節目を迎えるTokyoRのLTセッションにて、『Rによる言語処理(N/100)本ノック』というタイトルで言語処理100本ノック(2015年版)をRで解く話を紹介しました。 本発表スライドでは、RPubsに上げた回答記事*1を一部抜粋して説明していますが、…

Rによる言語処理100本ノック前半まとめ

はじめに Rによる言語処理100本ノック(2015版)が折り返したので、まとめ記事を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第1章:準備運動 第2章:UNIXコマンドの基礎 第3章:正規表現 第4章:形態素解析 第5章:構文…

第49回R勉強会@東京(TokyoR)にて発表しました

TokyoRの応用セッションにて、Rでいい感じに文字列処理をする{stringr}と{stringi}のパッケージについて、baseの文字列処理と比較して紹介しました。タイトルの「☆」は@kohske先生へのオマージュです。 本発表スライドは、RPubsに上げたメモ*1を発表用にまと…

Rに関わりそうなチートシートまとめ(随時更新)

チートシートやリファレンスのまとめ Rの基本的な操作に関するあれこれ チートシートやリファレンス R Cheat Sheet (PDF) (ADD: 2017.03.11) R Reference Card (PDF) R Reference Card 2.0 (PDF) The Ultimate R Cheat Sheet – Data Management (Version 4) …

ブログ、初めました

やるやる詐欺になっていたブログを書き始めます。 R言語や言語処理に関する個人的なメモを書き連ねていきます。 今まではRPubsやSpeaker Deckにいろいろと公開していましたが、 RPubsには仕上げたコードと実行結果を載せ、奮闘した記録はこちらに記述します…