バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

R

広がる宇宙の話

R

概要 この記事はR Advent Calendar 2016の14日目の記事です。Rで言語処理する話ばかりしているので、今年は宇宙の話をします。 急速に広がる宇宙。R界の「宇宙」といえば、tidyverseですね。ということで、CRAN巡りまたはRパッケージ探しが趣味である自分がt…

Japan.R 2015にてLT発表しました

概要 記事を書くのが遅くなりましたが、12月5日に開催されたJapan.RのLTセッションにて、『Rと形態素解析』というタイトルで形態素解析の説明と、Rで形態素解析ならびにわかち書きする方法を紹介しました。総ページ数80オーバーでしたが、なんとか無事に終え…

"An R package for creating and exploring word2vec and other vector models"を試す(+ GloVeと比較)

前書き Rでword2vecが適用できるという{wordVectors}がGitHub上に公開されたので、早速試してみました(+「言語処理100本ノックの課題でGloVeによる結果と比較」)。 オリジナルのword2vecのC実装を.C()でラップした{tmcn.word2vec}を修正したもので、モデ…

Rによる言語処理100本ノック後半まとめと全体での総括

はじめに Rによる言語処理100本ノック(2015版)を最後まで終えることができたので、後半のまとめ記事と全体総括を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第6章:英語テキストの処理 第7章:データベース 第8章:…

第51回R勉強会@東京(TokyoR)にてLT発表しました

概要 10月10日に開催されたTokyoRのLTセッションにて、『Rでいろんな言語』というタイトルでRからPythonを呼ぶパッケージ{PythonInR}を紹介しました。発表の途中でスクリーンが砂嵐になるというトラブルに見舞われましたが、なんとか無事に時間内に収めるこ…

"ranger: A Fast Implementation of Random Forests"のメモ書き

前書き とあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。 パッケージ自体は下記リンクをご…

第50回R勉強会@東京(TokyoR)にてLT発表しました

祝50回 50回という節目を迎えるTokyoRのLTセッションにて、『Rによる言語処理(N/100)本ノック』というタイトルで言語処理100本ノック(2015年版)をRで解く話を紹介しました。 本発表スライドでは、RPubsに上げた回答記事*1を一部抜粋して説明していますが、…

Rによる言語処理100本ノック前半まとめ

はじめに Rによる言語処理100本ノック(2015版)が折り返したので、まとめ記事を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第1章:準備運動 第2章:UNIXコマンドの基礎 第3章:正規表現 第4章:形態素解析 第5章:構文…

第49回R勉強会@東京(TokyoR)にて発表しました

TokyoRの応用セッションにて、Rでいい感じに文字列処理をする{stringr}と{stringi}のパッケージについて、baseの文字列処理と比較して紹介しました。タイトルの「☆」は@kohske先生へのオマージュです。 本発表スライドは、RPubsに上げたメモ*1を発表用にまと…

Rに関わりそうなチートシートまとめ(随時更新)

チートシートやリファレンスのまとめ Rの基本的な操作に関するあれこれ チートシートやリファレンス R Cheat Sheet (PDF) (ADD: 2017.03.11) R Reference Card (PDF) R Reference Card 2.0 (PDF) The Ultimate R Cheat Sheet – Data Management (Version 4) …