バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

2015-01-01から1年間の記事一覧

Japan.R 2015にてLT発表しました

概要 記事を書くのが遅くなりましたが、12月5日に開催されたJapan.RのLTセッションにて、『Rと形態素解析』というタイトルで形態素解析の説明と、Rで形態素解析ならびにわかち書きする方法を紹介しました。総ページ数80オーバーでしたが、なんとか無事に終え…

"An R package for creating and exploring word2vec and other vector models"を試す(+ GloVeと比較)

前書き Rでword2vecが適用できるという{wordVectors}がGitHub上に公開されたので、早速試してみました(+「言語処理100本ノックの課題でGloVeによる結果と比較」)。 オリジナルのword2vecのC実装を.C()でラップした{tmcn.word2vec}を修正したもので、モデ…

Rによる言語処理100本ノック後半まとめと全体での総括

はじめに Rによる言語処理100本ノック(2015版)を最後まで終えることができたので、後半のまとめ記事と全体総括を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第6章:英語テキストの処理 第7章:データベース 第8章:…

第51回R勉強会@東京(TokyoR)にてLT発表しました

概要 10月10日に開催されたTokyoRのLTセッションにて、『Rでいろんな言語』というタイトルでRからPythonを呼ぶパッケージ{PythonInR}を紹介しました。発表の途中でスクリーンが砂嵐になるというトラブルに見舞われましたが、なんとか無事に時間内に収めるこ…

第4回「NLP勉強会」を開催しました #NLPStudy

はじめに 去る9月23日(水)に株式会社ドワンゴ様歌舞伎座タワー本社にて、第4回言語処理勉強会(ハッシュタグ「#NLPStudy」)を開催しました。 会場提供ならびにご案内をしていただいたドワンゴ様、まことにありがとうございます。 また、発表者の皆様、ボ…

"ranger: A Fast Implementation of Random Forests"のメモ書き

前書き とあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。 パッケージ自体は下記リンクをご…

第50回R勉強会@東京(TokyoR)にてLT発表しました

祝50回 50回という節目を迎えるTokyoRのLTセッションにて、『Rによる言語処理(N/100)本ノック』というタイトルで言語処理100本ノック(2015年版)をRで解く話を紹介しました。 本発表スライドでは、RPubsに上げた回答記事*1を一部抜粋して説明していますが、…

Rによる言語処理100本ノック前半まとめ

はじめに Rによる言語処理100本ノック(2015版)が折り返したので、まとめ記事を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。 第1章:準備運動 第2章:UNIXコマンドの基礎 第3章:正規表現 第4章:形態素解析 第5章:構文…

第49回R勉強会@東京(TokyoR)にて発表しました

TokyoRの応用セッションにて、Rでいい感じに文字列処理をする{stringr}と{stringi}のパッケージについて、baseの文字列処理と比較して紹介しました。タイトルの「☆」は@kohske先生へのオマージュです。 本発表スライドは、RPubsに上げたメモ*1を発表用にまと…

Rに関わりそうなチートシートまとめ(随時更新)

チートシートやリファレンスのまとめ Rの基本的な操作に関するあれこれ チートシートやリファレンス R Cheat Sheet (PDF) (ADD: 2017.03.11) R Reference Card (PDF) R Reference Card 2.0 (PDF) The Ultimate R Cheat Sheet – Data Management (Version 4) …

ブログ、初めました

やるやる詐欺になっていたブログを書き始めます。 R言語や言語処理に関する個人的なメモを書き連ねていきます。 今まではRPubsやSpeaker Deckにいろいろと公開していましたが、 RPubsには仕上げたコードと実行結果を載せ、奮闘した記録はこちらに記述します…