バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

第51回R勉強会@東京(TokyoR)にてLT発表しました

概要

 10月10日に開催されたTokyoRのLTセッションにて、『Rでいろんな言語』というタイトルでRからPythonを呼ぶパッケージ{PythonInR}を紹介しました。発表の途中でスクリーンが砂嵐になるというトラブルに見舞われましたが、なんとか無事に時間内に収めることができました。
 また、公開したスライドに未掲載だった{PythonInR}を使ってChainerを呼び出したコードを手直ししたので、メモ書きとして残しておきます。

続きを読む

第4回「NLP勉強会」を開催しました #NLPStudy

はじめに

 去る9月23日(水)に株式会社ドワンゴ歌舞伎座タワー本社にて、第4回言語処理勉強会(ハッシュタグ「#NLPStudy」)を開催しました。
 会場提供ならびにご案内をしていただいたドワンゴ様、まことにありがとうございます。
 また、発表者の皆様、ボランティア参加の方々、そして参加者の方々、シルバーウィーク最終日というゆっくりと休みたい日にお集まりいただきましてありがとうございました。

 tokyoscrapper.connpass.com

続きを読む

"ranger: A Fast Implementation of Random Forests"のメモ書き

前書き

 とあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。
 パッケージ自体は下記リンクをご参照ください。

続きを読む

第50回R勉強会@東京(TokyoR)にてLT発表しました

祝50回

 50回という節目を迎えるTokyoRのLTセッションにて、『Rによる言語処理(N/100)本ノック』というタイトルで言語処理100本ノック(2015年版)をRで解く話を紹介しました。
 本発表スライドでは、RPubsに上げた回答記事*1を一部抜粋して説明していますが、他の課題の回答例に興味がある方はそちらをご参照ください。

続きを読む

Rによる言語処理100本ノック前半まとめ

はじめに

 Rによる言語処理100本ノック(2015版)が折り返したので、まとめ記事を書きました。Rの実行結果は下記のRPubsにアップロード済みですので、ご確認ください。


 RmdファイルはGitHubにあります。
github.com

続きを読む

第49回R勉強会@東京(TokyoR)にて発表しました

 TokyoRの応用セッションにて、Rでいい感じに文字列処理をする{stringr}と{stringi}のパッケージについて、baseの文字列処理と比較して紹介しました。タイトルの「☆」は@kohske先生へのオマージュです。
 本発表スライドは、RPubsに上げたメモ*1を発表用にまとめたものになっております。興味がある方はそちらも併せてご参照ください。

続きを読む

Rに関わりそうなチートシートまとめ(随時更新)

チートシートやリファレンスのまとめ

Rの基本的な操作に関するあれこれ

チートシートやリファレンス

RStudioキーボードショートカット

RStudio.comが公開しているチートシート

データ処理に関わるチートシートやリファレンス・チュートリアル

日付処理

空間統計・空間データ

その他

可視化に関わるチートシートやギャラリー

可視化ギャラリー

可視化チートシート

色彩に関わるチートシート

可視化について

パッケージ

統計に関わるチートシートやリファレンス

統計確率にチートシート

統計分布に関するチートシート

統計手法に関するチートシート

数理に関わるあれこれ

行列

数理最適化

機械学習に関わるあれこれ

アルゴリズムチートシート

ニューラルネットワーク

Rと機械学習

Awesome Machine Learning

SQL/HiveQL

Python

基本操作など

Python For Data Science

Scala/Spark

Scala

Spark

開発・インフラ関係

開発

Docker

Hadoop

その他いろいろ