バイアスと戯れる

Rと言語処理と(Rによる言語処理100本ノック終了)

第50回R勉強会@東京(TokyoR)にてLT発表しました

祝50回

 50回という節目を迎えるTokyoRのLTセッションにて、『Rによる言語処理(N/100)本ノック』というタイトルで言語処理100本ノック(2015年版)をRで解く話を紹介しました。
 本発表スライドでは、RPubsに上げた回答記事*1を一部抜粋して説明していますが、他の課題の回答例に興味がある方はそちらをご参照ください。

speakerdeck.com



発表について

 LT発表スライドの概要は次の通りです。

  • 言語処理100本ノックというものがあります
  • Rで挑戦してみました。皆さんも挑戦しましょう
  • R言語100本ノックないの? 考えましょう

 以上のように5分もいらない内容でした。
 言語処理100本ノックについては、以前に前半5章までを回答した際にまとめを書きましたが*2、後半も終わり次第まとめを書く予定です(最後の10章を現在回答中)。 その際にもう少し詳しく書きます。
 RPubsに上げた記事にない話題としては、コードのざっくりとした説明と、R以外で言語処理100本ノックを解いている方々を数名紹介しております。

 また、最後に出てきた「R言語100本ノック」は絶賛考案中です(協力者求む)。各章10問として、章毎にひとつのテーマに基づく一問一答形式のRによる課題集を想定しています。作成次第公開していきますので、無事にできた場合、ご興味ある方は回答してみてください。
 現時点での案は次のようなものです。

  • 第1章: 準備運動
     様々な課題をRで遊びながら解く 
  • 第2章: データ操作
     ベクトル・行列・データフレームを操作して、目的の結果を出す
  • 第3章: 可視化
     いろいろなデータを題材に可視化に挑戦
  • 第4章: 統計処理
     データセットに基本的な統計処理を施してみる
  • 第5章: テキスト処理
     文字列・テキスト処理を少し大きめな入力でやってみる
  • 第6章:(考え中)
     章を含めて考え中
  • 第7章: Webテクノロジー
     Webページの取得や整形に始まり、{shiny}でアプリ化してみる
  • 第8章: 機械学習
     入門的な話から少し応用に踏み入れる
  • 第9章: 応用統計処理
     統計モデリングに挑戦
  • 第10章: パッケージ作成
     すべての章の総まとめとして、パッケージを作成してみる

 まだまだ考え始めたばかりですので、ご意見をお待ちしております。




発表の所感

 他の方々がされたLTの手慣れた感じ、見習いたいものです。
 第50回R勉強会@東京(#TokyoR) : ATND