Rは数年前にほんの少しだけ触ったことはあったけれど、
結局はExcelで十分だったので殆ど使わなかった。
dplyrとかtidyrとかが最近の流行りらしいので、
かつてピンと来なかったRによるやさしい統計学 以外で
もう一回イチから勉強しようと思った次第。
学んだこととか
- %>% パイプ処理は便利。いちいち変数作らなくて良い。
- ctrl (macならcommand) + shift + m で、
パイプ処理の %>% ←コレを入力できる。すっごく楽。 - ggplot2の長くてよく分からなかったコードは、
データの指定(aes)、グラフの形の指定(geom_なんとか)とかで構成されてた。 - RStudioは、tabで予測変換したり、データセット$でカラム名が出たりする。
いちいち長いカラム名を打たなくって良い。便利。 - Rstudioのプロジェクトを使えば、ディレクトリとか楽に設定できる。
- パッケージを入れると、以下のメッセージが稀によく出てくる。
y/nを聞かれたら、とりあえずnを選んでおけばよい。
Do you want to install from sources the package which needs compilation? y/n:
Udemyの講義の感想
- %>%に慣れる機会になった。
- ggplot2でグラフを描く機会が何度かあった。
「式が長くてわからない」から、少しだけ理解できるようになった。 - dplyrの機能はよくわからない。分析手法の見取り図は描けない。
とりあえずRでの分析を一通りやってみるスタンス。 - 音声が途切れたり、テキストボックスでコードが隠れるのはいただけない 。
- 同時期に読んだ『新米探偵、データ分析に挑む』と同程度の内容を、
もう少し丁寧に解説してあるイメージ。同じ方が携わってるからかもだけど。
次にやりたいこと
- dplyr, tidyrなどのデータハンドリングまわりを、もう少しお勉強したい。
データハンドリング入門とか、R/RStudio入門あたりで復習する。 -
近日発売のこの本が、tidyverseまわりもカバーしてるらしいので気になる。