きとのおもちゃばこ。

名刺の肩書が『データアナリスト』になったけど、実態が無いので途方に暮れてます。

【R】Udemy『データサイエンスの実践例から学ぶデータ分析入門』で、Rを学び直す

Rは数年前にほんの少しだけ触ったことはあったけれど、

結局はExcelで十分だったので殆ど使わなかった。

 

dplyrとかtidyrとかが最近の流行りらしいので、

かつてピンと来なかったRによるやさしい統計学 以外で

もう一回イチから勉強しようと思った次第。 

www.udemy.com

  

学んだこととか

  • %>% パイプ処理は便利。いちいち変数作らなくて良い。
  • ctrl (macならcommand) + shift + m で、
    パイプ処理の %>% ←コレを入力できる。すっごく楽。
  • ggplot2の長くてよく分からなかったコードは、
    データの指定(aes)、グラフの形の指定(geom_なんとか)とかで構成されてた。
  • RStudioは、tabで予測変換したり、データセット$でカラム名が出たりする。
    いちいち長いカラム名を打たなくって良い。便利。
  • Rstudioのプロジェクトを使えば、ディレクトリとか楽に設定できる。
  • パッケージを入れると、以下のメッセージが稀によく出てくる。
    y/nを聞かれたら、とりあえずnを選んでおけばよい。
Do you want to install from sources the package which needs compilation? y/n:

 

Udemyの講義の感想

  • %>%に慣れる機会になった。
  • ggplot2でグラフを描く機会が何度かあった。
    「式が長くてわからない」から、少しだけ理解できるようになった。
  • dplyrの機能はよくわからない。分析手法の見取り図は描けない。
    とりあえずRでの分析を一通りやってみるスタンス。
  • 音声が途切れたり、テキストボックスでコードが隠れるのはいただけない 。
  • 同時期に読んだ『新米探偵、データ分析に挑む』と同程度の内容を、
    もう少し丁寧に解説してあるイメージ。同じ方が携わってるからかもだけど。
    新米探偵、データ分析に挑む
     

 

 次にやりたいこと