【2019】R言語入門 おすすめ本 統計・データサイエンスを始めよう
R言語のはじめるに当たって知っておくべきこと、おすすめの入門書を書きました。
R言語とは
オープンソースの統計解析向けのプログラミング言語です。
統計解析向け
研究目的で使われることもおおいですが、まあ統計やらデータサイエンスやらに少しでも興味があるのなら、さわってみるべきプログラミング言語だと思います
統計解析を目的として作られたプログラミング言語ですので統計解析においてはR言語は非常に優秀です。
統計解析用のパッケージがたくさんありますので本格的に統計解析を行うのであればR言語が第一候補になります。
まあライブラリが多すぎてどれを使えばいいのかわからない問題もよく起こりますがね(笑
基本的には統計学の知識がある人がそれを実際に実装して解析するために使うものですので、統計学の知識はあらかじめあった方がいいです。
もちろんRと一緒に統計学を学ぶのもOKです。
統計解析以外の用途では基本使わないので注意。
また基本的な線形代数や微積分もやっておく必要があります。
線形代数
データ解析では行列をよく使いますので、行列の扱いについて知っておかないと行けません。
微積分
最適化するときに微分を使います。微分だけでも学部一年レベルのことは学んでおきましょう。
開発環境
オープンソースですので当然無料で使うことができます。
またマルチプラットフォームですのでWindows・macOS・UNIX・LinuxなどのOSで使うことができます。つまり大抵のパソコンで使うことが可能です。
R言語はこちらから入手可能です。
The Comprehensive R Archive Network
RstudioのようなIDE(統合開発環境)もありますので気軽に始めることができます。
環境構築ではそこまでつまずかないはずです。
Rstudio はこちらから入手できます。
まずは、Rstudioでいろいろいじってみるのがいいと思います。よくできたIDEですのでこれで困ることはあんまりないんじゃないでしょうか。
用途
金融工学
統計解析
データ解析
機械学習
データマイニング
マーケティング
アクチュアリ
などなどデータをいじくる分野でよく使われています。
日本語の情報は少ない
Pythonなんかと比べると日本語の情報はかなり少ないですので英語が読めないとちょっと厳しいかも。
まあ、ある程度使えるようになるぐらいまでなら日本語の情報でもなんとかなるはずですが、英語のドキュメントや記事を読めないとどこかでつまってしまう可能性が大。
頑張って英語の勉強もしましょう。
どっちにしたって英語は求められる時代ですから。
Pythonとの比較
日本語の情報 Python
学びやすさ Python
データの可視化 R
統計解析用パッケージ(ライブラリ、関数) R
特に可視化と解析はRに分があります。
グラフや円グラフ、ヒストグラムなど多くのパッケージがありますので、どんなグラフが必要になっても対応することが可能ですし、最新のアルゴリズムもすぐに実装されています。
取っつきやすさ使いやすさははPythonですが、本格的に統計解析をやる人はRを使っている人が多いように思えます。
KaggleなんかでもRを使っている人が多いですよね。
Pythonについてはこちらを参考にしてください
おすすめ本
RStudioではじめるRプログラミング
- 作者: Garrett Grolemund,大橋真也,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/03/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
RStudioを使ってRについて学ぶ本です。
Rで統計について学ぶ本ではありませんので注意。
純粋にR言語の文法を学ぶための本ですので、これからR言語を使いたい人やプログラミング自体が初めての人におすすめできる本です。
一番最初に読む本です。
プログラミング言語を学ぶときは必ず自分で書いてみてください。
繰り返しますが統計については触れられていないので注意。
はじめてのR
- 作者: 村井潤一郎
- 出版社/メーカー: 北大路書房
- 発売日: 2013/10/03
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Rと統計の基本について学ぶことができます。
個人的には統計は統計の入門書を読んだ方が理解は早い気はします。
まあ統計について知らなくてもなんとかなるとは思います。
相関係数の検定・t検定・カイ2乗検定・分散分析について触れられています。
RユーザのためのRStudio実践入門
RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−
- 作者: 松村優哉,湯谷啓明,紀ノ定保礼,前田和寛
- 出版社/メーカー: 技術評論社
- 発売日: 2018/06/29
- メディア: 大型本
- この商品を含むブログ (1件) を見る
RStudioを用いたデータの収集、データの整形、可視化、レポーティングなど、データ解析基本を学べます。
解説も丁寧で分かりやすく、一部カラーになっています。レイアウトも良いので個人的な評価は高いです。
入門書としてとても優れていると思います。
R初心者のためのABC
- 作者: A.ジュール,E.イエノウ,E.ミースターズ
- 出版社/メーカー: 丸善出版
- 発売日: 2012/04/05
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Rを使ったデータ解析の入門書です。
データを読み込んで、解析して、可視化する、までの流れの基本的なことができるようになるはずです。
あくまでRの入門書ですので統計について色々かかれているわけではない。
R言語徹底解説
- 作者: Hadley Wickham,石田基広,市川太祐,高柳慎一,福島真太朗
- 出版社/メーカー: 共立出版
- 発売日: 2016/02/10
- メディア: 単行本
- この商品を含むブログ (29件) を見る
関数や環境,遅延評価などについて丁寧に説明されていて、メタプログラミング,パフォーマンスの改善,デバッグ,RとC++との連携などについても触れられている。
本格的な本ですが、他のプログラミング言語について詳しいのであれば行きなりこの本を読んでもいいと思います。
中級~上級者レベルの本です。
Rによるやさしい統計学
- 作者: 山田剛史,杉澤武俊,村井潤一郎
- 出版社/メーカー: オーム社
- 発売日: 2008/01/25
- メディア: 単行本
- 購入: 64人 クリック: 782回
- この商品を含むブログ (68件) を見る
R言語と統計学を同時に学ぶことができます。
統計学の入門書としても使えます。多分。
高校でやるデータ分析かなんかぐらいのことは知っておいた方がいいかも。
Rではじめるデータサイエンス
- 作者: Hadley Wickham,Garrett Grolemund,大橋真也,黒川利明
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/10/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
訳はあれだけど、内容は素晴らしいです。
著者は二人とも重鎮です。
ただデータサイエンスの解説ではなくてデータサイエンスをより効率的にやる方法をかかれている本です。
Rクックブック
- 作者: Paul Teetor,大橋真也,木下哲也
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/12/22
- メディア: 大型本
- 購入: 9人 クリック: 61回
- この商品を含むブログ (13件) を見る
本当にいろんなトピックについて書かれていますので、R言語を使うのであれば持っておきたい本です。
基本を学んだあとに読む本ですね。
Rグラフィッククックブック
Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集
- 作者: Winston Chang,石井弓美子,河内崇,瀬戸山雅人,古畠敦
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/11/30
- メディア: 大型本
- この商品を含むブログ (3件) を見る
グラフィックスパッケージであるggplot2を使ってグラフの作り方がいろいろ書かれている本です。
可視化も非常に重要ですのでちゃんとやっておく必要があります。
グラフィックなら取り敢えずこの本。
最後に
データ解析は今後もその重要度は変わらず高いままだと予想されるので、この分野を学ぶことは仕事とかそういうことを考えても良いことなんだと思います。
あくまでもR言語はツールですので、統計学や機械学習とかをしっかりと学びましょう。
機械学習
DeepLearning