1: 名無し

データ分析最強ツール「R」の実力

Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570

2: 名無し

時代はロータス123

3: 名無し

ExcelマクロでRに変換する案件が増えて良かったな

4: 名無し

その前にアクセスという考えはないのか?

5: 名無し

データ分析はRDMSとアクセス+エクセル十分

7: 名無し

一太郎だろ

8: 名無し

>>1
エクセル貶した「R」ってなんだ

10: 名無し

A3で印字しても見えないくらい縮小されてたら
見る気もしない

11: 名無し

R言語か

15: 名無し

Rは言語であってアプリケーションじゃないだろ そもそも比較するのがおかしい

18: 名無し

数十万件レベルのデータをExcelの中に置いたりするのかね

22: 名無し

>>18
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので

25: 名無し

>>22

保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw

27: 名無し

>>25
保険金な

19: 名無し

つまり一般人はエクセルでいいわけですね

20: 名無し

フリーソフトだっけ?
でも、理系学部の人たちが使うものでしょ。
ウィンドウズが跋扈する社内で、使っても、孤立するだけだし。

21: 名無し

Rかなと思ってスレ開いたらRだった

23: 名無し

マジレスをすると、まともに統計解析やりたいなら、SPSSとかの統計専門ソフトだろうね。

26: 名無し

ところで cygwin にR言語インストールできなくて困ってる
ビルドにも失敗する
Linuxだとパッケージで一発なのだが

37: 名無し

>>26
ファイル足りないか更新が必要なんじゃね

40: 名無し

>>26
Windows使うのやめればいいだけだな
俺はWindows使わなくていい会社に転職した

28: 名無し

ワゴン

30: 名無し

いや、excelと比較するならS-PLUSだろw

31: 名無し

ツールというならSPSSとかTensor Flowとかだと思ってた

32: 名無し

そういえば、昔、論文書くときに使ってた!

34: 名無し

kingsoftのやつ

35: 名無し

全然しらないけどデータの取り込みはどうやるの?

36: 名無し

男は黙って「三四郎」

38: 名無し

ソース現代だったわ…

39: 名無し

方眼紙上手く書けるかな?

42: 名無し

俺は何でもrubyでやる

43: 名無し

S のフリー版みたいな話なんだっけ?

44: 名無し

検索しづらい名称つけたら最後
すぐ廃れる