統計処理ソフトR ファイルや出力の扱い方

大学の授業で統計処理ソフトRを学ぶ機会がありました。

授業を履修する前から名前は聞いたことがありましたが、実際に触るのは完全に初めてです。

その授業ではExcelで用いるような各種関数に加え、グラフ理論の意味での大規模データの可視化などに用いましたが、数学・情報学に限らず便利になりそうな機能もたくさん備えています。
後々の自分、及び自分に似た入門者のために簡単にメモしておこうと思います。

sudo apt-get install R

によってRをインストールすることができます。

まず授業で必要なため、igraphというライブラリをインストールしました。
端末で

sudo R

としてRを起動した後、

install.package("igraph")

です。
Rの起動時にsudo権限をつけていないとLinux系OSでは警告が出ると思います。
MacWindows使いの人たちは必要ないかもしれません。

早速ネットワークデータを作成してみましょう。
f:id:alstd:20141216220249p:plain
このネットワークを以下のように書きなおします。

a	b
a	c
b	c
c	d
d	a

このデータをsample1.datとして保存しましょう。

続いてこのデータを読み込むRのコードです。
端末に直打ちでもできますが、ファイルを作ってみましょう。

library(igraph)
net <- read.table(file="sample1.dat",sep="\t")
g <- graph.data.frame(net,directed=TRUE)

このコードをplot.rとして保存しましょう。
library(igraph)によってigraphを読み込みます。
2行目はタブを区切り文字として、sample1.datをデータとして読み込み、netへ代入するという意味です。
そして、3行目はdirected=TRUE、つまり有向グラフとして、netをgraphの形式へと変換しています。

最後に、端末からRを起動し、

source("plot.r")
plot(g)

と入力すると、先ほどのグラフの画像が表示されているはずです。

なお、画像をpngなどで出力したい場合は、

source("plot.r")
png("sample1.png", width = 400, height = 400)
plot(g)
dev.off()

によって、カレントディレクトリにsample1.pngが出来上がっているはずです。


参考にさせてもらったサイトです!
各関数のオプションや仕様も詳しく載っています。
統計解析フリーソフト R の備忘録頁 ver.3.1