2008年7月10日木曜日

R のインストールと、手始めに「平均、分散、標準偏差」を求める

1. 統計のためのアプリケーションとして、SAS の代わりに R を使う

統計解析というと、大学時代に、SAS を使ったのを思い出す。あの頃、全く勉強してなかった ^^;

今ではフリーの統計ソフトとして、

R

を使える。いい時代だ。久しぶりに統計のお勉強を。 o(^^)o

R言語 - Wikipedia によると、

R言語の構成には広義の関数型言語の一つであるSchemeの影響があり、リストを基本にした内部処理、遅延評価静的スコープなどの特徴を持つ。

これは、おもしろそうだ。

 

2. R のインストール

より、Download R 2.14.0 for Windows をダウンロードして、インストールした。

 

3. ドキュメントの探し方

R Console において、

help()

と入力すると、マニュアルが表示される。

help(関数名)

により、関数のヘルプを表示。

例えば、平均 のヘルプを見たい場合、

help(mean)

HTML でヘルプを読みたい場合、メニューより

  • Help > html help

Packages > base > M > Mean と辿れる。ただし、これはローカルにあるファイルが表示される。ネット上で読むなら、The R Language 。検索するなら、R: Search Engine

その他、R – Search を見ると、いつくか検索サイトがある。

 

4. 平均、分散、標準偏差を求める

R: Arithmetic Mean によると、

Usage
mean(x, ...)
Arguments

x
An R object. Currently there are methods for numeric data frames, numeric vectors and dates. A complex vector is allowed for trim = 0, only.

Examples
x <- c(0:10, 50)
xm <- mean(x)

 

データをベクターに変換

例を見ると、mean に直接データを渡すのではなく、

C( )

に渡してから、計算が行われている。

c( ) とは、R: Combine Values into a Vector or List によると、

This is a generic function which combines its arguments.

The default method combines its arguments to form a vector.

ベクターに変換する関数のようだ。

データ解析用統計言語Rによる統計的プログラミング: 第1回 豊富な統計機能で遊ぶ によると、

Rでの基本的なデータ・オブジェクトはベクターです。ベクターの変種の幾つかによって、(多次元)配列やデータ・フレーム、(異種)リスト、マトリックスなどのような機能が追加されます。

 

平均

では、平均を求めてみる。

> mean(c(1,2,3,4,5))
[1] 3

 

分散

分散を求める。

R: Variance-Covariance Matrices (deprecated)

> var(c(1,2,3,4,5))
[1] 2.5

ただし、R-Source によると、

データの不偏分散を求める関数 var() は不偏分散を求める関数であって,標本分散を求める関数ではないことに注意.

「不偏分散」については、以下を参考に。正直未だよくわからず... ^^;

 

標準偏差

標準偏差を求める。R: Standard Deviation

> sd(c(1,2,3,4,5))
[1] 1.581139

 

参考

関連記事

(更新日: 2011.12.11)

2コメント:

匿名 さんのコメント...

R言語、面白いですね。
比較的違和感の無い制御構文と、変数にベクトルや行列があることによる統計演算の容易さ、ユーザーによる追加パッケージ作成機能がいい感じの相乗効果をもたらしていると思います。

私も興味を持っていて、モンテカルロ実験ですが、OLSをかけて、F検定を行う練習を行ってみました。

(;゚д゚) R言語を使え!

jutememo さんのコメント...

R もやりたいのですが、最近いじってませんでした。 ^^;