hiratake55 の作業メモ

R, Javascript, Python, Linux and Hadoop

Rで重複した値を取り除く

→unique 関数を使う。
SQL でいう DISTINCT のようなものは無いのか?、と思って探したらやっぱり存在した。

> n<-c("Y","K","F","Y","K","Y","K","Y","K","Y","K","F","F")
> unique(n)
[1] "Y" "K" "F"

> d<-c(8,11,23,21,1,8,21,6,4,23,1,4,9)
> sort(unique(d))
[1]  1  4  6  8  9 11 21 23

一方、繰り返し出現した際の TRUE/FALSE が欲しい場合は、duplicated 関数を使う

> n<-c("Y","K","F","Y","K","Y","K","Y","K","Y","K","F","F")
> duplicated(n)
[1] FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE

> d<-c(8,11,23,21,1,8,21,6,4,23,1,4,9)
> duplicated(d)
[1] FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE  TRUE  TRUE  TRUE FALSE

「R 重複 除去」とかで検索しても R に関係したページがヒットしないというか、そもそも R は名前が一文字なので SEO 的に不利過ぎて逆引きには本当に困りますね。