1 名前:132人目の素数さん mailto:sage [2011/01/09(日) 17:31:49 ] R は統計計算とグラフィックスのための言語・環境です。 統計計算で重宝するデータ型や、複数要素を処理する演算や関数、 解析結果を表示するグラフィックなど、多彩な機能を提供します。 ●関連サイト The R Project www.r-project.org/ RjpWiki www.okada.jp.org/RWiki/ リンク集 www.okada.jp.org/RWiki/?%A5%EA%A5%F3%A5%AF%BD%B8
720 名前:132人目の素数さん [2013/01/05(土) 12:25:03.16 ] <スプライン補間:yからxを予測する方法> 質問です。 x<-c(1,2,3,4,5,6) y<-c(1,4,9,7,6,8) というデータがあったとして、 sp<-smooth.spline(x,y) predict(sp,x=2.5) とすると、xが2.5のときのyの値は下記のように予測できます。 $x [1] 2.5 $y [1] 6.923206 逆にyからxを求める方法がお分かりの方、いらっしゃいましたらお教えください。
721 名前:132人目の素数さん mailto:sage [2013/01/05(土) 14:02:30.39 ] >>720 stats:::predict.smooth.spline.fitにざっと目を通した限りは、 できなさそうだけど。 GAMFIT (lib.stat.cmu.edu/general/gamfit )の中までは読んでいない。 sp$fitの中身を使って数学的に解くか、xを細かい間隔でpredict()に与えて、 与えられたyに最も近いものを選ぶしかなさそうだが、 ちゃんとした識者に答えてもらった方がよいかも。 後者なら、 predict.y <- function(y){ x0 <- c(1, 2, 3, 4, 5, 6) y0 <- c(1, 4, 9, 7, 6, 8) sp <- smooth.spline(x0, y0) i <- seq(from = min(x0), to = max(x0), by = 0.0001) Y <- predict(sp, i) j <- which.min((Y$y - y)^2) return(list(y = y, x = i[j], fitted = Y$y[j])) } こんな感じでよいのでは。 > predict.y(2.345) $y [1] 2.345 $x [1] 1.4487 $fitted [1] 2.345004
722 名前:132人目の素数さん mailto:age [2013/01/05(土) 14:47:31.66 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ 私は只の数ヲタなんかとは付き合わないわ。 . | \ ∠イ ,イイ| ,`-' | 頭が良くて数学が出来てかっこいい人。それが必要条件よ。 | l^,人| ` `-' ゝ | さらに Ann.of Math に論文書けば十分条件にもなるわよ。 | ` -'\ ー' 人 一番嫌いなのは論文数を増やすためにくだらない論文を書いて | /(l __/ ヽ、 良い論文の出版を遅らせるお馬鹿な人。 | (:::::`‐-、__ |::::`、 ヒニニヽ、 あなたの論文が Ann of Math に accept される確率は? | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ それとも最近は Inv. Math. の方が上かしら? | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
723 名前:132人目の素数さん [2013/01/05(土) 16:46:53.71 ] >721 ありがとうございました。参考になりました。
724 名前:132人目の素数さん mailto:age [2013/01/05(土) 20:24:09.52 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ . | \ ∠イ ,イイ| ,`-' | | l^,人| ` `-' ゝ | このスレには馬と鹿と豚さんしかいないのね。 | ` -'\ ー' 人 | /(l __/ ヽ、 | (:::::`‐-、__ |::::`、 ヒニニヽ、 | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
725 名前:132人目の素数さん mailto:sage [2013/01/07(月) 16:01:51.28 ] >>716 いまさらだけどビギニングス ガイド イン Rのミススペルな。
726 名前:132人目の素数さん mailto:sage [2013/01/07(月) 18:48:16.16 ] >>725 ttp://www.amazon.com/dp/0387938362 これのことか? でも「ビギニングス ガイド イン R」じゃないぞ。
727 名前:132人目の素数さん mailto:sage [2013/01/09(水) 09:49:00.54 ] またミスすぺるブチこみました。 正確には ビギニングス ガイド イン R でした。
728 名前:132人目の素数さん mailto:sage [2013/01/11(金) 23:37:12.84 ] 以下のようなデータフレームを仮定 コード 日付1 日付2 日付3 データ1 データ2 データ3 0001 201201 201103 201003 52 33 34 0002 201203 NA NA 22 NA 3 0003 201103 201001 200901 32 2 73 0004 201003 200905 200804 98 87 88 0005 NA NA NA NA NA NA 0006 201105 201102 201009 NA 32 55 日付XとデータXが対応 日付1>日付2>日付3となっている この時、日付が201101よりも大きい日付に対応するNAでないデータを取得したい 即ち望まれる出力は以下の通り コード 日付 データ 0001 201201 52 0002 201203 22 0003 201103 32 0004 NA NA 0005 NA NA 0006 201102 32 このように取得したい場合どのような操作をすればよいでしょうか? 実際には数千のコードがあるのでループで一行ずつ回すのはあまり現実的ではありません。 よろしくお願いします
729 名前:132人目の素数さん mailto:sage [2013/01/12(土) 03:32:35.10 ] >>728 宿題じゃないよね? > a <- scan(text="0001 201201 201103 201003 52 33 34 + 0002 201203 NA NA 22 NA 3 + 0003 201103 201001 200901 32 2 73 + 0004 201003 200905 200804 98 87 88 + 0005 NA NA NA NA NA NA + 0006 201105 201102 201009 NA 32 55") Read 42 items > b <- data.frame(t(matrix(a, ncol = 6))) > names(b) <- c("コード", paste0("日付", 1:3), paste0("データ", 1:3)) で、ヒントは次の通り。 > m <- ((b[, 2:4] > 201101) & (b[, 2:4] & b[, 5:7])) * b[, 2:4] > m[(m == 0)] <- NA > i <- apply(m, 1, which.max) > unlist(sapply(1:length(i), function(j){ifelse(length(i[j][[1]]) == 0, NA, (b[j, 5:7])[i[j][[1]]])})) [1] 52 22 32 NA NA 32 > unlist(sapply(1:length(i), function(j){ifelse(length(i[j][[1]]) == 0, NA, (b[j, 2:4])[i[j][[1]]])})) [1] 201201 201203 201103 NA NA 201102
730 名前:132人目の素数さん mailto:sage [2013/01/13(日) 13:37:10.99 ] 正規分布の乱数を作って、確率密度(面積)の合計が1になるのを 確認したいのですが、↓だと何故か2になってしまいます。 どこがダメなんだしょう? x = rnorm(500) hist(x, prob=T) sum(hist(x, prob=T)$density)
731 名前:132人目の素数さん mailto:sage [2013/01/13(日) 13:52:12.00 ] >>730 乱数の分散を変えてみると、理解出来るのでは? > set.seed(1234); sum(hist(rnorm(500, sd = 2), prob = TRUE)$density) [1] 1 > set.seed(1234); sum(hist(rnorm(500, sd = 5), prob = TRUE)$density) [1] 0.2 > set.seed(1234); sum(hist(rnorm(500, sd = .1), prob = TRUE)$density) [1] 20
732 名前:132人目の素数さん mailto:sage [2013/01/13(日) 15:13:55.16 ] >>731 わからないよ (´・ω・`) sum(hist(x, prob=T)$density) と sum(hist(x, prob=T)$count/500) は同じになると思ったんだけど、違うってことですかね??
733 名前:132人目の素数さん mailto:sage [2013/01/14(月) 13:24:07.24 ] >>732 730 の最後の式では、確率密度の積分 ∫f(x) dx = 1 の dx の部分が 抜けてしまっています。 hist を用いる場合、dx に相当する値は diff(hist(x, prob=T)$breaks) で求めることができます。 x <- rnorm(500) h <- hist(x, prob=T) sum(h$density * diff(h$breaks))
734 名前:132人目の素数さん mailto:sage [2013/01/14(月) 22:54:04.42 ] >>733 理解できました! ありがとうございます!
735 名前:132人目の素数さん mailto:sage [2013/01/16(水) 12:15:17.92 ] 質問失礼します 言語を英語にすると、立ち上げた際のメッセージなどはきちんと英語になるのですが、 cor.test()などの関数を実行すると出力が日本語メッセージでかえってきます 日本語のwinOSでRの返答を完全に英語にする方法をどなたかご存知ないでしょうか? ちなみに↓サイトの起動アイコンカスタマイズの方法で英語化しています ttp://minato.sip21c.org/swtips/R.html
736 名前:132人目の素数さん mailto:sage [2013/01/16(水) 12:41:27.37 ] >>735 妙な挙動ですね。WindowsだとLANG=Cがどこかで強制的に書き換えられるのでしょうか。 Sys.getenv()で、メッセージが日本語になる前後でLANGやLC_ALLを確認してみてはどうでしょうか。 LANGを確認するには、Sys.getenv("LANG")とすればOKです。 なお、メッセージの言語を指定する環境変数はLC_MESSAGESです。 環境変数によるローケルの管理を知っておいても損はないと思います。 例えば、ttp://www.itmedia.co.jp/enterprise/articles/0605/16/news027.html の「環境変数の階層」とかに目を通すとか。
737 名前:736 mailto:sage [2013/01/16(水) 12:54:26.20 ] 追記。 ttp://www.itmedia.co.jp/enterprise/articles/0605/16/news027.html を読んで思い出したが、昔、起動アイコンに、LANG=Cじゃなくて、language=enをつけていた。 「R language=en」でググるとCRANのR for Windows FAQがヒット。 ttp://cran.r-project.org/bin/windows/base/rw-FAQ.html ... if you want to ensure that menus and messages are in (American) English, LANGUAGE=en. とか、 You can ensure that R uses English messages by appending LANGUAGE=en to the shortcut you use to start R, or setting it in the Rconsole file. って書いてあるよ。FAQに。
738 名前:132人目の素数さん mailto:sage [2013/01/16(水) 23:32:51.99 ] >>729 遅くなりましたがありがとうございました。 無事動作しました。
739 名前:728 mailto:sage [2013/01/16(水) 23:41:01.80 ] すいません。 再び質問です。 横型ではなく縦型の場合はいかがでしょうか? 以下のようなデータフレームを仮定します コード 日付 データ 0001 20120101 332 0001 20120111 542 0002 20120201 5554 0002 20120301 52334 0002 20120511 15234 0003 20121101 35234 0003 20121201 NA 0004 20120501 75234 0005 20120601 NA 各コードに対してデータがNAでない日付が最大の値を取得したいのです。 NAしかない場合にはその値を取得します。 上記の場合以下の値が期待されます。 コード 日付 データ 0001 20120111 542 0002 20120511 15234 0003 20121101 35234 0004 20120501 75234 0005 20120601 NA ヒントだけでも結構ですのでよろしくお願いいたします。
740 名前:132人目の素数さん mailto:sage [2013/01/17(木) 00:37:07.40 ] mac版のRでの質問、失礼します。 ローカルに保存したCSVファイルではなく、直接ダウンロード、読込みをするファイルの文字化けを解消したいのですが、 エンコードを変える記述では上手くいきません。 ご教示いただけないでしょうか? 例) url.data <- "maxis.muam.jp/e/fund/download/" eMAXIS <- read.table(url.data, sep=",", stringsAsFactor = FALSE)
741 名前:132人目の素数さん mailto:sage [2013/01/17(木) 14:18:27.23 ] >>740 fileEncoding = "SJIS" オプションとかではダメってこと?
742 名前:132人目の素数さん mailto:sage [2013/01/17(木) 14:25:14.37 ] >>739 plyrにあるddply()でIDで分割してwhich.max()で日付が最大のところのindexをとって、その場所の数字を取ればいいかな。 NAの処理を条件分岐を使わないでやるなら、ID日付でソートしたうえで、ddply()の中でzooのna.locf()を使えばいいか? 結構重くなってしまうかも。
743 名前:132人目の素数さん mailto:age [2013/01/17(木) 19:30:55.74 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ . | \ ∠イ ,イイ| ,`-' | | l^,人| ` `-' ゝ | このスレは馬と鹿と豚さんばかりね。 | ` -'\ ー' 人 | /(l __/ ヽ、 | (:::::`‐-、__ |::::`、 ヒニニヽ、 | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
744 名前:132人目の素数さん mailto:sage [2013/01/17(木) 22:40:29.47 ] >>742 ありがとうございます。 ddplyで無事いけました。 20万行程度のデータフレームですが、数秒で完了するので問題ありませんでした。
745 名前:132人目の素数さん mailto:sage [2013/01/18(金) 01:06:24.60 ] >>741 すみません。勘違いしてました。 オプションでいけました。 ご指摘ありがとうございます。
746 名前:132人目の素数さん mailto:sage [2013/01/26(土) 23:13:16.48 ] RMySQLがインストールできず困っています。 > install.packages("RMySQL", type="source") Installing package(s) into ‘D:/program_files/R-2.15.2/library’ (as ‘lib’ is unspecified) URL 'cran.rstudio.com/src/contrib/RMySQL_0.9-3.tar.gz ' を試しています Content type 'application/x-gzip' length 165363 bytes (161 Kb) 開かれた URL downloaded 161 Kb * installing *source* package 'RMySQL' ... ** パッケージ 'RMySQL' の解凍およびMD5サムの検証に成功しました checking for $MYSQL_HOME... D:program_filesMySQL MYSQL_HOME is set but does not point to a directory ERROR: configuration failed for package 'RMySQL' * removing 'D:/program_files/R-2.15.2/library/RMySQL' Warning in install.packages : 命令 'D:/PROGRA~1/R-215~1.2/bin/x64/R CMD INSTALL -l "D:/program_files/R-2.15.2/library" C:\Users\<<User>>\AppData\Local\Temp\RtmpmAoBu3/downloaded_packages/RMySQL_0.9-3.tar.gz' の実行は状態 1 を持ちました Warning in install.packages : installation of package ‘RMySQL’ had non-zero exit status The downloaded source packages are in ‘C:\Users\<<User>>\AppData\Local\Temp\RtmpmAoBu3\downloaded_packages’ が出て、MYSQL_HOMEの値がダメなんだと思いますが、mysql自体にはパスが通るので合ってるはずです。どこが悪いんでしょうか?
747 名前:132人目の素数さん mailto:sage [2013/01/27(日) 08:48:14.43 ] >>746 これってソースしかないの?
748 名前:746 mailto:sage [2013/01/27(日) 23:38:33.32 ] ごめんなさい。自己解決しました やっぱりMYSQL_HOMEの値がおかしかったようです。
749 名前:132人目の素数さん mailto:sage [2013/02/01(金) 10:37:40.43 ] win版のRについて質問があります Rjpwikiの時間の数値変換を、使っているデータの時間フォーマットにあわせてアレンジしてるんですが date2num <- function(x, ...) { .day <- as.numeric(substr(x,10,11)) .hour <- as.numeric(substr(x,13,14)) .minute <- as.numeric(substr(x,16,17)) .second <- as.numeric(substr(x,19,20)) .year <- as.numeric(substr(x,2,5)) .mon <- as.numeric(substr(x,7,8)) a <- .day - 1 b <- .year - 1970 c <- 1 if(.mon==2) c <- 31 else if(.mon==3) c <- 59 else if(.mon==4) c <- 90 else if(.mon==5) c <- 120 else if(.mon==6) c <- 151 else if(.mon==7) c <- 181 else if(.mon==8) c <- 212 else if(.mon==9) c <- 243 else if(.mon==10) c <- 273 else if(.mon==11) c <- 304 else if(.mon==12) c <- 334 else if(.mon==1) c <-0 else m <-1
750 名前:132人目の素数さん mailto:sage [2013/02/01(金) 10:40:10.94 ] file<-sprintf("%03d",.mon) cat(file) # 画面に出力 cat("\n") # 改行コード file<-sprintf("%03d",a) cat(file) # 画面に出力 cat("\n") # 改行コード file<-sprintf("%03d",c) cat(file) # 画面に出力 cat("\n") # 改行コード c<-c+a file<-sprintf("%03d",c) cat(file) # 画面に出力 cat("\n") # 改行コード return(b*31556926+c*86400+a*86400+.hour*3600+.minute*60+.second) } これに" 2012/11/30 16:50:00"のような時刻データを date,sum 2012/12/05 20:30:00,17012 2012/12/05 20:30:00,16512 2012/12/05 19:53:00,16512 2012/12/05 19:53:00,16012 以上のようなデータフレームで入力しているのですが 月を調べているif文が1度しか動きません if文が問題なのだと思っているのですがどう直せばよいものでしょうか
751 名前:132人目の素数さん mailto:sage [2013/02/01(金) 11:19:52.70 ] >>750 よく分からない。date2numの引数はxだけなのに、なんで、dateとsumのデータフレームを入れるの? それに、月を7文字目と8文字目ってしているけど、6文字目と7文字目じゃないの? > date2num("2012/12/05 20:30:00") 以下にエラー if (.mon == 2) c <- 31 else if (.mon == 3) c <- 59 else if (.mon == (from #11) : TRUE/FALSE が必要なところが欠損値です [snip] 再現できるように質問しようよ。 もっと言えば、 > as.numeric(as.POSIXlt("2012/12/05 20:30:00")) [1] 1354707000 とかを使うのは嫌いなの?
752 名前:132人目の素数さん mailto:sage [2013/02/01(金) 12:21:01.54 ] すみません 単純に使い方が分からず力技でどうにかやってみた感じだったのでこういう形になっていました 自分の力が及ばないせいでデータファイルを作るとき時刻データの前にどうしても消えない半角スペースがあって それで6番目と7番目ではなく7番目8番目になっていますorz それと > as.numeric(as.POSIXlt("2012/12/05 20:30:00")) [1] 1354707000 これをみて目からうろこでした、自分のやってたことの馬鹿さ加減にあきれました 御助言ありがとうございました
753 名前:132人目の素数さん mailto:sage [2013/02/01(金) 13:26:36.91 ] >>752 >時刻データの前にどうしても消えない半角スペース 関数を自作するレベルなのになぜw 例えば、 > (a <- c(" 2013-02-01 13:21:17", "2013-01-01 09:21:17", " 2013-03-01 11:21:17")) [1] " 2013-02-01 13:21:17" "2013-01-01 09:21:17" " 2013-03-01 11:21:17" こんな感じで、時刻前に空白があったりなかったりするなら、 > library(stringr) > str_trim(a) [1] "2013-02-01 13:21:17" "2013-01-01 09:21:17" "2013-03-01 11:21:17" これでよいのでは? オプションなしでは、前後の空白を取り除くから、前だけならそのように指定する。
754 名前:132人目の素数さん mailto:sage [2013/02/01(金) 13:49:46.73 ] なるほど、Rの方でtrimするって手もありましたね なにからなにまでありがとうございます
755 名前:132人目の素数さん mailto:sage [2013/02/01(金) 14:11:14.62 ] >>754 >Rの方でtrimするって手もありましたね 別にRの外でも、どこででも空白を削除すれば良いと思う。 例えば下記のようなcsvがあったら、 $ cat tmp.csv "A","B","C" "BE DAC","Jan",0.35 "AC BDE","Feb",0.34 " EBACD","Mar",0.66 " DABEC","Apr",0.44 "BEA CD","May",0.84 "CDA EB","Jun",0.3 "EDCAB ","Jul",0.59 "CBEA D","Aug",0.53 "ECDA B","Sep",0.44 "ABDCE ","Oct",0.33 $ sed -e 's/¥" ¥([^ ,]*¥)/¥"¥1/g' tmp.csv "A","B","C" "BE DAC","Jan",0.35 "AC BDE","Feb",0.34 "EBACD","Mar",0.66 "DABEC","Apr",0.44 "BEA CD","May",0.84 "CDA EB","Jun",0.3 "EDCAB ","Jul",0.59 "CBEA D","Aug",0.53 "ECDA B","Sep",0.44 "ABDCE ","Oct",0.33 とすると3,4行目にあった文字列前の空白を消せる。
756 名前:132人目の素数さん mailto:sage [2013/02/02(土) 10:13:07.27 ] Win版Rで質問失礼します cse.naro.affrc.go.jp/takezawa/r-tips/r/43.html 上記サイトの複数の列に対してソートを行う場合は関数を使用して 同じように a b c 11 1 2 11 12 1 1 12 9 2 4 9 10 2 3 10 7 3 6 7 8 3 5 8 5 5 8 5 6 5 7 6 4 7 9 4 1 9 12 1 2 9 11 2 3 9 10 3 というデータフレームをaを昇順に整列しaで同じものがあった場合はcの小さいものを上にするようにしたいのですが In Ops.factor(mmm, each) : < 因子に対しては無意味です というエラーが出てうまくいきません どこが問題でしょうか?
757 名前:132人目の素数さん mailto:sage [2013/02/02(土) 10:18:28.45 ] データフレーム訂正します a b c 1 2 11 1 1 12 2 4 9 2 3 10 3 6 7 3 5 8 5 8 5 5 7 6 7 9 4 9 12 1 9 11 2 9 10 3 です 実際にはデータフレーム名test1で sortlist <- order(test1$a, pmax(test1$a,test1$c)) test1[sortlist,] 以上に実行しました
758 名前:756,757 mailto:sage [2013/02/02(土) 10:45:26.08 ] すいません 自己解決しました
759 名前:132人目の素数さん mailto:sage [2013/02/02(土) 11:01:54.12 ] >>758 複数カラムをキーにしたソートなんて考えたことがなかった。 いったいどんなときに必要になるの? # 表計算ソフトのように「見せる」目的なら理解できるけど。
760 名前:132人目の素数さん mailto:sage [2013/02/02(土) 11:09:52.57 ] 順位相関などを見るときにそういう処理をする可能性はあると思う
761 名前:132人目の素数さん mailto:sage [2013/02/02(土) 12:03:35.44 ] 再び質問失礼します a,b 3,5 2,3 2,2 2,1 1,3 1,1 a列は必ず降順になっているときに b列が降順になっていないとき この例では5行目1,3ですが これを削除したいのですが 関数化して自動で判別して削除したいです どのようにしたら良いでしょうか
762 名前:132人目の素数さん mailto:sage [2013/02/02(土) 12:16:56.00 ] 複数の列でのソートは doByパッケージのorderBy()が使いやすい。
763 名前:132人目の素数さん mailto:sage [2013/02/02(土) 12:36:52.26 ] >>761 pmax()というのを初めて知った。 bの列を一行下げて頭にInfをいれたものをcとしてデータフレームにいれる、bとcに対してpmax()して、結果をdとしてデータフレームにいれる。dがbと一致しているところを落とす。 でどうだろう?
764 名前:761 mailto:sage [2013/02/02(土) 13:18:11.28 ] >>763 御助言ありがとうございます しかし当方最近Rを使いだしたもので何をどうすればいいのか分かりません・・・ あつかましいのですが具体的にどんな感じに書けばいいでしょうか
765 名前:132人目の素数さん mailto:sage [2013/02/02(土) 14:23:56.55 ] >>764 dat = read.csv(text = "a,b 3,5 2,3 2,2 2,1 1,3 1,1") dat dat$c = c(Inf , head(dat$b, -1)) dat with(dat, pmax(b, c)) dat$d = with(dat, pmax(b, c)) == dat$c dat dat[dat$d,] を想定。関数化されてないけど。もっと大きい例で動くはチェックしていない。
766 名前:132人目の素数さん mailto:sage [2013/02/02(土) 15:20:57.47 ] >>763 さんの解答にインスパイアされた別解。 > dat = read.csv(text = "a,b + 3,5 + 2,3 + 2,2 + 2,1 + 1,3 + 1,1") > dat[c(TRUE, diff(dat$b) < 0), ] a b 1 3 5 2 2 3 3 2 2 4 2 1 6 1 1
767 名前:132人目の素数さん mailto:sage [2013/02/02(土) 15:35:34.61 ] >>766 の追記。 bが例えば、10, 8, 6, 9, 8, 5とかになっていると、 >>766 の方法を1回だけ適用したのでは通用しない。 > d2 a b 1 3 10 2 2 8 3 2 6 4 2 9 5 1 8 6 1 5 > d2[c(TRUE, diff(d2$b) < 0), ] a b 1 3 10 2 2 8 3 2 6 5 1 8 6 1 5 そのため、十分な回数を繰り返し適用することになる。 > sum(diff(d2$b) > 0) [1] 1 これが0になるのが、終了条件。
768 名前:132人目の素数さん mailto:sage [2013/02/02(土) 19:57:32.38 ] cummin を使えばいいか?
769 名前:132人目の素数さん mailto:sage [2013/02/03(日) 12:03:27.26 ] これなら1,9,8,1の並びも一回で行けるか? dat = read.csv(text = "a,b 3,5 2,3 2,2 2,1 1,9 1,8 1,1") dat dat$cummin <- cummin(dat$b) dat$correct <- with(dat, b == cummin) dat dat[dat$correct == TRUE,]
770 名前:132人目の素数さん mailto:sage [2013/02/03(日) 13:34:45.07 ] r-base-core がみつからないとか言われるでござる…
771 名前:132人目の素数さん mailto:sage [2013/02/03(日) 22:46:23.58 ] ビッグデータに関する本で 膨大なデータを統計処理して活用するために RやJavaのhadoopが使える人材が求められてるって書いてあったな
772 名前:132人目の素数さん mailto:sage [2013/02/05(火) 08:32:45.91 ] すみません、グラフで箱の左下をゼロで直交するようにしたいのですが (軸オンリーではなく箱で書きたいのです)、 Baseパッケージで何か良い方法ありませんでしょうか? 今は↓のように書いていますが、ablineで線を引くとはみ出してしまう等手間がかかるので、 簡単にかける方法をご存知の方おりましたらお願いします plot(x=0,y=0,xlim=c(0,6),ylim=c(0,3),lwd=2,ann=F,cex.axis=1,las=1,type="n",axes=F) axis(side=1,seq(0,6),lab=F,pos=0,tck=0); axis(side=2,seq(0,3),lab=F,tck=0,pos=0) axis(side=3,at=0:6,lab=F,tck=0,pos=3); axis(side=4,at=0:3,tck=0,lab=F,pos=6) axis(side=1,at=0,tck=0,pos=0) >>735-37 レス忘れていました、申し訳ありません Rconsoleが2つ存在し妙な読み込みがされていたのが原因でした アドバイスありがとうございました
773 名前:132人目の素数さん mailto:sage [2013/02/05(火) 09:04:30.55 ] >>772 > plot.new() > box() とすると、左下に原点が来るけど。 > points(0, 0)
774 名前:132人目の素数さん mailto:sage [2013/02/05(火) 09:17:22.01 ] >>773 の追記 R的なアプローチとして、複雑な手続きを関数化して簡単にする方法がある。 f772 <- function(){ plot(x=0,y=0,xlim=c(0,6),ylim=c(0,3),lwd=2,ann=F,cex.axis=1,las=1,type="n",axes=F) axis(side=1,seq(0,6),lab=F,pos=0,tck=0); axis(side=2,seq(0,3),lab=F,tck=0,pos=0) axis(side=3,at=0:6,lab=F,tck=0,pos=3); axis(side=4,at=0:3,tck=0,lab=F,pos=6) axis(side=1,at=0,tck=0,pos=0) } とスクリプトの最初に書いておけば、 > f772() 以降は、これだけでよい。Baseパッケージのコマンドを探すよりも簡単。
775 名前:132人目の素数さん [2013/02/06(水) 03:22:55.78 ] xaxs/yaxs (AXis Style)のことか plot(1,1, xaxs = "i", yaxs = "i", xlim = c(0,1), ylim = c(0,1), tck = 0) ?parでbaseの細かいオプションの説明がみられる。 これも役立つかも www.stat.auckland.ac.nz/~paul/RG2e/chapter3.html
776 名前:132人目の素数さん mailto:age [2013/02/06(水) 06:43:29.05 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ 私は只の数ヲタなんかとは付き合わないわ。 . | \ ∠イ ,イイ| ,`-' | 頭が良くて数学が出来てかっこいい人。それが必要条件よ。 | l^,人| ` `-' ゝ | さらに Ann.of Math に論文書けば十分条件にもなるわよ。 | ` -'\ ー' 人 一番嫌いなのは論文数を増やすためにくだらない論文を書いて | /(l __/ ヽ、 良い論文の出版を遅らせるお馬鹿な人。 | (:::::`‐-、__ |::::`、 ヒニニヽ、 あなたの論文が Ann of Math に accept される確率は? | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ それとも最近は Inv. Math. の方が上かしら? | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
777 名前:132人目の素数さん mailto:sage [2013/02/06(水) 17:31:58.49 ] >>773-775 レスありがとうございます 非常に参考になりました
778 名前:132人目の素数さん mailto:sage [2013/02/15(金) 09:19:22.40 ] barplot と plotを重ねるときに、 軸(目盛の位置)がずれてしまうのですが、 揃える方法ってあるのでしょうか? barplot(1:10, xlim=c(0,10), ylim=c(0,10)) par(new=T) plot(1:10, col=2, xlim=c(0,10), ylim=c(0,10))
779 名前:132人目の素数さん mailto:sage [2013/02/15(金) 10:52:07.52 ] >>778 よく分からないが、 > a <- barplot(1:10); points(a, 1:10, col = 2) こうしたいの?
780 名前:132人目の素数さん mailto:sage [2013/02/15(金) 11:18:55.04 ] >>779 縦軸の0の位置が、barplot と plot で違うんで揃えたいんです。
781 名前:132人目の素数さん mailto:sage [2013/02/15(金) 11:34:08.72 ] >>780 いや、そもそも揃っているけど。 > a <- barplot(1:10); points(a, rep(0, 10), col = 2)
782 名前:781 mailto:sage [2013/02/15(金) 11:39:38.94 ] >>780 あっ、分かった。plot()を無理矢理使っているんだ。 addオプションをサポートしているクラス以外では、plot()を重ねるのは禁止。 想定外の使用形態。 描画を重ねるとき、普通はpoints()やlines()やaxis()を使う。
783 名前:132人目の素数さん mailto:sage [2013/02/15(金) 11:44:27.17 ] >>782 なるほど。ありがとうございます。
784 名前:781 mailto:sage [2013/02/15(金) 11:53:12.37 ] ちょっと説明が不親切だったかも知れないから、追記。 例えば、棒グラフと折れ線グラフを重ねたかったら、次のようにする。 x <- 1:10 n <- length(x) y <- jitter(rep(10, n), 10) op <- par(mai = c(1.02, 0.82, 0.82, 0.82)) a <- barplot(x, ylim = c(0, 13)) points(a, y, type = "l", lty = 2) axis(4, label = (0:6) * 2 / 100, at = (0:6) * 2, las = 2) par(op)
785 名前:132人目の素数さん mailto:sage [2013/03/09(土) 12:17:39.65 ] 結局、Rで中程度規模のデータを高速に集計できるパッケージ(関数)ってなんなの? plyr : 中規模以上のデータで遅すぎ(idataframe使ってもそこまで変わらず) aggregate : 普通 sqldf : まとも、でもRっぽくない。 他にお勧めがあったら教えて
786 名前:132人目の素数さん mailto:sage [2013/03/13(水) 01:03:30.88 ] 教えて下さい。 rawデータをcharacterにしたいです。 chromeの localstorageのデータを整理しようとしています。 ドメインごとのsqlite形式?ファイルがあり、ItemTableというテーブル名で、 key,valueの項目でデータが入っています。 valueのデータ形式がblob型です。 RSQLiteで、 ret <- dbGetGuery(con, "select value ItemTable") でデータフレームでデータが返って来ました。 class(ret[1,1][[1]]) >> raw それで、これから先、 ret[1,1][[1]] を characterにしたのですが、 どうすればいいのでしょうか?
787 名前:132人目の素数さん mailto:sage [2013/03/13(水) 12:10:10.92 ] >>786 内部でSQLiteを使っているソフトが最近多いなと思っていたが、 Chromeもそうなんだ。 再現して検証できない質問なので、適当な回答になるけど、 as.character(ret[1,1][[1]])でどのようなエラーになりますか?
788 名前:786 [2013/03/13(水) 12:57:52.15 ] >>787 ありがとうございます。 chrome側のconsoleで、 localstorage.hoge = "abc" として、 sqlteデータを入れた時に、 R側でそのblob型のデータ(abcというデータ, 他のsqlite viewerで確認済み) を読むと、 > ret[3,2][[1]] [1] 32 00 30 00 31 00 33 00 2d 00 30 00 33 00 2d 00 31 00 32 00 54 00 31 00 34 [26] 00 3a 00 33 00 35 00 3a 00 35 00 30 00 2e 00 31 00 34 00 33 00 5a 00 となり、 as.character(ret[3,2][[1]]) [1] "32" "00" "30" "00" "31" "00" "33" "00" "2d" "00" "30" "00" "33" "00" "2d" [16] "00" "31" "00" "32" "00" "54" "00" "31" "00" "34" "00" "3a" "00" "33" "00" [31] "35" "00" "3a" "00" "35" "00" "30" "00" "2e" "00" "31" "00" "34" "00" "33" [46] "00" "5a" "00" となります。 こういうのを16進数のbyteデータというのですよね? これをcharacterにencode?してやりたいです。
789 名前:132人目の素数さん mailto:sage [2013/03/13(水) 13:54:01.89 ] >>788 元データのエンコードが分からないと厳しいと思います。日本語でしょうか。 英語(ASCII)なら、 rawToChar(ret[3,2][[1]])とするとうまく行くかも知れません。
790 名前:789 mailto:sage [2013/03/13(水) 15:25:46.98 ] >>788 ちゃんと読んでいませんでした。申し訳ない。 これは「abc」という文字列なんですね。 ちなみに"abc"の8進数表記は次の通り $ echo abc | od -to1c 0000000 141 142 143 012 a b c \n 10進数表記 $ echo abc | od -td1c 0000000 97 98 99 10 a b c \n 16進数表記 $ echo abc | od -tx1c 0000000 61 62 63 0a a b c \n >>788 を見る限り、abcじゃなさそうに思える。 16進数と仮定すると、 2 NUL 0 NUL 1 NUL 3 NUL - NUL 3 NUL - NUL 1 NUL 2 NUL T NUL 1 NUL 4 NUL : NUL 3 NUL 5 NUL : NUL 5 NUL 3 NUL . NUL 1 NUL 4 NUL 3 NUL Z NUL となるが、NULを飛ばすと、2013-3-12T14:35:53.143Zで、日付時間っぽいな。 これ以上は分からないので、識者の方にパス。
791 名前:132人目の素数さん mailto:sage [2013/03/13(水) 15:28:55.56 ] >>789 ありがとうございます。 かなり前進しました。 さきほど、データの提示は、間違え(一つずれたものでした) "abc"というデータを入れたときは、 ret[4,2][[1]] [1] 61 00 62 00 63 00 rawToChar(ret[4,2][[1]],multiple=T) [1] "a" "" "b" "" "c" "" なぜか、空文字が入りますがOKです。 また、日本語の場合ですが、 私のwindows環境の文字コードは、cp932だと思います。 >Sys.getlocale() [1] "LC_COLLATE=Japanese_Japan.932;LC_CTYPE=Japanese_Japan.932;......." それで、データとして "あい" と localstorageに入れて、 RSQLiteでとりだしたところ、 ret[5,2][[1]] [1] 42 30 44 30 となり、 これは、文字コード表を見ると、 unicode (あい) => UTF16形式 3042 3044 と、 2バイトの間隔で前後入れ替えしたものに見えます。 mapply(function(a,b)paste(b,a,sep=""), x[seq(1,3,2)], x[seq(2,4,2)]) [1] "3042" "3044" これを、"あい" という文字で、 できれば、UTF8形式でファイルにおとしたいのですが、、
792 名前:132人目の素数さん mailto:sage [2013/03/13(水) 15:31:21.55 ] >>789 さん 返事が入れ違いになりました。 "abc"ではなく、日付でした。 間違えてました。
793 名前:132人目の素数さん mailto:sage [2013/03/13(水) 21:35:55.82 ] データの補間について質問させてください 下記のようなCSVファイル(,区切り)が存在します。ID、NAME、MONTHは各情報の最初の行にしかデータとして入っておりません。 ---------- データ部 ---------- ID, NAME, MONTH, PRICE, NUMBER AAA1, Apple, 1, 100, 10 , , , 98, 12 , , , 102, 8 AAA2, Orange, 2, 120, 3 , , , 130, 4 , , , 112, 8 ------------------------------ これをデータフレームとして読み込みます。 ID NAME MONTH PRICE NUMBER AAA1 Apple 1 100 10 "" "" "" 98 12 "" "" "" 102 8 AAA2 Orange 2 120 3 "" "" "" 130 4 "" "" "" 112 8 ....... となります。 ここでID NAME MONTHを上の行から補間したいのですが、どのようにすればよいでしょうか? ID NAME MONTH PRICE NUMBER AAA1 Apple 1 100 10 AAA1 Apple 1 98 12 AAA1 Apple 1 102 8 AAA2 Orange 2 120 3 AAA2 Orange 2 130 4 ........ としたいです。補間さえできれば形式はデータフレームでなくても結構です。よろしくお願いいたします。
794 名前:786 [2013/03/13(水) 22:48:40.11 ] >>793 stackoverflow.com/questions/2776135/last-observation-carried-forward-in-a-data-frame を参考にするといいよ。 ""をNAに変えておかないといけないので、 df[ df == ""] <- NA としておいて、 library(zoo) na.locf(df) まだ、rawデータからcharacterに変えられてない、、、
795 名前:132人目の素数さん mailto:sage [2013/03/14(木) 09:59:33.96 ] >>793 単純にコピーするだけでは駄目なの? > sample <- data.frame(matrix(c("AAA1","Apple",1,100,10, + "","","",98,12, + "","","",102,8, + "AAA2","Orange",2,120,3, + "","","",130,4, + "","","",112,8), ncol = 5, byrow = TRUE)) > names(sample) <- c("ID", "NAME", "MONTH", "PRICE", "NUMBER") > sample ID NAME MONTH PRICE NUMBER 1 AAA1 Apple 1 100 10 2 98 12 3 102 8 4 AAA2 Orange 2 120 3 5 130 4 6 112 8 > for(i in 1:(nrow(sample) - 1)){ + if(sample[i+1, 1] == ""){ + sample[i+1, 1:3] <- sample[i, 1:3] + } + } > sample ID NAME MONTH PRICE NUMBER 1 AAA1 Apple 1 100 10 2 AAA1 Apple 1 98 12 3 AAA1 Apple 1 102 8 4 AAA2 Orange 2 120 3 5 AAA2 Orange 2 130 4 6 AAA2 Orange 2 112 8
796 名前:793 mailto:sage [2013/03/14(木) 22:00:08.24 ] >>794 ありがとうございます。 無事うまくいけました。 質問に答えることができればよかったのですが、 残念ながら私にはわかりません。申し訳ありません。 >>795 実際のデータは100万行ほどありますので、 ループを回すと試してはいませんが時間がかかるかと。。。。
797 名前:794 mailto:sage [2013/03/15(金) 15:10:27.37 ] >>796 いえいえ。 791の疑問は、説明の仕方が悪い気がする。 単純な文字コードの問題なのだろうけど、そこのところがよくわかてっない。 他の言語でやりますのでOKです。
798 名前:132人目の素数さん [2013/04/02(火) 00:12:39.59 ] DMwR::SMOTE関数のエラーについて教えてください。 以下の処理を実行するとエラーになります。 library( DMwR ) work00 <- data.frame( kbn=c(rep("A",12),rep("B",3)) , tuikavar=c(rnorm(12,20),rnorm(3,2)) ) SMOTE( kbn ~ . , data=work00 , perc.over=200 , perc.under=100 ) >以下にエラー `colnames<-`(`*tmp*`, value = c("kbn", "tuikavar")) : >'names' 属性 [2] はベクトル [1] の長さと同じでなければなりません ドキュメントを読みつくしたつもりなのですが、バグとしか思えません。 詳しい方、このバグは既知のものなのでしょうか?それとも回避方法があるのでしょうか?
799 名前:132人目の素数さん mailto:sage [2013/04/02(火) 09:47:57.43 ] >>798 その作者のTorgoさんに聞く方がここで聞くよりも早いと思うぞ
800 名前:狢 ◆yEy4lYsULH68 mailto:age [2013/04/02(火) 16:08:36.00 ] 狢 > 1 :西独逸φ ★:2007/08/05(日) 05:47:55 ID:???0 >徳島県警阿南署などは5日未明、東京都足立区千住寿町、 >筑波大学准教授、増田哲也容疑者(50)を >県迷惑行為防止条例違反(痴漢行為)容疑で逮捕した。 > >調べでは、増田容疑者は、4日午後4時20分ごろから約50分にわたり、 >JR牟岐線の列車内で、県内の >専門学校生の女性(21)の胸や太ももなどを触った疑い。調べに対し、 >「夏休み期間に、講演活動を兼ね >て旅行していた。好みの女性だったのでムラムラした」と話しているという。 >
801 名前:132人目の素数さん mailto:sage [2013/04/03(水) 23:34:54.43 ] R 3.0.0 キタ━━━━(゚∀゚)━━━━!!
802 名前:132人目の素数さん mailto:sage [2013/04/04(木) 12:51:51.74 ] 3.0.0に上げたら、保存されたワークスペースに非互換部分が含まれていたみたいで、 R (正確にはR.app GUI)が起動しなくなったw コンソールの方は使えたので、すぐに対処できたけど、R初心者は要注意だな。 バージョン上げたら、ライブラリのコンパイルをやり直さなくてはいけないので面倒だよな。 configureにオプションを渡さないといけないのもあるし。 > nrow(library()$results) [1] 267 みんなは、いくつぐらいなの?
803 名前:132人目の素数さん mailto:sage [2013/04/04(木) 13:07:53.30 ] rstudioの対応待ち
804 名前:132人目の素数さん mailto:sage [2013/04/04(木) 13:11:23.49 ] メインPCのlibraryは262 3.1とか3.0.2が出るまでとりあえず様子見だな
805 名前:132人目の素数さん mailto:sage [2013/04/04(木) 22:31:14.28 ] > nrow(library()$results) [1] 2961 Rcmdrのせいなのか随分と多い。 自分の環境はR version 2.13.0 (2011-04-13)
806 名前:132人目の素数さん mailto:sage [2013/04/05(金) 01:02:41.34 ] 背景色とフォントカラーを変えたいんだけど、etc\Rconsoleを設定しても全然反映されない font = TT MS Gothic points = 20 background = black normaltext = white usertext = LightGreen highlight = Red style = normal # Style can be normal, bold, italic 何が悪いんだろう
807 名前:132人目の素数さん mailto:sage [2013/04/05(金) 07:49:15.90 ] 回答になっていなくて申し訳ないのだが、R以外のエディタを使うのが良いかと デフォルトエディタらしいといえばそうなのだが、Rエディタはあまりに低機能過ぎる モニタが大きい人ならRstudio、ノーパソ派ならNotepad++ & NppToR、あたりが個人的おすすめ
808 名前:132人目の素数さん mailto:sage [2013/04/05(金) 09:33:00.80 ] >>806 は?ターミナルエミュレータの設定にRは関係ないだろ、と思ったら、 > font = TT MS Gothic Windowsな方でしたか。 私も回答になっていなくて申し訳ないけど、 背景やフォントカラー、構文色強調を自由に設定できるEmacs+ESSがお薦め。 Emacsは初期学習コストがかかるが、超絶便利。 初めてESSを使ったときは、あまりの便利さに気を失いそうになった。
809 名前:132人目の素数さん mailto:sage [2013/04/05(金) 15:31:00.18 ] >>803 3.0.0で使えているみたいだけど。 RStudio Ver.0.97.336
810 名前:132人目の素数さん mailto:sage [2013/04/06(土) 08:59:21.34 ] RStudioで普通に問題なく使えてる。一応2.15.3も残してはあるが3.0.0 インスコした後まだ立ち上げる機会がない。
811 名前:132人目の素数さん mailto:sage [2013/04/06(土) 13:04:58.94 ] なんか、ノートン先生に怒られた…(;・∀・) 絶対パス: c:\program files\r\r-3.0.0\bin\i386\r.dll ____________________________ ____________________________ コンピュータの評価日 2013/04/05 12:12:11 前回の使用 利用不能 起動項目 いいえ 起動済み はい ____________________________ ____________________________ 少数のユーザー Norton コミュニティの 50 人未満のユーザーがこのファイルを使いました。 ____________________________ ごく新しい このファイルの更新日はここ 1 週間以内です。 ____________________________ 高 これは危険度が高いファイルです。 ____________________________ 脅威の詳細 SONAR 保護はコンピュータ上で疑わしいプログラムの活動を監視します。 ____________________________ 元ファイル: r.dll
812 名前:132人目の素数さん mailto:sage [2013/04/07(日) 12:09:36.61 ] 怪しいサイトから拾い食いしただろ
813 名前:132人目の素数さん mailto:sage [2013/04/07(日) 17:13:19.15 ] よほどヘビーにR使う人でなければ、Emacs系はコスト>利益 「 (略) 作業効率が上がる(ように錯覚でき)ます. (RjpWikiより)」
814 名前:132人目の素数さん mailto:sage [2013/04/08(月) 11:00:43.17 ] >>813 逆。試しに使ってみるとか、RCommanderしか使わないとか、 年に数回だけ使うとかそんなレベルなら、 コンソール/RCommanderでもよいが、 ある程度使うなら、試行錯誤するためにも、エディタは必須。 常用しているテキストエディがなければ、微妙だけど。
815 名前:132人目の素数さん mailto:sage [2013/04/08(月) 12:42:11.56 ] 3.0.0は「だいぶ2系が落ちついたから番号あげてみた」程度だって公式では言ってたけど、非互換なところたくさんあるの?
816 名前:132人目の素数さん mailto:sage [2013/04/09(火) 19:51:21.47 ] >>815 過去にsave.image()しまくった資産があるのでなければ、 基本的に非互換なんて気にしなくてもよいと思うよ。 でも、Ubuntuのリポジトリは2.15.3のままだな。 単に遅れているだけか、何か理由があるのかな。 Debianの方は3.0.0が来た。
817 名前:132人目の素数さん mailto:sage [2013/04/10(水) 01:47:48.52 ] ベン図を描きたいのだけど、お勧めある? 因みに2.15だとgplotsが無いみたいでvenn()は使えないみたいでした。
818 名前:132人目の素数さん mailto:sage [2013/04/10(水) 08:58:38.30 ] >>817 > RSiteSearch("Venn") でヒットした関数やパッケージは試した上での質問かどうかで回答は変わるけど、 VennDiagramパッケージのような専用パッケージはどう?
819 名前:132人目の素数さん mailto:sage [2013/04/10(水) 10:52:02.97 ] ttp://www.biomedcentral.com/1471-2105/12/35 >>817-818 同じくVennDiagramに一票
820 名前:132人目の素数さん mailto:sage [2013/04/12(金) 10:13:54.71 ] ちょっと教えてくれろ。 x <- rnorm(100);hist(x, prob=T, ann=F) ;par(new=T) ;plot(density(x),col="red") こんな感じの正規分布っぽいグラフでXの範囲指定して、 Y軸0から確率密度の赤線までの面積を表したいんだけど、 ここを色づけする方法が判らない、 例えばXが1~2の間を塗るとき具体的にどんなコードになるか教えて下さい。
821 名前:132人目の素数さん mailto:sage [2013/04/12(金) 15:37:00.07 ] ペイント使って塗ったらいいじゃん
822 名前:132人目の素数さん mailto:sage [2013/04/13(土) 00:06:14.95 ] >>820 dat <- with(density(rnorm(100)),data.frame(x,y)) library(ggplot2) ggplot(data = dat, mapping = aes(x = x, y = y)) + geom_line() + layer(data = dat, mapping = aes(x=ifelse(x >1 & x < 2 ,x,0), y=y), geom = "area", geom_params=list(fill="red",alpha=0.5)) + scale_y_continuous(limits = c(0,max(dat$y)))
823 名前:132人目の素数さん mailto:sage [2013/04/13(土) 10:48:56.27 ] >>822 ありがとう
824 名前:132人目の素数さん mailto:sage [2013/04/13(土) 23:48:23.04 ] ここがRの本スレか。 R自体統計プログラムなのかグラフィックソフトウェアなのかよくわからんけど本スレは数学板なのね。 数学嫌いだわ…。Rまで嫌いになりそう
825 名前:132人目の素数さん mailto:sage [2013/04/13(土) 23:52:28.69 ] むしろ数学界隈以外での R の用途が気になるな。なんでもできるっちゃそうなんだけど。
826 名前:132人目の素数さん mailto:sage [2013/04/14(日) 00:04:02.13 ] >>825 学生時代数学にはつらい思いでがあって… 数学的能力が全くダメでもいろんな運の巡り合わせでRと向き合わなきゃいけなくなる人もいますんでご容赦を
827 名前:132人目の素数さん mailto:sage [2013/04/14(日) 05:11:16.14 ] 統計学もグラフィックスも数学じゃないよ。数学者はそんなもの相手にせんわ
828 名前:132人目の素数さん [2013/04/14(日) 07:37:32.81 ] カール・フリードリヒ・ガウス...
829 名前:132人目の素数さん mailto:age [2013/04/14(日) 11:00:26.70 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ 私は只の数ヲタなんかとは付き合わないわ。 . | \ ∠イ ,イイ| ,`-' | 頭が良くて数学が出来てかっこいい人。それが必要条件よ。 | l^,人| ` `-' ゝ | さらに Ann.of Math に論文書けば十分条件にもなるわよ。 | ` -'\ ー' 人 一番嫌いなのは論文数を増やすためにくだらない論文を書いて | /(l __/ ヽ、 良い論文の出版を遅らせるお馬鹿な人。 | (:::::`‐-、__ |::::`、 ヒニニヽ、 あなたの論文が Ann of Math に accept される確率は? | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ それとも最近は Inv. Math. の方が上かしら? | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
830 名前:132人目の素数さん mailto:sage [2013/04/15(月) 07:52:40.36 ] あるデータをplot(density(data))でグラフ化してます。 任意のX区間を指定して面積を求めようとしてるのですが、やり方を教えて下さい。 また、正規分布だと、dnorm(c(0,0.2,0.4,0.6,0.8,1))とやればX値に対応したY値がでるみたいですが、 任意のデータをプロットしている場合、X値からY値を取り出すにはどうやればいいのでしょうか?
831 名前:132人目の素数さん mailto:sage [2013/04/15(月) 08:54:48.29 ] 規制されて書き込めなかった。 普通はpolygon()を使う >>820 > x <- rnorm(100);hist(x, prob=T, ann=F) > a <- density(x) > polygon(a$x,a$y, col="red")
832 名前:132人目の素数さん mailto:sage [2013/04/15(月) 09:12:17.89 ] >>830 こちらも、>>831 と同じ要領。 > data <- runif(100) > plot(density(data)) > a <- density(data) として、念のために幅を確認して、 > head(diff(a$x)) [1] 0.003151153 0.003151153 0.003151153 0.003151153 0.003151153 0.003151153 横が0.003151153と分かったので、矩形の面積を計算して合計。 > sum(diff(a$x)[1] * a$y ) [1] 1.000883
833 名前:132人目の素数さん mailto:sage [2013/04/15(月) 09:21:38.51 ] >>825 統計的裏付けのない実感で申し訳ないが、 確かに、10年くらい前は数学・数理統計の関係者がほとんどを占めていたと思う。 しかし、ここ5年ほどで急速に、Rをプログラミング言語としてとらえるIT関係のユーザが増えたし、 心理学研究や医学研究にも地道に普及している。 Rユーザ会の出席者を見渡しても、数学関係者はマイノリティになりつつあると思う。
834 名前:132人目の素数さん mailto:sage [2013/04/15(月) 12:01:36.43 ] こんな記事もある 「次に来る」プログラミング言語を占ってみる ttp://www.atmarkit.co.jp/ait/spv/1201/17/news133_2.html 今後の動向を予感させるもう1つの動きは、プログラミング言語「R」が2012年1月のTIOBE PCIの19位に入ったことだ。 (中略)Rが話題になり始めた背景には、最近注目を浴びているある種のコンピュータ技術がある。 大量のデータを効率良く処理する技術だ。「ビッグデータ」という言葉を耳にした方は多いと思う。(中略) RはGoogleが社内のデータ解析に活用しているなど、ビッグデータを扱う企業において重要なプログラミング言語となっており、今後広い範囲で話題になる可能性がある。
835 名前:132人目の素数さん mailto:sage [2013/04/15(月) 21:12:53.25 ] 後藤大地ってどんなやつかと思ったら小物もいいとこじゃん。聞く耳もつに 値しないね。
836 名前:132人目の素数さん mailto:sage [2013/04/15(月) 23:59:44.25 ] ちゃんと取材にいってる人だと思うが、どちらかというとPCハードの記者さんだよね。 事実として、企業のコミットが増えてlinuxみたいにRもコミッター増えてんじゃないの?