【統計分析】機械学習・データマイニング【集合知】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 02/02 00:00 / Filesize : 198 KB / Number-of Response : 850
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2010/10/04(月) 23:00:10 ]: 何でもいいので語れ

【関連サイト】
機械学習の「朱鷺の杜Wiki」
ibisforest.org/index.php?FrontPage
597 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 01:34:57.83 ]: >>596
こんな状況で申し訳ない、次回から他スレで質問をお願いします
598 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 01:35:42.72 ]: 今度は専門用語並べてドヤ顔か
簡単な数学ができてからにしようね
599 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 01:37:59.88 ]: かなり言語設計に問題がありそうな気がするが
600 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 01:38:11.66 ]: こんな状況ｗｗｗｗｗｗｗｗｗｗｗこれが状況と呼ばれるようなものなのかよｗｗｗ
どんだけお前のせかいせまいんだよｗｗｗ

さらに、専門用語ｗｗｗｗｗｗ
まじで意味わからんｗｗｗｗどこのことを指しているのかまったく不明ｗｗｗｗ
ニューラルネットワークは専門用語でなくて完全性定理(<--ここかな？）が専門用語？？？？？
まじお前院生病だわｗｗｗｗｗｗ
601 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 01:39:35.76 ]: 見事な発狂っぷりだな
602 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 04:57:04.63 ]: >>527
荒れるのは望みませんが、これだけは言わせてください。
「鬼の兜とった」は「鬼の首とった」が正しいです。
603 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 05:54:45.99 ]: 機械学習の力でこいつを識別してNGにするフィルタを作れという天からの出題だろ
604 名前：デフォルトの名無しさん mailto:sage [2011/08/24(水) 10:47:46.38 ]: 草生やしてるからテキスト処理だけで十分
たとえ本人でなくとも草生えてるレスにはろくなものがないから
605 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 00:09:26.01 ]: すれが止まった。結局お前ら等機械学習よりあおりあいの方が好きなんだな。
606 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 00:30:34.89 ]: www.gazo.cc/up/53547.png
これが止まったというのか
推定の手順を示せ
607 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 00:53:26.33 ]: このグラフどうやって作ったの？面白いね！
608 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 04:29:42.39 ]: >>578ですがやっぱり上手くいきません...
中間層が180個もあるので一つの中間層の値が0.5として全ての重みを0.5としても180*0.5*0.5=45でこれをシグモイド関数で計算するとe^-1.0*45は限りなく0になるので値が1になってしまいます。
609 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 06:43:34.78 ]: >>608
教師データと合うように重みを変えていくわけだから
それができないってことは学習アルゴリズムがバグっているか
教師データが間違っているのでは。

＞中間層の値が0.5として全ての重みを0.5として
0.5というのはどこから出てきたの？
610 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 09:49:45.92 ]: >>606
日付ごとのレス数を棒グラフにしたら止まったかどうかわかるんじゃないかな
611 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 14:54:55.21 ]: >>609
初期では重みをランダムで[0,1]の範囲で与えているので入力層:60、中間層:180とすると入力層で与える値が全て0.1だとして重みの平均は0.5なので一つの中間層の値はΣx•w = 0.1•0.5•60=3
sigmoid(3) = 0.99..となり
次の出力層の値はΣx•w = 0.99•0.5•180=90
sigmoid(90) = 1.0 になる始末です。
入力層、中間層の数を少なくすれば機能することは確認済みなのですがやはり数を多くすると上記の不具合が出てしまいます。
大人しくwekaでも使ったほうが良いですかね...
612 名前：デフォルトの名無しさん mailto:sage [2011/08/25(木) 23:29:38.67 ]: >>611ですが自己解決しました。
ご迷惑おかけしました
613 名前：デフォルトの名無しさん mailto:sage [2011/08/26(金) 12:46:56.47 ]: >>611
入力がなんだろうと重みを調節すれば出力値はどうにでもなる。
中間層の数が増えれば、各ユニットの重みが減るというだけで、
それができないというのは学習の処理がバグっているのでは。

解決したならいいけど。
614 名前：片山博文MZ mailto:sage [2011/08/26(金) 13:27:39.74 ]: 誰かIBMのワトソンみたいなの作って無料で公開してくれないか？
日本語で分かるやつ頼む。
615 名前：デフォルトの名無しさん mailto:sage [2011/08/26(金) 14:30:26.62 ]: これ凄いよね
d.hatena.ne.jp/kaiseh/20080609/1212980260
616 名前：デフォルトの名無しさん mailto:sage [2011/08/26(金) 16:02:32.90 ]: .
617 名前：デフォルトの名無しさん mailto:sage [2011/08/26(金) 23:36:36.90 ]: >>615
これはみた？

ttp://newsmap.jp/
618 名前：デフォルトの名無しさん mailto:sage [2011/08/27(土) 04:14:58.32 ]: 実際マイニングするより下準備のほうが大変だよね。
今いちいち手入力でデータセット打ち込んでるわ・・・
619 名前：デフォルトの名無しさん mailto:sage [2011/08/27(土) 06:35:53.93 ]: データから作ると大変だよな。
620 名前：デフォルトの名無しさん mailto:sage [2011/08/27(土) 11:46:10.68 ]: ここム板なんだけど？
621 名前：デフォルトの名無しさん mailto:sage [2011/08/28(日) 02:11:16.74 ]: RもCもパイソンもゴミだった。
622 名前：デフォルトの名無しさん mailto:sage [2011/08/28(日) 06:54:08.13 ]: >>621
なぜならお前がゴミだから。
623 名前：デフォルトの名無しさん mailto:sage [2011/08/28(日) 12:03:55.45 ]: 来年は北京だってさ
624 名前：デフォルトの名無しさん mailto:sage [2011/08/28(日) 13:29:06.48 ]: >617
SMAP が新しくなった?
625 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 08:52:25.06 ]: 卒論で競馬や野球といったスポーツの多変量解析をテーマにし、
将来の成績やタイムや順位を予測するモデルを考えているのですが、
分からないことがありますので、ご存知でしたらどなたか教えて下さい。

まず、競馬にしろ野球にしろ過去成績データを説明変数として重回帰分析等の
モデルを作ろうとした場合、どの期間をデータとして使用するか、手掛かりが
掴めないのです。
626 名前：625 mailto:sage [2011/09/02(金) 08:57:46.26 ]: 安定性を考え、なるべく長い期間を取るべきとは思いますが、
具体的にどの位の期間を取れば良いか分かりません。

また長期間の成績データを使うと、最近調子が上がった馬や選手等の
直近の成績は活かせないし、長期間の過去データが存在しない新人や
新馬はどう予測するのか途方に暮れています。

野球なら新人を分析データから外せば良いかも知れませんが、競馬なら
新馬もレースに参加するので無視できないし、新馬の扱いが分かりません
627 名前：625 mailto:sage [2011/09/02(金) 09:13:54.48 ]: それにしても野球も競馬も背景の違いを扱いのが難しいですね。
野球の打率やら出塁率やらは、相手のレベルが違いますし、
競馬のタイムも走った場所や馬場の条件等が違います。

背景が違うものを比較するのに、多変量解析でファクター毎に
線形に分解して影響度を比較しようと考えています。
628 名前：625 mailto:sage [2011/09/02(金) 09:19:51.56 ]: たとえば、競馬のタイムなら競馬場、芝・ダート、馬場等のファクター
毎に分解して、他の条件が同じならダートの方が芝より○秒早い、
と言った感じで分析したいな、と思います。

これは例えば競馬場ごとのタイム差が有意かどうか検定を行い、
2元配置分散分析等で交互作用を分析し、ダミー変数や交互作用項を
利用して、重回帰分析の偏回帰係数をファクター毎の影響度と見なして、
分析するのが良いでしょうか。恐れ入りますがお知恵をお貸し下さい。
629 名前：625 mailto:sage [2011/09/02(金) 09:26:24.63 ]: 野球にしても競馬にしても日本語で読める統計やデータマイニング
絡みの本が少ないですね。

Sabermetricsは「メジャーリーグの数理科学」他数冊しかなく、
「メジャーリーグの数理科学」は上巻が絶版で図書館には無いし、
競馬は「実践データマイニング―金融・競馬予測の科学」位しか
無いです。

英語が苦手でも、やはり洋書で高い専門書籍を買うしかないですかね。
630 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 09:47:23.99 ]: 成長の確変を計算で予測出来たら世界が変わるぞ

野球の新人ならドラフトにかかるまでの成長曲線
競馬の新馬なら血統から求めれば良いかと

その後の成長なんて指導者や調教師や怪我次第だから、
重回帰でも主成分分析でも、あくまで肉体的な統計を取るくらいしか出来ん
631 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 12:37:46.71 ]: 学習期間を最適化したら良いんじゃないの？
632 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 15:24:39.73 ]: つうか、やってみる前に人に訊く時点で
データマイニングに向いてないよね
633 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 18:09:31.56 ]: 分かってることを解析しても意味ないからな
634 名前：デフォルトの名無しさん mailto:sage [2011/09/02(金) 18:31:35.72 ]: ttp://www.hakodate-ct.ac.jp/~tokai/tokai/research/paper/takei.pdf
この論文の楽曲推薦システムってなかなか面白そうだけど
楽曲の特徴の抽出に何を用いるかってなかなか難しいよね。
データマイニングを行う場合は対象についても勉強しないといけないし大変。
635 名前：デフォルトの名無しさん [2011/09/02(金) 23:13:36.51 ]: >>625
本よりも論文探したほうがいいよ
636 名前：デフォルトの名無しさん mailto:sage [2011/09/03(土) 16:38:14.15 ]: >>634
むしろ研究の本筋は特徴量の方だろうね。機械学習自体は定番のライブラリそのまま使うのがおおいと思う。
637 名前：625 mailto:sage [2011/09/03(土) 18:34:44.44 ]: 返信が遅く申し訳ありません。

>>630-631
>>635
アドバイス本当にありがとうございました!!色々と試してみます。

>>632-633
どうもごめんなさい。とても耳が痛いです…。
638 名前：デフォルトの名無しさん mailto:sage [2011/09/03(土) 19:05:02.31 ]: 今からFBIのプロファイリングの番組やるぞお前ら。
639 名前：デフォルトの名無しさん mailto:sage [2011/09/03(土) 19:16:36.27 ]: 録画＆アップ頼む
640 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 10:25:57.85 ]: FBIと日本のプロファイリングの精度ってどのくらい違うの？
641 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 10:28:41.73 ]: 日本は冤罪率が高いので比較できない。
642 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 11:18:37.08 ]: プロファイリングをモデルに置き換えるとしたら犯行内容ぽちぽち入力したら結果出てくる感じ？
643 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 11:35:01.10 ]: 最強なのは現場の刑事の勘
644 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 11:47:06.59 ]: それが日本で冤罪が多い理由なんだよな。
645 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 13:03:43.77 ]: 過去の凶悪事件で報道される、捜査中でのプロファイリングって大抵間違ってるよね
あれは犯人に安心感を与える為の罠なんだよっ（ｷﾘｯ
646 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 13:05:26.57 ]: 分類に不要な変数を見つけるのに決定木を用いる方法が良いかな？
多分最適化もできないと思うので
647 名前：デフォルトの名無しさん [2011/09/05(月) 16:22:40.59 ]: 決定木において、二分木と多分岐の
メリットとデメリットをそれぞれ教えて下さい！
648 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 16:27:44.04 ]: 2分木は多分木の特殊な場合だろう
649 名前：デフォルトの名無しさん [2011/09/05(月) 17:02:16.56 ]: >>648
多分木のほうが処理が速いとかいったメリットってないんですか？
650 名前：デフォルトの名無しさん mailto:sage [2011/09/05(月) 17:33:59.14 ]: 多分木は2分木の組み合わせで表現できるだろ。
651 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 04:42:17.97 ]: >>650
答えになってないな

>>649
2分木は林、多分木はジャングルと表現できる
652 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 04:43:41.34 ]: >>651
知らないならエラそう言わなきゃいいのにw
653 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 05:00:15.52 ]: そういえば野球選手と言えば例のその数学が戦略を決めるって本で選手の出塁率だか四球の数だかが重要な変量として有望な新人を見つけるみたいな話があったな。
後は映画の脚本で興行収入を予測したりとか
654 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 08:00:30.13 ]: >>652 >>652
655 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 09:41:39.06 ]: >>653
その辺りは選球眼や、いやらしい球をカットする技術を持っているかの指標だね
でも、長打力や肩や足は、生まれ持った素質でしか無いから、メジャーのトップクラスになるには両方大事
656 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 09:59:21.24 ]: そういう個別理論じゃなくて、統計の裏付けのあるデータにもとづいて戦略を
立てろという話なんだが。セイバーメトリクスでググれ。
657 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 10:22:35.17 ]: 鳩山由紀夫＜バントや盗塁は得点効率を下げる（ｷﾘｯ
ci.nii.ac.jp/els/110001186623.pdf?id=ART0001520064&type=pdf&lang=jp&host=cinii&order_no=&ppv_type=0&lang_sw=&no=1315272044&cp=
658 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 11:52:03.24 ]: >>656
ところで良い統計的決定をするには>>655みたいな
ビリーフモデルがあった方がいいんじゃないのか？
人間に解釈しやすい（事前確率を作りやすい）という意味でも
659 名前：デフォルトの名無しさん mailto:sage [2011/09/06(火) 16:32:49.10 ]: >>629
株価予測のやり方の方は実践してみた？
あの天井と底を決めるやり方が書いてないんだよね
660 名前：デフォルトの名無しさん [2011/09/06(火) 17:48:52.09 ]: 半教師あり学習と転移学習の違いについて詳しく教えてください！
661 名前：デフォルトの名無しさん mailto:sage [2011/09/07(水) 09:31:35.31 ]: やってることが違う
662 名前：デフォルトの名無しさん mailto:sage [2011/09/07(水) 21:15:59.46 ]: iPhoneのAkinatorがやってることは決定木だよね。
なるべく最短で見つけるためのNP困難で工夫してるんだろうけど
663 名前：デフォルトの名無しさん mailto:sage [2011/09/10(土) 02:22:42.14 ]: ブラック企業多そうな職種
664 名前：デフォルトの名無しさん mailto:sage [2011/09/12(月) 06:23:40.19 ]: >>662
最短であることは要求されていない。
なんとなく、思ったより早く絞れればいい。
665 名前：デフォルトの名無しさん mailto:sage [2011/09/12(月) 16:18:36.85 ]: 間違えて入力した時どうやって遡るのかが分からない
666 名前：デフォルトの名無しさん mailto:sage [2011/09/15(木) 09:35:43.82 ]: ベイジアンネットワークを実装しようと色々な本を読んでいますが、
変数にはガウシアンネットワークなどを除くと、基本的にカテゴリーデータ
しか使えないようですね。

そのため、数量データを等間隔に分割してカテゴリ化したり、
順序尺度に変換して分析しようとしていますが、カテゴリーデータに置き換える
客観的な指標や方法論などはございますでしょうか。

各種論文にはカテゴリーデータに置き換えるテクニックの記載がなかったもので。
それとも案外アナログに決めているんですかね？
667 名前：デフォルトの名無しさん mailto:sage [2011/09/15(木) 13:25:19.03 ]: k-meansとかx-meansすれば？
668 名前：デフォルトの名無しさん mailto:sage [2011/09/15(木) 17:37:03.39 ]: そういえば、x-meansを挙げるやつがたまにいるけど
クラスタを分割する条件が悪くて使い物にならないだろ
Wakeのx-meansも論文とは違う実装だし
669 名前：デフォルトの名無しさん mailto:sage [2011/09/15(木) 22:22:27.98 ]: ワケ？
670 名前：デフォルトの名無しさん [2011/09/15(木) 22:47:31.66 ]: キューティー・クラスタリングでぐぐれ
671 名前：デフォルトの名無しさん mailto:sage [2011/09/16(金) 00:09:41.28 ]: >>667-670
有難う御座います!!とても助かりました…。
672 名前：デフォルトの名無しさん mailto:sage [2011/09/18(日) 16:12:52.80 ]: pythonごみすぎてわろた
673 名前：デフォルトの名無しさん mailto:sage [2011/09/18(日) 16:37:14.20 ]: 来期は単位取れるといいね。
674 名前：デフォルトの名無しさん mailto:sage [2011/09/23(金) 22:20:46.96 ]: 知能のあるコンピュータウイルスって面白そうだね。
遺伝的プログラミングでコードを自己書き換えしてセキュリティに引っかからないようにするみたいな
675 名前：デフォルトの名無しさん mailto:sage [2011/09/23(金) 23:17:38.86 ]: >>674
5年前くらいから存在してないっけ？
どこかのカンファレンスで、そういったウィルスの対応方法を聞いたことがある。
676 名前：デフォルトの名無しさん mailto:sage [2011/09/23(金) 23:28:52.85 ]: ポリモーフィック型という奴だな
677 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 01:05:55.36 ]: もうあるのか～
でもこれを研究するのも面白そうだね
ただ発表することは出来なさそうだけど
678 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 01:59:39.63 ]: パソコン1つで1個体だと相当数感染させないと
まともな子孫作る程度の人口が確保できないよな。
そういうやり方じゃないのかな？
679 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 04:56:46.89 ]: 処理としての意味が変わらない範囲でコードを書き換えて
ウィルスのデータベースにヒットしないようにしてるだけだろ
680 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 09:49:26.83 ]: リアルウイルスも生き物１匹の体内で大量の個体が世代交代して
たまーに他の生き物のウイルス達と混ざるわけだよな。
なんかいかにもGAの並列計算で考えつきそうなネタだな
681 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 10:44:36.40 ]: まさに進化そのものだからな
機能そのものも変化できたら面白いのに
682 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 11:50:12.75 ]: 進化の裏に淘汰があるわけで、かならずしも思うようにならないかと。
683 名前：デフォルトの名無しさん mailto:sage [2011/09/25(日) 13:07:44.18 ]: 淘汰があるから（平均的には）良くなる方向にいく
684 名前：デフォルトの名無しさん [2011/09/26(月) 00:13:29.35 ]: モバイルエージェント）ﾁﾗｯ
685 名前：デフォルトの名無しさん [2011/09/26(月) 01:16:17.85 ]: 質問
集合K [ 2, 4, 5 ]
集合1 [ 3, 4, 5 ]
集合2 [ 1, 2, 4, 3 ]
集合3 [ 2, 4, 5, 1 ]

集合1～3のうち集合Kを全て含む集合を
高速に特定するにはどうしたらいいだろうか。
現実には集合は大量に存在するのでビットマスクは避ける方向で。
何かいい方法はない？
686 名前：デフォルトの名無しさん [2011/09/26(月) 03:50:12.78 ]: 相関係数法を使った協調フィルタリングを実装するのに一番簡単な方法を教えてください
今のところPhp(Vogooライブラリ）+SQLを利用しようと考えています
687 名前：デフォルトの名無しさん mailto:sage [2011/09/26(月) 04:51:38.71 ]: >>685
転置しろ
688 名前：デフォルトの名無しさん mailto:sage [2011/09/26(月) 09:44:17.56 ]: 某企業は、ある日いきなり韓国メーカーに呼び出され、

VIP待遇を受けて、韓国の粗悪なメカ工場視察イベントに招待された。

後、韓国はそのメーカーに対し、

「我々は貴様らに工場視察をさせてやったのだから、日本の工場を見せろ！」

と、言いがかりをつけてきて、日本の工場へずかずかと入り込んだ。

後、韓国の工場が日本の工場の技術を盗んで、そっくりな工場を作っていたことが発覚した。

日本の技術を賞賛し、工場を視察しに行くタイプの番組が増えているな。。。
689 名前：デフォルトの名無しさん mailto:sage [2011/10/01(土) 23:18:13.97 ]: >>688
ずかずかと工場に入り込んだだけで技術を盗めるなんて韓国人ってすごいんですね
690 名前：デフォルトの名無しさん mailto:sage [2011/10/02(日) 01:11:00.75 ]: キチガイのネトウヨのコピペに反応してどうする
691 名前：デフォルトの名無しさん mailto:sage [2011/10/02(日) 01:20:24.28 ]: できないとおもうりゆうは。。
692 名前：デフォルトの名無しさん mailto:sage [2011/10/02(日) 22:18:06.85 ]: 韓国の工場の製造機器なんて日本製が大量に入ってる。
だから韓国製品は日本製と品質が大して変わらない。ネトウヨはアホすぎる。
693 名前：デフォルトの名無しさん mailto:sage [2011/10/02(日) 23:34:04.58 ]: ターンキーで何でもできると考えるのはさすがに舐めすぎだけどな。
694 名前：デフォルトの名無しさん mailto:sage [2011/10/03(月) 05:46:07.19 ]: 日本の工場で実際に手を動かしてるのはブラジル人と中国人だけどな
695 名前：デフォルトの名無しさん mailto:sage [2011/10/04(火) 01:33:09.23 ]: 数量データを予測するのにSVMって使えるん？
696 名前：デフォルトの名無しさん mailto:sage [2011/10/04(火) 08:59:12.53 ]: samui
697 名前：デフォルトの名無しさん mailto:sage [2011/10/04(火) 22:29:09.33 ]: >>695
サポートベクトル回帰ならある

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef