[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 02/02 00:00 / Filesize : 198 KB / Number-of Response : 850
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【統計分析】機械学習・データマイニング【集合知】



1 名前:デフォルトの名無しさん mailto:sage [2010/10/04(月) 23:00:10 ]
何でもいいので語れ

【関連サイト】
機械学習の「朱鷺の杜Wiki」
ibisforest.org/index.php?FrontPage



175 名前:Tea and Coffee Time [2011/02/24(木) 07:12:59.52 ]
>>166(再)

掲示板等の匿名性は保たれているのでしょうか、暗に言語統制をしようとするための情報
漏洩ルートはないのでしょうか。個人情報保護法や「通信の秘密」を守る法律が軽視、無視されて、
掲示板などのインターネット上の匿名性がなくなると、最近話題の集団ストーカー行為等が引き起こされる
可能性があると考えられます。(下記参照)
infowave.at.webry.info/200804/article_1.html
掲示板やホームページ、あるいはブログの意見を消去せずに言語統制や集団ストーカー
の関係を調べるよい方法がいくつか考えられると思うのですがどうでしょうか。



176 名前:『2ちゃんねる』:海外からのデータマイニング?(再) [2011/02/24(木) 07:46:57.50 ]
『【ネット】2ちゃんねる、“言論なき日本”を見捨てた?…2ちゃんねる、ひろゆき氏の手を離れてシンガポール共和国の法人へ譲渡[1/2]』
(下記参照)
gimpo.2ch.net/test/read.cgi/news4plus/1230860771/
(以下引用)『譲渡先は「PACKET MONSTER INC. 」とされており、これについての詳細な説明はない。・・・(中略)・・・
また、書き込みを保存するサーバー自体はアメリカ合衆国にあり、従来、2ちゃんねる
ガイドに添えられていた「書き込み削除の最終責任は管理人ひろゆきにあります。 」という表現自体も削除されている・・・
(中略)・・・今回の“外国への譲渡”が、
書き込みをめぐる名誉棄損訴訟や法務省、警察庁など“ネットを取り締まる”官庁にも相当の影響を与えると思われる。』
(以上引用)

以上を読んでいただ後、下記を参照してください。
『アメリカ経由の通信情報ローンダリング手法』の確立可能性と傍聴法の無力化』
infowave.at.webry.info/201010/article_2.html

盗聴法改正案が来年提出され、もし成立すれば、基本的に米国のインターネット・サービス
を利用するユーザーは、国の区別なしに米公安機関による通信傍受の対象となる。これは
意外な落とし穴となるだろう。たとえば、東京から大阪までスカイプで電話をした場合、
もしその通話が米国の管理サーバーを経由していれば、理論上、米国公安当局は傍受をできる
ことになる。同様に、日本の知人や友人同士が楽しくフェースブックで交流していても、
そのメールやアップロードした写真、書き残したメモなどが米国のサーバーにある限り、
米国の公安当局が傍受あるいは閲覧することができるようになる。



177 名前:デフォルトの名無しさん mailto:sage [2011/02/24(木) 12:20:50.48 ]
TCと他map実装の比較(全部memcopy時)
fallabs.com/mikio/tech/promenade.cgi?id=64
なんとかなるかな

178 名前:デフォルトの名無しさん [2011/02/26(土) 12:41:48.45 ]
吉本ってこれ使ってネタ作ってる

話聞いてておかしいと思ったよ
なんかエキサイト翻訳的な日本語で話しかけられてるから意味が通じないって
言う、ハーフの友人の母なんかエキサイト翻訳の英文の意味が本国では通じな
いって言ってたけどな。

何度も何度も「子供たち」「子供たち」って聞こえて明らかに30過ぎたおっさんが
何言ってんだ?と思ったがな。

179 名前:デフォルトの名無しさん mailto:sage [2011/02/26(土) 14:21:45.10 ]
単語を適当にマルコフ連鎖でつなげれば、
100に1つくらいは使えるネタが作れそう。

180 名前:デフォルトの名無しさん mailto:sage [2011/02/27(日) 09:35:17.93 ]
ガンダムって教育型タイプコンピュータだったんだな。
www.youtube.com/watch?v=dXXd251N7C8
の13分あたり

181 名前:デフォルトの名無しさん mailto:sage [2011/02/27(日) 09:48:05.76 ]
常識だろ
ガンダムはSVMでNT判別するんだぜ?

182 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 12:03:48.96 ]
その当時にSVMが(ry

183 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 15:09:44.04 ]
なんか人口無脳作って喋らしたいんだけどフリーの喋らせるソフトってない?



184 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 16:29:55.90 ]
>>183
作りたいのか拾いたいのかどっちなんだ?

185 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 17:45:19.38 ]
拾いたいです

186 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 19:30:38.70 ]
>>185
作れよ。

187 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 19:43:50.89 ]
伺か

188 名前:デフォルトの名無しさん mailto:sage [2011/02/28(月) 22:20:08.98 ]
作るのは人工無能で、拾うのは人工有声

189 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 00:30:57.35 ]
>>188
そうです。
喋らせる言葉はテキストマイニングで決める予定なので欲しいのは人工有声です。

190 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 12:56:32.13 ]
タミーの買ってやれよ

191 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 13:45:39.26 ]
ニコニコで人工有声使ってる人いなかったっけ?

192 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 13:53:37.87 ]
テキストマイニングの分野で入門自然言語処理ってどう?

193 名前:デフォルトの名無しさん [2011/03/01(火) 15:11:23.18 ]
別に



194 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 16:16:24.39 ]
>>193
だったら書き込まないでください

195 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 21:11:40.43 ]
>>189
じゃ、お前って結局何もする気ないってことじゃん。
帰れよ。

196 名前:デフォルトの名無しさん mailto:sage [2011/03/01(火) 23:17:24.54 ]
なぜそうなるのか、よく分からん。
音声エンジンは作らないけど、AI作るんじゃないのか?

197 名前:デフォルトの名無しさん mailto:sage [2011/03/02(水) 11:19:10.31 ]
このスレじゃ人工有声も作るのがデフォらしい

198 名前:デフォルトの名無しさん mailto:sage [2011/03/02(水) 20:05:55.59 ]
単純パーセプトロンって入力層と出力層だけの構成のもの?
それとも出力層ニューロンが1つだけのものをいうの?


199 名前:デフォルトの名無しさん mailto:sage [2011/03/03(木) 21:48:14.53 ]
出力層ニューロンが1つだけのもの。
層の数は関係ない。

200 名前:デフォルトの名無しさん [2011/03/09(水) 23:51:17.98 ]
SIで機械学習使った仕事が出来るのってどんな分野ですか?情報家電とか?

201 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 00:44:07.42 ]
SIで情報家電って、そのSIは何だろう。

202 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 00:45:50.16 ]
BIなど分析系の業務なら使えるのでは。

203 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 02:01:00.06 ]
Web系企業はどこでもHadoop使ってデータマイニングやってるけどね




204 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 19:44:03.64 ]
>>200
そこら辺のメーラーにも機械学習が使われているから、
機械学習を使ってない仕事を探す方が難しい。

205 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 19:52:49.00 ]
いや、直接ML実装するのは末端パートナー
SIerは末端パートナーから買い叩いたMLをポンと繋げるだけ
もちろん、SIerのSE様はMLなんて理解できてないから、
使えねえゴミシステムができあがるわけだがw

206 名前:デフォルトの名無しさん mailto:sage [2011/03/10(木) 20:23:15.40 ]
実際つくるのは、SIerだと研究所ぐらいだよな

207 名前:デフォルトの名無しさん [2011/03/20(日) 22:21:37.03 ]
パターン認識もここでいいの?

208 名前:デフォルトの名無しさん mailto:sage [2011/03/21(月) 01:39:02.32 ]
>>16
批判思考、論理思考(広範囲の可能性から根拠に基づき対策を確定)、
人の気持ちを察する。これが出来なきゃコンサルは無理。
データをインフォメーションに変えるのは人間だからな。

209 名前:デフォルトの名無しさん mailto:sage [2011/04/01(金) 20:07:40.61 ]
機会学習、データマイニングを勉強して幸せになれるようなことって何?
具体的にどんなことが出来るようになるの

210 名前:デフォルトの名無しさん mailto:sage [2011/04/01(金) 20:19:39.67 ]
>>209
論文を書ける

211 名前:デフォルトの名無しさん mailto:sage [2011/04/01(金) 21:23:29.19 ]
そんなしょうもないこと聞いてないです。
もう結構です

212 名前:デフォルトの名無しさん [2011/04/01(金) 22:13:30.65 ]
>>209
女にモテる

213 名前:デフォルトの名無しさん mailto:sage [2011/04/01(金) 22:17:02.11 ]

ジ  ハ ,,ハ
デ (;゚◇゚)z
!?



214 名前:デフォルトの名無しさん mailto:sage [2011/04/02(土) 06:03:59.97 ]
ヒルズ勤務になれる

215 名前:デフォルトの名無しさん mailto:sage [2011/04/02(土) 06:46:22.60 ]
カネがもらえる

216 名前:デフォルトの名無しさん mailto:sage [2011/04/02(土) 11:03:44.70 ]
ここまで自演

217 名前:デフォルトの名無しさん mailto:sage [2011/04/02(土) 15:46:18.69 ]
機会学習の勉強の本教えて〜

218 名前:デフォルトの名無しさん mailto:sage [2011/04/03(日) 22:54:49.03 ]
マンガでわかる統計学ってどうすか

219 名前:デフォルトの名無しさん mailto:sage [2011/04/04(月) 00:37:16.22 ]
意外に良書だけどスレチ

220 名前:デフォルトの名無しさん mailto:sage [2011/04/04(月) 09:54:07.28 ]
>>219
統計もあながちスレチではないと思ったんですが関係ないんでしょうか?

221 名前:デフォルトの名無しさん mailto:sage [2011/04/04(月) 16:30:37.69 ]
統計は帰納学習だから機械学習といえなくもない
ベイズ統計までくると完全に機械学習と区別できなくなってくる

222 名前:デフォルトの名無しさん mailto:sage [2011/04/04(月) 18:24:54.79 ]
つうか線形回帰の時代から機械学習は統計無しに語れんだろ。

223 名前:デフォルトの名無しさん mailto:sage [2011/04/04(月) 22:49:09.47 ]
ベイズって今でもAIとかに使われてるの?
エキスパートシステムよりニューラルネットワークスの方が優れている事がわかった時点で
終わってると思ってた



224 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 00:58:38.84 ]
ネットワークスw

別に優れているわけじゃないでしょ。
得意分野が違うだけで。

225 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 11:19:38.43 ]
わかりやすいパターン認識って今でも良書

226 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 18:36:38.21 ]
です

227 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 20:01:59.13 ]
西日本も福島原発の放射能に曝される。

4/7 予測 up3.viploader.net/ippan/src/vlippan198234.jpg
発表はドイツ気象庁 www.dwd.de/

228 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 22:56:27.28 ]
ベイズネットは今も最前線で活躍してる
スパム分類はほとんどベイズネットが入ってる

229 名前:デフォルトの名無しさん [2011/04/05(火) 23:34:03.69 ]
ベイズネットは、計算が高尚な割りに、
大した性能がでてないけどね。。
因果関係に自分で縛られて過学習を起こしやすいような希ガス

230 名前:デフォルトの名無しさん mailto:sage [2011/04/05(火) 23:41:09.44 ]
このスレ的にラフ集合ってどうなん?

231 名前:デフォルトの名無しさん mailto:sage [2011/04/06(水) 04:37:59.39 ]
ベイジアンネットワークとナイーブベイズぐらい区別つけようぜw

232 名前:デフォルトの名無しさん mailto:sage [2011/04/08(金) 11:43:56.09 ]
フリーソフトでつくる音声認識システムすら難しいんだがフーリエ級数展開とか出来て当然なの?

233 名前:デフォルトの名無しさん mailto:sage [2011/04/08(金) 19:39:22.78 ]
フーリエ級数程度でどうにかなるチョロい時代はとっくに終わった



234 名前:デフォルトの名無しさん mailto:sage [2011/04/08(金) 20:27:15.77 ]
最低限大学数学ぐらい出来てもらわないと

235 名前:デフォルトの名無しさん mailto:sage [2011/04/08(金) 20:31:04.04 ]
>>232
音声認識であればフーリエ級数は必要だと思うけど。
分野によって必要になる数学は違ってくるよ。

236 名前:デフォルトの名無しさん mailto:sage [2011/04/08(金) 22:37:48.90 ]
フーリエ級数というより、周期を拡大したフーリエ変換ね

237 名前:デフォルトの名無しさん mailto:sage [2011/04/09(土) 01:59:14.96 ]
フーリエ急須自体は高校数学レベルでも理解可能

238 名前:デフォルトの名無しさん mailto:sage [2011/04/09(土) 11:07:22.43 ]
質問者ですがどうもありがとう。
わかりやすいパターン認識も立ち読みしてみたんですがとりあえず数学の勉強が必須みたいなので最低限どんな分野を勉強したら良いでしょうか?
微積と線形あたりは勉強し直そうかと思ってるんですが

239 名前:デフォルトの名無しさん mailto:sage [2011/04/09(土) 12:31:32.85 ]
統計学は必須

240 名前:デフォルトの名無しさん mailto:sage [2011/04/09(土) 20:33:34.16 ]
AIなら統計学じゃなくて確率論の方だと思う

241 名前:デフォルトの名無しさん mailto:sage [2011/04/09(土) 20:39:11.13 ]
三次の非線形モデルだろう

242 名前:デフォルトの名無しさん mailto:sage [2011/04/10(日) 01:37:58.06 ]
>>239-241
とりあえずフリーソフトでつくる音声認識システムの分からない所は読み飛ばしながら最後まで読んでみようと思います。
アドバイスありがとうございました。

243 名前:デフォルトの名無しさん mailto:sage [2011/04/13(水) 02:12:55.66 ]
数式理解できないんじゃ仕方がない気もするが・・・まぁいいか



244 名前:デフォルトの名無しさん mailto:sage [2011/04/13(水) 02:19:50.00 ]
数式だけじゃなくて「ε」などに配慮したアルゴリズムも知る必要があるぞ
だが、そうしたライブラリーも出回っているので、
それなりに勉強すれば、細かいところまで押さえなくても、なんとかなるかも?

245 名前:デフォルトの名無しさん mailto:sage [2011/04/13(水) 23:31:51.13 ]
組み合わせ論
ベイズ理論(事前確率と事後確率の式の理解)
行列・ベクトル演算
指数関数・対数関数
英語

この辺が得意な人なら大抵の本は読めると思う


246 名前:デフォルトの名無しさん mailto:sage [2011/04/14(木) 05:38:16.49 ]
あとは、
偏微分
テイラー展開
ぐらいなもんだね、楽チンだw

247 名前:デフォルトの名無しさん mailto:sage [2011/04/15(金) 12:24:12.12 ]
ずいぶん敷居が高いのな

248 名前:デフォルトの名無しさん mailto:sage [2011/04/15(金) 12:53:55.30 ]
集合知プログラミング買ったぜ〜
これから始めてみよう

249 名前:デフォルトの名無しさん mailto:sage [2011/04/15(金) 21:00:35.17 ]
高3+程度と言うと、英検で言えば2級か

250 名前:デフォルトの名無しさん mailto:sage [2011/04/16(土) 11:11:05.84 ]
ラグランジュ法ぐらいはあらかじめ理解してないとしんどいだろ

251 名前:デフォルトの名無しさん mailto:sage [2011/04/16(土) 18:38:58.94 ]
確率統計のいい本ない?
東大出版の統計学入門読み終わったくらいのレベルなんだけど

252 名前:デフォルトの名無しさん mailto:sage [2011/04/16(土) 22:45:52.32 ]
>>251
「図解でわかる」レベルの本を読み終えたら、そのまま機械学習の本に入ればいいよ

253 名前:デフォルトの名無しさん mailto:sage [2011/04/16(土) 22:59:52.49 ]
「マンガでわかる」じゃダメですか?



254 名前:デフォルトの名無しさん mailto:sage [2011/04/17(日) 23:34:57.42 ]
標本となるデータってどっから調達してるの?

255 名前:デフォルトの名無しさん mailto:sage [2011/04/17(日) 23:52:10.55 ]
要するに機械学習で用いられるアルゴリズムの数式を理解出来るようになれば良いんだなお前ら。


256 名前:デフォルトの名無しさん mailto:sage [2011/04/18(月) 21:07:31.51 ]
>>254
国際大会とか学会が金融や交通の架空のコンテスト用のデータを公開してる

あとはWEBサーバのログとか

257 名前:デフォルトの名無しさん mailto:sage [2011/04/18(月) 22:35:53.61 ]
なるほど
いわゆる「お客様の声」とか、評判分析に使えるようなテキスト・データ無いかな?
自動車だと国交省のクレームシステムがあるけど、基本的にネガティブ系に偏ってるし。
件数として100万件オーダーであるとうれしい。2ちゃんのログは勘弁。

258 名前:デフォルトの名無しさん mailto:sage [2011/04/18(月) 22:51:02.80 ]
>>257
架空のヤツしかない
実在のヤツが欲しければ、企業に就職するか、企業と共同研究してる大学の研究室に入るしかない


259 名前:デフォルトの名無しさん mailto:sage [2011/04/19(火) 19:20:45.54 ]
企業の中の人ですが、
近頃はプライバシー保護がどうので、
なかなか思うように使わせてもらえません。

情報収集時にエンドユーザに見せる文言も
法務がやたらと保守的な文章にするし、
現場がよほど協力的じゃないと難しいっす。

260 名前:デフォルトの名無しさん mailto:sage [2011/04/19(火) 23:22:31.83 ]
>>258-259
サンクス。やっぱ難しいみたいだね。自分も口コミ系サイト (kakaku.com等)、オンラインショップの
リコメンド (amazon等)、blog、facebook、twitter、2ch など探してみたけど、ゴミが多くて所望の情報を
選り分けるのが大変という印象。数100件程度ならともかく、それ以上は現実的じゃないと分かりました。

おっしゃるとおり企業に入るか、データを買ってくるしか、大量データをそろえるのは難しい感じですね。

261 名前:デフォルトの名無しさん mailto:sage [2011/04/20(水) 09:50:37.18 ]
こんなのあるね
xtori.blogspot.com/2011/04/blog-post.html
お客様の声じゃないけど、データマイニングや機械学習はめっちゃ適用できそう


262 名前:デフォルトの名無しさん mailto:sage [2011/04/20(水) 23:02:53.27 ]
論文書くときは、実在のデータを探すのが一番難しい

263 名前:デフォルトの名無しさん [2011/04/20(水) 23:23:46.00 ]
WebAPIとかないの?



264 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 19:20:29.88 ]
>>262
そうか?
どうせ比較評価するために学術系公開データを使わざるを得ないから、
特に論文書くためのデータで困ったことはない。

265 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 22:05:34.20 ]
>>264
企業の中の人だが、実際のデータだと迫力が違ってくると思うよ。もっとも、扱いが制限されるので
結果が外に出ることはないのだけど、どうしても見たいとかならインターンシップとかで中に入ればOK。

266 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 23:43:52.33 ]
査読や追試されない論文もあるんだよ

267 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 23:45:42.93 ]
Googleとかインフラとかの社内統計データでの論文発表多いよね。

268 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 23:47:09.78 ]
データマイニングの基礎ってアルゴリズムの手法を詳しく解説してる見たいだけど
入門向けとしてはどう?

269 名前:デフォルトの名無しさん mailto:sage [2011/04/22(金) 04:26:07.85 ]
>>267
まあ、それはググルだから聞いてもらえるわけだがなw

270 名前:デフォルトの名無しさん [2011/04/24(日) 21:21:50.60 ]
ベキ分布でリスク管理のすすめ
f.blogos.livedoor.com/opinion/article/5513200/

271 名前:デフォルトの名無しさん mailto:sage [2011/04/25(月) 02:27:15.48 ]
重み空間だとか重みベクトルは特徴ベクトル+1次元だとかマジ難しい

272 名前:デフォルトの名無しさん mailto:sage [2011/04/26(火) 13:27:29.85 ]
データマイニングで効果や利益でるの?

273 名前:デフォルトの名無しさん mailto:sage [2011/04/26(火) 17:52:28.64 ]
>>272
マイニング対象、入手可能データ、マイナーの技量、顧客の能力とやる気、そして運による。



274 名前:デフォルトの名無しさん mailto:sage [2011/04/26(火) 21:29:12.32 ]
デジコンより在庫の回転率が上がる物販のが効いてくるのか?

275 名前:デフォルトの名無しさん mailto:sage [2011/04/30(土) 17:01:08.53 ]
「はじめての機械学習」って本が出たね。
プログラム例がC言語で書かれてるらしいからちょっと興味ある。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<198KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef