【統計分析】機械学習・データマイニング24
at TECH
[前50を表示]
600:デフォルトの名無しさん
19/06/01 16:30:05.62 hwSQjOfA0.net
取引用のAPIとか流行ってないのもあると思うけど
601:デフォルトの名無しさん
19/06/01 17:34:56.30 dhP+frpUx.net
>>581
GMO証券が昔やってたけど、プログラマーが業者間アービトラージやりすぎて禁止にしたんだわ
同じUSDJPYでも業者間で開きがあってね、でも基本は同じ価格だから監視して反対売買するだけでノーリスクだったんだ
そしたらシステムの不備をついての取引はなかった事にするって決められて取引ノーカン、待て待てお前らもシステムの不備で個人に損失押し付けてるだろってなって、GMOがめんどくせ、でAPIごと無くなったw
602:デフォルトの名無しさん
19/06/01 17:38:45.74 hwSQjOfA0.net
GMO API懐かしい。
なるほど、そんな裏話があったとはw
603:デフォルトの名無しさん
19/06/01 18:51:47.90 GYFwl+wK0.net
「手を動かしながら学ぶ ビジネスに活かすデータマイニング」尾崎 隆
禿げてるくせにアイコンではドフサなのなw
604:デフォルトの名無しさん
19/06/01 21:33:13.93 q5GNYH3B0.net
これはひどいw
フレーム問題は解決済みというこのブログの62からの書き込みをご覧下さい。
ななしさんvs田方さんの議論が続いているけど
田方さんはひたすらコピペを繰り返すのみw
どちらの意見の方が正しいと思いますか?
URLリンク(robomind.co.jp)
605:デフォルトの名無しさん
19/06/01 22:20:06.45 6lfNl3yX0.net
>>585
わたしはナナシさんに一票ですかねー
606:デフォルトの名無しさん
19/06/01 22:41:25.66 2XldKqBd0.net
双方、定義が曖昧で詰め切れてないような
言葉で説明するより、数式化した方が解りやすい議題では?
607:デフォルトの名無しさん
19/06/01 22:47:35.18 6lfNl3yX0.net
確かにそんな感じはするよね
ナナシさんの方は人間すら解けない一般化フレーム問題について言及してそうだし
田方さんの方は条件が揃えば有限推論にまで落とし込めるレベルまで来てるって話してる
自分はまだ後者すら怪しいと思ってる
608:デフォルトの名無しさん
19/06/02 03:44:15.71 2KxPItQH0.net
ボーナス出たらPC買い替えたいんだけどみんな自宅でどんなPC使ってる?
コンペ出てる人とかはモンスタースペックなんだろうか
今使ってるのが下のスペックなんだけどGPU積んでるやつそろそろほしい
ノートPC
メモリ8G
SSD128G
609:デフォルトの名無しさん
19/06/02 06:15:33.28 IIH/Ft8W0.net
>>589
ゲーミングPCにUbuntu入れてる
Core i7-8700
32GB
RTX-2080Ti
30万円くらいしたけど15万円くらいのノートPCにして残りはクラウドでも良かったかな
610:デフォルトの名無しさん
19/06/02 08:49:41.97 sOEEtAtn0.net
automlでいいじゃん
611:デフォルトの名無しさん
19/06/02 11:39:59.34 KRm86vg2a.net
colabでタダで使えるGPUが50万ぐらいするやつだから、それ以上の金をつぎ込むかどうしてもオフラインで使えなければならないとかでなければ
PCはできるだけ安価にして機械学習の実行はcolab使った方が圧倒的にマシ
612:デフォルトの名無しさん
19/06/02 11:42:57.91 +FZaNNUF0.net
EC2のp2インスタンスで優雅に実行してる
613:デフォルトの名無しさん
19/06/02 11:49:22.08 fhCQazd50.net
URLリンク(headlines.yahoo.co.jp)
614:デフォルトの名無しさん
19/06/02 16:16:23.54 sOEEtAtn0.net
向こうにデータが流れちゃうんだっけ?
615:デフォルトの名無しさん
19/06/02 16:54:44.09 bAFc1zkP0.net
>>594
だれが責任取るんだろうな
616:デフォルトの名無しさん
19/06/02 19:01:56.94 J26IJNP50.net
AIも居眠りするんか
617:デフォルトの名無しさん
19/06/03 00:44:11.05 ovfSzwnAM.net
seq2seqをrnnではなくcnnでやる論文が出たの、まだ一年前か
あまりにも技術の進歩が早すぎて辛い。学習コストが高すぎてプライベートを侵食してる
618:デフォルトの名無しさん
19/06/03 00:59:05.77 XztrACRT0.net
初歩的な質問ですいませんがAI系の論文てどこで見れるんですか?
619:デフォルトの名無しさん
620:sage
https://arxiv.org/
621:デフォルトの名無しさん
19/06/03 01:39:49.35 XztrACRT0.net
>>600
英語なんすね・・・(^_^;)
ありがとうございます
622:デフォルトの名無しさん
19/06/03 07:44:41.95 uDEDVvyl0.net
グーグル翻訳かけろよ
623:デフォルトの名無しさん
19/06/03 08:08:44.21 3/CobnB+0.net
てかクソみたいな日本語解説よりも良い論文てのは読みやすいもんだから。
624:デフォルトの名無しさん
19/06/03 08:52:30.51 laJYrrTta.net
英語なんすねと言ってる時点で論文読むのは無理
625:デフォルトの名無しさん
19/06/03 09:05:36.33 lmgaybdAM.net
日本語の論文?で完結する分野あるのかね。歴史、宗教、文学くらいかや
626:デフォルトの名無しさん
19/06/03 09:51:04.68 NMMhu3n80.net
>>605
だとしても前者ふたつは古文書という難関が待っているw
627:デフォルトの名無しさん
19/06/03 10:21:07.26 KMfIyW070.net
美人シリーズ第4弾
URLリンク(youtu.be)
628:デフォルトの名無しさん
19/06/03 12:03:19.08 e0wnqHBFa.net
今中国がアメリカ追い越したからアメリカ人は中国語に四苦八苦してるって聞いたが
629:デフォルトの名無しさん
19/06/03 12:12:24.36 ZJy6OnVgF.net
日本語で書いてあっても読めんとか言うよこういうモンスターは
630:デフォルトの名無しさん
19/06/03 12:55:46.32 4oSq2JT3a.net
数学と英語苦手な時点でこの分野はやめた方がいい
これまでのIT土方と違ってそれなりに頭は必要な分野
631:デフォルトの名無しさん
19/06/03 15:18:59.46 KMzFsLrVM.net
そう
英語と数学は勉強したほうがいいね
じゃないと仕事にならんでしょ
632:デフォルトの名無しさん
19/06/03 15:24:19.33 IZ54YEPMp.net
プログラマー、ソフトウエアを目指す限り、英文からは逃れられないよ。
そこがクリアできてもIT土方が沢山いるのに。
そもそも何かわからなかった時に、どうやって解決法を見つけてるんだよ。 日本語で間に合ってる? よほど時代遅れの知識だな。
633:デフォルトの名無しさん
19/06/03 16:28:44.31 dNq8yLNDM.net
そこそこなアプリ作るのと機械学習ってどっちが難しい?
634:デフォルトの名無しさん
19/06/03 18:06:46.78 S2kjcDL10.net
【速報】クオカード五百円分とすかいらーく優待券をすぐ貰える
URLリンク(pbs.twimg.com)
@ スマホでたいむばんくを入手
A 会員登録を済ませる
B マイページへ移動する。
C 招待コード→招待コードを入力する [Rirz Tu](スペース抜き)
今なら更に4日18時までの登録でクオカードとすかいらーく優待券を両方ゲットできます
数分で出来ますのでお試し下さい
635:デフォルトの名無しさん
19/06/03 18:44:54.25 IFRF1HL70.net
>>613
機械学習だけやるならそんなに難しくないでしょ
フレームワーク使えば理論知らなくても結果だけはだせるし
基本的にバッチ処理だし
この地味な作業を楽しいと思えるかが重要
636:デフォルトの名無しさん
19/06/03 19:02:00.26 KMzFsLrVM.net
今のところPythonのライブラリに
データ突っ込むだけで仕事になってしまうからなあ。
今後はそれだけじゃあダメだと思うけどね。
若い人は今のうちに英語と数学を
勉強しておくべきと思いますね。
637:デフォルトの名無しさん
19/06/03 19:11:49.90 K3p1xLZi0.net
>>614
CM見てインスト済み
638:デフォルトの名無しさん
19/06/03 19:36:10.22 TWqm3GopM.net
そんな仕事あるんか
解釈性もくそもないな
639:デフォルトの名無しさん
19/06/03 19:50:11.89 3/CobnB+0.net
英語は必要だとは思うがそもそも日本語で十分
640:ネところもできてない奴は多い。 そういう意味では英語わからんでも十分。
641:デフォルトの名無しさん
19/06/03 20:03:16.10 uDEDVvyl0.net
chainer(笑)のやつか
松尾豊(笑)のやつなら日本語だろ
642:デフォルトの名無しさん
19/06/03 20:29:56.17 VGERDnng0.net
>>619
意味不明、日本語を勉強したらw
643:
19/06/03 20:36:09.49 4mhHvrQR0.net
>>608
アメリカ人に中国語は無理でしょうね…
まず漢字を1万ほど覚えなくちゃならないですから
644:デフォルトの名無しさん
19/06/03 20:53:44.42 VGERDnng0.net
帰化シナ畜の発言は重い
645:デフォルトの名無しさん
19/06/03 20:57:59.06 uC3eXgjBM.net
なんで日本人が作るAIってレベル低いの?
646:デフォルトの名無しさん
19/06/03 21:06:24.06 9zscLiuLM.net
AIは日本人の仕事を奪うからな。
647:デフォルトの名無しさん
19/06/03 21:12:54.57 tuBqQaKmM.net
ジェネラリストに作らせるからじゃない?
648:デフォルトの名無しさん
19/06/03 22:12:54.02 3/CobnB+0.net
アメリカだろうと中国だろうとまともに応用されてる機械学習技術なんてそう多くはない。
単純に当たりづらいものに規模で負けてりゃそりゃそうなるわ。
649:デフォルトの名無しさん
19/06/03 22:21:54.97 XztrACRT0.net
最新の論文を読んでないと仕事にならないとか思い込んでるからなんだよな
人のアイデアをパクってても新しいものは生まれない
650:デフォルトの名無しさん
19/06/04 00:45:55.87 8xHD1vRka.net
大半のエンジニアはパクる能力から発展して新しく生み出す能力を身につけるんだけどな
無から生み出せるのなんて一握りの天才だけなのでそんなのを前提に物事考えてはならない
651:デフォルトの名無しさん
19/06/04 02:01:41.10 KLSsoQXNM.net
無から生み出せるなんて
神のみだよ
人は脳の物理的限界を
超えられないんだ
サルと同じようなものさ
652:デフォルトの名無しさん
19/06/07 22:31:32.71 NFFQc2wE0.net
>>616
>今のところPythonのライブラリに
>データ突っ込むだけで仕事になってしまうからなあ。
将来的には、似たようなことが主流になるだろう。
通常言われる専門の技術者が作ったものは信用されなくなると思う。
信用度の高いものが、パッケージのような形で供給され
それを使うのが一般化してくると思う。
今までの数理技術系と同じ流れになると思うよ。
653:デフォルトの名無しさん
19/06/07 22:51:34.40 SEIOZ3Zi0.net
機械学習の難所は、その突っ込むデータの選定としかるべき前処理かと
654:デフォルトの名無しさん
19/06/08 00:17:58.14 K02PGDcbH.net
その前処理もAIがやるようになるだろうなあ
スペシャリストの中のスペシャリスト以外は働けない世の中になりそう
655:デフォルトの名無しさん
19/06/08 00:39:31.90 VVVFFkBt0.net
>>632
それはその通りなんだが
AI関係の人はほとんどが、旧来からの分析者に比べると
その辺りを嫌う傾向、および軽視するがあるように見受ける。
656:デフォルトの名無しさん
19/06/08 05:49:01.12 2hi7btAr0.net
データは社内のデータベースにある
そこから引っ張るとしてとりあえずSQL文は書けないといけないが
AI系の人でまともにデータベースやSQL知ってる人を知らん
画像処理や自然言語処理も知らん
コモディティ化した今のディープラーニングなら
理論知らなくても解析できるし
その辺理解してるデータエンジニアだけが生き残りそう
657:デフォルトの名無しさん
19/06/08 08:18:18.40 JxaHk6L10.net
>>631
知ったかしてるところ悪いが「数理技術」はそこまで安定したことは一度もない。
658:デフォルトの名無しさん
19/06/08 08:23:50.60 5drHbnb00.net
機械学習やってる研究者って天才の実装パックてるだけやん。。。
まあ数学者じゃないから仕方ないけどもう少し数学的なとこを考えてほしい
659:デフォルトの名無しさん
19/06/08 08:28:17.16 JxaHk6L10.net
CNTK とか数学的アプローチはある。ただ恐ろしく実用的ではない。
660:デフォルトの名無しさん
19/06/08 09:45:57.34 VVVFFkBt0.net
>>636
おそらく言っている意味と、あなたが捉えている意味が異なるんだとおもう。
たとえば、医薬など、学会や国際的な組織に亭主るする際に、この手法は
私があらたにプログラムしましたでは、信用してもらえない。
その論文などのために、みんながデバックしろという話になってしまう。
661:デフォルトの名無しさん
19/06/08 10:29:12.95 o8w0Fi6UF.net
そやな、閉じた世界なら何でもいいけが信頼性考えるとご免こうむる。
金融の資金運用でも自己資金ならどうでもいいが、預託資金の運用だと
説明責任もあるから、分析などのコアには信頼度の高いもの使う。
662:デフォルトの名無しさん
19/06/08 10:42:37.12 3e6+W68wH.net
AIやってて画像処理も自然言語処理も知らないって何やってた人なのだろうか
663:デフォルトの名無しさん
19/06/08 10:43:11.34 o8w0Fi6UF.net
考えたら機械学習でPython利用が多いというのも、流用できるからが多いわけだから、このの世界も次第にそうなって行くだろ。業務と手法のインターフェースに成れる人、あるいは、商用パッケージ作る人以外は職が難しくなるかもまだ先だろうけど。
664:デフォルトの名無しさん
19/06/08 11:01:05.35 o8w0Fi6UF.net
>>641
AIで画像処理中心は今に始まった話だからね
665:デフォルトの名無しさん
19/06/08 11:03:57.06 pkTweyaS0.net
>>639
馬鹿乙
666:デフォルトの名無しさん
19/06/08 11:10:54.44 ryWt2GlsF.net
日本が遅れてる理由を垣間観た気がする
667:デフォルトの名無しさん
19/06/08 12:03:39.89 uBDMoQSsa.net
ベイジアン最適化は学習を自動化させる目的で使われてるよ
668:デフォルトの名無しさん
19/06/08 12:22:42.56 88WJsb000.net
>>641
AI作れた?
669:デフォルトの名無しさん
19/06/08 12:26:12.19 ZCxD/IFaa.net
>>647
AIって何を言ってる?
670:デフォルトの名無しさん
19/06/08 12:39:27.20 TXqpB7K3M.net
東大は松尾豊も
叔父さまのコネで
東大の教授になったのね
なんであの馬鹿たれが
異常に若くて教授になれたのか
不思議だったんだ
671:デフォルトの名無しさん
19/06/08 12:40:53.96 CckI98TW0.net
馬鹿ばっかり
672:デフォルトの名無しさん
19/06/08 12:57:59.23 JxaHk6L10.net
>>639
実際問題信頼できる統計計算なんて回帰分析ぐらいのもので、
random forest系統、deep learning 系統など少しでも複雑な手法の場合、
安定した実装なんてものは未だかつてない。
ただ有名どころを使ってまっせってアピールが蔓延っただけで
その種の業界の信頼度が揺らぎまくったというのがここ数年の流れだろう。
何かを発見する際の手法としては使われてても
何かを保証するツールとしてはまだ全然だし、もしかしたら原理的に無理、もしくは不可能の可能性は結構ある。
673:デフォルトの名無しさん
19/06/08 13:34:26.87 CckI98TW0.net
コネで東大教授になれるのかw
674:デフォルトの名無しさん
19/06/08 15:36:30.34 tdlQ+u900.net
なれるだろ
iPSでなんかやらかした人も東大教授(准教授だったか?)だし
特に機械学習なんて日本のレベル低すぎてどんぐりの背比べなんだから
コネにならない方がおかしいわ
675:デフォルトの名無しさん
19/06/08 15:57:40.02 2hi7btAr0.net
松尾さんって人まともな論文出してるの
日本でヒントン氏レベルの扱いなんだが
676:デフォルトの名無しさん
19/06/08 16:10:48.96 wPg0m4E00.net
>>652
最低限の実力(外部資金獲得)があること
他に同じ研究をしている人が学内にいないこと
コネはないよりあった方がいい
論文はあればいいが、最近の大学はどこも金がないから産学連携を前面に出せる人を
677:~している
678:デフォルトの名無しさん
19/06/08 16:17:22.39 wPg0m4E00.net
>>654
東大で教授まで来ると研究時間はほとんど取れないから、研究方面での活躍は余程いい弟子が来ない限り難しいだろう
679:デフォルトの名無しさん
19/06/08 16:29:43.96 CckI98TW0.net
>>655
工学部の事情はしらんが、そんな当たり前のことは聞いていない
680:デフォルトの名無しさん
19/06/08 16:31:12.45 2hi7btAr0.net
>>656
研究できないって訳がわからない
最高学府のAI研究室だよ?
681:デフォルトの名無しさん
19/06/08 16:32:47.46 CckI98TW0.net
>>639
こういうプログラムを書いたことのない馬鹿ばっかり
682:デフォルトの名無しさん
19/06/08 16:50:05.05 wPg0m4E00.net
>>658
こればっかりはもう、本当に情けない話だが事実だ
研究時間が取れるのはせいぜい准教授までだ
優秀な弟子を育てるためのフレームワークを組むのが彼の仕事だと私は思うが、責めるべきはそこじゃないかね
683:デフォルトの名無しさん
19/06/08 19:28:31.58 dgEPQa3n0.net
Geoffrey Hintonはlast authorが多いけどfirst authorが今でもある
一方、松尾は無い
松尾の研究室からでる論文は東大のわりにショボい
誰の意向か分からんが
日本でのai広報担当ポジを得てる
684:デフォルトの名無しさん
19/06/08 19:49:27.00 XbfNvLSpp.net
>>661
First Authorについては70歳を超えて学内事務など皆無の爺ちゃんと比較するのはフェアではないな
比較するならLeCunだろう
それより二つ目の件がむしろ問題だな
良質な論文を量産できる環境構築を早急に行うべきだ
東大はとにかく学生指導を甘く考えている
685:デフォルトの名無しさん
19/06/08 20:53:36.86 JxaHk6L10.net
日本でAIで金引っ張ってくるのが上手いやつは詐欺師しか見たことない。
686:デフォルトの名無しさん
19/06/08 22:09:40.78 dgEPQa3n0.net
>>662
松尾研がしょぼいのは
環境がしょぼいからじゃないだろ
あれで環境がしょぼいなら
東大より下の研究室はショボくて当然ということになる
松尾はnvidiaやベンチャーとも組んでて
あれは環境のせいじゃない
687:デフォルトの名無しさん
19/06/08 22:28:05.56 UWafBj2Ca.net
>>663
そいつらのせいで第三次AIブームも終わりそうだしな
データがない奴らが騒ぎ立てて結果出ませんってそりゃそうだろうと
688:デフォルトの名無しさん
19/06/08 22:52:51.14 wPg0m4E00.net
>>664
環境とはハードウェアがすごいとか予算が潤沢とか意味じゃない
689:デフォルトの名無しさん
19/06/09 01:10:28.23 fjoZT5gcM.net
>>662
松尾自身が論文書くことを捨てて
マスコミに出て有頂天なんだよ
ただの馬鹿だろ?
690:デフォルトの名無しさん
19/06/09 01:39:02.58 iJmQ5mgDa.net
金儲けも大事なのは事実だけど常に最優先事項であるとは限らないのにこんなこと言ってるしな
ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏
URLリンク(ainow.ai)
691:デフォルトの名無しさん
19/06/09 01:46:57.58 fjoZT5gcM.net
> ディープラーニングは事例は増えているがビジネスになっていない
そりゃそうだ.
アホ学者どもがワンサカ群がってきて
無理矢理事例を作ってる。
実は表に出ないだけで
すごくビジネスになってる。
金も動いてる。
今の景気を支えてるのはAIビジネス
だからね。
692:デフォルトの名無しさん
19/06/09 02:08:43.27 w6PGXrHH0.net
ビジネスになってないのはすごく感じる
TensorFlowのサンプルをコピーしただけの
監視カメラの画像認識サービスの多さは酷い
こんなのを売り物にしようとしてるのは詐欺に近い
693:デフォルトの名無しさん
19/06/09 09:26:20.21 NAUdcA9m0.net
監視カメラ
694:ヨ連で内製する求人もここ数ヶ月で3件は見たよ。
695:デフォルトの名無しさん
19/06/09 09:26:57.56 /FZVYwra0.net
だって品質あげても苦労が多いだけで給料上がらないじゃん。
下手したら更に安い金で更に工数のかかる精度を要求されるようになるし。
査定精度の低いところがこういうことに手を出すのがそもそも間違いなんだよ。
696:デフォルトの名無しさん
19/06/09 09:33:54.75 NAUdcA9m0.net
要件定義怪しそうw
従来型ITって仕事でも要件定義怪しいの沢山あるもんね
697:デフォルトの名無しさん
19/06/09 10:08:18.40 /FZVYwra0.net
従来のSIer的な要件定義は基本無理。
だから機械学習を本番運用するのは難しいんだよ。
精度策定で結局嫌になってアリバイ作業に徹するようになる人は本当に多い。
698:デフォルトの名無しさん
19/06/09 13:33:10.54 w6PGXrHH0.net
精度が要件になってたらアウトだしな
やってみないとわからないし
一回でも下回ったらアウトなのか
精度でなかったらどうするのか
ビジネスになる訳がない
699:デフォルトの名無しさん
19/06/09 13:55:38.89 xN+bC573a.net
機械学習に限らず特にIT業界においては「作ったものを売って終わり」というタイプのビジネスは確実に減少を続ける
とは言え、継続的に開発を続ける形式の契約を他社と結ぶのは面倒なので大企業でも内製が増えている
これまで大企業で内製があまり行われなかったのは「IT=社内システム開発」で一旦完成すれば開発要員はほぼ不要になるので正規雇用などできなかったから
今はむしろ「IT=本業」なので常に案件が存在するので直接雇用してあれもこれもやらせた方が効率的となる
だから従来式のSIerが今のような規模では存続不可能と散々言われている
700:デフォルトの名無しさん
19/06/09 14:31:52.84 iQc3/8+U0.net
>>651
>>実際問題信頼できる統計計算なんて回帰分析ぐらいのもので
これすんごいそう思う。
なので、この分野で日本はまだきのこれるんじゃないかと妄想してる
701:デフォルトの名無しさん
19/06/09 14:42:15.14 xN+bC573a.net
回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない
702:デフォルトの名無しさん
19/06/09 15:28:50.25 fjoZT5gcM.net
ここで一般化線形モデルまで行くのか?
ちょっと極端すぎね?
703:デフォルトの名無しさん
19/06/09 16:06:14.14 z1WXn/lH0.net
>>676
まとめ
SI市場が無くなった
704:デフォルトの名無しさん
19/06/09 16:06:22.37 vzathb3ta.net
多くの人は単回帰や重回帰のことを指して回帰分析と呼ぶがこれらは一般化線形モデルの中で様々な条件を仮定したものにすぎない
もちろんそれらの仮定が分析対象にとって妥当なものなら何の問題もないが、最低限の数学や統計学が分からないと妥当性など判断できないはずなのに
そんな知識のない人が何となく単回帰・重回帰で直線・曲線を引いてみて何となくフィットしてるのを見せてドヤ顔している例が多い
705:デフォルトの名無しさん
19/06/09 17:11:03.41 /FZVYwra0.net
>回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
>その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
>「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない
こういうめんどくさい人が登場してあれこれ言うことも含めて安定しないので普通の回帰にしとけと。
706:デフォルトの名無しさん
19/06/09 17:52:27.15 yPvpM3IBa.net
統計モデルなら実データとどのくらい分布や分散が一致してるのか調べられる
707:デフォルトの名無しさん
19/06/09 19:19:45.77 vT6Mp8oIa.net
現実問題として回帰モデル以上のモデルを準備しても
過学習するだけだからな
708:デフォルトの名無しさん
19/06/09 19:28:50.93 kma
709:dDgcNa.net
710:デフォルトの名無しさん
19/06/09 19:59:05.39 /FZVYwra0.net
そこまでノイズが複雑な場合、何やってもダメだろ。
711:デフォルトの名無しさん
19/06/10 01:05:22.06 fcJW0GWO0.net
>>685
誤差分布が正規分布ではない分布に従うモデルのことを一般化線形モデルと言います
ちなみに正規分布に従うものを一般線形モデルと言います
自由の女神ほどのナイス日本語訳まで行かなくてもいいが、もうちょい訳語考えろと言いたい
712:デフォルトの名無しさん
19/06/10 01:35:01.39 fcJW0GWO0.net
>>681
なんとなく単回帰・重回帰でドヤ顔する人と
一般化線形分析で謎のハイパーパラメータ持ち出してドヤ顔する人の区別がつきません
713:デフォルトの名無しさん
19/06/10 01:57:16.14 RiY8Pa+r0.net
回帰なんて今や面倒なこと考えずにニューラルネットにぶち込むだけだと思うんだが
714:デフォルトの名無しさん
19/06/10 02:18:48.96 eq86jRmO0.net
間違いだらけのことをどや顔で臆面なく言っちゃうのがこのスレのレベル
715:デフォルトの名無しさん
19/06/10 05:40:36.59 +XEUhSwt0.net
須山に修正してもらおう
716:デフォルトの名無しさん
19/06/10 06:12:15.29 3mQ7PTgOM.net
>>685
それ間違い
>>686
意味不明
717:デフォルトの名無しさん
19/06/10 06:13:50.37 3mQ7PTgOM.net
>>687
それも間違い
718:デフォルトの名無しさん
19/06/10 06:14:37.92 3mQ7PTgOM.net
>>688
こんなところで
聞いても無駄
719:デフォルトの名無しさん
19/06/10 07:03:46.89 fcJW0GWO0.net
>>689
そういう局面はあるだろうけど、本気でそう考えているなら恐ろしい
720:デフォルトの名無しさん
19/06/10 07:53:37.33 2I4+V8i80.net
ニューラルネットするなら回帰王♪
721:デフォルトの名無しさん
19/06/10 07:57:41.79 +XEUhSwt0.net
>>695
どっちでもよくね?
722:デフォルトの名無しさん
19/06/10 12:20:20.62 g6tidy/FF.net
別に回帰しかやってなくても
精度出てればそれでも良いと思うし
統計がなんでもかんでも悪いとは思わないが
それを「ブラックボックスだ」とか「信用出来ない」とか
「人間より優秀とは思えない」とか「責任誰がとるんだ」とか
言って欲しくないな
人間がやってそれ以上の精度出るのか?とか間違わないか?とかスピードは?とか
考えると「ブラックボックス(実際はそうじゃないが)」で良いと思う
723:デフォルトの名無しさん
19/06/10 12:21:40.70 g6tidy/FF.net
>>687
合衆国が一番の迷訳
724:デフォルトの名無しさん
19/06/10 12:30:18.47 QmI1edQr0.net
>>699
美国は?
725:デフォルトの名無しさん
19/06/10 12:52:27.52 g6tidy/FF.net
美国は文脈的に的外れだからどうでも良い
合州国じゃなくて合衆国を選んだのが迷訳っていう意味だし
726:デフォルトの名無しさん
19/06/10 13:35:48.80 OXwxgYdVH.net
>>698
アカデミックの人かな?
ビジネスの領域ではそんなこと言ってられないのよ
727:デフォルトの名無しさん
19/06/10 19:46:57.52 rY9Mn9x+0.net
機械学習初心者なのですがディープラーニング以外の機械学習って覚える必要ありますか?手法が無限にありすぎて覚えられないです。
728:デフォルトの名無しさん
19/06/10 19:47:28.66 zRTuBs9kM.net
ビジネスだけど?
729:デフォルトの名無しさん
19/06/10 20:15:35.50 laqTwvRyp.net
>>703
何がやりたいかによるかな
覚えるという言葉から察するに応用したいんだと思うけどkeras使ってfit回すのと、scikit-learn使ってfit回すのでは、ソースコードは殆ど同じように思う
そういう意味では、やりたい事と手法のマッピングをすることに意味があって、その手法がDeep Learningだろうがそうでなかろうが、あまり意味がないと思う
統計モデリングは少し腰を落ち着かせて勉強しないと身につかないので、世の中のデータサイエンティストでも活用できている人は少ないのではないかと思う
730:デフォルトの名無しさん
19/06/10 21:09:57.64 RiY8Pa+r0.net
>>703
今のところ必要ないと思う
今一番成果が出てる手法だけを使うべき
731:デフォルトの名無しさん
19/06/10 22:36:21.02 EQVv/EW6a.net
統計モデルについてはこの動画の説明が分かりやすいからこれ見ろ
URLリンク(youtu.be)
732:デフォルトの名無しさん
19/06/10 22:39:30.02 cl88emhA0.net
赤本読めよ
733:デフォルトの名無しさん
19/06/10 23:11:32.89 +ahrTwMVa.net
>>703
実用を考えるとディープラーニングができるほど綺麗なデータが大量に使えることってあまりないからむしろ他の機械学習手法の方を知っていると強い
734:デフォルトの名無しさん
19/06/10 23:29:42.63 A95SX7z40.net
>500
735:デフォルトの名無しさん
19/06/11 02:42:37.45 ZQzbuTIBM.net
>>709
禿同
>>706
馬鹿
736:デフォルトの名無しさん
19/06/11 18:09:22.34 6NZpwaykM.net
機械学習って楽しいですか?
737:デフォルトの名無しさん
19/06/11 18:36:41.34 SdCAq12yd.net
楽しくはない。
機械学習はあくまでもサブ技術。
メインに専攻すべきではない。
738:デフォルトの名無しさん
19/06/11 18:48:27.85 QClOim5zM.net
ひとによるだろ
そんなこと聞いてどーすんの?
739:デフォルトの名無しさん
19/06/11 19:01:09.34 ZQzbuTIBM.net
>>712
大好き!楽しい!
統計学の勉強も楽しい!
現在、統計学の応用の5本目の
論文書いてるところ。
ただ、仕事から帰って書いてるだから
時間足りなさすぎ!
740:デフォルトの名無しさん
19/06/11 19:39:18.49 XL/fn5z60.net
という夢をみたのであった
741:デフォルトの名無しさん
19/06/11 19:40:07.84 XL/fn5z60.net
嫉妬野郎でござった
742:デフォルトの名無しさん
19/06/11 19:44:25.65 ko492/aS0.net
そろそろ論文もAIが書くよ
てか生成系のモデル悪用の将来はいかに
743:デフォルトの名無しさん
19/06/11 19:46:19.65 rt/UvHAD0.net
論文はAIが書き、人間はアノテーション作業に明け暮れるのであった。
744:デフォルトの名無しさん
19/06/11 21:18:16.47 tg9Aa7Nc0.net
アノテーションって転移学習とかで自動化出来そうで出来ないな
745:デフォルトの名無しさん
19/06/12 05:09:56.24 fMVFjy++0.net
文章生成系を生成系というと怒る人がいる
746:デフォルトの名無しさん
19/06/12 08:31:05.93 fMVFjy++0.net
ソフトバンクの社外取締役っていくらもらえるんだろう。。。
1億円くらい?
747:デフォルトの名無しさん
19/06/12 08:34:59.71 +0pwNKukM.net
そん正義が連れてきたインド人役員は
100億円もらってたんだよね
ま、インド人だから高いのよ
中国人も高い
次は韓国人
奴隷は日本人
在日ならソフトバンクに
行けばいいよ
韓国名で応募してね!
仕事は通名(日本名)でOk
748:デフォルトの名無しさん
19/06/12 09:01:52.01 k5XrsZPH0.net
ソフトバンクの社内役員は基本的に1億円。孫正義も同額で全額被災者に寄付を続けている。
他にストックオプションなども有るだろうけど。
749:デフォルトの名無しさん
19/06/12 09:26:41.42 3wcfQWS2M.net
松尾豊はソレで研究し金に
750:デフォルトの名無しさん
19/06/12 09:27:07.85 R4nJHUbN0.net
太陽光発電所を作ります(大法螺)
751:デフォルトの名無しさん
19/06/12 12:38:17.82 Wmv+D3tsM.net
>>724
へー本当に寄付してんだ
口先だけかと思ってたよ
で、どこに寄付してんの?
752:デフォルトの名無しさん
19/06/12 17:00:13.34 cGak2oaxp.net
>>726 たくさん作ってるじゃん。 サウジのやつは没になったけど。 国内では最大手に近いんじゃないのか?
753:デフォルトの名無しさん
19/06/12 19:12:40.23 yRay9q0a0.net
>>728
埼玉県にきまってるだろ
754:デフォルトの名無しさん
19/06/12 19:19:26.93 yRay9q0a0.net
計画はすべて尻つぼみ(笑)
755:デフォルトの名無しさん
19/06/12 19:24:11.00 yRay9q0a0.net
メガソーラーは1都道府県ごとに事業会社を設立して運営する考え。仮に20メガワット規模
の発電所が1年間稼働して売電すると、売上高は8億円規模になるという。国
756:フ規制で実現 していない発電した電力の全量買い取りや電力会社が持つ送電網との接続などが事業成立 の条件で課題は山積みだ。また発電事業とは別に埼玉県や神奈川県など地方自治体と 自然エネルギーの普及促進へ政策提言する団体「自然エネルギー協議会」も設立する。
757:デフォルトの名無しさん
19/06/12 22:40:31.71 BSq+d1KN0.net
機械学習って色んな手法あるけどみんなどれも覚えてるもんなの?
参考書やってて種類多すぎてどのケースでどれ使えばいいのかすら分からん
758:デフォルトの名無しさん
19/06/12 22:50:24.33 mQ+7g/y1d.net
手法を覚えるって、手法の何を覚えるんだ
759:デフォルトの名無しさん
19/06/13 09:44:39.89 g8amv0Zv0.net
>>732
手法を使えよ
760:デフォルトの名無しさん
19/06/13 11:41:27.81 qBC/YmXXM.net
名前と特徴、適正でしょ
761:デフォルトの名無しさん
19/06/13 12:04:23.81 bhCstcom0.net
Colaboratoryで巨大なデータセット扱うおすすめの方法を教えてください
自宅にwebサーバー建ててColaboratoryからwgetしてみたのですが、40Gあるのでアップだけで2時間、展開で1時間とか効率悪すぎて泣けてきます
Googleドライブ有料版をマウントして使ってみたのですが、何か1日の転送量最大値があるのかファイルが破損してしまいます
何かいいアイデアください!
762:デフォルトの名無しさん
19/06/13 13:11:29.71 3Y+kP9XaM.net
回線が遅いって話?
速くすれば?
763:デフォルトの名無しさん
19/06/13 13:36:35.55 2T1UAjXOa.net
>>736
ファイルを分割して並列であげろ
764:デフォルトの名無しさん
19/06/13 14:39:13.04 bhCstcom0.net
>>737
まあ、回線も遅いですが他の方法でアップしなくてもいい方法とかないかなと
>>738
aria2てので並列ダウンロードしてみます!
765:デフォルトの名無しさん
19/06/13 18:38:00.31 bhCstcom0.net
うーん、Google側が細いのか最大で10MB/s位しかでないですね
766:デフォルトの名無しさん
19/06/14 00:22:53.60 Gaxv7IADM.net
当たり前じゃん?
どんだけの人がアクセスしとると思ってる?
767:デフォルトの名無しさん
19/06/14 00:57:35.96 7+4XKUlI0.net
>>736
webサーバ建てる必要性ある?
768:デフォルトの名無しさん
19/06/14 10:18:19.40 2Fe7zdUeH.net
有料の環境つかえよ…
769:デフォルトの名無しさん
19/06/14 15:52:36.68 rI3r/fFD0.net
URLリンク(hazm.at)
これって
loss 順調に下がって下がり止まって,
acc 順調に上がって上がりきっても
val_loss val_acc 安定していないけど最終的に収束してて驚く
この不安定な val_loss val_acc だけど学習続けたのは,
loss acc が安定していたからなのかな?
いつ収束するかわからないまま学習続けるとか狂気の沙汰な気がする・・・
770:デフォルトの名無しさん
19/06/14 17:23:40.19 Wi4bG/9MM.net
何が言いたいのか
感想?
771:デフォルトの名無しさん
19/06/14 17:32:41.95 rI3r/fFD0.net
いや loss acc が安定していれば val_loss val_acc が不安定でも収束に向かうのか知りたい
発散してるように見えても大丈夫なのかなと
772:デフォルトの名無しさん
19/06/14 19:31:51.91 M8ulC+VI0.net
大丈夫
773:デフォルトの名無しさん
19/06/15 12:43:28.02 XjE03gEa0.net
gpt-2もマスクがバックにいるから
大袈裟に盛ってるんだろうなと思う
774:デフォルトの名無しさん
19/06/15 17:54:48.11 3j3poNkN0.net
低い精度で収束しちゃった場合はどうすればいいの?
775:デフォルトの名無しさん
19/06/15 18:01:34.11 NPtNfhdjF.net
インポ
776:デフォルトの名無しさん
19/06/15 18:26:18.80 XjE03gEa0.net
何をもって低いと判断?
777:デフォルトの名無しさん
19/06/15 19:04:43.64 3j3poNkN0.net
valdation accuracyが0.3位で動かなくなっちゃった
778:デフォルトの名無しさん
19/06/15 19:35:13.28 REOBTzcy0.net
他の方法を試す
データを増やす
779:デフォルトの名無しさん
19/06/15 20:09:59.21 3j3poNkN0.net
他の方法はモデルの変更とか、オプティマイザの変更とかでしょうか
データ量はもう増やせそうにないです
780:デフォルトの名無しさん
19/06/15 20:26:29.56 oNMgwv5d0.net
ノイズをのせる
781:デフォルトの名無しさん
19/06/15 21:19:32.93 XjE03gEa0.net
なんのタスクなの?
782:デフォルトの名無しさん
19/06/15 21:26:47.58 3j3poNkN0.net
画像分類です
650種類で、各200枚ほどの教師データです
783:デフォルトの名無しさん
19/06/15 21:52:22.51 U5fh38HZ0.net
指摘できる可能性が多過ぎて情報小出しにするのやめろ
784:デフォルトの名無しさん
19/06/15 22:10:12.02 3j3poNkN0.net
すみません
小出しにしているつもりはないのですが
初学すぎて何を出すべきなのかもわかりません
単純な各200画像分類を10クラスで学習して十分な精度が得られました
30クラスでも十分な精度が得られました
なので600まで増やしてみました
Keras で tf をラップし、
オプティマイザはAdam
modelはxceptionで108層までフリーズさせています
785:デフォルトの名無しさん
19/06/15 22:26:19.43 U5fh38HZ0.net
フリーズ以降のFC層は?
786:デフォルトの名無しさん
19/06/15 23:41:50.06 3j3poNkN0.net
触ってません
787:デフォルトの名無しさん
19/06/16 03:50:23.99 mrnjCxzMp.net
機械学習の教師データの意味が分からないのですが、入力データを教師データに近づけて行くのが学習ということであってますか?それとも教師データは学習時の正確性を図るためだけのものなのでしょうか?質問が拙くて申し訳ありません。
788:デフォルトの名無しさん
19/06/16 07:08:35.54 rp/1F5B10.net
AutoMLにぶっこめば簡単に高精度が出る
URLリンク(cloud.google.com)
789:デフォルトの名無しさん
19/06/16 16:36:11.78 zi6PIII50.net
>>757
650種で各200だと?
どういう物の判別か知らんけど
絶対に無理だと思う。
俺の経験から言うと
最低でもその10倍以上は必要と思う。
種類が多いからね。
790:デフォルトの名無しさん
19/06/16 17:41:35.14 Fp97SQ0B0.net
この世界に存在しない人物の画像をワンタッチで簡単に生成できる「This person does not exist」
URLリンク(gigazine.net)
これって、用意された画像をランダムに表示しているだけですか?
それとも、更新する度に一瞬で生成しているの?
791:デフォルトの名無しさん
19/06/16 18:18:13.85 rp/1F5B10.net
gigazineに聞け
792:デフォルトの名無しさん
19/06/16 22:32:14.35 0s8OobEM0.net
ビジネスで使うデータ分析って何?
t検定、カイ2乗検定、主成分分析、、、?
793:デフォルトの名無しさん
19/06/16 22:53:42.26 sdZe9hov0.net
>>764
わざわざ返信ありがとうございます
URLリンク(www.flowername.sint.ai)
ここは花ですが、
257クラスで10000枚1クラスあたり約40枚でそれなりの精度が得られているみたいです
これは特殊な例なのでしょうか
794:デフォルトの名無しさん
19/06/17 01:35:30.06 ikfjEprK0.net
>>767
圧倒的に主成分分析
795:デフォルトの名無しさん
19/06/17 01:40:35.29 3nvSauNK0.net
>>767
どれもよく使うけど主成分分析が多いイメージがある
796:デフォルトの名無しさん
19/06/17 01:43:43.86 3nvSauNK0.net
>>768
使う手法によると思うなぁ
適当なニューラルネットワークで精度上げるならやはりデータ量が決め手だとおもう
データ量が少ない状態で精度あげるには、ネットワークの選定やパラメータの調整がしんどいと思う
797:デフォルトの名無しさん
19/06/17 09:00:26.51 +0WLzjC8a.net
ビジネスでは検定の出番は多分ないと思う
798:デフォルトの名無しさん
19/06/17 11:17:33.99 k0TPj4160.net
ケースによる
ベイズ統計が大はやりの現状を見たらフィッシャー先生大激怒?
799:デフォルトの名無しさん
19/06/17 12:12:53.43 qGWgX2vna.net
有意水準5%の検定を行うとして5%ラインを僅かでも上回るならOK、僅かでも下回るならNGというような極端な使い方をせずにあくまで判断の目安にするだけならいいが、このような極端な使い方が割と蔓延している
800:デフォルトの名無しさん
19/06/17 12:35:15.40 X5xlHef/M.net
何に使えるのか考えるのも難しい
801:デフォルトの名無しさん
19/06/17 18:52:45.48 bJSnmi3rM.net
>>767
分析方法じゃないけど
客に見せるのはヒストグラム、
散布図、折れ線グラフが多い。
簡単な図で一目で「なるほど!」
と客に思わせるようにしなければならない。
そこが腕の見せどころ。
DLやR―Forestやら、SEMやらの
難しい方法は、
客が?で次の仕事無くなるので、
どうしても必要なときしか使わないようにしてる。
802:デフォルトの名無しさん
19/06/17 20:11:39.74 793xWBfG0.net
semってなに?
803:デフォルトの名無しさん
19/06/17 20:18:10.68 fqYLifJKp.net
>>774
p値論争あったねぇ
これまでp値で論文を書いてきた人たちには、p値はそこまで信頼できない事実に薄々気づいてたけど、ハッキリと宣言されて受け入れられない人は多いんじゃなかろうか
H0: とりあえずp値を信頼することにする
p値が信頼できるかどうかを、帰無仮説にしてしまおう
804:デフォルトの名無しさん
19/06/17 20:37:35.91 G+aoI1Nz0.net
>>777
走査電子顕微鏡
805:デフォルトの名無しさん
19/06/17 21:39:43.78 ldY4JpVQ0.net
>>778
何にも知らないなら黙っておいた方がいいよ
806:デフォルトの名無しさん
19/06/17 21:50:26.06 ikfjEprK0.net
SEMつったら一般には>>779だな
807:デフォルトの名無しさん
19/06/17 22:02:54.11 3nvSauNK0.net
>>780
何かを知ってるなら情報を出しなよ
現代の使い方、というか現場におけるp値の使い方のヤバさは現場ほどよく知ってるだろ
統計的な有意差を出すための様々な悪しき風習があるのも知らない理論屋さんかな?
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
110日前に更新/249 KB
担当:undef