【統計分析】機械学習・データマイニング30 at TECH
[2ch|▼Menu]
[前50を表示]
350:デフォルトの名無しさん
21/04/13 19:20:02.35 JY3IIMBR0.net
経営者に歯向かうって
日本の95%ぐらいが同族企業で新しい芽はすぐ摘まれるのに
そんな歯向かう程意気込んでいる奴が居るのか?
何か反論してお前がやってみろ的流れで上げ足を取られないよう我慢較べに耐え
マイナスポイントを作らないように頑張るぐらいが
日本のサラリーマンのやる気だろ

351:デフォルトの名無しさん
21/04/13 19:40:11.07 h3BzXWVB0.net
>>342
突然どしたおい

352:デフォルトの名無しさん
21/04/13 20:34:14.37 TGVCGH2G0.net
春だから

353:デフォルトの名無しさん
21/04/13 21:02:28.07 Qr7OJO8/0.net
はるだなぁ ┌┤´д`├┘

354:デフォルトの名無しさん
21/04/13 21:14:34.02 JY3IIMBR0.net
おっと意気込んで勉強してる奴が居たっぽいな

355:デフォルトの名無しさん
21/04/13 21:24:43.15 JY3IIMBR0.net
そんな使い捨て分野の勉強もいいが
サラリーマンなら腰巾着として生きていく道も悪い選択肢ではないぞ
方向性を間違ってしまいそうな準社畜勢が多く集まっていそうだけども

356:デフォルトの名無しさん
21/04/14 00:22:17.60 SzuxgdzH0.net
年収 >= 20万円 x 年齢
を満たしつつ、楽しく平穏に働きたい

357:デフォルトの名無しさん
21/04/14 10:53:40.16 GkDETHMT0.net
夢見る若者w

358:デフォルトの名無しさん
21/04/15 09:06:10.49 /Y74/7RV0.net
URLリンク(ocw.tsukuba.ac.jp)
筑波大学では、平成31年度10月より、情報教育に関する共通科目として「データ


359:Tイエンス」を開講しました。 「データサイエンス」の授業では、データサイエンスの基礎的概念を理解し、 コンピュータを利用した基礎的なデータ分析技術を学ぶことを目的としています。 筑波大ではデータサイエンスが必須になった 更にその内容もデータサイエンスに留まらず 流体力学もIoTも何でもあり もちろん地道な検定とかもやるんだな



360:デフォルトの名無しさん
21/04/15 10:11:09.71 3ci3nRnzM.net
>>350
良く分かんないページだ
オープンコースの説明?
ラボの説明?

361:デフォルトの名無しさん
21/04/15 11:31:20.39 /Y74/7RV0.net
>>350は筑波大の学生全員共通科目だな
筑波大といえば学生が授業を見るためのデータベースを
学生が独自に作ってしまったとかで最近話題になった
もっと前には、構内でしたい放題しまくったスーパーハッカーがいて
いい所に就職できたんだっけ

362:デフォルトの名無しさん
21/04/15 13:54:53.25 YwaVn3VBa.net
>>350
流体力学なんて大手メーカーの開発職ぐらいしか使わないぞ
やるだけ無駄

363:デフォルトの名無しさん
21/04/15 14:11:56.12 3ci3nRnzM.net
>>350
これって導入のところの一項目が授業一回分になるのかな?
ラボの説明聞いて終わり?

364:デフォルトの名無しさん
21/04/15 14:28:15.51 ASAfbP0Sr.net
>>353
研究機関でも使う
そして研究機関でパラメータをひねりまわしてるのは派遣PGだったりする

365:デフォルトの名無しさん
21/04/15 14:30:23.81 WWq7Tu7t0.net
流行りだから、学生が呼べて就職がよければOKさ

366:デフォルトの名無しさん
21/04/15 16:27:52.28 Ek3DvuxM0.net
>>352
受賞はタイーホのライセンス!的なアレですな

367:デフォルトの名無しさん
21/04/15 16:37:07.53 Nt0NlrQG0.net
URLリンク(www.youtube.com)
強化学習とDNN画像認識を組み合わせて、
マンデルブロ集合の図形を自動検知、自動拡大

368:デフォルトの名無しさん
21/04/15 17:19:45.29 3ci3nRnzM.net
>>358
アーモンド的な模様を探して拡大?
マンデルブロを計算せずにってこと?

369:デフォルトの名無しさん
21/04/15 17:22:02.46 Ek3DvuxM0.net
なんちゃらのなんちゃら休むににたりってやつだな・・・

370:デフォルトの名無しさん
21/04/15 21:36:04.06 /Y74/7RV0.net
>>358
自己相似の構造を見出すことに成功か
このスレは何でもかんでも深層学習にしなくても
統計学っぽいのも一応はいいのかな
k-means法とかクラスター分析とか位相的データ解析とか

371:デフォルトの名無しさん
21/04/15 21:57:49.86 FAu+tRVaa.net
深層学習は機械学習を実現する一手法に過ぎないからね

372:デフォルトの名無しさん
21/04/16 10:59:52.75 3ahlvanY0.net
>>362
他の方法とは?

373:デフォルトの名無しさん
21/04/16 11:01:25.02 +ZqSb2qyM.net
コホーネンに手を出すかw

374:デフォルトの名無しさん
21/04/16 11:53:04.91 gNE3LwpI0.net
>>363
昔ながらのサポートベクトルマシンとか
マハラノビス距離に基づく分類とか
ランダムフォレストとか

375:デフォルトの名無しさん
21/04/16 12:12:24.30 +ZqSb2qyM.net
マハラノビスも最近は機械学習に
分類されるのか。orz

376:デフォルトの名無しさん
21/04/16 12:38:05.85 eQE8+yTmM.net
>>1
データ少ないときは深層学習じゃない方がいいの?

377:デフォルトの名無しさん
21/04/16 13:24:48.08 RDksD56A0.net
データが少ない時は決定木系でいいよ
特にテーブルデータ

378:デフォルトの名無しさん
21/04/16 14:17:37.95 qA3a8jioa.net
機械学習は機械的に学習できる手法の総称でしかないので何でもあり

379:
21/04/16 20:19:06.10 5MUeIHD20.net
>>361
k-means はあらかじめクラスタの個数は指定しないといけないから、クラスタの個数がわからない状況では無力ですよ‥‥

380:デフォルトの名無しさん
21/04/16 21:52:50.72 uMQoO2nS0.net
何を当たり前のことを…

381:デフォルトの名無しさん
21/04/16 22:11:22.27 +WADC0tD0.net
しっ、よしなよ
めちゃ早口で言ってるじゃん
rubyガイジ引き込む前兆だよ

382:デフォルトの名無しさん
21/04/17 00:53:32.90 r+Flv24K0.net
まあしかしk-meansとかのクラスター分析ってなんか意味あんのか?って思うことはよくある。
教師なしでもPCAなんかはまだ使い道わかるけど。

383:デフォルトの名無しさん
21/04/17 03:24:44.86 KQhVv37W0.net
SOM & GAN  gaaan

384:デフォルトの名無しさん
21/04/17 04:06:51.97 9pKeriUl0.net
クラスター分析は深層学習以前の統計解析が主流だった頃のNLPでよく使った。
よく使ったのが、大量の学術論文をベイズ分類器でテーマ別に分類して、分類後の
集合をさらにクラスター分析で類似文書ごとにまとめるというもの。
クラスター分析は、BOW的なデータ構造であればなんでも自動分類してくれるので
例えば画像ファイルからカラーヒストグラムを生成して、色分類ごとの色強度のデータ
ファイルを作れば、画像分類とかもできたので面白かった。
あと、クラスター分析とは違うが、最近、 誰かがNLPにおける教師なし学習の
新潮流について触れて、例えば、よくあるワードベクターの2次元マップ(Word embedding)
を作り、英語とドイツ語のマップを重ねると英語とドイツ語の対訳辞書を自動生成
することも可能になるはずとか話していた。教師なし学習で対訳辞書みたいなものが
自動生成できるかもしれないという考え方は斬新だなと思った。

385:デフォルトの名無しさん
21/04/17 04:15:57.29 dljYNFer0.net
>>373
応用例を知りたいの?

386:デフォルトの名無しさん
21/04/17 11:10:35.27 7oBh743X0.net
>>373
類縁グループを定量的に調べられるのなら
分類とかだと非常に有効だね

387:デフォルトの名無しさん
21/04/17 12:00:18.35 8ejS6mqaa.net
k-meansとかのクラスタリングで
正常クラスタ群と異常クラスタ群に分けられる?
過去に異常検出した時のデータと正常データを区別できるようにしておいて
クラスタリングを繰り返して上手く正常と異常に分かれるクラスタ数を見つける
新たになデータが各クラスタのどれに属するか判定して
異常クラスタに属したら異常の可能性があるから
調べるとか運用停止するとかの対処をする

388:デフォルトの名無しさん
21/04/17 13:21:11.85 ohP60UMxd.net
いや、分類ってそれなりの分類の尺度をユーザーが決めるから意味あるんじゃねーの?
機械学習的に分類しても、で?っていう気にしかならんのだが。

389:デフォルトの名無しさん
21/04/17 13:27:16.40 7oBh743X0.net
>>379
よく問題になるのは生物の分類だね
分類から主観を取り除くことが出来る
主観こそが大事と考える文系の為政者、経営者にとっては
邪魔な時がある

390:デフォルトの名無しさん
21/04/17 13:31:51.20 ohP60UMxd.net
ある種の外れ値を認識する方法としては意味ある時もあるか。
主観がどうとか言ってるのは全く的外れにしか思わん。
逆に主観とのある種の一致性を無駄に主張する道具には使われてる印象だが。

391:デフォルトの名無しさん
21/04/17 13:45:29.23 QU2IYZKl0.net
外れ値は外れ値だけ正常値は正常値だけ近くなるような距離関数選んで
dbscanにかけろよ

392:デフォルトの名無しさん
21/04/17 13:51:53.23 7oBh743X0.net
コンドルはワシタカ目(もく)なのかコウノトリ目なのか
とか
フラミンゴはコウノトリ目なのかガンカモ目なのか
とかを骨格とか卵白のアミノ酸配列などに注目


393:オたりとか 色々指標を変えて学者が二百年も言い争い続けて、 結局はDNAの塩基配列をクラスター分析したら、 https://ja.wikipedia.org/wiki/%E9%B3%A5%E9%A1%9E#%E7%8F%BE%E7%94%9F%E9%B3%A5%E9%A1%9E%E3%81%AE%E7%9B%AE%E5%88%86%E9%A1%9E コンドルはコウノトリに近いんだよ〜って20年前の自称鳥類物知りが語ってたのに 結局ワシとかに近い方に入れられてしまった



394:デフォルトの名無しさん
21/04/17 14:41:09.11 ohP60UMxd.net
>>383
で、その分類を誰がどう使うんだ?
そこで「正しい」とか主張することになんの意味があんの?
ってところを全く考えてなさそうな頭の悪さが見受けられる。

395:デフォルトの名無しさん
21/04/17 14:43:54.03 dljYNFer0.net
そう。。。

396:デフォルトの名無しさん
21/04/17 15:08:57.10 7oBh743X0.net
>>384
ある論争があった学問分野に
1つの解を与えた(これで解決したとは言っていない)
というだけでも恩恵はあるんじゃないかな

397:デフォルトの名無しさん
21/04/17 15:11:19.78 Qe2ZIyvF0.net
>>384
頭大丈夫か?

398:デフォルトの名無しさん
21/04/17 15:20:42.83 7oBh743X0.net
どのレベルで「客観的な分類なんて要るのか?」
と言いたいんだろうと思ってたが
古典的な哲学寄りの煽りだったのか

399:デフォルトの名無しさん
21/04/17 15:22:02.38 nv8Do3m/M.net
自分の頭が大丈夫かどうか
それは誰にも分からない
腹が減ったのは分かる

400:デフォルトの名無しさん
21/04/17 20:52:47.18 v2WFWWWe0.net
人間の恣意的な分類より
体型的で規則的な分類の方が個人による分類の違いがでないから分類結果の共有に間違いが少ない

401:デフォルトの名無しさん
21/04/17 22:10:48.61 4y7R77pu0.net
サイボウズ青野社長が目指す「100人100通り」の働き方実現
URLリンク(www.nikkan-gendai.com)
初公開! サイボウズの自由すぎる働き方はこんなやり方で管理されていた
URLリンク(cybozushiki.cybozu.co.jp)
どうしてサイボウズは、働き方を変えられた?
「時間」と「場所」の制約がない多様な働き方
URLリンク(toyokeizai.net)
サイボウズの働き方改革事例(前編)
「働き方の多様化」へ、その歩みはトップの覚悟からはじまった
URLリンク(ws.zxy.work)
サイボウズの働き方改革 〜働き方の多様性がチームワークあふれる会社を創る〜
URLリンク(jinjibu.jp)
サイボウズはなぜ自由な働き方ができる? ーインターンが見た裏側には、ツールと情報共有があったー
URLリンク(www.wantedly.com)
働き方先進企業が警告「パワハラ的な日本企業は在宅勤務で沈む」
URLリンク(business.nikkei.com)
「働き方を自分で選ぶ」時代へ。その多様性が責任になり、パフォーマンス向上につながる。
URLリンク(www.nice2meet.us)

402:デフォルトの名無しさん
21/04/17 23:03:07.99 7oBh743X0.net
>>370
URLリンク(qiita.com)
エルボー法でも使ってみてくれ

403:デフォルトの名無しさん
21/04/18 01:15:06.95 oEMklD2xa.net
機械学習で分類するには分類基準をまず人間が与える必要がある訳でそれを客観的と言えるのか

404:デフォルトの名無しさん
21/04/18 03:01:48.20 /yrt+WGh0.net
客観的である必要はない。
人間にとって分類しやすいかどうかのがよっぽど意味があるというのに。。
分類をなんのために行うのかさえわかってないでk-meansで出ましたとか言ってるバカは
機械学習とかやめてほしいわ。印象を悪くする。

405:
21/04/18 03:53:49.04 8N2uJcok0.net
>>392
全く手段がないというわけではないんですね‥ありがとうございます
>>392
URL内結論コメント
>>現実のデータを使ってエルボー図を書いてみると、上記のような「綺麗なヒジ」はなかなか現れない
>>言いたいことはエルボー図の時と同じだ!!!

406:デフォルトの名無しさん
21/04/18 09:08:11.82 lVaCsfaE0.net
URLリンク(qiita.com)
x-means法が既にあるね

407:デフォルトの名無しさん
21/04/18 09:46:42.30 m+SV1W/C0.net
>>394
自然科学は自然を理解するモノだから
人間の考えより自然の方が正解
対象によって何が正解かは違ってくる
人間の都合で良いものは人間に合わせたらいいけど
自然科学は自然が正解
実験結果とか実際と差があるなら人間の仮説の方が間違いだから修正する

408:デフォルトの名無しさん
21/04/18 09:55:52.80 m+SV1W/C0.net
元のデータ空間のままでk-meansが上手くクラスタリングできない場合は
別の空間に移してからクラスタリングすると良いかもしれない
DNNも入力に近い層で空間を移していると解釈する人もいるし
どんな写像にするかをデータから学習していると考えられる
中間層の出力を使ってクラスタリングすると上手く分けられるようになっているかもしれない

409:デフォルトの名無しさん
21/04/18 11:49:56.96 yp3ki8fH0.net
測定誤差や間違いを多く含むデータを利用し、人間の主観が入った機械学習を利用している時点で…

410:デフォルトの名無しさん
21/04/18 13:36:27.79 QeEYhUGL0.net
その測定誤差を低減する上で必要な基礎知識って大学のデータサイエンス課では教えてなさそう
URLリンク(www.ds.shiga-u.ac.jp)
ジャンル的に工学部の履修内容だからか?

411:デフォルトの名無しさん
21/04/18 17:14:46.61 IRPicDM6a.net
どんな手法でどんなデータを計測するかということを設計する時点で設計者の主観が大いに入り込むことを理解できずに
データだけから判定を下すのだから客観的だろと言っている自称DSが多過ぎる

412:デフォルトの名無しさん
21/04/18 20:04:19.08 /yrt+WGh0.net
>>397
クソ馬鹿野郎は黙っててくれ。
物理においても人間の主観を蔑ろにするようなバカは話にならん。
量子力学も相対性理論も厳密には正しくないニュートン力学にどのような意味で帰着されるか
厳密に考えてる。
そういうことをまるっきり理解していない輩は消えてくれ。

413:デフォルトの名無しさん
21/04/18 20:21:19.55 ysDt+vZr0.net
そう。。。

414:デフォルトの名無しさん
21/04/18 21:38:13.62 fLgnYf4l0.net
GeForceの新規生産をCUDA動かない新verに切り替えるらしい噂
マイナー相手に争奪戦で勝てる気が全くしないw

415:デフォルトの名無しさん
21/04/18 22:09:58.07 n32h2KsI0.net
>>404
CUDAが動かなければGeForceの意味がない。ディープラーニングでもゲームでも使い物にならない。CUDA性能を維持してマイニングに使えなくするのがマイニング対策済30x0では?

416:デフォルトの名無しさん
21/04/18 22:16:31.16 Qxa4OXG60.net
>>404
それはマイニング制限とは別の話?CUDA使いたければTesla買えとか?

417:デフォルトの名無しさん
21/04/18 22:17:55.90 lVaCsfaE0.net
Tensorコアだけじゃどうしようもないからなあ

418:デフォルトの名無しさん
21/04/18 23:13:01.66 m+SV1W/C0.net
>>402
人間の主観じゃなくて観測する側の状態じゃね?
主観だと観測する状態は同じでも人によって違う結果になる
そうするとどんな値でも間違いではなくなる

419:デフォルトの名無しさん
21/04/18 23:13:58.56 m+SV1W/C0.net
>>399
測定誤差は正規分布に順うとしたら誤差の平均値が判るからその値を調整したらいい

420:デフォルトの名無しさん
21/04/18 23:14:17.97 m+SV1W/C0.net
フィッシャーの三原則とかある

421:デフォルトの名無しさん
21/04/18 23:15:20.18 m+SV1W/C0.net
>>401
主観が出来るだけ入らないように実験計画するんじゃないの?
主観を出来るだけ入れるように実験計画する?

422:デフォルトの名無しさん
21/04/18 23:21:52.89 m+SV1W/C0.net
量子論の不確定原理なら人間の主観とか関係なく不確定なんじゃね?
不確定だとしても確率的には値の差があるだろうから9割はこの範囲の値とか決まるだろうな
どんな外れ値でも確率ゼロではないから絶対に間違いとは言えないけど観測される頻度は稀になるはず
それよりも大きな頻度で観測されたら仮説の方が間違いなのは変わらない

423:デフォルトの名無しさん
21/04/18 23:35:52.79 yp3ki8fH0.net
>>412
主観入りまくってますがなw

424:
21/04/19 00:16:28.58 6sLSrXGT0.net
>>409
正規分布という名前が悪すぎます、ガウス分布でいいのです
ガウス分布は数ある誤差分布の one of them

425:デフォルトの名無しさん
21/04/19 00:49:42.58 Y2i4yGVV0.net
>>412
現象を説明する為にモデルを当てはめる時点で主観入ってる

426:デフォルトの名無しさん
21/04/19 09:16:49.17 I4CFpA8M0.net
All models are wrong, but some are useful.

427:デフォルトの名無しさん
21/04/19 09:31:02.90 QmRvPrb/M.net
>>416
誰の言葉?

428:デフォルトの名無しさん
21/04/19 09:32:33.96 xpugMHkq0.net
F=G*m1*m2/r^2

429:デフォルトの名無しさん
21/04/19 09:35:52.97 xpugMHkq0.net
George Edward Pelham Box

430:デフォルトの名無しさん
21/04/19 10:50:45.42 7a+3hK+O0.net
ニュートン力学は間違ってる(厳密には正しくない)から使えないとか言い出すやつは頭悪いだろ。

431:デフォルトの名無しさん
21/04/19 11:20:30.03 vPt4CmiJ0.net
スレタイ読めないやつと比べてどっちが頭が悪いの?

432:デフォルトの名無しさん
21/04/19 14:28:49.64 7a+3hK+O0.net
>>421
スレタイと関係ないと思っちゃうのか。。そりゃ頭悪いな

433:デフォルトの名無しさん
21/04/19 14:37:35.07 vPt4CmiJ0.net
>>422
どう関係するの?

434:デフォルトの名無しさん
21/04/19 17:58:53.25 ZVFLPhBo0.net
>>404
CUDAを動かなくする、という情報は少なくとも自作板では見つからなかったな

435:デフォルトの名無しさん
21/04/19 19:34:04.83 6UVoDsj30.net
>>417
ロジャーペンローズが似たようなことを言っている

436:デフォルトの名無しさん
21/04/19 20:34:22.39 GRSFwPvE0.net
人間が考えるなら主観が入り込むというなら全てに主観が入り込むことになる
つまり主観という点では差がない
出てくる成果には現実を上手く説明できるかどうかの差が生じる
より現実を説明できる成果は単なる個人の固定観念とは違う価値のあるもの
現実と合致する程度が高い成果は一個人の主観とは言えない程に質が変わる

437:デフォルトの名無しさん
21/04/19 21:20:07.15 GUe2JtDVa.net
主観的か客観的かは重要ではない
どれだけ客観的な手法を構築したとしても予測精度が低ければ使い物にならない

438:デフォルトの名無しさん
21/04/20 07:24:15.31 jszIXr370.net
>>420
君は>>416の英文をきちんと理解できてるのかな?

439:デフォルトの名無しさん
21/04/20 08:08:47.60 5/fHSI6qM.net
新卒で機械学習エンジニアになったけどGUIで学習するツールが導入されてて、マウスポチポチするだけでお仕事になるの納得行かない

440:デフォルトの名無しさん
21/04/20 08:10:50.56 SsFdkrp5F.net
単なる作業員になったらその内捨てられる

441:デフォルトの名無しさん
21/04/20 08:20:33.94 5/fHSI6qM.net



442:>>430 そう、危機感を感じている。 データサイエンス協会の人たちに「ライブラリが使えるだけじゃダメ、数学頑張れ」って教わってきたからモヤモヤする。 ツールでだめだったら即諦めってのも悲しいところ



443:デフォルトの名無しさん
21/04/20 08:55:31.90 XU4ld2UL0.net
>>429
どこのシステム?

444:デフォルトの名無しさん
21/04/20 09:05:48.17 YStzcIe+0.net
ファインチューニングすらしないでいいとか羨ましい

445:デフォルトの名無しさん
21/04/20 09:49:15.80 JWX72o4+M.net
データの仕事するなら数学よりコンサル力が重要
もしくはWeb分析や製造管理などドメイン知識を学んで特化するかだな
技術系でいきたいならクラウド使って基盤から自分で作れるようになれば引く手数多
最適化エンジニアは自動化されて終わるよ

446:デフォルトの名無しさん
21/04/20 11:59:17.59 pbjOZaIB0.net
メーカー研究開発やってるけど機械学習に対する敷居はここ数年で大きく下がったね
GUIツールなら実験系の人でも普通に使ってるし
データサイエンスに加えて、それ以外の専門を持たないと厳しいね

447:デフォルトの名無しさん
21/04/20 18:16:49.45 /RDGneBGM.net
>>432
会社バレしたくないから言えないですごめんなさい
>>434
Web分析やりたいなぁ スクレイピングさせてもらえるなら楽しいだろうな
>>435
ドメイン知識大事なのはわかる
世の中の全員が機械学習できるようになったらとても楽しい世の中になると思う

448:デフォルトの名無しさん
21/04/20 18:27:49.71 XU4ld2UL0.net
>>436
特殊なシステムか。。。
ソニーの奴辺りを使ってるかと思った

449:デフォルトの名無しさん
21/04/20 22:42:35.89 PyHebxw60.net
>>435
というか、専門分野を持たない統計屋が成り立ってる現状が疑問
数学をさらに極めているアクチュアリーでさえ、金融工学等でスキル補強してる

450:デフォルトの名無しさん
21/04/20 22:59:27.20 pbjOZaIB0.net
だからデータサイエンス学部とかちょっと心配になるね。

451:デフォルトの名無しさん
21/04/20 23:09:28.18 RpmUT2UU0.net
データから突き詰めていけば
その領域の構造も見えてくるんじゃないの?
予備知識として知っておいた方が良いけど
先入観とか思い込みで新たな発見を阻害しているかも

452:デフォルトの名無しさん
21/04/20 23:58:44.60 KfvQjl/O0.net
データから突き詰めて、分かった事実の99%は、その領域の人間にとって、何を今さらって言うレベルの常識なのが現実

453:デフォルトの名無しさん
21/04/21 00:26:38.44 pJR1O2/f0.net
それでも需要があるのは何故?

454:デフォルトの名無しさん
21/04/21 04:57:56.95 BjUmBGuB0.net
(1)マーケティングの成功 (ただ単に運がよくはやれたってだけかもw)
(2)1%に賭けてるところもあるかもしれない (薬系なんかは特に)

455:デフォルトの名無しさん
21/04/21 09:27:01.32 ULWWT4ypa.net
いわゆる「暗黙知」の問題を解決できるから
例えば、初心者に対して説明しやすい
あまりにも当たり前だと思い込んでしまっていることは
そもそも話そうとすらしない

456:デフォルトの名無しさん
21/04/21 15:29:43.27 KSNXGwT50.net
それも現場では当たり前だから話そうともしないけどね。

457:デフォルトの名無しさん
21/04/21 16:39:38.54 YSTRB6CIM.net
データサイエンス学部って企業と組んでむしろゴリゴリドメイン細分化してなかったっけ
DS実用化の観点からは正解にも見えるけど

458:デフォルトの名無しさん
21/04/21 16:58:44.66 LssXF+cLM.net
企業と組むっていってもデータ渡されてモデル作るだけでしょ
少なくともうちの会社と大学の共同研究はそう



459:なもんKaggleと大差ないよ



460:デフォルトの名無しさん
21/04/21 17:10:53.01 YSTRB6CIM.net
ほんまやね
新しい学部だし企業でもないからそこまで深くコミットすること出来ないんでしょね

461:デフォルトの名無しさん
21/04/21 18:06:22.19 qv/v785L0.net
基礎だけ教えるだけでしょ
あとはpythonかrあたりを習わせて

462:デフォルトの名無しさん
21/04/21 20:54:12.98 pJR1O2/f0.net
リコメンドとかは個人毎に人がやるのは作業時間的にむりなんじゃね?
作業時間は人件費、コストになる
売上アップ分より少ないコストで実現できれば投資する価値がある

463:デフォルトの名無しさん
21/04/21 21:00:23.59 pJR1O2/f0.net
当たり前と思われている事も
具体的にどの顧客やケースに適用できるかは
勘でしかわからなかっただろうから
担当者毎に違う判断をすることになる
ある担当者は知見を使えると考えるけど
別の担当者は知見を使えると考えない
その知見が明確に認識されていなければ組織内で共有もされていないだろうから
経験の浅い担当者はその知見があることすら認識していない
知見を可視化する事は共有可能になるし
組織全体の成果の底上げにつながる

464:デフォルトの名無しさん
21/04/21 21:22:24.85 scWNm3nIM.net
一般論としてはその通りだけど、実際の仕事では一般論じゃなく個別の課題に対して何をどうすればどう効果があるのかを説明できなきゃいけない
容易に想像できる通り、そのためには最適化より重要なスキルが山ほどある

465:デフォルトの名無しさん
21/04/21 21:58:18.31 4ieWnGe7M.net
解くべき問題を探し回って捻り出さなきゃいけない時点で相当なハンデなんだよな
普通のソフトエンジニアリングだったら、解くべき問題なんてそこら辺の事務のおばちゃんに聞けばいくらでも出てくるだろう
逆に言えば解くべき問題を見つけられる人間に希少価値があるとも言えて、だからコンサルの飯の種としては最適だ
一方で解く側の人間にとってはパイの小さな分野だと言える

466:デフォルトの名無しさん
21/04/21 22:49:45.31 pJR1O2/f0.net
今の世界中の課題は新型コロナ
データサイエンスで何ができるか

467:デフォルトの名無しさん
21/04/21 22:51:36.83 pJR1O2/f0.net
少し前に目の結膜か何かをカメラで撮ると感染しているか判別するAIアプリのニュースがあったな
役に立つのか知らんけど

468:デフォルトの名無しさん
21/04/21 22:55:35.42 pJR1O2/f0.net
ガンとか他の病気も早期発見できたら役に立つと思うけどな
トイレの便器にセンサーつけて異常検知するとか言うニュースもあったな
コロナ禍でストレスかかってる人が増えているとかも聞くし
早く検知して対処できたら良いんじゃね?

469:デフォルトの名無しさん
21/04/21 23:33:54.27 AHvTeMJC0.net
普通のソフトエンジニアリングでも、データドリブンな開発というのはこれから重要になっていくと思うけどな。
その辺のおばちゃんが言ってることをデータを収集して分析して、本当なら改善すればいいし単に特殊例でそうなっただけならスルーすればいいし。
定性的な開発で済む場合もあるけど、定量的な開発ができることで業務改善できる分野はいっぱいあると思うよ。少しでもそういう見方で意味論をある意味捨象して数値で評価しようとする立場の人間が増えることはいいことだと思うけどな。
まあ、数値の評価ってのはいかようにも出せるので、文系的な議論がしっかりなされた上で数値的な評価で裏付ける、というのがよいと思うけれど。

470:デフォルトの名無しさん
21/04/22 02:31:03.78 EZ9yi1XHM.net
事務のおばちゃんを例に出すまでもなく、ソフトウェア・エンジニアリングはマネタイズの方法がたくさん開発されてて実績も豊富
DS分野でいうとBI導入が流行ってるのもマネタイズの分かり易さからでしょ

471:デフォルトの名無しさん
21/04/22 08:38:


472:37.02 ID:iKwCvStp0.net



473:デフォルトの名無しさん
21/04/22 08:57:06.72 M8v84iKOM.net
>>459
正解

474:デフォルトの名無しさん
21/04/22 09:30:40.56 KHhdvM960.net
マネタイズできてるのはかなりの規模で使われた場合ばっかだろ。
中小や受託案件なんかは全く関係ないわ。

475:デフォルトの名無しさん
21/04/22 14:18:43.57 CDCM7CdZ0.net
>>454
むしろ、コロナ騒動でデータサイエンティストの無力を実感
・国や地域によって患者・重傷者・死者のカウント基準が異なる
・陽性と判定するCt値も同様に定まっていない
・PCR検査以外の感染者の検出方法ほぼ全てで擬陽性が多分に含まれる手段を用いている
データとしてゴミだらけで統計以前。
これらに問題提起をして的外れな対策に意見すべきであった

476:デフォルトの名無しさん
21/04/22 14:42:04.01 TgsR4gUfM.net
検査数(当日)と患者数(2日前)とか
そこからかよ。みたいな

477:デフォルトの名無しさん
21/04/22 18:30:59.89 Uzm+txz10.net
>>462
所詮雇われ屋しかいないしな
まともな予測出したのって北海道の免疫学の教授とGoogleくらいでしょ

478:デフォルトの名無しさん
21/04/22 19:26:43.57 lA0hV6360.net
頼れそうなデータは重症者と死者数なんだが
死んだときに感染していればカウントするそうだから
データとしては「かなり」多めに出るな
誤差さえわからない

479:デフォルトの名無しさん
21/04/22 19:47:09.32 FRH+m68J0.net
「重症」の定義が国によってばらばらなんだが

480:デフォルトの名無しさん
21/04/22 19:47:48.04 FRH+m68J0.net
+日本の新規感染確定@PCR分てのは保健所分だけ公表で、医療機関独自系は非カウントなう

481:デフォルトの名無しさん
21/04/23 08:36:21.23 tnFfajmm0.net
死者数のリボルビング発表も言われてるしなあ

482:デフォルトの名無しさん
21/04/23 17:31:31.74 P+WEt3o30.net
ワクチン開発で多数の候補物質からふるい落とすとかに活用したらしいけど
そういうのは半端なくドメイン知識いるし

483:デフォルトの名無しさん
21/04/23 18:44:22.53 rBK2myaR0.net
>>469
候補を出すだけならいらないんじゃない?

484:デフォルトの名無しさん
21/04/24 08:25:25.67 MOnT+7TF0.net
データサイエンティスト「こちらが候補の一覧です。何の物質なのかわかりませんけど。」
お客さん「・・・」
おわり

485:デフォルトの名無しさん
21/04/24 12:25:29.89 OO9vAqoAM.net
やっぱデータサイエンチストに任せずに自分でやったほうがいいか

486:デフォルトの名無しさん
21/04/24 15:21:15.93 6XEQ6ynBa.net
>>471
物質名か構造式が出てくれば後は自動で絞り込めるよ
まあそれもデータサイエンティスト側でできるか

487:デフォルトの名無しさん
21/04/24 18:30:45.31 kEsviUBS0.net
製薬やマテリアルは自然界の物質をそのまま変数として使えるから、さほど難しくないテーマ
世の中の大多数のテーマは変数の生成から始めないといけない

488:デフォルトの名無しさん
21/04/24 19:20:19.57 b1XnG/z6M.net
データの意味を知らずにできるような単純な問題ならそれこそデータサイエンティストなんか要らんよ
親切なツール使えば現場の人間でも難しくないだろうし、近い将来完全に自動化される

489:デフォルトの名無しさん
21/04/24 19:24:54.82 aBat7e4Id.net
マテリアルもいい記述子見つけるの大変だよ

490:デフォルトの名無しさん
21/04/25 12:26:44.89 0okbEX8U0.net
ワクチン開発でDNNを活用す


491:るというのは異常に難易度が高いよ。 例えば、コロナウィルスの場合、COVIDウィルスのスパイクのタンパク質配列とかを 学習データに使用するけど、普通は、この種のウィルス特有のデータを10種類以上 選択する必要がある。このデータ選択は、ウィルスの専門知識がないと無理。 状況によっては公開データが用意されていない場合もあるので、その場合は、 研究室でタンパク質配列とかRNA配列とかを解読する作業も必要となってくる。 さらに、DNNに関しても、既存のネットワークを流用することはできないので、 新規にネットワークのアルゴリズムを作る必要もある。この作業は、普通のAI エンジニアでは無理。更に、機械学習に関してもかなり膨大なGPUリソースが 必要となる。また、専用のネットワークは動かしてみた上で修正を入れるという 作業が発生するため、TPUv3x1024くらいのリソースを開発期間の数ヶ月に渡って、 占有するという状況が発生する。開発要員としてはウイルス学、AIの各領域のポスドク クラスの専門研究者を10人くらい集めて、さらにクラウド費用として数億円くらいアサイン する必要があるかもね。まあ、これはほとんど不可能な要件なんだけどね。



492:デフォルトの名無しさん
21/04/25 16:03:32.73 A9tbQoo40.net
>>477
十年前からきたのかな?

493:デフォルトの名無しさん
21/04/25 16:35:58.53 lzmMLOISa.net
>>477
去年効果のありそうな物質の候補をリストアップしたニュースがあったな
それになんでもDNNを使わなくて良いし

494:デフォルトの名無しさん
21/04/27 21:39:48.80 SgCXWhD40.net
東大卒 旧通産省・工業技術院の元院長・飯塚幸三
「ブレーキを踏んだが、車が加速した」
流石高学歴で上に行った奴だな
この程度の嘘を平気でつけるのがこのクラス
AIで犯罪を起こしそうな率を検出させてみると
政治家とか企業のトップとか軒並み率が高そうだけど
末端労働者程率が低かったりして
犯罪者が作ったルールに一般市民が従っているっていう

495:デフォルトの名無しさん
21/04/27 21:55:07.22 SgCXWhD40.net
菅義偉の詳細データ入れると
99.9%とか出るんだけど
菅総理だけ表向きの事情で0%にしないといけないっていう
そんなチューニングがメンドクサそう
特別なチューニングを何個もやってるうちにおかしなシステムになって
最終的に末端が叩かれて
一般人が犯罪者になるっていう

496:デフォルトの名無しさん
21/04/27 22:26:18.40 drc3/kck0.net
馬鹿参上

497:デフォルトの名無しさん
21/04/28 00:01:36.86 kjLpBedQ0.net
頭にアルミホイル巻いとけ

498:デフォルトの名無しさん
21/04/28 00:48:19.24 Tk2PmT/40.net
AI疲れだな
GWにしっかり休んでくれ

499:デフォルトの名無しさん
21/04/28 07:27:21.67 rShJ3D9e0.net
あさからわろらされたわwww

500:デフォルトの名無しさん
21/05/02 11:16:21.40 N4VRd0iX0.net
>>1
sdgと言われるとsgdと空目する

501:デフォルトの名無しさん
21/05/02 17:25:15.38 liMkj8Q90.net
あわしろ氏は、AIはベイズ推論だけで十分だって言ってたけどね。

502:デフォルトの名無しさん
21/05/02 18:08:34.90 rSJyHW/ca.net
十分というか今AIと言われているものはほとんどがベイズの枠組みで記述する方が分かりやすいし柔軟的に拡張できるからな

503:デフォルトの名無しさん
21/05/02 18:11:39.92 JG6YyYGw0.net
ビショップの本を買ったのですが、積読状態です。
気合入れて読む価値はありますか?

504:デフォルトの名無しさん
21/05/02 18:13:31.90 JG6YyYGw0.net
フィールズ賞受


505:賞者のD. マンフォードらのパターン認識の本が全く話題になりませんが、あの本はどういう位置づけの本なのでしょうか?



506:デフォルトの名無しさん
21/05/02 19:10:03.88 N4VRd0iX0.net
基礎

507:デフォルトの名無しさん
21/05/02 20:33:26.36 liMkj8Q90.net
一般教養。

508:デフォルトの名無しさん
21/05/02 23:43:59.54 AUnCr2Ku0.net
>>487
今なら深層学習を最初にやるべきだと思う

509:デフォルトの名無しさん
21/05/03 07:36:08.52 k1jvROw50.net
>>487
誰?

510:デフォルトの名無しさん
21/05/03 08:09:03.39 s03MGASG0.net
IT業界に居て知らないことは無いだろ。

511:デフォルトの名無しさん
21/05/03 08:14:12.53 JIK/4A/q0.net
知らん。
ニクラウス・ヴィルトとかクヌース級なのか?
Joseph Redmon氏を超えたら紹介してくれ

512:デフォルトの名無しさん
21/05/03 08:24:08.67 sjGHdyBX0.net
俺も知らん
俺が好きなのはあんどりゆー先生

513:デフォルトの名無しさん
21/05/03 08:56:18.97 s03MGASG0.net
だからお前らは駄目なんだよ。

514:デフォルトの名無しさん
21/05/03 09:23:32.94 J4qyGfu10.net
ネタだと思って何も言わんと本気にする馬鹿が出てくるというアレだな。

515:
21/05/05 10:47:54.94 tRoHSHAj0.net
>>487
誰?

516:デフォルトの名無しさん
21/05/05 16:21:28.27 YD9wgWX/0.net
colab pro使ってる人いる?

517:デフォルトの名無しさん
21/05/06 11:59:48.85 9ulEY78a0.net
Colab pro日本からも契約できるようになったんだよな

518:デフォルトの名無しさん
21/05/06 13:39:08.91 3t4KZ2ob0.net
月1000円ちょっとだから家で機械学習で遊ぶのにいいかなと思って

519:デフォルトの名無しさん
21/05/06 19:23:34.81 ySmiiGpmd.net
URLリンク(colab.research.google.com)
プログラミング初心者は、このcolabでopenAIのテキスト→画像生成モデルをテスト実行できるぞ

520:デフォルトの名無しさん
21/05/12 11:00:45.44 lwPC+Em40.net
我勉強中なんだけど、
「RMSE(平均平方二乗誤差)を使い求まる解は、誤差が正規分布に従うという前提の下で求まる最尤解と同じになる」
これってどういう意味?

521:デフォルトの名無しさん
21/05/12 12:02:35.00 cBo9TB3z0.net
>>505
正規分布を使って最尤推定の式を立ててみな
式変形したら結果がRMSEと同じになる

522:デフォルトの名無しさん
21/05/12 12:34:56.40 aZwuBi2/0.net
誤差分布と正規分布の違いとか最近基礎を忘れてきたな。。。

523:デフォルトの名無しさん
21/05/13 09:33:19.17 LL50QdoW0.net
>>506
THX!
やってみるわ

524:デフォルトの名無しさん
21/05/14 03:55:13.35 +CUnWEgy0.net
colaboratory使えばGPU買わなくても大丈夫?

525:デフォルトの名無しさん
21/05/14 06:00:37.69 YMhl4ox20.net
>>509
はい

526:デフォルトの名無しさん
21/05/16 18:14:37.34 BCvV60Hy0.net
>>510
マジ!?
本番サーバのバッチでも使える?

527:デフォルトの名無しさん
21/05/17 11:56:47.57 AazcJmIk0.net
「X_train, X_test」の大文字ってどうしてます?
面倒なので小文字にしたいのですが、不都合ありますか?

528:デフォルトの名無しさん
21/05/17 13:27:31.17 50pYDYVJ0.net
ないよ

529:デフォルトの名無しさん
21/05/17 16:02:53.44 x42zKMo10.net
>>512
その変数名にしてる人たいていクソコード書いてるから
ちゃんとした入力変数の名前にしたほうがいい

530:デフォルトの名無しさん
21/05/17 19:41:41.86 3TA+gznAM.net
クソチョンw

531:デフォルトの名無しさん
21/05/17 21:45:08.12 sdljpxakM.net
>>514
Xの大文字を打つのにシフトすら面倒だって言ってる奴にちゃんとした変数名付けろって言っても、馬の耳に念仏なんじゃないか <


532:br> 概念の説明にはx,yが出て来るのは仕方ないとしても、 実際の分析では意味のある名前付けた方がいいというのには完全に同意だけど。 x2やy2に相当するものを使いたくなるときもあるし、 将来コードを見返す自分は赤の他人だと思って分かりやすく書いておかないと折角の努力が資産にならないよね。



533:デフォルトの名無しさん
21/05/17 22:50:20.67 TxYncY5F0.net
行列だから大文字Xなのかと思ってた

534:デフォルトの名無しさん
21/05/18 04:49:22.56 XMy91+oY0.net
>>516
その辺の機械学習の概念を理解するお薦め本ありますか?

535:デフォルトの名無しさん
21/05/18 11:04:58.96 K5WN/Dsi0.net
いや、pythonの規約を普通に守ればそこは小文字始まりだろ。
それを破るならそれなりの理由が必要だわ。

536:デフォルトの名無しさん
21/05/18 12:41:52.89 FgenxOxPr.net
jupyter notebookみたいな書き捨てコードだったら何でもいいよ

537:デフォルトの名無しさん
21/05/18 15:26:01.83 QNG9JUM6a.net
ていうか変数名くらいAIでわかりやすいの勝手に付けて欲しい
人間が考えるのはおかしい

538:デフォルトの名無しさん
21/05/18 16:19:30.43 oyqcAYpS0.net
テンソルの変換するからXだの言われても辛いのよ
前処理も一緒にやる場合はどの段階のXなの?ってなる

539:デフォルトの名無しさん
21/05/18 17:17:37.19 K5WN/Dsi0.net
>>521
そこまでAIができるなら、お前らなんかいらんわ

540:デフォルトの名無しさん
21/05/18 18:13:53.05 WCK1jWazM.net
行列だとしても、単に大文字だとわかりにくいから、mat_Rとか名前つけることあるな。回転行列だけど。
数式ですら字体や添字で区別を色々つけないと訳分からなくなる。

541:デフォルトの名無しさん
21/05/18 18:44:16.23 ONMU+Hso0.net
回転行列?
転置のことか?
転置は昔からTと相場が決まっとる

542:デフォルトの名無しさん
21/05/18 19:49:43.85 oyqcAYpS0.net
転置ではないよ。。

543:デフォルトの名無しさん
21/05/18 19:50:07.22 UWVHwMarr.net
回転行列は回転変換の話で転置とは無関係だろ

544:デフォルトの名無しさん
21/05/18 19:55:16.40 CtrctolZa.net
長くてもいいから読めば分かる名前にする。これが原理原則
メモ帳でプログラミングでもしない限り補完してくれるので変数名の長さは問題にはならない

545:デフォルトの名無しさん
21/05/18 20:07:18.39 Q90nYKbd0.net
ぬるぽ

546:デフォルトの名無しさん
21/05/18 20:46:05.40 puQpLL01a.net
コメントを書いても良いけどな

547:デフォルトの名無しさん
21/05/19 08:09:56.86 k7Ue1zjEM.net
配列の形はよくコメントに残すようにしている

548:デフォルトの名無しさん
21/05/19 10:50:43.72 V3eiLHp10.net
pycharm使っている人います?
有料の価値ありますか?
VSCodeを使ってますが、プラグインやカスタマイズが面倒なので、pycharmに乗り換えようかと
ワタシは初学者です

549:デフォルトの名無しさん
21/05/19 10:57:03.47 oIwzetOOM.net
ない

550:デフォルトの名無しさん
21/05/19 11:25:18.51 NOe9g/vN0.net
>>528
実際やってみればわかるが長すぎる変数名、関数名ばっかりだと視認性を恐ろしく悪くする。
適切なスコープに対する長さが重要。


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

381日前に更新/225 KB
担当:undef