- 1 名前:デフォルトの名無しさん mailto:sage [2021/01/01(金) 09:10:55.46 ID:a+OQlEaa0.net]
- !extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512 ↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。 機械学習とデータマイニングについて語れ若人 *機械学習に意識・知能は存在しません。 人の意識に触れたい方はスレ違いです。 ■前スレ 【統計分析】機械学習・データマイニング29 https://mevius.5ch.net/test/read.cgi/tech/1597882603/ -EOF- VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
- 892 名前:デフォルトの名無しさん mailto:sage [2021/08/07(土) 23:07:23.06 ID:S6UZnCNm0.net]
- チビタレビ接続、アルファ接続なんて使用しません
- 893 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 01:36:39.38 ID:QRxRLgxLM.net]
- 実務未経験、kaggle初挑戦でソロゴールド取れたけど転職活動で評価されますかね
kaggleやる前は経験がないという理由でさんざん落とされまくった masterまで取ってしまった方が評価高まるんかな grandmasterまで取れたら引く手あまた?
- 894 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 09:58:13.80 ID:/p80N7+xa.net]
- 実務はkaggleみたいに整備された環境ではないのでkaggle実績など実務経験としてカウントされません
実務でデータサイエンスやっている人が転職時にアピールポイントとして使うならまだ分かる
- 895 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 12:13:58.31 ID:KSDEV/p50.net]
- >>868
DeNAがkaggle経験重視してるから受けてみたら?
- 896 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 13:13:50.96 .net]
- Kagglewwwwwwwww
競プロer笑と同レベルって気付け
- 897 名前:デフォルトの名無しさん [2021/08/08(日) 13:34:01.94 ID:FLwcAWgNr.net]
- 実務マウントもイタイよな
- 898 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 14:34:01.87 ID:4QdLr3Tg0.net]
- >>868
今の会社でデータ分析の部署に転属させてもらうか、プロジェクトに参加させてもらったら? 部長クラスに相談すれば悪いようにはならないかと。
- 899 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 15:35:49.38 ID:APy0xH+W0.net]
- >>868
数多ではないだろうがある程度評価はされると思うからそのままグラマスまでやれ
- 900 名前:デフォルトの名無しさん mailto:sage [2021/08/08(日) 22:18:53.80 ID:vFD24uPRr.net]
- 転職サイトでkaggleで検索すると何件かヒットするよ
- 901 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 11:23:28.16 ID:YrRw0eGAM.net]
- ありがとう
データ分析の職種もいろいろあるね 研究開発もあればコンサルもあったり、データの活用方法の立案から任せたいところもあれば、データを集めるところからやらせたいところもある この違いのせいで人によって言うことが全然違
- 902 名前:、というのは面接でも経験した
kaggleのような精度出しを重視するのは研究開発なのかな grandmasterまでは少し時間かかりそうだから考えてしまう ソロ金取れたからあとはチーム組みまくればさくっと取れるのかもしれないけど [] - [ここ壊れてます]
- 903 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 11:36:38.45 ID:YrRw0eGAM.net]
- >>873
今の会社のデータ分析やってる部署は機械学習の仕事は2割しかないらしい 古典的な統計手法がほとんどなんだとか 試しに社内公募で面接受けてみたら機械学習についてまったく質問されなかったから辞退した 業界はAIを活用し始めてるし会社もビッグデータを持ってるんだけど、そこの部長が機械学習に疎いようだから社外に出た方がよいと判断した
- 904 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 12:05:10.95 ID:8AhcXF4R0.net]
- kaggleなんて初めて知った
- 905 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 12:34:48.65 ID:Gz+/uc5A0.net]
- >>877
まずはその部署で実務経験を積めばよかったのに。 機械学習プロジェクトでも古典的な統計手法は使うよ。
- 906 名前:デフォルトの名無しさん [2021/08/09(月) 12:49:06.77 ID:rKb0Niaj0.net]
- 俺もそう思う
データサイエンスなんて実際は本当に泥くさい仕事だよ
- 907 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 12:50:30.94 ID:EJdTKpSKa.net]
- >>879
いやまあそれだけじゃなくてあの部長とは反りが合わないと思った。 面接でケーススタディやらされたんだけど、こっちの解答が不正解で扱われたから模範解答を聞いてみて、 その模範解答間違ってるよと間違ってる理由を言ったら、間違ってないの一点張りで、根拠を聞いても今後の採用でも同じ問題使うから答えられないと。 いや出題ミス隠蔽のうえに間違った問題を使い続けるって… 人事に話したが俺の言い分は正しいように思うが人事は試験問題には立ち入れないんだと。何のための人事なんだか。 とりあえずこの人の下では働きたくないと思った。 今の仕事も統計関連ではあるから古典的な分析手法を異動してまで経験する必要はないかな。
- 908 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 12:51:41.18 ID:EJdTKpSKa.net]
- >>880
どの仕事もそうだね。今の仕事もそうだから想像はつく。
- 909 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 13:48:53.19 ID:jlOW9NPh0.net]
- >>868
kaggleのことよく知らないんだけどソロゴールドってどういう状態なの?
- 910 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 13:54:33.72 ID:PID/W7Dkr.net]
- 機械学習だけでなく古典的統計もちゃんとわかってる方が価値あると思うなぁ
- 911 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 14:43:49.71 ID:ABArYxqcM.net]
- 皆さんが言う古典的統計って、計量経済のこと?
- 912 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 15:05:05.53 ID:xK6XOXuS0.net]
- 全く違う
そもそも古典的統計なんて言葉ほとんどつかわない
- 913 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 15:15:37.04 ID:3bscJFtj0.net]
- ナイチンゲール?
- 914 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 15:18:02.99 ID:xELB7YY70.net]
- この発想はないわ、経済屋さんか?
>古典的統計って、計量経済のこと?
- 915 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 15:28:53.04 ID:xK6XOXuS0.net]
- むしろ経済とは無縁の人の発想だろ
- 916 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 15:32:54.86 ID:xELB7YY70.net]
- 計量経済という言葉自体経済をかじってないとしらないだろ
- 917 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 16:07:47.57 ID:ABArYxqcM.net]
- 古典的統計って単語でt値とかp値とか連想して質問してみました
- 918 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 16:29:06.17 ID:yT1rK/qm0.net]
- p値や帰無仮説の類いは、統計分析で使われているが、本来は検定では?
古典的統計って、古典的統計分析の省略形?
- 919 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 16:48:39.03 ID:ABArYxqcM.net]
- そうなんです、私は仮説検定で育ってきて最近機械学習を勉強し始めたところで、二つの世界観の違いに少なからず戸惑っておりまして、漠然とした質問を投げて、何かヒントを頂けたらと思った次第です
- 920 名前:デフォルトの名無しさん [2021/08/09(月) 17:14:20.50 ID:/DAK4ORS0.net]
- 機械学習でinsightを得て、統計的検定で確認するもんじゃろ
どこの現場もそうやっとるじゃろ?
- 921 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 19:50:41.35 ID:ABArYxqcM.net]
- その感覚がわからなくて。tks
- 922 名前:デフォルトの名無しさん [2021/08/09(月) 19:55:34.56 ID:/DAK4ORS0.net]
- tksとは珍しい略語を使うのう
- 923 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 21:20:56.44 ID:WuaDW8MIM.net]
- 古典的というのは別に用語ってわけでなくて比較的最近流行の的になっている機械学習以外の昔ながらのデータ分析手法という意味で言ったつもり。
セグメンテーションとか主成分分析とかいろいろあると思うけどデータ分析業界でどういう言葉が使われてるのか分からないので深く突っ込まず察してほしい。 ところでスレ違い申し訳ないけどひとつお聞きしたい。 皆さんとこのデータサイエンティストの女性率は何割くらいだろう? うちの会社のその部署は部長(男)の下に4人の女性と3人の男性が所属していて、それぞれデータサイエンティストまたはデータエンジニアの肩書きが付いている。 しかしこの仕事を志望する人の大半は男性だと思う。ネットで調べても9割は男性だと出る。 意図的に女性を優遇して採用しない限り部署の過半数が女性になることは考えにくいと思うのだけど、この感覚は皆さんも一緒だろうか? その部長はデータ分析部署立ち上げ当初から採用に関わっているらしい。 なんだかものすごく気持ち悪く感じた。合理的理由なく女性優遇してるとしたら法律違反でもある。
- 924 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 21:34:44.42 ID:xELB7YY70.net]
- ベイズ推定勉強すれば
- 925 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 21:58:25.58 ID:GSmZJeae0.net]
- 女性の割合をクォータ制とかで割合を決めたりするところもあるから違法とは言えないんじゃね?
海外では国会議員の割合とか会社役員の割合とかクォータ制導入してるとこもあるだろうし 人事のことは会社の人事権限を持つ人が決めることで 成果の責任を取るのも責任者になるはず 何故かそうならないこともあるけどな 自分のやりたいことをしたいのなら出世するか独立したら良い
- 926 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 22:04:18.62 ID:xELB7YY70.net]
- 成果は俺の物、失敗は部下の物w
- 927 名前:デフォルトの名無しさん mailto:sage [2021/08/09(月) 22:27:09.99 ID:5XVoQDhV0.net]
- >>877
某メーカーの中で少し働いたことがあるがコテコテの統計学だったよ それこそt検定とかF検定 しかも秘伝のタレと化した自前Fortranのライブラリを使わなきゃダメだった
- 928 名前:デフォルトの名無しさん mailto:sage [2021/08/10(火) 00:32:57.08 ID:uO0ANz+Ga.net]
- >>897
>しかしこの仕事を志望する人の大半は男性だと思う。ネットで調べても9割は男性だと出る。 そりゃ現状大半が男性で構成される環境を志望する女性はレアなんだから仕方ないだろう
- 929 名前:デフォルトの名無しさん mailto:sage [2021/08/10(火) 08:47:35.51 ID:2xiLGjmP0.net]
- >>901
秘伝のタレは継ぎ足していくもの。 改良されない数値計算ライブラリは、秘伝のタレではなく単なる化石?
- 930 名前:デフォルトの名無しさん mailto:sage [2021/08/10(火) 13:51:45.49 ID:BpbHj/DY0.net]
- >>903
社内の業務フローに組み込まれてるだろうから変えられないんだと思う 製品開発に直結するからね
- 931 名前:デフォルトの名無しさん mailto:sage [2021/08/10(火) 14:48:04.03 ID:CtWJxJTj0.net]
- >>904
並行して別のシステムを作っていけば 出来上がってから切り替えられるし 品質管理なら適用する製品を選べば良いように思う 例えば新製品は新システムで品質管理するとか
- 932 名前:デフォルトの名無しさん [2021/08/10(火) 16:38:57.39 ID:QOeLlU4qM.net]
- > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw
- 933 名前:デフォルトの名無しさん mailto:sage [2021/08/10(火) 20:17:47.53 ID:pEvUaaVHd.net]
- まあ実際の仕事はkaggleで高得点出すことじゃなくて
kaggleがコンテストするためにやってるように、データ整備やコンテスト形式を整備する部分なんだよね。
- 934 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 08:52:04.34 ID:SA7xwrWpM.net]
- rnnを試してるけど学習が安定しない
想定どおりに学習できることもあるしできないこともある こんな感じだっけ?
- 935 名前:デフォルトの名無しさん [2021/08/11(水) 09:57:19.51 ID:LaezIcyQ0.net]
- >>908
いいえ
- 936 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 13:14:47.40 ID:lYh86/4uM.net]
- >>909
(o´・ω・`o)何が良くないんだろう
- 937 名前:デフォルトの名無しさん [2021/08/11(水) 13:26:42.69 ID:LaezIcyQ0.net]
- >>910
基本的な知識の得方
- 938 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 15:54:21.73 ID:lYh86/4uM.net]
- >>911
(o´・ω・`o)どう得れば良いの?
- 939 名前:デフォルトの名無しさん [2021/08/11(水) 16:03:44.47 ID:Jt5epKHNp.net]
- >>912
実は勉強するだけでいいんだ
- 940 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 16:07:34.59 ID:s3/ZPgm10.net]
- 先ずは全裸になります
- 941 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 16:20:47.36 ID:5Ljj9b3D0.net]
- 学習データの選び方によって結果が異なるとか?
- 942 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 16:49:21.51 ID:EKde279r0.net]
- 次に窓を開けます
- 943 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 18:15:56.01 ID:hWJ4QZBPa.net]
- うちは女性も多いってレスが無いところからするとやはり普通は男性が多そうだね。
転職活動してても女性は一人しか見たことがない。 >>899 人事に聞いた限りじゃそういうのはなさそう。今回の公募は応募者全員が男性だったそうな。 今回結局誰か採用したのかどうか結果は知らんが。 >>902 というより工学、数理、ITって一般的に女性より男性の方が得意だからというのが大きいと思う。 生物系以外の理系職はどれも男性が多いね。 >>907 いろんな会社に話を聞くと会社によってだいぶ違う気がする。 データ整備と分析で人員を分けていたり。 扱うデータの種類でも違うんじゃないだろうか。 例えば画像解析だと認識精度が重要である一方で精度を出せるスキルのある人は限られてそうで、 データ整備よりも精度を上げる仕事が重要になるんじゃないかと想像してる。 自動運転の研究なんかは日々精度を上げるための研究をしてるイメージ。知らんけど。 kaggleはホスト企業が精度を上げるアイデアをコンペを通して募集する場だね。企業からすればある種のクラウドソーシングでしょう。 だから入賞者には企業からそれなりの報酬が払われ、報酬を得るにはソリューションの説明が義務付けられてる。
- 944 名前:デフォルトの名無しさん mailto:sage [2021/08/11(水) 19:23:33.11 ID:lYh86/4uM.net]
- >>915
あー、片寄ってるのかも。。。
- 945 名前:デフォルトの名無しさん mailto:sage [2021/08/12(木) 15:53:15.16 ID:D76zE5lQ0.net]
- テンソルの次元が間違ってた
- 946 名前:デフォルトの名無しさん mailto:sage [2021/08/13(金) 10:22:01.47 ID:JDdJznaVM.net]
- nnで遊んでてどテンソルの次元が分からなくなることがあるんだけど皆さんそう言う苦労感じることはないの?
- 947 名前:デフォルトの名無しさん mailto:sage [2021/08/13(金) 22:10:35.40 ID:7BlJfnOl0.net]
- kerasだと間違わないけど生のtensorflowだとやらかし易いのかな
- 948 名前:デフォルトの名無しさん mailto:sage [2021/08/14(土) 04:11:47.31 ID:tSdjK28r0.net]
- テンソルの次元を型として扱ってほしい時はあるよね
pythonだと型がふにゃふにゃだから仕方ないが
- 949 名前:デフォルトの名無しさん mailto:sage [2021/08/14(土) 10:10:41.67 ID:7G/MQzi80.net]
- pytorch使ってるけど
fcに繋げるときに次元計算するの大変
- 950 名前:デフォルトの名無しさん [2021/08/14(土) 10:15:40.32 ID:owqwTzAL0.net]
- LazyLinearがある
- 951 名前:ナしょ []
- [ここ壊れてます]
- 952 名前:デフォルトの名無しさん mailto:sage [2021/08/14(土) 10:58:01.55 .net]
- テンソルといえば、Python (つーかNumpy) の多次元配列が使いやすい上に速過ぎる
まあNumpyの線形代数ライブラリがC++とかでビルドされてるってだけだが、それにしても速い 問題が全部線形代数の言葉で記述される限りは、並のプログラマC++とかFortranでコード書くメリットほぼないね
- 953 名前:デフォルトの名無しさん mailto:sage [2021/08/14(土) 22:58:37.25 ID:gYaerU7s0.net]
- NumPyは生のCPythonでの演算に比べて高速だけど、それでもボトルネックになり得るから、精度は落ちるがPyTorchのテンソルでGPUに計算させるね
CuPyというものも一応あるが
- 954 名前:デフォルトの名無しさん mailto:sage [2021/08/15(日) 14:28:35.97 ID:Qb5ISoeor.net]
- CPUよりGPUの方が速いっていうのはそりゃそうだろとしか
>>925とはレイヤの違う話
- 955 名前:デフォルトの名無しさん [2021/08/15(日) 15:47:17.10 ID:si7Mpb2N0.net]
- > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw
- 956 名前:デフォルトの名無しさん mailto:sage [2021/08/15(日) 20:53:39.40 ID:HtCgJxPe0.net]
- cupyはサイズが小さいテンソルだとcpuより遅いみたいだけど
- 957 名前:デフォルトの名無しさん mailto:sage [2021/08/20(金) 12:10:40.90 ID:MQrCwhW/a.net]
- 方策勾配法で学習させたら累積報酬が伸びなくなったんだけどどうしたらいい?
https://i.imgur.com/JburTbf.jpg
- 958 名前:デフォルトの名無しさん mailto:sage [2021/08/20(金) 12:49:52.15 ID:FbVOze5U0.net]
- >>930
状態の保持が間違っていたりする? 変な曲線になるんだよね。
- 959 名前:デフォルトの名無しさん mailto:sage [2021/08/20(金) 20:03:47.74 ID:/LFG2LNja.net]
- >>931
ありがとう角度を三角関数で分解したり無理矢理スケーリングしたらなんとか学習進んでそうな感じする
- 960 名前:デフォルトの名無しさん [2021/08/22(日) 04:03:30.28 ID:0Cz6ueFz0.net]
- Rustのメモリ安全性はボローチェッカーによって担保されているが、
Nimと比較してRustはタイプ量が多い事により限りなく低い生産性と C++のような高い難読性、超巨大なバイナリ生成性能を兼ね備えています Nimはバージョン1.5.1でRustのボローチェッカーに似た「View types」が実装されれば、 GC無しのView typesで参照の有効性を検証することによってメモリ安全性を保証しつつ 限りなく抑え込まれたタイプ量で高速化したCのソースコードを吐き出せます Nimソースコード ==nimコンパイラ==> Cソースコード ==Cコンパイラ==> バイナリ なので、nimコンパイラが通った時点でメモリ安全性が担保されませんか? Nimの実験的特徴 著者: アンドレアス・ルンプ バージョン: 1.5.1 nim-lang.github.io/Nim/manual_experimental.html Nimは限りなく抑え込まれたタイプ量で高い生産性とPythonのような高い可読性を実現し ているにもかかわらず、高速なCのソースコードを吐き出せるのでC言語でリモートワーク されている方は割り振られた仕事が早く終わっても終わってないふりをして怠けることができる 「怠け者とはこうあるべきだ!」と言うとても大事な事を Nim は我々に教えてくれます
- 961 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 09:13:36.46 ID:ofqTG56L0.net]
- >>1
kaggleやり始めた 全然順位上がらない😭
- 962 名前:デフォルトの名無しさん [2021/08/22(日) 18:24:57.02 ID:GHDNHuGz0.net]
- 東京都のコロナ感染者数の予測をやっている人いませんか?
もしいるとして、どれくらいの精度ですか?
- 963 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 18:56:17.98 ID:zdGxm9qc0.net]
- 測定データに大きな偏りがあるため予測
- 964 名前:s能
なんか数字が出たとしても、誤差さえも見積もり不能 [] - [ここ壊れてます]
- 965 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 19:08:22.91 ID:J4tnnXpD0.net]
- カコ習慣の平均とを使用するとか工夫すればある程度できるんでね?
でも予測ってどんなん? 出せても感染者の予想分布かな
- 966 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 19:09:10.38 ID:J4tnnXpD0.net]
- 過去1週間の平均等
- 967 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 19:12:35.97 ID:zdGxm9qc0.net]
- 統計の基本中の基本だけど
偏ったサンプルデータを分析に使うと まともな結果は導けない
- 968 名前:デフォルトの名無しさん mailto:sage [2021/08/22(日) 19:19:46.61 ID:J4tnnXpD0.net]
- 実務でまともなデータなんてあまり無いよ
そんなデータからなんらかの成果を出すのが腕の見せ所なんだけどね
- 969 名前:デフォルトの名無しさん [2021/08/22(日) 21:24:36.63 ID:zwA+sbGKd.net]
- そうだけど糞データではどうしようもない
後々面倒なことになる
- 970 名前:デフォルトの名無しさん [2021/08/22(日) 21:47:00.98 ID:0Cz6ueFz0.net]
- Rustのメモリ安全性はボローチェッカーによって担保されているが、
Nimと比較してRustはタイプ量が多い事により限りなく低い生産性と C++のような高い難読性、超巨大なバイナリ生成性能を兼ね備えています Nimはバージョン1.5.1でRustのボローチェッカーに似た「View types」が実装されれば、 GC無しのView typesで参照の有効性を検証することによってメモリ安全性を保証しつつ 限りなく抑え込まれたタイプ量で高速化したCのソースコードを吐き出せます Nimソースコード ==nimコンパイラ==> Cソースコード ==Cコンパイラ==> バイナリ なので、nimコンパイラが通った時点でメモリ安全性が担保されませんか? Nimの実験的特徴 バージョン1.5.1 nim-lang.github.io/Nim/manual_experimental.html 第二プログラミング言語として Rust はオススメしません Nim をやるのです https://wolfbash.hateblo.jp/entry/2017/07/30/193412 Nimは限りなく抑え込まれたタイプ量で高い生産性とPythonのような高い可読性を実現し ているにもかかわらず、高速なCのソースコードを吐き出せるのでC言語でリモートワーク されている方は割り振られた仕事が早く終わっても終わってないふりをして怠けることができる 「怠け者とはこうあるべきだ!」と言うとても大事な事を Nim は我々に教えてくれます
- 971 名前:デフォルトの名無しさん mailto:sage [2021/08/23(月) 11:25:28.32 ID:KpLgmN1yM.net]
- optunaユーザーいる?
いまいちじゃないコレ?
- 972 名前:デフォルトの名無しさん mailto:sage [2021/08/24(火) 14:58:57.23 ID:Hl9oAnl10.net]
- >>935
コロナ感染者の予測を出したいなら、用いられた検査方法と検査キットの情報は不可欠 測定誤差が大きすぎ
- 973 名前:デフォルトの名無しさん mailto:sage [2021/08/24(火) 16:23:56.10 ID:IgUjDL9R0.net]
- 回しかた足りないのかな?
3000じゃ足りない?
- 974 名前:デフォルトの名無しさん mailto:sage [2021/08/24(火) 21:05:22.63 ID:WPVjFHuu0.net]
- https://news.mynavi.jp/article/20210823-1954227/
東芝など、学習済みAIを用途やハードの仕様に合わせて展開できる技術を開発 2021/08/23 20:28 DNNのサイズをその重要度を見分けて削る事で 小さなエッジデバイス上でも性能を落とさずに AIモジュールを動かすことができる、と
- 975 名前:デフォルトの名無しさん mailto:sage [2021/08/25(水) 22:42:46.04 ID:PyfYFB5Y0.net]
- 塩野義製薬 AI創薬技術によるマルチターゲットに対する創薬を目指した米InveniAI社との業務提携について
https://www.shionogi.com/jp/ja/news/2021/04/210428.html 塩野義、創薬研究における開発候補化合物の探索にAWSクラウドの利用を開始 https://classmethod.jp/cases/shionogi/ 塩野義製薬、新型コロナ重症化抑制の候補薬で米バイオエイジ社と契約 https://www.nikkei.com/article/DGXZQOHD268OV0W1A120C2000000/ 製薬業界の丸ごとAI化を目指す取り組み(LINC)が日本でスタート 塩野義、理研、京都大学、NEC等 https://news.mynavi.jp/article/20171013-okuno_vinas2017/ >富岳スパコンを使った分子化合物シミュレーション >AI(機械学習)を使った、分子動力学計算の最適化 AIを使った分子自動設計 タンパク質立体構造の予測 >知識ベース、過去の分子ビッグデータを整理し、解析、探索するデータサイエンス技術
- 976 名前:デフォルトの名無しさん mailto:sage [2021/08/26(木) 08:54:20.20 ID:E8v09I6UH.net]
- ごめん、optunaちゃんとしてた
- 977 名前:デフォルトの名無しさん mailto:sage [2021/08/27(金) 08:05:38.52 ID:ebhntqkF0.net]
- 検定の考え方と機械学習(特にdeep learning)ではかなり考え方に差がある。
- 978 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 02:57:16.24 ID:t9q3RQuP0.net]
- mecabより良い解析器って出てこないのかしらん?
- 979 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 09:31:33.03 ID:3DuZZh5/a.net]
- mecabの何が不満?
- 980 名前:デフォルトの名無しさん [2021/08/30(月) 11:41:39.31 ID:D5v3tNv00.net]
- sudachi
- 981 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 13:28:14.44 ID:HWYFF8sx0.net]
- メカブは体にいい
- 982 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 19:26:51.33 ID:t9q3RQuP0.net]
- >>951
使っている手法がcrfベースと古いから
- 983 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 20:53:05.50 ID:DbDPNUf30.net]
- >>954
手法が古くても必要な結果を得られたら問題無いんじゃね?
- 984 名前:デフォルトの名無しさん [2021/08/30(月) 20:58:58.02 ID:D5v3tNv00.net]
- バイトペアエンコーディング全盛の今、形態素解析なんて時代遅れだよねと思いきや、Whole Wordなんて手法も出てきてやっぱり重要だっていうね
- 985 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 21:56:49.19 ID:t9q3RQuP0.net]
- >>955
ビッグデータ処理してると数パーセントの精度の違いが大きく出てくるから なるべく高精度のが欲しい
- 986 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 21:59:20.42 ID:t9q3RQuP0.net]
- 松尾研の要約システム、ひどいな
- 987 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 22:00:46.32 ID:FcBMjYja0.net]
- 精度が売上に直結するならいいけど
弱い相関ならシンプルなロジック選んでしまうな
- 988 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 22:13:34.30 ID:IfLgW1Xz0.net]
- 40年以上前から言われているけど
何文字以内、何行以下の要約というのは あまり意味がない。必須な部分がかけてしまうかもしれないし 余分な部分が残ってしまうことがある
- 989 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 22:23:27.16 ID:6Ldth3Lh0.net]
- 愚痴みたいになるけど形態素解析とかIMEみたいな古典的な分野ばっかやりすぎて
統計的機械学習やディープラーニングへの対応が遅れて 世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ アテンションやトランスフォーマーみたいな仕組みが 日本から出てこなかったのは悲しい
- 990 名前:デフォルトの名無しさん mailto:sage [2021/08/30(月) 23:06:53.06 ID:DbDPNUf30.net]
- >>957
それなら古いからじゃなくて必要な精度を得られないからってことで 精度に関わる他の部分を変えることで目的を達成できるかも 何がその目的達成に影響するのかは判らない
- 991 名前:デフォルトの名無しさん [2021/08/31(火) 04:15:10.73 ID:D+Jl3XmV0.net]
- >>950
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
- 992 名前:デフォルトの名無しさん [2021/08/31(火) 04:39:38.87 ID:D+Jl3XmV0.net]
- >>958
個人的にはあれはよくできてると思う。 まず、要約はextraction法とabstraction法の2種類がある。 extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。 一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。 松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン というのはほとんど見たことがない。 ただ、実際に売れるかどうかは別。 この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと 企業は内部情報が外部に流出することになるのでまず100%導入はしない。 一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、 企業のイントラネットの中に専用サーバーを立ち上げることなんだが、 これをやるとSI業者には勝てない。 また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売 を始めたりするので、敵を誘い込むことになる。
- 993 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 07:41:34.77 ID:vHl4DeHq0.net]
- >この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。 用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。 そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
- 994 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 14:21:53.09 ID:Sht6cbMy0.net]
- optunaで指定するパラメータの範囲はどう決めれば良いの?
apiにパラメータの取りうる範囲が1 <= p < ∞とあるとき
- 995 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 15:50:48.02 ID:j/ruVWceM.net]
- 1と∞で二分探索
- 996 名前:デフォルトの名無しさん [2021/08/31(火) 19:28:12.45 ID:l6anRrPu0.net]
- 無限の半分は・・・無限!!
- 997 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 19:30:49.23 ID:IiAPjlBZ0.net]
- >>966
無限大に発散するような関数はまずないはずだけどどういう式?
- 998 名前:id:ignore mailto:sage [2021/08/31(火) 20:06:05.81 ID:Yj2FMtNrr.net]
- exp
- 999 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 20:07:05.73 ID:TL2gsmuJ0.net]
- 表からともったら裏、裏かとと思ったら表
- 1000 名前:デフォルトの名無しさん mailto:sage [2021/08/31(火) 20:56:01.05 ID:Sht6cbMy0.net]
- >>969
xgboostのパラメータ reg_alphaとか
- 1001 名前:デフォルトの名無しさん [2021/09/04(土) 02:49:35.61 ID:9cArpdYt0.net]
- >>877
Rejected internal applicants twice as likely to quit doi.org/10.5465/amj.2018.1015
- 1002 名前:デフォルトの名無しさん [2021/09/04(土) 04:02:08.87 ID:9cArpdYt0.net]
- >>965
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば 要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供 となると、かなり困難に直面するんじゃないかと思っただけ。 Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。 これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、 自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。 また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、 最終的には開発元の資本力によって決まることになる。
- 1003 名前:デフォルトの名無しさん mailto:sage [2021/09/05(日) 22:01:26.67 ID:zykEaDwPr.net]
- 松尾研で文章を3つの文にまとめるアプリができてましたが
これを任意の文の数にまとめられて更に 「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
- 1004 名前:デフォルトの名無しさん mailto:sage [2021/09/05(日) 22:33:17.49 ID:vgQPhGSA0.net]
- どうして文の「数」にこだわるの?
重要なことがその「数」以上あったらどうするの?
- 1005 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 01:15:14.50 ID:otQfwK4Sr.net]
- 3つにする、5つにする、など試して最も妥当な説明書になっているものを最終出力出来たらいいんですがねえ
- 1006 名前:デフォルトの名無しさん [2021/09/06(月) 01:21:37.13 ID:owoO2Yj90.net]
- 妥当な説明を定式化せよ
- 1007 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 08:50:13.28 ID:0zGOZ0ajM.net]
- >>975
できるんじゃない?
- 1008 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 09:29:44.52 ID:fsHJbGHja.net]
- 重要な項目が5つあって、3つの文にせよ
という場合は、一つの文に2つ盛り込むとか? なんだか本末転倒だなあ 重要な項目がいくつあるか分からなくなるじゃないの
- 1009 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 10:59:46.00 ID:fK8LC2SFr.net]
- 重要な項目の数に合わせて文の数も調整できたらなあ
更にはそれぞれの文の構造化まで自動化
- 1010 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 11:36:22.35 ID:
]
- [ここ壊れてます]
- 1011 名前:fsHJbGHja.net mailto: 例えば、裁判所の判決文とかは全部重要なのだそうで
要約できないらしい。法曹関係者が要約が下手なのは そういう理由もあるらしい [] - [ここ壊れてます]
- 1012 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 16:50:04.99 ID:XuYnRkl0M.net]
- ほう、そうかい
- 1013 名前:デフォルトの名無しさん mailto:sage [2021/09/06(月) 21:34:45.15 ID:3OGE1cne0.net]
- マニュアルを要約して
手順を飛ばされてもやだな
- 1014 名前:デフォルトの名無しさん [2021/09/07(火) 08:21:33.30 ID:QjyEMXOy0.net]
- だが待って欲しい
その手順は本当に必要だったのだろうか
- 1015 名前:デフォルトの名無しさん [2021/09/07(火) 09:23:15.96 ID:IHJavDsS0.net]
- いやちょっと待って欲しい
そもそも三つの文に…
- 1016 名前:デフォルトの名無しさん mailto:sage [2021/09/07(火) 12:15:41.45 ID:X6g3xS9u0.net]
- 富士通あたりがやり出しそう(笑)
- 1017 名前:デフォルトの名無しさん mailto:sage [2021/09/07(火) 13:03:13.11 ID:oZHnA/lFa.net]
- 試しにここのテキスト入れてみたら
めちゃくちゃ的外れな要約が出てきた どうやら掲示板は向いてないらしい
- 1018 名前:デフォルトの名無しさん mailto:sage [2021/09/07(火) 20:01:11.19 ID:Cp1uuQsT0.net]
- 新聞記事も読み終わって何がなんだかわからない
という記事が多いから、要約しても無駄だな
- 1019 名前:デフォルトの名無しさん [2021/09/12(日) 11:08:30.42 ID:PNU8wIel0.net]
- > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw
- 1020 名前:デフォルトの名無しさん [2021/09/22(水) 19:51:03.76 ID:pNoEEii80.net]
- リッジとラッソ回帰をうまく説明するためのデータセットて何かある?
勉強会の資料で探すてる ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
- 1021 名前:デフォルトの名無しさん [2021/09/23(木) 12:44:23.64 ID:7tGJmFKPF.net]
- 次スレここの再利用?
https://mevius.5ch.net/test/read.cgi/tech/1578890891/
- 1022 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:33:41.18 ID:fnXwjiVa0.net]
- 次スレ
【統計分析】機械学習・データマイニング31 https://mevius.5ch.net/test/read.cgi/tech/1632587566/
- 1023 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:34:31.80 ID:fnXwjiVa0.net]
- スカラー倍
- 1024 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:36:40.35 ID:fnXwjiVa0.net]
- みっつの数に意味はない
ただの経験則
- 1025 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:41:50.83 ID:fnXwjiVa0.net]
- アルタナティブ
- 1026 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:42:53.67 ID:fnXwjiVa0.net]
- 🉑
- 1027 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:44:07.46 ID:fnXwjiVa0.net]
- (*´∀`*)
- 1028 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:44:53.74 ID:fnXwjiVa0.net]
- (*´∀`*)
- 1029 名前:デフォルトの名無しさん mailto:sage [2021/09/26(日) 01:45:22.39 ID:fnXwjiVa0.net]
- (*´∀`*)
- 1030 名前:1001 [Over 1000 Thread.net]
- このスレッドは1000を超えました。
新しいスレッドを立ててください。 life time: 267日 16時間 34分 27秒
- 1031 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|

|