[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 08/19 23:27 / Filesize : 245 KB / Number-of Response : 1025
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【統計分析】機械学習・データマイニング26



1 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 09:23:06.34 ID:bjsiNRs40.net]

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■関連サイト
機械学習の「朱鷺の杜Wiki」
ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
-
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/

【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
-
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:: EXT was configured

166 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 19:07:25.32 ID:qJaHnW7l0.net]
参考書を変える

167 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 19:11:04.90 ID:fonAqmctr.net]
>>161
amdも意外と使えるらしいけど、情報ないし疲れるよ。動かないとき常にうたがっちやうしね

168 名前:デフォルトの名無しさん [2019/10/09(水) 19:19:32.23 ID:4X2jyJQLM.net]
古典統計学とベイズ統計学をちゃんと学びたい

169 名前: mailto:sage [2019/10/09(水) 20:05:21.59 ID:K/FCWkI00.net]
>>166
統計論と確率論は違うものですか?

170 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 20:14:54.29 ID:fTI0icewa.net]
統計学の中で使われる道具の1つが確率論

171 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 20:23:04.27 ID:ZvOECUeE0.net]
>>161
まずはawsかgcpでやってみろ。
はじめからグラボなんか購入しても必ず後悔する。

172 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 21:11:35.20 ID:MK+5GX/v0.net]
古典統計とは集合論と位相空間論から測度論に発展して確率論との関係性のあたり?

173 名前:デフォルトの名無しさん [2019/10/09(水) 22:40:50.59 ID:+iZUlLJa0.net]
わかんない

174 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 22:44:05.44 ID:zMnGtdTv0.net]
アホ



175 名前:デフォルトの名無しさん mailto:sage [2019/10/09(水) 22:58:19.23 ID:Qjd49VQKa.net]
現実問題として、測度論まで必要になることはあるかなあ?
まずは連続量ではなくて離散量での理解が先かと思われる
それならそんなに難しくないでしょ

176 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 00:11:01.13 ID:O5ET7Lyz0.net]
規定関数の概念と関数のノルムさえ理解していればいらん。

177 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 00:11:57.40 ID:O5ET7Lyz0.net]
逆にそれがわかってない研究者はくそ

178 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 00:14:30.11 ID:O5ET7Lyz0.net]
それ=『規定関数の概念と関数のノルム』な。

179 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 00:17:00.40 ID:O5ET7Lyz0.net]
わら。×規定
自分がわかってませんでした。

180 名前:デフォルトの名無しさん [2019/10/10(木) 02:31:31.78 ID:eF+ihzDEM.net]
グレブナー基底は重要だな

181 名前:デフォルトの名無しさん [2019/10/ ]
[ここ壊れてます]

182 名前:10(木) 06:52:08.55 ID:H/x/U9NKM.net mailto: >>160
勉強のためにスクラッチで書くならpythonがオススメ。ネットに情報が多いから
仕事のためならC一択
[]
[ここ壊れてます]

183 名前:デフォルトの名無しさん [2019/10/10(木) 06:53:03.85 ID:H/x/U9NKM.net]
>>169
何故そこでcolabが出さない

184 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 10:19:46.41 ID:xGOoNgUAa.net]
統計学を理解できていないのに理解したと思い込んだ人はこういう頓珍漢なことを平気で言い出す

@Inetgate:
@usukutilife @u874072e 一般的な統計処理において、標本数が30を超える場合には正規分布を仮定できますが、
えん さんが調べた結果だと全然正規分布になってないので、食べログの数値操作疑惑、真っ黒じゃねーかと。

https://twitter.com/Inetgate/status/1181488204068749312
(deleted an unsolicited ad)



185 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 10:23:07.08 ID:H/x/U9NKM.net]
母集団の分布が正規分布に従うと"仮定"すれば、間違ってない意見だな
仮定すれば

186 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 10:25:56.74 ID:H/x/U9NKM.net]
って、もとのグラフをみたらbin数がやばかった・・・

187 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 14:07:25.58 ID:9SEfnsqfa.net]
標本抽出の仕方がランダムサンプリングで
母集団が正規分布の時だけに成り立つことを言っているな

188 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 18:30:07.85 ID:7gKn5Xz20.net]
競馬あてて見たいんだけど特徴量として前5走を使いたいんだけどどんな実装にすればいいのかな
どなたかヒントいただけないでしょうか

189 名前:デフォルトの名無しさん [2019/10/10(木) 18:50:01.66 ID:i+8+28k+F.net]
前走の結果より血統でやった方が良いって先輩は言ってた

190 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 18:56:00.12 ID:cL0M7hVK0.net]
入力で与えるのが出馬一覧とかで順番の意味を無くしたいならPointNetとかの構造を真似したりすればいいんじゃない

191 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 21:27:00.23 ID:aZnaY5Is0.net]
>>180
あれ、逆にわかりずらいと思うんだが。
環境設定がすげーわかりずれーわ。

192 名前:デフォルトの名無しさん mailto:sage [2019/10/10(木) 23:11:06.33 ID:bdrwblpoa.net]
>>185
ググればソースコード付きでいろいろ出てくるが

193 名前:デフォルトの名無しさん [2019/10/11(金) 08:18:38.76 ID:mCGV3tUv0.net]
>>184
中心極限定理の話しで
標本数を30にした平均値の分布は
元の分布に関係なく正規分布とみなせるって事だよな

食べログの分布もその分布から標本を30取り出して
平均値を求める操作を10000回繰り返して
平均値の分布を描くと正規分布に近くなるはず

194 名前:デフォルトの名無しさん mailto:sage [2019/10/11(金) 11:53:47.65 ID:BrwAZKhG0.net]
>>186
血統も絡めてるよていだけど、前走も大事かなと思いまして。

>>187
前走ではAの馬に負けてるから今回も厳しそう、とかの特徴を抽出したいなと思いまして、順序はそれなりに大事なのかなと考えています。

>>189
巷にあるコードよりも、より順序を重視する方法が無いものかなと。

数値やカテゴリーなどの特徴ではなく、多次元特徴を一つの特徴量として扱うことができないかなという感じです。



195 名前:デフォルトの名無しさん [2019/10/11(金) 11:58:01.09 ID:hkXt1GtmF.net]
重量ハンデは?

196 名前:デフォルトの名無しさん mailto:sage [2019/10/11(金) 14:41:23.78 ID:uWNk0GcMM.net]
アルバイトでデータ解析やってる人間の意見としては、
とにかく役立ちそうな特徴量を選択せずにぶち込めるだけぶち込んで、
一度xgbかcgbを回してみればいいんじゃない
そうすれば重要な特徴量が何か抽出できるでしょ
話はそれからよ

勝ち馬をよく当てる人が何を大切にしているか調べることからはじめるべき

197 名前: mailto:sage [2019/10/12(Sat) 10:11:52 ID:UGc1lgsI0.net]
馬を株の銘柄に置き換えてリターンとリスク(分散)を元に
共分散使って有効フロンティアの曲線を引いて
無差別曲線と接する部分の比を見てパーセンテージの高い順に馬を買うってのは?

198 名前:デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156]) [2019/10/13(Sun) 00:20:47 ID:kaSZg9r20.net]
>>184
すでに指摘されているが、母集団の分布は正規分布である必要はない

>>190
中心極限定理の話(前半の話)はそうだけども、後半の部分は何が言いたいのかよく分からない

食べログの評点は一人当たり整数値の1~5を付けられる(ある店舗における点数分布をAとする)
各店舗は添付ごとにN人の評価の平均を平均点として算出する(各店舗の平均点分布をBとし、これが話題となっている分布)

Aの採点を行うのが一般人であると仮定すると、各店舗は同一の母集団確率分布に従うものと仮定でき、各店舗の確率変数X1, X2, …, XNは同一の母集団確率分布からのランダムサンプルと考えられる
大数の法則により、標本平均(分布Bのこと)は母集団の平均に近づき正規分布になる

標本数30以上というのはNが30以上ということで、この部分は残念ながら自明ではない
ある焼肉屋の評価は67件から構成されているが、別の焼肉屋は2件となっている

つまり最大限「食べログ」を擁護するのであれば、標本数が30以上ではないため前提条件が間違っている、ということだろうか

199 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 00:57:27.47 ID:0ePwtCDKa.net]
各店の平均化する前の採点が同一母集団に従うという仮定に無理がありすぎる
例えばラーメン屋とスイーツ店の採点者が同じ傾向の採点するなんて仮定は不自然

200 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 00:59:42.54 ID:kaSZg9r20.net]
>>196
すまん、焼肉屋しか見てなかった
実にその通り

201 名前:デフォルトの名無しさん [2019/10/13(日) 06:54:46.01 ID:ObLeezZqa.net]
>>159
Juliaでしょう。

202 名前:デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.128.168]) [2019/10/13(Sun) 06:56:55 ID:ObLeezZqa.net]
>>160
Flux

203 名前:デフォルトの名無しさん [2019/10/13(日) 07:21:13.99 ID:Fxu1r5BT0.net]
>>195
大数の法則は標本数を増やすと標本平均が母平均に近づくということ

中心極限定理は平均値の分布に関する定理
食べログの評価の数が30になった時点で平均値を計算して
一度リセットするのを繰り返す
その平均値の分布は正規分布に近づく

今の評価の分布がその店に行く人の評価の分布を表している
のであれば今の評価分布から30標本を取って平均値を求める
操作を復元抽出で繰り返しても同じような結果になるだろう

204 名前:デフォルトの名無しさん [2019/10/13(日) 07:23:54.12 ID:Fxu1r5BT0.net]
ある店の評価分布は標本数が多くなっても正規分布になるとは言えない
分散が広くなるのはその店のサービスや品質が安定していない事が原因になりうる
その店の特徴が分布に反映される

同様に店を評価する側の特徴も反映されるだろう



205 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 07:58:04.98 ID:S6cUkNQoM.net]
深層学習の凄いことのひとつは特徴量を人が設計する必要がない、と本とかに書いてありますが、どう理解すればいいのか分からず教えてください!

ここでいう深層学習とはニューラルネットのことですか?(線形回帰やSVMと違って説明変数を人間が決めてないから? )

206 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 08:07:52.14 ID:A69S9ntC0.net]
レビューを投稿する行動を取る時点で母集団にサンプルバイアス

207 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 08:55:43.76 ID:kaSZg9r20.net]
>>201
言ってることの一つ一つは正しいことは理解できるんだけど、何が言いたいのか理解できないんだ

食べログが評価を操作しているかどうか、は今説明してくれた事を駆使すれば判別できるんだろうか?

あるいは、Twitterの書き込みのおかしさ、は今説明してくれた事を駆使すれば、ココがおかしいと指摘されるんだろうか

208 名前: mailto:sage [2019/10/13(Sun) 09:26:19 ID:vNAU+AUMa.net]
>>201
各店舗の分散は各店舗の分布には影響しても全店舗の平均値の分布には影響しないでしょ

209 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 10:08:21.52 ID:uKg8mtfTa.net]
中心極限定理はあくまで「同一の母集団から得た独立な確率変数であれば、十分な数の平均値を集めたものの分布が正規分布に近似できる」というもの
全店舗の採点者が同一の基準に従う採点を行うという前提が成り立たなければ成立しない定理

210 名前: mailto:sage [2019/10/13(Sun) 10:56:42 ID:kaSZg9r20.net]
>>206
個々の採点者が同じ基準でないのに中心極限定理を持ち出しているのがおかしいと主張しているわけか、なるほど

同じ基準ではないにしろ、少し幅をつけてみよう
個々の採点者はある得点を中心に正規分布で配点する、もしくは一様分布で採点する、あるいは同じ点数しかつけないものとする

正規分布で採点する者は、正規分布の合成が正規分布になることから、平均値の分布もまた正規分布
一様分布で採点する者は、分布関数の底上げにはなるが平均値には影響を与えない
同じ点数しかつけない者も、平均値そのものをずらす事にはなるが正規分布の形は歪めない

つまるところ上記の前提が成り立つ場合には、平均値の分布は厳密に正規分布になる
毎回1点で、たまに4点をつけるような人が大量にいないと、この評点と言う平均値分布を正規分布から歪めるのは難しいように思う

211 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 12:13:54.05 ID:pJwii1Hg0.net]
>>202
多分、画像データを深層学習(ニューラルネット)で学習することを念頭に置いてる話だろう。
もっと広い文脈で使えるときもあるがたいていは画像でうまくいった話を誇張して言ってることが多い。

212 名前:デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129]) [2019/10/13(Sun) 12:41:16 ID:Fxu1r5BT0.net]
>>205
平均値についても同様の事が言える
仮に評価する側が同じだとしても
店舗の特徴によって分布の形は変わる
分布の形を見る事で店舗の特徴を把握してその店を利用するかどうかを事前に利用者が判断できるようにするサービス
が本来目標としたものかもしれない

分布を意図的に操作する事で金儲けに利用しようとした疑いが上がっているという問題だと思う

213 名前:デフォルトの名無しさん [2019/10/13(日) 12:44:15.71 ID:Fxu1r5BT0.net]
>>207
評価尺度はただの順序尺度で間隔尺度ではないだろう

214 名前:デフォルトの名無しさん [2019/10/13(日) 12:53:02.60 ID:sm0sVhGqM.net]
>>159
大規模ですけどC、C++、アセンブラです。
現在、全部で数百万ステップです



215 名前:デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156]) [2019/10/13(Sun) 13:19:59 ID:kaSZg9r20.net]
いかん、ラーメン屋の得点とスイーツ屋の得点を合わせて平均するとか謎なことをしていた
改めてデータに立ち戻ろう

3.6にピークがあるのは、とりあえず4に入れておこう層が2/3くらいいて、残りの1/3がとりあえず3に入れておこうということ4*2/3+3*1/3=11/3=3.67で説明できそうだ
逆に言えば、ここにピークが立つのは「とりあえず3か4に入れとけ層」が一定数いるということで、これは直感と合うのであまり怪しくはなさそうだ

次に3.8にギャップがある理由を考えてみる
元のデータを見た所、2つのガウス関数の和で表現できそうだ
一つは平均3.6で3σが0.3にあるピーク、もう一つは平均3.75で3σが0.05のピーク
こう仮定すると3.8にギャップができているのは、この2つ目のガウス関数の裾野に原因がある

この2つのガウス関数が意味するところは
ラーメン屋に通う「オヤジ層」とスイーツ屋に行く「レディー層」の違いを表すのか、
あるいは「関東に住んでいる層」と「関西に住んでいる層」を地域差表すのか、
はたまた疑惑の「操作されていない層」と「操作されている層」の人為操作の違いを表すのか

ラーメン屋だけの分布、特定地域だけの分布は作れそうだが、疑惑の操作に辿り着くのは難しそうだ

216 名前:デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129]) [2019/10/13(Sun) 13:25:37 ID:Fxu1r5BT0.net]
操作がなかったという帰無仮説を棄却できるかどうかじゃね?

217 名前:デフォルトの名無しさん [2019/10/13(日) 13:39:33.29 ID:kaSZg9r20.net]
>>202
まぁ>>208でも言っているけど画像をCNNで処理することを汎用化して言ってる気はするなぁ
少し古いけど

https://deepage.net/deep_learning/2016/11/07/convolutional_neural_network.html

にある

CNNはこういった特徴を抽出するための検出器であるフィルタのパラメータを自動で学習していく

ということなんだろう
RNNでも同じ話はあるので画像だけってことはないけど、なんでもかんでも特徴量を自動抽出ってことではないよ

218 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 13:45:19.51 ID:48i2xCpca.net]
三層のニューラルネットワークでは xor を分離できないという問題は
さらに多層になったことで何で解消されたの?

219 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 14:17:08.81 ID:25TC8kRG0.net]
3.8を超えた評価を3.6に落としてるって仮定したらほぼ同じヒストグラムになる
https://i.imgur.com/NrNIWrn.jpg
平均3.8標準偏差0.5で正規分布を生成して、3.8を超えた評価値を90%の確率で平均3.6標準偏差0.01の正規分布で取り直す操作をした(N=1000)
ただ同じだからと言って>>212のように元データの特徴量ごとの性質の違いを反映しているだけかもしれない

220 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 14:21:02.62 ID:qY0pTgmia.net]
>>213
操作がないという帰無仮説について仮説検定の方法で検証するには操作がない場合の点数の理想的な分布を知っていなければならない
その理想分布に基づいて実際の分布がどの程度ずれているのかを確認するのが仮説検定なのだから
しかしそんなもの知り得ないので検定のしようがない

221 名前:デフォルトの名無しさん [2019/10/13(日) 14:23:09.86 ID:llG9wcVha.net]
>>215
出来ないのは2層
3層にすると一度高次元空間に写してからシンプルな境界で分離出来る

222 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 14:45:50.67 ID:TJDkUn5hM.net]
>>208
>>214
ありがとうございます。ほぼCNNのことと思って良さそうなんですね
CNNが凄い!っことを深層学習という言葉に拡大して凄い!って言ってるイメージですね

223 名前: mailto:sage [2019/10/13(Sun) 15:01:05 ID:kaSZg9r20.net]
>> 215

細かいけど、まず層の数え方から
入力層は層に数えないので、ANDとORは1層で、XORは2層で表現できる

次にXORはなぜ2層で表現可能か
単純に、AND(正確にはNAND)とORの出力をANDで受ければXORが作れるから

ググったら以下のような図を見つけた
https://www.infiniteloop.co.jp/blog/wp-content/uploads/2017/12/XOR.png

>>218の回答はエレガントだけども、少し説明を加えると
(0, 0) → 0
(0, 1) → 1
(1, 0) → 1
(1, 1) → 0
を分ける直線は2次元平面内では書けないけど、3次元に拡張して
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
を分ける平面はa,b,c,dを適当に決めれば作れる(例えばa=d=0, b=c=1としてz=0.5の平面)

a,b,c,dを適当に決めて分離できるってそんなんアリかよ!?って最初は思うかもしれないけど
そんな純粋な気持ちは最初だけで、どうせa, b, c, dは見ないし分離できたら何でもOKになる

224 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 18:39:55.88 ID:48i2xCpca.net]
二層あれば大抵の関数は模倣できるのに
何でもっと多層が必要なの?



225 名前:デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129]) [2019/10/13(Sun) 18:43:34 ID:Fxu1r5BT0.net]
>>217
諦めたらそこで試合終了ですよ
目の前にヒントが転がっていても見えなくなる

226 名前:デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129]) [2019/10/13(Sun) 18:44:48 ID:Fxu1r5BT0.net]
>>218
線型結合してる層を増やすとなぜ高次元になるのかを直感的に判るように説明して

227 名前:デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6]) [2019/10/13(Sun) 19:30:49 ID:llG9wcVha.net]
>>221
層を増やす方が効率が高い

ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない

228 名前:デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6]) [2019/10/13(Sun) 19:32:44 ID:llG9wcVha.net]
>>223
一旦中間層のニューロン数だけの次元を持つ空間を経由できるから

229 名前:デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129]) [2019/10/13(Sun) 20:04:55 ID:Fxu1r5BT0.net]
>>225
線型結合して関数を通して
また線型結合して関数を通して
の繰り返しでなぜ高次元になるの?

関数によって非線形になるなら判るけど

230 名前:デフォルトの名無しさん [2019/10/13(日) 20:33:11.99 ID:llG9wcVha.net]
>>226
非線形な活性化関数噛ませるでしょ普通

自然に高次元になるんじゃなくてそうなる様にしてるんだよ、ニューロン数は自由に決められるから

231 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69]) [2019/10/13(Sun) 20:44:50 ID:/3kPh57iM.net]
ディープキスのほうがいい!
舌をからませるの
立つよね!

232 名前: mailto:sage [2019/10/13(Sun) 20:48:48 ID:P1vmVh210.net]
>ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない
こんなことを示した論文などない。
よくこんなことをさも証明されたことの如く言えるな。

233 名前: mailto:sage [2019/10/13(Sun) 21:28:26 ID:kaSZg9r20.net]
>>221
本質的な質問が来た
これについては俺も明確な答えは持ってないなぁ

直感的には、多層の方が中間層に保持できるパラメータ数が多く
そこには活性化関数を通した非線形の効果も含まれているので
ほどほどにノイズが消されていて抽象的な状態を保持できるから

と思うんだが、本当かどうかは分からない

234 名前:デフォルトの名無しさん [2019/10/13(日) 21:37:08.64 ID:llG9wcVha.net]
>>229
Montufar, Guido F., et al. "On the number of linear regions of deep neural networks." Advances in neural information processing systems. 2014.

NIPSの論文だが
何を根拠に「こんなことを示した論文などない(キリッ」なんて言えたのか



235 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 21:45:22.38 ID:kaSZg9r20.net]
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である

236 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 21:46:31.38 ID:kaSZg9r20.net]
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である

237 名前: mailto:sage [2019/10/13(Sun) 22:05:13 ID:48i2xCpca.net]
五、六層でいいのかと思いきや
ものすごく多層にするよねえ
うまくいくからという説明しかないのか?

238 名前:デフォルトの名無しさん [2019/10/13(日) 22:18:18.69 ID:/3kPh57iM.net]
>>221
〉二層あれば大抵の関数は模倣できる

その『大抵』とは、どの程度

239 名前:ネんですか?
それが示されてないのですから
まったく意味をなさないですよね?

>>230
その意味をなさない書き込みに、
本質的とかって、
レベル低すぎですね。
[]
[ここ壊れてます]

240 名前:デフォルトの名無しさん mailto:sage [2019/10/13(日) 22:20:28.84 ID:mSmeGM2p0.net]
>>235
完全な関数の導入じゃなくて疑似的な関数が解ればいいから

241 名前: mailto:sage [2019/10/13(Sun) 22:35:14 ID:kaSZg9r20.net]
>>235
あんたは性格悪いなぁ・・・
ニューラルネットワークの普遍性についての質問が本質的でないなら何が本質的なんだ?
知ってて聞いてるなら教えてやれよ

242 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 00:26:24.00 ID:Xj3JYQcoa.net]
専門的な知識はほとんどなく説明されても理解できる頭も持ってないけどマウントとりたいからとにかく突っかかる癖のある人が多すぎる

243 名前: mailto:sage [2019/10/14(Mon) 00:50:17 ID:yAy44Gfva.net]
初等関数?
特殊関数?

244 名前:デフォルトの名無しさん [2019/10/14(月) 07:16:20.36 ID:KQ95R8h/0.net]
>>232
それだと
x1, x2の入力を受けるニューロンと
それからx3を計算するニューロンを並列に並べたら良い

x1-x1\
x2-x2-out
\x3/
みたいに

次元を増やすの意味として変数増加とx^2などと混同しやすい
これらを区別する言い方は何?
変数増加→高次元
x^2など→非線形
とか?



245 名前:デフォルトの名無しさん [2019/10/14(月) 12:29:28.91 ID:utYACZDud.net]
前に『ゼロから作るディープラーニング』買ったけど
これ3千円はする高額な本だけど、計算や式の意味がわからず挫折したなあ…。

やっぱノートに書いて解き方や意味を学習するしかないと思うねん。

246 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69]) [2019/10/14(Mon) 12:54:25 ID:syyLl6c1M.net]
>>241
ならば『excelでわかるディープラーニング超入門』がオススメ
続編もある

247 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 13:19:28.08 ID:aq/jCORe0.net]
>>241
あの本は線型代数と微積分の知識は必須だと思う

248 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 13:53:05.51 ID:pO8Bz3ni0.net]
機械学習に数学はいらないよ

249 名前:デフォルトの名無しさん [2019/10/14(月) 14:01:22.69 ID:htBbaZR2r.net]
機械学習に数学はいらないよおじさん「機械学習に数学はいらないよ」

250 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69]) [2019/10/14(Mon) 14:23:44 ID:syyLl6c1M.net]
ソフト使うだけなら数学いらんわね

251 名前: mailto:sage [2019/10/14(Mon) 14:26:05 ID:daX/fZMnF.net]
適当にデータ放り込んで適当な手法を選択してなんとなく精度が良さそうなのを選ぶだけで成立する仕事なら数学など不要
普通の企業や研究室ではそんなものに金なんて出してくれないがな

252 名前:デフォルトの名無しさん [2019/10/14(月) 14:31:10.41 ID:JdA0BOgta.net]
>>247
そういう仕事は既にAutoMLに取られつつあるね

253 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 14:31:49.76 ID:XFqMr8NbM.net]
というかこの世界ももう土方がいるのか

254 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 14:40:16.73 ID:VuPQ6UMJ0.net]
>>240
並列に並べるために(x1, x2)からx3を作るための層が最低1つ必要なんだ
0か1かのような2値分類は、つまるところ出力層と全く同じ出力をする新しい次元を作って、その次元に直行する超平面で分類する作業なので

言い方は高次元や非線形で良いと思うけど、次元についてはニューロンの数が、非線形については活性化関数が深く関係している

もう少し詳しく説明しよう
より一般的な関数があったとして、入力が(x1, x2)のとき、最後の出力層への入力としては

(f1(x1, x2), f2(x1, x2), f3(x1, x2), …, fN(x1, x2)) … (1)

となっている
Nは最後の隠れ層のニューロンの数なので、次元と読んでいるのはニューロンの数だということが分かる

(1)を如何にして作るのかが重要になり、層を深くして(1)を作らなくても、ニューロン増やせばいいんじゃね?となる
隠れ層1層と出力層1層の2層あれば大抵の関数は模倣できると指摘している>>221はかなり鋭くて実にその通り

それでもなんで層を深くするのかというと>>224の効率が良いというのが一般な回答なんだが、Deep Learningを回している人なら実感があると思うけど、第一層のニューロンの数がある一定数ないと学習がうまくいかないことが往往にしてある
単に層を深くすればよいというのは明らかに直感と異なり、そうすると「どの層にどれだけのニューロンを配置すると良いか」という問題になり、これに対して自分なりの回答はまだ全然持っていない



255 名前:デフォルトの名無しさん [2019/10/14(月) 14:42:39.82 ID:syyLl6c1M.net]
最初から土方しかいないから。
今もほとんど土方。
できる人は研究者か大学教員になってる。

256 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 14:47:46.87 ID:daX/fZMnF.net]
この分野はむしろ大学より民間の方がやりやすいから本来なら博士行くような人も修士までにしてとっとと成果出せる環境に移ろうとする人が多くなってきた印象

257 名前:デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97]) [2019/10/14(Mon) 15:08:32 ID:utYACZDud.net]
>>242
ありがとう。調べてみます。

258 名前: mailto:sage [2019/10/14(Mon) 15:10:40 ID:4WTqwCCG0.net]
今ならまだ簡単にデータエンジニア目指せるけど、
早い者勝ちなのかな
すぐベテランにしか仕事がこなくなるよね

259 名前: mailto:sage [2019/10/14(Mon) 15:13:07 ID:4WTqwCCG0.net]
>>241
あの本のレベルの数学が分からないと厳しい
数学が分からないと言いながらDSやってる人たちでも理解できる程度の内容

260 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 15:22:52.88 ID:drx0D0Vb0.net]
博士持ち or ベテラン < 精度の高い競馬予測モデル開発者

データを集めてくるところが始まるから、Kaggleより難易度高い

261 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69]) [2019/10/14(Mon) 16:12:47 ID:syyLl6c1M.net]
博士号持ちといってもピンキリ

天才的な人もいるし、
とんでもない馬鹿もいる。

2、3枚の感想文のようなレポートで
博士号取れる院も
日本にある。
そこは博士号とりたい中国人ばかりが
留学生としてやってくる。
日本の恥!

262 名前:デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6]) [2019/10/14(Mon) 17:26:03 ID:JdA0BOgta.net]
>>257
例えばどこの院

263 名前:デフォルトの名無しさん [2019/10/14(月) 18:51:16.60 ID:/yNf4ic50.net]
>>255
DSって何ですか?

264 名前:デフォルトの名無しさん (エムゾネ FF43-1wBF [49.106.193.20]) [2019/10/14(Mon) 18:55:58 ID:ljIrzJ7BF.net]
Deta
Saiensu



265 名前: mailto:sage [2019/10/14(Mon) 19:22:19 ID:lAL0R9ntM.net]
サイエンティストな

266 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57]) [2019/10/14(Mon) 20:18:41 ID:DQ9Yh+dwM.net]
>>258
知り合いが現在
そこの教員やってるので
大学名は書かないけど
博士論文は国会図書館に
全て収蔵されるので
みればすぐわかる。

ヒントとしては、
なんと中国語でレポート2枚ぐらいの
博士論文がある!
日本の恥!
抹殺したい!

267 名前:デフォルトの名無しさん (ワッチョイ ab82-IE9o [113.20.238.175]) [2019/10/14(Mon) 21:29:45 ID:/yNf4ic50.net]
ディープラーニング発明した人に
ノーベル賞やるべきだと思う。

268 名前: mailto:sage [2019/10/14(Mon) 21:34:26 ID:lAL0R9ntM.net]
そんな人おらん
ローゼン・ブラッドからはじまって(もっと前から遡れる?
カナダ人のチームがドロップアウトを考えた時点で弾けたんだ

269 名前:デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.225.237]) [2019/10/14(Mon) 21:35:46 ID:lAL0R9ntM.net]
メダル獲れなかったkaggle用のnoteをgithubに載せてしまった。はずかしー
これで就活だあ〜。おーッ!

270 名前:デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6]) [2019/10/14(Mon) 23:09:10 ID:JdA0BOgta.net]
>>263
チューリング賞はとった

271 名前:デフォルトの名無しさん mailto:sage [2019/10/14(月) 23:23:40.59 ID:Dfy8oKXF0.net]
チューリング賞は賞自体よりも取ってる人のがたいてい有名っていう。。

272 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57]) [2019/10/15(Tue) 02:28:14 ID:KLW/euVzM.net]
甘利さんか?

273 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 06:10:05.34 ID:I8iXAPqNM.net]
競馬予想みたいにデータ収集含めて特定の領域に特化したモデル作れる人だけが勝つようになるかね、、、全く潰しのきかない職業になりそうですね。

274 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 06:37:37.44 ID:7FHw0Vhl0.net]
ゲームの自動生成やりたいから勉強してるけどそういう職業目指してない



275 名前:デフォルトの名無しさん (アウアウカー Sa51-KA+R [182.251.40.158]) [2019/10/15(Tue) 07:35:51 ID:5lPGjOaaa.net]
>>269
田倉寛史は失業するな。

276 名前:デフォルトの名無しさん (ワントンキン MMa3-Hjv8 [153.154.213.244]) [2019/10/15(Tue) 09:11:20 ID:CGH1vHQcM.net]
競馬って予想して勝てるゲームなの?

277 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 09:52:34.15 ID:BuCrjnSD0.net]
kerasしかわかんね

278 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 10:04:58.88 ID:ST5HgM4Ya.net]
統計学で競馬で食ってる人いる見たいよ
10年くらい前に聞いた話しだけど

279 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 10:08:19.91 ID:CpmUKzMvM.net]
統計学やらなくてもきちんと研究すれば勝てるらしいけど
才能の使い方としては空しいな

280 名前:デフォルトの名無しさん [2019/10/15(火) 10:31:23.58 ID:YjTx8zIDa.net]
佐々木洋佑の予想。

281 名前: mailto:sage [2019/10/15(Tue) 10:36:34 ID:tidBIruUd.net]
控除率25%の競馬で勝とうとするならもっと楽に勝てるとこに注力した方がましやろ

282 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 10:52:22.27 ID:AlK2cYWx0.net]
>>277
FXとか?

283 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 11:24:20.27 ID:CpmUKzMvM.net]
FXより競馬の方が百倍楽でしょ
勝つために必要なデータを取れればだけど

284 名前: mailto:sage [2019/10/15(Tue) 12:32:17 ID:2+ahF6drr.net]
>>221
層が多いほうが表現力が高い
教師データ数に対して異常に多いパラメータは、なんで性能が伸びるかよく分からない。

パラメータの中にはあたりくじがあるのかもという、宝くじ仮設なるものがあるけれどどうなのでしょう?



285 名前:デフォルトの名無しさん mailto:sage [2019/10/15(火) 13:03:36.76 ID:uSQ3MvZ60.net]
テーブルデータの解析って、nnをつかっても2層や3層だから、ぜんぜんdeepじゃないよね
営業の人はそれでもディープラーニングっていうんだろうなあ

286 名前:デフォルトの名無しさん [2019/10/15(火) 13:13:25.51 ID:KLW/euVzM.net]
テーブルデータってなーに?

287 名前:デフォルトの名無しさん [2019/10/15(火) 16:36:14.39 ID:OfiTiE/Hr.net]
>>221
深くする程損失関数が凸関数に近くなり最適解に辿り着きやすくなるかも知れないことが最近の理論研究で判明してきている

288 名前:デフォルトの名無しさん [2019/10/15(火) 23:48:10.86 ID:1HOx40aj0.net]
層を増やすと普通にバックプロパゲーションだけでは上手く学習できないんじゃね
どうするんだっけ

289 名前:デフォルトの名無しさん [2019/10/16(水) 07:22:30.93 ID:399vjxSUM.net]
甘利さんに聞く

290 名前:デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97]) [2019/10/16(Wed) 12:21:07 ID:KK2SmrYwd.net]
ドロップアウトって
実際に人間の脳でも行われているのでしょうか?

291 名前: mailto:sage [2019/10/16(Wed) 12:33:04 ID:ur38NdBia.net]
インドのリキシャの話は知ってるか?
人間は一度認識すれば多少形は違ってもリキシャだとわかる
おそらく人間は逆で、学習したデータを柔軟に他の認識の補助とすることができる

292 名前: mailto:sage [2019/10/16(Wed) 12:49:56 ID:Bk7OFSs90.net]
シミュラクラ現象のことか

293 名前: mailto:sage [2019/10/16(Wed) 12:55:37 ID:/VU6ev+W0.net]
kerasで作ったモデルをtfjsで読み込んだんだが
訓練してたときのinputがnp.arrayみたいで
tfjsでpred出来なくて積んだんだが(´・ω・`)

numjsとnumpyって同値じゃないよね?(´・ω・`)

294 名前:デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.48]) [2019/10/16(Wed) 13:17:05 ID:YrOVtgjKM.net]
>>287
当たり前のことすぎて
どう反応していいかわからんよ。
どういうレスが欲しかったの?



295 名前: mailto:sage [2019/10/16(Wed) 15:01:44 ID:ur38NdBia.net]
>>290
は?誰?どゆこと?w

296 名前: mailto:sage [2019/10/16(Wed) 18:21:05 ID:aRt+pAGAp.net]
>>286
どうだろうね
短期記憶が長期記憶に移るときに、移らなかった記憶はドロップアウトされたと考えられなくもないかなぁ

297 名前:デフォルトの名無しさん (スフッ Sd43-v2l4 [49.104.18.87]) [2019/10/16(Wed) 18:25:30 ID:mV5OOZvVd.net]
>>292
ドロップアウトは過学習を抑制するためにやるやつだし
記憶の結び付きとは違うだろ

298 名前: mailto:sage [2019/10/16(Wed) 20:46:35 ID:h/NO83zwa.net]
>>286
可塑性を示すものは発見されてるけどシナプス伝達におけるフィードバック機構は見つかってない
神経回路で見ればフィードバックの投射は当たり前に存在するけどそれでは誤差伝播にはなり得ない

299 名前: mailto:sage [2019/10/16(Wed) 20:46:41 ID:wE+aWwg30.net]
一度見た画像をぼんやりとしか覚えてない、という奴はドロップアウト臭い
だから>>292には個人的には賛成できるんだけど
ただ長期記憶が短期記憶うんぬんはリカレントNNを連想するから
このスレ的にはわかりにくいわ

300 名前: mailto:sage [2019/10/16(Wed) 20:48:32 ID:wE+aWwg30.net]
>>294
これま?

301 名前:デフォルトの名無しさん [2019/10/16(水) 21:07:54.87 ID:dCHq3Ix40.net]
>>295
>一度見た画像をぼんやりとしか覚えてない
そもそも観察メッシュが雑(現物→キャッシュ的なところ の時点で情報がだいぶ落ちてしまう)なヤツの場合・・・

302 名前: mailto:sage [2019/10/16(Wed) 21:15:52 ID:XUKusm2Pa.net]
BPの話かと思ったらdropoutの方だったすまん
そっちに関連するものは知らん

303 名前:デフォルトの名無しさん mailto:sage [2019/10/17(木) 08:31:12.53 ID:O+QTTbhZr.net]
>>283
KKT条件?

304 名前: mailto:sage [2019/10/17(Thu) 15:21:49 ID:lSerOx+kM.net]
違うぞ



305 名前: mailto:sage [2019/10/17(Thu) 15:30:38 ID:IoilZ/4vr.net]
mnistのデータをインストール出来なかったから
直接.npz型データを落としてきてこれを.kerasのdatasetsフォルダに入れたら
使えるようになった

こういうのは邪道なのか

306 名前:デフォルトの名無しさん mailto:sage [2019/10/18(金) 20:19:51.03 ID:ohB2HmeFH.net]
きみたちSparkとかHadoopとか使ってるの?
深層学習の理論の話しは出るけども

307 名前:デフォルトの名無しさん mailto:sage [2019/10/18(金) 22:12:26.25 ID:+r0vv9/5M.net]
Sparkは競争に負けたシステムだし、Hadoopはゴミ

308 名前:デフォルトの名無しさん mailto:sage [2019/10/18(金) 22:12:50.99 ID:+r0vv9/5M.net]
>>301
たぶん正道

309 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 10:20:09.74 ID:Xn59Im0u0.net]
hadoopなんてまともに使おうとしたらgoogle並みの回線チューニングが必要なんでしょ?

310 名前:デフォルトの名無しさん [2019/10/19(土) 11:27:09.87 ID:O4F+zYXc0.net]
ググってると、ときどき尾崎隆のブログが検索結果に出てくる。
みなさんもご存じ(?)の、
 「渋谷駅前で働くデータサイエンティストのブログ」というやつ。

名前を公開して堂々とブログを書いているのであるから、
間違いがあっても、実名でよく書いた!ほめてあげよう。
だって、5chなんて匿名だから批判とか妬みとか罵詈雑言ばかりだもんな。

尾崎は偉いと思う。実名で書いてるから。
ちょっと自信過剰すぎて、ブログの間違いを見つけるたびに
笑えるけどそれもまたいい!
尾崎はいいやつ!
これからもブログをどんどん書いてくれ!

311 名前:デフォルトの名無しさん [2019/10/19(土) 12:29:08.69 ID:RpavgoGg0.net]
自信過剰

312 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 13:48:35.47 ID:oy4za/qN0.net]
馬鹿乙

313 名前:デフォルトの名無しさん [2019/10/19(土) 14:19:40.09 ID:O4F+zYXc0.net]
>>302
> きみたちSparkとかHadoopとか使ってるの?

使っていない。
仕事でAzureとAWSを使っていて
もはやHadoopとか必要ねーじゃんとか思ってる
何か使う理由がある?

314 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 15:03:04.15 ID:5Qr+gv3yF.net]
オンプレ環境でリアルタイムのビックデータ解析やりたいシチュ
データ容量は1TB程度……あんまりないよね



315 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 16:11:23.85 ID:6fznObHGa.net]
使いまくるなら圧倒的にローカルで環境構築する方が安いし自由度高いからな
クラウドコンピューティング万能説を説いている人を見ると「それで十分な程度でしか使っていないんだな」という感想しかない

316 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 17:05:53.24 ID:MiA7VA63M.net]
安さは開発費込みで圧倒的ではないだろう
自由度は同意

317 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 17:42:12.86 ID:3SA6UJOGH.net]
よく知らんけど調達コスト高いのでは
特に期間

318 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 17:52:06.40 ID:Xn59Im0u0.net]
クラウド万能とは思わんが数百GB単位でボコボコ組むならまずクラウドで組んだ方がいいと思うがな。
自前のオンプレで組むならかなり正確な見積もりないと怖いわ。

319 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 19:39:02.78 ID:TPhFrENC0.net]
最近は大手メーカーがオンプレのGPU買うケースが増えてる
彼らはアンチクラウドだから絶対使わないし
データを外部に置くことを極端に嫌う

320 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 20:33:07.47 ID:MiA7VA63M.net]
あくまで自分の肌感覚だけど、最近そういう風潮もなくなってきたというか、
コストカットで見境がなくなってきた印象がある
日本は海外ほどクラウドの導入が進まないけど、そのうち一気にくるだろう

321 名前:デフォルトの名無しさん mailto:sage [2019/10/19(土) 21:05:40.70 ID:/qIJCw1Pr.net]
kerasの経験ばかり増えたが、いきなり生のtensorflowのコードを見たりchainerを見せられたり

日々勉強だなあ
データセットもある日はnpzある日はpkl

322 名前:デフォルトの名無しさん [2019/10/20(日) 00:03:48.28 ID:tuWSj+Lu0.net]
>>315
セキュリティが心配なんだろうと思う

323 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 00:44:54.23 ID:Ff441XyXM.net]
セキュリティというよりデータを抜かれるのが心配
特に画像処理

324 名前: mailto:sage [2019/10/20(Sun) 01:42:29 ID:nq7StZQCa.net]
自然言語処理は近頃 word2vec 一択なの?



325 名前:デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178]) [2019/10/20(Sun) 03:49:01 ID:zXnrxtUW0.net]
>>320
word2vec一択とはどゆ意味なのかわからんけど、
それだけでは人と会話できないじゃん?

326 名前:デフォルトの名無しさん [2019/10/20(日) 03:50:55.76 ID:zXnrxtUW0.net]
うちではword2vecは使ってないよ

327 名前:デフォルトの名無しさん (ワッチョイ 2fe6-hjwr [14.3.161.84]) [2019/10/20(日) 06:36:34 ID:RLBjETOG0.net]
自然言語処理スレで聞け

328 名前:デフォルトの名無しさん [2019/10/20(日) 06:51:17.93 ID:tuWSj+Lu0.net]
>>319
データを抜かれるのはセキュリティの脅威の一つ

329 名前: mailto:sage [2019/10/20(日) 08:21:29 ID:KT5ycvxT0.net]
クラウド=情報漏洩の可能性が高いわけではなく、
社内のアナログ上司の承認が降りないんだろう

データセンターと国内の一般的な企業のセキュリティの堅牢性を比べたら前者が勝ち

330 名前: mailto:sage [2019/10/20(日) 09:51:37 ID:4HG1pc8w0.net]
データ解析事業なんて当たればデカいけどリスクでかいし、
マイナス査定が通常の企業じゃ社員はやりたがらんだろうね。
クラウドにデータおきたがらないのなんてわかりやすい大企業病の例だわ。

331 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 10:15:03.52 ID:WLZPVulDa.net]
セキュリティ万全と言いながら音声認識の音声データを勝手に社員が聞いていたりという事例もあるわけで
物理的にデータが相手側に置かれる以上はいくらでもこっそり悪用できるし内部告発以外でそれに気付くことは不可能だからな
扱うデータの性質にもよるが大企業ならすぐ炎上し得るので慎重になるのは当然だろう

332 名前:デフォルトの名無しさん [2019/10/20(日) 10:18:01.24 ID:zXnrxtUW0.net]
クラウドとローカルと、うまく使い分ければいいだけの話
言語論争と同じで、その仕事に適しているものを使うというだけの話

333 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 10:37:24.12 ID:006B6SYsM.net]
個人的に、ローカル側を勉強するコストは別のことに回したいかなあ…

334 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 10:41:10.83 ID:006B6SYsM.net]
中小でローカルサーバーを利用したがるのは、
社員たちのITに対する理解度が底辺で、データをネットに接続しただけで、
情報漏洩のリスクが発生するからだったり…
奴ら、機械学習用のPCにwinny入れちゃうとかデフォだから



335 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 10:43:19.71 ID:4HG1pc8w0.net]
ほとんどの場合、上の自己保身のために下にサーバーメンテのコストを押し付けてるだけだがな。
だから仕事がスケールしねーんだよ。

336 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 11:00:28.67 ID:006B6SYsM.net]
良く調べもしないで、"クラウドは怖いから駄目"とか言っちゃう上司か
でもいつかは海外の流れに追随するんじゃないの

337 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 11:15:24.44 ID:NNpN8hAvH.net]
このスレにデータ基盤エンジニアはさすがにいないか?
データ基盤回りの技術もなかなか難しいっすね
ご多分に漏れず技術の移り変わり早いし

338 名前:デフォルトの名無しさん [2019/10/20(日) 12:45:28.09 ID:zXnrxtUW0.net]
データ基盤はNTTデータであっても
ぐちゃぐちゃになってますね。

データ分析が始まって、
何もわからないところから、
その時その時に良いと思う方法で
構築して結合するので、
現在は、もうそれはそれは恐ろしい
暗黒構造となってます。

資料を作るひまもなく付け加えるので、
資料無しのぐちゃぐちゃです。
終わってます。

339 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 12:57:25.45 ID:pEDMITRJM.net]
オートエンコーダについて質問です

計算の負荷を考えないことを前提の場合
層の深さは深いほど良い(もしくは損をすることはない)の理解であってますか?

340 名前:デフォルトの名無しさん [2019/10/20(日) 13:00:42.05 ID:xbXJ4T7Ga.net]
>>335
深すぎるとoverfittingする可能性がある

341 名前:デフォルトの名無しさん [2019/10/20(日) 13:03:01.09 ID:zXnrxtUW0.net]
>>335
いいえ、違います。
オートエンコーダを使って何をするのかにもよりますけど、
結局のところ次元圧縮を「適切に」やりたいわけです。

基本的には中間層から取り出した「圧縮」されたデータを
分析に利用するわけですから、
その分析として実現したいことによって、
「適切な意味が残存している」データを中間層から
取り出したいわけです。
よって適切な層の数はやりたいことによって変わります。

ただ、オートエンコーダの応用はいろいろ発展中ですので、
どういうことをやっているのか具体体に書いていただければ
よりよいアドバイスができると思います。

342 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 13:20:57.38 ID:pEDMITRJM.net]
>>336
返信ありがとうございます
オートエンコーダは入力と出力が同じだから過学習とかは考えなくてもいいと思ってたんですがそうでもないんですか?

343 名前:デフォルトの名無しさん [2019/10/20(日) 13:25:54.53 ID:zXnrxtUW0.net]
> オートエンコーダは入力と出力が同じ

原始的なNNとして使ってるだけなんだな
しかし入力と出力が同じとはどういう意味なんだ?

344 名前:デフォルトの名無しさん [2019/10/20(日) 13:52:06.21 ID:xbXJ4T7Ga.net]
>>338
教師データだけ丸暗記して、テストデータは復元出来なくなる



345 名前:デフォルトの名無しさん [2019/10/20(日) 14:05:16.23 ID:zXnrxtUW0.net]
データサイエンティスト名乗るやつって
みんな馬鹿だと確信できたよ

346 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 14:06:19.35 ID:pEDMITRJM.net]
>>337
すみません。お返事もらってたのに見逃してました
本で理論を学んでいてオートエンコーダの層の深さは多い方がいいのか少ない方がいいのか書いていなかったので、知識浅いのに質問してみました…
適切な意味が残存するようにということで一歩ですが少し分かった気がします。具体例を色々見てみたいと思います

>>340
>>339
教師データ入れて教師データで評価するとか考えてしまって書き込んでしまったのですが、教師データとテストデータはありますよね、ありがとうございます

347 名前: mailto:sage [2019/10/20(日) 15:07:27 ID:RLBjETOG0.net]
ディープラーニングが流行ってから
汎化性能ってあんまりうるさく言わなくなったよね

SVMあたりのころはやたら言及してたのに

348 名前:デフォルトの名無しさん [2019/10/20(日) 16:55:57.67 ID:5FKWmxq9d.net]
DCGANによる画像生成について質問。
色んな文章の画像データを学習させたら
LSTMのように画像データとして、文章生成は可能ですか?

あと、4コマ漫画をDCGANで学習させて
意味のある4コマ漫画を生成することは可能ですか?

349 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 18:08:28.99 ID:+KWnMamE0.net]
>>344
どっちもはげしく調教師の腕前次第。
不可能ではないだろう。

350 名前: mailto:sage [2019/10/20(日) 19:17:37 ID:2v7IlCoiM.net]
そもそもクラウドはテクニカルタームじゃなくて単なるマーケティング用語だったよな?
AIと同じく結局はビジネス界隈で流行れば官軍ってことか

351 名前: mailto:sage [2019/10/20(日) 20:17:51 ID:4HG1pc8w0.net]
別に誰も勝者じゃないのに官軍とか馬鹿じゃね?

352 名前:デフォルトの名無しさん [2019/10/20(日) 20:45:32.57 ID:xbXJ4T7Ga.net]
>>344
不可能とは言わないが、出来たらトップカンファレンス通るレベル

353 名前:デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178]) [2019/10/20(日) 22:12:40 ID:zXnrxtUW0.net]
>>344
難しいとは思うがやってみたらいい。
なんでもチャンレンジしておくと、
どゆのが難しいのかわかってくる。
人にとって意味のあるものを生成するということが
どれほど困難かわかると思う。

不可能と思えることにチャレンジすることを
無駄と思うか、勉強と思うか、馬鹿にするか、
それは人それぞれ。

やらないでおいて、
「できやしないよ。」
「それ不可能だから」
「それ単なる判別だから」
なんて批判するのは簡単。どんな馬鹿でも低能でも言えること。

何を言われようとチャレンジするのがいいと思う。
あとあと財産になると思う。

354 名前:デフォルトの名無しさん mailto:sage [2019/10/20(日) 22:39:19.56 ID:4HG1pc8w0.net]
https://github.com/NVlabs/stylegan
V100を八枚使って3日って世界だけど頑張って!
(ちなみにアマゾンだとこれで約20万円だけど。)



355 名前: mailto:sage [2019/10/21(月) 00:10:30 ID:0yo3KYqzM.net]
>>347
勝てばという枕詞がつけばそのような含意になるが、この場合はそうではない
そもそも論ズレだよ

356 名前:デフォルトの名無しさん mailto:sage [2019/10/21(月) 00:56:16.91 ID:WYoX45rO0.net]
で、クラウドって言葉がビジネス界隈で流行って何が官軍なん?

357 名前:デフォルトの名無しさん [2019/10/21(月) 07:33:53.00 ID:LkDkCGmw0.net]
>>325
正規アクセス権限を持つ人の管理を自社でできない
正規アクセス権限を持つ人だからその気になればアクセスするのは容易

358 名前:デフォルトの名無しさん [2019/10/21(月) 07:40:58.63 ID:LkDkCGmw0.net]
>>337
オートエンコーダによる次元削減と
主成分分析による次元削減とは
どんな関係?
条件が揃うと両者の結果は一致する?
どんな条件でとか判明している?

359 名前:デフォルトの名無しさん (ワッチョイ 2fe6-sprL [14.3.161.84]) mailto:sage [2019/10/21(月) 07:54:38 ID:2zFZa7pr0.net]
論文があったと思う

360 名前:デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232]) [2019/10/21(月) 09:02:29 ID:VyV3rznyM.net]
オートエンコーダっていうけど
古くない?

361 名前:デフォルトの名無しさん [2019/10/21(月) 09:07:45.09 ID:HKPBZHRea.net]
最近の手法でもネットワークの一部にオートエンコーダーが使われていたりはする

362 名前:デフォルトの名無しさん [2019/10/21(月) 10:35:25.87 ID:VyV3rznyM.net]
どんな奴?

ビッグデータ言うけど
中身的にはknnになってそうで怖い
どの程度未知データに対応できるのか知りたいのに

363 名前:デフォルトの名無しさん (アウアウエー Sa7a-S3Tg [111.239.68.186]) mailto:sage [2019/10/21(月) 13:31:47 ID:qqa/WroJa.net]
主成分分析は軸を決めて絞っているイメージ
オートエンコーダはなんとなく絞っているイメージ

364 名前:デフォルトの名無しさん [2019/10/22(火) 10:09:07.31 ID:lFIH7itId.net]
ディープラーニングで星空を学習させて、星空の画像を生成させようとしたら
ノイズのような糞画像が生成されたというツイートです。

https://mobile.twitter.com/aki202/status/1185695506703384576

どうしてこうなったの?
原因を調べようにも、ブラックボックスでわからないのでしょうか?
(deleted an unsolicited ad)



365 名前:デフォルトの名無しさん [2019/10/22(火) 14:58:07.65 ID:NFYmLoNWa.net]
学習できてない

366 名前:デフォルトの名無しさん [2019/10/22(火) 16:15:33.91 ID:hH4hu+Bb0.net]
ganでやってんでしょ
足りてない

367 名前:デフォルトの名無しさん mailto:sage [2019/10/22(火) 19:14:07.07 ID:9wtq+mx60.net]
ガーン

368 名前:デフォルトの名無しさん mailto:sage [2019/10/22(火) 19:16:27.86 ID:5RVdJ+a80.net]
読み方はギャンらしい

369 名前:デフォルトの名無しさん mailto:sage [2019/10/23(水) 07:33:38.47 ID:kl84VSvUr.net]
>>360
星空全体の学習(dcgan?)はむりでないなかあ なにの特徴量をとらえたら良いのか分からない

星、山一つづつを学習して 何らかの方法で合成するとか

370 名前:デフォルトの名無しさん [2019/10/23(水) 10:28:52.26 ID:/wjqUoilM.net]
やってみた系
Qiitaにありそう
何でこういうツイートをどや顔でするんだろう
高度なことをしているアピール?
実際は無知を晒してるだけなのに。。。

371 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 10:02:19.99 ID:apIKxFyCM.net]
>>366
やってみた系やQiitaの記事書くよりもツイートする方が楽だからだろう

372 名前:デフォルトの名無しさん [2019/10/24(木) 10:22:21.30 ID:ABhN6CSmF.net]
所詮はバカッター
失敗や無恥を曝す方がリツイートも良いねも増える世界
アフィ厨と一緒でフォロワー増やす目的
相手にするとつけあがる

373 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 10:42:24.24 ID:TZ+cyP5wr.net]
アノテーション1日3000個

374 名前:デフォルトの名無しさん [2019/10/24(木) 15:39:10.85 ID:h4TZRS470.net]
IT系は客の懐具合で予算が決まる
衰退する業界を客にしてると共倒れだ



375 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 19:06:51.87 ID:k0n7Q/rX0.net]
時代は量子コンピュータだ(棒)

376 名前:デフォルトの名無しさん [2019/10/24(木) 20:18:37.50 ID:mJmionkaM.net]
まだまだ先じゃないの

377 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 23:33:33.42 ID:MvRnXylv0.net]
[ビ+]【IT】量子超越「ライト兄弟の業績に匹敵」 Googleが会見
https://headline.5ch.net/test/read.cgi/bbynews/1571927133/

378 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 11:19:29.75 ID:qkKvohBNa.net]
>>366
既存の事例や良書の下位互換でしかなくても記事にまとめることで理解が深まる
別に君に見せるために書いているわけではないので興味がないなら黙って閉じればよい
「何でツイートするの?」とか言ってるだけ時間と労力の無駄だろう

379 名前:デフォルトの名無しさん [2019/10/25(金) 14:02:38.91 ID:lQl0zV4qM.net]
何で公開すんの?
見て欲しいからでしょ?
注目を浴びたいんでしょ?

380 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 15:03:44.46 ID:qkKvohBNa.net]
何で公開したら駄目なの?
見なければいいだけでしょ?
注目しなければいいだけでしょ?

381 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 15:36:22.58 ID:DCbb0Eu2r.net]
VOTTを使ったアノテーションで
ver1では動くがver2で全然動かないなあ
タグの設定ができない

Win上で作業

exeファイルでインストールしたが、ソースからやった方がいいのかな

382 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 20:13:24.49 ID:zctARNqM0.net]
                  ヽ人人人人人人人人人人人人人人人

383 名前:m
         / ̄(S)~\  <                      >
       / / ∧ ∧\ \<  嫌なら見るな! 嫌なら見るな! >
       \ \( ゚Д,゚ ) / /<                      >
         \⌒  ⌒ /  ノ Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Yヽ
          )_人_ ノ  
          /    /
      ∧_∧ ■□ (    ))
     (   ; )■□  ̄ ̄ヽ
   γ⌒   ⌒ヽ  ̄ ̄ノ  ノ
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
[]
[ここ壊れてます]

384 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 20:29:51.32 ID:E+67pbC4a.net]
むしろ自分からわざわざ見に行って「俺の気に入らないものを書くな!」と騒いでるんだよなあ
嫌なら見るな、以外の何物でもない



385 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 22:09:09.25 ID:I8iFw1TGa.net]
ならnoindexしといて

386 名前:デフォルトの名無しさん [2019/10/25(金) 23:30:25.15 ID:zY1ZO0SR0.net]
チラシの裏に書け

387 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 23:35:26.50 ID:Pxjdzyta0.net]
>>375
アドバイスももらえてるようだし公開したメリットを享受してるっぽいが
何が気に入らないのかわからない

388 名前:デフォルトの名無しさん mailto:sage [2019/10/25(金) 23:44:56.12 ID:6CYskVcia.net]
そもそもTwitterは個人のつぶやきに過ぎないしブログは単なる日記だ
別に君に有用な情報を与えることを目的としていないのに何勝手に期待しちゃってるんだろう

389 名前:デフォルトの名無しさん mailto:sage [2019/10/26(土) 00:17:17.07 ID:D9LzSwkGM.net]
>>378
AVの撮影現場に乱入して「僕、童貞ですから早く服を着てください///」って真っ赤になる感じ

390 名前:デフォルトの名無しさん (ワッチョイ 53da-roNU [60.47.117.90]) mailto:sage [2019/10/26(土) 08:46:36 ID:NR6i9qZO0.net]
ここは便所の壁

391 名前:デフォルトの名無しさん [2019/10/26(土) 10:04:19.57 ID:sMyP0ohJ0.net]
YouTubeでpvだと思って見たら
素人のカラオケだったときの失望に似ている

上手いなら感心してみるけど
ド下手が上げてんじゃねえよ、と

392 名前:デフォルトの名無しさん mailto:sage [2019/10/26(土) 22:57:59.97 ID:pDakV2RU0.net]
tensorflowでmnistを99%くらい当てられるようになった程度だと
機械学習のお仕事の最底辺辺り?
仕事で機械学習ってどの程度の難易度か全然イメージつかない

393 名前:デフォルトの名無しさん mailto:sage [2019/10/26(土) 23:06:22.63 ID:uMeA1BUs0.net]
ここは機械学習の最底辺どころか
知ったか素人のたまり場だから質問されたって答えられないよ

394 名前:デフォルトの名無しさん mailto:sage [2019/10/26(土) 23:08:34.54 ID:I3o5RH8v0.net]
>>387
機械学習案件の未経験者の採用指標って、
マトモなところだと大学の学部と専攻、
SESのようなアホ営業が間に入る商流だとPythonの経験年数 みたいな感じ?

作業の大半は前処理とデータクレンジングだから後者でも間違いでは無いが



395 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 00:01:55.46 ID:MrvuaP/Y0.net]
>>387
mnistは簡単すぎてベンチマークにならない
その程度で十分なこともあるけど、データの素性を理解していないとどうしようもないこともある

396 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 00:08:01.21 ID:N1OrUkzdr.net]
>>387
tensorflowだと機械学習でなく深層学習だな

まあ自分でデータセット作ってそれから区別出来るように学習させました、というのが大事だな

397 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 03:00:05.93 ID:yje76TNI0.net]
>>387
未経験で機械学習の仕事掴みたいならkaggleで結果出してアピるのが早いんじゃないか
早いつっても一朝一夕じゃいかないけどな
色んな機械学習のタスク解いてみ
あと勉強して理解したことを客観的な指標とともにちゃんと表現するといい

398 名前:デフォルトの名無しさん (アウアウウー Sa97-G9/M [106.154.130.173]) [2019/10/27(日) 06:50:07 ID:Qb9Ns76Ya.net]
>>387
チュートリアル完了

399 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 10:23:08.48 ID:Sdc+cFVla.net]
mnistを高精度で当てるモデルができたとしてもネット上の他人の知識を寄せ集めただけで理屈はよく分かっていないのか、
何らかの根拠に基づくモデリングを行って精度が上がった(=高精度の理由を自分で数学的に説明できる)のかで全く異なる
前者であればそんな人間は山ほどいるので何の自慢にもならない

400 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 11:06:47.77 ID:a+EgGKKD0.net]
>>387
就職することを考えているなら知識の移り変わりが少なくて派遣が蔓延してなくて年寄りが居るところにした方がいいだろう
中国の殺し屋が下請けを雇って5次請けまで行って3000万の案件が末端で150万になり
「150万で殺しなくない」ってことで死んだフリした写真を送って終わらせようとしたニュースが出てて
それ日本のIT業界じゃねーか!突っ込まれてたけど
こんな構造が当たり前になっているところもちょっと

401 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 11:49:41.57 ID:/g1/9V530.net]
mnistはもうこれ以上あげても過学習でしかないだろう。
あれ、人間も判別不可な数字もまじっているし、
あえて業務で使うなら「判別不可」を割り当てるのが正しいデータが結構ある。

402 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 20:36:55.06 ID:hG9pDBcOM.net]
発注元の社内における地位によって、そこらへんの閾値の調整が違うんだよなあ
発注元が閾値に対して責任を負っている人だと、閾値を調整する機能を持たないシステムの方が好まれる
実務経験がある人にしかわからんだろうけど

403 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 21:53:53.97 ID:qLlRYvp1M.net]
将来この分野の仕事したかったら、ゼロからはじめるのフルスクラッチの内容理解するのって意味あるのかな
そんなことに時間使うならテンソルフローとか使ってモデルを多く作った方がためになるのか…

404 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 22:04:32.89 ID:hG9pDBcOM.net]
ゼロから作る方がためになる。あなたの年齢にもよるけど
kerasのいま使われている関数は、量子コンピュータですべて吹き飛ぶから



405 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 22:37:18.84 ID:MrvuaP/Y0.net]
>>399
適当なことは言わんほうがいい

406 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 22:44:11.08 ID:i58DI1ra0.net]
>>399
ゼロから読んだけれどもpythonが量子コンピュータを扱えなければ仕組みを解っていてもキツいっしょ

407 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 22:52:02.49 ID:/g1/9V530.net]
>>398
意味はあるがあれはソースコードがヘンテコな副作用を仮定したつくりになってて好きじゃない。

408 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 22:53:54.48 ID:/g1/9V530.net]
>>397
くだらん社内政治によってデバッグしずらくなるパターンだな。
あんまりそういうところから機械学習の仕事はしたくねーわ。

409 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 00:25:42.82 ID:3pZ+EtQea.net]
ゼロから始めるなんて集中すれば1週間かそこらで終わるんだからtensorflowもどっちもやればいい
所詮は超初心者向けの入門なんだから

410 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 02:12:02.65 ID:pZrpoGAC0.net]
逆に初心者向けでない機械学習を扱ってる本って何か知っていたら教えて欲しい
中級以上、実務レベルって言っても差し支えないやつ
わりと超初心者or初心者を対象にした本が多い気がする

本でなかったら、サイトとかでも

411 名前:デフォルトの名無しさん (ワッチョイ 337c-uGyE [14.193.216.182]) mailto:sage [2019/10/28(月) 04:23:48 ID:IQZT4uzj0.net]
DLフレームワーク操るのどこまで突き詰めりゃいんだろ
なんか水ものの知識に思えるんだよな
とはいえ定番は定着してきてるか
他に覚えなきゃいけないこともたくさんあるし

412 名前:デフォルトの名無しさん (ワッチョイ bf94-CpIv [115.37.31.209]) mailto:sage [2019/10/28(月) 06:09:29 ID:GLbWfyQf0.net]
PRML

413 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 14:24:55.48 ID:y+5NzS6or.net]
>>377
自己解決
タグを入力してからenterを押してタグ名確定
これだけw

414 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 14:40:54.62 ID:/femDpxA0.net]
>>400
いや、さすがに量子コンピューターうんぬんはもののたとえだけど
勾配ブースティングが出てきて業務が変わったように
ツールの知識は流行り廃りが激しいから、深いところで知識や技術を蓄えないと
エンジニアとして時代に押し流される



415 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 17:41:38.53 ID:W1nk1vcAM.net]
>>405
理論の中級レベル以上書籍ならPRMLとかカステラ本があるだろうけど、
実務に沿ったMLノウハウを凝縮した本ってまだ出版されてないんじゃないか
コードレベルのものならkaggle漁ればあるだろうけど

416 名前:デフォルトの名無しさん mailto:sage [2019/10/28(月) 18:35:22.41 ID:DGKmppp60.net]
それこそレビュー論文でよくね

417 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 14:12:21.90 ID:2H6Dj4B4a.net]
>>405
機械学習に限らず中級以上の本、サイトは需要が少ないので発表されることが少ない。
あえて言えば、マニュアルが中級向け、論文が上級向け
ただし論文はうそも多い

418 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 16:21:48.30 ID:kXn8AUyn0.net]
うそ おおげさ まぎらわしい

論文撤回数ランキング上位10名のうち半分が日本人

419 名前:デフォルトの名無しさん [2019/10/29(火) 18:36:46.47 ID:KCHCOTCfM.net]
実務をどれだけやったかじゃね?

420 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 21:20:41.60 ID:DOUedQO9a.net]
>>405
実務レベルの機械学習の知識なんて企業秘密だらけなので公開されるわけがない

421 名前:デフォルトの名無しさん [2019/10/29(火) 22:14:12.17 ID:32UpIEvm0.net]
知識って言語モデルで良いの?

422 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 22:18:26.97 ID:kXn8AUyn0.net]
>>416
やること次第っそ

ひとくちに「ターゲットは言語だ!」といっても、
1バイト分かち書き文法カチカチの場合と
2バイト文法なにそれおいしいのカオスの場合では
必要な知識の量が全く違ってくる品・・・

423 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 22:18:44.23 ID:dJZjQrr+0.net]
さすがにそろそろ機械学習でなんとかするみたいな馬鹿案件はなくなってくるだろうな。
それくらい焼き畑したと思うよ。

424 名前:デフォルトの名無しさん mailto:sage [2019/10/30(水) 13:37:41.45 ID:ffNJYAeVp.net]
そうだ!星空(ランダムドット)を学習させれば星空(ランダムドット)が生成されるんじゃないか!?



425 名前:デフォルトの名無しさん mailto:sage [2019/10/30(水) 13:56:23.63 ID:GWmaMiFl0.net]
>>419
やめてさしあげろwwwww

426 名前:デフォルトの名無しさん [2019/10/30(水) 17:13:08.55 ID:3aN27z+Ma.net]
>>404
chainerもpytorchもやれ。

427 名前:デフォルトの名無しさん [2019/10/30(水) 17:26:33.89 ID:DV87KhQta.net]
ランダムドットを入力して星空に変換出来たら面白そうだなあ

428 名前:デフォルトの名無しさん [2019/10/30(水) 18:57:53.97 ID:OxfqAVssM.net]
単一画像からのスタイルganみたいなやつが
まさにコピペ自動機だった

429 名前:デフォルトの名無しさん mailto:sage [2019/10/31(木) 11:13:06.25 ID:JglnROWD0.net]
>>422
星空は、まったくランダムじゃなくて
けっこうな粗密のむらっけ&見た目の大小(明るいくらい)があるから、
テキトーに1dotの点々を何個かうってもらった画像を初期値として
そこから準備しておいた数式でごにょごにょーごにょーして
適度に粗密と大小をつけた星空ふいんきの画像を出す。
っていうのつくったら、
カネにはならんだろうが
やったったです!デモにはいいだろうな。

機械学習は、
全天サーベイの写真あたりをインプットにして、
「初期値からいいかんじにごにょってくれる数式」を製作するところに使ってくれ。

430 名前:デフォルトの名無しさん [2019/11/01(金) 16:25:10.67 ID:GsymoNAsM.net]
却下

431 名前:デフォルトの名無しさん [2019/11/01(金) 16:29:45.45 ID:4VV6x0MuF.net]
星団
星雲
天の川
あたりをだしたければ重力シミュレーションも必要

432 名前:デフォルトの名無しさん mailto:sage [2019/11/01(金) 17:28:42.59 ID:qSHo2rpn0.net]
>>426
うーんどうだろう?

天の川を0から現在まで作るには、
「2400億粒くらいの星を撒いて重力シミュレーション」らしいけど

星空っぽい柄を生成しちゃるぞー
程度だったら
天の川銀河(銀河系)のざっくり図・・・星がある確率の地図を作っておいて
あとは地球のどこからみると、どっちがどんだけみえるー
くらいのデータがあれば
ええんでないのかなー

入力も、
dotをいくつか打ってもらうんじゃなくって
メルカトル図的な真っ黒四角の中に、
どこか1点でいいような。
季節とか時刻はめんどうだから春分の夜@ロンドン固定とかで。


星団・星雲はトッピング的なもんで、
肉眼でもわかるぞー!っていうのはマジ数少ないから、
「星空柄の壁紙つくっちゃる」くらいだったら
とりまホーチでおk。
どーしてものせたいのなら、確率地図に大小マゼラン雲くらいは書き足しておk。

433 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 09:14:43.57 ID:cAnKAoHq0.net]
カブリ数物宇宙研、宇宙の複雑な3次元シミュレーションをAI技術で効率化 日米加 共同研究
https://www.ipmu.jp/ja/20190828-AI_model

>宇宙の構造形成過程を瞬時に模倣できる深層学習モデルの作成に成功
>宇宙の始まりの初期条件を復元することも不可能ではない

434 名前:デフォルトの名無しさん [2019/11/04(月) 14:20:31.61 ID:6UHCWlqh0.net]
嘘臭い



435 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 17:51:30.22 ID:WRpKwFsh0.net]
この論文通ったのは奇跡だと思う
中身なさすぎ

436 名前:デフォルトの名無しさん [2019/11/04(月) 18:20:52.91 ID:PQlPE2ZKa.net]
>>416
BART?

437 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 19:05:13.23 ID:F/trr2gA0.net]
修士論文で2次元アニメ画像の顔をたくさん読み込ませて
平均顔みたいなのをAIで自動生成するみたいな課題を割り振られたんですが
何から手を付けていいか分かりません

まず顔認識の場合ラスター画像そのままよりもベクター画像に変換したほうがよさそう
(とくにアニメ画像の場合髪色がまちまちぃだったりするので)
と思うんですが詳しい方いませんか?

その場合顔の画像を与えると境界情報をベクトル化して抽出してくれるようなライブラリってないでしょうか
髪型を特徴量として表すのはかなり難しいとおもってるので
まずは顔全体の外接円、あごからほおの輪郭、目の位置、鼻の位置 あたりをベクトル化して
大量画像をディープラーニングで流し込んで顔データを自動生成して
髪型だけは既存のものを適当にあてはめて可愛い画像ができました
あたりをおとしどころで論文にしようかなとおもってます

機械学習は大学の講義レベルの知識しかないので
それじゃあだめだろとか改良点とかあったら
みなさまのプロのご意見をおききしたいです

438 名前:デフォルトの名無しさん [2019/11/04(月) 19:57:54.46 ID:b7XfuRK5a.net]
「平均顔みたいなの」というのがよく分からないが、あなたの考えるベクター画像に変換するメリットをもっとkwsk

439 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 20:10:24.80 ID:l8jF+acj0.net]
>>432
ラスタをベクタにしてやんよ!系ソフトは
それだけで高額販売されてるレベル

440 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 21:00:39.11 ID:F/trr2gA0.net]
>>433
かわいいとおもった画像の特徴を平均化すれば
万人受けするもっとかわいい画像が作れるんじゃないかっておもってますが
そこは別に商業じゃないので結果うまく行きましたでも修論レベルなら十分かなとおもってます

あとラスターだとかなり周辺広く見ないとどこの部分なのか認識するのが難しいから
特徴量が多くなりすぎてかなり深いニューラルネット組まないと
そもそも顔として認識するのが難しいんじゃないかっていう印象です

見当外れだったらすみません

>>434
そうなんですね

リアルの写真は難しそうですが
2次元アニメ画像ぐらいなら境界周出するのってそんな難しくないかなと
なんとなくおもってました

そこがすでにすでに難しいなら
大量の画像の顔部分だけ手動で輪郭や目とかをトレスして
そのペンのストロークを座標に記録してベクトル化するようなプログラムを作ってから
そのベクトルに対してディープラーニングを行ったほうが良さそうですね

アドバイスありがとうございます

441 名前:デフォルトの名無しさん mailto:sage [2019/11/04(月) 21:34:46.65 ID:l8jF+acj0.net]
>>435うえはんぶん
('A`) おう べんきょうもっとがんばれよ

>まんなからへん
ラスタ画像っつか写真の顔認識は、ぐっぐるが結構昔から販売してるぞ。

それとはたぶん独立に、
近頃のプリクラマシンの
デブスだって日本人受けしやすくカワイい方へガツンと盛ってくれる補正技術はすごいから、
カワイイをきわめるつもりなら、
勉強する価値があるとおもう。

>したからにばんめ
二次元はいわゆる人外カラーの髪や瞳の色が壁になると思う
まぁがんがれ

>いちばんした
機械学習くんを調教できるほど手を動かすなら
努力したで賞で修士・・・でるのか・・・・・・?
理学じゃ努力しまくってても失敗データじゃ修士でないんだが。

442 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 02:25:13.35 ID:WGM3y/GM0.net]
>>436
販売なんですね
有名なんだったら普通に研究室で買ってそうなのできいてみます

>プリクラマシンの補正技術
調べてみます!

> 二次元はいわゆる人外カラーの髪や瞳の色が壁
そうなんですよね
3次元用の顔認識アルゴリズムをそのままラスター画像に適用して
うまく肌以外の色相自由度を認識してグループ化してくれるか分からないです

いろいろアドバイスありがとうございます!

443 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 06:41:44.76 ID:KG ]
[ここ壊れてます]

444 名前:QwTe220.net mailto: pcaのeigenfaceだろ? []
[ここ壊れてます]



445 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 08:08:18.32 ID:wNX9eMw00.net]
修士なんて何やっても貰えるよ
お前大学院行ってないだろ

446 名前:デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.224.202]) mailto:sage [2019/11/05(火) 09:53:29 ID:1ygLA3K6M.net]
機械学習を就職に使うなら、修士論文がんばらないといいところ行けないぞ(哀しい目)
論文適当にすませてKaggleがんばってもいい気がするけど

447 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 12:17:34.32 ID:GVd5q/rua.net]
就活段階で修論の全体像なんて全然見えていないだろうからなんとなく立派そうなテーマとそれっぽく説明できる話術があればOK

448 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 12:41:52.10 ID:fvi/VFnh0.net]
修論レベルでちゃんとした成果を出すのは不可能に近い
何かをやったということにしかならない
研究で成果を出すことはものすごく大変

449 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 13:23:27.49 ID:1ygLA3K6M.net]
それで充分さ。立派だよ。まぶい

450 名前:デフォルトの名無しさん [2019/11/05(火) 16:10:59.42 ID:mbkTm92O0.net]
>>432
宿題は宿題スレで

451 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 17:32:52.03 ID:4ZvLZxny0.net]
>>437
どこの研究室でもライセンス買っつるであろう、Officeみたいなものじゃない件。
しっかりパッケージされて売ってるわけではないぞw > 顔認識システム

>色相自由度を認識
人外カラーの髪や瞳だけじゃなく、
スキンカラー問題だの、
いわゆる色トレス線を境界だと誤認識するだの、ありそうだぞ。

インターネッツに、日本語で、
自分で顔写真を顔写真だと認識するプログラム組んだったw

黄色人種以外に非対応な人種差別っぷりよ…(´・ω・`)

改良したった!
っていう話をのっけてくれてるブログが転がってるはずだから
がんばってしらべろ。

二次元絵じゃないほうの、
リアル写真からの顔認識については、
おさえておくべき特徴点とか、
年齢・性別・人種を分類するためのポイントとかまでもう研究されてるから、
そっちをしっかり勉強してから、
二次元に挑んだ方がいいのかもわからん。

あー
続きは宿題スレを占拠されても困るんで
指導教員なり同様の課題をやってる先輩にききんしゃー

452 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 17:43:51.24 ID:4ZvLZxny0.net]
>>439
なにやってても押し出し(追い出し)てもらえるなんざ、
戦前から平成一杯くらいまで続いてた研究室(たぶん200人以上卒業生がいる)の中でも
1名しかいないレベルの
特大ハズレ大馬鹿うんこ野郎だけの特権だw

>>442
そんなに枯れちゃってるのこの業界?

おれは正直いって結構オワコンな分野の所属だったけど
学部で配属後最初の1か月分のデータでレター書いて、
学部の残りのデータあわせて1報書いて、
修士で全く違うジャンルだけどやっぱもう廃れてきてる分野に引っ越して
1から?勉強しなおしになったけど、
(こっちはハゲタカとまではいかないがまずまずのマニアック誌にしか載らなかったが)1報書けたぞ・・・
博士過程のことと、某大職員時代については・・・きくなよwwwだけど。。。

453 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 17:56:57.62 ID:D3X6JyYoF.net]
新規性はともかく有用性はなあ
大抵有用性はほとんどないに等しい

454 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 18:16:33.73 ID:4ZvLZxny0.net]
>>447
それは、いえてる。



455 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 19:16:48.26 ID:4ZvLZxny0.net]
>>438
今wikiで読んだったら
調教開始前の
生写真に求

456 名前:められる要件がすっげ厳しいのなw []
[ここ壊れてます]

457 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 21:48:30.86 ID:FS2CN9rWM.net]
C言語で画像処理してる会社をクビになって
(その会社に入社する時に、面接官にいわれた方便程度の優しい嘘がささって
バタフライ効果で周りの人間にさっさと会社を辞めた方がいいと諭されまくった挙句、
心が棒人間になって仕事を続けられなくなった。人間関係の板挟みって複雑。。。)
Kaggleちょっとやって、メダル獲れなかったけどいい線いったから
元から行きたかった自然言語処理の方面へ応募してみようかな〜みたいな感じでフラフラしてるんだが
自然言語処理に行きたい!とこっちがいくらいっても、逆求人で画像処理の奴ばっか来るのな。くるなー、くるなー!
やっぱ画像処理の方が簡単に就職できるのかな。それともOpenCVを独学でやっちまったからか

458 名前:デフォルトの名無しさん mailto:sage [2019/11/05(火) 21:53:10.42 ID:4ZvLZxny0.net]
>>450
しぜんげんごが不自由ですな。
マ板向けだろその話題は。

459 名前:デフォルトの名無しさん [2019/11/05(火) 21:53:50.28 ID:FS2CN9rWM.net]
>>451
板違い? すまん、感情のほとばしりがやばかったわ

460 名前:デフォルトの名無しさん [2019/11/05(火) 22:16:09.83 ID:S4fXfghv0.net]
>>432
pcaとかautoencoderとか使えるかも
あとはパーツ毎に学習して
パーツ毎に生成したものを組み合わせるとか

パーツの位置、配置や大きさでも変わってくるだろう

可愛いキャラは目の位置が上下中央辺りとか
目の大きさが顔に占める割合が大きいとか

461 名前:デフォルトの名無しさん mailto:sage [2019/11/06(水) 00:05:37.17 ID:ggnsGnq2H.net]
>>450
実績ない分野で中途って基本ないだろう
画像とNLP両方やってるとこに画像と抱き合わせでNLPやらせてくれって交渉したら
それでもやらせてくれる確証なんてないけど

462 名前:デフォルトの名無しさん [2019/11/06(水) 00:32:15.90 ID:YRVde36bM.net]
>>454
だな。別にNLPに固執してるわけでもないんだがアプリでも作るわ
次は失敗しないように頑張ろう

463 名前:デフォルトの名無しさん [2019/11/06(水) 10:20:15.66 ID:q549CorC0.net]
Google AutoMLをKaggleの350万人のデータサイエンティストに提供
https://cloud.google.com/blog/products/ai-machine-learning/bringing-google-automl-to-3-million-data-scientists-on-kaggle

こうなってくるともうなんかつまんなくない?

464 名前:デフォルトの名無しさん mailto:sage [2019/11/06(水) 10:43:11.86 ID:dKEXVk/h0.net]
仕事としてはシステム導入のノウハウが一番大事だから残るけど
機械学習の仕事は消えていく運命



465 名前:デフォルトの名無しさん mailto:sage [2019/11/06(水) 12:10:55.21 ID:WNCFxxLWa.net]
>>456
AutoMLで自動化できてしまう程度のことに労力使わず人間でなければ(現段階では)できない高度なことに集中しろというだけのこと
むしろつまらない仕事を減らしてくれているんだから感謝しかない

466 名前:デフォルトの名無しさん mailto:sage [2019/11/06(水) 13:59:14.13 ID:Zqmg2IVoF.net]
能力のめちゃくちゃ高いエンジニア以外は淘汰されていくんだな
クラスわけ問題を解いているだけの会社は危うそう

467 名前:デフォルトの名無しさん [2019/11/06(水) 16:41:33.50 ID:q549CorC0.net]
次、どこに行こうかね。。。

468 名前:デフォルトの名無しさん mailto:sage [2019/11/07(木) 18:39:39.86 ID:KASF5ywG0.net]
人間が現場作業をしつつアノテーションが同時に出来る(撮影しておいて、
右手を伸ばして目標物体を掴んだ時に左手で数値などを入れてラベリングする)機械を作れば
色んな作業がどんどん自動化されるのかなあ

469 名前:デフォルトの名無しさん mailto:sage [2019/11/07(木) 19 ]
[ここ壊れてます]

470 名前::19:45.16 ID:i5KqlsP00.net mailto: >>461
3Dスキャナとさわるほうの手につけるタイプのセンサーグローブを用意して、
初期位置合わせをがんがれば、
3次元の座標入力と応力(弾性)入力くらいは
今よりはかどりんぐ!になりそうだが、
だからといって
いろいろなんでも自動化ハッピー☆とはならんと思うぞ。。。

そんなことより
3Dプリンタのz軸の動きをもっと精度よくして
積層段差うんとちいさくするなり、
大きめにうちだしておいて自動であとから削って精密に仕上げるテクノロジー

シリコーンみたいなエラストマー樹脂を積層するように、素材開発

はよ
[]
[ここ壊れてます]

471 名前:デフォルトの名無しさん mailto:sage [2019/11/07(木) 23:42:34.21 ID:TJTG2zyAM.net]
そのうち撮影とアノテーションだけの会社ができるってみんな言ってる
誰も設立したがらないだけで

472 名前:デフォルトの名無しさん mailto:sage [2019/11/07(木) 23:45:17.24 ID:TJTG2zyAM.net]
ネットで調べたらもうあった。時がたつのって早い…

473 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 00:48:20.76 ID:WgiyDGhsa.net]
「未経験の貴方もAI業界で大活躍!」とか言って募集してひたすらアノテーションさせるんだろうな

474 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 01:46:15.47 ID:2zKKI3uDM.net]
いや、もっと普通の人を集めるんじゃない?
「接客不要。デスクワーク。画像データのラベリング」みたいな求人
接客したくないフリーターが世の中いっぱいいるから人手に困ることはないと思う



475 名前:デフォルトの名無しさん [2019/11/08(金) 07:13:35.28 ID:LWIqGPHS0.net]
>>466
クラウドソーシングじゃね

476 名前:デフォルトの名無しさん [2019/11/08(金) 11:40:21.46 ID:3E1/z7K0F.net]
>>461-462
これは今後どうなるかな
https://www3.nhk.or.jp/news/html/20191107/k10012168051000.html
https://www.okinawatimes.co.jp/articles/-/495151

477 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 12:20:26.44 ID:xgevcE5G0.net]
>>466
中国で貧民がそれやらされてるらしいな

478 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 16:58:00.80 ID:HH11ynhJ0.net]
>>468
撮影地点の座標と、三脚の高さがしっかりきっぱり分かってれば
写真は平面なんだから
自動で空と建物の境界を認識させて
外枠の3D座標起こすくらいは、
いまどきスッとできるんじゃね?

479 名前:デフォルトの名無しさん [2019/11/08(金) 17:14:11.10 ID:HpQs1W/gM.net]
できるね

480 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 17:32:33.66 ID:LJWzZTdr0.net]
HoloGAN?

481 名前:デフォルトの名無しさん mailto:sage [2019/11/08(金) 17:33:27.04 ID:klpf5FSXa.net]
古典的なエピポーラ幾何の問題に機械学習要素を入れる必要はない

482 名前:デフォルトの名無しさん [2019/11/08(金) 17:56:01.28 ID:HpQs1W/gM.net]
金谷センセだな

483 名前:デフォルトの名無しさん [2019/11/08(金) 19:07:52.56 ID:CSR+2ZkJa.net]
>>470
撮影地点の座標と三脚の高さがしっかりきっぱり分かってないからスッとできないんじゃね?

484 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 01:19:19.56 ID:dqtY4XvXd.net]
https://news.yahoo.co.jp/byline/kazuhirotaira/20191108-00149956/



485 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 03:14:02.31 ID:ieexeq/b0.net]
https://headlines.yahoo.co.jp/hl?a=20191107-00000082-asahi-soci

486 名前:デフォルトの名無しさん [2019/11/09(土) 07:23:02.53 ID:R+fonfJU0.net]
歩道を歩いてない奴が事故っただけじゃん

無罪

487 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 09:12:53.22 ID:TBchCo8fa.net]
素人でも予見できる例外を考慮してないとかカス設計だな

488 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 10:10:53.93 ID:u5+ga7gca.net]
>ウーバー車のAIは車道に歩行者がいることをそもそも想定していなかった

小学生が作ったのか?

489 名前:というレベルだな []
[ここ壊れてます]

490 名前:デフォルトの名無しさん [2019/11/09(土) 10:28:42.03 ID:ZM4bFDeE0.net]
AI技術者ってマジで急激に増えたな
それも大学で体系的に教育されてきたやつが。
まぁ三年もあれば修士くらい量産できるしな

491 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 12:40:04.35 ID:ibGxAFOpd.net]
>>478
普通なら車側が100%悪いと判決される

492 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 15:06:51.67 ID:QVHxqxkCa.net]
人が100%悪くても、それが理由でひいていいわけではない
飛び出してきたときは多少考慮されるようだが
それでも車が無罪にはならない

493 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 15:11:10.81 ID:06f/2UDZ0.net]
>>481
そして
かつてのバイオテクノロジーバブルと同じように
ピペド(ピペッティング奴隷)ならぬ
機械学習設置するだけの奴隷があふれかえるところまでがセット。

494 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 15:15:32.65 ID:BmJjM1vIM.net]
もうAI土方は居るんじゃね



495 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 15:25:20.12 ID:06f/2UDZ0.net]
AI土方→(たぶん)最低賃金は守られてるんだろう
AI奴隷→サビ残だらけで実質時給は違法なのが当たり前

496 名前:デフォルトの名無しさん [2019/11/09(土) 16:06:33.78 ID:ZM4bFDeE0.net]
必要精度に到達できるかどうかのリスクを請負で抱え込んじゃってる会社もあるらしい。
開発のリスク背負うんだったら販売契約だろ

497 名前:デフォルトの名無しさん [2019/11/09(土) 16:30:27.99 ID:dihGWiYo0.net]
>>487
その条件で請け負っている時点でAI技術なさげ

でも、客も解ってなさそうだから、過学習させたインチキ精度で逃げるか?

498 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 17:11:58.21 ID:u+nAgAfJM.net]
インチキ精度で逃げる。でもそういう仕事は黒か白かではないから、あながちインチキとも呼べない
たとえば、もともと人間がやっても精度が出ていなかった仕事で
建前上だけ検査しているという話にして、その仕事に関わっているひと皆がおかしいとは思ってるけど
仕事が回らないから誰も何もいわない〜みたいな仕事が世の中にはいっぱいある
そういう仕事を機械に置き換えるような場合、名目上の目標の精度がでなくても
前の精度を実質上回っていれば迷わず開発するでしょ
発注元も、精度が目標を下回っていたところで、見て見ぬフリをする

499 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 17:21:43.78 ID:u+nAgAfJM.net]
後そういう会社はAI技術はなくても
ほかの技術をしっかりもってるからエンジニアとしてはむしろ一般より格上

500 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 18:37:54.55 ID:PlRJlzfP0.net]
>>487
自分のところの事業の成功率の予測モデルでも学習してろよと思うわなw

501 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 20:05:44.35 ID:R+fonfJU0.net]
>>476

AIは警告出してた
警告を無視した人間のせいじゃん

502 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 20:48:42.09 ID:u+nAgAfJM.net]
てか機械学習だけしかできない会社ってよほどでないとこれからは厳しいな
別のフィールドに専門を持つ会社の方が残りやすそう

503 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:12:41.54 ID:PlRJlzfP0.net]
>衝突0.2秒前になって減速が始まると同時に、ドライバーのバスケス氏に警報で危険を知らせる。
これで対応できるわけねーだろ。

504 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:31:22.85 ID:u+nAgAfJM.net]
今さら警報なんて鳴らさないでくれって感じだな



505 名前:デフォルトの名無しさん [2019/11/09(土) 21:38:40.63 ID:1ZolsRQG0.net]
>>489
その場合は人件費より安く前と同程度の結果が出せれば依頼者側としては大きな問題ではないかもしれない

506 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:40:04.01 ID:R+fonfJU0.net]
飛び出しで急ブレーキなんて一瞬の判断だよ
0.2秒で判断できないならAI以下じゃん

507 名前:デフォルトの名無しさん [2019/11/09(土) 21:40:09.82 ID:1ZolsRQG0.net]
>>491
データを得られないんじゃね?

508 名前:デフォルトの名無しさん [2019/11/09(土) 21:41:20.60 ID:1ZolsRQG0.net]
>>493
AIは手段だよな

509 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:44:56.26 ID:PlRJlzfP0.net]
普通に運転してるならともかくとにかく乗せられていざという時なんとかしろって
できるわけねーだろ。
こんなもん責任かぶせるためだけに乗せてるだけってのがミエミエで気分悪くなるわ。

510 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:50:16.84 ID:u+nAgAfJM.net]
>>496
そそ。俺の前にいた会社なんて
C言語で画像処理やってたんだけど、電機や半導体などの簡単な仕事ばかり請け負って、その道の専門という体裁で仕事を集めてたんだ
全部なんでもやれますというより、これがうちの強味って売り出し方した方が強い
千葉はそういう会社がいっぱいある。中小企業が多いからじゃん

511 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 21:52:56.76 ID:u+nAgAfJM.net]
だから機械学習なのにプログラマーの人件費は超安い
まさしく土方

512 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 22:15:57.44 ID:LDMrdFKy0.net]
ある日はkeras
別の日にはchainer
そして頭大混乱

513 名前:デフォルトの名無しさん mailto:sage [2019/11/09(土) 23:58:20.65 ID:ieexeq/b0.net]
>>492
???
日本の法律として100%車側のNGな案件。

AIが悪いとかではない。

514 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 00:02:08.22 ID:j8ULpgDb0.net]
まあ、前からこの話は問題になると予想された案件。
一度AI設計者の責任にはならないという法律はできたが、それを導入した設計者に責任があるかはまだ結論は出てない



515 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 00:10:11.95 ID:j8ULpgDb0.net]
機械学習はあくまで目的解決手段の一つに過ぎない。
最近、AI専門の学科が増加してるが、それをメインにしては飯食えなくなる気がする。

516 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 01:37:00.28 ID:eARvZr/10.net]
ついにバブルが完全に弾ける要素が出たなあ
まあこれから地に足ついた現実的な路線に戻るだろなあ
普通にまずは業務プロセスを改善するということに使って欲しい
それ以上のことはあまりにも現実的ではない

517 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 02:20:34.83 ID:j8ULpgDb0.net]
https://qiita.com/yossymura/items/334a8f3ef85bff081913

518 名前:デフォルトの名無しさん (ワッチョイ bfda-TAVf [223.217.165.240]) mailto:sage [2019/11/10(日) 03:52:17 ID:j8ULpgDb0.net]
>>476への1つの打開策としてAI保険基金でも作るしかないかなー。
AI車が事故った場合、AI車の管理者が責任を有する。そのときのお金はAI保険に入っていれば保険やさんが出す。

そもそもの事故回避の問題点は消えないままだが。。

519 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 07:45:50.09 ID:odpzTgCKM.net]
つぎ量子コンピューターが出てくるとどうなるか分からないけど

520 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 08:55:44.53 ID:vAvO6oJv0.net]
>>476
自転車を押している人

を、危険なものと認識できなかったって事か

https://www.kunihikokaneko.com/dblab/keras/31.png
こんなもんの分類は出来るのに、夜中だったから無理だったって事かなあ

521 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 09:15:41.41 ID:vAvO6oJv0.net]
>>508
これ以外に、株やFXの相場のろうそくチャートから
次に上がるか下がるかを90%以上の確率で予測できた
なんてのもあるねえ

更にどこぞの高速コンピュータがそれを上回る精度で予測し
しかも1秒に100万回の売買可能!なんて言ってやがるw
実際には証券取引所の方で制限が掛かりそうだな

(0.01%の利益率しか無くても、取引手数料を考慮しないなら
1秒で1万倍以上に軽くなるわけだ(実際には大赤字))

522 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 09:59:21.42 ID:rtaa2JF9a.net]
>>509
保険料決めるには保険屋にソース

523 名前:Rードや学習に使ったデータなど、基本的にAIの全てを公開しなければならないな []
[ここ壊れてます]

524 名前:デフォルトの名無しさん [2019/11/10(日) 10:20:19.78 ID:+OI0AxiYa.net]
>>509
事故は分からんが精度に対する保険はある
https://www.nikkei.com/article/DGXMZO47986460Q9A730C1EE9000/



525 名前:デフォルトの名無しさん [2019/11/10(日) 11:57:56.59 ID:C4cvR5cE0.net]
https://ja.m.wikipedia.org/wiki/%E5%A4%A7%E6%BE%A4%E6%98%87%E5%B9%B3

松尾豊の弟子かよ(笑)

526 名前:デフォルトの名無しさん [2019/11/10(日) 12:23:39.77 ID:i7RQ4O9k0.net]
松尾研は変なやつが集まりすぎだよ
yentaでも松尾研のやつ見たぞ

527 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 13:11:20.89 ID:/B2ESouKa.net]
松尾先生で思い出したけど
「G検定を機械に解かせてみた」で合格したらそれは合格と認められるのかね?

528 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 13:37:21.47 ID:uUiSn9Z5a.net]
そもそもG検定なんて文章の読み取り能力を問うような国語の試験になってしまっているので
あんなの合格しても「素人でもわかるAI」系の本の内容を理解している程度の評価にしかならない
E資格ならまだマシだけどそれでも費用が高すぎるので、勤務先が全額出してくれるなら取ってもいいんじゃね?というレベル

529 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 13:46:32.18 ID:j8ULpgDb0.net]
松尾てだれだよ

530 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 14:35:24.56 ID:eARvZr/10.net]
松尾研出身の人でまともに論文とか出して人いる?

531 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 14:46:59.67 ID:5evIiogq0.net]
学習モデル考えたりしてバリバリの研究するより、松尾のような既存の技術を社会に導入する方法を提案する方が金になるだろうな

532 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 15:08:09.90 ID:j8ULpgDb0.net]
データなんちゃらりすとになりたいなんて言ってないで素朴に専門学科の勉強をしっかりやりましょう。機械学習はあくまで複数ある問題解決手段の一つに過ぎない。企業側はそのうち見切りつきますから。

533 名前:デフォルトの名無しさん [2019/11/10(日) 15:49:21.14 ID:iNYMutj60.net]
>>511
静止しているから衝突しないとそのモデルは判断していたんじゃね?
本当は静止していなかったから認識ミス、識別ミスだな
ドライバーが動画を見ずに前を見ていたら停止できたと思う
ドライバーの契約がどうなっていたかわからないけど
事故を予防する役割もあったとしたらアメリカなら訴えるだろうな
あくまでも事後処理の役割しかなかったのかな

534 名前:デフォルトの名無しさん [2019/11/10(日) 16:08:28.16 ID:iNYMutj60.net]
>>513
事故の確率とかがわかれば保険料率とか決められるんじゃないの?
病気とかその発生メカニズムとかを説明できなくても保険はあるし



535 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 16:31:30.69 ID:j8ULpgDb0.net]
死亡者を出すか出さないかは社会的に大きな差を持つ。
死亡者が出た以上、確率云々の話にならない可能性がある。

536 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 16:48:45.66 ID:j8ULpgDb0.net]
小さなお子さまを轢いてしまいました、なんて前例作ったら一気に手を引かなければならない状況になるでしょうね

537 名前:デフォルトの名無しさん [2019/11/10(日) 17:14:27.32 ID:iNYMutj60.net]
>>525
人間が車を運転しても死亡事故は発生する
自動運転の方が死亡事故率が低い事が分かったら
自動車保険で自動運転の場合の保険料が安くなるだろう

社会的な影響は理解できる
だから実証実験のドライバーが動画を見ていて良かったのかが疑問

538 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 17:22:52.75 ID:j8ULpgDb0.net]
保険も思い付きで上げた事例。
実際にそれですむかは知らん

539 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 17:58:05.20 ID:si2lOYY4a.net]
自分が自動運転アルゴリズムの開発責任者なら何があっても全責任をユーザー(とユーザーが契約した保険会社)が負う条件でないと販売できないな
何故ならバグ皆無のプログラムなど存在しないのだからそれを了解した上で使えよとしか考えられない
で、そんな条件で自動運転車を使おうとする人がいるのかどうか

540 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 17:59:45.60 ID:FBzaMbQQM.net]
機械学習の仕事はなくならないどころか増えてるけどな
だから人が増えても単価落ちてない

541 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 19:30:46.14 ID:FBzaMbQQM.net]
でもJavaとCで不良品検査する単価の安い仕事はもうしたくないな
つらたん

542 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 19:44:33.69 ID:zgABv+Qd0.net]
>>530
具体的に何の産業での仕事よ

543 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 19:56:07.47 ID:FBzaMbQQM.net]
少なくとも、画像処理の仕事は増えてる

544 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 20:03:19.56 ID:MbFf7EI60.net]
まあテスラならテスラが全額賠償するんだろう。
日本じゃ無理だな。



545 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 20:09:35.21 ID:zgABv+Qd0.net]
>>533
それはただの要素技術でしょ
工場とかの不良検品?医療のサポート系?それとも色んな分野のpocが来てるだけ?

546 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 20:19:42.03 ID:FBzaMbQQM.net]
>>535
不良品検査で伸びてる。データ集めだるくて
今までシステムを導入してなかったところが、上にせつかれてようやく動きはじめた

547 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 20:26:29.68 ID:zgABv+Qd0.net]
やっぱりその辺だよなあ
ありがとう

548 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 21:41:34.53 ID:Ni2n1I0Oa.net]
荒稼ぎさせてもらったがそろそろ逃げる準備かな
そもそも機械学習なんて外注してる時点で終わっとるのよ
本当にビジネスに生かしたいなら
海外のIT企業の様に業務プロセスに入れなきゃ
活かせるわけないんだよね

549 名前:デフォルトの名無しさん mailto:sage [2019/11/10(日) 22:52:41.28 ID:FBzaMbQQM.net]
pythonで組んだtensorflowのモデルをjavaで実装するだけという底辺の仕事もあるよ。そんで外向けにはDL4Jを使ってることになってる
最初Cが苦手でそんな仕事ばかりやらされたわ

550 名前:デフォルトの名無しさん mailto:sage [2019/11/11(月) 05:12:56.35 ID:4B7iuPHw0.net]
ちくっとしちゃうよ!

551 名前:デフォルトの名無しさん mailto:sage [2019/11/11(月) 05:25:18.59 ID:tX5kGdXzH.net]
データ分析も人出足りてないよな

552 名前:デフォルトの名無しさん mailto:sage [2019/11/11(月) 14:12:42.36 ID:KOoLqfbJa.net]
>>539
Web経由で結果だけ返すとか
system関数などでpython起動するのじゃダメなのか?

553 名前:デフォルトの名無しさん [2019/11/11(月) 15:28:27.51 ID:6RvD5GOFM.net]
モデルだけ再利用?
よく分からん

554 名前:デフォルトの名無しさん mailto:sage [2019/11/11(月) 18:52:23.73 ID:Oegy0lSI0.net]
https://tech.nikkeibp.co.jp/atcl/nxt/mag/rob/18/00003/110600045/



555 名前:デフォルトの名無しさん [2019/11/11(月) 19:19:21.18 ID:6RvD5GOFM.net]
これだったら
小さい工場でも気軽に導入できるね?

556 名前:デフォルトの名無しさん mailto:sage [2019/11/11(月) 20:45:45.13 ID:EVqu4APJ0.net]
推論のためにモデルを軽くするってのはあるけど、
精度を考えるとそもそもそこまで大きなモデルで学習する必要なかったんじゃね?
みたいな話はある。
てか誰も精度なんか興味なかったって話も。。

557 名前:デフォルトの名無しさん [2019/11/12(火) 15:52:52.24 ID:5J5yqkZqM.net]
hackerxてなんのイベントなの?

558 名前:デフォルトの名無しさん mailto:sage [2019/11/12(火) 15:59:09.63 ID:c/ZpUwOW0.net]
リクルートみたい

559 名前:デフォルトの名無しさん mailto:sage [2019/11/13(水) 15:33:05.22 ID:hApsuBpcr.net]
ハッカー村(そん)

560 名前:デフォルトの名無しさん [2019/11/15(金) 08:48:30.37 ID:y4RyaYdh0.net]
gpt-2の発表は変だった
期待外れ

あの大袈裟な発表は
イーロンマスクが入れ知恵したからなのかな

561 名前:デフォルトの名無しさん [2019/11/17(日) 21:27:39.70 ID:Qw4Ltt1k0.net]
形式ニューロンとパーセプトロンの違いがよくわかりません。

562 名前:デフォルトの名無しさん [2019/11/18(月) 07:41:28.00 ID:9aN5YyV+0.net]
>>551
ニューロンは一つの素子で
ニューロンを層状の2層構成

563 名前:にしたのがパーセプトロンじゃないかな []
[ここ壊れてます]

564 名前:デフォルトの名無しさん [2019/11/18(月) 09:52:47.05 ID:ahZzeXy3F.net]
割とマトモなこと言ってる
https://www.youtube.com/watch?v=OLkoIsuxg8k



565 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 06:35:07.83 ID:cfYOxE8L0.net]
むんどくさい
https://ainow.ai/2019/11/18/180603/

566 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 10:12:41.66 ID:49NB1ryfM.net]
要するに定期的な性能評価と再訓練が必要だから、作って終わりじゃないよって話だよね
あたりめえの話だ

567 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 12:10:48.90 ID:2mjMv6uSa.net]
作って放置して劣化しないものなど存在しない
技術の進歩の速いソフトウェアの世界ならなおさら

568 名前:デフォルトの名無しさん [2019/11/19(火) 12:20:05.56 ID:8naC8O/UF.net]
過学習で馬鹿になるパターンは人間でもよく居るよな

569 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 18:54:57.23 ID:Y8qF6Kw60.net]
増加しているアジャイルもAIも従来のSI型の発注では無理だけど、
いつまでこの慣行が続くんだろうね

570 名前:デフォルトの名無しさん [2019/11/19(火) 19:12:20.06 ID:s40irKmEp.net]
>>555
運用中に処理対象になるデータが
開発中に扱ったデータと違う分布になっているとか
開発中のデータがもともとたりなかったってことじゃ無いの?

571 名前:デフォルトの名無しさん [2019/11/19(火) 20:25:28.12 ID:Ag+TvSO9p.net]
ここで聞くのもなんなんですがdeep learningの手法とかテクニック系を話してる板はどこでしょうか?

572 名前:デフォルトの名無しさん [2019/11/19(火) 20:31:02.32 ID:nEj8UkU30.net]
どうしたらディープラーニングで言語理解出来るようになりますか?

573 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 20:46:18.90 ID:FKsBQDds0.net]
>>561
ママンに自然言語をも一度おしえなおしてもらってからだな

574 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 21:02:01.44 ID:cfYOxE8L0.net]
https://www.itmedia.co.jp/news/spv/1911/19/news098.html



575 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 21:03:39.09 ID:bUPqVsUtM.net]
>>555
つまりはしばらく食いっぱぐれ無いってこったな。ええこっちゃ。

576 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 21:30:03.49 ID:z1WwUVuJ0.net]
SIerが滅びないと日本のITに未来はない

577 名前:デフォルトの名無しさん mailto:sage [2019/11/19(火) 21:33:22.55 ID:EAp6ZFS60.net]
滅びない。そして未来はない

578 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 00:19:44.54 ID:fEAcQWwmp.net]
すいません。まったくのど素人なのですが、質問させてください。

システム構築というか、コンピュータに望むような動きをさせるため、どのプログラムをどのように組んだらいいのか、ってことについて勉強をしていきたいと思ってます。

アルゴリズムや機械学習などの基本知識を学んだ上で、プログラミングを勉強していけばいいでしょうか。

よくわからないなりに考えたので、何を言ってるのかわからないかもしれませんが、何をすべきか、ご教示ください。

579 名前:デフォルトの名無しさん [2019/11/20(水) 07:06:48.48 ID:zvVE5hEg0.net]
>>567
こういうのをやってみたら?
https://www.codexa.net/

580 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 07:43:05.33 ID:akFTsaUH0.net]
>>567
適切なスレに誘導してもらう

581 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 08:22:58.48 ID:xoh76b7Fp.net]
>>568
ありがとうございます。できれば最初に地図というか全体を俯瞰して理解したいのですが、それは可能でしょうか。

>>569
ありがとうございます。どこらへんで聞くのが適切でしょうか。教えていただけると助かります。

582 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 09:45:01.14 ID:hrstG49p0.net]
>>570
システム構築をゼロから学ぶつもりってこと?
どこかの情報工学科のシラバス一回見てみるとか
習得範囲が広すぎるような気もするので、とりあえず望んだプログラム動かすまでとか範囲

583 名前:決めるといいかも
あとは身近で詳しい人捕まえて素人質問たくさんぶつけた方がよさそう
[]
[ここ壊れてます]

584 名前:デフォルトの名無しさん [2019/11/20(水) 11:54:50.74 ID:8uwrhbuIM.net]
東大に入ればいいんじゃない?



585 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 12:22:19.49 ID:QpxHOQL8d.net]
ライフワークになってしまう

586 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 15:56:49.87 ID:fDyJS9pg0.net]
>>567 >>570
続きは↓へ移動汁
スレ立てるまでもない質問はここで 152匹目
mevius.5ch.net/test/read.cgi/tech/1573214616/

587 名前:デフォルトの名無しさん mailto:sage [2019/11/20(水) 22:43:33.41 ID:xoh76b7Fp.net]
遅くなりました。皆さまありがとうございました。
とりあえず、全体像を見て、どこらへんを目指すか考えていきます。
>>574のスレッドでいろいろ聞いてみようと思います。
それでは。

588 名前:デフォルトの名無しさん [2019/11/23(土) 11:06:54.12 ID:EMpawcHE0.net]
>>567
>「コンピュータに望むような動きをさせるため」

その『望むもの』を自分で先に見つけ出したほうがいい
これ自体はコンピューターと直接の関係はない。
まずは、コンピュータにとらわれない実務に触れてみたら
ヒントがでてくるんじゃないかな。
じゃないと、何やっていいかすらわからないから、
何から覚えるかもわからないことになる。

589 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 14:23:27.39 ID:pr0bhlVh0.net]
意匠権について
https://youtu.be/nXdkZafRzyY


2020年4月に法改正
https://youtu.be/5YS0TLS37Zs

590 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 14:52:00.77 ID:UeAxjNOJa.net]
大澤昇平 :: AI 救国論 🇺🇳 @Ohsaworks:

AI の場合は単に精度が高ければ何でもいいんですよ。
設計時に人間が主観(「事前分布」といいます)として差別的な情報入れたら NG ですけど、
ラーニングの結果として差別が生まれるのであれば、それは単なる自然の摂理です。
https://twitter.com/rysyrys/status/1197764388691689472
(deleted an unsolicited ad)

591 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 15:07:28.15 ID:PHGQW6IUa.net]
特任准教授なのに准教授と自称している人だな

592 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 19:34:36.75 ID:rr4WRS2d0.net]
> 称号 経済産業省認定 未踏天才プログラマー/スーパークリエータ
(つд⊂)ゴシゴシ
( ゚д゚ )

593 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 00:38:43.56 ID:2vFps37N0.net]
>>580
これが何の意味もないことを証明してしまったな

594 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 08:46:55.06 ID:wKi7JOLd0.net]
清水某とかもそうだろ



595 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 13:27:18.72 ID:WoLlse2Fa.net]
東大から正式に切り捨てコメント出たな
こういう胡散臭い人はどんどん切ってほしい

596 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 13:30:34.69 ID:G+scijNw0.net]
つくばが出発点で
政府系のあやしープロジェクトにガンガン応募して
りっぱにうかってるところも一緒ダナーw > >>578の人&「トロイのつくば」の作者

>>581
だなw

>>583
東大以外からも
どんどん探し出してポイしてってほしい

597 名前:デフォルトの名無しさん (オッペケ Sr27-acyW [126.212.138.5]) mailto:sage [2019/11/26(火) 08:01:06 ID:g0fKFAs1r.net]
cudaがらみはくだpyスレがいいのかな

598 名前:デフォルトの名無しさん mailto:sage [2019/11/26(火) 19:02:05.57 ID:pgCzIwzp0.net]
>>585
【GPGPU】くだすれCUDAスレ part8【NVIDIA】
mevius.5ch.net/test/read.cgi/tech/1465969275/

599 名前:デフォルトの名無しさん [2019/11/26(火) 19:32:56.95 ID:xV5ChpD10.net]
文章から画像を生成するGANがあるけど
例えば「机の上にリンゴが1個あります」という文章から画像が生成されたら

600 名前:

機械は人間のように、言葉の意味を理解したと言えるのでしょうか?
[]
[ここ壊れてます]

601 名前:デフォルトの名無しさん [2019/11/26(火) 19:36:56.31 ID:cmZeJbzH0.net]
>>587
机、りんご、上、1個、ある
とかの個別の概念と
それらの関係を人間が意図したのと同じように
解釈して図示できたら
通信ができたことになるのではないでしょうか?

通信が出来ることを理解すると解釈するなら
理解したことになりそうな気はします

602 名前:デフォルトの名無しさん [2019/11/26(火) 19:38:45.07 ID:cmZeJbzH0.net]
xmlとかでちゃんと書いてやればコンピュータでも解釈できると思う
画像からXMLなりを生成するのもできそうな気はするな

603 名前:デフォルトの名無しさん [2019/11/26(火) 19:41:33.35 ID:cmZeJbzH0.net]
センター試験か何かを解かせたとかニュースになってた気がするけどな
一応問題文を理解して答えを見つけられるようにはある程度なってるんじゃないの?

604 名前:デフォルトの名無しさん mailto:sage [2019/11/26(火) 20:21:16.43 ID:4LG/NuNj0.net]
理解、ってなに?ってことだよな



605 名前:デフォルトの名無しさん mailto:sage [2019/11/26(火) 22:54:22.47 ID:qL3WJ7tta.net]
まあ、人間も問題の意図している理解をしているとは限らないからな

606 名前:デフォルトの名無しさん (ワッチョイ 03da-BEIG [58.89.130.35]) mailto:sage [2019/11/27(水) 09:01:28 ID:dU+ct8c00.net]
入試問題を解くのは条件反射、出題の意図を理解するのは無駄(笑)

607 名前:デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33]) [2019/11/27(水) 14:25:38 ID:pvWhqXzvM.net]
curriculum learningてどうよ?
効果を感じないんだが。。。

608 名前:デフォルトの名無しさん (ワッチョイ bf01-qZD/ [60.86.178.93]) mailto:sage [2019/11/27(水) 14:44:38 ID:R3eAH8fN0.net]
>>594
にんげんさまが指示してやらねばならん部分・・・
階段の刻み方(どういう方法で難しさを順位付けするか)
が悪いんでね?

あるいは
これもやっぱりにんげんさまが指示してやらねばならん部分・・・
レベル1の勇者にいきなりたまにはぐれメタルエンカウントさせちゃう的な、
試練の与え方が悪いか。

609 名前:デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33]) [2019/11/27(水) 14:50:18 ID:pvWhqXzvM.net]
nlpなんだけど
ミニバッチ作るときに自然にもうcurriculum learning的になっているのかな?

610 名前:デフォルトの名無しさん mailto:sage [2019/11/28(木) 22:01:34.94 ID:Y+wConzQ0.net]
訓練データとテストデータの相関性がほとんどない問題とか
当てずっぽうで適当に振るところから始めて反応見て方向性定めているのか?
パワーと投稿数の勝負になっている気がしてならないけど

611 名前:デフォルトの名無しさん [2019/11/28(木) 22:37:12.05 ID:fUP9hRZYa.net]
>>590
2019年大学入試センター試験英語筆記科目においてAIが185点を獲得 
https://www.ntt.co.jp/news2019/1911/191118a.html

612 名前:デフォルトの名無しさん [2019/11/29(金) 00:17:47.54 ID:lLJmxOHf0.net]
Kaggleとかの機械学習コンペで主催者(依頼者)が持ってるマシンよりも参加者(優勝者)がコンペで使ったマシンのほうが性能良いってことあったりするの?

613 名前:デフォルトの名無しさん (ワッチョイ 7f3d-YC6P [219.104.75.160]) mailto:sage [2019/11/29(金) 02:03:47 ID:ZRMLeeOO0.net]
主催者がもってるマシンってなんぞ

614 名前:デフォルトの名無しさん (ワッチョイ 7f9c-rPqt [61.125.210.189]) mailto:sage [2019/11/29(金) 02:04:56 ID:WPSMNOiN0.net]
マシン持ってない可能性も高いだろう



615 名前:デフォルトの名無しさん (アウアウクー MM33-O/Gm [36.11.225.189]) [2019/11/29(金) 09:49:10 ID:gYWo3w4cM.net]
Deep Learning散々騒いだ割には結局テーブルデータじゃGBDTにボロ負けな現状なんとかならんの
せいぜいGBDT様にお情けでensembleさせて頂く程度

616 名前:デフォルトの名無しさん [2019/11/29(金) 12:49:35.84 ID:9onQejqxM.net]
つ適材適所

617 名前:デフォルトの名無しさん mailto:sage [2019/11/29(金) 16:11:35.42 ID:WPSMNOiN0.net]
>>602
テーブルデータの解析で話題になったわけじゃないぞ

618 名前:デフォルトの名無しさん mailto:sage [2019/11/29(金) 19:08:43.15 ID:rfU0XW80r.net]
>>604
多分だけどニューラルネットワークは汎用性が高いだけで、画像系でももっと良いほうがあるけど見つかってないだけと思ってる

619 名前:デフォルトの名無しさん mailto:sage [2019/11/29(金) 19:15:32.09 ID:Ab9Y7Svv0.net]
>>605
画像処理で高精度が出るDNNのモデルサイズを精度をあまり下げずに削減するような研究が出てきてるから、それを突き詰めると決定木的なルールが取り出せるのではないか

620 名前:デフォルトの名無しさん [2019/11/29(金) 19:18:55.66 ID:9onQejqxM.net]
えーまた同じ間違いを?

621 名前:デフォルトの名無しさん mailto:sage [2019/11/29(金) 21:04:43.23 ID:i2+wAL7T0.net]
>>602
データテーブルでも回帰の滑らかさではnnが上だけどな。

622 名前:デフォルトの名無しさん mailto:sage [2019/11/29(金) 23:37:12.91 ID:ZRMLeeOO0.net]
>>602
調律師次第ではNNもGBDTに精度で並ぶ
しかもNNとGBDTではGBDTの方がモデルの劣化が早い

623 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 09:04:53.45 ID:DZbtLtp60.net]
回帰がなめらかじゃないと困るって、たぶんあるとは思うけど具体的にどういうケースだろう

624 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 09:36:17.16 ID:Uqy6J8Cl0.net]
>調律師次第ではNNもGBDTに精度で並ぶ
んなわけねーだろ。。データが 2000,3000程度の場合、NNなんてまともに動かんわ。



625 名前:デフォルトの名無しさん [2019/11/30(土) 09:52:40.58 ID:vuvC9RZIa.net]
>>609
モデルの劣化って汎化能力が低いってこと?

626 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 10:17:22.90 ID:g/CprbiQ0.net]
overfitじゃない?

627 名前:デフォルトの名無しさん [2019/11/30(土) 10:53:06.13 ID:xqSKATFaa.net]
>>611
それもNNの規模次第でゎ。。。

628 名前:デフォルトの名無しさん [2019/11/30(土) 10:54:38.50 ID:xqSKATFaa.net]
>>609
劣化が早いってどゅこと?
モデルって腐るの。。。?

629 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 12:02:50.26 ID:Uqy6J8Cl0.net]
>>614
そんな小規模でNNチューニングしてまで使ううまみはないだろ?
ばかなの?
それとも本気で現場でそんな主張してんの?

630 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 12:09:04.69 ID:A+rR0WU8a.net]
はい

631 名前:デフォルトの名無しさん [2019/11/30(土) 12:58:50.37 ID:YcFQTR8Rx.net]
なんか悪かった
どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざくから
むしゃくしゃしてやっただけなんだ

NGBoostは学習も推論も遅いし予測分布も分類じゃそんなに嬉しくないし結局LightGBM/CatBoostは超えられなさそうだよなぁ

632 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 13:03:41.07 ID:OO2kPiiB0.net]
>>618
> どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざく
発注元の責任で このでぃーぷするとです って
明文化しとけよw
あとから責任おっかぶせられそうになると
ブチ切れちゃうぞw

633 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 13:57:35.50 ID:kDVEf3m10.net]
政策もビッグデータで決めるようになるらしい

634 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 13:59:00.59 ID:OO2kPiiB0.net]
>>620
テラ保守スwww
しっぱいするみらいしかみえないぞ・・・



635 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 15:42:08.94 ID:NbIvukTW0.net]
>>610
例えば学習データでは整数しかないけど、小数点の数値も予想したいときとか。
パラメータ変えた時に結果が同じだと説明の整合が取れないようなものにも使う。

636 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 16:47:02.28 ID:n3PjdAM0a.net]
数万程度のデータでNNは流石に無理だろう
過学習して終わるイメージ

637 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 17:12:57.03 ID:369/mHN+0.net]
パンピーには関係ない話だけど、
Kaggleで賞金狙えるレベルの人の中には、稀にNNでGB

638 名前:ニ大差ない精度を出す者もおるんだ
これはたびたびカーネルに出る話題だから間違いない
GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
NNは前処理もパラメーター調整もシビアだけど、この少ない特徴量でモデルを組めれば、
実装後にデータの傾向が多少変わっても、GBDTよりは精度が落ちない
[]
[ここ壊れてます]

639 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 17:34:03.26 ID:CwbTtXvfH.net]
そんな怖いモデル使えないっす

640 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 17:54:56.02 ID:U4j9IED8a.net]
長期に渡って現場で使い続けられるかという観点ではパラメータをやたらと増やした力ずくモデルの方が信用ならない危険なモデルなんだけどな

641 名前:デフォルトの名無しさん [2019/11/30(土) 18:09:44.73 ID:YcFQTR8Rx.net]
実務上は精度追い求めるよりFeature Importanceが出せるかどうかの方が重要なんだよなぁ

642 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 18:32:57.53 ID:HNwCuvLH0.net]
NNでもGBでもいいけど、>>618のような客が使う道具まで指定してくるのがイタイ
これで失敗した場合の瑕疵担保責任はどっちにあるんだ?

643 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 18:40:26.81 ID:Uqy6J8Cl0.net]
>GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
そりゃ20~50にうまく特徴量を絞れたらそうだろ。それが難しいんだっつーの。
それを半自動でやりたいってのがそもそもの機械学習の目的だろうに。

644 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 18:47:56.68 ID:OO2kPiiB0.net]
>>628
>瑕疵担保責任
契約書の文面の(偶然のなりゆきも含めた)ふいんきと
弁護士に幾らかけるか次第じゃね?



645 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 18:49:01.71 ID:OO2kPiiB0.net]
「渡り鳥の渡り行動の研究するよ!
モデル動物はニワトリ指定な!!」くらいの
明瞭な無茶苦茶さがあれば楽なんだがなw

646 名前:デフォルトの名無しさん [2019/11/30(土) 19:06:06.12 ID:YcFQTR8Rx.net]
大体4000件しかないデータで何すんだよ
Titanicじゃねーんだぞ

647 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 19:19:04.99 ID:DZbtLtp60.net]
>>622
台風の進路予想とか言うくらいのもっと具体的な例を期待していた
それだと滑らかな回帰ができないとホントに困るのかぴんと来ない

648 名前:デフォルトの名無しさん [2019/12/01(日) 09:32:45.02 ID:loLKdL8Wd.net]
このソニーのニューラルネットワーク関連の解説動画どうよ?
https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA

良い動画だと思うんだけど、このスレの人たちの意見を聞きたいです。

649 名前:デフォルトの名無しさん mailto:sage [2019/12/01(日) 09:34:39.98 ID:YoP0MD/80.net]
アノテーションツールとしてVoTTとlabelImgが紹介されているが
VoTTの方が楽かな
ただしtag名を入力してから、最後にエンターキーを押さないと
それが確定しない、という事を知っておかないと
いつまで経ってもtagすら作れないw

labelImgはpythonのpyqtから作るからワクワク感があるが、
自分の落として来たバージョンがミスっていたのか、プログラム内のimportファイルの書き方に
3ヶ所エラーがあって、自分で「こんな行き当たりばったりの治し方で良いのかなあ?」
と直したら、とりあえずユーザーフォームが開く所までは動いた
だがまだ肝心なアノテーションを試してないなあ
ボロボロだったりして

650 名前:デフォルトの名無しさん (オッペケ Sr33-Y6BP [126.212.138.5]) mailto:sage [2019/12/04(水) 16:01:19 ID:tCRQbFTxr.net]
GPUのメモリがオーバーしてしまい
Jupyter閉じてプロセスID調べてtaskkillと

こんなの出来たんかwwwww

651 名前:デフォルトの名無しさん [2019/12/04(水) 16:29:35.31 ID:9sxYmTh0M.net]
knnをneural netでやるのって無意味?

652 名前:デフォルトの名無しさん [2019/12/04(水) 16:54:35.12 ID:vhuKISsK0.net]
コリアン・ニュース・ネットワーク。

653 名前:デフォルトの名無しさん mailto:sage [2019/12/05(木) 2 ]
[ここ壊れてます]

654 名前:0:26:03.41 ID:NiCdCRl60.net mailto: chainerやめちゃうのか
chainerXとかリソースメチャクチャ使ってたのに
やはりマーケティングの失敗だよなあ
非常に残念
[]
[ここ壊れてます]



655 名前:デフォルトの名無しさん mailto:sage [2019/12/05(木) 20:36:15.87 ID:NKJ9SQ6T0.net]
マジかよChainerの勉強もそこそこ進めてた矢先に

まあPyTorchが類似部分が多いから何とか

656 名前:デフォルトの名無しさん mailto:sage [2019/12/05(木) 20:52:35.88 ID:NiCdCRl60.net]
PyTorchに統一して欲しいね
TF2.0も今更感あるし
初心者向けのKerasとプロ用のPyTorchの2つでいいと思う

657 名前:デフォルトの名無しさん mailto:sage [2019/12/05(木) 21:11:16.43 ID:aecxiEdH0.net]
粘着してたkerasの作者大勝利だな

658 名前:デフォルトの名無しさん mailto:sage [2019/12/05(木) 21:55:53.24 ID:JFK1j8cBr.net]
chainet-rlの代わりは何がよいの?
cupyとoptunaは開発継続らしいよ

659 名前:デフォルトの名無しさん (ワッチョイ eeda-ejxW [223.217.160.106]) mailto:sage [2019/12/06(金) 01:37:39 ID:GLXpNeMl0.net]
マーケティングじゃなくてマンパワーの差。

660 名前:デフォルトの名無しさん (ワッチョイ a102-V35x [106.166.50.77]) mailto:sage [2019/12/06(金) 04:01:13 ID:1/Pn3P+Y0.net]
何といっても深層学習の数学的な枠組みが分かってないと
使いにくいのがChainerとPyTorch
だが細かくカスタマイズし易いのがChainer&PyTorch

kerasは「何かこのタイミングでこれっぽい事したら上手く動くんじゃね?」ぐらいの理解でも
何とか動いてくれる
でも細かなカスタマイズは出来ないからTensorflow丸ごと弄ることになって、
そうなるとChainer&PyTorchより更に上のレベルの数学的な理解と
そのプログラミング上の実装を知っておく必要が出来てしまう

661 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 07:42:41.87 ID:GLXpNeMl0.net]
まあ、良いのではないでしょうか
マイナーチャンジに力を注ぐより、より良きものを求めることが立場

662 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 07:43:08.75 ID:GLXpNeMl0.net]
できる立場

663 名前:デフォルトの名無しさん (アウアウクー MM75-MVf8 [36.11.224.68]) mailto:sage [2019/12/07(土) 09:11:16 ID:ARR8om9gM.net]
tf2.0とpytorchってシェアほぼ互角じゃない?
どっちに統一されるかは知らん。自分の使ってる方がマイナーになったら
あきらメロン

664 名前:デフォルトの名無しさん (ワッチョイ c9da-WBaP [114.184.82.243]) mailto:sage [2019/12/07(土) 09:44:14 ID:iMRj3aHc0.net]
メロンです、請求書です。



665 名前:デフォルトの名無しさん mailto:sage [2019/12/07(土) 09:58:04.39 ID:xi7Cj8Cta.net]
ツールが使えるだけで機械学習や統計を理解した気になっている人は危険だと言うことだ
本当に理論から理解していれば多少記法が変わったところですぐ順応できるが、特定のフレームワークを使った単なる作業者だとそのフレームワークが下火になった時に移行するのにかなりの労力が必要

666 名前:デフォルトの名無しさん (アウアウクー MM75-MVf8 [36.11.224.68]) mailto:sage [2019/12/07(土) 10:43:12 ID:ARR8om9gM.net]
はじパタ本とかゼロから作るで適当にベースを作っただけでも
複数のツールを使うぐらいならワケないけどな
でもそのレベルだとこれからは機械学習を専門職にはできない感じがする

667 名前:デフォルトの名無しさん mailto:sage [2019/12/07(土) 12:39:37.05 ID:ZsYnLuoj0.net]
ハードウェアサポートが広い方を使いたいからtensorflowって感じになってる。
分散環境での学習とか、クライアント機でどれだけ動くのかがこれからの焦点なんじゃないかね。
コード内容自体はどっちも大して変わらん。バカは大騒ぎするけど。

668 名前:デフォルトの名無しさん (ブーイモ MMe1-IfTI [210.138.178.45]) mailto:sage [2019/12/07(土) 15:48:15 ID:adovJNi9M.net]
ゼロから作るやっとくメリットで具体的になんですか?

669 名前:デフォルトの名無しさん (ワイーワ2 FFc2-EG+M [103.5.142.122]) mailto:sage [2019/12/07(土) 15:58:51 ID:kC4yD5gfF.net]
自動微分を自分で実装すると手間だなというのが実感できる。

670 名前:デフォルトの名無しさん [2019/12/07(土) 16:41:02.63 ID:8POX1SPh0.net]
あ、はい

671 名前:デフォルトの名無しさん mailto:sage [2019/12/07(土) 16:52:12.95 ID:ARR8om9gM.net]
>>653 NN、畳み込みNNやLSTMのロジックを一から理解できる
逆にいえば、そこ完璧にわかってるならやる意味ないだろうなあ

672 名前:デフォルトの名無しさん mailto:sage [2019/12/07(土) 17:00:30.01 ID:xi7Cj8Cta.net]
「ロジック知って何の意味あるの?知らなくても使えてるよ?」みたいなことを言う奴が出てきそう

673 名前:デフォルトの名無しさん mailto:sage [2019/12/07(土) 17:06:56.43 ID:ARR8om9gM.net]
お前が使えるレベルならそうなんだろうとしか言いようがないな

674 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 08:50:34.91 ID:pkvtzmnX0.net]
つまり意味はない、ってことだな



675 名前:デフォルトの名無しさん [2019/12/08(日) 09:09:03.18 ID:d61YKsOU0.net]
>>659
好き

676 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 09:36:02.76 ID:wx0c05j8a.net]
ハイパーパラメータの自動調整をまともに使うには背景にある統計理論の知識がいるよ

677 名前:デフォルトの名無しさん [2019/12/08(日) 13:55:46.22 ID:KMc7Z1Fn0.net]
chainerは単純に人員が足りてなかったと思う
リリース版にバグがあるままリリースしてる
リリース版の更新が多すぎ
で離れて使わなくなった

678 名前:デフォルトの名無しさん [2019/12/08(日) 15:40:26.42 ID:dxbVA0b4M.net]
いうてtfもバグなしじゃないだろ

679 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 16:05:40.36 ID:HPGGb6iI0.net]
>>661
あんまり関係ないがな。
hyperoptなりoptunaなりにつっこむだけだろ。
しかもそんな変なチューニングするくらいなら論文のままのもの使った方がいいっていうおまけつき。

680 名前:デフォルトの名無しさん (ワンミングク MM6a-DV35 [153.235.108.33]) [2019/12/08(日) 16:11:39 ID:dxbVA0b4M.net]
automlで適当に調整してくれるしな

681 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 17:12:03.76 ID:DDGzay+d0.net]
>>662
いよいよ倒産が見えてきたのかな?
受託もしないし自社サービスも出さないし
それでやってられるとは思えん
とにかくユーザーが使えるサービスをリリースしないと

682 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 17:15:40.02 ID:S4ZYhJQRa.net]
ハイパーパラメータ調整ツール自体の調整能力まで把握した上で使うならいいが
理論も分からない、ツールがどうやって調整したのかも分からないだと困るな
「どうしてこのハイパーパラメータが最適なのか?」の質問に対して「ツールがそう算出したから」「論文に書いていたから」を回答にせず説明できるなら問題ないとは思う

683 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 17:26:18.38 ID:d61YKsOU0.net]
>>667
それは生産性も価値もない話だと思う
理論について勉強することは必要だけど、重箱に隅のような知識を大切にするよりは
機械学習の外に目を向けた方がいい

684 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 17:31:13.86 ID:4TAWhQS40.net]
>>666
嫉妬じゃん



685 名前:デフォルトの名無しさん [2019/12/08(日) 19:49:05.17 ID:KMc7Z1Fn0.net]
pfnってなんか仕事はしてるだろ
トヨタとの共同研究ってまだ続いてるんじゃないの

686 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 20:50:44.18 ID:7TPIEo2i0.net]
オコボレ狙いの企業が未だに群がってるから、財源の心配は無いだろう

人材に恵まれていないのか成果がパっとしないけど、
それでも日本のSI企業に頼るよりPFNに投資した方が賢い

687 名前:デフォルトの名無しさん [2019/12/08(日) 20:59:04.48 ID:wWaHJEbO0.net]
>>667
試した中で一番いい結果だから
じゃダメなんですか?

688 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 21:32:17.42 ID:HPGGb6iI0.net]
PFNみてるとgoogleが広告やらなかったらこんな風にじり貧になってたんだろうなってのが想像できる。

689 名前:デフォルトの名無しさん [2019/12/08(日) 22:44:35.51 ID:KMc7Z1Fn0.net]
googleは元々広告で食ってるだろ

690 名前:デフォルトの名無しさん mailto:sage [2019/12/08(日) 23:18:41.13 ID:DDGzay+d0.net]
>>669
嫉妬というかこれだけの技術力あるのになにをしてるんだ?という気持ち
結局第三者から見たchainer以外のアウトプットはないわけだし
それを切るってもう何も残らん

691 名前:デフォルトの名無しさん [2019/12/08(日) 23:30:34.77 ID:KMc7Z1Fn0.net]
いちいち公開してないだけで色々案件はやってるだろ

692 名前:デフォルトの名無しさん mailto:sage [2019/12/09(月) 00:20:35.28 ID:NiFr8TmZ0.net]
>>675
技術力って何?具体的に何のこと?

693 名前:デフォルトの名無しさん (ワッチョイ dd7c-s/HI [14.193.216.182]) mailto:sage [2019/12/09(月) 01:54:46 ID:PMVVzMoi0.net]
第三者ってどの程度のこと言ってるか分からんけどCuPyとかoptuna使ってる人そこそこいるだろ

694 名前:デフォルトの名無しさん mailto:sage [2019/12/09(月) 13:00:46.54 ID:cQNHGZkd0.net]
機械学習で日本の人名を生成したい
どうすればできる?

当方しがないエンジニアでpythonはできるが、
機械学習周辺のキーワードがわからなくて調べられずに困っている
GANとかいうのは画像用だから使えないんだよな?程度の知識



695 名前:デフォルトの名無しさん [2019/12/09(月) 13:09:35.22 ID:RLwtKsqpF.net]
日本の人名は戸籍に使える文字が決まってるから
そこから選べ

696 名前:デフォルトの名無しさん (ワッチョイ b5e3-mnWA [220.219.149.102]) mailto:sage [2019/12/09(月) 13:14:56 ID:cQNHGZkd0.net]
>>680
ありがとう
ただこれの用途はキャラクターの命名なので、
現実に使える文字かどうかはあまり重要じゃない
むしろ実際にはありえなさそうな方が良い

697 名前:デフォルトの名無しさん mailto:sage [2019/12/09(月) 13:55:54.49 ID:scocuTx70.net]
>>681
保険会社かなんかが姓名ランキングしてるから
まずは使える文字からランダムして
よくある苗字や名前になってたら再抽選

698 名前:デフォルトの名無しさん (アウアウカー Sa8d-0KSf [182.251.195.157]) mailto:sage [2019/12/09(月) 15:05:03 ID:xDp47k0Pa.net]
ディープなことするよりマルコフ連鎖とかでやった方が良さそうだけどな

699 名前:デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.79.171]) [2019/12/09(月) 15:14:40 ID:RLwtKsqpF.net]
条件後出しは失格

700 名前:デフォルトの名無しさん (ワッチョイ bd54-8zr5 [180.235.0.69]) [2019/12/09(月) 16:25:34 ID:HdYgf83V0.net]
ああ、同人誌みたいなライトノベルみたいなどうしようもないやつに使いたいのね
乱数でいいんじゃね?

701 名前:デフォルトの名無しさん mailto:sage [2019/12/09(月) 19:24:47.20 ID:QTsW6dvXa.net]
ランダムな個人情報を生成するプログラムなら既にあるが
テストとかに使うらしい

702 名前:デフォルトの名無しさん mailto:sage [2019/12/09(月) 21:39:53.12 ID:w/kMOH0C0.net]
人名ジェネレーターで良くない?
辞書リストと乱数で成り立っていてAI不要な

703 名前:デフォルトの名無しさん [2019/12/10(火) 04:20:23.19 ID:0gRjlhkw0.net]
デスノートのいじめが発生しないようにって配慮スゲーって思ったな

704 名前:デフォルトの名無しさん [2019/12/10(火) 14:05:49.73 ID:48kVELqAF.net]
阿部進次郎



705 名前:デフォルトの名無しさん mailto:sage [2019/12/11(水) 19:37:08.57 ID:LCchQiSlD.net]
ご質問なのですが、機械学習の回帰問題において、教師信号が特定の範囲内にある時の重みを重くするような損失関数はありますでしょうか?

私が解きたい問題においては、教師信号の値が0~1の間の値を取るように基準化しているのですが、
例えば、RMSEを下記のようにカスタマイズした損失関数を使用したいのです。

False Positive:学習器の出力は0〜0.2の範囲だが、教師信号は0.2より大きい or
学習器の出力は0.8〜1の範囲だが、教師信号は0.8未満

False Negative:教師信号の出力は0〜0.2の範囲だが、学習器の出力は0.2より大きい or
教師信号は0.8〜1の範囲だが、学習器の出力は0.8未満  

とTrue negativeとFalse Negativeの場合にのみ損失関数を計算するか、重みを大きくした損失関数を使いたいのです。

もしご存じでしたら、この損失関数を使用可能な学習器やライブラリなどを教えていただけますでしょうか。
ライブラリなどが無くても最悪論文などがあればそれでもかまいません。何卒ご教示をお願いいたします。

706 名前:デフォルトの名無しさん [2019/12/11(水) 21:41:26.98 ID:DwgG6llj0.net]
わかんない

707 名前:デフォルトの名無しさん mailto:sage [2019/12/11(水) 21:52:30 ]
[ここ壊れてます]

708 名前:.04 ID:10/84Yqu0.net mailto: 知らない []
[ここ壊れてます]

709 名前:デフォルトの名無しさん mailto:sage [2019/12/11(水) 22:27:12.29 ID:ARdMYJJF0.net]
andで繋げたら?

710 名前:デフォルトの名無しさん mailto:sage [2019/12/11(水) 22:52:42.17 ID:KfdgnhFCa.net]
損失関数自分で定義すればいいじゃん

711 名前:デフォルトの名無しさん (スッップ Sdba-c9yC [49.98.151.148]) mailto:sage [2019/12/12(Thu) 00:35:12 ID:XDEaLtEed.net]
>>690
まず教師信号とはなに?ベクトル?時系列?
>教師信号が特定の範囲内にあるとき…
ヘビサイト関数(ステップ関数)の重ね合わせで表現可能

>RMSE
二乗平均?(RMS)
よくわからん。一般的でない。

>false positive, false negative…
応答だけ書かれてもわからん。±で4パターンあるだけ?

712 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 06:56:14.26 ID:HzXPCxE7r.net]
>>690
fpに分類をよせたいということであれば重み付けカッパ係数で評価する方法はある。
ttps://qiita.com/tand826/items/4d1fb2045f2b48d21b7d

求めているものと全くちがうかも

713 名前:デフォルトの名無しさん [2019/12/12(木) 07:02:30.85 ID:x0loQ0xU0.net]
理解してない人が繰り出す小手先の改善ほど効果のないものはない

714 名前:デフォルトの名無しさん (スップ Sdba-HVu8 [49.97.96.198]) mailto:sage [2019/12/12(Thu) 07:37:25 ID:xvtH/KsFd.net]
>>695
RMSEは一般的だけど。。

>>690
やり方は主に2通りある
一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?



715 名前:デフォルトの名無しさん (アウアウカー Sac3-WaUP [182.251.45.43]) mailto:sage [2019/12/12(Thu) 08:02:27 ID:mOtpkcnLa.net]
うんこレベルに無知なくせに回答しようとするゴミって
どういうメンタルなんだろうなw
機械学習は分かるけどウンコの考えは謎だわ

716 名前:デフォルトの名無しさん (スッップ Sdba-qWAV [49.98.141.222]) mailto:sage [2019/12/12(Thu) 09:22:48 ID:rtEMPQR+d.net]
文句いうだけのうんこよりマシって程度

717 名前:690 mailto:sage [2019/12/12(木) 12:56:19.08 ID:qy4ltjlBD.net]
皆さん、お忙しい中返信をありがとうございます。

>>698
知りたいです。是非教えてください。
>一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?

718 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 17:43:51.02 ID:xvtH/KsFd.net]
>>701
サンプルをいじる方は2パターンあって、重みを付けたい範囲のデータを水増しして増やすか、逆に重みを付けたくない方のデータを間引くかのどちらかを行う

関数をいじる方は、使ってるライブラリのオプションにweightみたいなのがたぶんあるはず。無ければ自分で実装しかないんじゃないかな

719 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 21:49:18.95 ID:x0loQ0xU0.net]
違う話になってない?

720 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 22:07:40.49 ID:SSYYfvrk0.net]
損失関数を変えるってより真の目的は特定のデータ範囲だけ重み付けしたいということだと解釈したけど、違ってたらすまん

721 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 23:49:42.64 ID:2XjPPOkCd.net]
>>702はあほか
ただステップ関数だけやん

722 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 23:50:24.59 ID:2XjPPOkCd.net]
訂正
>>702はあほか
ただステップ関数かけるだけやん

723 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 23:52:33.17 ID:2XjPPOkCd.net]
>>702はうんこにも負けるお馬鹿さん

724 名前:デフォルトの名無しさん mailto:sage [2019/12/12(木) 23:58:44.94 ID:2XjPPOkCd.net]
>>702の方法を詳しく聞きたいです。
どのレベルのものが出てくるのかな?



725 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 00:03:20.51 ID:YzIzcvdhd.net]
>>698
>やり方は主に2通りある
一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?

聞きたいです。
どのくらい短いコードになりますか?

726 名前:690 mailto:sage [2019/12/13(金) 00:07:11.37 ID:ztjeN6RTD.net]
>>702
ありがとうございます。私が阿保でした…。色々と難しいことを考えていましたが、普通に分類問題における不均衡データの扱いと同じように考えれば良いのですね…。

727 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 00:10:21.56 ID:XxZjyVfOd.net]
>>698いわく方法は2つあるらしいけど、僕ちん一番始めに思い付かなかったな。長過ぎて。

728 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 00:21:47.33 ID:XxZjyVfOd.net]
>>698のどや顔のわりに出題者の意図を組んだ回答になってなくて笑うわ

729 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 00:28:36.82 ID:XxZjyVfOd.net]
>>699>>695

730 名前:始め四行を理解できましたか?

おそらく意図に沿った最適解ですよ?
[]
[ここ壊れてます]

731 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 00:52:32.77 ID:XxZjyVfOd.net]
ところでさ、>>690>>695の最後の一行だけで解決できたって認識はある?

732 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 08:26:43.93 ID:4f9XcAird.net]
>>710
ID変わっちゃってるけど

>>698は俺で、>>702で回答したつもり
そうそう不均衡データ知ってるなら話は早い。それと同じに考えればいいんじゃないかな

733 名前:デフォルトの名無しさん mailto:sage [2019/12/13(金) 08:47:13.93 ID:zOMzCfb1a.net]
オライリーのPythonによるデータ分析とデータサイエンスハンドブックってどっちがおすすめですかね?

734 名前:デフォルトの名無しさん [2019/12/13(金) 11:10:40.03 ID:V90d9jYdF.net]
前者



735 名前:デフォルトの名無しさん mailto:sage [2019/12/15(日) 11:25:39.35 ID:NsMHdX+Qd.net]
オライリー本の機械学習本大杉
俺にも初心者向けのお勧め教えてほすぃ
趣味でやる程度で、プログラムは問題なくて数学はソコソコ程度でやんす

736 名前:デフォルトの名無しさん [2019/12/15(日) 11:27:48.03 ID:qAhsyicK0.net]
どうせ無理

737 名前:デフォルトの名無しさん mailto:sage [2019/12/15(日) 16:36:37.82 ID:IJ9lyMvCr.net]
夢見る機械学習
夢見る深層学習

あたり

738 名前:デフォルトの名無しさん [2019/12/17(火) 17:57:23.97 ID:IOLSzPnMM.net]
neuripsは、にゅうりっぷす、でいいの?

739 名前:デフォルトの名無しさん mailto:sage [2019/12/17(火) 21:22:33.32 ID:TP04XND70.net]
夢見るって何だよw

740 名前:デフォルトの名無しさん mailto:sage [2019/12/18(水) 08:37:06.46 ID:AGv/bbi+0.net]
アンドロイドは電気羊の夢を見るか? フィリップKディック

741 名前:デフォルトの名無しさん mailto:sage [2019/12/19(木) 16:18:27.57 ID:687/ZJ6rM.net]
>>723
この板では常識みたいな本のタイトルだよな

742 名前:デフォルトの名無しさん [2019/12/19(木) 19:13:19.10 ID:7bTJNhmPM.net]
攻殻機動隊は?

743 名前: mailto:sage [2019/12/19(木) 20:08:23.64 ID:Gv7/QyPZ0.net]
>>725
アニメという時点でダメですね、紙の本を読みなよ

744 名前:デフォルトの名無しさん [2019/12/19(木) 20:36:41.48 ID:2pi3DA5F0.net]
コミックです。。。



745 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 12:35:04.23 ID:Ens8Pa2w0.net]
pythonの入門書を終えてtensorFlowとかkerasとか学びたいんだけど、
よい入門書教えろください。 orz

746 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 13:30:25.72 ID:AF24n/5l0.net]
>>728
いきなり深層学習フレームワーク触るより深層学習の基礎勉強しなさいよ
つ ゼロから始める〜

747 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 13:47:20.09 ID:QqTXpvNUM.net]
せんせー、pythonの文法知ってるだけの人がいきなりゼロからはじめるやって分かるんですかー

748 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 13:50:53.01 ID:AF24n/5l0.net]
tensorflow触ったって理屈何も分からんでしょ

749 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 14:19:38.73 ID:sLfMPx200.net]
tensorflowに触ってごらん、AIだよ

750 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 14:24:41.20 ID:Ens8Pa2w0.net]
>>729
説明不足でした。
ニューラルネットで修士号とってますが、
全然関係ない分野で働いてたので、
プログラムのリハビリ状態。

統計学と昔の機械学習は理解しているので、
新しいトピックと実際の動かし方を学びたい。

751 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 14:32:55.35 ID:fEmGBg4L0.net]
統計学は応用数学だが
機械学習に数学はいらない

752 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 14:38:25.43 ID:D2xqHNpK0.net]
>>734がイイ(・∀・)こといった!

753 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 14:54:20.51 ID:jKm3tCWya.net]
何をどう調べてどこまで身につければ十分なのかを自力で把握できなければダメ
何も知らない中学生・高校生ならまだしも、大学出た社会人が「何から学べばいいか?」とか聞くこと自体がアウト

754 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 15:02:08.75 ID:Ens8Pa2w0.net]
いや、Tensorflowの全体像を知るための定番の入門書を知りたかっただけなんですが・・・。



755 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 15:13:24.42 ID:MAO/zmGQ0.net]
>>733
「scikit-learnとTensorflowによる実践機械学習」などどう?

756 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 15:40:47.34 ID:tyzf2bxBa.net]
>>737
TensorFlow2.0やりたいなら本はほとんどない
これから2.0しか使わなくなるから今ある1.0の本を読むべきかと言うと微妙

757 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 15:55:54.03 ID:Ens8Pa2w0.net]
>>738
ありがとうございます。チェックしてみます。

758 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 15:58:04.45 ID:Ens8Pa2w0.net]
>>739
なるほど。
現在2.0を学ぶんなら洋書ということになるのでしょうか?
ひょっとして、洋書もまだ出てなくて、ネットで情報を漁るしかないのかな・・・。

759 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 16:15:13.33 ID:kqUBoQ4ga.net]
pytorch開発入門が良い

760 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 16:35:38.25 ID:Ens8Pa2w0.net]
>>742
pytorchなんてものもあるんですね・・・。

Scikit-learn
Tensorflow
dlib
PyTorch

どれから手をつけるのがいいんでしょう?

761 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 16:36:54.74 ID:Ens8Pa2w0.net]
修士のときはアルゴリズム系の研究をしていて、
あの頃は、みんな一からC言語でコード書いていたから、
完全に浦島太郎状態だなぁ。

762 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 18:28:11.78 ID:AF24n/5l0.net]
>>743
sklearnでいいんじゃない?
仕事内容にもよるけど

763 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 18:45:14.82 ID:Ens8Pa2w0.net]
>>745
入門書ではsklearn使ってましたね。
とりあえず直近の回帰分析とかレベルだとこれで十分なんですよね。

ただ、流行りのDeepLeariningとかも学んでみたいという欲が出ているのが抑えがたい。

764 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 21:16:41.90 ID:tA8JsD2t0.net]
使い物にならない頭の固い浦島太郎



765 名前:デフォルトの名無しさん mailto:sage [2019/12/22(日) 22:11:05.54 ID:Ens8Pa2w0.net]
ライブラリ比較サイトで勉強してきました。
直近のしごとはsklearnで事足りそうだし、
Deep Learningとかの勉強はPytorch使ってみようかと思います。
Tensorflow+Kerasも気になるけど、Tensorflow2.0の情報が出てから勉強したほうが、
効率良さそうな気がしてきました。

766 名前:デフォルトの名無しさん (ワッチョイ 139c-UWZo [61.125.210.189]) mailto:sage [2019/12/23(月) 00:31:24 ID:Aom+GboU0.net]
>>741
洋書もほとんどないと思うよ
公式のドキュメント読み込むのが良いと思う

767 名前:デフォルトの名無しさん (ワッチョイ 1302-4eo+ [27.81.114.231]) [2019/12/23(月) 01:08:38 ID:VfWxGDyD0.net]
修士持ってて5ちゃんで入門書の情報収集かよ
てかネタだよな?

768 名前:デフォルトの名無しさん [2019/12/23(月) 07:02:49.05 ID:C376Wcca0.net]
neural machine translationを試してるけど
ユーザー辞書を指定する方法が分からない

誰か教えて

769 名前:デフォルトの名無しさん [2019/12/23(月) 07:57:44.83 ID:OGRagDqQ0.net]
print('Hello World')

770 名前:デフォルトの名無しさん mailto:sage [2019/12/25(水) 20:19:54.82 ID:1fTZ/ZaM0.net]
>>748
普通にtensorflowやっとけ。
どうせ2.0でても1. 系統との違いみたいな説明しかされんから。

771 名前:デフォルトの名無しさん mailto:sage [2019/12/25(水) 20:56:16.29 ID:aaAP7ysf0.net]
やるならkerasがいいよ
モデル構築部分はほぼkerasと同じ感じに書けるようになった
1.0の計算グラフはユーザーから意識することはなくなったし
それを覚えても意味はないと思う

772 名前:デフォルトの名無しさん [2019/12/29(日) 10:57:12.10 ID:qpN3wIzL0.net]
NICTはなぜオープンソースで公開しないんだろう

MSやGoogleやFacebookはGitHubにアカウントを持っていて
研究成果を公開しているのに

NICTもそれらのオープンソースを利用しているくせに公開しない

773 名前:デフォルトの名無しさん [2019/12/29(日) 11:57:05.52 ID:qLN9wlkm0.net]
企業は収益を得る手段がほかにあるけど
研究機関は違うのも関係あるように思う

774 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 12:16:45.48 ID:ji21HRv6M.net]
NASAもジャンル違うけど公開してるし、税金投入してるなら国民に見せた方がいいはずだけど
日本の研究機関は遅れてるんかね
情報漏洩と公開範囲を定義して運用出来る頭脳はよ



775 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 13:53:29.86 ID:TN/x0Ru2a.net]
現代のIT企業は研究成果をオープンにすることで世界中からフィードバックを貰うことで超速で進化しているんだけど
日本の古典的大企業や研究機関は研究成果を隠すことで他と差別化できると思い込んでいる
GAFA躍進前の時代なら日本式もそれなりに良い方針だったかもしれないが
今の時代ならその隠した研究成果と同等かそれ以上のものがその内GAFAから生まれるだろうから無意味
研究機関がGAFAのようにオープンにした成果を利用した金儲けができないことが問題なのであれば
金儲けできるように日本のローカルルールを変更すればいいだけ

776 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 15:38:02.27 ID:Dx5kC0NRM.net]
研究機関はどうかは知らないけど少なくとも世界的に大学は公開してるしな

777 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 15:42:26.10 ID:ji21HRv6M.net]
横並びで公開しない暗黙のルールか忖度ありそうね
東大やら普通にイントラにgitlabサーバ建てたりしてた記憶
あの先生より上層部の意識がどうかやねえ

778 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 20:25:01.95 ID:by75XqYfM.net]
研究スピードがどうしても海外より劣るから、モノを公開しちゃうと置いてかれるんだよ。
日本の研究機関の風土の問題じゃなくて、研究以外もこなさなきゃいけない人達が合間を縫って研究するしかない
日本の科学技術に対する制度設計の問題。

779 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 20:42:28.27 ID:BQX6608C0.net]
国立の研究所が情報隠すのって
NHKが受信料で作った番組を子会社でDVDで商売してるようなもんだね

780 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 21:52:42.26 ID:rpIpsCsdM.net]
論文優先で手が廻らないってとこか
ソース公開も楽じゃないすな

781 名前:デフォルトの名無しさん mailto:sage [2019/12/29(日) 23:28:34.15 ID:XnQ2dClWa.net]
論文で十分に公開していると思うが
ソースも欲しいのか
テクニカルレポートが欲しいのか?

782 名前:デフォルトの名無しさん [2019/12/29(日) 23:56:49.13 ID:qpN3wIzL0.net]
実装公開するのが世界標準

783 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 00:20:35.01 ID:KJuDSflP0.net]
Pythonライブラリの公開とかね
日本も大学はしてるとこあるし

784 名前:デフォルトの名無しさん [2019/12/30(月) 12:19:39.72 ID:WAqdspciF.net]
>>762
国民の財産で私服を肥やすNHKはもっと悪質



785 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 12:43:25.39 ID:cr0/Lsx50.net]
公開出来るレベルのソース書けてるか、ライブラリ設計する能力があるか、も問題になりそうだけど、その辺も磨くと、ワイのような暇してる野良開発者もOSSなら協力出来るという特典はあるね
正直、研究系のITの仕事はパートタイムの30年前のサーバ管理みたいなのが多くて手伝えん

786 名前:デフォルトの名無しさん [2019/12/30(月) 13:41:37.17 ID:WAqdspciF.net]
>>768
ほんそれ
https://megalodon.jp/2019-1225-1001-08/https://qiita.com:443/unico/items/76499d1e20042d929aa1

787 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 15:40:35.39 ID:H7m/k27K0.net]
研究者なら本来ソースが見やすいかとか関係ないからなあ
大事なのは数式の理論だし
日本人はごちゃごちゃどうでもいいことでなんくせつけるし

788 名前:デフォルトの名無しさん [2019/12/30(月) 15:54:00.51 ID:iq/klXJD0.net]
古い日本人の陰湿さだよな結局

789 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 16:12:34.46 ID:EbY28/9f0.net]
もう日本は終わりだよ
どうしようもない

790 名前:デフォルトの名無しさん [2019/12/30(月) 16:21:10.72 ID:iq/klXJD0.net]
産総研、JST、NICT、理研あたりは実装公開しろ

791 名前:デフォルトの名無しさん [2019/12/30(月) 17:47:06.43 ID:hVGBluVVr.net]
>>770
んなこたーない
スパゲッティなコード書かれたら検証も追実験もやりにくくなる
機械学習の論文の再現性がないのは大きな問題になっている

792 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 17:47:44.68 ID:8pRHoXtUa.net]
研究報告の本質は再現性の有無を確認してもらうことだ
機械学習分野で言えば都合のいい学習データ、テストデータを使っていて実用上そんな状況あり得ないとか、ハイパーパラメータどう決めたのかとか疑おうと思えばいくらでも疑える点は出てくる
それを払拭する唯一の方法は実際に書いたソースそのものを出すこと
そのソースは最早論文の一部なのだから書いた人にしか分からない滅茶苦茶なものを公開して「公開したのだからこれでいいだろ」などというのはあり得ない

793 名前:デフォルトの名無しさん [2019/12/30(月) 17:58:08.77 ID:U5SCa4jH0.net]
>>775
ソースコード出しても他のデータでの
汎化誤差が小さいかどうか判らなくね?

794 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 18:04:19.52 ID:cr0/Lsx50.net]
STAP細胞はありまーす



795 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 19:15:55.84 ID:tmdGEa4Zd.net]
stap細胞はありました。

796 名前:デフォルトの名無しさん mailto:sage [2019/12/30(月) 22:05:07.58 ID:lxiCJ2Yf0.net]
企業もIT云々と言われた時代から金を掛けないし人を育てようともして無かったんで伸びないだろ
AIについてソフトバンクの孫が日本は遅れていると吠えてたけどまともな人材すら流れて来てないんじゃないか
企業にとっては若者をいかに騙して利益を吸い取るかっていう分野だろう
日本ではIT土方より土方の方が将来性ある

797 名前:デフォルトの名無しさん [2019/12/30(月) 23:34:55.91 ID:HsGQHO6z0.net]
stanとかPyMCって明らかに統計解析向きでシステムに組み込みづらいけど、
明らかにNNよりベイズの枠組みで変数間の関係を記述する方が優れているので、数学弱者でも自力でアルゴリズムを導出する事なく、kerasみたいにシステムに組み込めるようになる日は来るんだろうか。

798 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 03:09:29.79 ID:nxNHwLJH0.net]
研究者のコードは糞で見てられない。
R&D何年かやってたけど、もう関わりたくないなぁ

799 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 04:10:23.19 ID:RM1+Cid30.net]
人に読ませることは重要ではない。
読めない奴は置いていけばよい
確固たる結果が付属する理屈があること。それさえあれば自然と読む人が必ずいる。

800 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 05:43:20.17 ID:nxNHwLJH0.net]
情報系の研究はソースコード公開してても読むやつほぼいないよ
バグとかそのまんまで放置されてる
動くかどうかすら怪しいから研究の副産物触るのは嫌い

801 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 08:04:33.96 ID:NUJAOpc70.net]
動かなかったら研究を追試できないと文句を言えばいいし
ぐちゃぐちゃコードで動けば追試できるしリファクタリングもできる

802 名前:デフォルトの名無しさん [2019/12/31(火) 09:51:08.49 ID:rB5IKPkdr.net]
>>782
そして誰もいなくなった

803 名前:デフォルトの名無しさん [2019/12/31(火) 09:52:45.34 ID:rB5IKPkdr.net]
>>783

> 情報系の研究はソースコード公開してても読むやつほぼいないよ

どうやって調べたの

804 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 11:11:19.86 ID:9r6RBOcwM.net]
たしかに酷いコード見るなあ
1関数1ファイルで何百行もあってif
文が大半のとか
リファクタリングしてあげたいけど、作者が読めなくなりそうで躊躇



805 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 12:51:42.15 ID:cUwK5JbL0.net]
ソフトバンクの損って節税(脱税)と投資失敗で話題の人か

806 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 13:10:46.49 ID:K5ePzvxLa.net]
>>782
その真逆でとことん人に読んでもらう・理解してもらう環境を整えることを追求した結果が今の世界的IT企業の躍進に繋がっているんだけど

807 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 13:20:30.79 ID:RM1+Cid30.net]
読む奴は存在すると言ってるだけ。
有益ならばちゃんと拾う

808 名前:デフォルトの名無しさん [2019/12/31(火) 13:56:00.88 ID:NUJAOpc70.net]
日本の論文だけなんだよ実装がないのって
海外のは下の脚注にgithubで公開してるぜとある

809 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 15:39:29.45 ID:K5ePzvxLa.net]
機械学習分野なんて玉石混交の論文が日々大量に出回っているのに読みやすさを無視して「有益なら読む人はいるだろ」
という態度で書いたものを読んでもらえるのなんて既に実績上げているごく一部の人だけなんだよな

810 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 21:47:08.95 ID:+hXuYToDd.net]
くっだらないね
だから読むっての

811 名前:デフォルトの名無しさん mailto:sage [2019/12/31(火) 23:51:33.77 ID:a+xjNkxx0.net]
>>782
人が読めないのは100歩譲っても自分でも読めないとか言い出す馬鹿が多いからな。
それ根本的にソースが糞ってことだから。

812 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 00:51:57.38 ID:EAfwe2HZM.net]
論文読まないけどソース読むよ

813 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 03:50:18.57 ID:Bw/I0Y2Fa.net]
ソース公開しないのは発展性がない論文だからだよ
要は書き逃げ。そこから次々に論文が出てくるようなら
否応ざるにコードもちゃんと書かなければいけなくなる
それをしないということはその論文はゴミ、あるいは捏造

814 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 08:35:14.27 ID:2Yvb+gk50.net]
その判断は読者がするので
とにかく公開すればいい



815 名前:デフォルトの名無しさん [2020/01/01(水) 11:06:21.99 ID:2Yvb+gk50.net]
ハーバード大のテキストは公開されてる
https://drive.google.com/file/d/1VmkAAGOYCTORq1wxSQqy255qLJjTNvBI/view

816 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 12:49:32.22 ID:Bw/I0Y2Fa.net]
まず、ソース公開は、業績にならないからな
次に、公開しない論文は自らゴミと認めていることでもある
どうせ使う人はいないだろうという意味合いもある

817 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 13:02:33.72 ID:R7AcXQfB0.net]
ソースより醤油

818 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 15:35:59.56 ID:R/r7VkS4M.net]
論文書いてる人はソース公開されないと実行できないとかいうレベルの人向けに書いてるわけじゃないんだぞ

819 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 15:44:55.51 ID:EAfwe2HZM.net]
追試しやすくなるから、やましいことがないならソースも公開した方がモテると思うよ

820 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 16:00:02.58 ID:/oDzwe5Aa.net]
>>801
論文に書かれた内容だけで論文に示された結果を完全再現できるような論文なんてほぼ存在しないことを知らないのか
それをソースで示して完全再現できるようにしない限り捏造の誹りから逃れることはできない

821 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 16:09:55.17 ID:EAfwe2HZM.net]
せやせや

822 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 16:22:41.75 ID:kPvcajv80.net]
1行目と2行目の繋がりがよくわからない。
世の中のほとんどの論文は捏造が疑われているということ?

823 名前:デフォルトの名無しさん [2020/01/01(水) 16:47:20.30 ID:YftyIXIv0.net]
>>803
お前はバカなんだから黙ってろ

824 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 17:02:22.17 ID:AV+0j7FA0.net]
>>805
捏造とは言わんが、特定のデータにチューンして宝くじ効果で上手くいったよね
みたいな論文ばっかだと思われる。
MNIST、CIFER10でしか実験してない論文とかな。



825 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 17:17:44.38 ID:Q+lm5ndma.net]
>>805
公開情報のみから判断した人に捏造と疑われても仕方がないということ
>>801は「ソース公開されないと実行できないとかいうレベルの人向けに書いてるわけじゃない」と言っているが論文をいくら読み込んでも必要な全情報が含まれないことなどザラにあるのだから実行して確認したくてもできないことが多い
だったら最初からソース丸ごと公開しろよ、ということ
その方が無駄な

826 名前:疑いに基づく手探りの検証過程などすっ飛ばして早く自分の成果を認めてもらえるのだから []
[ここ壊れてます]

827 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 17:26:30.85 ID:kPvcajv80.net]
結果が疑わしかったり論拠があやふやな論文はさすがに査読で落とされていると信じたいが。
大半がそんな状態だというのが共通認識だとしたらいまごろもっと問題視されてないか?

828 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 17:50:51.23 ID:Bw/I0Y2Fa.net]
水面下では問題視されている
結果が良すぎたり、特定の国の人が書いた論文は
信用されない

829 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 18:22:02.12 ID:AV+0j7FA0.net]
>>809
だから普通に問題視されてるだろ。
blog.livedoor.jp/tak_tak0/archives/52421590.html

830 名前:デフォルトの名無しさん [2020/01/01(水) 19:32:55.99 ID:2Yvb+gk50.net]
だから日本は遅れてる
何とかしろよ

831 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 19:46:28.03 ID:kPvcajv80.net]
それが共通認識になっていたとしたらもっと大問題にされているだろうと言っている。

832 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 19:52:14.44 ID:AV+0j7FA0.net]
連日報道でもされん限り問題になってないとか思っちゃうバカ?
何をもって問題になってるなってないというかによるとしか言いようがない。
使ってなけりゃ社会的な問題にはならんだろうし。
少なくとも「まるっきり信じてやったら上手くいきませんでしたー俺は悪くありません」
とか言い出す奴は、自分の職場では大問題だわ。

833 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 20:34:27.25 ID:kPvcajv80.net]
「論文に書いてあることなんて信用できないからその通りにできなくても俺の責任じゃありません」
と言ってるのかと思ったが。

834 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 20:50:13.15 ID:W/LYnAl/0.net]
>>809
> 結果が疑わしかったり論拠があやふやな論文はさすがに査読で落とされていると信じたい
希望論でつねわかります

>>815
実験系だと
論文の結果そのものは
往々にしてミラクルなオリンピックレコード的な伺か
って暗黙の了解なんだけどぬ・・・



835 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 21:00:46.16 ID:AV+0j7FA0.net]
もう馬鹿は「再現性なんてなくても問題ない」と思ってりゃいいよ。
お前の中ではそれでも問題ないんだろう。

836 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 23:03:53.85 ID:VTgMf2Yt0.net]
実装が公開されてるけど、実行しても論文通りの結果が出ないとか普通にあるしなぁ
ソースが公開されてても査読者は暇じゃない限り実行せんしな

837 名前:デフォルトの名無しさん mailto:sage [2020/01/01(水) 23:48:05.60 ID:1biaYKqja.net]
さらにデータを開示してもらわなければならない
「このデータ・セットではうまくいった」
実はそのデータ・セット以外ではうまくいない
じゃあダメじゃん
よくある話だ

838 名前:デフォルトの名無しさん [2020/01/02(木) 07:41:44.81 ID:abNQ9/EA0.net]
まともな論文はオープンなデータを使うか
実験に使ったデータを公開してる

JST、産総研、NICT、理研、NTTあたりはこれらもやってない

839 名前:デフォルトの名無しさん mailto:sage [2020/01/02(木) 09:14:28.28 ID:tOCbQ3Wha.net]
オープンなデータを使っているけど
データを恣意的に選択して実験しているため
他の人がやっても再現できないというのも
よくあるパターン
別に日本だけではないが

840 名前:デフォルトの名無しさん mailto:sage [2020/01/02(木) 11:12:59.42 ID:VAl9vceh0.net]
データの選択によって再現性が失われているなら、抽出データが偏ってるし、
普通は検証段階で確認する

しかし、精度の高いモデル作りました→実践投入
で、新規データを食わせたら精度が右肩下がりって良くある光景

841 名前:デフォルトの名無しさん [2020/01/02(木) 14:08:56.51 ID:fRqsjLPxF.net]
>>812
箱根マラソンもビッグデータωで戦ってるそうだ
https://toyokeizai.net/articles/-/321510?page=3

842 名前:デフォルトの名無しさん [2020/01/02(木) 14:23:33.66 ID:CkITwvFM0.net]
>>822
よく言われる過学習になってると思う
過学習かそうでないかは未知データで訓練と同程度の性能が出るかどうか以外の判別方法ある?

843 名前:デフォルトの名無しさん mailto:sage [2020/01/02(木) 19:01:13.39 ID:GkTEMuMY0.net]
ない。あったらみんな飛びついてる。

844 名前:デフォルトの名無しさん mailto:sage [2020/01/02(木) 19:18:29.62 ID:GkTEMuMY0.net]
そういうわかりやすい汎化性能を表す指標ってものがあったら、それをロスに組み込めばいいわけだ。
だがそんな状況にはなってない。



845 名前:デフォルトの名無しさん mailto:sage [2020/01/02(木) 22:19:42.02 ID:KXPhUsay0.net]
希望の結果に成らなかった事柄全て、過学習と言ってしまうことのないように

846 名前:デフォルトの名無しさん [2020/01/02(木) 23:09:33.24 ID:abNQ9/EA0.net]
日本の研究期間は
本当の意味で研究に寄与してない

松尾豊あたりがちゃんと言わなきゃダメだろ

847 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 09:51:46.65 ID:JJK+Gv110.net]
そんな自分を全否定するようなこと言えないだろw

848 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 10:33:40.29 ID:dIGkMlOva.net]
PyTorchとTensorFlow - 学界と産業界で有力なMLフレームワークはどちらか
https://www.infoq.com/jp/news/2019/12/State-Machine-Learning-fw-2019

849 名前:デフォルトの名無しさん [2020/01/03(金) 11:57:25.32 ID:lHIykz7yF.net]
>>827
ほんそれ
日本の教育構造の欠陥だな

850 名前:デフォルトの名無しさん [2020/01/03(金) 15:30:23.04 ID:W71Q+2T/0.net]
>>831
主語デカ

851 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 16:10:33.70 ID:jtHjGBI50.net]
粗探し <<<< 欠点の解消の実行

852 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 17:04:32.60 ID:WpaKhE1wa.net]
過学習の判定は当然ながら一定数の推論結果を総合して行うわけで個別の推論結果が希望通りかどうかなんてことはそもそも眼中にない
>>827は過学習が何なのか、どうやって過学習か否か判定するのかすら理解していないのだろう

853 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 17:59:55.69 ID:gVRcdqQw0.net]
松尾豊にダメ元で意見を送ってみることにした
実装とデータをgithubで公開することを基本にしろ、と
そうしないと日本の研究は停滞したままだ、と

854 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 18:29:08.35 ID:6jkaCR+Q0.net]
>>835
松尾に送ってどうするよ



855 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 18:34:20.22 ID:b+HkQOrh0.net]
繰り返しますが、うまくいかなかった事柄を過学習とラベリングし、考えることを止めないように。
過学習って言葉は使用禁止にしたいぐらいですね

856 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 18:37:58.64 ID:b+HkQOrh0.net]
>>835
松尾って奴には何も期待してないから別にやらなくてよい

857 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 19:54:17.54 ID:hATKQL5q0.net]
線形代数とか難しいんだけど、ライブラリ使いこなすだけだとやっぱりしぬ?

858 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 21:15:55.83 ID:JJK+Gv110.net]
機械学習は置いといても線形代数は理解してた方が今後の人生のためにはなる。

859 名前:デフォルトの名無しさん mailto:sage [2020/01/03(金) 22:46:08.59 ID:kIdsqT260.net]
>>835
経産省と文部科学省に言うべきだが、
>>835が進言するより、松尾や落合が言った方が聞く耳を持って貰える

860 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 01:07:26.61 ID:+fj4YEmI0.net]
聞いてるふりをして聞き流してますよ

861 名前:デフォルトの名無しさん [2020/01/04(土) 08:10:20.67 ID:0FWfySRB0.net]
PFNの連中でもいいけど
日本のAIベンチャー(笑)から建設的な意見が出てこないのも悲しい

やっぱり山師なんだろう

862 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 10:56:49.96 ID:GvN9lrG00.net]
実装を公開するといっても、実装した人の特異な環境、設定で
やっているかもしれないし。次はそれをもっと標準的な環境で
公開しろということになってきりがないような気がするが

863 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 11:08:32.58 ID:uVSKRwzpM.net]
まずは米国並みに公開すればいい。問題が出てきたら他国でも問題になるだろうから皆で考えればいいさ

864 名前:デフォルトの名無しさん [2020/01/04(土) 11:41:58.28 ID:ENDwxYLV0.net]
公開するのってキリスト教的な考えなのかな
寄付みたいな

日本はどうも閉鎖的



865 名前:デフォルトの名無しさん [2020/01/04(土) 11:42:29.12 ID:j2BUy ]
[ここ壊れてます]

866 名前:Z6N0.net mailto: 複数のデータセットでエラー率を測定して
その母比率を区間推定して
下限値が要求するレベルを超えているかどうかで
そのモデルを採用するか否か判別する方法はどうか

エラー率を他の指標にしてもいいかもしれない
[]
[ここ壊れてます]

867 名前:デフォルトの名無しさん [2020/01/04(土) 11:43:40.22 ID:j2BUyZ6N0.net]
過学習しているモデルなら
エラー率の分散が大きくなると予想して
区間推定の区間が広くなって
下限値が下がると思う

868 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 11:56:52.06 ID:NL29rqkc0.net]
複数のデータセットをそんな簡単に用意できるわけないだろ。
クロスバリデーションからやり直し。

869 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 11:59:21.87 ID:uVSKRwzpM.net]
>>846
科学的なものではないか

材料系の実験論文は、材料と手順を書いても追試困難なものも多いそうな
計算機上で出来る実験はエビデンスとしてソースが使えるから、公開したら説得力が増して良いことばかり

870 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 12:19:30.68 ID:NL29rqkc0.net]
問題は説得力と信頼性を得ても金にならんてことだけどね。

871 名前:デフォルトの名無しさん [2020/01/04(土) 12:31:23.41 ID:trUJS7QSF.net]
線形代数が難しいって言ってる人に聴きたいんだが
具体的にどの辺で詰まってるの?

872 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 12:33:42.39 ID:n3QqNFMv0.net]
論文の説得力が増しても給料上がったりに繋がらないなら、研究者の評価の仕方が違うんかね
お役所はどこを見てるのか

873 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 13:01:13.27 ID:Eq0fd+t90.net]
随伴行列とか

874 名前:デフォルトの名無しさん [2020/01/04(土) 13:12:18.47 ID:lipfO/3va.net]
>>844
イメージも一緒に公開するまでだ



875 名前:デフォルトの名無しさん [2020/01/04(土) 13:20:23.20 ID:j2BUyZ6N0.net]
>>849
訓練に必要なデータ数はどの程度か目安を計算する式ある?
テスト用ならそれよりもっと少なくていいんじゃね?

876 名前:デフォルトの名無しさん [2020/01/04(土) 14:13:41.19 ID:CQ4m6M+L0.net]
教育やってるけど難しいと言ってる人は大抵固有値問題で引っかかる

877 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 14:39:53.48 ID:eKUy87rqa.net]
固有値で引っかかり
ジョルダン標準形で完全挫折

878 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 15:16:22.42 ID:zJPV7nPe0.net]
固有値では引っかからんだろ、ジョルダン標準形なら分かるが

879 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 16:07:21.47 ID:+gXTwHr30.net]
線形代数は大抵の大学の講義がひたすら定理の証明をなぞるだけで何のためにやってるのか説明しないからいつしか付いていく気が失せるのが問題

880 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 16:55:02.67 ID:dVmT9Zd40.net]
>>853
何本かいたか&何回発表したか しかかぞえてないぉ
だから
プレデター(ハゲタカ)ジャーナルとかプレデターカンファレーションがわらわらわー

881 名前:デフォルトの名無しさん [2020/01/04(土) 17:12:16.04 ID:0FWfySRB0.net]
じゃなくて
研究者としての矜持くらい持てよ

882 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 17:15:40.43 ID:dVmT9Zd40.net]
矜持と予算がケンカする現状なのー

883 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 17:58:28.14 ID:UI0ynszPa.net]
正当な評価を受けたいまともな研究者は海外へ出ていくだけ

884 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:20:25.08 ID:mrNm0sQkF.net]
ロジック/ロジカルシンキング/論理的思考と一般的に呼ばれるもので物事を解決しようとすると、基本的な問題解決のための方法は
帰納法によるアプローチ
演繹法によるアプローチ

この二つの何れかのアプローチに分けられる。



885 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:24:33.17 ID:mrNm0sQkF.net]
前者は、これまでの実績/経験則を元に一般法則を推定しようとするアプローチである。

一方後者は、確固たる前提/原理原則/一般規格から、確固たる結論を得る方法である。

886 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:27:21.07 ID:mrNm0sQkF.net]
例えば、ハイパーパラメータを弄って一定の

887 名前:効果・傾向を掴み、それを元に上手くいった/いかないを結論付けようとするのは帰納法による推論である []
[ここ壊れてます]

888 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:33:21.25 ID:mrNm0sQkF.net]
他方、小学1年の算数の例であるが…

1+1は2である。

これは、小学生1年生であろうが学校の先生であろうが、会社の社長であろうが一国の首相であろうが同じ答えを答えるだろう。

889 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:34:05.47 ID:iP+F2XtLM.net]
>>861
引用数も評価されると思ってた
引用稼ぐにはソース公開はいいと思うけどなあ

890 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:37:44.95 ID:mrNm0sQkF.net]
ただし、
数字を十進法ではなく二進法で表せば1+1=10である。

他に、
1+1の『+』の加算の定義を『×』乗算の定義と入れ換えれば1+1=1である。

あるいは、
2という数字の定義を5と入れ換えれば1+1=5である。

891 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:39:43.23 ID:mrNm0sQkF.net]
加算の定義、数字の定義、数の定義を全て正しいものと仮定して始めて1+1は2となる。

892 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:41:39.97 ID:mrNm0sQkF.net]
ここの人は是非、自分のやっていることが前者で進めているのか、後者で進めていることなのか、よく考えてほしい

893 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:47:32.97 ID:mrNm0sQkF.net]
帰納法で得られた結果はあくまでも推定の域を出ない。

例え10回やって10回ともいい結果が出たとしても11回目に100%よい結果が出るかどうかは保証はない。

894 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 19:50:57.56 ID:mrNm0sQkF.net]
他方、演繹法は絶対的・普遍的な解を得ることができる。

これは非常に強烈なロジックなのだが、残念ながら日本ではこのアプローチを重視する人材が非常に少ない、というかいない



895 名前:デフォルトの名無しさん [2020/01/04(土) 19:52:14.75 ID:CQ4m6M+L0.net]
公衆無線LANで何寒いこと書いてるねん

896 名前:デフォルトの名無しさん [2020/01/04(土) 20:19:20.64 ID:ENDwxYLV0.net]
ねー
文系出身のワナビーだろう

直感はどちらに分類されるのだろうね

897 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 20:27:40.67 ID:dVmT9Zd40.net]
>>869
そういえばそんなのもあったが
だいたいはお友達w同士で相互に引用しあって一蓮托生というね もうね

898 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 20:43:29.49 ID:m+tPynmQ0.net]
>>876
帰納法

899 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 20:52:46.32 ID:YBqf4hfGa.net]
日本での研究者の評価というと、真っ先に思い浮かぶのが科研費
過去の論文の数を基に、今後の計画を立てて予算申請する
一応審査しているのは専門家
専門性の高い論文を書いているかどうかが評価の基準
情報公開は・・・評価されるのかな?
そういうのを書く項目がないような気がする

900 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 21:56:53.64 ID:xLbjEwkrM.net]
君たちG検定はとるの?

901 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:06:24.08 ID:NL29rqkc0.net]
>>856
そんなものはない。
あってもVC次元使った奴とかバウンドが実際のデータ数よりも圧倒的に多いものしか計算できなくて
全く使い物にならん。
テストデータのサンプル数も何回か試して精度が安定する個数に設定するってのが現状。

この仕事、やってない奴ほど理論でなんとかなると思ってんだよな。
そこが実際とのギャップになってめんどくさい議論を増やしてる。

902 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:16:11.54 ID:Eq0fd+t90.net]
相対性理論は帰納法で導かれたよ

903 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:31:38.39 ID:m+tPynmQ0.net]
相対性理論は
仮説推定⇒演繹法による検証⇒ローレンツ変換不変の前提のもとで100%正しい

904 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:34:59.55 ID:m+tPynmQ0.net]
仮説推定の検証が実験のみか理論かで分かれる



905 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:36:39.92 ID:m+tPynmQ0.net]
>>881
それはお前及びお前が出会ってきた人間がヘボいだけ

906 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:39:40.66 ID:NL29rqkc0.net]
>>885
そうだな。お前みたいなヘボイ奴ばっか相手にしてる。

907 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:41:53.90 ID:Eq0fd+t90.net]
例えば一般相対性理論は慣性質量と重力質量は等価である等の
小さな原理から大きな理論を構築した帰納的思考によるもの

908 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:45:01.46 ID:m+tPynmQ0.net]
だから仮説推定の後すぐに演繹法による検証をやってるのがアインシュタイン

909 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 22:46:21.57 ID:m+tPynmQ0.net]
実験やってないんだよ

910 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 23:11:36.37 ID:Eq0fd+t90.net]
実験したとかしないとか関係ないし

911 名前:デフォルトの名無しさん mailto:sage [2020/01/04(土) 23:15:56.70 ID:m+tPynmQ0.net]
??

912 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 06:22:18.52 ID:+jir1/5X0.net]
自然言語処理のツールの使い方を覚えたいんですが
具体例のあるブログ記事ってないでしょうか

keras とか ALBERT とか tensorflow とかでてくるんですが
どれもインストール方法とかの説明はあるんですが
はじめからセットしてあるモデルに対して精度を出力して終わりみたいなブログ記事ばかりで
実際に日本語で質問文を投げてAIが返答するようなプログラムの書き方みたいなのが一切出てこないです

どうやって勉強すればいいんでしょうか

情報系の大学院生でプログラムはそこそこ経験があるんですが
AIに関しては原理を講義でならっただけでtensorflow すら使ったことがないレベルです
もうじき就活がはじまるのでAIが使えるってだけで有利になるらしいので
サンプルシステムを作ってみたいと思ってます

913 名前:デフォルトの名無しさん [2020/01/05(日) 06:28:31.48 ID:kv6ApXZt0.net]
それは世間的には基礎的かもしれないが
現行のAIはそこまで対応してないだろ
文書の内容を機械が理解するのは高度
とりあえず日本→英語の翻訳を実装してみれば手がかり、オリジナリティを得られるのでは?
一般的な、唯一の手法はないという前提だが、じぶんがしらないだけかもしれないが

914 名前:デフォルトの名無しさん [2020/01/05(日) 06:35:30.27 ID:kv6ApXZt0.net]
2019/08/19 05:01
AI翻訳が人間超え、言葉の壁崩壊へ
1人に1台、自動翻訳機、多言語“通訳”がポケットに
第1部:市場動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00001/



2019/08/20 05:02
AI翻訳が人間超え、言葉の壁崩壊へ
トランスフォーマー時代到来、翻訳技術から汎用言語系AIに
第2部:技術動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00002/



915 名前:デフォルトの名無しさん [2020/01/05(日) 06:41:07.68 ID:kv6ApXZt0.net]
総務省・NICT主催「多言語音声翻訳アイデアコンテスト」(第2回)優秀賞決定!
多言語音声翻訳コンテスト運営事務局 2019年12月19日

総務省と国立研究開発法人情報通信研究機構(NICT)は、12月14日(土)TEPIAホールにて、
多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速するため、
世界の「言葉の壁」をなくす新しいアイデアを募集する「多言語音声翻訳アイデアコンテスト」(第2回)審査会及び表彰式を開催いたしました。
https://prtimes.jp/main/html/rd/p/000000002.000050519.html

916 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 06:55:10.09 ID:24cr/O3JM.net]
機械学習だと固有値って教本にやたら出てくるけど具体的にどこで使うの?主成分分析だけ?

917 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 07:05:39.44 ID:+jir1/5X0.net]
>>893
ツールを使うだけではBOT同志で会話するっていうのは無理で
かなり高度なチューニングの知識?がいるってことなんでしょうか

ライブラリに適当な文章大量に流し込めば勝手に知識獲得してしゃべりだすものかと思ってました

918 名前:デフォルトの名無しさん [2020/01/05(日) 07:15:11.42 ID:kv6ApXZt0.net]
人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日

人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。

NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。

しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。

不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。

そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。

https://pc.watch.impress.co.jp/docs/news/1219388.html

919 名前:デフォルトの名無しさん [2020/01/05(日) 13:14:15.07 ID:5vFDsLtv0.net]
>>881
ないならつくるのが研究者の課題じゃ無いのかな?

920 名前:デフォルトの名無しさん [2020/01/05(日) 13:16:19.91 ID:5vFDsLtv0.net]
科学って帰納的に仮説を立てて実証することの繰り返しじゃね?
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う

921 名前:デフォルトの名無しさん [2020/01/05(日) 13:17:44.79 ID:5vFDsLtv0.net]
>>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している

922 名前:デフォルトの名無しさん [2020/01/05(日) 13:19:41.39 ID:5vFDsLtv0.net]
>>890
あなたはそうかもしれないけど世の中的には
実験で確認されて初めてノーベル賞もらったりしてるけどな
ヒッグス粒子もそうだったし

923 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 13:31:19.77 ID:98+Qbn7z0.net]
マウント合戦

924 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 13:34:07.84 ID:/FsL/PEZM.net]
物理は実験が主だよ
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想



925 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 13:41:29.59 ID:98+Qbn7z0.net]
イタチ野郎

926 名前:デフォルトの名無しさん [2020/01/05(日) 14:55:53.83 ID:5vFDsLtv0.net]
>>904
湯川博士とか理論物理で進展した領域もあると思う
実験で確認されないとただの仮説だけど

927 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 15:01:35.73 ID:Xx30ZH0k0.net]
>>897
(ヾノ・∀・`)ナイナイ

大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。

928 名前:デフォルトの名無しさん [2020/01/05(日) 15:38:21.14 ID:rjC1FbEm0.net]
ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。

929 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 17:38:18.20 ID:qqN6BGPlM.net]
>>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ

930 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 17:57:18.05 ID:ZpTtXk4N0.net]
>>909
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ

931 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 18:08:53.21 ID:qL+E1kAs0.net]
実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。

たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。

○-○aveなんかはその最たる例ですね

932 名前:デフォルトの名無しさん [2020/01/05(日) 19:11:04.25 ID:aadHI+RPa.net]
アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど

ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな

933 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 19:22:52.95 ID:qL+E1kAs0.net]
>アニーリング方式は100%最適解が求まる類のものではないんじゃないの?

そのとおり。量子アニーリングで得た結果は最適解である保証はありません。

結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。

934 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 19:24:37.61 ID:qL+E1kAs0.net]
https://www.itmedia.co.jp/news/spv/1906/03/news033.html



935 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 19:43:23.83 ID:6gmeklwC0.net]
全くすれ違いだし
そもそもお前ら実験も理論もどっちもやってねーだろ。。

936 名前:デフォルトの名無しさん [2020/01/05(日) 20:06:43.95 ID:5vFDsLtv0.net]
組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね?

937 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 20:07:51.30 ID:y5M6+8m0d.net]
元々の話題の一例を語ってるだけに見えますが…

>>915は帰納法・演繹法何れで仕事をされているかたですか?

938 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 20:08:34.48 ID:y5M6+8m0d.net]
>>916
それ以上はスレ違いですね

939 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 20:49:34.82 ID:6gmeklwC0.net]
>>916
そっちのが難しいっつーの。
>>917
両方だよ。どっちかだけで仕事になると思ってのかおめでてーな。

940 名前:デフォルトの名無しさん mailto:sage [2020/01/05(日) 21:17:01.17 ID:+jir1/5X0.net]
>>907
ありがとうございます!

941 名前:デフォルトの名無しさん [2020/01/06(月) 06:54:23.54 ID:KyZp9b9y0.net]
いよいよ人間超え、AI最新事情 文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13

文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長

かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。

グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。

言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。

文章読解のスコアで人間超え

具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。

SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。

https://tech.nikkeibp.co.jp/atcl/nxt/column/18/01056/111200002/

942 名前:デフォルトの名無しさん [2020/01/06(月) 16:22:20.03 ID:7M4Z0nKv0.net]
この手のテストに和文が無いからいまいちよくわからん

943 名前:デフォルトの名無しさん [2020/01/06(月) 19:21:10.07 ID:SSsR6M4H0.net]
MSRの連中が描いた本(pdf)だってさ

Foundations of Data Science
https://www.cs.cornell.edu/jeh/book.pdf

日本の研究者はなーんもしない

944 名前:デフォルトの名無しさん [2020/01/07(火) 15:50:31.93 ID:2Dq0zKSWF.net]
>>868
1 + 1 は 2 にはならんよ
大抵の場合 2 未満で 1.5 とか 1.0 とか
酷い時には 1 未満になることの方が多い



945 名前:デフォルトの名無しさん [2020/01/07(火) 16:00:42.05 ID:8esPW0SX0.net]
>>908
<・∇・>ニダ

946 名前:デフォルトの名無しさん mailto:sage [2020/01/08(水) 03:38:16.27 ID:LHUjt0c20.net]
>>924>>870-871を嫁

947 名前:デフォルトの名無しさん mailto:sage [2020/01/08(水) 04:04:04.17 ID:LHUjt0c20.net]
>>908
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る

948 名前:デフォルトの名無しさん mailto:sage [2020/01/08(水) 10:16:28.43 ID:XvkUwLSh0.net]
イタチの屁

949 名前:デフォルトの名無しさん [2020/01/09(木) 11:42:39.35 ID:0RBXSUPhF.net]
https://hayabusa9.5ch.net/test/read.cgi/news/1578536733/
NVIDIA製GPUドライバーに深刻な脆弱性、いますぐIntelオンボード

950 名前:利用に切り替えてください []
[ここ壊れてます]

951 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 00:41:45.45 ID:xMwSVvEb0.net]
https://youtu.be/fK_JGVti5y8

952 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 02:20:32.44 ID:xMwSVvEb0.net]
まあ、学生さんはデータナンちゃらリストなんてうつつ抜かしてないで、各専門の基礎教科の習得に励みましょう。

機械学習なんてあくまで多数ある問題解決手段の1ツールに過ぎない。そもそも機械学習の習得なんて社会人からでも十分。

953 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 08:00:59.46 ID:MP8EZybiM.net]
excelくらいのもんだね

954 名前:デフォルトの名無しさん [2020/01/10(金) 11:21:21.64 ID:dy6nGdDz0.net]
数年後には無くなってそう>>データサイエンティスト



955 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 11:33:30.82 ID:MP8EZybiM.net]
業務の一部として取り込まれる未来

956 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 12:28:08.40 ID:9hvTdV+ca.net]
データを元に業務上の判断をするのがデータサイエンティストの仕事
これは技術者にとって本質的な能力なのでデータサイエンティストという呼び名が無くなったとしてもこの能力を必要としなくなるわけではない

957 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 12:31:18.21 ID:MP8EZybiM.net]
データを元に判断するのは、豊臣秀吉もやってたそうだから今更感

958 名前:デフォルトの名無しさん [2020/01/10(金) 12:35:48.58 ID:K/lWprnk0.net]
秀吉はデータサイエンティスト。

959 名前:デフォルトの名無しさん [2020/01/10(金) 12:47:28.71 ID:ap2klRr+a.net]
技術者にはもともとデータサイエンティスト的な要素があったのに、それだけが妙に持ち上げられた
そのうち、訳もわからずデータをライブラリにぶち込むだけの人をデータサイエンティストと蔑むことになるよ

960 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 13:15:10.43 ID:W4/veIGi0.net]
データサイエンティスト的なタスクって、
業務に携わってる奴がやるのが世界の普通のような

システム屋にやらせるから応用範囲が限定される

961 名前:デフォルトの名無しさん [2020/01/10(金) 14:59:12.98 ID:jdArXowMM.net]
マクロかexcelにツールがついて終わり

962 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 16:48:37.09 ID:3HDQydXj0.net]
若手の自称データサイエンティストと話すと
linuxわかりませんとか言う人マジで多くて嫌になる
どこがのスクール出身なのか?
クラウドのjupyter notebook上でしかコード書いたことないらしい
マジで基礎がガバガバ
そこを身につけるのは地味で退屈だから最近の人はやりたがらないのはわかるが

963 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 16:53:19.80 ID:XoWOAf9+0.net]
ツールの話でマウントとろうとすると僕は馬鹿ですって自己紹介してるのと同じだからやめた方が良いよ

964 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 16:54:28.69 ID:iWyShsMIH.net]
エクセルで完結はさすがにない



965 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:00:34.97 ID:MP8EZybiM.net]
分析から先の仕事メインならlinux知らなくてもいいかなと
技術者でなく、ただのビジネスマンだと思うが

966 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:03:43.90 ID:apRS/vPU6.net]
リモートサーバにコード投げて動かすときくらいしかまともにlinuxコマンド使わんわ
vscodeで開発してるからvimも最低限しか使えない

967 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:03:57.42 ID:6tzIS8Z40.net]
自前で動かそうとしたらLinuxはあったほうがいいよ

968 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:34:07.53 ID:1UGZVEFGd.net]
>>941
プロダクションで動かすコードにするまでにすごい苦労しそうだな
(自称)データサイエンティストとSI屋の間に、もう一人両方の分野を知ってる人間がいないと無理そう

969 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:39:06.54 ID:o1aiizUGM.net]
データサイエンス系の仕事手伝ってるけどSI屋が分析より下のレイヤーやるようになりそうな雰囲気
ETLとかの延長で出来るところまで

970 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:43:26.30 ID:3HDQydXj0.net]
>>947
ウチはジョブキュー使ってコマンドで投げるから
最低でも一連の学習処理をシェル化して
入力ファイルを配置してサブミットするというのができないと詰むんだけど
大したことではないはずなのにわかりませんとかさあ

971 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 17:47:52.64 ID:o1aiizUGM.net]
kaggleみたいなUIにしとけばいいんかな

972 名前:デフォルトの名無しさん [2020/01/10(金) 19:00:13.93 ID:jdArXowMM.net]
msの技術力を侮ってはいけない
いずれexcelに付くよ

973 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 19:03:54.70 ID:iWyShsMIH.net]
そら小規模データならエクセルでも可だろうけど
ちょっと大きいデータ扱うと重たくてどうしようもないしょ

974 名前:デフォルトの名無しさん [2020/01/10(金) 19:16:19.21 ID:9TebhQDM0.net]
>>943
少し前にexcelのマクロ言語にPythonを採用するとか言う噂が上がってたけどな
今はその話は無くなってPythonからexcelを操作してくれってことになってると思う



975 名前:デフォルトの名無しさん [2020/01/10(金) 19:19:06.71 ID:9TebhQDM0.net]
>>949
社内ルール的なものはマニュアル作れば解決する問題だと思うけど
その判らない人に作るように言って判らないところは仮で書いてもらって訂正すればいいのでは?

976 名前:デフォルトの名無しさん [2020/01/10(金) 19:20:16.63 ID:9TebhQDM0.net]
>>952
表示の更新とか完了するまで再計算を停止するとスピード上がる

977 名前:デフォルトの名無しさん [2020/01/10(金) 19:22:21.42 ID:9TebhQDM0.net]
ピボットテーブルとかはexcelの方が作業効率良くない?
GUIで操作できるし

978 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 19:41:25.05 ID:iWyShsMIH.net]
議論するつもりはないけど、前処理やらバッチ処理するのもエクセルでやるんかな

979 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 19:45:47.30 ID:OuRZpUf20.net]
VBAで数値積分する人もいるから、ありえる
jupyterの人も増えそうだけど

980 名前:デフォルトの名無しさん [2020/01/10(金) 19:55:10.38 ID:hc3qGoBHa.net]
>>933
誰でもタイピングする様になってタイピストが居なくなったように、データサイエンティストもなるかもね

981 名前:デフォルトの名無しさん mailto:sage [2020/01/10(金) 20:00:51.64 ID:gdjTauNe0.net]
>>941
jupyter使いは信用するなってのがこの業界の鉄則だぞ。

982 名前:デフォルトの名無しさん [2020/01/10(金) 20:24:48.47 ID:eyebCCoV0.net]
filemakerとかkintoneの流れでexcellって消えていくのかと思ってた。
pythonも使えるようになってるっぽいし、pandasとかRとGUIが融合したみたいになっていくのか。

983 名前:デフォルトの名無しさん [2020/01/11(土) 01:41:29.68 ID:r5wulSj/0.net]
Linux板でよくExcel対スパコンみたいな話してるけどな。
Excelはスパコンより性能が低いからもうWindows使わないみたいな。

984 名前:デフォルトの名無しさん mailto:sage [2020/01/11(土) 11:21:35.22 ID:R+Z8VLSZM.net]
スコップとショベルカーみたいな関係かね。
自分は重機好き?だからWindows使いたくないんだけど、仕事ではWindows上でVirtualBox動かしてlinux+dockerしてる。
退勤時間はexcelで集計したりしてる
適材適所やね



985 名前:デフォルトの名無しさん mailto:sage [2020/01/11(土) 11:41:24.42 ID:vkWme/+ta.net]
Excelはあくまでデータとビューが同時に確認できることがメリット
明らかに一画面に収まらないぐらい大量のデータや大量のグラフが必要になるものをExcelで処理している時点で使い道を誤っている
一画面に収まらないなら素直にデータとビューを分離できる仕組みで処理すべき

986 名前:デフォルトの名無しさん mailto:sage [2020/01/11(土) 11:45:43.40 ID:ucFJPBVI0.net]
excel使うくらいならmatlab使う

987 名前:デフォルトの名無しさん mailto:sage [2020/01/11(土) 12:35:50.32 ID:WuYSTrVT0.net]
>>962
テラワロスwwwwwwww

988 名前:デフォルトの名無しさん mailto:sage [2020/01/11(土) 20:57:36.20 ID:H7kAoHn50.net]
https://i.imgur.com/XGU2tNI.jpg

989 名前:デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78]) [2020/01/12(日) 03:23:49 ID:gh55rPFY0.net]
>>965
そんで、最終的に
Excelでレポートにする

単に、適材適所と思わん?

990 名前:デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78]) [2020/01/12(日) 03:26:42 ID:gh55rPFY0.net]
ライブラリ使わずに自分でAIプログラム書きました
といわれても、プログラムが信用できへんで

991 名前:デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97]) [2020/01/12(日) 04:33:11 ID:Uj5X0q1W0.net]
Excelのシートは業務のノウハウそのものなので、使われてきたシートのせいでシステム化が出来ないというのなら、インテグレータとして失格だと思うというか、普段なんでお金貰えてるの?と不思議に思う。
OAと言ってた頃はまさに詐欺で飯食ってたけど。
いま同じことしたら普通に詐欺で訴えられると思う。

992 名前:デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222]) [2020/01/13(月) 00:58:09 ID:HVnwH/nI0.net]
≪株式会社学情 調査≫
『2020年卒 就職人気企業ランキング【速報】』
service.gakujo.ne.jp/files/7415/5374/1191/2020_ranking.pdf

IT・ソフトウェアの最上位
26位 アマゾンジャパン

AIとか若い奴は興味ないんだろうな

993 名前:デフォルトの名無しさん (アウアウカー Sa61-xSig [182.251.149.138]) mailto:sage [2020/01/13(月) 01:05:12 ID:bgtYO71Ta.net]
日本企業の技術系なら理系であれば何学部出身でも採用の可能性があるが
GAFAみたいな外資だと情報系で修士か博士取っていないと門前払いだからそもそも応募資格のある人数が圧倒的に少ないので仕方がない

994 名前:デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222]) [2020/01/13(月) 01:08:04 ID:HVnwH/nI0.net]
>>970
まー日産っていう大きい会社のカリスマ経営者と言われている英雄ですら
ペテン師みたいなもんだからな
大量に解雇して金をこっそり奪い取るんだ!ぐらいの気持ちが無いと
金持ちにはなれんぞ



995 名前:デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222]) [2020/01/13(月) 01:21:36 ID:HVnwH/nI0.net]
>>972
日本企業の IT・ソフトウェアで人気なのは52位のSkyだな
次が54位の楽天
次が99位のLINE

996 名前:デフォルトの名無しさん (ワッチョイ 6501-tgR8 [126.25.131.86]) mailto:sage [2020/01/13(月) 01:55:13 ID:xcD2sz0v0.net]
20年前のgoogle考えたら、今はちっこいベンチャーなとこ(日本じゃなくて)行かんとダメなんじゃねーの?

997 名前:デフォルトの名無しさん (ワッチョイ 239c-fZro [61.125.210.189]) mailto:sage [2020/01/13(月) 04:39:22 ID:AqVlGfb/0.net]
若いのになんでこんな保守的なんだろうなw
金儲けしたい訳でもなさそうだし
おじさん世代からすると今の若い奴なんていくらでも
多様な道があると思うのだが

998 名前:デフォルトの名無しさん [2020/01/13(月) 07:31:56.91 ID:8RyNzpcha.net]
>>975
Arayaは?

999 名前:デフォルトの名無しさん [2020/01/13(月) 07:35:28.69 ID:8RyNzpcha.net]
>>972
イオヌッツは修士出てなかったが。
ちなみにイオヌッツは断った。

1000 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 12:15:52.60 ID:XVZ9a4MGa.net]
>>975
アメリカだと本当に優秀な人はとっとと起業する
GAFAみたいな既に出来上がった大企業に行くのは起業できるだけの能力とアイデアが無かった二流という感じ

1001 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 12:21:17.18 ID:pLOO1PDzM.net]
東大卒でGAFA行くの勿体ないよね
すぐ辞めて起業するならいいけど
昔官僚、今GAFAで、ノーベル賞少ないところを見ると目先の金に計算高いという特性が透けて見える

1002 名前:デフォルトの名無しさん [2020/01/13(月) 12:35:20.31 ID:uorRSC+xa.net]
ノーベル賞にCS分野はないぞ
チューリング賞ならGAFAから出てるじゃないか

1003 名前:デフォルトの名無しさん [2020/01/13(月) 12:38:02.23 ID:uorRSC+xa.net]
むしろGAFAは目先の金に囚われずに基礎研究にもかなり注力している印象だが

1004 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 12:54:31.24 ID:pLOO1PDzM.net]
東大卒で研究するためにGAFA行くって人増えてるか



1005 名前:
それならそれでいいんだけど、研究より金を優先させてる人が多い印象だったのよね
[]
[ここ壊れてます]

1006 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 12:59:26.89 ID:L7OG7ykaa.net]
>>983
GAFAですら結果出してのは一握りの人だけだから
日本の企業と人材では到底無理だろうね
一昔前は日本のメーカーがそういうことして
結果も出てたのになあ

1007 名前:デフォルトの名無しさん [2020/01/13(月) 13:48:22.96 ID:HVnwH/nI0.net]
>>976
頭が良くなったんじゃないか?
使い捨ての知識を植え付けられ会社の為
一時の利益に貢献させられるより
食いっぱぐれない食品関係に長く居た方がいいっていう
起業と言っても大半は失敗する訳で
その中の本当にごく僅かな人が運的要素により成功しているが
そんな割にも合わないものにチャレンジするより安定して長く居られる会社に就職した方がいいっていう

1008 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 14:12:17.54 ID:qe5f7iwkd.net]
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

1009 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 14:17:46.68 ID:6kghygIo0.net]
>>986
たておつ

1010 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 16:00:18.20 ID:NQckQZya0.net]
>>972
Googleは学歴不問になったはず

入社テストが上手く出来てりゃ、最終学歴で振り分ける必要が無いので、新しい主流

1011 名前:蟻人間 mailto:sage [2020/01/13(月) 16:31:01.42 ID:9nwjRJNrd.net]
次スレッドが重複してるぞ

1012 名前:デフォルトの名無しさん mailto:age [2020/01/13(月) 17:01:53.06 ID:6kghygIo0.net]
誘導かかってない↓こっちのスレのほうがほんのちょっとだけ先にたってるな
【統計分析】機械学習・データマイニング27
mevius.5ch.net/test/read.cgi/tech/1578890891/

1013 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 17:44:13.38 ID:QmCTZYcld.net]
そもそもワッチョイぐらいつけろよ

1014 名前:蟻人間 mailto:sage [2020/01/13(月) 18:58:02.41 ID:xgMgrp400.net]
どっちのスレを使うか決めて



1015 名前:デフォルトの名無しさん mailto:age [2020/01/13(月) 19:26:49.09 ID:6kghygIo0.net]
>>991なるほど990はスレ設定失敗してる不良品なんだな。

じゃあみんな↓を使おうぜ
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

1578890891のほうは、ノーレス放置で落とそう。

1016 名前:蟻人間 mailto:sage [2020/01/13(月) 20:27:06.16 ID:9nwjRJNrd.net]
賛成多数。よって本法案を可決致しました。

1017 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:36:48.83 ID:l7upyLYs0.net]
民主主義を無視している、横暴だ(笑)

1018 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:41:25.06 ID:QmCTZYcld.net]
よしなに

1019 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:41:56.67 ID:QmCTZYcld.net]
あぽーん

1020 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:42:26.27 ID:QmCTZYcld.net]
SQL

1021 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:43:03.73 ID:QmCTZYcld.net]
ldl

1022 名前:デフォルトの名無しさん mailto:sage [2020/01/13(月) 20:43:35.62 ID:QmCTZYcld.net]
らめー

1023 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 120日 11時間 20分 29秒

1024 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<245KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef