1 名前:田杉山脈 ★ [2019/01/12(土) 18:37:50.17 ID:CAP_USER.net] 「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。 まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記 以下ソース https://japan.techrepublic.com/article/35131060.htm
2 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 18:38:58.81 ID:UT9z2lcu.net] データサイエンティストに求められるのは言語ではない 数字を読む能力なのに
3 名前:名刺は切らしておりまして [2019/01/12(土) 18:42:18.85 ID:b9qRj+KZ.net] ピソン
4 名前:名刺は切らしておりまして [2019/01/12(土) 18:55:36.17 ID:K7woRKwy.net] Rは統計データを扱うのに特化した言語であって システムを組むには不向きなだけだろ
5 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 18:55:39.34 ID:ekSjywov.net] データをnumpyとかpandaとかに整形するのがめんどいんじゃ糞が
6 名前:名刺は切らしておりまして [2019/01/12(土) 18:57:58.43 ID:dibLf/yi.net] Python 遅いけど、、 使いやすいし、便利なライブラリも多い。
7 名前:名刺は切らしておりまして [2019/01/12(土) 19:05:32.54 ID:XHrLj9Fn.net] 基本をC、ライブラリは都合のいいもの。今はたしかにPython。 Rは統計というかデータベース用だとおもう。
8 名前:名刺は切らしておりまして [2019/01/12(土) 19:09:51.27 ID:hEuBy7aA.net] Rubyは流行ることなく終わったな
9 名前:名刺は切らしておりまして [2019/01/12(土) 19:11:30.41 ID:WUJUgZ1h.net] なぜ Rだと思う? 記者の取材不足?
10 名前:名刺は切らしておりまして [2019/01/12(土) 19:15:41.63 ID:ephSBmTY.net] 最近は機械学習系のライブラリがみんなPythonだからな イヤでも使うしかない
11 名前:sage mailto:sage [2019/01/12(土) 19:24:51.91 ID:OWQfCzk/.net] >>10 >最近は機械学習系のライブラリ プログラマー全体の何パーセントが,「機械学習系のライブラリ」を 使用するのか? これがPythonの人気の主な理由とは思えない!
12 名前:名刺は切らしておりまして [2019/01/12(土) 19:27:11.26 ID:H29X4LK5.net] いよいよボッキデータの真髄、といったところか
13 名前:名刺は切らしておりまして [2019/01/12(土) 19:32:17.23 ID:b4p6ouCE.net] 2chでも変なところで改行してると気になる
14 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 19:32:26.78 ID:kDQzC5W5.net] >>2 数字を読むのはAIの役目
15 名前:名刺は切らしておりまして [2019/01/12(土) 19:34:39.49 ID:H9+KMJVU.net] その辺の言語は文法が少し違うだけで どれも同じだよ
16 名前:名刺は切らしておりまして [2019/01/12(土) 19:41:12.41 ID:ephSBmTY.net] >>11 この記事はデータサイエンティスト限定の話だし もちろん他の用途では事情は変わってくるだろうね 機械学習いらんってことなら、別の言語でも全然構わないだろう ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると 素のApacheですぐに動かないから微妙に面倒くさい Djangoとかのフレームワークを使う手もあるけど、 それぞれにクセがあって多少手間がかかる 最後は何を作りたいかで決まるでしょう
17 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 19:44:53.13 ID:d46EjDA9.net] numbaじゃなくてpsyco復活してほしい cythonがまぁまぁ使いやすい
18 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 19:46:01.58 ID:0Stlar/u.net] Rを使うのは昔の文系統計屋だけ データサイエンティストはRなんて使わないわな
19 名前:名刺は切らしておりまして [2019/01/12(土) 19:55:26.28 ID:SD42/tYe.net] assembler, bash, basic, c, cobol, java, perl, php, python, PL/M 人生最後の言語はrustだと思いたい
20 名前:名刺は切らしておりまして [2019/01/12(土) 19:59:05.68 ID:q+VwURUA.net] データ解析といえばSASじゃないの?時代は変わったな
21 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:07:25.47 ID:VGAcCdku.net] データ分析基盤を作るのは他に丸投げ?
22 名前:名刺は切らしておりまして [2019/01/12(土) 20:11:46.83 ID:PAeBiU62.net] でもモジュール作る人はc/c++じゃないの? データサイエンティストと言う人らはフロントだけを作るの?
23 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:13:22.05 ID:0AG1278f.net] >>1 Julia は?
24 名前:名刺は切らしておりまして [2019/01/12(土) 20:16:59.67 ID:sJf3fT7h.net] Rはデータ処理しやすいから好き 書き方も好き
25 名前:名刺は切らしておりまして [2019/01/12(土) 20:17:56.46 ID:7pg+voxm.net] これはおかしい Pythonが言語として優れてるわけでなく、グーグルとか多数企業が 数値計算、AI関連のモジュールもあとから追加したからだろ。 Javascriptでもよかった
26 名前:名刺は切らしておりまして [2019/01/12(土) 20:24:06.33 ID:7pg+voxm.net] なぜ機械学習にPythonが選ばれるのか Google AppEngineの開始当初(2008年4月)にPythonをサポートしていた際には、なんでPythonなんだろうと軽く調べ、教育用として海外では普及しているという認識だった。 2012年〜2013年頃にデータサイエンスがバズワードとなり機械学習する上でR言語と次点でPythonという感じだったと思う。 そして昨今はPython一色になってきている。 私としては何故このように科学計算分野のライブラリが作成され強化されるように至ったのかを知りたくなり歴史から調べてみました。 RubyがRailsにより注目されたように、Pythonでは当初数値コンピューティング用に設計されたものではなかったがリストの概念や関数型言語の基本機能を実装したこと、 Jim Fulton氏(元ZOPE社CTO)が多次元配列・行列ライブラリ「Matrix Object in Python」を開発したことで、 早い段階(Python 1.0から1年後)で科学/エンジニアリングコミュニティに注目され「Matrix-SIG」が設立、 後の「NumPy」が紆余曲折(Numeric(1995年)とNumArray(2001)を統合)を経て2005年にリリースされた。 また幾つかの科学計算用ライブラリをパッケージ化した「SciPy」が2001年にTravis Oliphant氏らによりリリースされた。 その後はEnthought社が2001年に米国で設立され、SciPyをベースにツールやパッケージやサポートを提供、また科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援して行く。 Pythonが、科学技術計算で使われるようになるであろう理由のもう一つに着目した。 オープンソースプロジェクトは開発リソースが限られ、開発の中心メンバーが何らかの理由で参加しなくなった場合、一気にそのプロジェクトが衰退する場合があるが、 特に科学技術計算関係のパッケージについては民間企業が本格的にサポートとしており、オープンソースソフトウェアとして公開する体制が整っている。 民間企業の代表的なのが、Enthought社とContinuum Analytics社である。 Enthought社は科学技術計算用パッケージ群「Scipy Stack」を提供し、科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援している。 Continuum Analytics社はPythonディストリビューション「Anaconda」を提供し、データ分析向けの「Py Data」と呼ばれる会議の開催を支援している。 また、GoogleもPython作者のGuido van Rossum氏を2005年に雇用したり、「Google Summer of Code」というオープンソースの開発に資金を提供するプロジェクトを2005年に作成し、 機械学習ライブラリの「scikit-learn」や多変量回帰分析・時系列分析ライブラリ「statsmodels」がリリースされています。 科学技術計算分野のキーマンは、「SciPy」と「NumPy」の作者でもあるTravis Oliphant氏であろう。 qiita.com/yaju/items/5502115d7e3d06e6bbdd
27 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:27:33.19 ID:bz9KFmyJ.net] 普段業務でR言語を利用するなんて日本なわけないと思ったらやっぱり日本じゃなかった
28 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:33:18.62 ID:FyOIkd6T.net] >>27 別に日本でも使うだろ。 研究者やデータサイエンティストとかなら。 ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ
29 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:37:41.08 ID:bz9KFmyJ.net] >>28 趣味レベルだろ
30 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:39:23.01 ID:FyOIkd6T.net] >>22 機械学習とかはサーバサイドだろ。 サーバでPythonが動き、C/C++で書かれてコンパイルされたライブラリーを呼び出す。 サーバサイドのフレームワークはPHP/Ruby/Pythonあたり。 フロントエンドではJavascript/HTML/CSSが動き、 C#とかJava書かれたソフトも動いてるかもしれん。 今時1つの言語じゃ大したことできねーぞ。
31 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:41:28.24 ID:FyOIkd6T.net] >>29 仕事で使ってるんだぞ?立派な業務使用。 商用ソフトのクオリティではないだけの話。 そこは目的が違うだけ。 英語で言ったら「英語は通訳しか仕事で使わない」 と言ってるようなもん
32 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:43:09.54 ID:FyOIkd6T.net] 日本のプログラマに多い、 SIとかでクライアントの社内システムしこしこ作ってるようなのが、 むしろプログラマーの中では底辺だからな。
33 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:51:34.47 ID:RxXl9REQ.net] Rかじった程度の統計の人やプログラム未経験だけどとにかくクエリは自力でかけますみたいな人たちにとっては取っつきやすいみたいですね 純粋なプログラマーにはクソ言語にしか見えない
34 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 20:55:54.96 ID:FyOIkd6T.net] 純粋なプログラマーって言い方が謎だが、 プログラミングそのものでお金をもらってるのと、 何か成果を出すためにプログラミングをツールとして 使ってる人ではそりゃ見方が違うだろ。
35 名前:名刺は切らしておりまして [2019/01/12(土) 21:04:11.03 ID:7pg+voxm.net] >>30 全体でみればそうかもしれないが。 データサイエンティストとして要求されるのはPythonにほぼ限定されるかと。 機械学習とかAIはPythonでやって結果は別人、グループへ。
36 名前:名刺は切らしておりまして [2019/01/12(土) 21:23:54.55 ID:4kOuee7Y.net] システム化にこそ価値が宿る
37 名前:名刺は切らしておりまして [2019/01/12(土) 21:44:28.59 ID:bl6GrAb2.net] Python簡単で便利だしな 情報工学の基礎を学んでない人でも扱える
38 名前:名刺は切らしておりまして [2019/01/12(土) 22:03:11.01 ID:PAeBiU62.net] じゃあなに、偉そうに書いている割に俺らと一緒でAPIをぽちぽち叩く人らなんだ なんだそれ
39 名前:名刺は切らしておりまして [2019/01/12(土) 22:12:15.59 ID:03hknbTV.net] >>38 プログラミング環境はただの道具 実現したいことがさくっと実現できればそれでおk と通りすがりのScheme使いが言ってみる
40 名前:名刺は切らしておりまして [2019/01/12(土) 23:05:12.35 ID:or34q7p2.net] >>11 主な理由の1つだな もう1つは非常にとっつきやすくて、昔でいうperl的なニーズなんだと思う
41 名前:名刺は切らしておりまして [2019/01/12(土) 23:06:28.94 ID:or34q7p2.net] >>38 勝手に偉そうに感じてるだけだろ 単純な関数みたいには使いこなせんよ
42 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 23:21:51.98 ID:Jk8z6VDP.net] お前らプログラムやってるのか知らんがデータサイエンティストはお前らと全く違う職種だから 言語ってスレタイで自分の領域だと勘違いして入るのはクルマの免許しかないやつがバイクスレに入るようなもん
43 名前:名刺は切らしておりまして [2019/01/12(土) 23:37:58.42 ID:yTAZ7IAR.net] Rの女
44 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 23:50:23.56 ID:Pf6VbnVt.net] マジレスすると一番必要なのはSQLだろ笑笑
45 名前:名刺は切らしておりまして mailto:sage [2019/01/12(土) 23:59:40.74 ID:HhxoKhz8.net] >>11 何パーセントとか関係ないでしょ。 CにしろJavaにしろPythonにしろ言語作ったのは数人〜数十人とか。 それを何百万人ものプログラマが使ってる。 人数の多寡ではなく影響力。 影響力ある人が数人でも始めればそれが波及する。 アメリカで機械学習をやってる人たちってのは影響を与える側。 その人たちがPythonを使い出せば、新しいアルゴリズムの ライブラリや機械学習の教科書のコードがPythonで書かれるようになる。 やがて他国の研究者もそのライブラリを使うためにPythonに乗り換える。 日本のITエンジニアが何言語使おうと世界に影響は殆どないけどね。
46 名前:名刺は切らしておりまして [2019/01/13(日) 00:02:49.29 ID:cXFUuuq3.net] >>42 ワロタ 確かに、 「車のほうが値段高いから俺のほうが偉い」 とか無意識に思ってそう。
47 名前:名刺は切らしておりまして [2019/01/13(日) 00:07:23.78 ID:wx3Zu4C3.net] >>42 データサイエンティストと組んで仕事してるけど 今時は理論だけじゃ仕事にならんよ システムに組み込める形にできないと
48 名前:名刺は切らしておりまして [2019/01/13(日) 00:12:37.48 ID:GObm6Thu.net] python は perl5 の次のステップアップで覚えた言語 データ処理は出力がある程度まとまっている Rに任せてる
49 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 00:13:11.03 ID:tG0QmgRX.net] クルマに例えるなら、日本でプログラマといって連想する人たちはタクシーやトラックの運転手に当たる。 で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。 クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、 タクシーやトラックの運転手しかないから国民は 「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」 あろうことか、そのトラックやタクシーの運転手たちが 「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。 トヨタの開発者?俺たちより運転してないだろ」 とメーカーの社員よりえらぶってる状況。それが日本のIT業界。
50 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 00:31:45.30 ID:Ci4YzD6F.net] 細かなところで言語仕様がイラッとくるから好きじゃない
51 名前:名刺は切らしておりまして [2019/01/13(日) 00:34:59.99 ID:T2tvEFxv.net] >>49 分かる。 データサイエンティストとか聞いて、てっきり計算科学やってる人の事かと思ったら、 只の技術屋じゃん。 サイエンティストって。。。
52 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 00:42:52.73 ID:VgsFpufp.net] なんで電子マネーみたいに無駄にポコポコ新言語作るんだ?
53 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 00:53:09.41 ID:Ci4YzD6F.net] >>52 AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、 プログラミングのパラダイムが変遷して、その変化に合わせたりとか、 プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。 ただpythonは結構古い。もうすぐ30年になる。
54 名前:名刺は切らしておりまして [2019/01/13(日) 00:59:43.61 ID:6q6Qw5AL.net] Rってソフトウエアってイメージあったわ
55 名前:名刺は切らしておりまして [2019/01/13(日) 01:00:22.03 ID:yQoop5da.net] いやだからさ、アセンブラレベルで最適化したCモジュールやフレームワークを提供する側の人間かと思ったら そのへんのプログラマ同様、pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ これでサイエンティストとか名乗られても、ただのプログラマじゃん
56 名前:名刺は切らしておりまして [2019/01/13(日) 01:02:03.59 ID:rs+IoQeE.net] うちはブルジュアだからSAS
57 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 01:02:38.48 ID:Ci4YzD6F.net] >>54 Mathematicaに近いイメージか
58 名前:名刺は切らしておりまして [2019/01/13(日) 01:06:10.32 ID:rk6nPjSo.net] >>55 一行目がプログラマで、サイエンティストはエンドユーザーかと
59 名前:名刺は切らしておりまして [2019/01/13(日) 01:28:48.85 ID:13OGwtBI.net] python自体は遅いけどnumpyのようなライブラリは早いじゃん
60 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 01:29:31.94 ID:Lqlv4ZuM.net] データサイエンティスト≒統計家じゃね
61 名前:名刺は切らしておりまして [2019/01/13(日) 01:33:54.48 ID:LP8DwHKq.net] >>55 > アセンブラレベルで最適化したCモジュールやフレームワークを提供する これはエンジニアの仕事。サイエンティストの仕事では無い。 > pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ サイエンティストはプログラミング能力で評価されるわけでは無い。 データサイエンティストならデータから有用な結果を引き出せるかどうかが評価のポイントだろ。
62 名前:名刺は切らしておりまして [2019/01/13(日) 01:45:45.24 ID:LP8DwHKq.net] ややこしいのは、新しい機械学習のアルゴリズムを作る 例えばヒントンのような人はコンピュータサイエンティストの くくりの方が適切(多分)ってこと。 そういう意味でデータサイエンティストよりデータアナリストとか 統計技術者という言い方の方が適切なのかもしれない。
63 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 02:02:49.47 ID:Xagx+4Vu.net] データサイエンティストとデータアナリストは別な データアナリストはExcelでグラフ作ってプレゼンしたりする奴ら データサイエンティストはRやPythonで予測モデルを作る奴ら
64 名前:名刺は切らしておりまして [2019/01/13(日) 02:17:11.65 ID:BC+9xAcO.net] データサイエンティストはエクセルも作るし、プレゼンもするぞ。モデルも作る てか、エクセル作るためにモデル必要だし エクセル作るだけの仕事なんてまずないだろ。それじゃただのコンサルじゃないの? クライアントに寄り添ってデータ分析するのがデータサイエンティスト 彼らの実装をよりエレガントにエフェクティブにするのが機械学習エンジニア その実装や必要なデータ整備を分散化、自動化するのがデータ基盤エンジニア 実際ははっきりとは分かれず 兼務してることが大半だと思う 特にデータサイエンティストと機械学習エンジニア
65 名前:名刺は切らしておりまして [2019/01/13(日) 02:29:01.95 ID:caw1iggm.net] データアナリスト = データを分析して傾向を割り出す データサイエンティスト = データを分析して予測を立てる 機械学習エンジニア = 鑑別器の正解率を高めるように特徴量を際立たせる こんな感じか?
66 名前:名刺は切らしておりまして [2019/01/13(日) 02:34:11.89 ID:yQoop5da.net] ヘボい こんなんで年収がいいんだ、おれもデーターサイエンティスト()目指そうかな
67 名前:名刺は切らしておりまして [2019/01/13(日) 02:47:16.83 ID:BC+9xAcO.net] >>66 人間性スキルが必要だから 君には無理だよ
68 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 03:31:04.34 ID:tG0QmgRX.net] >>66 学位あって英語できりゃ年収2000万ねらえるよ。頑張って。
69 名前:名刺は切らしておりまして [2019/01/13(日) 04:03:21.73 ID:w+vTZU2B.net] >>14 なんか、いろいろとバカが滲み出ている発言だなw
70 名前:名刺は切らしておりまして [2019/01/13(日) 04:08:52.57 ID:YYj9J9ni.net] 技術スレ特有の 上から目線のきもいヤツ湧きすぎ
71 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 04:26:14.26 ID:PCzZ6H6e.net] π損もやっといた方がいいかなー 色んな言語に手を出すには日本人エンジニアの余暇は少なすぎるのだけど
72 名前:名刺は切らしておりまして [2019/01/13(日) 04:31:17.45 ID:k4IKoDS7.net] >>67 人間性スキル(爆笑)
73 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 05:43:02.74 ID:ZgmZpark.net] データサイエンティスト? また胡散臭げなコンサルがでてきたんか
74 名前:名刺は切らしておりまして [2019/01/13(日) 08:25:50.71 ID:QussHjZD.net] ライブラリ頼みでPython使ってるだけでデータサイエンティストとかw
75 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 09:03:04.78 ID:oJ9+JRM2.net] >>67 そんなことを言ってるから日本一人負けなんだよ
76 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 09:04:17.78 ID:8E8SQ8s3.net] 真のデータサイエンティストならば断定口調で語る可能性は優位にあるとは言えない
77 名前:名刺は切らしておりまして [2019/01/13(日) 09:19:31.15 ID:4qHb4AL0.net] >>60 統計ではなくパターン化がデータサイエンティストの仕事 将来こうなるorこうするだろう、 っていうのが、データサイエンティストには読める
78 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 09:23:52.78 ID:4qHb4AL0.net] >>69 おまえが無知なだけですよ 数字を読んで傾向を割り出すのがAIの仕事 傾向からパタン認識して未来予測するのがデータサイエンス
79 名前:名刺は切らしておりまして [2019/01/13(日) 09:28:44.13 ID:R/3igTmB.net] 言語、言語言ってる連中は間違いなく素人。 プロのこだわりはドメイン設計とメッセージングとデザインパターン これに尽きる。
80 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 10:18:03.32 ID:VSzeClV0.net] >>18 実務経験ないんだろうけど。 海外じゃ理系だの文系だのといった馬鹿な区分けはないんだよ。 PythonもだけどR使ったことない学生なんて 勉強してないって自分から言ってるようなもんだし 外資じゃ絶対雇わないよ。
81 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 11:29:55.10 ID:L0m1Tzpz.net] 単なる分析屋なの? 新しいアルゴリズム開発するとかじゃないのか。
82 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 12:01:04.24 ID:7HNKg5tW.net] numpy, scipy, scikit-learn この3つの影響が大きいと思う
83 名前:名刺は切らしておりまして [2019/01/13(日) 12:40:47.79 ID:4VcpaMum.net] 今メインはMatlab+Statistical Toolboxで計算してて,たまにR使うくらいなんだけど, Pythonに置き換えるってのはなんかメリットある? やってるのはMCMCとかの1000行くらいから10000行くらいの計算。 Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。
84 名前:名刺は切らしておりまして [2019/01/13(日) 12:56:12.84 ID:BC+9xAcO.net] 論文読んでアルゴリズムを拝借するだけの データサイエンティスト馬鹿にしてるくらいなんだから きっと著名なアルゴリズムを生み出して 社会に貢献をしてるんだろうなあ
85 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 12:57:35.18 ID:pSQYDZ7L.net] >>25 言語としても優れてるよ 実装したいアルゴリズムをコンパクトに記述できる 型定義や型変換など、アルゴリズムとは関係ない余計な記述が殆どいらない インデントで構造が明確で、閉じカッコの様な余計な行が不要 pythonだと、人間はアルゴリズムに集中できる 他の言語ではコンパイラやインタープリターを支援する為に、どれだけ余計な記述を強いられているかがわかる コードが読みやすいので、仕様書は要らず、数カ月前に書いたコードでも動作を思い出せ、改造が楽 職業プログラマーではない、サイエンティストにとって、最適な言語だ
86 名前:名刺は切らしておりまして [2019/01/13(日) 13:07:38.53 ID:4VcpaMum.net] >>85 そうかー,今MATLABで計算しているので,できるだけFORループを使わないように行列演算だけでなんとかならないかと苦戦してるんだけど,それもなくなるのか。 まあ,MATLABは関数の型宣言が全くいらず,いきなり行列を代入することができるのがむちゃくちゃ楽なんだけど。 でもアルゴリズムに集中できるというのはいいね。ちょっとインストールしてみようかな。
87 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 13:10:05.47 ID:pSQYDZ7L.net] >>78 逆だろ 数字を読んで傾向を割り出すのはデータマイニングで、AIじゃない また、データマイニングも、数字をそのまま入力して良い結果が得られるケースは殆ど無く、人間が数字を読んで前加工して、適切なマイニングツールを選ばなきゃならない それがデータサイエンティスト データサイエンティストが組んだ前処理とマイニングツールの組み合わせを使って、新たなデータから傾向を見出して、何かのアクションを自動化するのがAI
88 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 13:26:16.43 ID:Ev0OzgOy.net] >>86 for loop使わずに行列計算したほうが早いのはpythonも同じ。 裏でどういう処理してるか考えれば分かると思うが。 pythonのnumpyっていう実質的な標準ライブラリを入れると、 MatlabやRと同じ行列演算ができるようになる。 matlab、R、python一通り使ってきたけど、 計算するだけならmatlabが一番楽だね。 環境が製品として閉じてるから。 pythonはプログラミングより環境構築が難しい。
89 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 13:31:25.77 ID:Ev0OzgOy.net] >>83 別にMatlabで何の問題なくできてるなら、問題はない。 Pythonが好まれてるのはオープンだから。 Matlabは商用ソフトなんで誰でも使えるわけじゃない。 あなたが書いたコードを共有するときに問題になる。 新しいアルゴリズムがデファクトで、 pythonで実装されるようになりつつあるから、 次第にpythonを使わざるをえなくなる機会は増えていく
90 名前:名刺は切らしておりまして [2019/01/13(日) 13:57:47.62 ID:D4GElc6G.net] 全部VBでできるだろ VB.NETを使えっての てか、データサイエンティストって何なんだよ
91 名前:名刺は切らしておりまして [2019/01/13(日) 14:06:41.60 ID:4VcpaMum.net] >>88 >>89 ありがとう。つまり年間10万くらいMathworksにお布施してるのは意味があるってことか。 まあ,俺が作ったFFTのCのプログラムよりインタプリタのMatlabのFFTのほうが速かったときは びっくりしたもんな。やっぱり売り物はよくできてるってことか。 >>90 お前はマシン語でもやってろ。何でもできるぞ。
92 名前:名刺は切らしておりまして [2019/01/13(日) 15:03:08.00 ID:YWud//Y+.net] dplyrが出てからpythonでなくてもRは前処理楽になったよ。 Rとpython両方できてないと他人のコード読めないので、片方だけという 人は少ない
93 名前:名刺は切らしておりまして [2019/01/13(日) 15:07:18.43 ID:K7d3Qawg.net] では、>>90 は我々低レベルプログラミング勢が貰い受ける まずIntelの仕様書を渡すところから始める
94 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 15:39:11.20 ID:pSQYDZ7L.net] >>89 計算するだけならmatlabやRで良い事に同意 その計算モジュールをWebAPIやMQ等で他のモジュールと連携させたり、MongoDBやRedis等のDBを読み書きしたりと、システム化してAIにするには、pythonの方が便利 要は、バッチでデータ処理してた時代から、クラウドでAIする時代に変わり、pythonがトップになったんだと思う
95 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 15:46:50.50 ID:RuWdLfwG.net] ExcelとRで回帰分析しかできないようなのはなんちゃってデータサイエンティスト。 それでもデータで経営層を動かせるからプログラマーより評価されるだけ。
96 名前:名刺は切らしておりまして [2019/01/13(日) 16:45:22.54 ID:maVCz2LA.net] なんだよ 回帰分析って そんなの知らねーよ
97 名前:名刺は切らしておりまして [2019/01/13(日) 16:46:48.10 ID:4VcpaMum.net] >>95 違う。ExcelとRで経営層を動かせるほどの結果が出せる奴がすごい。 あくまでも統計的手法は道具であり,よい道具を使ったらよい結果が出るわけではない。 すごいデータサイエンティストは,道具がすごいのではなく,データを見抜く力がすごい。 思ってもみなかったものに,ものすごく単純な統計的手法を適用して,びっくりする結果を出す。 これがほんとのデータサイエンティスト。
98 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 16:48:16.74 ID:FYelBOa0.net] ゲロおそパイソン
99 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 17:09:33.65 ID:d2U21Etj.net] >>61 >データから有用な結果を引き出せるかどうか ホントにな 言語とか正直どうでもいいだろ カンタンにミスなく書けてデータが取り回せれば ・・・行きつくとpハックの話もあるけど(白目
100 名前:名刺は切らしておりまして [2019/01/13(日) 17:13:09.10 ID:kxpdShTD.net] データオナニスト職にはどんな言語が求められるの?
101 名前:名刺は切らしておりまして mailto:sage [2019/01/13(日) 17:19:52.92 ID:iT7GDQh4.net] S言語やろ