自然言語処理スレッド ..
[2ch|▼Menu]
641:デフォルトの名無しさん
08/01/05 22:15:13
>>636
あほかw
それすらわからなくて、もっとちゃんとした方法をとろうとしてるのか?
今のお前には、知識的に無理、計算量的に無理、(開発)時間的に無理だと思われ。

普通に一般的な方法なんだが、お前がちゃんとした方法を自分で考えれるなら
勝手にすればいいじゃん。そんな奴がここで聞くとは思えないがな。

642:デフォルトの名無しさん
08/01/05 22:18:42
質問するときはトリップつけたほうがいいよね

643:デフォルトの名無しさん
08/01/05 23:26:55
ドコモの携帯にATRで開発した音声入力の翻訳機能がつくらしいんだけど、だれか使ったことある?

644:デフォルトの名無しさん
08/01/05 23:42:56
TOEIC600程度ってニュースで言ってた奴?
自分でしゃべったほうがマシそうなんだが

645:デフォルトの名無しさん
08/01/06 00:19:12
NECとの共同研究のだよな。
あれ使い物にならんぞ・・・。

何とか形にした感じだけど、おそらく製品になっても
玩具程度だと思われ。

そもそも、音声入力自体が、全然まともに出来上がってないw
次に、分かち書きが基本的に不可能に近い。理論的には文字での方法と同じだが
現実は遠くかけ離れてる。

あと、最近のATRって確実に質堕ちてるよな?

646:デフォルトの名無しさん
08/01/06 03:49:14
ATRはそりゃ落ちてるだろうな、最近なんか随分出来の悪い人材が行ってる気がする。
昔は東大・京大ばっかだったのにな。
京阪奈周辺の大学の教授が自分ん所の学生送り込んでたが、優秀な人材はみんな企業行っちまうから…

647:デフォルトの名無しさん
08/01/06 05:10:57
NAISTの馬鹿が行ってるくらいだからなぁ

648:デフォルトの名無しさん
08/01/06 06:33:26
完全に人材不足だからなぁ…。
加えて、マネージメントやってるNICTが国会で槍玉に挙がったもんだから、色々絶望的だよ。
NAISTの人間ですら今じゃGoogleやYahooやNTTに行くもん。あんな所誰が行くんだよw

649:デフォルトの名無しさん
08/01/06 08:21:15
なんでNAISTってこんなに馬鹿にされてんの?w
そりゃあ、東大・京大と比べられたらどうしようもないんだろうけど。

650:デフォルトの名無しさん
08/01/06 14:46:21
全入だからでしょ
やってることのレベルで馬鹿にされてるわけじゃないと思う

651:デフォルトの名無しさん
08/01/06 16:59:26
馬鹿にするならせめてより優れたものを作ってからにしようや

652:デフォルトの名無しさん
08/01/06 17:20:47
NAISTに優れたものなんてあったっけ?
売りの辞書も、構造が随分時代遅れで、東大・京大よりレベル低いし。
NAISTにEnjuのようなものが作れるとは思えん。

653:デフォルトの名無しさん
08/01/06 17:23:51
知らんくせに馬鹿にしてのか
最低だな

654:デフォルトの名無しさん
08/01/06 17:29:32
学生のレベルが低いからなあ

655:デフォルトの名無しさん
08/01/07 15:53:52
nlpに限っては
山下、工藤らが在籍していた前後がピークだよね

656:デフォルトの名無しさん
08/01/08 09:29:51
彼らは、既存の積み重ねの成果を実装しただけで
実際に偉いのは、彼らの先輩の構築したもの。
運と時期が良かっただけ。Googleの登場時期も良かった。
言っちゃあ悪いが、単なる実装屋さんだよ。そのくせ、その辺の専門卒プログラマより質は悪いし。

ま、工学の分野は作ったものが偉いってのも確かなんだがな。

657:デフォルトの名無しさん
08/01/08 18:00:29
NAIST批判が多いね

658:デフォルトの名無しさん
08/01/08 22:27:07
批判すればそれを超えたつもりになれる患者さん達

659:デフォルトの名無しさん
08/01/09 00:02:50
>>656はNAISTの蓄積は評価してるように見えるが…
あとは、それを実際に世に出した、k_takuとたつをも評価してるし
案外まっとうな意見じゃないかと。

660:デフォルトの名無しさん
08/01/10 10:12:31
今後も蓄積だけでやっていくつもりかな

661:デフォルトの名無しさん
08/01/12 19:13:01
工藤がただの実装屋って…
ここの連中は論文も読めんのか

662:デフォルトの名無しさん
08/01/13 00:24:44
サーベイばっかだろ。
元論文読んだ事無いってオチじゃないだろうな?

663:デフォルトの名無しさん
08/01/13 15:20:57
やっぱり研究者は批判されて一人前ってことか。
東大・京大がすごいと言われているようだけど、
(実際凄いとは思うが)個人名は出てこないもんな。

664:デフォルトの名無しさん
08/01/13 20:25:00
工藤山下あたりは単なるエンジニアじゃなくてサイエンティストだろ
高林はエンジニアよりだけど

665:デフォルトの名無しさん
08/01/13 20:43:12
奈良先は学生が足を引っ張ってるからな、残念だ

666:デフォルトの名無しさん
08/01/14 05:45:29
>>664
そんなに有名な理論系の論文出してるか?
基本的に既存の理論の実装を中心にやってると思うが…。
PATアレイやら、ダブル配列やら、CRFやら、形態素解析やら。

>>665
学生がって・・・。
学生以外居ないだろ。学校なんだから。
大学院大学だから、学部生が居るわけでもあるまいし。




667:デフォルトの名無しさん
08/01/14 10:00:05
論文読めよ

668:デフォルトの名無しさん
08/01/14 10:30:08
>>628 ってその後どうなったのかな
↓日記が見られないから経緯が良く分からんです

URLリンク(groups.google.com)

669:デフォルトの名無しさん
08/01/14 10:46:18
>>666
何もやってないってのがわからないのが今のNAISTの学生。
なんか、それっぽい事してるからだまされるだけで
基本的に彼らのやってるのは、既存の実装技術の欠陥を、あまり注目されてない理論で改良してるだけ。
他の研究者の着眼点が悪いのか、それともそもそも研究者がやるべきことじゃないから目を当てないのかは知らないけどな。

670:デフォルトの名無しさん
08/01/14 11:23:33
NAIST叩きスレになっててワロスw
別に、そんな叩くほどの価値があるわけでもなく
何らかの理論に対しての論争をするまでも無いレベルなのに
何やってるんだ。

理論が叩かれてるとかなら、有る意味「叩かれてこそ」って言えるけど
そういうレベルの議論でもなさそうだし。馬鹿だなぁ。お前らも。

671:デフォルトの名無しさん
08/01/14 14:41:20
理論も持ち出さずに叩くからただの妬み嫉みにしか見えない。
NAISTがろくな研究してないっていうなら会議なり論文なりで否定して見せろよ。

672:デフォルトの名無しさん
08/01/14 15:11:59
だから、そういう議論をするようなレベルの学校じゃないって事でしょ。
会議や論文で叩くにも、相手が何も理論を作ってなきゃやりようがない罠

まさにその話自体が本末転倒

673:デフォルトの名無しさん
08/01/14 15:22:17
毎年国際会議もジャーナルも大量に出てるのに会議や論文で叩けないってどういうことだ。

674:デフォルトの名無しさん
08/01/14 15:23:56
NAISTの馬鹿学生が必死に書き込んでることだけはわかった

675:デフォルトの名無しさん
08/01/14 15:24:59
なにこのスレ

676:デフォルトの名無しさん
08/01/14 15:30:19
>674
また嫉妬か。みっともない。
もっとも俺はNAIST関係者じゃないが。

677:デフォルトの名無しさん
08/01/14 15:42:10
嫉妬する要素が一つもないw

678:デフォルトの名無しさん
08/01/14 15:54:17
だから、もうやめろってw
学校批判したけりゃ、お受験板にスレたてて来い。

どっちにしろ、そんなレベルの低い話しても、誰もうれしくない。

679:デフォルトの名無しさん
08/01/15 16:48:25
>>673
会議や論文は叩くためのものじゃないだろ・・・

680:デフォルトの名無しさん
08/01/18 14:55:31
事件は会議室で起こってる

681:デフォルトの名無しさん
08/01/18 14:57:40
・・・んじゃない。現場で起こってるんだ。

682:デフォルトの名無しさん
08/01/18 20:12:11
が現場が会議室だった。

683:デフォルトの名無しさん
08/01/19 05:38:42
/( ^o^ )\ なんてこったい

684:デフォルトの名無しさん
08/01/22 15:43:56
もしも現場が会議室だったら・・・

685:デフォルトの名無しさん
08/01/25 20:14:59
正規文法に従って設計された人工言語ってどっかない?
あればコンピューターで解析させるのに楽

686:デフォルトの名無しさん
08/01/26 03:50:34
それがプログラミング言語じゃねぇの?

687:デフォルトの名無しさん
08/01/26 08:42:19
( ´,_ゝ`)

688:デフォルトの名無しさん
08/01/26 09:01:48
なでしこでも使っとけ

689:デフォルトの名無しさん
08/01/26 10:05:40
ロジバン?


690:24歳
08/01/26 12:06:28
お前らって何歳くらいなの?


691:デフォルトの名無しさん
08/01/26 12:17:33
26歳

692:デフォルトの名無しさん
08/01/26 19:00:44
>>685
ジャバって言語がいいらしいよ

693:デフォルトの名無しさん
08/01/26 21:18:11
えっちてぃーえむるう
っていう まーくあっぷ げんご
が いいらしい よ


694:デフォルトの名無しさん
08/01/26 21:19:10
オブジェクト指向は、世界を表現出来ます。
エレガントにそれを取り込んだJavaに不可能はありません。


695:デフォルトの名無しさん
08/01/27 14:45:28
>>690-691みたいなガキばっかだったのか・・・
どーりで、話のレベルが低いと思った。

この業界って、普通30代後半からじゃないの?

696:デフォルトの名無しさん
08/01/27 14:51:24
え、院生とかばかりだと思ってた。

697:デフォルトの名無しさん
08/01/27 15:08:59
26才

698:デフォルトの名無しさん
08/01/27 19:06:47
45歳

699:デフォルトの名無しさん
08/01/28 06:11:25
ごめん、学部生だ

700:デフォルトの名無しさん
08/01/28 08:31:17
伊代はまだ16歳だーからー

701:デフォルトの名無しさん
08/01/28 09:01:43
M1です^^

702:デフォルトの名無しさん
08/01/28 13:22:01
>>695>>698
やーいおっさんおっさん!

703:デフォルトの名無しさん
08/01/28 13:23:46
B1です

704:デフォルトの名無しさん
08/01/29 15:19:39
助教とか准教授がこんなとこ見てたら幻滅するわ・・・

705:デフォルトの名無しさん
08/01/29 21:03:24
ごめん。。。

706:デフォルトの名無しさん
08/01/29 21:12:11
本当に助教授とか居るなら何かネタ投下してよ
最近やってる研究とか読んだ論文とか

707:デフォルトの名無しさん
08/01/30 01:30:44
この業界狭いから、そんな事するとすぐ特定されるだろw

708:デフォルトの名無しさん
08/01/30 07:56:23
>>706
年齢だけでも危ういのにそんなことできるかw


709:O大学
08/01/30 17:43:42
じゃあ、どこの研究室出身か名乗り上げてみようか〜♪

710:デフォルトの名無しさん
08/01/30 17:47:45
大阪大学
岡山大学
大阪工大
大阪府立大
などなど・・・。

多すぎるw
○大学って言う意味だったらぶっころ

711:MIT大学
08/01/30 18:20:57
いやまて
>>709は、そもそもnlp出身とも、そもそも理系出身とも言ってないぞw

712:B大学
08/01/30 18:26:58
MITなんてお金がなくていけませんでした

713:デフォルトの名無しさん
08/01/30 18:45:28
井上研究室

714:デフォルトの名無しさん
08/01/30 18:51:00
>>714-1000
以下NAIST出身の提供でお送りいたします。

715:714
08/01/30 18:51:33
間違えた。
>>714は無し。俺NAIST出身じゃないし。

716:デフォルトの名無しさん
08/01/30 18:59:49
俺も違う

717:デフォルトの名無しさん
08/01/30 20:35:40
>>715=NAIST出身

718:デフォルトの名無しさん
08/01/30 20:43:32
じゃあ俺はNAISTでいいや

719:デフォルトの名無しさん
08/01/30 23:39:17
じゃあおれはJAISTで

720:デフォルトの名無しさん
08/01/31 13:47:58
じゃあKAISTで

721:デフォルトの名無しさん
08/02/02 22:22:48
atrがやってるドコモの翻訳サービスってどうなの?

722:デフォルトの名無しさん
08/02/03 03:04:32
>>645-

723:デフォルトの名無しさん
08/02/03 17:55:54
>>772
そんなこと聞いてなくて,実際に使ってみてどうなんだ?

724:デフォルトの名無しさん
08/02/03 22:23:56
あれに参加した研究者の論文を見りゃわかるだろ。
どのレベルかは・・・。
この業界に居れば、使うまでも無くわかるだろうに。

725:デフォルトの名無しさん
08/02/03 23:24:42
アホアンチうざいよ

726:デフォルトの名無しさん
08/02/04 00:15:15
>>724
精度はコーパス次第だろうけどね。
あれは一応関西の学生バイトをかき集めて人手で作ったものだから
それなりには出来るだろうね。
問題は、機械による、単語の同定どころか、発話区間の同定すら出来てない(コーパス構築は人手?)
状態で、どこまで出来るのかが問題。
まー、はっきり言ってしまえばダメだろうねw

727:孟宗
08/02/04 00:18:32
割と使えるものだったよ。
凄い凄い。

728:デフォルトの名無しさん
08/02/04 00:23:23
今この研究やれば波に乗れるって研究は何?
トレンドが読めなくなってきた。

729:デフォルトの名無しさん
08/02/04 00:26:44
>>728
mp3データからの歌詞トランスクリプトの生成

730:728
08/02/04 01:19:33
mp3データから、歌詞の子音を判断して、それに合わせてキャラに口パク(6パターン)させるプログラムなら
高校時代に趣味で作ったことがある。もちろん精度悪い。
そこから歌詞まで行くのは、色々別の過程が難しい気がしてならんw


731:デフォルトの名無しさん
08/02/04 01:36:04
>>730
多分、特定したw
あのゴーストの作者か…。懐かしいな

732:デフォルトの名無しさん
08/02/05 07:08:26
野村先生のパーティ

733:デフォルトの名無しさん
08/02/06 02:45:54
このスレ内輪すぎるからうんこ

734:デフォルトの名無しさん
08/02/06 05:21:12
どうせ
>>730>>731>>732>>733も顔見知りなんだろ?

735:デフォルトの名無しさん
08/02/06 06:03:23
そりゃ、みんなNAISTの学生だモンな

736:デフォルトの名無しさん
08/02/06 06:05:26
俺はNAISTじゃないぜ
NAIST出身の友達は居るが

737:デフォルトの名無しさん
08/02/06 07:54:00
まぁ、話の内容的に
NAIST、京大、NICT、ATRあたりの関西の機関の人間が多いのは確かだろうな。
しかも、あの辺共同研究ばっかだし人材の移動もあるので、スレの人間は殆ど身内じゃね?

738:デフォルトの名無しさん
08/02/06 07:57:46
俺はそのうちのどれでもない

739:デフォルトの名無しさん
08/02/06 08:39:11
俺は海外組。
英語処理ならそこそこ研究したが、日本語処理は正直わからん。

740:デフォルトの名無しさん
08/02/06 09:31:46
こんなスレあったのな。ム板住人なのに気づかなかったぜ。

俺の学部時代は、文字列(高速検索・動的処理)・統計処理(のごくごく一部)で終わった・・・orz
修士で伸ばせなかったら俺はおしまいだ・・・・。

周りのレベルがアレ(つーか論外)なので特に言われる事は無いんだが、
どう考えても大学出た後がヤバい。所詮ここはその程度の大学だし。。。
京大生の知り合いの仕事見てると、こいつには勝てないんじゃないかって
ある種の絶望を覚える・・・。

741:デフォルトの名無しさん
08/02/06 09:37:21
IQが20違うと
ものの見方が全然違うよ

試しに自分よりIQが20低そうな相手を考えてごらん?

742:デフォルトの名無しさん
08/02/06 09:47:04
IQ200とIQ180だからあんまり変わらんと思うけど

743:デフォルトの名無しさん
08/02/06 10:55:45
違うよ
全然

744:デフォルトの名無しさん
08/02/06 16:13:47
↑何でこんなアホが紛れ込んでるの?
お前には10年早いよ

745:デフォルトの名無しさん
08/02/06 18:08:22
>>740
自覚があるだけマシ
周りのレベルに流される奴は、外を見ないからなぁ。

746:デフォルトの名無しさん
08/02/06 23:25:28
>>740
プライドがあるだけたちが悪い
周りのレベルが低いとか言う奴は、自分の能力を見ないからなぁ。

747:デフォルトの名無しさん
08/02/06 23:34:23
どちらにせよ足りないと思ってるなら変わりないだろう。
うぬぼれているならともかく。

748:740
08/02/06 23:50:33
>>746
なるほどww
それは言えてるねw
でも、自分に対して低いとは言ってないよ?同じくらいかもしれないし、少し周りの方が高いかも知れない。
そもそもそんな狭いフィールドで比較なんてしてないんだからww
全体の中での自分の立ち位置を確認する為に、外を確認しただけ。それは自分の能力を把握する事ではなくて?w
俺も自分の能力をはっきりとは知らないわ。誰も知らないんじゃない?
でも他人よりは知ってるよ。

ところで、プライドとただの馬鹿の区別が付かない人が多いよね。
自覚とプライドも違う筈だよね。馬鹿馬鹿しい話だと思わないかい?

749:デフォルトの名無しさん
08/02/07 00:02:05
>>748
自重・・・。
若いのはわかるけど、ちょっと喧嘩売ってるというか
君は色々無駄に人生苦労してそうだ。発言には気をつけような。

明らか>>740じゃないような。釣りなのか。

750:デフォルトの名無しさん
08/02/07 00:07:07
はいはいNAIST、NAIST

751:740
08/02/08 14:32:56
>>750
関西の大学だけじゃなく、地方も忘れんでください・・・。

752:デフォルトの名無しさん
08/02/08 17:37:25
え?北陸先端?徳島?静岡?北大?長岡?筑波?

753:デフォルトの名無しさん
08/02/08 23:14:42
>>752

ワロタ

754:デフォルトの名無しさん
08/02/09 00:07:59
北陸で学部はないだろw

755:デフォルトの名無しさん
08/02/09 22:25:50
ふむ
結局文系は俺だけのようだな

756:デフォルトの名無しさん
08/02/10 16:41:06
>>755 言語学系の人?

757:デフォルトの名無しさん
08/02/10 18:20:34
なんか入門書を紹介してください。高卒ですがよろしくお願いいたします。

758:デフォルトの名無しさん
08/02/10 18:26:59
>>757何をやりたいの?

759:デフォルトの名無しさん
08/02/10 18:46:34
自然言語処理です。

760:デフォルトの名無しさん
08/02/10 18:52:40
>>759
自然言語処理の何をしたいの?

761:デフォルトの名無しさん
08/02/10 18:54:19
>>756
商学系ですサーセン

762:デフォルトの名無しさん
08/02/10 18:54:51
>>760
検索エンジンとかです。

763:デフォルトの名無しさん
08/02/10 19:31:53
検索エンジン関連技術全体のごくいちぶだなぁ、自然言語処理らしい自然言語処理は。

764:デフォルトの名無しさん
08/02/10 19:33:31
検索エンジンって儲かりますか?

765:デフォルトの名無しさん
08/02/10 20:02:08
検索エンジンつっても
PowerSetのような自然言語理解の分野に手をかけたようなのもあるし。


766:757
08/02/10 21:18:14
なんでか偽物がでてる…。自分は日本語文章を機械的に要約してみたいんです。
ぐぐってみた結果、文を要素にバラす形態素解析というのをやったあと意味を解析するらしい事はわかりましたが、
なにぶん無学なもので体系的に勉強しておきたいのです。

MeCab で形態素にバラした後に日本語の構文知識をどう適用したらいいのか途方にくれています。

767:デフォルトの名無しさん
08/02/10 21:36:46
>>766
「確率的構文解析」でググれ。

768:デフォルトの名無しさん
08/02/10 22:09:14
knpじゃだめなのか?

769:デフォルトの名無しさん
08/02/10 22:14:12
どこまでやりたいか,アプリケーションとして何をやりたいかによるなあ
応用によっては形態素解析で表層情報だけあれば十分な場合も多々あるし

770:デフォルトの名無しさん
08/02/10 23:32:31
>>766
とりあえず「。」で区切って文の配列をつくって、
最初の文と1/3あたりの文と2/3あたりの文と最後の文を表示する。
これだけでも結構つかえるぞ。

771:デフォルトの名無しさん
08/02/11 03:27:03
文の同定ってどうするんかなぁ。
前から疑問だったんだけど。
確かに自分でデータ作るときは「。」で判別してるけど
もっと、ちゃんとした方法があるはず。

ちゃんとした文じゃなくても
形態素や係り受けみたいな、コンピュータ的に扱える単位であればいいんだけど
それの文に相当するものってないよね。

772:デフォルトの名無しさん
08/02/11 07:45:36
>>771
コーパス用意して、bigramかtrigramで終端モデルつくればいいんじゃね?

773:デフォルトの名無しさん
08/02/11 12:34:38
bigram、て響きがかっこいいよな

宇宙戦隊バイグラム、とかありそうじゃん

774:デフォルトの名無しさん
08/02/11 12:53:35
宇宙怪獣トリグラム
宇宙戦艦エヌグラム
宇宙刑事マルコフ

775:デフォルトの名無しさん
08/02/11 15:25:29
宇宙刑事マルコフwww

776:デフォルトの名無しさん
08/02/11 15:27:54
バイファムは「銀河漂流」だけどね

777:デフォルトの名無しさん
08/02/11 15:30:30
俺今までビグラムって呼んでた

778:デフォルトの名無しさん
08/02/11 16:07:38
ビグラム量産の暁には連邦など >>777オメ

779:デフォルトの名無しさん
08/02/11 16:09:48
>>775
なんか手錠が数珠つなぎになってそうだw

780:横レス
08/02/11 17:02:58
>>768
それだと形態素解析もjuman限定になるしね
さすがに形態素解析にルールベースはきつい
(個人的には日本語構文解析だとルールベースのほうが結局得策な気はするけど)

781:デフォルトの名無しさん
08/02/12 02:37:19
>>780

ルールベースの構文解析器を紹介してください。



782:デフォルトの名無しさん
08/02/12 09:12:41
> さすがに形態素解析にルールベースはきつい
なんで?

783:デフォルトの名無しさん
08/02/12 13:15:39
780はルールベースって言いたいだけちゃうん?

784:デフォルトの名無しさん
08/02/12 13:22:52
どのレベルで「きつい」と言ってるかによるなあ
最長一致とかでは全然話にならないとかいうレベルなら確かにきついかも

785:デフォルトの名無しさん
08/02/14 18:49:17
cabochaとknp、どっちの精度がいい?

786:デフォルトの名無しさん
08/02/14 21:47:34
>>785
普通の係り受けと同格の区別までさせたければknpしかない

cabochaのは配布ページにも書いてあるけどあくまでも「簡易」同格判別
というか中の人のweb日記によると次バージョンではなくなってるってさ

ついでにボヤキ
しかしjuman品詞体系は癖が強くてもう嫌じゃー
誰かmecab-ipadic形態素解析使ってknpっぽいことするの作ってBSD or LGPL or GPLで公開してくれない?

787:デフォルトの名無しさん
08/02/16 20:51:13
許してやれよ

788:デフォルトの名無しさん
08/02/16 21:22:23
自分で作れ

789:デフォルトの名無しさん
08/02/16 21:39:07
歴史的仮名遣いの文の形態素解析やってる人居るかな?
先行研究例があったら教えてほしい

790:デフォルトの名無しさん
08/02/16 21:43:28
>>789
それは自然言語処理というよりむしろ計算言語学の領域と思われ

791:デフォルトの名無しさん
08/02/17 08:42:34
現代仮名遣の形態素解析は自然言語処理なのに
歴史的仮名遣の形態素解析は計量言語学になるん?

水谷先生あたりがやってないですかねとあてずっぽうを言ってみる。

792:デフォルトの名無しさん
08/02/19 13:47:15
LREC2008の航空券を調べているが、日本/モロッコ往復は、安いのが
見つからない。うちの研究室では、今回の出張は4名が限度だ。


793:デフォルトの名無しさん
08/02/20 21:52:33
情報理論のいい入門書知ってる人いる?

794:デフォルトの名無しさん
08/02/20 22:02:38
スレ違い

795:デフォルトの名無しさん
08/02/20 22:10:51
そこをなんとか

796:デフォルトの名無しさん
08/02/20 22:13:43
amazon.co.jp

797:デフォルトの名無しさん
08/02/20 22:18:52
レビュー少ないんだよなぁ

798:デフォルトの名無しさん
08/02/20 22:19:40
あんたが書けば?

799:デフォルトの名無しさん
08/02/20 22:22:53
無茶言うわ
読む本探してる人間に

800:デフォルトの名無しさん
08/02/20 22:24:42
スレ違いのほうがよほど無茶

801:デフォルトの名無しさん
08/02/20 22:27:37
そんなにスレ違いかねぇ
自然言語処理の基礎なんじゃないの?

802:デフォルトの名無しさん
08/02/20 22:31:22
情報理論がベースになっている領域もあれば、
そうでない領域もある。

さあ、適切なスレをみつけてそっち逝け。

803:デフォルトの名無しさん
08/02/21 03:22:56
知らないなら知らないって言えばいいのに
恥ずかしいやつ

804:デフォルトの名無しさん
08/02/21 07:33:21
知らないよー^^

805:デフォルトの名無しさん
08/02/21 07:35:09
恥ずかしい捨て台詞だなwwwwwwwww

806:デフォルトの名無しさん
08/02/21 09:29:07
入門書(笑)

知ってる人いる?(笑)

807:デフォルトの名無しさん
08/02/21 10:30:01
空気を読まずマジレス
URLリンク(www.inference.phy.cam.ac.uk)

808:デフォルトの名無しさん
08/02/21 10:38:23
ここ年齢層高いんだろ?
助教とか准教授がこういうアホな煽りしてるかと思うと、涙が出てくる

809:デフォルトの名無しさん
08/02/21 17:59:48
はいはい、いい本が見つかるといいなw

810:デフォルトの名無しさん
08/02/21 19:56:04
>>807
ありがとう。
今日その本を図書館で見たら、結構出来が良かった。
買ってみる。

811:デフォルトの名無しさん
08/02/21 23:58:00
pdf版が落とせるから無理に買う必要ないぞ

812:デフォルトの名無しさん
08/02/22 02:50:14
ってか洋書じゃん
日本語版ないの?

813:デフォルトの名無しさん
08/02/22 07:28:08
洋書に抵抗のある研究者ってどうなのよ?

814:デフォルトの名無しさん
08/02/22 07:37:06
Referencesには原著のタイトルを書くからオッケーオッケー

815:デフォルトの名無しさん
08/02/22 10:34:12
日本人が日本語の本を好んでも別に悪くは無い。
無ければ洋書を読む。あるなら日本語を読む。
それの何が悪い。

むしろ、洋書も和書も読めないヤツが山ほど居るわけだが・・・。
彼らは自覚あるんだろうか。

816:デフォルトの名無しさん
08/02/22 19:08:42
URLリンク(www.amazon.co.jp)

これはどう?

817:デフォルトの名無しさん
08/02/22 19:15:54
>>815
学生ならともかく、研究者が原著にあたらないのは問題あると思われ。
ましてや>>814のような行為は言語道断だろ。

818:デフォルトの名無しさん
08/02/22 19:48:38
いずれにしろスレ違いなスレで質問して
煽れば答えがもらえると思ってる時点でろくなもんじゃねぇ

819:デフォルトの名無しさん
08/02/22 20:16:07
>>815
スレ違いで粘着して情報を要求しておいて洋書だとブーたれるヤツが一人いるわけだが・・・。
彼は自覚あるんだろうか。

820:デフォルトの名無しさん
08/02/22 20:45:54
つゆとり

821:デフォルトの名無しさん
08/02/22 23:30:37
このスレのオッサンきめぇな
いい年して幼稚な煽りするなよ・・・

822:デフォルトの名無しさん
08/02/23 06:13:43
はいはい、ぼくちゃんはゆとりで生きていこうね。

823:デフォルトの名無しさん
08/02/23 14:30:17
>>822
だから自分の年考えろよ、恥ずかしくならんのか?

824:デフォルトの名無しさん
08/02/23 14:31:24
そいつは単なる門外漢のアホだよ

825:デフォルトの名無しさん
08/02/23 14:32:37
自演醜ス

826:デフォルトの名無しさん
08/02/23 14:46:23
(・∀・)クスクス

827:デフォルトの名無しさん
08/02/23 15:14:44
改訂版がもうすぐ出る。

URLリンク(www.cs.colorado.edu)

828:デフォルトの名無しさん
08/02/23 15:55:53
>>827
第1版の正誤表は凄まじいことになってたからな。
ほとんど本文と同じぐらいの分量の正誤表ってどうよ。

829:デフォルトの名無しさん
08/02/23 16:26:55
だから和書を出せと・・・

830:デフォルトの名無しさん
08/02/23 16:51:51
和訳と翻訳の違いって何?w

831:デフォルトの名無しさん
08/02/23 16:52:35
>>827
Martinはカンファレンスで直接会ったことあるけどいい人だよ。

832:デフォルトの名無しさん
08/02/23 20:29:52
マーティンってくまくましててかわいい♥

833:デフォルトの名無しさん
08/02/23 20:53:24
どうやらみたいなゆとり学部生はスレ違いのようですな

834:デフォルトの名無しさん
08/02/23 22:42:27
>>833
日本語が読めません・・・!!!


835:デフォルトの名無しさん
08/02/23 22:46:06
>>834
大丈夫
それは日本語じゃないから読めなくて当然

836:デフォルトの名無しさん
08/02/23 23:15:37
ジュラフスキは、学部が文科系の言語学科。
現職もスタンフォード大の(コンピュータ・
サイエンスではない)言語学科?

837:デフォルトの名無しさん
08/02/24 01:18:30
あーなつかしいスレ発見。

2chの対象のスレッド内の形態素集合からその板の形態素集合の平均を引いて
求めた特徴的形態素集合の上位のものを抜き出して、その形態素を含む行
およびそれにレスしている行だけを抜き出して要約を作成するとかやったなあ・・・。

うまく動いたけどすごく重かった。

838:デフォルトの名無しさん
08/02/24 01:25:04
疑似コードだとこんな感じ。
こんだけのことをするためにえらく苦労した思い出が・・・。

uniqueTokenMap = tokenMap(target) - TokenMapAverage(board)
uniqueTokens = sort(uniqueTokenMap)[0:20]
uniqueResList = grepRes(target, uniqueTokens)
print(uniqueResList)


839:デフォルトの名無しさん
08/02/24 09:32:36
それならBayesianな生成モデルたてた方が面白そうだな。

840:デフォルトの名無しさん
08/02/24 18:31:18
くらし安心ベイジアン

841:デフォルトの名無しさん
08/02/24 18:38:51
SOMで最大クラスタを抽出するのもアリだな

842:デフォルトの名無しさん
08/02/25 10:11:20
いやダメだろjk・・・

843:デフォルトの名無しさん
08/03/06 16:57:07
ho

844:デフォルトの名無しさん
08/03/07 15:20:11
言語処理とセマンティックをもちいた検索だって

URLリンク(journal.mycom.co.jp)

845:デフォルトの名無しさん
08/03/07 19:46:22
つまんねえなそれ

846:デフォルトの名無しさん
08/03/08 13:31:54
NTTがそれぐらいしてるだろ

847:デフォルトの名無しさん
08/03/08 15:21:39
この手の検索は俺は失敗すると思うんだがな。
必ずしも自然言語で問い合わせるのが楽かと言えば、俺はNoだと思うし。

コンピュータを操作するのに、対話型にすべきとか言ってるのも、俺は正気じゃないと思う。
アプリケーションの起動に、音声認識で起動するのすら煩わしいのに、対話なんかしたら・・・。

何でも人に近づけりゃ良いってもんじゃねぇぞ。
使いどころがわかってない商売人と、研究者が組んだってこの程度しか出てこないんだろうが・・・。

848:デフォルトの名無しさん
08/03/08 17:41:08
>>847
漏れもそう思う
ただGUIvsCUIみたく結局はとっつきのいい方に流れていく気がしないでもない
それぐらいだったらせめて日本人がデファクトスタンダードとって大儲けして呉とも思う

849:デフォルトの名無しさん
08/03/08 18:41:50
自然言語検索でも、なにが知りたいかをちゃんと表現できる人は少ないだろうしなぁ。

850:デフォルトの名無しさん
08/03/08 22:40:33
自然言語検索にしても、より良い結果を得ようとして最適化したら
結局は人間相手に使う言葉とは別物になってしまうという罠

851:デフォルトの名無しさん
08/03/13 09:48:10
オントロジーって役立つの?


852:デフォルトの名無しさん
08/03/13 11:36:21
オントロジー(笑)
セマンティック(笑)

853:デフォルトの名無しさん
08/03/13 12:19:43
自然言語処理って役立つの?

854:デフォルトの名無しさん
08/03/13 14:40:42
FEPとかIMEは自然言語処理じゃないの?
SKKやらTUT-Codeみたいなのは知らんが。

855:デフォルトの名無しさん
08/03/14 09:10:09
自然言語処理(笑)
人工知能(笑)

856:デフォルトの名無しさん
08/03/17 18:57:44
久しぶりに見に行ったらnaist-jdicがうpしてICOT条項外れてるね
URLリンク(sourceforge.jp)

このスレって実はnaist関係者いないんじゃね?

857:デフォルトの名無しさん
08/03/17 19:38:18
前も言ったが俺はnaist関係者じゃないぞ
naist出身の知り合いが居るだけだ

858:デフォルトの名無しさん
08/03/17 21:17:11
debian関係で知ったけど、別にここに書くことでもないかと思ってた。

859:デフォルトの名無しさん
08/03/18 14:43:52
駒場、結構繁盛してるね

860:デフォルトの名無しさん
08/03/18 19:10:18
日本における自然言語処理の分野で今もっとも活発な順に並べると
どんな感じなの?

東大
京大
NAIST
阪大
徳島大
鳥取大

こんな感じ?

861:デフォルトの名無しさん
08/03/18 20:18:47
>860
URLリンク(nlp2008.anlp.jp)
の著者名(所属)の所属をカウントしてみれば、多少の傾向はわかるかもしれない。
本数が多い→活発,が成り立つかは疑問だが。
明日の懇親会にでもでてみれば名無しさんにも会えて
各組織の活発さもわかるかもしれないよ・・・。

862:デフォルトの名無しさん
08/03/18 21:29:09
>>861
そんなドメな学会、あんまり参考にならないのでは。

863:デフォルトの名無しさん
08/03/18 22:16:14
今週東大でなんかやるみたいじゃん


864:デフォルトの名無しさん
08/03/19 12:11:03
>860
下3つは無い

865:デフォルトの名無しさん
08/03/19 19:39:38
要所の研究をやったかどうかで言えば>>860が近いが
活発かといわれると、下2つはありえない。

それ以前に、阪大は自然言語処理の分野では大して・・・。
何故そこに阪大があるのか理解できない。

866:デフォルトの名無しさん
08/03/21 08:23:36
今日は東大で機械翻訳のシンポジウム〜

867:デフォルトの名無しさん
08/03/21 22:27:21
明日は東京女子大で社会言語科学会
プログラムをみるとATRが目立つな

868:デフォルトの名無しさん
08/03/22 01:37:53
最近のATRは露骨な成果稼ぎの為に
質の悪い人材・バイトを大量に引っかき集めとるからな・・・

869:デフォルトの名無しさん
08/03/22 06:57:33
一粒で二度おいしかったり、ね。

870:デフォルトの名無しさん
08/03/22 07:55:17
atrの質低下ってそんなに著しいの?

871:デフォルトの名無しさん
08/03/22 10:03:24
ATRの成果稼ぎってより、周辺の学生の成果稼ぎってのもあるような…。

872:デフォルトの名無しさん
08/03/22 12:55:58
研究を第三セクターでやろうというのがそもそも失敗だったと思う

873:デフォルトの名無しさん
08/03/22 17:38:16
何もかもが中途半端だよな、atr

874:デフォルトの名無しさん
08/03/23 17:35:31
つーか文系やら三流理系はもうお腹いっぱい
外国人留学生をもっと取り入れろ。
三流理系は「作る系」に導入し生産的な環境を拡大せよ。
それすら出来ないエセ理系は、諦めろ。
文系はトップクラスの一部だけで良い。
本当にこのままでは堕ちる一方だぞ。

別にATRに対してじゃなくて、全体に対して言ってることだけれども。
成果稼ぎとインチキ研究ばっかしてお茶濁してるんじゃねぇよ。

俺が学生の頃(7年ほど前)から、相当堕ちてしまったと”現場”で感じるようになった。
つーことは、きっと教育・育成の現場レベルではもっと酷いんだろうな。
これでは日本の機関から人材を取る気が起きない。

875:デフォルトの名無しさん
08/03/23 17:56:14
留学生だろうがなんだろうが玉石混交なのは何も変わらない

876:デフォルトの名無しさん
08/03/23 18:06:38
7年前というと、俺が学生だった頃(15年前)から見るとだいぶ落ちた後だな。

877:デフォルトの名無しさん
08/03/23 20:02:04
人が居ないからって、何も国内の粗悪な学生使わなくても
留学生使えばいいじゃんって話でしょ。
>>874の話は2年くらい前の研究現場に居るとかなり同意出来るんだが、
問題は、既に学生を指揮する立場の研究者の質まで落ちつつあるという事
優秀な人には相当逃げられてる。

上が悪いから、もうどうにもならん。

878:デフォルトの名無しさん
08/03/23 21:41:34
なんでそこで外国人留学生が出てくるのか分からん
どうせ帰るし、日本で就職したとしても奴らは日本で消費せずに本国に送金するだけだろ

879:デフォルトの名無しさん
08/03/24 02:26:33
教育機関じゃないのに、なんで後のことを考えるんだ?
その後国に帰ろうがどこに就職しようが知ったこったねぇ。
選択肢を増やし極力優秀な人材を使うべきだ。と言う話だろうに。

880:デフォルトの名無しさん
08/03/24 05:55:09
留学生に優秀な人材は少ないぞ。いないわけではないにせよ。

881:デフォルトの名無しさん
08/03/24 07:20:37
>>880
アメリカのように留学生にとって魅力的な大学が増えれば、
日本にいる留学生の質も上がるんだろうけどね。

あと、せっかくいい留学生が来ても、学生は英語で日常会話できないし、
教授も英語で講義できないしで、すぐに孤立してやる気をなくしてしまう。

まずは優秀な教授を育てるところから始めないと。

882:デフォルトの名無しさん
08/03/24 10:01:54
留学生が日本語を勉強すればいいじゃん

英語できない教授なんているの?
どこ大?

883:デフォルトの名無しさん
08/03/24 13:19:33
881は明らかにろくな大学行ってないw

884:デフォルトの名無しさん
08/03/24 15:42:21
ですよねー

885:881
08/03/24 19:37:54
一応宮廷ですよ。
もちろん教員は英語普通に話せるよ。
でも授業を全部英語でやるのはまた別の話。

886:デフォルトの名無しさん
08/03/25 00:14:52
「一応宮廷」じゃ分解能に欠けていて話にならん。どこよ。

887:デフォルトの名無しさん
08/03/25 00:21:09
あんまり追求しないでやれよ

888:デフォルトの名無しさん
08/03/25 06:06:18
最大でもたった7校しかないのに分解能に欠けているって・・・プ

889:デフォルトの名無しさん
08/03/25 07:31:42
授業を英語で出来ない教授なんているの?
どこ大?

890:デフォルトの名無しさん
08/03/25 08:16:57
やろうと思えばできるけどやらないって話だろ
日本人が大半の現状でやる意味もないけどな
なんて言ってると日本語のわからない外人が入ってこないから負のスパイラルなんだけどな

891:デフォルトの名無しさん
08/03/25 16:06:06
> 日本人が大半の現状でやる意味もないけどな

どこの話? その認識。いまどき珍しいというか遅れてるというか。

892:デフォルトの名無しさん
08/03/25 18:44:39
その場で適した言語を使うべきであって
言語が何だからどうこうなると言う話でもない。
何か、英語でやればメリットでもあるというの?

この辺はプログラミング言語にも言えることだが・・・。

893:デフォルトの名無しさん
08/03/25 20:05:04
>>892
学術界の共通言語は英語です。
日本人学生は英語でのディスカッションの経験が少なすぎ。
だから教授になっても対等な勝負ができない。
たまにがんばってる先生がいるかと思うと、ヨーロッパやアメリカ帰りだったりするし。

894:デフォルトの名無しさん
08/03/25 20:32:21
>>892
自分でその場その場で言語選択出来るほど、外国語が使えるならな。
残念ながら、英語が出来ない学生が多いので、練習の意味も込めてやるべき。

プログラミング言語だって、VBでもC♯でも、その場で適しているならば使えば良いとは思うし
Cで全てやるのが偉いわけでもないが
VBしか出来ないなら問題。

んで、やらないだけって言ってる人は
基本的に、やれないと俺は思う。
経験が足りない人間が外国語で高度なディスカッション出来るとは思えない。

895:デフォルトの名無しさん
08/03/25 20:35:19
少なくとも大学院の講義は英語でやった方がいいよね〜

896:デフォルトの名無しさん
08/03/26 01:23:37
うちの大学は3年から一部の授業や試験は英語でやってたが

897:デフォルトの名無しさん
08/03/26 07:41:29
うちの大学は学部1年から英語で講義をやってたけど?


ってことになるからそういう話はイクナイ
でも実際俺がいたところはそうだったw

898:デフォルトの名無しさん
08/03/26 16:08:31
どこ?

899:デフォルトの名無しさん
08/04/02 09:08:06
>>868
それって URLリンク(www.slc.atr.jp) のことなの?
質の悪い人材って誰?


900:デフォルトの名無しさん
08/04/02 11:46:07
普段資源整理やらコーパス集めに借り出されてる人材は、そんなページに載らない。
あと、ATRつっても自然言語処理とは限らない。似た研究が結構あるからそっちかもしれん。


>>898
文系の大学だと山ほどあるなw

901:デフォルトの名無しさん
08/04/03 22:27:35
っていうか、>>899のページに載っている人はみんなかなり前から
いた人達だと思うぞ。

902:デフォルトの名無しさん
08/04/10 20:58:25
ATRとNiCTとJSTが契約している翻訳会社の質が悪い

903:デフォルトの名無しさん
08/04/12 00:33:01
NAISTの自然言語関係について、学内の雰囲気知ってる人います?
工藤さんが卒業されたインパクトとか含めて、どんな感じなんでしょうか。

904:デフォルトの名無しさん
08/04/12 02:35:43
これまたダイレクトな質問だなwww

905:デフォルトの名無しさん
08/04/12 16:32:04
そろそろ新入生の研究室配属決定の時期か?

906:デフォルトの名無しさん
08/04/12 18:43:36
やっぱり>>903がデリケートな質問であるような状況なのかな…
不安だ

907:デフォルトの名無しさん
08/04/12 18:50:45
>>906がどこへ行っても上手くやれないだろうということは分かった。

908:デフォルトの名無しさん
08/04/12 20:49:06
最近の雰囲気は知らないが,
工藤氏やたつを氏が在籍したのは昔のこと。
今は特に目立つ人材は居ないのでは。

909:デフォルトの名無しさん
08/04/12 22:04:28
彼らは辞めてから特に有名になっただけでは・・・。
在籍中も、そりゃ無名ではなかったけど、そんなに有名でもなかったし。
そもそも、形態素解析器が一般人(非研究者)にメジャーになったのが、彼らが辞めた後だからなぁ・・・。

それ以前だと、高林氏のnamazuとかkakasiで有名だったか。
何にしても、研究のレベルはともかく、
成果物を広く使えるようにしている研究室は強いな。

910:デフォルトの名無しさん
08/04/30 03:01:03
今自分の居る研究室が、強烈に居心地悪くなった・・・orz
うちの主力が鬱入っちゃって潰れたもんだから。。。
俺らが無能だから悪いんだがね。

911:デフォルトの名無しさん
08/04/30 05:37:35
よくあること。うちの職場でもそうだし。
大体1匹狼状態を作ると、ますますそいつ以外触れなくなって悪循環に陥る。
最初は、些細なきっかけなんだがな・・・

プロジェクト管理やってるやつの責任は重大だよ。

912:デフォルトの名無しさん
08/05/25 14:14:41
自然言語業界は頭が命だから、どうしてもごく一部のすごい人と
大多数のワナビーって構図になるよね。
by ワナビーの一人

913:デフォルトの名無しさん
08/05/28 01:51:20
lrec2008。金持がないと出来ない学問。

914:デフォルトの名無しさん
08/05/28 02:00:20
学問・・・・・・か?

915:デフォルトの名無しさん
08/05/28 16:34:32
>>912
ワナビー的には、どの辺が難しいというか、壁を感じて
いるんでしょう?
FSNLPと東大出版会の「確率的言語モデル」をきちんと読めば、
標準的な所はかなりすっと行くような気もするけど..。

916:デフォルトの名無しさん
08/05/28 17:00:37
>>915
それはお勉強。誰でもできる。問題なのは研究。これは才能がいる。

917:デフォルトの名無しさん
08/05/28 20:57:14
才能といい切ってしまっていいんだろうか。
912の人はどう思っているのかな。

918:デフォルトの名無しさん
08/05/28 21:37:23
才能というか、暗記しかしてこなかった馬鹿とは違うやつらだろ。


919:デフォルトの名無しさん
08/06/05 20:10:35
言い換えの為に、データ形式の類語辞書を探してるんだけど何か無い?

920:デフォルトの名無しさん
08/06/08 09:37:21
第2版。
Speech and Language Processing (2nd Edition) (Hardcover)by Daniel Jurafsky (Author), James H. Martin (Author)

URLリンク(www.amazon.com)

Hardcover: 1024 pages
Publisher: Prentice Hall; 2 edition (May 26, 2008)
Language: English
ISBN-10: 0131873210
ISBN-13: 978-0131873216
Product Dimensions: 9.4 x 6.9 x 1.6 inches
Shipping Weight: 3.5 pounds (View shipping rates and policies)
Average Customer Review: No customer reviews yet. Be the first.
Amazon.com Sales Rank: #22,897 in Books (See Bestsellers in Books)
Popular in these categories: (What's this?)
#2 in Books > Computers & Internet > Computer Science > Artificial Intelligence > Machine Vision
#2 in Books > Computers & Internet > Software > Voice Recognition
#2 in Books > Computers & Internet > Software > Business > Speech Processing

921:デフォルトの名無しさん
08/06/18 23:53:19
>>915
いや、その本頑張って読んでるけど難しすぎ…。

今EMアルゴリズムのところで詰まってます。

44ページの(2.33)なのですが、
「また、ジェンセンの不等式より、次が成り立つ。
Σ[y]P[θ](y|x[i])(log(P[θ](y|x[i])/P[θ ̄](y|x[i])) >= 0

とありますが、これは 8ページ、(1.20)・(1.21)の
「P(x)、Q(x) を確率分布とするとき、不等式
log(x) <= x - 1
より、次が成り立つ。
Σ[x]P(x)log(Q(x)/P(x)) <= Σ[x]P(x)((Q(x)/P(x)) - 1) = Σ[x]Q(x) - Σ[x]P(x) = 0

これの、log の中で Q(x) と P(x) が入れ替わって、符号が逆に→不等号が逆になった
パターンですよね。
Jensen の不等式は使ってないように見えるのですが…
私の勘違いなんでしょうか。

使っているのが Jensen の不等式だろうと、log(x) < x - 1 だろうとどっちでも
いいじゃないかと言われそうですが、気になって先に進めません。
おわかりの方いらっしゃったらよろしくお願いします。

922:デフォルトの名無しさん
08/06/19 02:05:32
(2.33)はKLダイバージェンスは常に正ですよ、というだけだけど、
>>921に書かれている通り、別にJensenの不等式を
使わなくても証明できるね。
無理に?使うなら、Jensenの不等式はf(x)が凸なとき
E[f(x)]≦f(E[x])ということなので、f(x)=log(x)として
-Σplog(p/q)=Σplog(q/p)=E_p[log(q/p)]
≦log(E_p[q/p])=log(Σq/p・p)=log(1)=0
よってΣplog(p/q)≧0、
でいいんじゃないかな。

923:デフォルトの名無しさん
08/06/19 02:16:03
確かに、そこは書き方が難しいね。
でも全部そうだってことではないので、がんがれ。

924:デフォルトの名無しさん
08/06/19 23:49:10
>>922
なるほどー。わかりました。
それにしても、EM アルゴリズムのあたりは難しい…。
式も補って読まないといけないし。

HMM に適用する場合について読んでいるのですが、
117ページの(4.27)は
まず素直に適用すると

Q(M, M ̄) = Σq[1, T]P(q[1, T]|o[1, T], M)log(P(o[1, T], q[1, T]| M ̄)

だけど、P(q[1, T], o[1, T]|M) = P(q[1, T]|o[1, T], M) * P(o[1, T]|M) だから

P(q[1, T]|o[1, T], M) = P(q[1, T], o[1, T]|M) / P(o[1, T]|M)

なので、(4.27)の

Q(M, M ̄) = (1 / P(o[1, T]|M)Σq[1, T]P(q[1, T], o[1, T]|M)log(P(o[1, T], q[1, T]| M ̄)

となるわけですよね。

こうやって書くといかにも当たり前のようだけど、本の中でもう1〜2行でいいから
途中の式を挟んでくれたらわかりやすいのに…と思うけど、
このへんがすらすらわかるぐらいじゃないと NLP やっていけないのだろうか…

925:デフォルトの名無しさん
08/06/20 07:08:05
>>924
まあ論文書こうと思ったら、それぐらい導出できないとなあ。
でも一番大事なのはEMをどう適用するかだと思うよ。

926:デフォルトの名無しさん
08/06/22 01:11:39
また「確率的言語モデル」からの質問です。
115ページの前向き・後ろ向きアルゴリズムのところで、
(4.21)の式の 2行目から 3行目で、分母が

P(X[t] = q[i], X[t + 1] = q[j], o[1, T] | M)

= α[t](i) * a[i, j] * b[j](o[t + 1])β[t + i](j)

となっているのはどうしてでしょうか。

α[t](i) は「モデル M が o[1, t] を生成して、時刻 t で状態 q[i] に到達する確率」(110ページ)、
β[t](i) は「状態 q[i] から始まる状態遷移によって o[t + 1, T] が生成される確率」(112ページ)
ですよね。

ということは、上の式は単純に

α[t](i) * β[t](j)

となりそうな気がするのですが。

よろしくお願いします。


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5399日前に更新/189 KB
担当:undef