[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2chのread.cgiへ]
Update time : 06/30 10:02 / Filesize : 148 KB / Number-of Response : 538
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

自然言語処理スレッド その3



1 名前:デフォルトの名無しさん mailto:sage [2009/02/20(金) 20:31:21 ]
このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。


前スレ:自然言語処理スレッド その2
pc11.2ch.net/test/read.cgi/tech/1173105287/

次スレは>>980

488 名前:デフォルトの名無しさん mailto:sage [2012/05/20(日) 21:11:18.03 ]
>>486
セマンティックウェブという1例しか出していないのに
「なんでもかんでも残念って決めつける人」と決めつける残念な人だったか

489 名前:デフォルトの名無しさん [2012/05/21(月) 15:57:53.43 ]
>>487
>少なくとも自然言語を相手にするには決定的にダメ。

2ちゃんねらー百万人では、まだ足りないのか?

ツイッターとフェイスブックを合わせて500万ではどうだ?

490 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 16:20:30.83 ]
突然コーパスの話にすり替える>>489の負け犬っぷりw


491 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 16:50:19.57 ]
そして>>489の冗談を真に受ける馬鹿っぷりww

492 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 18:32:02.11 ]
冗談?>>489のどこが面白いの?

493 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 19:11:28.79 ]
話変わるけど皆さん大学で体系的に言語処理を学んだ感じですか?
独学でヒッソリみたいな人はいないのだろうか

494 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 20:37:00.75 ]
>>492
怒りでチンコが勃起してるのか?

495 名前:デフォルトの名無しさん mailto:sage [2012/05/21(月) 20:50:36.09 ]
>>494
消えろこの知能障害!

496 名前:デフォルトの名無しさん mailto:sage [2012/05/22(火) 11:00:02.74 ]
まぁ、>489は面白くないんだけどね。



497 名前:デフォルトの名無しさん mailto:sage [2012/05/22(火) 14:42:03.65 ]
あれ、もしかして、地球人全員動員すれば可能じゃね?


498 名前:デフォルトの名無しさん mailto:sage [2012/05/22(火) 22:14:07.87 ]
>>493
自然言語処理は、通り一遍のこと以上を教えられる先生はまだそんなに多くないので、
それ専門にやってる先生がいない大学のレベルなら、独学でもいけるように思う。

499 名前:デフォルトの名無しさん mailto:sage [2012/05/23(水) 23:15:29.50 ]
最近は機械学習とn-gramだけ分かればいいからな




500 名前:デフォルトの名無しさん mailto:sage [2012/05/24(木) 08:23:36.97 ]
>>499
自然言語処理が専門だけど、n-gramとか難しすぎてさっぱりだよ。

501 名前:デフォルトの名無しさん [2012/05/24(木) 15:04:22.30 ]
>例:水は水素と酸素の化合物である。

例えば「水」「氷」「水蒸気」については、「凍る」「溶ける」「蒸発する」「気化する」など、
様々な動詞を挟んでRFDデータベースが作成される。「凍る」と「溶ける」は反対語、
「蒸発する」と「気化する」は類義語であるが、「蒸発する」は「人間が行方不明になる」の意味もある。
けれども人間は蒸発はしても気化はしない。RFDデータベースにより、類義語の微妙な違いを理解させる。
「同一ではないが類似」について、共通点と相違点を、RFDデータベースにより明らかにしていきたい。

「たけし」と「たけし軍団」は違うけれど、「イェニチェリ」と「イェニチェリ軍団」は同じであることが分からないといけません。
www.nii.ac.jp/userdata/shimin/documents/H23/120118_7thlec02.pdf

これもRDFデータベースが充実していれば、「たけし」と「たけし軍団」ではRDFデータベースは全く違うが、
「イェニチェリ」と「イェニチェリ軍団」は似たようなRFDデータベース関係となることが理解されよう。
更に言えば百万冊の書籍について一文一文、いつ何処で誰が何をしたか、あるいは何が何にどうしたかを、
2チャンネラー百万人を動員して人力で詳細解析してコンピュータに入力するというやり方も考えられる。

502 名前:デフォルトの名無しさん mailto:sage [2012/05/24(木) 20:10:56.93 ]
言語観がナイーブすぎ

503 名前:デフォルトの名無しさん mailto:sage [2012/05/25(金) 07:33:54.44 ]
>2チャンネラー百万人を動員して人力で詳細解析してコンピュータに入力するというやり方も考えられる。
この一文だけで妄言だと分かる


504 名前:デフォルトの名無しさん mailto:sage [2012/05/25(金) 20:26:58.58 ]
>>420
> ご利用いただきまして、ありがとうございます。
> また、こちらからの返信が遅れましたことをお詫び申し上げます。
>
> お問い合わせの件でございますが、担当者より下記の回答がございましたので、ご
> 確認いただけますようお願いいたします。
>
>
> 膨大なテキストデータの圧縮にVF符号化を使うと、データの符号化・復号化のための
> オーバーヘッドが発生するため、高速で質問応答の計算を行う状況では、こういっ
> た手法は用いないのが一般的です。
> このため十分なディスク容量と、インメモリで解答を計算できるような大容量メモ
> リを搭載したシステムを利用します。

505 名前:デフォルトの名無しさん mailto:sage [2012/05/26(土) 22:08:43.24 ]
>>500
俺の知ってるn-gramは学部生で分からなかったら
アホレベルだと思うんだけどなぁ

専門の奴でも難しく感じるくらいの
n-gramが他にあるのか?

506 名前:デフォルトの名無しさん mailto:sage [2012/05/27(日) 10:47:17.10 ]
むしろ簡単すぎ、役に立たな過ぎで
逆にわからないと感じてしまうとか



507 名前:デフォルトの名無しさん mailto:sage [2012/05/27(日) 16:37:26.17 ]
自然言語処理でN-gram以上に役立つものなんて存在しないだろ


508 名前:デフォルトの名無しさん mailto:sage [2012/05/28(月) 20:50:41.16 ]
最初にオライリーの自然言語処理入門買ったけど選択ミスだった
妙に分厚いのでなんでも網羅してるだろうと思ったら大間違い
何ら本質的な事は書いてなくて、ツールの使い方がダラダラ続くだけ
その後確率的言語モデル系の本に出会ってようやく言語処理の取っ掛かりが掴めた

509 名前:デフォルトの名無しさん mailto:sage [2012/05/29(火) 15:29:23.97 ]
折角だからその役に立った本をステマしてってよ。

510 名前:デフォルトの名無しさん mailto:sage [2012/05/29(火) 16:14:22.27 ]
確率的言語モデルでググってみたら?

511 名前:デフォルトの名無しさん mailto:sage [2012/05/29(火) 17:10:35.24 ]
テキストマイニングみたいなものではなく
係り受け解析や述語項構造解析をがんばってほしい



512 名前:デフォルトの名無しさん mailto:sage [2012/06/02(土) 05:48:26.55 ]
>>505
n-gramはただ出現数を数えただけでもSVMに放り込むか検索のキーに使うかって感じでもちろん使えます。
でも、文の出現確率をうまく近似するためのスムージングとか、巨大なn-gramモデルを扱うためのデータ構造やらプルーニングやらで、面倒で奥深く最近もまだ研究が続いているのですよ。

とは言え、使うだけならSRILMとかあるので、理解する必要かあるかはやりたいこと次第だけれど。

513 名前:デフォルトの名無しさん mailto:sage [2012/06/06(水) 18:20:56.54 ]
1ヶ月近く前の5/11にお問い合わせ頂いておりました件ですが、
大変申し訳ございません、
弊社内で担当割りがされないままの状態が今になって発覚いたしました。
大変失礼いたしました。

今更で大変恐縮ですが、お問い合わせに対応させて頂けたらと思っております。


<いただいたお問い合わせ>
wacom.jp/jp/company/news_detail.php?id=426

>双方がPCとペンタブレットを使用して同じ教材を閲覧するとともに、手書きで書き
込みをし合うことができるため、

数式についても、インターネットクラウドサービス上で『データ化』してやり取りできるということですか。

数式入力パネルを使用して数式を入力および訂正する
windows.microsoft.com/ja-JP/windows7/Use-Math-Input-Panel-to-write-and-correct-math-equations


数学の入試問題は数式と図形と日本語の混合ですが、ワコムの手書き入力システムは
それにも対応して『デジタル化』できますか。
Windows7に手書き数式入力パネルが用意されているのだから、それと連携するクラウ
ドシステムがあってもよさそうな気がしますが。

(2003年の東大)円周率は3.05より大きいことを証明せよ。
d.hatena.ne.jp/LM-7/20070310/1173504483

例えばこうした証明問題についても、手書きの解答記述を図形も含めてデジタル化できますか。
これは平方根でこれは微分でこれは行列でこれは三角形でこれは円でこれは放物線だ、と。
更に言えば、類似の問題を検索する機能は開発されているのですか。

514 名前:デフォルトの名無しさん mailto:sage [2012/06/06(水) 18:22:08.87 ]
【要望】
手書きのOCRは誤認識が多いが、原稿用紙のようにマス目を設定したり、あるいは文
脈から誤認識を検出するシステムが求められる。

実験では、文字誤りモデルの有効性を検証するためにOCR 誤り訂正システムを実装し
た。実験の結果、文字正解率 97.2% の高いベースラインに対して 12.5% の認識誤り
を訂正することができた。
www.phontron.com/paper/neubig09nlp.pdf

図形についてもこれは楕円なのか円なのかというのも、解答記述の数式から推測する
アルゴリズムとか。上の証明問題は「円周率」と書いてあるから、関連する曲線図形
も「円」であることは認識できるはず(あるいは楕円や放物線や双曲線を用いて円周
率を証明する方法が考えられるか)。また「閾値」が怪しいようなら、いくつかの選
択候補を提示するとか。

========================

<回答>
仰る通り数式入力パネルを使用してのデジタルでの数式入力は可能(対応アプリが必要)です。
弊社、または現時点での弊社パートナー様のシステムで
クラウド上でデジタル数式をやりとりするといったサービスはございません。
数式のデジタル化は文字認識という意味では可能ですし、通常の文字も文字認識変換は
Windows7(またはVista)の機能で可能です。
ただ、それに「連携」という意味でのクラウドサービスについては分りかねます。
実際に弊社の液晶ペンタブレットの実機をお貸出しして検証いただくことは可能です。

大変恐れ入りますが、差し支えなければ篠田様のご職業を伺ってもよろしいでしょうか?
本件の対応につき、直接お電話などさせていただければ幸いでございます。
もしよろしければご連絡先お電話番号をおしらせいただけますでしょうか。

何卒よろしくお願い申し上げます。

515 名前:デフォルトの名無しさん mailto:sage [2012/06/07(木) 12:14:48.07 ]
NLTKのバージョン2がリリース
NLTK 2 Release Highlights | StreamHacker
streamhacker.com/2012/06/03/nltk-2-release-highlights/

NLTK 2.0.1、別名NLTK 2は 、最近リリースされました、
何以下は、私のお気に入りの変更点、新機能、およびからのハイライトであるのChangeLog 。

516 名前:デフォルトの名無しさん mailto:sage [2012/06/07(木) 12:37:23.65 ]
>>515
日本語でOK w

以下は、私が気に入った変更点、新機能、ChangeLogからの抜粋です。

程度の訳でいいのかな。



517 名前:デフォルトの名無しさん mailto:sage [2012/06/07(木) 12:44:43.12 ]
>>516
google翻訳です。

518 名前:デフォルトの名無しさん mailto:sage [2012/06/07(木) 21:06:44.89 ]
>>517
なぜここにgoogle翻訳なんか投げる必要が

519 名前:デフォルトの名無しさん mailto:sage [2012/06/08(金) 07:32:09.58 ]
自然言語処理スレだから自然言語処理の力を使ったのだろう
「自分の作ったドックフードを食え」
の精神に則ったよい心がけだと思うわ


520 名前:デフォルトの名無しさん mailto:sage [2012/06/16(土) 16:09:52.73 ]
生成文法ってやつあるけど
自然言語処理と何か関係あったり役立つことありますか?

521 名前:デフォルトの名無しさん mailto:sage [2012/06/16(土) 20:48:49.43 ]
自然言語処理の基礎としてたいてい生成文法の話はやるけど?

522 名前:デフォルトの名無しさん [2012/06/17(日) 00:29:43.78 ]
やるけど、役に立つのか?


523 名前:デフォルトの名無しさん mailto:sage [2012/06/17(日) 01:50:38.02 ]
否が応でも勝手に頭にたたき込まれているから問題ない。
というか、文系の言語学の連中より我々の方があれをまともに使っている。

524 名前:デフォルトの名無しさん mailto:sage [2012/06/17(日) 03:44:24.23 ]
何が「問題ない」で、何が「というか」なんだ?

525 名前:デフォルトの名無しさん mailto:sage [2012/06/17(日) 12:56:59.56 ]
正直やればわかるとしか言いようがないな

526 名前:デフォルトの名無しさん mailto:sage [2012/06/17(日) 17:19:37.17 ]
>>520
研究として自然言語処理をするなら知っておくとよいかもしれません、という程度です。視野を広げる意味で。
言語学で使われているような生成文法を使ってどうこうする、ということは今のところ無いです。



527 名前:デフォルトの名無しさん mailto:sage [2012/06/17(日) 19:40:38.48 ]
>>525
つまり答えられませんってことだろ


528 名前:デフォルトの名無しさん mailto:sage [2012/06/18(月) 11:53:26.56 ]
そう思うなら好きにしろ。
あとで「そんな便利なものがあったのか」と泣く自由はあるからな。

529 名前:デフォルトの名無しさん [2012/06/21(木) 21:56:17.12 ]
LFGも生成文法?! これはMicrosoftが
自然言語処理エンジンに使用している。
チョムスキーのは,言語学者の遊び。

530 名前:デフォルトの名無しさん mailto:sage [2012/06/22(金) 08:08:51.20 ]
違うよ。
チョムスキーの理論を唯一まじめに使っているのは我々だけだということ。

531 名前:デフォルトの名無しさん mailto:sage [2012/06/22(金) 10:41:12.81 ]
言語学者にいぢめられたバカが必死、なのか?

532 名前:デフォルトの名無しさん mailto:sage [2012/06/22(金) 10:47:23.23 ]
>>531
頭が悪いやつだな。
言語学者の仕事と我々の仕事は違うんだよ。連中は実装しない。

533 名前:デフォルトの名無しさん mailto:sage [2012/06/22(金) 14:39:53.35 ]
無知なやつだな。

534 名前:デフォルトの名無しさん mailto:sage [2012/06/26(火) 02:07:25.61 ]
>>532
もしかして、HPSGパーザーを作ってる方でしょうか。であれば、生成文法は基礎として必要なのは確かですね。
前に生成文法が自然言語処理に必要ないと言ったのは、別にHPSGを否定したかったのではなく、自然言語処理一般では使わないという意味でした。ただ他には目立った用途がない以上、当面必要ない人にまで勉強するべきとはいえないと思います。


535 名前:デフォルトの名無しさん mailto:sage [2012/06/26(火) 09:23:31.89 ]
hello worldを書くのに必要ないから、プログラミングに数学はいらない、みたいな意見だな。

536 名前:デフォルトの名無しさん mailto:sage [2012/06/26(火) 18:54:27.63 ]
>>535
パーザーはhello world ほど、誰もがかける必要があるプログラムではありませんし、生成文法は数学ほど重要ではないと言う意見です。



537 名前:デフォルトの名無しさん mailto:sage [2012/06/28(木) 10:36:05.94 ]
荒れたおかげでまともな人も来たようだな







[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<148KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef