[表示 : 全て 最新50 1-99 101- 201- 301- 2chのread.cgiへ]
Update time : 05/09 09:30 / Filesize : 68 KB / Number-of Response : 339
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

形態素解析と日本語処理



1 名前:デフォルトの名無しさん [05/01/25 07:38:01 ]
日本語はご存じの通り、文章が単語で区切られていません。
そこで検索のインデックスを作る際には、まず単語や品詞に分ける必要があります。
これを形態素解析といいます。
このスレでは、その形態素解析について語っていきましょう。

320 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 07:21:39 ]
>>316
だからマルコフ連鎖をA*探索したのとどう違うんだって?

321 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 21:14:40 ]
naist-jdic マダ−?

322 名前:デフォルトの名無しさん [2008/02/07(木) 23:29:31 ]
>>320
前後のつながりだけじゃないって書いてるじゃん。

323 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 23:36:23 ]
>前後の繋がりだけではなく、すべての分割に対してもっとも確率が上がるもの
ここをもうちょっと formal な形で言わないと伝わらないと思われ
どういう確率モデルを想定しているのか。つーか俺にも伝わってない
単語分割をマルコフ連鎖でモデル化したのなら >320 の指摘通りだと思うのだが

324 名前:デフォルトの名無しさん mailto:sage [2008/02/10(日) 16:31:23 ]
このへんとか
www.amazon.co.jp/%E8%A8%80%E8%AA%9E%E3%81%A8%E8%A8%88%E7%AE%97-4-%E7%A2%BA%E7%8E%87%E7%9A%84%E8%A8%80%E8%AA%9E%E3%83%A2%E3%83%87%E3%83%AB-%E5%8C%97-%E7%A0%94%E4%BA%8C/dp/4130654047


325 名前:デフォルトの名無しさん mailto:sage [2008/02/10(日) 16:37:25 ]
>>324
ああ、その本はいい本だよ。B4のゼミとかに丁度いいんじゃないかな。

326 名前:デフォルトの名無しさん mailto:sage [2008/02/11(月) 08:21:36 ]
結局313が何を言いたかったのかは謎なまま時は過ぎてゆく…

327 名前:デフォルトの名無しさん [2008/02/23(土) 13:44:46 ]
音声の検索システムできた。

328 名前:デフォルトの名無しさん mailto:sage [2008/02/23(土) 14:13:43 ]
ソースうp



329 名前:デフォルトの名無しさん [2008/03/27(木) 07:31:14 ]
>MySQLおよびPostgreSQLで日本語キーワードインデック
>スを実現しているもの(Sennaおよびtextsearch-ja)は、
>現在バックエンドエンジンとしてMecabを推奨してい
>るようです。

あるフォーラムあらのコピーですが、本道だとすると、
すごいですね?! AppleのOSXの日本語処理もMecab?

Mecabの一人勝ちか。

330 名前:デフォルトの名無しさん mailto:sage [2008/03/29(土) 01:45:22 ]
>>329
>AppleのOSXの日本語処理もMecab?

そうなん?
Mac OS X には Language Analysis Manager というのがあるけど。
ありゃ、リファレンスを見ると Leopard から deprecated だな。

331 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 11:11:05 ]
>>330
おっと、ちょっと調べたら確かにMeCabが使われてるね。知らんかった。

332 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 23:48:58 ]
なさけねえな、Apple
スピーチ周りでVocaloid時代を十数年先取りしてた企業のくせに
自社技術捨ててオープン物に蔵換えか
そろそろジョブズ氏ねよ

333 名前:デフォルトの名無しさん mailto:sage [2008/04/07(月) 06:31:49 ]
>>332
初音ミクのApple版でも出せってかw
まー形態素解析ってメインは日本語とかでしょ。アジア方面はもともと「二の次」感が。

オープンソースで手に入る共通な技術があったなら使わせてもらう、というのが流れ
なのかなあと。もう何から何まで自家製というんじゃなくて、企業として独自性を
打ち出す部分だけ頑張る、みたいな感じなんじゃないかな。

334 名前:デフォルトの名無しさん mailto:sage [2008/04/07(月) 19:37:41 ]
しょうがないよ、マック信者は舶来物信者だから、アジア方面に力を入れないほうが売れるんだよ。

335 名前:デフォルトの名無しさん mailto:sage [2008/04/09(水) 21:10:16 ]
ただのりあぽーか。

336 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 02:47:39 ]
blog界隈で信者のMac IMEを褒めたたえる声が目立つと思ったら、
オープンものに頼った結果ってことか。
奴らの言う最先端とやらは素晴らしい技術力だことで(呆

MS-IMEの糞っぷりも失笑ものだが、
Macの信仰のしどころの間違いっぷりは抱腹絶倒だな

337 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 07:44:33 ]
Mac に IME なんて無いけどな。

338 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 00:53:20 ]
今はもうInput Method EditorのEはつけずにIMって呼び方のほうが一般的じゃない?








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<68KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef