- 1 名前:デフォルトの名無しさん [05/01/25 07:38:01 ]
- 日本語はご存じの通り、文章が単語で区切られていません。
そこで検索のインデックスを作る際には、まず単語や品詞に分ける必要があります。 これを形態素解析といいます。 このスレでは、その形態素解析について語っていきましょう。
- 320 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 07:21:39 ]
- >>316
だからマルコフ連鎖をA*探索したのとどう違うんだって?
- 321 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 21:14:40 ]
- naist-jdic マダ−?
- 322 名前:デフォルトの名無しさん [2008/02/07(木) 23:29:31 ]
- >>320
前後のつながりだけじゃないって書いてるじゃん。
- 323 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 23:36:23 ]
- >前後の繋がりだけではなく、すべての分割に対してもっとも確率が上がるもの
ここをもうちょっと formal な形で言わないと伝わらないと思われ どういう確率モデルを想定しているのか。つーか俺にも伝わってない 単語分割をマルコフ連鎖でモデル化したのなら >320 の指摘通りだと思うのだが
- 324 名前:デフォルトの名無しさん mailto:sage [2008/02/10(日) 16:31:23 ]
- このへんとか
www.amazon.co.jp/%E8%A8%80%E8%AA%9E%E3%81%A8%E8%A8%88%E7%AE%97-4-%E7%A2%BA%E7%8E%87%E7%9A%84%E8%A8%80%E8%AA%9E%E3%83%A2%E3%83%87%E3%83%AB-%E5%8C%97-%E7%A0%94%E4%BA%8C/dp/4130654047
- 325 名前:デフォルトの名無しさん mailto:sage [2008/02/10(日) 16:37:25 ]
- >>324
ああ、その本はいい本だよ。B4のゼミとかに丁度いいんじゃないかな。
- 326 名前:デフォルトの名無しさん mailto:sage [2008/02/11(月) 08:21:36 ]
- 結局313が何を言いたかったのかは謎なまま時は過ぎてゆく…
- 327 名前:デフォルトの名無しさん [2008/02/23(土) 13:44:46 ]
- 音声の検索システムできた。
- 328 名前:デフォルトの名無しさん mailto:sage [2008/02/23(土) 14:13:43 ]
- ソースうp
- 329 名前:デフォルトの名無しさん [2008/03/27(木) 07:31:14 ]
- >MySQLおよびPostgreSQLで日本語キーワードインデック
>スを実現しているもの(Sennaおよびtextsearch-ja)は、 >現在バックエンドエンジンとしてMecabを推奨してい >るようです。 あるフォーラムあらのコピーですが、本道だとすると、 すごいですね?! AppleのOSXの日本語処理もMecab? Mecabの一人勝ちか。
- 330 名前:デフォルトの名無しさん mailto:sage [2008/03/29(土) 01:45:22 ]
- >>329
>AppleのOSXの日本語処理もMecab? そうなん? Mac OS X には Language Analysis Manager というのがあるけど。 ありゃ、リファレンスを見ると Leopard から deprecated だな。
- 331 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 11:11:05 ]
- >>330
おっと、ちょっと調べたら確かにMeCabが使われてるね。知らんかった。
- 332 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 23:48:58 ]
- なさけねえな、Apple
スピーチ周りでVocaloid時代を十数年先取りしてた企業のくせに 自社技術捨ててオープン物に蔵換えか そろそろジョブズ氏ねよ
- 333 名前:デフォルトの名無しさん mailto:sage [2008/04/07(月) 06:31:49 ]
- >>332
初音ミクのApple版でも出せってかw まー形態素解析ってメインは日本語とかでしょ。アジア方面はもともと「二の次」感が。 オープンソースで手に入る共通な技術があったなら使わせてもらう、というのが流れ なのかなあと。もう何から何まで自家製というんじゃなくて、企業として独自性を 打ち出す部分だけ頑張る、みたいな感じなんじゃないかな。
- 334 名前:デフォルトの名無しさん mailto:sage [2008/04/07(月) 19:37:41 ]
- しょうがないよ、マック信者は舶来物信者だから、アジア方面に力を入れないほうが売れるんだよ。
- 335 名前:デフォルトの名無しさん mailto:sage [2008/04/09(水) 21:10:16 ]
- ただのりあぽーか。
- 336 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 02:47:39 ]
- blog界隈で信者のMac IMEを褒めたたえる声が目立つと思ったら、
オープンものに頼った結果ってことか。 奴らの言う最先端とやらは素晴らしい技術力だことで(呆 MS-IMEの糞っぷりも失笑ものだが、 Macの信仰のしどころの間違いっぷりは抱腹絶倒だな
- 337 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 07:44:33 ]
- Mac に IME なんて無いけどな。
- 338 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 00:53:20 ]
- 今はもうInput Method EditorのEはつけずにIMって呼び方のほうが一般的じゃない?
|

|