- 1 名前:login:Penguin [03/10/19 20:35 ID:qpiLj0r9]
- クライアント・サーバー型の日本語入力システム
Cannaをみんなで育てて便利にしようというスレッドです。 canna.sourceforge.jp/ 前スレ pc.2ch.net/test/read.cgi/linux/1032570972/ その他のリンクは>>2-3あたり
- 575 名前:login:Penguin mailto:sage [2008/02/21(木) 21:58:28 ID:YRgnlL2F]
- 変換効率的にも理論的にも Anthy のほうが優れている。
Canna を積極的に使う理由はないと思われる。
- 576 名前:login:Penguin mailto:sage [2008/02/21(木) 23:14:09 ID:GsN6fGtq]
- >>575
変換効率はともかく、理論的に優れるってどういう意味? IMとかMUAは慣れが重要だからイキナリ移れって言えないと思う。
- 577 名前:login:Penguin mailto:sage [2008/02/22(金) 00:21:52 ID:2IwtxeNp]
- だから、積極的に使わないで消極的にみんな使っているのではないかと。。
Canna は単語コストは人手でつけているし文節区切りは二文節最長一致の ヒューリスティックでしょう。つまり人手だらけ。Anthy は最近統計的 手法(これは数学的背景に基づいている)で確率的なコストをつけたり、 モデルとしても隠れマルコフモデル(HMM)とか最大エントロピーモデル (MEMM)とか導入して、割と最近の自然言語処理研究の成果を取り入れようと している。逆に変換効率はヒューリスティックのほうがいい可能性がある (特に学習モデルがちゃんと機能していない場合)けど、少なくとも去年 前半くらいまでの Anthy は Canna よりよかったと思う。最近はかなり アグレッシブに理論的なところをがんばった結果、逆に精度が落ちている。。
- 578 名前:login:Penguin mailto:sage [2008/02/22(金) 04:27:07 ID:7hgBMGql]
- 消極的にWnn7だ。
egg さえ動いてくれたら、実はなんでもいいって話もある。
- 579 名前:login:Penguin mailto:sage [2008/02/22(金) 12:44:59 ID:o/Fj9BBI]
- WXG……
- 580 名前:login:Penguin mailto:sage [2008/02/23(土) 17:47:39 ID:JNdtgFNK]
- vje+esecanna...
- 581 名前:login:Penguin mailto:sage [2008/04/20(日) 12:01:33 ID:qZG/1R2x]
- WXG for Linuxは優秀だった。死んでしまったのが今でも悔やまれる
- 582 名前:login:Penguin mailto:sage [2008/04/20(日) 16:52:16 ID:zF9t0Gom]
- WXG for Linuxが辞書が壊れる致命的なバグが放置されたまま
- 583 名前:login:Penguin mailto:sage [2008/05/29(木) 10:33:49 ID:syNu8Fkt]
- Anthyも墓場行きになったし誰かまたCannaを再復活させろよ
- 584 名前:login:Penguin mailto:sage [2008/05/29(木) 12:04:19 ID:O6cor6H+]
- いまがんばってるんじゃなかったっけ?
- 585 名前:login:Penguin mailto:sage [2008/06/27(金) 04:11:47 ID:b7Id5B2E]
- 復活も何も一応使えるだろ
辞書くらい自分でメンテすりゃいいじゃん
- 586 名前:login:Penguin mailto:sage [2009/02/06(金) 14:39:14 ID:zlx94K9b]
- お前らanthyに移住したの?
- 587 名前:login:Penguin mailto:sage [2009/04/15(水) 22:27:57 ID:rzELP1AO]
- anthyはキューハチで使ってる
PC-98 + Linux + busybox + nemacsな環境で + anthyにしてる 勿論普段使いでなく、メインはCanna LANで複数マシン使うなら、やっぱりCanna
- 588 名前:login:Penguin mailto:sage [2009/08/26(水) 23:50:30 ID:raY3g5N5]
- CANAANスレと間違えた俺はどうすれば…
- 589 名前:login:Penguin mailto:sage [2009/10/06(火) 04:28:55 ID:bQXi/F/j]
- canna で質問なんですが
頻度情報って回数でちゃんと持ってるのでしょうか なんか一回使った文字が必ず先頭に出て来るだけ。 一文字でも使うとそれを含んだ熟語も全部先頭に来てしまう。 mkdic -fq `lsdic -i` はしてあります。
- 590 名前:login:Penguin mailto:sage [2009/10/07(水) 09:34:48 ID:dw/iZ4F6]
- Cannaは別途頻度辞書というのを使ってる
- 591 名前:login:Penguin mailto:sage [2009/10/17(土) 17:10:42 ID:53vGs0jU]
- え・・と
その頻度辞書はmkdicとは別にあるということ? 頻度情報はその別の辞書で回数保持されていて、 mkdicで生成される頻度辞書では足りないということ?
- 592 名前:login:Penguin mailto:sage [2009/10/17(土) 17:24:28 ID:53vGs0jU]
- 「頻度学習ファイルはシステム辞書のみで作られてユーザ辞書では作られない。」
例えば”とうきょう””たんご”はシステム起動時には必ず”等強””単後”となる。 これは地名辞書等がユーザ辞書であるため? しかし「等強」「単後」←こんな言葉は日本語に存在しないと思うのだが。 なぜこんな変なものが登録されて代わりに当り前の単語が後方に追いやられてるのだろう。 システム辞書の単語は削除出来無いのか。
- 593 名前:login:Penguin mailto:sage [2009/10/18(日) 12:14:36 ID:po14eSAU]
- にし→「二誌」
ないないw
- 594 名前:login:Penguin mailto:sage [2010/03/22(月) 05:45:22 ID:+IgLRQUQ]
- トウキョウは候補一つ
東京 タンゴは候補二つ 単語 丹後
- 595 名前:login:Penguin mailto:sage [2010/03/22(月) 06:10:01 ID:8gpAh1oT]
- +端午+単五 (Anthy) ・・・微妙
- 596 名前:login:Penguin mailto:sage [2010/03/24(水) 03:00:17 ID:D4crZAMy]
- 長年使い続けてる学習結果の賜
人が/いないか/探してみる。 それ/以外にも/用途が/あった。 責任感も/伴い、/社会人/らしくなって/きた。 ttp://www.justsystems.com/jp/products/atok_linux/ でも「らしくなってきた」を一発で変換したい。 「らしくなってくる」を#KXで登録すりゃいいのかな?
- 597 名前:login:Penguin mailto:sage [2010/03/24(水) 03:14:38 ID:D4crZAMy]
- 自己レス
「社会人」を#F14にも登録 (+ #T35)。これで「社会人らしく」まで一発変換 「らしくなる」を#R5rで登録 「なってくる」を#KXで登録 社会人らしく/なってきた。 社会人らしくなって/きた。 こうなると「社会人らしくなってきた」まで一発変換したくなってきた。 「〜らしく」+「なってきた」の連結がうまくいかない。
- 598 名前:login:Penguin mailto:sage [2010/03/29(月) 02:41:58 ID:4/aDQxCU]
- なぎ #KJ g
くさなぎ #JNS 草g くさなぎつよし #JN 草g剛 by canna
|

|