[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 05/09 11:51 / Filesize : 203 KB / Number-of Response : 825
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

mozc / Google 日本語入力 #1



1 名前:login:Penguin [2010/05/13(木) 11:58:50 ID:e7jJ/yN9]
code.google.com/p/mozc/
ref.
sourceforge.jp/magazine/10/05/11/0335246
googlejapan.blogspot.com/2010/05/google_10.html

792 名前:login:Penguin mailto:sage [2010/08/11(水) 11:00:04 ID:iYJXMA6n]
>>787
オプションでオンオフできるようになっているといいというのは分かる。
予測入力はオンオフできるので、そうすればいいと思うけどね。

ローマ字入力修正機能がなければ変な誤変換がない、というのは誤解で、
そもそも変な誤変換が起きた原因は適当にコストをつけたせい。
ローマ字入力修正機能がなくても(あそこで露見しなかっただけで)変な誤変換をするはず。
砂の上に城を建てて地震で全部壊れて「地震が起きたせいだ」と言うようなものだが、
そもそも砂の上に建てるのが悪いわけで。

品詞IDを固定にしないのは、まだ精度が向上できると思っているからでしょう。
「精度はもうこんなものでいいからメンテナンス性を上げてくれ」という要望はあるだろうが、
「もっと精度を上げてくれ」という要望もあるんじゃないかな?
いま品詞増やしているところなんだから、落ち着くまで待ってみては。

793 名前:login:Penguin mailto:sage [2010/08/11(水) 12:05:43 ID:k5+025hu]
>>792
> ローマ字入力修正機能がなければ変な誤変換がない、というのは誤解で、

いやいや、「くだんの変な誤変換」というのは、日本脳炎の件ようなことを指していて、
ある一定の条件で「にほんおうえん」が「日本脳炎」に変換されるというのは、
コスト付けが適当だったせい+ローマ字入力変換機能のワンツーパンチで発生した。

> いま品詞増やしているところなんだから、落ち着くまで待ってみては。

うん、待ってる。
だけど、それってmozcのため "だけ" の作業なのであんまし期待してない。

そっちよりDebian (ていうかNIIBEさん) が引き継いだAnthyの方に
ひそかに期待してる。

794 名前:login:Penguin mailto:sage [2010/08/11(水) 17:56:10 ID:RKWCzkwj]
このアルゴリズムでマトモな精度で変換するには
辞書をつくるためのコーパスの量を数ケタ上げるしかない。
でも、そんな量のコーパスを用意するのは、
google IMEでは可能でも、mozcでは不可能。

残念でした。

795 名前:login:Penguin mailto:sage [2010/08/12(木) 01:20:10 ID:R2+IxwA8]
またコーパス君の登場か。


796 名前:login:Penguin mailto:sage [2010/08/12(木) 04:20:34 ID:vRk0mlkL]
mozcの起動時に「変換エンジンプログラムの起動に失敗しました。」云々で起動しない件は、
code.google.com/p/mozc/issues/detail?id=21&can=1
を参照。
次のアップデートでなおる模様。


797 名前:login:Penguin mailto:sage [2010/08/12(木) 12:33:25 ID:jxSVdslB]
>>793
いやいや、つまりそもそもコスト付けを適当にしなければ発生しないわけで。
両方の条件が揃ったときに発生するのはその通りだけど、
直すべきは適当なコスト付けのほうであり、ローマ字入力訂正機能ではないと。

品詞体系の整備は別に Mozc のためだけじゃないと思うよ。
統計的な IME であればどれでも恩恵があるはず。
事実上統計的でオープンソースな IME 自体が少ないので Mozc のためだけになるかもしれないけど…

798 名前:login:Penguin mailto:sage [2010/08/14(土) 02:37:15 ID:e75fvtZ6]
r38キター
そして、不具合直った!
中の人GJ!

799 名前:login:Penguin mailto:sage [2010/08/27(金) 06:20:41 ID:JNfYRWcD]
debian ではnon-freeになるみたい。

800 名前:login:Penguin mailto:sage [2010/08/27(金) 09:25:27 ID:Y8H/0QBm]
>>799
なんで?



801 名前:login:Penguin mailto:sage [2010/08/27(金) 09:57:03 ID:4AwcYRna]
>>800
bugs.debian.org/cgi-bin/bugreport.cgi?bug=591731

802 名前:login:Penguin mailto:sage [2010/08/28(土) 04:29:10 ID:3/mAytNo]
>>797
コスト付け直すのは対症療法って気がするけどね。
訂正機能使いたい人はトレードオフでいいけど、
そもそも余計なお世話だとしか思えない人にはすっきりしない話だと思うんだ。

803 名前:login:Penguin mailto:sage [2010/08/28(土) 04:49:18 ID:3/mAytNo]
>>801
もしかして>>727辺りの話が不明確って事なんだろうか?

この際、フリーな変換辞書データの決定版を目指すプロジェクトでも立ち上がらないものかな?
wikipedia辺りは使えるんだろうか?

804 名前:login:Penguin mailto:sage [2010/08/28(土) 05:40:00 ID:JuoBlAAn]
mozcって変換精度が飛び抜けて優れているわけではないし、
UIも他のIMEのモノマネでしかない。

どこがいいの?

805 名前:login:Penguin mailto:sage [2010/08/28(土) 07:54:44 ID:ivXPl8T9]
Googleのブランド
プラシボ

806 名前:login:Penguin mailto:sage [2010/08/28(土) 13:54:28 ID:+rnQGJGE]
>>804
Anthyよりはずっと良いじゃん

807 名前:login:Penguin mailto:sage [2010/08/28(土) 14:17:08 ID:sk8QD7aO]
連文節変換はね。
単文節変換ばっかしする人は辞書があれだからダメな子になってしまうかも。

UIにオリジナリティが必要かどうかはさておき、SCIMが死んだ今、まともなGUI
設定ツールがあるのは珍しい方なんじゃない?

808 名前:login:Penguin mailto:sage [2010/08/28(土) 14:42:58 ID:l8RYa1bV]
>>806 G-HAL AnthyとMozcはどっこいどっこい

809 名前:シベリアより代筆 mailto:sage [2010/08/28(土) 15:16:50 ID:0GiDpPnI]
>>801
問題にされているのはmozcが使っているmecab-ipadicは、ICOT projectの
成果を含んでいて、そのICOT projectのsoftwareのlicenseにdebianが問題と
している箇所が含まれている、ということ[1]
mecabの開発者さんの見解としては[2]から始まるスレッドで見ることが出来る。
Fedoraではfreeという扱いになっている[3]

[1] code.google.com/p/mozc/issues/detail?id=20
[2] sourceforge.jp/projects/mecab/lists/archive/devel/2007-March/000053.html
[3] pkgs.fedoraproject.org/gitweb/?p=mecab-ipadic.git;a=blob_plain;f=LICENSE.Fedora;hb=HEAD

810 名前:login:Penguin mailto:sage [2010/08/28(土) 15:33:26 ID:k7yOs/j4]
mecabの開発者の人は[2]には登場していない気が



811 名前:login:Penguin mailto:sage [2010/08/28(土) 19:38:05 ID:z5KVaVXE]
>>809
辞書データのライセンスが混在していて分離されていない、分離できない、というのも問題みたいだね。

812 名前:login:Penguin mailto:sage [2010/08/28(土) 19:59:01 ID:Zaq5K9Ul]
なんかよーわからんが、途中で勝手にアルファベットにかわっちゃう様になってしまつた。
.mozc消したら直った。

813 名前:login:Penguin mailto:sage [2010/08/31(火) 07:17:18 ID:jJOblZ05]
Naist-jdicベースにしたらいいんじゃね?
sourceforge.jp/projects/naist-jdic/wiki/FrontPage


814 名前:login:Penguin mailto:sage [2010/08/31(火) 18:05:08 ID:RLfgoPrY]
>>813
mozcのバグ報告みれ

815 名前:login:Penguin mailto:sage [2010/09/05(日) 23:36:40 ID:xp7KhwGH]
openSUSE M17N の IBus 1.3.6-7.2 にしたら入力中の文字列が見えなくなった。
r38 再コンパイルもエラーで終了。

俺可哀想過ぎるorz

816 名前:login:Penguin mailto:sage [2010/09/07(火) 23:24:50 ID:CwjV4LZ+]
>>815
> 俺可哀想過ぎるorz
べつにかわいそうでもないけどw

817 名前:login:Penguin mailto:sage [2010/09/09(木) 01:22:31 ID:TQLx6zsN]
可哀想な人=解決する知恵が足りないという意味の自虐表現なのでは?

818 名前:login:Penguin mailto:sage [2010/09/10(金) 12:33:50 ID:1Kd4Yrgy]
mozc r39

819 名前:login:Penguin mailto:sage [2010/09/10(金) 18:04:59 ID:SFywMLYY]
anthyに慣れてるから使いにくい

820 名前:login:Penguin mailto:sage [2010/09/11(土) 07:33:29 ID:yAZGOqGd]
俺はskkのほうがいい。



821 名前:login:Penguin [2010/09/17(金) 17:32:26 ID:WcFBVINN]
女子高生がなくて女子校生がでるmozcはエロゲマニア

822 名前:login:Penguin mailto:sage [2010/09/17(金) 17:36:21 ID:ByukVjC9]
「ひんち」って打ってみ
「きょにゅ」でもいいけど


823 名前:login:Penguin mailto:sage [2010/09/17(金) 18:35:24 ID:GG5LMteP]
ひんち→貧乳
きょにゅ→巨乳ちゃん
























なるほど…

824 名前:login:Penguin mailto:sage [2010/09/17(金) 18:59:49 ID:8/VWxC/+]
イベントのお知らせ「Google 日本語入力 TechTalk 2010」
2010 年 9月 17日 Posted by 小松弘幸 (ソフトウェアエンジニア)、Google 日本語入力チーム

IME の開発に興味はありませんか? Google 日本語入力のソースコードを、
ぜひ一緒にレビューしましょう!
googlejapan.blogspot.com/2010/09/google-techtalk-2010.html






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<203KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef