[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 02/03 05:26 / Filesize : 152 KB / Number-of Response : 638
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

mozc / Google 日本語入力 #2



1 名前:login:Penguin [2010/10/12(火) 11:28:32 ID:vOG98dtl]
code.google.com/p/mozc/

関連URI
sourceforge.jp/magazine/10/05/11/0335246
googlejapan.blogspot.com/2010/05/google_10.html

過去ログ
#1 hibari.2ch.net/test/read.cgi/linux/1273719530

152 名前:login:Penguin mailto:sage [2010/10/29(金) 20:42:25 ID:7WGwYOaz]
野良リポに置いてある拡張辞書を加えたカスタマイズパッケージなら変換できる

153 名前:login:Penguin mailto:sage [2010/10/29(金) 22:16:54 ID:tYtfAsZN]
女子校生、女指向性、助指向性、女嗜好性、助嗜好性、じょしこうせい、ジョシコウセイ
なんじゃこりあ

154 名前:login:Penguin mailto:sage [2010/10/30(土) 00:07:42 ID:MNQeJ5A2]
Ubuntu 10.10のリポジトリに入っているMozcって、バージョンが古いせいか
自分でビルドしてた時よりだいぶ変換精度が悪くなった気がする

155 名前:login:Penguin mailto:sage [2010/10/30(土) 01:09:43 ID:E41PEeSJ]
16日にソース落として10.10でビルドしたやつほしい?
emacs-mozc_0.13.499.102_all.deb
mozc-utils-gui_0.13.499.102_i386.deb
mozc-server_0.13.499.102_i386.deb
emacs-mozc-bin_0.13.499.102_i386.deb
scim-mozc_0.13.499.102_i386.deb
ibus-mozc_0.13.499.102_i386.deb

156 名前:login:Penguin mailto:sage [2010/10/30(土) 04:18:01 ID:3mvrDqIl]
なんかうぶん厨はUbuntuスレから出てこないでほしいなって心の底から思わせるスレだな。

157 名前:login:Penguin mailto:sage [2010/10/30(土) 14:37:28 ID:rDuyMOgF]
本家でもUbuntuを中心にbuildされてるんだから当然だろ
逆に他の鳥使いはここにくるなと言いたいくらいだ

158 名前:login:Penguin mailto:sage [2010/10/30(土) 15:02:31 ID:tADN8atH]
>>156 >>157
おまいら心が狭いなw

159 名前:login:Penguin mailto:sage [2010/10/30(土) 15:21:17 ID:E41PEeSJ]
Ubuntu以外って何があるの?クライアント用途で

160 名前:login:Penguin mailto:sage [2010/10/30(土) 15:36:45 ID:BMCUcT8P]
>>156
Currently, we only support Ubuntu 9.10 and 10.04 for building Mozc.
と書いてるのにアホか?




161 名前:login:Penguin mailto:sage [2010/10/30(土) 15:39:30 ID:+qi4/H7n]
>>159
Slackware, Gentoo, Arch 辺りがお推め

162 名前:login:Penguin mailto:sage [2010/10/30(土) 15:46:21 ID:tADN8atH]
>>159
Fedora Core 1の頃からFedora使ってるよ
っていうかスレ違い

163 名前:156 mailto:sage [2010/10/30(土) 17:35:09 ID:3mvrDqIl]
もーほんとにうぶん厨ってリアルバカなのね。
おれはUbuntuについてはなんも言ってないのに。

164 名前:login:Penguin mailto:sage [2010/10/30(土) 18:07:06 ID:rDuyMOgF]
あのなー
おまえのいううぶん厨という定義はなんだ?
Ubuntuユーザとうぶん厨の違いはなんだ?
Ubuntuユーザを揶揄する言葉じゃないのか?
何かを気に入って使っててそれを使ってる人を貶されたら頭来ないか?
誤解されたくなかったらそういう言葉使うなやアホ

165 名前:login:Penguin mailto:sage [2010/10/30(土) 18:14:38 ID:lBQr8+7o]
良く知らないけど、もしかしてうぶん厨というのは、書いてあるとおりにmakeするだけでなんでもできる気になって、
困っているタコを叩く割に基礎的なアドバイス一つできない連中の事だったりするのだろうか?

166 名前:login:Penguin mailto:sage [2010/10/30(土) 18:20:30 ID:EhY8jnpk]
うぶん厨って言うヤツ見たらああ、Lいぬx始めて少し覚えてワクワクしてる年頃何だってスルーでいいよ
中2病と同じ

167 名前:login:Penguin mailto:sage [2010/10/30(土) 18:28:03 ID:lBQr8+7o]
リーナスのOSをライナックスと読むのは無知の証拠みたいな論理なんだろうか?
もずくと読もうがエムオーゼットシーと読もうがそんなのスキルとは関係ないと思うけどね。

168 名前:login:Penguin mailto:sage [2010/10/30(土) 18:43:22 ID:tADN8atH]
よそでやってくれよ

169 名前:login:Penguin mailto:sage [2010/10/30(土) 19:01:40 ID:lBQr8+7o]
>>168
なんかネタないの?
たとえばx件中y件ヒットみたいな検索結果から辞書の頻度値を算出するのに適切な式はなんだろうとか。

170 名前:login:Penguin mailto:sage [2010/10/30(土) 19:53:38 ID:tADN8atH]
>>169
おみくじ機能がどこで実装されているのか調べていた時に
date_rewriter というのを見つけた。「ことし」を変換す
ると候補に「平成22年」が出てきてすごく便利。
今年が平成何年かとかすぐに忘れてしまうから..



171 名前:login:Penguin mailto:sage [2010/10/30(土) 20:46:18 ID:tADN8atH]
「ふいんき」が変換できてしまうのはどうなんだろう..

172 名前:login:Penguin mailto:sage [2010/10/30(土) 21:14:24 ID:jnu56M4W]
「あたらしい」が変換できるから構わない

173 名前:login:Penguin mailto:sage [2010/10/31(日) 16:31:56 ID:b8bq9EkW]
>>172
それは正しいから問題ではない。ふいんきは誤用でしょ。

174 名前:login:Penguin mailto:sage [2010/10/31(日) 16:43:48 ID:xtzzyKZu]
>>173
「あらたしい」

175 名前:login:Penguin mailto:sage [2010/10/31(日) 16:46:31 ID:b8bq9EkW]
>>174
あらたしい => 新た敷い

176 名前:login:Penguin mailto:sage [2010/10/31(日) 16:47:44 ID:uZx3+GXc]
平安時代にGoogle日本語入力があったら
「あたらしい」が変換されるのはおかしいって殿上人の間で議論が起こったんだろうな

177 名前:login:Penguin mailto:sage [2010/10/31(日) 17:27:42 ID:G4DbNk99]
冷蔵庫に牛乳があたらしい

178 名前:login:Penguin mailto:sage [2010/10/31(日) 17:39:13 ID:vIu+QxnP]
>>177
それは、あったらしい
つか、つまんないネタをふるなよ関西人
死ね>>172

179 名前:login:Penguin [2010/10/31(日) 19:53:18 ID:9mwyBBIW]
あきはばら あきばはら どっち?

180 名前:login:Penguin mailto:sage [2010/10/31(日) 19:58:09 ID:QTp0//OD]
>>179
どっちも正しい。
最近ではあきはばらと発音する人が多い。



181 名前:login:Penguin mailto:sage [2010/10/31(日) 22:59:05 ID:oHrJKpSi]
いみしん、はどうなんだい?

182 名前:login:Penguin mailto:sage [2010/11/01(月) 00:56:27 ID:SWnVyj9N]
echo "にほんご" | mozc_server
-> 日本語

というふうなことはできないだろうか?

183 名前:login:Penguin [2010/11/01(月) 05:56:42 ID:YhhQyHnL]
>>146
「じょしたかお」で変換すればいい。

じょしたかお 2249 2322 7265 女子高生
じょしたかお 2249 2328 4791 女子高生


184 名前:login:Penguin mailto:sage [2010/11/01(月) 06:05:27 ID:fojOTsvX]
じょした顔

185 名前:login:Penguin mailto:sage [2010/11/01(月) 06:19:31 ID:YhhQyHnL]
「女子中高生」は「じょしちゅうたかお」な。
じょしちゅうたかお 2249 2249 6901 女子中高生

なんじゃこりゃ。
じょたいごうもんしょ 2249 2328 7348 女体拷問所
「じょたい」が「にょたい」かどうかはまた別として。


186 名前:login:Penguin mailto:sage [2010/11/01(月) 22:45:14 ID:Ot+mWzF7]
>>185
そうやってゴミを見つけてくれることを期待してGoogleさまは
ソースを航海したんだからせいぜいゴミ取りに協力してやってくれ!

187 名前:login:Penguin mailto:sage [2010/11/01(月) 22:59:54 ID:9xqT8qMS]
>>186
辞書は別でしょ。

それに、↓みたいに言ってるし。
code.google.com/p/mozc/issues/detail?id=62#c3
> However, we are not going to remove/change/edit the entries you reported unless
> they produce any real misconversions and/or side effects in common user inputs.

報告きた分くらいは対処してくれてもいいんじゃないかとは思うけど。

188 名前:login:Penguin mailto:sage [2010/11/01(月) 23:03:57 ID:Ot+mWzF7]
>>187
つまり「じょしちゅうたかお」と入力する人がいるはずがないから
問題無しとGoogleさまは言ってようなもんだが

189 名前:login:Penguin mailto:sage [2010/11/01(月) 23:12:13 ID:7Zsv0Lzk]
>>188 確かにw

190 名前:login:Penguin mailto:sage [2010/11/01(月) 23:13:44 ID:PGEkVxYl]
>>187
それは「なんじゃこりゃ」の話でしょ。



191 名前:login:Penguin mailto:sage [2010/11/02(火) 00:18:38 ID:BKGjnDBK]
>>190
どこをどう読んだらそういう話になるのかと。

192 名前:login:Penguin mailto:sage [2010/11/02(火) 06:15:35 ID:mT8QDHS/]
じょしたかお 2249 2328 4791 女子高生
じょしたかお 2249 2322 7265 女子高生
こなかたかお 2990 2249 7137 小中高生
いまのなかたかお 2303 2249 7078 今の中高生

うーーむ。

>>187
もうめんどくせえので引用分しかコメント読んでないけど、
訳すとこんな感じか。
「ユーザが通常入力するにあたって実際に何らかの誤変換を引き起こさないのであれば、
(不適切だと)報告したエントリを削除変更編集する気はありません」

明らかな誤登録は削除するべきだと思うし、
何より「じょしこうせい 女子高生」が登録されていないことの一因は、
「女子高生」を「じょしたかお」と登録してしまっていることにある。
他にもそんな例がいっぱいあるからさっくり修正すればいいのに。

何のレビューもせずに単語を自動登録してたんだろうなあ。
ゴミを大量に混ぜて辞書は肥大化、
品詞も大量に追加、
修正依頼は放置、
返事は相変わらずおせえええ。

「文句あるなら自分で作れ」のフリーソフトウェア制作者気質と、
「素人が知ったようなこと言うな」の学者気質が、
悪いようにまじわってしまった感じがある。

Mozcにはもう飽きた。
> 小松さんが「Android IMEには、どんな機能が欲しいですか?」と問いかけていました
こっちのほうがシンプルで扱いやすくなりそう。

193 名前:login:Penguin mailto:sage [2010/11/02(火) 08:34:38 ID:KT9ETxbj]
「みんなでレビューして正しい辞書を作りたい」んじゃなく
「レビューの必要がない辞書を自動生成できる手法を作りたい」んじゃないかな。
よく知らんけど。

194 名前:login:Penguin mailto:sage [2010/11/02(火) 16:54:17 ID:lt3KQ0Pz]
一応誤解が広まらないように言っておくと、女子高生問題は次のpushで修正されるし、
「なんじゃこりゃ」もその後に修正されると言ってる。
どう修正されるのかはわからないけど。

「どうしゅうせいされるのか〜」で、「どう修正されるのか〜」が候補に出てこない
(副詞の "どう" [如何] を知らない)。

195 名前:login:Penguin mailto:sage [2010/11/02(火) 17:44:45 ID:TS7910Tn]
>>194
如何(どう)
修正されるのか
で一旦確定してから、どうしゅうせいされるのかと入力すると学習するよ

196 名前:login:Penguin mailto:sage [2010/11/02(火) 17:53:10 ID:HnoP3vVF]
次から「道州制」が出なくなるかもな

197 名前:login:Penguin mailto:sage [2010/11/02(火) 17:55:06 ID:HnoP3vVF]
「どう、修正されるのか〜」

これじゃ変かな?
連投すまねぇ

198 名前:login:Penguin mailto:sage [2010/11/02(火) 17:58:26 ID:I5llQG9q]
Mozcのイイ辞書おせーて

199 名前:login:Penguin mailto:sage [2010/11/02(火) 18:52:50 ID:TS7910Tn]
>>198
sawa氏の辞書

200 名前:login:Penguin mailto:sage [2010/11/02(火) 19:31:13 ID:NUJzeozc]
>>198
www.geocities.jp/ep3797/mozc_01.html

SKKの辞書から単語もらっててもGPLに感染しないのかね?
俺にはどうでもいいが



201 名前:login:Penguin mailto:sage [2010/11/02(火) 19:43:51 ID:OtQ7N85G]
GPLのcannadic改をベースにして作った自作のAnthy辞書と
GPLのSKK辞書を使ってもGPLには感染しないのか

202 名前:login:Penguin mailto:sage [2010/11/02(火) 20:27:40 ID:9AUUDNqo]
言葉(漢字)とその読み方には著作権が発生しないので、
FEP開発メーカは国語辞典の言葉をせっせと登録していた
とVJEの開発者が語ってたのを読んだことがある。
メーカー独自の品詞分類とか絡んでくるとどうなるのかは知らないが。

203 名前:login:Penguin mailto:sage [2010/11/02(火) 20:32:08 ID:gPK95h27]
>>201
安心しなさい。gplになります。

204 名前:login:Penguin mailto:sage [2010/11/02(火) 21:10:37 ID:YlARUZv5]
>>202
通称データベース著作権(2条1項10号の3)ってのがあって、
日本語変換辞書はそれが適用される。


205 名前:login:Penguin mailto:sage [2010/11/02(火) 21:13:06 ID:lt3KQ0Pz]
そもそもの辞書データのどこに著作権・知的財産権が発生するのかってことだけど。
読みと漢字自体に著作権はなくとも、辞書として創り上げるめに、収集し、選択した
作業の成果物としてのデータに対しては発生すると思うのが、普通だと思う。

実際に、それを利用する価値があるから使ったんだし。

ちなみにmozcの中の人は、SKK由来の辞書データを受け入れを拒否ってる。

そして、「よみとかんじを〜」と入力してたら、ダメデータを発見。

dictionary02.txt:よみと 1315 1315 1465 読取


206 名前:login:Penguin mailto:sage [2010/11/02(火) 23:20:30 ID:2Y+xahQy]
>>205
こんなところで報告しても、何にも起こらないと思うけど。

207 名前:login:Penguin mailto:sage [2010/11/03(水) 02:31:53 ID:91YapOGy]
>>206
それを言ったらこのスレの存在価値がなくなるので
適当に報告しあったらいいじゃん


208 名前:login:Penguin mailto:sage [2010/11/03(水) 03:09:05 ID:8wL0PaU+]
辞書にある誤りを見つけるたびにいちいちissueとしてあげるって、めんどくさいよなあ。
AnthyWikiの誤変換晒しあげ的なのがあればいいんだけどね。

うぉ、むかし「誤変換」が辞書になかったと思うんだけど、いまはあるんだな。

209 名前:login:Penguin mailto:sage [2010/11/03(水) 07:47:53 ID:RdavSDk6]
「二重になっている」と打ちたいんだが、
「二十二なっている」になる。
rewriterが強権発動してるのかな。

>>205
ライセンス問題って、
基地予定地に県外の非土地所有者が乗り込んでくるのと
似たような違和感を覚える。
本人は善意なんだろうけど、
なんつうかトラブル好きなんだなあと。

個人的には、
表記と読みは公知の事実で他に書きようがない。
ここにGPL主張するのは無理がある。
大量に入力する手間はわかるし感謝もしている。
しかし例えば自分が5000語入力したとして、
それの表記読みを誰かが流用したからといって
別になんとも思わない。
謝辞を書いてくれたら嬉しいな、という程度。
ja.wikipedia.org/wiki/著作権
> 五十音順に人名と電話番号を配しただけの電話帳は著作物ではない
五十音順の読みと表記もそんなもんだと思うけどね。

法律語りたがる人もいるんだろうが、
模擬裁判みたいなもので、結論でても効力がない。
結局はユーザが自分で判断するしか。

Mozcの中の人が「GPL辞書のかけらでもダメだ」と言うなら
それはそれでひとつの考え方。
Googleなら人もカネもあるからどこかの辞書を買って、
そいつを基本に据えるのもいいんじゃない。
大事なのは今の辞書じゃダメってことで、どう変えるかは中の人しだい。

210 名前:login:Penguin mailto:sage [2010/11/03(水) 08:02:34 ID:pGq1jz45]
中の人言わく、
辞書の誤エントリを直すのは大変だから、
誤エントリの報告は全部スルーですよ。
おまえら誤変換があったら全部報告しろ。

ようするに誤変換データを学習データにして
辞書の自動生成がやりたいってことだろ。
ユーザーの利便よりも、自分の研究が優先ってことだ。
おまえら、どこまで付きあってやるんだ?



211 名前:login:Penguin mailto:sage [2010/11/03(水) 11:37:03 ID:79jpaC7f]
>>209
法的にメチャメチャなこと言ってると思うが、気持ちは分かる

>>210
あれは結局のところ報告はうぜーから黙ってろと言っているわけだよな

212 名前:login:Penguin mailto:sage [2010/11/03(水) 12:08:46 ID:+mHxq1R3]
気にいらないならfolkすればいいじゃない

213 名前:login:Penguin mailto:sage [2010/11/03(水) 13:42:49 ID:pGq1jz45]
>>211
辞書のエントリなんざチマチマとメンテしてられっかよ (#ノ`Д´)ノ≡≡≡≡≡≡≡┻━┻
って意味だろうな。

214 名前:login:Penguin mailto:sage [2010/11/03(水) 14:03:57 ID:8wL0PaU+]
報告来たのを一々馬鹿丁寧に対処しないからそこんとこよろしく、
って予防線はってるだけでしょ。

215 名前:login:Penguin mailto:sage [2010/11/03(水) 14:26:39 ID:pGq1jz45]
>>214
ちがうよ。ちゃんと発言読んだ?
ttp://twitter.com/#!/taku910/status/29487577851
ttp://twitter.com/#!/taku910/status/29489974332

216 名前:login:Penguin mailto:sage [2010/11/03(水) 14:32:32 ID:fPaYoC38]
行間から「アホなお前らのやり方に付き合うつもりが無い」という感情が
滲み出ている文章ですね

217 名前:login:Penguin mailto:sage [2010/11/03(水) 15:07:45 ID:v6dh9rjS]
>>215
けど、twitterで呟いたのがgoogle 公式見解になるのは解せないな。

218 名前:login:Penguin mailto:sage [2010/11/03(水) 20:06:47 ID:N2m9/6JT]
言われるままに修正してると他に影響が出ることがあるからでしょ
いきなり、完成品を要求するのはどうかと

219 名前:login:Penguin mailto:sage [2010/11/03(水) 20:58:32 ID:/fIoZ3nn]
>>209
君は他人事かも知れないが、
リリースするエンジニアにとっては大問題だろ。
辞書のライセンス汚染は。

220 名前:login:Penguin mailto:sage [2010/11/03(水) 21:17:29 ID:jSq5Ix4/]
UTUMIさんは私家版辞書を引っ込めたのか。



221 名前:login:Penguin mailto:sage [2010/11/03(水) 22:05:34 ID:fPaYoC38]
今回、アップデート遅いね


222 名前:login:Penguin mailto:sage [2010/11/04(木) 00:33:04 ID:Zz4rplSe]
www.google.com/support/ime/japanese/?hl=ja
これの誤変換の不具合ページを消したらどうでしょうか?

223 名前:login:Penguin mailto:sage [2010/11/04(木) 00:44:25 ID:c6PEi/a/]
>>222
なぜ?

224 名前:login:Penguin mailto:sage [2010/11/04(木) 01:59:26 ID:gfgWDteS]
>>220
そして新しい試みの整理辞書は、サイズがオリジナルの半分以下になってんね。
ちらっとなめてみただけでも、無駄と思えるデータがずいぶんあるんだなと。
無駄じゃないデータもちょいちょいおとしてるっぽいけど。

225 名前:login:Penguin mailto:sage [2010/11/04(木) 05:57:49 ID:tasiiFno]
>>219
bsdライセンスぽくしたのは正解だとおもうけどね。好きに使えるから。それがいやならコンフリクトするライセンスにかえたほうがよい。

226 名前:login:Penguin mailto:sage [2010/11/04(木) 08:03:52 ID:siEagweF]
openlab.ring.gr.jp/skk/wiki/wiki.cgi?page=SKK%BC%AD%BD%F1#p11
>SKK-JISYO.geo は、日本郵政公社(以前は郵政省 → 郵政事業庁) のページにあるデータをもとに
> SKK 辞書形式の「地名辞典」に加工したものです。
>2004 年 12 月 12 日現在、 www.post.japanpost.jp/zipcode/dl/readme.html によれば、
>"日本郵政公社は著作権を主張しません。自由に配布していただいて結構です"とあります。
>同社のご厚意に感謝しつつ、自由に配布できるよう、明示的に GPL を適用しました。

>この辞書については、DDSKK独自の加除や加工がかなり加えられており、
>単純なコンバートとは性質をやや異にしています。

うう、GPL汚染怖ぇ、、

227 名前:login:Penguin mailto:sage [2010/11/04(木) 14:43:40 ID:Zz4rplSe]
「"加工した辞書も著作権を主張しません。自由に配布していただいて結構です"」
と言ってくれたらいいのにな

228 名前:login:Penguin mailto:sage [2010/11/04(木) 14:52:35 ID:BuJOJLo8]
>>227
著作権は放棄出来ないので無理
あと漢字の読み自体には著作権は発生しないけど、
集合体である辞書には発生するんじゃなかったかしら

229 名前:login:Penguin mailto:sage [2010/11/04(木) 14:55:35 ID:xLTlo5hi]
>>228
放棄って言ってないじゃん。

230 名前:login:Penguin mailto:sage [2010/11/04(木) 15:12:08 ID:wqiVPxGa]
>>228
著作人格権の以外の著作権上の権利は放棄できるよ。財産権だからね。



231 名前:login:Penguin mailto:sage [2010/11/04(木) 17:21:49 ID:R/cz4t0b]
r49
googlejapan.blogspot.com/2010/11/google-01352310x.html


232 名前:login:Penguin mailto:sage [2010/11/04(木) 17:50:18 ID:jvtMYlYT]
>>226
勝手にライセンス適用なんてできるの?ライセンスの変更にあたるよね?

233 名前:login:Penguin mailto:sage [2010/11/04(木) 17:55:44 ID:xLTlo5hi]
>>232
郵政公社が文句言わないならいいんじゃない?

234 名前:login:Penguin mailto:sage [2010/11/04(木) 17:58:18 ID:sCoOiEkM]
「女子高生」は直ったな
麻雀用語がえらく充実したけど要望でもあったのか

235 名前:login:Penguin mailto:sage [2010/11/04(木) 18:51:51 ID:wqiVPxGa]
>>232
新規に追加した分は著作権が主張できる。

↓以下の部分については、改変の程度による。
>この辞書については、DDSKK独自の加除や加工がかなり加えられており、
>単純なコンバートとは性質をやや異にしています。


236 名前:login:Penguin mailto:sage [2010/11/04(木) 19:34:04 ID:1tiop6Bm]
>>226
> >同社のご厚意に感謝しつつ、自由に配布できるよう、明示的に GPL を適用しました。

元データをそのまま転載し、加除の差分データとSKK形式への変換スクリプトを
あわせて配付すりゃいいものを。
詳しい説明なしでライセンス変更って、なんというか、やったもん勝ちっていうか。

237 名前:login:Penguin mailto:sage [2010/11/04(木) 20:26:25 ID:X0RFj6KQ]
またゴミみたいな登録が追加されてる。
也まん 2306 2235 7370 也マン
也みち 2235 2314 7839 也みち
也みつ 2306 2235 7948 也みつ
也りつ 2306 2235 7949 也りつ

言葉として変なのはもちろん、
読み仮名が漢字って。

あとおんなじ単語追加してる。品詞も読みも表記も同じ。
重複確認してないのか。
さいずとう 2235 2314 6411 サイズ等
+さいずとう 2235 2314 6822 サイズ等

反面、残してても良さそうな単語は削られてる。
-さいだいていいん 最大定員
-さいだいとうろくすう 最大登録数
-さいたまめいぶつ 埼玉名物
-じょしぶいん 女子部員
-じょしやきゅう 女子野球
-じょじんき 除塵機
-じょせいかんごし 女性看護師
-じょせいけい 女性系

「じょしこうせい」と「じょしだいせい」は直ってる。

そしてやっぱり何じゃこりゃ的なものが自動登録。
+じょじくつとう 女児靴盗
www.google.com/search?&q="女児靴盗"
5件しかないすけど、産経から引っ張ってるのかな。

たぶんNGワードフィルタに通しただけであとは自動登録なんだろう。

238 名前:login:Penguin mailto:sage [2010/11/04(木) 20:39:39 ID:X0RFj6KQ]
id.defがごっそり変わってるから、
以前の公式/私家版辞書を使いたい場合は
mozc-0.13.499.102/data/dictionary/
から
boundary.txt connection.txt id.def
と辞書全部を上書きすればいいのかな。
(dictionaryが 09.txt までないときは split して作る。)

id.defは連番だから、
1個変更されるとそれ以降は全部変更になってしまう。
500番台は動詞、
1000番台は名詞、
みたいにすれば変更の幅が小さくなるのに。

毎回品詞記号を変更する辞書ってどうなのさ…
せめて「名詞, 一般」みたいな汎用枠は数字を固定してほしいなあ。


239 名前:login:Penguin mailto:sage [2010/11/04(木) 21:07:15 ID:X0RFj6KQ]
なんでこれを削ったんだろ。方言?
-かえしとく 返しとく

「IMEは総合格闘技」と言ったらしいけど、
基礎練習せずに派手な技をやりたがる人みたい。
首以下が豆腐で出来てる。

これはさすがに手で消したか。
-かえらにゅうせき カエラ入籍

何すかこれは。
+かおかろ 加オカロ

これ?何のことかわからん。
> AKB48のたかみなと秋元才加(オカロ)

こういうことか。
> ファンの間では「オカロ」と呼ばれることもある。
> これは「才加」が「オカロ」と読めることに由来

こわいよ。
+かおでめ 顔で目

なぜ削った。
-かかくさいと 価格サイト

これは誤変換起こしそう。
+かかくでて 価格で手

ろくにチェックせず出して、
問題起きたらあとから直す、ってやりかただもんなあ。
報告なんて無駄。やりかたがダメなんだもん。

240 名前:login:Penguin mailto:sage [2010/11/04(木) 21:27:00 ID:qjny2BbR]
どこかに書いてあったけど、これはマジで日本語を壊すために作ってると思う。
文句言うくらいなら使わないほうがいいんじゃね?
おとなしくatok使った方が精神的にも時間的にも得だよ。



241 名前:login:Penguin mailto:sage [2010/11/04(木) 21:27:27 ID:c6PEi/a/]
辞書の不備を指摘する場合、どうやってそれを見つけたか
の情報も添えるといいんじゃないか。差分を眺めていて
たまたま見つけた、とか。読み仮名に漢字が含まれている
とかの指摘はいいね。次から開発者がチェックできるだろう。
ユーザーが眺めてて偶然見つけたようなのは、開発者が全部
チェックできるわけもなかろう。

242 名前:login:Penguin mailto:sage [2010/11/04(木) 22:02:40 ID:hTWac2QG]
ま、自然言語みたいな生物が関わるモノの自動生成なんて土台無理な話ですな
地道に一つ一つ自分の手と目で確認する職人気質の人でないとメンテは無理

243 名前:login:Penguin mailto:sage [2010/11/04(木) 22:22:45 ID:X0RFj6KQ]
>>241
> 次から開発者がチェックできるだろう。
今に始まったことじゃないはず。
読みが日本語になってない登録についてはIssuesで出てたと思う。
つまりは >>187-188 >>192 ってこと。
「じょしたかお」はさすがに直したようだが。

> どうやってそれを見つけたか
釈迦に説法じゃね?
見つける気があるならすぐ見つかる。
辞書がゴミだらけになってますよ、というのは
Issuesでさんざん出てるし。

> 差分を眺めていてたまたま見つけた
差分から見つけたけど、
「たまたま」なんてレベルじゃねえ。
「かえ-かか」だけで >>239 なんだぜ。


244 名前:login:Penguin mailto:sage [2010/11/04(木) 22:43:25 ID:X0RFj6KQ]
もっというと、
「かえ-かか」の「新規差分」だけでこれなわけで。
辞書全体だと1からやり直したほうがいいレベル。


245 名前:login:Penguin mailto:sage [2010/11/04(木) 23:26:49 ID:Zz4rplSe]
>>Google 日本語入力開発版をお使いの皆さま、いつも Google 日本語入力を
>>よりよくするためにご協力いただきありがとうございます。
>>今後とも、みなさんと共に Google 日本語入力を、より使いやすい製品に
>>育てていきたいと思っています。お気づきの点がありましたら、
>>ぜひヘルプフォーラムからお知らせください。
>>みなさんの貴重なフィードバック、お待ちしています。

と書いてある所に >>215 の文を追加して欲しい


246 名前:login:Penguin mailto:sage [2010/11/05(金) 04:44:49 ID:z3Qc1njF]
>>245 >>215 >>210
おお、そんな書き込みがあったのか。
もうたくちゃんの発言見てないので助かった。

報告していくつかの誤変換は直ったけどさ、
もう今後は関わりたくねえ。
ノーチェックだからキリがないし。

やっぱりこういう人が頑張らないとね。
twitter.com/haroperi/status/28516241859
> mozcは銀河一のIMEになる。


247 名前:login:Penguin mailto:sage [2010/11/05(金) 04:48:58 ID:UGkOAlVL]
元々、IMEという略語はMicrosoft社における用語であり、広く文字入力のためのシステムを表す一般名称はインプットメソッドエディターである。
ja.wikipedia.org/wiki/IME

248 名前:login:Penguin mailto:sage [2010/11/05(金) 12:04:03 ID:hskUUW2p]
まあ一般的には「インプットメソッド」だろうな。
昔は「フロントエンドプロセッサー」って呼び方もあった。

249 名前:login:Penguin mailto:sage [2010/11/05(金) 12:12:22 ID:BgtZf8s5]
じゃあ俺はインサートプッシーメソッドで行くわ

250 名前:login:Penguin mailto:sage [2010/11/05(金) 14:33:21 ID:8yokwCmI]
わーすげーおもしれー



251 名前:login:Penguin mailto:sage [2010/11/05(金) 15:12:18 ID:jGEHrHRa]
(´・д・`)

252 名前:login:Penguin mailto:sage [2010/11/05(金) 15:20:12 ID:PnB8HDC9]
やっぱり今時Linux使ってるのっておっさんばっかなんだろうな
ギャグがおやじだしな
JSやJCが使ってたらもうちょっとこの界隈も活気づくだろうにな






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<152KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef