mozc / Google 日本語入力 #1

mozc / Google 日本語 ..

199:login:Penguin
10/05/30 00:17:22 72nIDqZ2
>>186
あとユーザー辞書でベクターにあったカタカナ語辞書入れてみたらいい感じだな。
Book Offはあるのにbookがないとかはまああるけど。

200:login:Penguin
10/05/30 00:24:14 ctRryZlG
mozc-jinmei-20100517ut.txt とオリジナル辞書との重複
3357 / 105793 (約3%)

mozc-meisi-20100516ut.txt とオリジナル辞書との重複
8452 / 96378 (約9%)

201:login:Penguin
10/05/30 00:34:41 AWGjLpyv
もずく

202:login:Penguin
10/05/30 01:00:44 ysTkCy8z
UTUMIさんの辞書が更新されているね。

203:login:Penguin
10/05/30 01:50:49 ctRryZlG
>>202
付属辞書を全部置き換えるとか言われるとちょっと躊躇しちゃうなあ。
付属辞書が今後更新されたときどうすべきか悩む。

204:login:Penguin
10/05/30 02:06:32 SVG1hTFg
mozcプロジェクトに辞書をコミットしちゃえばいいような

205:login:Penguin
10/05/30 07:33:37 nCq3cr+o
あと、ダウンロード元だと、5/28じゃなくて5/30版になってるけど、それはいいとして
apply-mozcdic-ut.shが

#! /bin/sh

cat mozcdic-ut-*.txt edict-katakanago/mozcdic-ut-*.txt ../data/dictionary/dictionary1.txt > dictionary1.txt.new
cp -f dictionary1.txt.new ../data/dictionary/dictionary1.txt

になってるので、展開した ~/src/mozcdic-ut-20100530からみて、位置が異なるので、
../data/dictionaryの部分を../mozc/src/data/dictionaryのように書き換えてから実行するといいと思う。

206:login:Penguin
10/05/30 08:20:01 nCq3cr+o
>>205
ごめん、~/src/mozc/srcに展開すればいいだけの話だね。

207:login:Penguin
10/05/30 09:27:18 /q37kFvx
普通に端末からcat実行すれば良いのでは？

208:login:Penguin
10/05/30 09:35:37 nCq3cr+o
>>207
コマンド書いてあるだけだから、それもありだね。

209:login:Penguin
10/05/30 09:38:04 nCq3cr+o
あいぱっどを変換するとipodが出てくるんだが、どの辞書の間違いだ？

210:login:Penguin
10/05/30 10:50:29 YvZiFHSE
dictionary1.txt:あいぱっど 2239 2239 7203 ipod
Googleの辞書っぽい

211:login:Penguin
10/05/30 17:07:00 72nIDqZ2
ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う？
最長一致とかの方式だと文節変えないと出ないとかあるけど、
mozcで出ない場合はむしろ基本単語に漏れや頻度データの間違いがあるだけな気がする。

特定熟語が頻出すぎてそれ以外の組み合わせの頻度が低いと、それが辞書から落ちて
変換できなくなってるケースがあるんじゃない？

212:login:Penguin
10/05/30 17:29:24 uJai2QSu
やっとmozc入れたけど、辞書登録のバーが出て来ないんだけどなぜだ？
ちなみに、
$ /usr/lib/mozc/mozc_tool --mode=dictionary_tool
とコマンドで打てばあるので、辞書登録はできるっぽいです。
バーを出すにはなんかやる必要があるのでしょうか？

ちなみに、憩いの場さんのとこのリポジトリから9.10のをとりました。

213:login:Penguin
10/05/30 17:34:15 IJqAauuC
>>212
「iBusの設定」の言語パネルの表示が表示しないになってるんじゃね

214:login:Penguin
10/05/30 17:38:32 ctRryZlG
>>211
> ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う？

もしかしてUTSUMIさんの私家版辞書のこと言ってるなら、もう削ってないよ。

215:login:Penguin
10/05/30 17:59:01 uJai2QSu
>>213
iBusの設定のそれは「when active」になってます。

入力時のバーが
[mozc|あ|☆]
しか出てなくて、調べてみると本家は
[mozc|あ|@|☆]
と、@のところに、propertyやらdictionaryがあるみたいなんです。

216:login:Penguin
10/05/30 18:20:19 nCq3cr+o
>>215
憩いの場氏の使ってるんだったら、前バージョンのは非公式なツールが悪さしてるんじゃないかな？
鍛えた辞書が勿体ないが、~/.mozcを消してみるといいのかも。

217:login:Penguin
10/05/30 18:24:09 /q37kFvx
>>215
自前ビルドしてみると幸せになるかも。

218:login:Penguin
10/05/30 18:33:14 RB6LrfSr
最新ビルドの辞書バーのアイコンが重複してるのは既出か…。

219:login:Penguin
10/05/30 19:12:32 uJai2QSu
>>216
.mozcを消しでみましたがかわりませんでした。

>>217
ビルドはちょっと…
もう一つのパソがビルドでうまくごちゃごちゃになってしまったので、こっちは憩いの場さんに頼らせていだだいたというわけです。

220:login:Penguin
10/05/30 22:53:10 XBBIE1D1
mozcってnew BSDライセンスなのにCopyrightがgoogleになってていいのか？
chromiumはBSDライセンス（3-clause）でubuntu ppaのCopyrightはChromium Authorsになってる。
ようしらんけどppaのはわざわざCopyrightをChromium Authorsにかえてるのかそうでないのか。
あるいはmozcもgoogle以外のコードが入った時点でCopyrightを変えるのか。
ま、わりとどうでもいいけど。

221:login:Penguin
10/05/31 03:17:09 OxheF7AP
>>219
バージョンは0.11.365.102となってる？
一度synapticでmozcとなのつくもの全てアンインストールして入れなおしてみたら?

222:login:Penguin
10/05/31 03:20:02 OxheF7AP
>>219
sudo apt-get remove mozc-server mozc-utils-gui ibus-mozc
sudo apt-get update
sudo apt-get install mozc-server mozc-utils-gui ibus-mozc

223:login:Penguin
10/05/31 03:27:36 u2z9heZ1
PPAにMOZC置いた人って信用出来る？
もう面倒なのでこれでいれちゃうよ？

224:login:Penguin
10/05/31 07:43:28 XQ2ccCmp
うちのとこ（9.10)も設定ツールが言語バーに出ないな。
再インストールしても同じ。

225:login:Penguin
10/05/31 08:54:01 4NQTaTq8
>>223
信用できないから自分でビルド
憩いの場のSawa氏のリポジトリも、Modified Anthyに変わるということで、
>勝手に変えるなバカヤロー、という人は使わないでください
と言ってるので自分でビルド

226:login:Penguin
10/05/31 11:17:54 7jMwOMF4
PPA は鯖側がビルドするので、鯖がクラックでもされない限り、バイナリパッケージの中身は
担保される。
元ソースと差分も表示されるので、野良ビルドと比べて比較にならないほど安心できる。

227:login:Penguin
10/05/31 16:14:30 FTkWWhkF
>>226
PPAも野良と同じだろ
PPAもその辺のユーザが作っていて、他のと変わりないと思うが?
まともにメンテされてないパッケージの多いこと多いこと
GPG署名が入ってれば改変されているか分かるし。
違いはdiffの提供ぐらいか

228:login:Penguin
10/05/31 16:38:48 wf2jYEJD
mozc入れてみたけど全然ダメだ
preeditテキストが表示されない
ほんまにテストしてリリースしてんのか？

229:login:Penguin
10/05/31 17:04:45 HeOjte/K
>>219
qt4関連入ってんの？

230:login:Penguin
10/05/31 18:38:45 1o5Z8GAq
>>228
buildにつかったlibibus-devのバージョンがmozcで使うibusのバージョンより
古いとpre editが表示されなかった
だからdebian sid(ibus 1.3.x)相当の環境でubuntu 10.04(ibus 1.2.x)でbuild
されたパッケージ使おうとするとそういうこと起こるかも

自分でbulidしてだめだったら分からんが

231:login:Penguin
10/05/31 21:18:42 Ol5eUFST
UTSUMIさんの辞書が更新された。
で、それと知らず使ってる人が誤解するのを危惧してる。

232:login:Penguin
10/05/31 21:20:46 Ol5eUFST
いや違う、辞書は更新されてないか。
SF.netのフィードの配信遅すぎ。

233:login:Penguin
10/05/31 22:27:56 G2NqXecX
mozcのプロパティの一般タブで
候補選択ショートカットを A-Lにしても
候補表示窓では1-9になっちゃってるね。
実質A-Lは使えないみたい。

234:login:Penguin
10/05/31 23:53:43 HhhYtfRc
219です。
昨日はいろいろと、mozc関連のファイル消したりしましたがダメでした。(もちろん0.11.365.102です)

>>229
qt関連は入っておりません。
mozcの設定に関して重要なのでしょうか？

texが使えないので10.04には当分のあいだ手を出せません…

235:login:Penguin
10/05/31 23:57:49 4NQTaTq8
>>234
Sawa氏のやめて自分でビルドして入れろ。

236:login:Penguin
10/06/01 08:58:36 Khp/NcXq
>>226
鯖というより、パッケージングしてる人かな？
パッケージングしてる人が複数いるようだけど、ばらばらにやるのではなくチームとしてやってくれるといいんだけど。
それまでは素性のわからんやつのPPAは躊躇する。

237:login:Penguin
10/06/01 09:22:43 Khp/NcXq
某はてなのブログにコメントしてる人
ブロガーの義務でもなんでもないのに、UTSUMI氏の辞書入りPPAを紹介して、UTSUMIに迷惑かけなきゃいいけど。

238:login:Penguin
10/06/01 09:24:13 Khp/NcXq
>>237
最後の敬称が抜けてた。
UTUMIに迷惑かけなきゃ→UTSUMI氏に迷惑かけなきゃ

239:login:Penguin
10/06/01 12:43:06 4zExM02R
>>236
自分でビルドするから楽しいんだろうが。
自分でやれ。

240:login:Penguin
10/06/01 12:53:30 XI8koRaq
>>237
そこまで書くなら url書けよ。

241:login:Penguin
10/06/01 13:34:08 Khp/NcXq
>>239
だから自分でビルドしてると言ってるじゃん。
>>240
書こうと思ったけど、ブログ主に迷惑掛かると思ったからやめた。
そのくらいggrks

242:login:Penguin
10/06/01 13:35:45 Khp/NcXq
ごめん。ID変わってた。
>>235もおれな。

243:login:Penguin
10/06/01 13:41:31 XI8koRaq
>>241
だったら、ブログへの愚痴をここに書くなよ。
わけわからん。

244:login:Penguin
10/06/01 13:55:12 Khp/NcXq
>>243
一般論として捉えればいいこと。
例えば、Sawa氏が、UTUMI氏の趣旨を理解して辞書を同梱したとして、ホームページにその旨を書いたとしても
それを紹介する第三者が、単にリンクとか手順だけ紹介したら意味はない。
これはたとえ話なので、はてなのブログの話はSawa氏のリポジトリのことではないが、趣旨はそういうこと。

245:login:Penguin
10/06/01 14:42:35 XI8koRaq
>>244
? かなり自己中だとおもう。

246:login:Penguin
10/06/01 16:16:29 0n41Qhbr
Googleの人自身が追加辞書に否定的だからなあ。

URLﾘﾝｸ(twitter.com)
通常どんなIMEでもデフォルト状態が一番性能が高いように設計されています。
はてな辞書などをデフォルトで有効にしていいものをしていないのは、
精度が下がるからです。
手元で実験していますが基本デフォルト状態が一番良くて
ユーザ辞書でもなんでも余計な物を突っ込むと精度が落ちます。
6:13 PM May 30th webから

ただ文章表現って多様だから、
とあるケースでの精度がいかに良くても、
ある人にとっては全体としてイマイチだったりすることもある。
「基本デフォルト状態が一番性能が高い」とはちょっと思い上がりかもなあ。
ちょっと前まで県名を変換できなかった完成度だし、
はてな辞書にしても、単純に全部足したら精度は落ちるけど、
選別したうえで必要なものを足せばそれなりに使える。
なによりGoogleの秘密版の辞書って余計なものの盛り合わせじゃね？

辞書は色々あっていいと思う。ハッカーにしてみればうぜーのかもしれないが。
ただ今はバグ出しとか必要なので、デフォルトで使ってみるのも大事。
ディストリ標準で非公式辞書を最初から埋め込むのはまだ早い。
メーリングリストで注意喚起したって見てるやつほとんどいねえしな。
アイコンがないのも現状の完成度を暗示してると思うので、
あえて足すことはない。

あ関係ないけどHideaki ABEさんmozc-configの開発お疲れ様でした。
公式版はQt依存めんどくせえのでちょろっと使わせていただくかもしれません。
ABEさん自身が使ってるのであればフリーズすることもないのでは。
それとGoogleのひとIssues報告放置しすぎ(出張中か？)

247:login:Penguin
10/06/01 16:23:50 Khp/NcXq
>>245
は？なにが？

248:login:Penguin
10/06/01 16:31:12 XI8koRaq
>>246
辞書の育成はセンスもあるからな。
作者が最適化している辞書だとしても
それより優れたものは現れるかもしれない。チューニングする人しだいだね。
ま、遺伝的アルゴリズムみたいなもんだからね。
良いセンスの人がチューニングした辞書がオープンソースとして公開されたら
たすかるからね。

249:login:Penguin
10/06/01 16:34:29 Khp/NcXq
それはそれ
ID:XI8koRaqみたいなアホが知らずにgoogleとは違う辞書を使ってフィードバックするようなことがあれば、迷惑な話。

250:login:Penguin
10/06/01 17:17:22 X3cZthyj
>>246
そもそもデフォルト状態って、大規模コーパス版のことだろ。
エンジンの設計が同じならIPADic使ってる時点で性能落ちてるんじゃないか？
そこから追加した微妙な部分が付属辞書にあってそれが肝だってことなら、
どういう方針で調整がなされたのか誰か差分取って調べてくれないかな？

ユーザー辞書は登録時に頻度情報が入れられないので変換精度が落ちるに決まってるじゃん
組み込み追加辞書の場合は頻度情報入ってるから全然違うと思うけど。
しかしその頻度情報の精度というのが母集団、つまりコーパスデータによるから
まんべんなく集めてるグーグルより桁が落ちるかもとか、統計学的にデータまぜるなきけん、
って話なだけでしょ。

結局、GPSのわざと下げられている精度をどうやって向上させるかみたいな話なんだから、
中の人なら否定するに決まってる。

251:login:Penguin
10/06/01 17:19:24 +xUAPRzh
GPSの軍用コードはすべてにおいて民間用を超えるわけではないらしいけど
戦時に精度低下があれば補正値知ってると良いかもしれないけど

252:login:Penguin
10/06/01 17:22:17 6lXEiumK
午後を入力するのに、「ご」と「ご」を区切るなよ

253:login:Penguin
10/06/01 17:39:27 XI8koRaq
>>249
粘着お断りです。ごめんね。

254:login:Penguin
10/06/01 18:15:44 Khp/NcXq
ID:XI8koRaq

255:login:Penguin
10/06/01 18:28:50 0n41Qhbr
>>246
> そもそもデフォルト状態って、大規模コーパス版のことだろ。

そうなのかな？
Google辞書だったら開発者が意図しようがしまいが、
「はてな辞書」の語彙は収集されて有効になってると思う。
まあ直接聞かないと分からんが

256:login:Penguin
10/06/01 18:29:31 0n41Qhbr
あ >>250 だった

257:login:Penguin
10/06/01 18:55:15 X3cZthyj
>>255
追加単語そのものより、漏れが出る事が問題な気がする。
>>252とかもそうでしょ。

258:login:Penguin
10/06/01 19:24:49 XI8koRaq
ごごか。変換してないな。
英英辞典とかそのへんの言葉が漏れてたりもするし、
いまはこまめに辞書を育てるしかないなぁ。とはおもってるよ。
それでもanthyよりは使い易いけど、

259:login:Penguin
10/06/01 19:40:59 iRw/MYCq
辞書の問題っていちいちバグトラッカーにあげることになんの?
いちいちめんどくさいよね。

「はりつけて」で「貼り付けて」がでない。

260:login:Penguin
10/06/01 19:47:12 biQ6ox7/
そういうのは鍛えりゃいいだけだよな

261:login:Penguin
10/06/01 19:53:01 iRw/MYCq
>>260
そんなこと言い出したら何でもそうじゃん。

UTSUMIさんの名詞辞書をもってしても「ポルチオ」がないのはしょうがないかなとは思うが。

262:login:Penguin
10/06/01 20:01:56 biQ6ox7/
Anthyのデフォルト状態とかひどいもんだからな

263:login:Penguin
10/06/01 20:26:01 2EYeyyHj
ライフサイエンス辞書が登録できるようにしてくれ
あれがないと話にならん

264:login:Penguin
10/06/02 00:05:59 qoQj5wV4
誰かフォークするものはおらんのか！
誰か！

265:login:Penguin
10/06/02 01:29:17 HiSOFHLt
>>244
そういう話を当のブログにコメントで書いてあげたら?
URL 書けないならそれができるのは君しかいないんだから。

266:login:Penguin
10/06/02 01:40:28 408ZUOE4
とりあえずSKKのスモール辞書辺りの単語は網羅されているのか比較してみた人居る？
っていうか>>200のツール教えて欲しいな。

267:200
10/06/02 02:05:04 w3pItDF+
>>266
辞書ファイルの読みと漢字だけを sed で抽出して sort -u したものを、
sort -m して uniq -d して wc -l しただけ。だったはず。
ていうか、細かいこともうすっかり忘れてて愕然としている俺がいる。

268:login:Penguin
10/06/02 02:33:17 nCOjwefR
>>263
Google日本語入力、ATOKやことえり辞書のインポートに対応
URLﾘﾝｸ(internet.watch.impress.co.jp)
Google IME/Mozcのユーザ辞書は同じ形式のはずだから、
Windowsで何とかインポートしてLinuxに持っていけば使えるはず。
LSD(なんつう名前だ)はMS-IMEシステム辞書形式だから、
バイナリエディタでいじらないとインポートできないかもな。

>>266
meisiは0601では重複ないはず。
jinmeiは重複チェックしてないはず。
同じのをModified Anthyでも使ってるから。
の割には重複少ないな。
まあ収録数多いから比率的に小さくなるか。

> SKKのスモール辞書辺りの単語は網羅されているのか比較
くだらねー。
それに単に網羅したって意味ないよ。
要らない単語削って頻度指定して…とやらないとな。
ためしにユーザ辞書として一律にインポートしてみれば。

しかしこんな「要望」によく応えたもんだよ。「当然のこと」とか「絶対対応するべき！」とか。
日本のLinuxユーザのレベルを示したスレ↓。
> Linuxユーザーにこそ必要なものです。
URLﾘﾝｸ(www.google.com)

> Linuxユーザは共同でプロジェクトをより良いモノに完成させたい意識は
> マックやWindowsのユーザよりも高く、
経験的にはWindowsユーザのほうが人数多いぶん反響あるし、
より良くしたいという人も多いんじゃねえかなー

269:login:Penguin
10/06/02 03:07:20 HDGBUJC9
>>268
そりゃ単純に母数が大きいだけじゃないか？
Linuxは開発コミュニティへの貢献意識が強いユーザが多いというより
そういう人間しかLinuxを使ってないという側面がある

270:login:Penguin
10/06/02 03:26:40 fMpvOFIK
>>269
> そういう人間しかLinuxを使ってないという側面がある
それはないわ

271:login:Penguin
10/06/02 03:32:32 7kI2YFS9
>>268
LSDは確かことえり形式の辞書がダウンロードできたはず。
ちなみに名前はあえてそういうのを狙ったんだとさ。

272:login:Penguin
10/06/02 06:43:02 02i5Uj0J
>>265
コメントしましたがなにか？
きみに言われる筋合いはない。

273:login:Penguin
10/06/02 06:46:10 02i5Uj0J
>>268
で、Google側は辞書の提供はなく、ユーザ側は辞書よこせだったわけだｗ
もうアホかと。

274:login:Penguin
10/06/02 07:10:05 5crcoY3W
>>268
> しかしこんな「要望」によく応えたもんだよ。…

そりゃ戦略上のことをいうとgoogleって自社osつくるんだし
日本での普及を考えたらimeは無視できないのは当然かと。
web tvがどんなことになるのかわからないけど、こっちでも
重要な役割でしょうしね。
また、脱msのものを普及させようと思ったらこの辺の周辺のことって
無視できないからね。
だから、答えたとしても利益があるんだろうね。

まるでウインドウズユーザーのような連中の声って、その辺を
機敏に感じるにはよいのかもね。

ないものは作れという思想のもとでlinuxを利用しているものから見れば
苦笑いの連中だけど、それだけ昔よりは普及してきているという証でも
あるんだろうね。彼らを蔑んでみるのはわからんでもないけどね。

275:login:Penguin
10/06/02 10:03:44 HiSOFHLt
>>272
ならいいけど。
「なにか」とか言われても URL わからないから
コメントしたかどうかおれにはわからなかったよ。

276:login:Penguin
10/06/02 14:43:48 SuZRONSu
何の話をしてるかわからなかったが
URLﾘﾝｸ(linux.ikoinoba.net)
のことを言っているのか
ここの「またまた帰ってきた某所の匿名」と「ID:Khp/NcXq」は同一人物だろう
「某はてなのブログ」がどこかはわからなかった

277:login:Penguin
10/06/02 15:02:37 02i5Uj0J
>>276
某はてなはそこではない。

278:login:Penguin
10/06/02 15:40:49 SVlKWBuX
Linux界隈でバイナリ配布禁止をはじめて見た

279:login:Penguin
10/06/02 15:44:09 HiSOFHLt
>>278
禁止はしてないでしょ。

280:login:Penguin
10/06/02 16:32:49 SVlKWBuX
禁止と言っているようなものだろ
これで配布したら

作者の気持ちを考えないなんてサイテー

と喚く馬鹿が大量発生する

281:login:Penguin
10/06/02 16:51:06 KEng9W8y
ていうかnon-freeぐらい珍しくもないだろ

282:login:Penguin
10/06/02 16:57:43 5crcoY3W
ライセンスを発行した上でライセンス以外のお願いをするというのは
あまり褒められたものではないとは思うよ。

ありとかなしじゃなくて記述しているかしてないかだけが意味するのにね。
ライセンスってそうゆうもんだって理解してたんだが。

鬼車のrubyマージ騒動みたいになっちゃうよ。

283:login:Penguin
10/06/02 17:00:56 1sMEC1wh
他人のライセンスを制約するならともかく
自身の著作物にコメントするのは何も問題ない

284:login:Penguin
10/06/02 17:04:19 5crcoY3W
>>283
うん。そこをトラブルしないために、自分の著作物に新たなライセンスを加えて
しまえばいいというのは当然だとおもうよ。加えないのに別のお願いをする場合
そのライセンスと矛盾するならば当然作者に問題があるし、矛盾しないならば
なんのトラブルもならないだろう。

285:login:Penguin
10/06/02 17:19:02 QoktT3oR
まあ、よくないわな。しこりが残る

Google曰く「Mozcのバイナリ配布は避けてください」

286:login:Penguin
10/06/02 17:22:49 02i5Uj0J
バイナリをわければ済む話。

287:login:Penguin
10/06/02 17:40:27 nCOjwefR
>>280
ソースパッケージに突っ込むのは勝手だけど、
有効にするのは各自でビルドオプション付けてねってことでしょ。
「意識的に」各自でやってもらわないと、
Googleにワケの分からないことを報告するバカが大量発生するから。
何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

Googleにしてみればこう。
ユーザ「Mozc最高だぜ」
Google「(うんうん)」
ユーザ「人名xxxxもアレな名詞xxxxも出てくるぜ」
Google「(ん？？？)」
Google発表「基本的にはデフォルトで使うのが一番精度が高いのであります」

それに非公式辞書追加を知らずして
「Googleさん辞書追加ありがとー！！」とか言われても、
Googleも辞書作者も甲斐がないだろ？

>>278
debianだと2ch辞書を選択制にしたりとか、
gentooだとmplayerとか？のビルドオプション選ばせたりとか。
「各自で意識的に選んでね」というのはよくある方式よ。
文句あるなら選択ダイアログ出せばいいじゃん。
辞書がアドオン形式ならパッケージ名で明確に分割できるけど、
Mozcは全部一体だからしょうがない。

バイナリ禁止自体は昔LAMEで見たような気がする

288:login:Penguin
10/06/02 17:51:17 02i5Uj0J
>>287
Anthyよりmozcの方が変換精度が高いとか言ってるやつらはみんなそれだよな。
同じ辞書を追加した状態でのAnthyとmozcは大差ないだろ。

289:login:Penguin
10/06/02 18:01:18 grruSKdq
LAMEのバイナリ配布は特許にひっかかる恐れがあるからではなかったかと。
今回の問題とは若干違うような。

>「意識的に」各自でやってもらわないと、
>Googleにワケの分からないことを報告するバカが大量発生するから。
>何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

これはほぼ同意。

290:login:Penguin
10/06/02 18:02:11 nCOjwefR
まあどうしてもバイナリ配布したくて(各自でビルドすりゃいいことだと思うけど)、
非公式版であることをハッキリさせたいのであれば、
デフォルトのバイナリパッケージ+差分パッチぐらいか？
パッチで非公式バイナリを意識的に「再現」させるという形。

しかし自分好みにしたいんだったら自分でビルドくらいは当たり前じゃねえの？
それに辞書作者の意向つうかMozcプロジェクトの現状レベル考えたら、
今はデフォルト状態でテストしたほうがいい。
原作者が「余計な辞書入れたら精度下がる」つってんだしさ

291:login:Penguin
10/06/02 18:50:57 9TUUxqr0
バイナリ配布が基本的に禁止というと思い出すのがかつてのqmail。

292:login:Penguin
10/06/02 19:06:18 /GEmtGf2
>>289-290
辞書作者もそう思ってるだろうが、
それならなんでバイナリ配布OKのライセンスで配布するのか分からない

293:login:Penguin
10/06/02 19:26:14 O5aiTgdT
ぶっちゃけリポジトリを公開したら、webの注意書きなんて読むような
聞き分けのいい人じゃなくてタコ以外使うわけないだろ。
特にubuntuなんでデフォルトで対応しているのに、作っておきながら
組み込んでますなんて意味不明だ。
しかも、バグ報告は送るなといってるけど、じゃあ誰に送るんだ？
お前が引き受けろよ、そうでなければ公開すべきじゃない。

294:login:Penguin
10/06/02 19:29:49 1sMEC1wh
>>292
もとはModifiedAnthy向けに公開されていた辞書だから
Mozc用に改めてライセンスをいじっても仕方ない

295:login:Penguin
10/06/02 19:37:51 CGmWTyeQ
>>293
誰に言っているのか知らないが、俺のubuntuで
apt-get install ibus-mozc
とやってもインストールできない。本当にデフォルトで対応してるの?

296:login:Penguin
10/06/02 19:44:23 x5YErinu
>>293
日本語が不自由な人のような

297:login:Penguin
10/06/02 20:00:24 OEd5PW/N
>>293
すまん、意味不明すぎて何をいってるのかさっぱりわからん。

298:login:Penguin
10/06/02 20:00:48 9DErp56Y
>>295
Currently, we only support Ubuntu 9.10 and 10.04 for building Mozc.
URLﾘﾝｸ(code.google.com)

299:login:Penguin
10/06/02 20:02:49 t70gHhyq
>>295
リポジトリは加えなくてはダメ
加えても性能のいいModifiedAnthyは使うなといわれた
初心者にはibus-mozicの魅力が薄れた

いまここ

300:login:Penguin
10/06/02 20:04:18 L1cbISCc
anthyがいいとか言ってる池沼レベルの人間がまだいるんだな

301:login:Penguin
10/06/02 20:07:31 w3pItDF+
>>288 とかもね。

302:login:Penguin
10/06/02 20:08:54 fe2DcE2M
人それぞれさ、お気に入りのを使えば良いだけ

303:login:Penguin
10/06/02 20:17:47 RpWCZxYd
Google -IMEって変換エンジンはVJEの流用だったっけ？

304:login:Penguin
10/06/02 20:41:06 HiSOFHLt
>>303
そんな話どこで読んだの?

305:login:Penguin
10/06/02 20:48:51 408ZUOE4
>>267
ども、UNIX的手法だったんですね。全然身についてないなあこういう即席データ処理。

>>268
>> SKKのスモール辞書辺りの単語は網羅されているのか比較
>くだらねー。
>それに単に網羅したって意味ないよ。
>要らない単語削って頻度指定して…とやらないとな。
>ためしにユーザ辞書として一律にインポートしてみれば。

なにが言いたいのかさっぱりです。
デフォルト辞書で網羅してたら辞書インポートする必要無いのでは？
その場合の追加辞書という意味では、まあ確かに意味が無いですが、
判断の為の辞書内容の分析が下らないというのは意味不明です。

抜けている単語を抽出して、それが本当に変換出来ないのか確認してみるのは、
やみくもに探したり、ひたすらバグ報告を待つより早いのでは？

306:login:Penguin
10/06/02 21:22:35 408ZUOE4
>>287
そもそも、純正版と改造版を共存できるようにしたほうがわかり易いんじゃないですかね？
ビルドしない人にとっては意識できないままで、単純に退化したとしか思わないでしょうし。

307:login:Penguin
10/06/02 21:31:19 RpWCZxYd
>>304
あー、ごめん、VJE使ってるのはYahoo!の方だったわ。

308:login:Penguin
10/06/02 21:35:29 408ZUOE4
Google SONY連合ということで、mozcにsj3を合体させたらなにができるんだろうか？

309:login:Penguin
10/06/02 21:58:00 nCOjwefR
>>305
だからさ、やってみりゃいいじゃん。
S辞書とMozcデフォルト辞書の差分だろ？

SKK辞書は動詞の形式が特殊だから、
単純に比較できるのは名詞系だけかもな。

> デフォルト辞書で網羅してたら辞書インポートする必要無いのでは？
網羅してるかどうか分からんのでしょ？
試しにやってみて動作を確認すればと言ったわけよ。
Mozcのユーザ辞書のシステム辞書に対する優先度は知らないんだけど、
「漏れてる」と判断された短い単語がたくさんあれば、
おかしな変換結果が大量に発生して、
単純差分じゃ意味がないことがすぐに分かると思ったから。
実際どうなるかは俺も知らん。

Mozcのデフォルト辞書は長年編集されてきて収録数も膨大なIPAdicでしょ？
> SKKのスモール辞書辺りの単語は網羅されているのか比較
こんな発想おれにはないよ。「スモール」辞書と比較？
バカだなあ、と思いつつも、
>>305が意外な発見をして本家に有益な貢献をするのかもなあ

310:login:Penguin
10/06/02 22:35:24 nCOjwefR
>>305
とりあえずやってみた。
雑にやったものだからソースとかは出さねえよ。
確認したのは「存在しない表記」だけな。読みは無視。

SKK-Sには重複除いて4581の表記がある。
このうち単漢字・アルファベット・記号以外で
Mozcデフォルト辞書に入っていないのは次の通り。

仮名漢字変換
全角仮名
半角仮名
半角片仮名
日帰
最寄
相変
見掛
見落
記事選択

以上。
単漢字は自分で探してくれ。
記事選択とかは分けて変換できると思うので、
全部網羅されてると言っていい。

じゃあな

311:login:Penguin
10/06/02 22:41:13 408ZUOE4
>>309
詳しいやり方がわかりませんので、簡単にできるなら是非どうぞ。

とりあえず茶筅やメカブの辞書をgrepして眺めているだけですが、
IPAdicはあくまで形態素のコーパスで、熟語は音声処理用かなんかの逆変換で使いにくい
短い単語とかは結構足りないんじゃないかって気がします。
例えば宮城県で探しても大学の名前しかでてこなくて県名単体すら入ってない。
Mozcの辞書も傾向は似ていますが、unicodeな単語とかも入ってて
多少改善してる感じは気のせいでしょうか？

312:login:Penguin
10/06/02 23:00:23 408ZUOE4
っと入れ違いでした
>>310
どうもです。とりあえず予想通りって事ですよね。
単漢字の漏れというのはどうなんですかね？
まあ扱いは難しそうですが。

313:login:Penguin
10/06/03 00:50:31 0C19uf7w
>>311
なにがしたいのか意味が分からないのだけど
「宮城」「県」が入っていれば
「宮城県」は変換できる。
というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
ディスクの無駄だし。
短い単位で解析できるように、というのが UniDic。
自分でクロールしてきたデータに UniDic の MeCab をかけてコーパス作ればいいんじゃないかな

314:login:Penguin
10/06/03 00:59:29 wmng9tJY
＞というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
そもそも大規模コーパスというのはそういう方針とは思えませんが？

パーツの頻度を掛け算した予測頻度を実際の頻度が上回るのであれば登録するべきでしょう。

315:login:Penguin
10/06/03 09:15:19 1uwN98gG
>>300-301
私家版辞書追加して、さすがGoogleって言ってる馬鹿約2名発見しますた。

316:login:Penguin
10/06/03 09:29:34 1uwN98gG
確かに午後と打ちたければ、午と打って後と打てばいいよなｗｗｗ
それとも午後の紅茶と打って、の紅茶を削るか？ｗ
もうアホかと。

317:login:Penguin
10/06/03 10:29:33 cLHYQIlM
>>42
つきはＷakame(ワカメ)だな

318:login:Penguin
10/06/03 11:03:56 yHIg/azl
いやcombだろ

319:login:Penguin
10/06/03 11:43:56 8rrDcIso
libiconvェ…

320:login:Penguin
10/06/03 12:20:21 r9B8lAgG
uim-mozcのビルド方法おしえてくだい

321:login:Penguin
10/06/03 12:38:19 dyOLzhIN
# make; make; make clean

322:login:Penguin
10/06/03 13:37:11 u1itOj+L
>>320
URLﾘﾝｸ(code.google.com)

323:login:Penguin
10/06/03 14:11:44 zicLG5/c
mozcは低能糞ソフトでまともに使えないから、中の辞書だけが欲しいんだよね。

mozcの辞書はどこに置いてあって
どうやってplaintextに変換できるわけ？

324:login:Penguin
10/06/03 15:01:06 bG0s/qhN
糞で低能な奴に「低能糞ソフト」呼ばわりされるmozcとその開発陣は不憫だな。

325:login:Penguin
10/06/03 15:07:37 0C19uf7w
>>314
そうか？　「宮城県」は「宮城」と「県」であって、
「宮城(固有名詞)」の左に来る品詞と「県(接尾辞)」の右に来る品詞は違うのに、
登録してしまうと区別できなくなってしまう。
連接コストまで考えると単語の頻度だけで簡単に決まるものではないので、
なんでもかんでも登録するとむしろ精度悪化することもあるんじゃないかなあ。
(くっつけても品詞が変わらないものはくっつけたものを登録してもいいと思うが)

326:login:Penguin
10/06/03 16:11:34 uFbeO/du
結局、AnthyとMozcってどこが違うの？
Ubuntuで使ってるけど、はじめからあるAnthyよりはMozcの方がよさげだけど

327:login:Penguin
10/06/03 16:30:35 AE+ltDI6
>>326
anthyは開発停止してたんじゃなかったっけ？
mozcは開発公開が始まったばかり。

かなり初期の段階だから、開発協力者だけにしたい状態じゃないかな。
だから、辞書のバイナリうんぬんの話もでる。
stableちかくまで普通は待ったほうがいいだろうね。それでもanthyよりmozcの
ほうがいいように思う。

328:login:Penguin
10/06/03 16:50:09 8XZFMkrD
>>327
> anthyは開発停止してたんじゃなかったっけ？
再開したよ。
URLﾘﾝｸ(sourceforge.jp)

329:login:Penguin
10/06/03 17:30:21 xiIjB+In
>>326
anthyは親指シフトに対応している

330:login:Penguin
10/06/03 18:24:16 u1itOj+L
辞書が同じなら云々言ってる人たちは文節ごとに変換してる人たちでしょ。
文章で変換すれば違いは一目瞭然。

331:login:Penguin
10/06/03 18:26:44 wmng9tJY
>>355
県の後ろにつながるの品詞と、宮城県の後ろにつながる品詞は大差ない。
つまり語頭と語尾の文脈IDを継承すれば済む話。

332:login:Penguin
10/06/03 18:28:03 wmng9tJY
>>325　失礼

333:login:Penguin
10/06/03 19:31:44 HrnMknGo
>>330
筋がいいのはMozcだけど、
IPAdicのせいか文章を細かく区切りすぎるような感じはしてる。
「ご|ご」とか「する|シ」みたいな感じで。
ある程度の長さを入力すれば改善するけど、
やっぱりちょっと細かい感じはするな。
語尾とか複合語の切り方がおかしくなるときがある。

Anthyだとdepgraphだったか語のつながりをある程度まとめてくれるので、
「細かい」って感じはしない。
複合語もcompound.tか何かに大量登録されてるしな。

IPAdicは文章を単語に分割するツールでも使われてるんだっけ。
短い単語に比重がかかりすぎな感じがちょっとする。
複合語を大量追加＋短い単語の優先度をちょっと下げる、
くらいの調整はいるかもね。

ちょっと使った感想なんで勘違いかもしれん

334:login:Penguin
10/06/03 19:59:43 AE+ltDI6
>>333

そうだなぁ。検索するときには文章をキーワードにすることはないから、
検索屋さんが作ってるだけに、切り替えみたいなのは欲しいかも。
ibusのプラグインでSKK一発切り替えがあればなぁ。と変態的に思ってる。

mozcの一番良い使い方はおおよそ感じ取れるようになったけど、
やっぱり文節ごとに変換させるのはあまり良くなさそうだな。

335:login:Penguin
10/06/03 20:00:21 eXkP2joF
anthyを頻りに擁護するバカがいついてる模様

336:login:Penguin
10/06/03 20:56:17 0C19uf7w
>>331
あなた中国出身？ (煽りじゃなくてね)
後ろにつながる品詞は同じだが、
県の前に接続する品詞と、宮城の前に接続する品詞が違うという話。
「宮城県に出張に行った」は言うけど「県に出張に行った」は言わないでしょ？
あと、確かに左文脈と右文脈は別々に定義できるようになっているけど、
実際の辞書は左文脈ID=右文脈IDなので、やっぱり区別できないと思うよ。

337:login:Penguin
10/06/03 21:44:04 PxaC1S8F
uze-

338:login:Penguin
10/06/03 21:52:20 pPPT4Ls/
一般名詞と接尾の「県」は別個に登録されているから区別できるんじゃないのか？

339:login:Penguin
10/06/03 22:26:56 wmng9tJY
>>336
宮城県に
県に
言うでしょ。

340:login:Penguin
10/06/03 23:00:05 wmng9tJY
駅名なんかをみると、左文脈IDと右文脈IDが異なっている複合語を見かけるけど、幻覚なんだろうか？
それとも、変換エンジンが無視しているって話？

341:login:Penguin
10/06/04 01:57:57 ZO43vMX/
コンパイル中暇だからソース漁ってたら…
これは酷い
URLﾘﾝｸ(mozc.googlecode.com)

342:login:Penguin
10/06/04 02:06:05 kzCJPyMQ
いまさら。

343:login:Penguin
10/06/04 02:14:04 ZO43vMX/
あれ？
mozcってLinuxだけだよね？
Windows用のプログラムも混じってない？

344:login:Penguin
10/06/04 04:21:19 4TzFfVhZ
いまさら。

345:login:Penguin
10/06/04 06:17:40 mBX7YmR0
私家版辞書を追加したmozcを変換効率だなどと頻りに擁護するバカがいついてる模様

346:login:Penguin
10/06/04 10:04:52 NpMgVDdo
PCが無いと「頻りに」なんて漢字出てこないバカどもの議論ってこと？

347:login:Penguin
10/06/04 11:01:45 sE1oayZo
345はただの基地外なので放置推奨

348:login:Penguin
10/06/04 13:00:07 mBX7YmR0
>>335 >>347
>>345

349:login:Penguin
10/06/04 17:15:10 YpJdVChb
mozc/ipc/unix_ipc.ccだとローカルソケット(socket AF_UNIX)使っていて、
mozc/ipc/win32_ipc.ccだと名前付きパイプ(CreateNamedPipe)使っているけど、
ローカルソケット(socket AF_UNIX)をwindowsでそのまま使わなかった理由はなんなのだろう。

350:login:Penguin
10/06/04 19:08:43 YpJdVChb
自己解決した。たぶん理由は２つ
1.IPスタック
　WindowsのAF_UNIXソケットはIPスタックを回避できない
2.セキュリティ上の問題
WindowsのgetsocketoptはSO_PEERCREDが使えないため、
　アクセス元の情報を取得出来ない

これを避けるには名前付きパイプを使えばいいのか...な...たぶん

351:login:Penguin
10/06/04 19:38:47 2qDpkCoq
もずく酢

352:login:Penguin
10/06/04 19:46:47 ov5hWS+Q
iBus立ち上がらねぇぇぇええええ
藻屑はインストール出来て設定まで出来ているのに・・・・・　　　　@SUSE

353:login:Penguin
10/06/04 20:06:23 QQcLRn+n
そういえば、モズクの辞書を逆にメカブで使ったら性能どうなるんだろ？

354:login:Penguin
10/06/04 22:07:20 kzCJPyMQ
mozc の辞書ってそんなにいいの?

355:login:Penguin
10/06/05 02:12:01 lBoLIUKF
>>352 ん？iBus何か難しいことあったっけ？シェルからibus-daemonでどんなエラー出てる？

356:login:Penguin
10/06/05 06:19:24 D5PsWP6U
>>354
mozcの辞書がいいのではなく、UTUMIさんの辞書がいいだけ。
それを勘違いしてGoogleってスゲーって言ってるバカが、変換効率がいいとかいってるだけの話。

357:login:Penguin
10/06/05 06:49:54 xabQhbJd
たしかにUTUMIさんの辞書はいい
mozc使う人は素のmozcの能力を見極めて
改良に努めるべき。

358:login:Penguin
10/06/05 08:30:41 g/NHqkpU
>>356
しつこいなanthy君ｗ

359:login:Penguin
10/06/05 09:10:15 r9Lhvdmg
Mozcのデフォルト辞書はあんまり人の目でチェックされてない感じがする。
「べっさつ」と入力して方向キーの↓を押し続けると、
別冊すてき
別冊家庭画
別冊花

別冊すてきな奥さん、家庭画報、花とゆめ、が途中で切れたのかな。

べびーざら 2239 2318 6181 ベビーザら
「ベビーザらス」だな。

未知語の自動収集精度が良くないのかもなあ。
いや全体的にはそこそこの精度なのかもしれないが、
ノーチェックで収録してしまう感覚がまずいのかも。

わかりやすいのは「ん」ではじまるやつ。
ンコ気持、ンコさん、ンコたち、ンコちゃん、ンバーワン、ンピングカー、
ンブラー、ンプ場...
全くチェックしてないんだろうなあ。
きちんとしたIPAdic+雑な自動収集語という感じ。

頻度設定も怪しいところが。
「ふくらはぎ」と入力すると「フクラハギ」が第一候補。
よく使われるのは平仮名表記のはず。

何度か話でてると思うけど、短い文節だと極端に精度下がるのも気になる。
(入力終えて部分修正するときに、目的の表現がなかなか出てこないことがある)
「云い始めた」が第一候補になったり。
「そんな事を言い始めた」だと「言い始めた」になるんだが。

360:login:Penguin
10/06/05 09:19:22 fhMYXk7C
人力でどうこうやるのはGoogleの文化じゃないんだろう。

361:login:Penguin
10/06/05 09:29:33 r9Lhvdmg
なんじゃこりゃ系の登録

わーほりいぎりす 2239 2239 8157 ワーホリイギリス
ーとくん 2239 2319 6228 ートくん
ーままさん 2239 2319 7097 ーママさん
ヾの 2239 2239 8280 ヾノ
ぇんと 2239 243 7023 ヴェンと
いきちやん 2303 2303 8986 益暢
けんてんのう 2303 2239 7136 謙天皇
(孝謙天皇？)
このごろろ 2290 2239 7931 このごろろ
こんじょうてんのう 2239 2239 7590 今上天皇
(きんじょう)
こんすか 2979 2239 7552 今スカ
こんすたじお 2979 2239 7788 今スタジオ
こんすたっふ 2979 2239 7540 今スタッフ
こんすとれす 2979 2239 7788 今ストレス
こんすぽーつ 2979 2239 7626 今スポーツ
こんすーぱー 2979 2239 7227 今スーパー
こんせいかつ 2979 2234 7293 今生活
こんせいふ 2979 2239 7841 今政府
こんせいり 2979 2234 7849 今整理
こんせいり 2979 2239 7392 今生理
こんせけん 2979 2239 6929 今世間
こんせっけい 2979 2234 7924 今設計
こんせっと 2979 2239 7746 今セット
こんせつめい 2979 2234 7180 今説明
こんせぶん 2979 2301 6735 今セブン

適切な表現も混じってるかもしれないが、収録するほどでもないだろと

362:login:Penguin
10/06/05 09:38:44 r9Lhvdmg
>>360
まあなあ。

Google IMEの辞書ぐらい質を量で押し切ればいいんだろうけど、
現状だと中途半端な感じ

363:login:Penguin
10/06/05 10:12:08 D5PsWP6U
>>358
しつこいな変換精度くんｗ
辞書以外のところでmozcがどう変換精度が優れてるのか説明してみろ

364:login:Penguin
10/06/05 10:38:19 FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなｗ

365:login:Penguin
10/06/05 10:43:36 GieRvdIi
変な日本語w

366:login:Penguin
10/06/05 11:44:27 r9Lhvdmg
こんな記法もあるのか？
{こうたろう/ひろたろう} 2303 2303 5867 廣太郎

あとゴミっぽい収録語の続き
ヶせっと 2239 2239 8037 ヶセット
ヶらヶら 2239 2239 7784 ヶラヶラ
ぁでふぉるまにあこれくしょん 2239 2239 8118 ぁでふぉるまにあこれくしょん
んたーねっと 2239 2239 8085 ンターネット
んでぃーず 2239 2239 8230 ンディーズ
んぷさいと 2239 2239 8410 ンプサイト
んぷふぁいやー 2239 2239 8385 ンプファイヤー
んらんど 2310 2310 5391 ンランド

中黒付きの未知語は取れない？
ばらくおばま 2239 2239 7916 バラクオバマ
バラク・オバマ無し

変わった読みかたのチェックが甘い？
ばり 2239 2239 6859 尿

どこかで出てたご変換(「誤変換」が出ないし「誤」もなかなか出ない)
あいぱっど iPod

「がい買い」も出にくい。「臥位」よりも後。
「あと後」の優先度も低いなあ。
「よりも|あと」だと7番目。
「あと」単体でも「跡」より下になる。

367:login:Penguin
10/06/05 12:26:17 R3XOmDMP
>>366
イって打ったあと、ンターネットって打ったりする人のために・・

368:login:Penguin
10/06/05 12:44:57 D5PsWP6U
>>364
結局変換精度の説明は出来ないってことですね？ｗ

369:login:Penguin
10/06/05 13:27:13 r9Lhvdmg
単漢字で出にくいもの。

「ち　日」出るのが早すぎ。そもそも必要？
「こ　子」なかなか出ない。
「だん　男」なかなか出ない。
「くん　組ん」出るのが早すぎ。「君」「くん」を優先。
「じん　腎」出るのが早すぎ。「人」を優先。
「かみ　上」最優先にするものではないと思う。「紙」「神」を優先。
「せい　生」全然出てこない。かなり下にある。
「とう　頭/冬/島など」なかなか出てこない。
「かい　回」なかなか出ない。
「きょう　強」なかなか出ない。
「じ　時」なかなか出ない。
「さる　申」「猿」を優先。

「そよぐ」普通に変換すると「そよぐ」になるが、
「戦ぐ」が第一にサジェストされるのはなぜ？
こういうケース結構ある。

「たんさん　単三」候補がない。

370:login:Penguin
10/06/05 14:58:33 7VLh6t0e
>>368
そんなこと言ってると、mozcの変換精度が他と比べてたいしたことないってこと
説明してよと言いたくなるじゃないか。

371:login:Penguin
10/06/05 15:17:11 R3XOmDMP
まあ何はともあれAnthy以外に選択肢ができたのはいいことだ。

372:login:Penguin
10/06/05 16:19:04 SieYDk6Z
？ ATOKがあるじゃん。

373:login:Penguin
10/06/05 16:32:36 ZADDM2Q0
>>367
ゴミとか言ってる奴は変換辞書を国語辞典かなにかと勘違いしてるんじゃないの？

基本的には自動収集で大は小を兼ねるって思想だよな、元々の辞書に比べて足りない方が問題。
ケチくさい奴は他の変換使ってればいいよ。

検索屋の発想だから、悪影響のあるゴミはルールで排除って感じでしょ？
結局そこんとこがグーグルの肝なのでフリーになってない訳で。

374:login:Penguin
10/06/05 17:21:43 rTZo1uGy
ヶセットは～個セット、ヶラヶラは笑い声の擬音かな
「こせっと」「けらけら」の読みで変換できるといいね

ところで、「か」「が」「こ」で「ヶ」が出ない

375:login:Penguin
10/06/05 17:44:16 D5PsWP6U
>>370
変換精度云々言い出したのは、Googleとmozcをﾏﾝｾｰしてるやつの方。
一般的には選択肢が増えた程度の認識しかない。

376:login:Penguin
10/06/05 18:00:55 r9Lhvdmg
>>373
>>362 >>359

>>374
> ヶセットは～個セット
そうだな。
しかし「けせっと」だと「毛セット」、
「こせっと」だと「小セット」になって、
「ヶセット」が出ない。
sannxkesetto、とかじゃないと出ないな。

Google IMEの辞書から秘密情報を取り除いて、
低頻度の表現をバッサリ削ったもののほうが、
精度としては良くなる気がする。

377:login:Penguin
10/06/05 18:13:22 r9Lhvdmg
Mozcで困るのは、先々の方針がよくわからないことだなあ。
これだけ早く設定ツール出すんだったら、
mozc-configの人もCUIまででやめてたんじゃないかな。
(止めてたんじゃないかな、が出ない。)
辞書をチェックするにしてもツール作るにしても
ムダデマ(無駄手間、が出ない)になる恐れがある。
あとで嫌な思いしないように(ように、の順位低い)、
眺める程度のことしかできない。

変換確認にしたって辞書がゴソッと変わったらイチからやり直しだもんな。

次ページ