[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 2chのread.cgiへ]
Update time : 01/06 13:42 / Filesize : 188 KB / Number-of Response : 765
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

mozc / Google 日本語入力 #1



1 名前:login:Penguin [2010/05/13(木) 11:58:50 ID:e7jJ/yN9]
code.google.com/p/mozc/
ref.
sourceforge.jp/magazine/10/05/11/0335246
googlejapan.blogspot.com/2010/05/google_10.html

2 名前:login:Penguin [2010/05/13(木) 13:35:59 ID:O0qZ7dj/]
現時点でパッケージを配布しているサイトを調べてみた

Mandriva
www.geocities.jp/ep3797/mozc_01.html

FedoraとUbuntu
linux.ikoinoba.net/index.php?UID=1273605455

PCLinuxOS
tomcat.nyanta.jp/sb2/sb.cgi?eid=317

Momonga
b.awn.cc/2010/05/momonga-linuxgoogle.html

Fedora
tagoh.fedorapeople.org/ibus-mozc/

ほかにあれば追加よろしく

3 名前:login:Penguin [2010/05/13(木) 13:40:57 ID:O0qZ7dj/]
debianに取り込まれるようだ
bugs.debian.org/cgi-bin/bugreport.cgi?bug=581158

4 名前:login:Penguin mailto:sage [2010/05/13(木) 14:06:04 ID:y0/Hl/0B]
Arch Linux
aur.archlinux.org/packages.php?ID=37131

5 名前:login:Penguin mailto:sage [2010/05/13(木) 15:08:09 ID:y0/Hl/0B]
tomcat氏のパッケージにGoogle日本語入力のアイコン (もしくはそれにクリソツな物)
使ってるみたいだけど、これライセンス的にヤバくないの?

6 名前:login:Penguin mailto:sage [2010/05/13(木) 15:29:54 ID:O0qZ7dj/]
どんなのか知らないけど似てるだけなら問題ない

7 名前:login:Penguin mailto:sage [2010/05/13(木) 15:44:26 ID:y0/Hl/0B]
少なくとも上海万博のテーマソングよりオリジナルに似てる。
というかそのまんまなかんじ。

8 名前:login:Penguin mailto:sage [2010/05/13(木) 17:23:04 ID:xS73WnAg]
ダメならGoogleが警告するでしょう。

9 名前:login:Penguin mailto:sage [2010/05/13(木) 18:18:47 ID:SrfxWAX1]
>>5
アイコン差し替えたらしい。

10 名前:login:Penguin mailto:sage [2010/05/13(木) 18:38:28 ID:y0/Hl/0B]
ほんとだ、仕事が速い。
mozcのバグトラッカーにも「アイコンつけてくれよ」的な要望があがってたから、
そのうちchromuimみたいにmozc用アイコン用意されるかもね。
っていうかそれに期待。



11 名前:login:Penguin mailto:sage [2010/05/13(木) 19:55:32 ID:VXGGLAQH]
googleがibusを選んだことでibus最強伝説が始まるのかな

12 名前:login:Penguin mailto:sage [2010/05/13(木) 23:15:19 ID:Nw/pWA1B]
顔文字はないのか?
先読みした文字列を選ぶのにはtabキー使うのか。
マウスで選んでも反映されないな。

13 名前:login:Penguin mailto:sage [2010/05/14(金) 00:19:52 ID:jXUhgslI]
候補に数字が振られてるから数字キーで選べるのかと思ったら、それもダメだった。

14 名前:login:Penguin mailto:sage [2010/05/14(金) 00:27:46 ID:Z50AdfD5]
普通にカーソルキーで選べるよ

個人的にはスペル判らない英単語がくろーむとか読みで変換出来る奴が欲しいかな、
順位は一番下でいいんだけど。

15 名前:login:Penguin mailto:age [2010/05/14(金) 05:12:52 ID:1eOIuraW]
〇〇県とか〇〇市とか一発で出ない

16 名前:login:Penguin mailto:sage [2010/05/14(金) 20:05:21 ID:V8YokLRh]
モズク?と呼べばいい?海のモズクになるかな?w

17 名前:login:Penguin mailto:sage [2010/05/14(金) 20:12:46 ID:RKoNrI9+]
>>16
えっ?

18 名前:login:Penguin mailto:sage [2010/05/14(金) 20:51:26 ID:UhlYQllq]
>>16

ttp://internet.watch.impress.co.jp/docs/news/20100511_366273.html
> Google日本語入力をオープンソース化するプロジェクトは、「Mozc(モズク)」と名付けられ、専用サイトでの情報公開やソースコードの提供などが始められた。

19 名前:login:Penguin mailto:sage [2010/05/14(金) 21:27:35 ID:/QeyC4hy]
なるも何もモズクは元から海のものなんだぜ

20 名前:login:Penguin mailto:sage [2010/05/14(金) 21:48:39 ID:zcXnY/Qu]
チラシの裏
「海の…と消える」「海の…となる」
○「もくず(藻屑)」
×「もずく(水雲,海蘊)」
ttp://kotonoha.cc/no/62264



21 名前:login:Penguin mailto:sage [2010/05/14(金) 23:00:47 ID:16GEbLzF]
何にせよでたばっかなんでこれからに期待
オープンソースなんで誰がいじってもいいんだが出来ればきちんとしたプロジェクトが欲しいところ

22 名前:login:Penguin mailto:sage [2010/05/14(金) 23:12:54 ID:Ivit4eRw]
Linuxでは、変換は半ば諦めていたがついに来たか。
はじまったばかりとはいえ、変換効率ではすでにAnthyとは比ぶべくもない。
まあ、「くらぶべくもない」は変換できなかったわけだが。

記念カキコ@Arch Linux

23 名前:login:Penguin mailto:sage [2010/05/14(金) 23:29:32 ID:GNLYfS8s]
設定画面が実装されるまでの代わりになりそうなもの発見。
github.com/hidegit/mozc-config

24 名前:login:Penguin mailto:sage [2010/05/14(金) 23:30:30 ID:GNLYfS8s]
h抜き忘れた、ごめん

25 名前:login:Penguin mailto:sage [2010/05/14(金) 23:33:14 ID:tJIzuQ9X]
未だにhがどうこう言ってる人いたのか

26 名前:login:Penguin mailto:sage [2010/05/15(土) 00:50:34 ID:zuogiZUr]
さっそくいれてみた>mozc-config
Arch用。
aur.archlinux.org/packages.php?ID=37131

27 名前:login:Penguin mailto:sage [2010/05/15(土) 01:12:29 ID:CRGQ+MuZ]
>>2に追加。

Momonga用spec file

ttp://developer.momonga-linux.org/viewvc/pkgs/trunk/pkgs/ibus-mozc/ibus-mozc.spec?revision=43945&view=co

28 名前:login:Penguin [2010/05/15(土) 01:17:28 ID:nnVyvNGN]
mecabの作者がからんでるみたいだし、今後も期待できるよな。
日本語変換関連で有名なハッカーみたいだし。

29 名前:login:Penguin mailto:sage [2010/05/15(土) 13:02:02 ID:0uvn7PI2]
>>3見ながら入れてみた@xubuntu9.10
アイコンはやっぱり寂しい気がする

30 名前:login:Penguin mailto:sage [2010/05/15(土) 13:18:00 ID:OvnKkS2u]
アイコンはよーわからんが自分でビルドしたやつなら
/usr/share/ibus-mozcにproduct_icon.pngでアイコンに
したい画像をおいてmozcを再起動してやると表示されるよ

mozc.xmlに書いてあった



31 名前:login:Penguin mailto:sage [2010/05/15(土) 13:35:54 ID:0uvn7PI2]
>>30
レスありがと
自前ビルドなんだけど/usr/share/ibus-mozcがなかった
どこにいったのかちょっと調べてみる

32 名前:login:Penguin mailto:sage [2010/05/15(土) 13:39:51 ID:OvnKkS2u]
>>31
/usr/share/ibus-mozcは多分つくってやらないとないと思われる

sudo mkdir /usr/share/ibus-mozc

でつくるといいと思うよ

33 名前:login:Penguin mailto:sage [2010/05/15(土) 13:44:30 ID:0uvn7PI2]
ごめん。自分でディレクトリ作って、そこに放り込めばよかったんだね

34 名前:login:Penguin mailto:sage [2010/05/15(土) 13:45:58 ID:0uvn7PI2]
調べている間にレスが付いてた
リロードしときゃよかったorz
重ね重ねありがとです


35 名前:login:Penguin mailto:sage [2010/05/15(土) 15:39:19 ID:WBC1KGbj]
VineSeed
ttp://ml.vinelinux.org/vineseed/msg04129.html

36 名前:login:Penguin mailto:sage [2010/05/15(土) 19:49:54 ID:xsBDhuUs]
「もずく」って俺の地方の方言では「チン毛」の事なんだけど皆さんの住んでる処ではどうですか?



37 名前:login:Penguin mailto:sage [2010/05/15(土) 20:30:24 ID:WBC1KGbj]
>>36
「もずく」ではない。「Mozc(モズク)」だ!


38 名前:login:Penguin mailto:sage [2010/05/15(土) 20:47:44 ID:dl5VQhEj]
方言というより、その地域でよく使われる暗喩表現じゃね

39 名前:login:Penguin mailto:sage [2010/05/15(土) 21:11:41 ID:+VLrpVYE]
なんかネーミングが悪いよね。Mozukuにするべきだった。

40 名前:login:Penguin mailto:sage [2010/05/16(日) 00:01:11 ID:bGG7bl+1]
検索に引っかからない単語を選んだのでは。



41 名前:login:Penguin mailto:sage [2010/05/16(日) 00:20:06 ID:kVBIoRlz]
mozc悪くないね
Anthyは、漢字は知ってるけど日本語がわかってない感じだった
mozcはちゃんと日本語が分かっている感じがする
文節を区切って変換する人は、Modified Anthyのほうが幸せになれるだろうけど
長文を打つ人やAtokに憧れてる人にはいいと思う

42 名前:login:Penguin mailto:sage [2010/05/16(日) 01:52:18 ID:SQrMrh4P]
mozcは名前をみれば作者がわかるからね。mecab/mozcとくればつぎなんだろうね
という程度。

43 名前:login:Penguin mailto:sage [2010/05/16(日) 01:55:41 ID:SQrMrh4P]
>>40
検索屋がつくってるから、それはあるんだろうね。

44 名前:login:Penguin mailto:sage [2010/05/16(日) 03:16:46 ID:Jq+w1ra8]
つぎは
ひじき
つづり
ふめい

45 名前:login:Penguin mailto:sage [2010/05/16(日) 07:19:55 ID:KwS5bda1]
ひじきに一票

46 名前:login:Penguin mailto:sage [2010/05/16(日) 07:27:28 ID:LEPWL7ld]
awabi

47 名前:login:Penguin mailto:sage [2010/05/16(日) 07:45:50 ID:s4uMTR0w]
「もずく」(チン毛) の次は 「わかめ」(マン毛)だろ

48 名前:login:Penguin mailto:sage [2010/05/16(日) 09:40:49 ID:LEPWL7ld]
入力モードのアイコンは出せないのか。。。

49 名前:login:Penguin mailto:sage [2010/05/16(日) 10:57:27 ID:dqv9F0yk]
固有名詞とか普通に出てくるようになった
乗り換えない理由がなくなったな

50 名前:login:Penguin mailto:sage [2010/05/16(日) 20:42:16 ID:eFgJW+/G]
最後をdで「ど」と読む海藻類・・・



51 名前:login:Penguin mailto:sage [2010/05/16(日) 20:45:09 ID:MN751rmN]
twitter.com/taku910/statuses/14090223097

>Google 日本語入力のOSSは、例の辞書がないから無意味とか言われると、とても残念だ。

お前ら批判されてるぞw

52 名前:login:Penguin mailto:sage [2010/05/16(日) 20:55:31 ID:mCXM9j+3]
猫に小判って事さ。
向こうはプロ。批判しているのは素人。

そしてオイラはSKKユーザだから対岸の火事w

53 名前:login:Penguin mailto:sage [2010/05/16(日) 21:00:27 ID:cH9XZXAo]
ボール乗りにガンダムが配備されると勝手に思っただけで、別にガンタンクが配備されたからって拗ねてませんよ。

54 名前:login:Penguin mailto:sage [2010/05/16(日) 21:30:36 ID:BYyS/9z2]
エスティマハイブリッドを注文したらガソリンエンジンの
エスティマが届いたでござるの巻

55 名前:login:Penguin mailto:sage [2010/05/16(日) 21:59:20 ID:kKWK8GP9]
uim使ってるオレはibusにしか対応してないから拗ねてるけどな。

56 名前:login:Penguin mailto:sage [2010/05/16(日) 22:21:33 ID:LDcnnSF/]
mozcは、使うアプリによっては、注目している文節の位置が分かり難いね。
GTK_IM_MODULE=xim にすると分かり易くなるけど、今度は変換候補窓が明後日な位置に出ちゃう。


57 名前:login:Penguin mailto:sage [2010/05/16(日) 23:01:01 ID:sGArlv0L]
>>52
っていうか、SKKってつまりKAKASIの辞書ってことでしょ?
あれぶち込んだら熟語系は結構補完できないものだろうか?

>>55
しかし汎用プロトコルサーバって作れないものかな?
pulseadioみたいに対応アプリによって別プロトコルのサーバに見えるみたいな。


58 名前:login:Penguin mailto:sage [2010/05/16(日) 23:01:17 ID:dqv9F0yk]
例の辞書使えるようになってるけどな

まなか→真中瞳
かるろ→カルロス・ゴーン
ぱんく→パンクブーブー
ばらく→バラク・オバマ
しゃんはいば→上海万博
とある→とある科学の超電磁砲
そらの→ソラノヲト

アップデートで辞書更新してるのかな?


59 名前:login:Penguin mailto:sage [2010/05/16(日) 23:39:56 ID:mCXM9j+3]
>>58
そんなフランクな辞書嫌だ……

60 名前:login:Penguin mailto:sage [2010/05/16(日) 23:41:22 ID:+DbqisIG]
漏れのでは
かるろ->カルロス
    ->カルロスゴン

だけどw「かるろすご」までいくとゴーンが出てくるけど



61 名前:login:Penguin mailto:sage [2010/05/16(日) 23:47:19 ID:tIejJQ9m]
まなか→茉奈佳奈

62 名前:login:Penguin mailto:sage [2010/05/17(月) 00:05:58 ID:MPHEbhtS]
>>58
例の辞書と言われても一昨日使い始めたばかりなのでわからないけど、なんかパワーアップしてるね。
どういう事なんだろうこれ?

63 名前:login:Penguin mailto:sage [2010/05/17(月) 00:35:56 ID:6iXl9CjZ]
なんでパッケージの入手元を書かないかね。
あ、うぶん厨か。

64 名前:login:Penguin mailto:sage [2010/05/17(月) 01:46:43 ID:MPHEbhtS]
っていうか、野良ビルド入れようとしててふとapt掛けたら入っちゃって拍子抜けした訳で。
何もせずに只更新しただけで辞書が充実するなんて初めての経験だわ。

65 名前:login:Penguin mailto:sage [2010/05/17(月) 01:47:27 ID:1JzuPqRl]
>>63
goo.gl/xsxM

66 名前:login:Penguin mailto:sage [2010/05/17(月) 02:26:09 ID:L4lIJaWJ]
>>23で紹介されてた mozc-config にGUIが実装されたよ。

67 名前:login:Penguin mailto:sage [2010/05/17(月) 08:17:33 ID:SrnXuvoJ]
>>58
時間が経つとこの変換ができるようになるの?なんで?
まなか がまだでないよ。

68 名前:login:Penguin mailto:sage [2010/05/17(月) 09:00:55 ID:3VvgwkSa]
>>67
野良パッケージを使ってて、その野良が辞書追加してくれてるだけ。

69 名前:login:Penguin mailto:sage [2010/05/17(月) 09:50:39 ID:LXrt6Hw/]
>>51
辞書が使えなくて既存よりちょっとマシ程度では、夢と希望の99%は潰えたわけで
この分野では(IMだけでなく自然言語処理)一緒に夢を見させてはくれないということね。
ちょっとM$のようで幻滅。

70 名前:login:Penguin mailto:sage [2010/05/17(月) 09:54:20 ID:GgtwhzgO]
>>69
MicrosoftもGoogleも営利企業だから、営利優先なのは仕方ないだろう。
Googleに変に期待するのは間違いというものだ。



71 名前:login:Penguin mailto:sage [2010/05/17(月) 10:15:13 ID:LXrt6Hw/]
>>70
M$とgoogleではブランドイメージが違うよ。というか違ってた。
今は足元が見えなくなった似たような巨大企業に見えるって話。脱線してるね。

72 名前:login:Penguin mailto:sage [2010/05/17(月) 14:20:04 ID:C9+QIeWJ]
>>71
あんたが勝手な思い込みで過剰に期待してただけじゃないのか、それは

73 名前:login:Penguin mailto:sage [2010/05/17(月) 15:24:58 ID:wWBDQlhu]
mozc-configのmozc再起動オプションがうまく働かないのは俺だけ?
とりあえずmain.ccをこうしてみたら再起動してくれるようになった。

int reboot() {
- const char *path = "/usr/bin/killall";
+ const char *path = "/usr/bin/ibus-daemon";
char *const argv[] = {
- (char *)"/usr/bin/killall",
- (char *)"ibus-daemon",
+ (char *)"/usr/bin/ibus-daemon",
+ (char *)"-rdx",
(char *)NULL
};


74 名前:login:Penguin mailto:sage [2010/05/17(月) 16:24:41 ID:m44FgXbZ]
Googleはケチっぽいな

75 名前:login:Penguin mailto:sage [2010/05/17(月) 18:00:46 ID:MPHEbhtS]
>>67
うちは>>61と同じだわ。
学習してるんじゃないの?
例えば曹操とか一度分けて変換したら次から出るようになったよ。

>>68
とりあえずmozc用にapt line追加したりはしていないんだよね。
モデファイアンシーの時に色々やってたのが効いてる気がするけど覚えてないや。

辞書はどうやらそれ由来の奴が追加されたのかな?
しかしそれだけでこれだけ印象が変わるというのは発見だと思う。
anthy用の辞書がこんなに使えるものだったなんて、
単にグーグル変換使ってるだけじゃ気がつかなかっただろうな。

76 名前:login:Penguin mailto:sage [2010/05/17(月) 18:21:38 ID:z+wFOyNB]
>>71
そりゃ勝手に期待していただけで、まともな人は MS も Google も同程度に evil
だって思っているよ。(Google が evil じゃない程度には MS も evil じゃない)

>>69
(MeCab も使っている) IPADic は40万語の辞書をフリーで公開してくれていて、
MeCab も Mozc もその恩恵を最大限に受けているわけだが、
それで自然言語処理まで幻滅と言うのは言い過ぎだと思うぞ。
Debian かなにかに入っている Cannadic を使った ChaSen でも使ってみるといいよ。
「ちょっとマシ」どころではない。
そして、Mozc みたくデータ構造やアルゴリズムまで惜しみなく公開してくれてるんだから、
うだうだ言ってないであとは自分で作ればいいじゃん。

77 名前:login:Penguin mailto:sage [2010/05/17(月) 18:57:08 ID:L4lIJaWJ]
今 gclient sync したら リビジョン 14 だったんだけど、13 と何が変わったのか分からん。

78 名前:login:Penguin mailto:sage [2010/05/17(月) 19:04:56 ID:bWqpYvJz]
>>77
WinとOSXの開発版がアップデートされたからそれに伴う変更だと思うけど。
変換周りでの変更では口語表現の変換精度の向上とあるから、その辺の変更だと思う。

79 名前:login:Penguin mailto:sage [2010/05/17(月) 19:09:36 ID:6iXl9CjZ]
>>77
Change Log みろよ。wikiの更新だけ。
mozcソースはr10から更新されてない。

80 名前:login:Penguin mailto:sage [2010/05/17(月) 19:16:14 ID:MPHEbhtS]
>>76
まあ、グーグルは検索売ってる会社でMSはOS売ってる会社だからな
本業絡みのフリー公開要求は酷でしょ。
只、オマケに関する考え方はかなり違うんじゃないかな?

日本語変換に関して言えば、各社公開してきた中で、MSが公開したのはAPIだけだろうか?
DOS用のFEPが利用できたりしたのにはそのお陰もあっただろうとは思うけど。



81 名前:login:Penguin mailto:sage [2010/05/17(月) 19:21:14 ID:bWqpYvJz]
すまない。ソースは更新されていないね。
もしかすると、OSSで公開したときにWinとOSX用の変更も入っていたのかも。

82 名前:login:Penguin mailto:sage [2010/05/17(月) 21:50:10 ID:MPHEbhtS]
Mozc-0.11.356.0 というのは結局何を表しているのだろうか?

83 名前:login:Penguin mailto:sage [2010/05/17(月) 22:08:20 ID:6iXl9CjZ]
バージョンでしょ。どこで表示されるのか知らないけど。

84 名前:login:Penguin mailto:sage [2010/05/17(月) 22:41:05 ID:otewHu6c]
> 669 login:Penguin sage 2010/05 /11(火) 12:12:07 ID:GIqwpOCz
> 10.04 にibus-mozc_0.10.288.102-1_i386.deb を入れてみた
> 「バージョン」を変換して表示されるバージョンは「Mozc-0.11.352.0」みたいだね

公開時のバージョンはMozc-0.11.352.0 だったね

85 名前:login:Penguin mailto:sage [2010/05/17(月) 22:45:05 ID:sen2xgUr]
今はMozc-0.11.357.0だよね

86 名前:login:Penguin mailto:sage [2010/05/17(月) 22:51:53 ID:LXrt6Hw/]
>>76
幻滅しているのは結局皆で協力して作る体制でないこと。

googleの収集能力に皆の知恵を合わせればきっといろいろな素晴らしい辞書や
それに見合うさまざまな自然言語処理ロジックができると思う。ロジックなんて
データとセットだと思うし、基礎分野で直接金儲けなんて所詮無理だと思うんだよね。
それが望みなら個々にやってもいいんだけどさ。つまらないなと思って。

87 名前:login:Penguin mailto:sage [2010/05/17(月) 23:30:39 ID:MPHEbhtS]
>>86
よくわからないけど、そんなの単に呼びかければいいだけの話じゃないの?
それとも鍋パーティーで持参した材料が期待はずれだったって話?

88 名前:login:Penguin mailto:sage [2010/05/17(月) 23:43:37 ID:6iXl9CjZ]
バージョン番号の3つ目は、ビルドした日で決まる。2009年5月24日からの日数。

89 名前:login:Penguin mailto:sage [2010/05/17(月) 23:46:25 ID:LXrt6Hw/]
>>87
出された料理にケチつけてるだけだぞ。正直言ってガッカリだって。

90 名前:login:Penguin mailto:sage [2010/05/17(月) 23:51:36 ID:MPHEbhtS]
>>89
まずそれが理解できないんだよな。まだそんなバージョンじゃないような気がするし。



91 名前:login:Penguin mailto:sage [2010/05/18(火) 00:02:35 ID:B2LkaHDw]
>>88
うん。
// mozc_version_template.txt
MAJOR=0
MINOR=11
BUILD=daily

// mozc_version.py
if expand_daily and self._build == 'daily':
zero_day = datetime.date(2009, 5, 24)
self._build = str(
datetime.date.today().toordinal() - zero_day.toordinal())

ソースの改変に関係なく毎日バージョンが上がる。

実際のソースのバージョンはこれ、
$ ./gclient revinfo
src: mozc.googlecode.com/svn/trunk/src@16;
src/mozc_build_tools/gyp: gyp.googlecode.com/svn/trunk@819;
src/protobuf/files: protobuf.googlecode.com/svn/trunk@328;
src/third_party/gtest: googletest.googlecode.com/svn/trunk@422
「0.11.16」ってことになるのかな

92 名前:login:Penguin mailto:sage [2010/05/18(火) 00:18:46 ID:vzn3LFMg]
>>90
ん?早合点なのかな?もう少し待ってみよう
面白そうになったらまた来るよ

93 名前:login:Penguin mailto:sage [2010/05/18(火) 00:57:27 ID:ek1o3lz7]
>>86が言ってることはわかるけど、googleの収集能力はプライバシー問題と切り離せないってことや
Win版で問題になってる意図的に間違った語彙やエロ単語ばっかり送ってる連中がいること忘れてないか?
世の中きれい事だけで出来てるわけじゃないしな

94 名前:login:Penguin mailto:sage [2010/05/18(火) 08:59:01 ID:JWxOBNY+]
誤変換でエロとか隠語ばかりでてくればやっかいだもんな。
個人的な予想だけど、辞書は辞書で別に育てるプロジェクトが
できるんじゃないの?核になる辞書はすでにあるんだし。

95 名前:login:Penguin [2010/05/18(火) 10:03:01 ID:LImcuvrf]
てすと
tools.google.com/dlpage/res/japaneseinput/images/icon-128.png

96 名前:login:Penguin mailto:sage [2010/05/18(火) 13:47:49 ID:70sjXmJM]
> きちんとパッケージングしたい時は、ibus-setup-mozc(pythonスクリプト)内で
決め打ちされている LOCALE_DIR の値を適切なパスで書き換えてください。


ibus-setup-mozcのLOCALE_DIRに書くパスはどのように書けばいいのでしょうか?
とりあえずLOCALE_DIR = /home/Mydir/.mozcとしたけどダメでした

97 名前:login:Penguin mailto:sage [2010/05/18(火) 14:10:36 ID:5Kw0K1CN]
>>96
やっつけで書いた汚いパッチですが、ご参考までに。
aur.archlinux.org/packages/mozc-svn/mozc-svn/packaging-mozc-config.patch

setup.glade は /usr/share/mozc-config/setup.glade を想定。
ja.mo は /usr/share/locale/ja/LC_MESSAGES/ibus-mozc.mo を想定。

で、mozc r18 でソースに更新が入り、mozc-config の make が通らなくなりましたよと。

98 名前:login:Penguin mailto:sage [2010/05/18(火) 14:13:23 ID:70sjXmJM]
>>97
早速の対応ありがとうございますm( _ _ )m


99 名前:login:Penguin mailto:sage [2010/05/18(火) 14:25:57 ID:70sjXmJM]
>>97
でもスキルがないので使い方わからないです(つд⊂)エーン

100 名前:login:Penguin mailto:sage [2010/05/18(火) 21:20:30 ID:zuDAgc9p]
辞書鍛えられた、俺のuim、primeと比べたらまだまだだね、というか専門用語が
当て字でないとでないので登録できないのは致命的だと知った今日この頃でした



101 名前:login:Penguin mailto:sage [2010/05/18(火) 21:34:46 ID:v2MqqeZ1]
無変換押しても認識してくれないのはどうすりゃいいの?
ひらがな->カタカナにしたいときとか

102 名前:login:Penguin mailto:sage [2010/05/18(火) 21:57:33 ID:9S8dCsGu]
r21まで上がってるね。結構、変更入ってそう。

103 名前:login:Penguin mailto:sage [2010/05/18(火) 22:04:54 ID:5Kw0K1CN]
ソースに変更が入ってるのはr18のみ。
しかも変更内容が全然書かれていないLog。

104 名前:login:Penguin mailto:sage [2010/05/18(火) 22:05:49 ID:ob1SjPRd]
mozc-config -s session_keymap MSIME

105 名前:login:Penguin mailto:sage [2010/05/18(火) 22:22:09 ID:Cw6VPgaB]
>>100
ビルド時に辞書へ登録すればいいと思って、登録様式を眺めているが
まだ理解しきれていない。

106 名前:login:Penguin mailto:sage [2010/05/18(火) 23:04:29 ID:7/hsmRtM]
>>105
ttp://www.geocities.jp/ep3797/mozc_01.html
そんなあなたにここで公開されている[開発者向け] Mozc辞書生成用のスクリプトとデータ
というのを使うと幸せになれるかも
Rubyで書かれているらしいから、Rubyを解釈できるなら適切な形に書き換えると汎用性
アップするかも

107 名前:login:Penguin mailto:sage [2010/05/18(火) 23:26:18 ID:5Kw0K1CN]
mozc-configで単語登録できるようになった模様。

108 名前:login:Penguin mailto:sage [2010/05/19(水) 00:07:33 ID:Abp89he5]
>>104
サンキュー

109 名前:login:Penguin mailto:sage [2010/05/19(水) 01:29:49 ID:OiNM5kLh]
>>86
幻滅もなにも、Googleはこれまで検索インデックスも検索アルゴリズムも公開していない。
(PageRank は公開したが、あれはもはや数千とも数万とも言われるランキングの特徴量の一つにすぎない)

Search Wiki で検索結果にみんなの知恵を合わせる方法も、去年一時期やっていたが止めた。
そもそも協力するという会社ではない。

オープンソースはばんばん利用して、少しだけ(20%ルールでやった部分)公開する。
もともとクローズドな会社でしょ。MS と同じくらい evil だって知らないで騒いでいるだけだよ。
Google 日本語入力はもう20%ルールではないし、公開できない部分が増えても当然。

110 名前:login:Penguin mailto:sage [2010/05/19(水) 04:20:37 ID:MWVh65Mq]
>>101
F7



111 名前:login:Penguin mailto:sage [2010/05/19(水) 08:20:38 ID:f/GdZ3Wf]
>>101
>>110
mozcに限ったことではない。スレ違い氏ね。


112 名前:login:Penguin mailto:sage [2010/05/19(水) 08:40:33 ID:YHsJ/j49]
>>111
>>104

>>107
mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
ところでこれ消すのはどうするんだろう?

113 名前:login:Penguin mailto:sage [2010/05/19(水) 09:06:43 ID:7ZniSmP+]
r21、ビルドできないぞ…。

114 名前:login:Penguin mailto:sage [2010/05/19(水) 09:22:08 ID:Abp89he5]
漏れはdebuildしてるけど、依存関係でエラーでたから、それインストールしてやったらでけた。
libprotobuf-dev libgtest-devだったと思う。

115 名前:login:Penguin mailto:sage [2010/05/19(水) 09:26:47 ID:7ZniSmP+]
>>114
うわーほんとだ! Wiki の依存項目も更新されてるのを見落としてた。
さんくす。

116 名前:login:Penguin mailto:sage [2010/05/19(水) 14:34:36 ID:bawMocvX]
>>112
> mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
> ところでこれ消すのはどうするんだろう?

修正および消去が実装された模様。

117 名前:login:Penguin mailto:sage [2010/05/20(木) 23:06:32 ID:GdrSg3LG]
mozc-configの中の人ここ見てるかなあ。
make install を実装したのはいいけど、ibus-setup-mozc 忘れてますよ(´・ω・`)
バグトラッカーにあげるのも躊躇するほどのアレだし…

118 名前:117 mailto:sage [2010/05/20(木) 23:21:12 ID:GdrSg3LG]
いや、忘れてない、俺の勘違いだった。

119 名前:login:Penguin mailto:sage [2010/05/21(金) 03:04:25 ID:YmYjM0UN]
だめだ。ibusに耐えられない。
uimで実装してくれ。

120 名前:login:Penguin mailto:sage [2010/05/21(金) 08:17:43 ID:2eer+h5s]
画面の下の方で入力してると予測候補のリストが入力中の文字を隠してしまう。
これもibusの問題かなあ。
あと、候補リストの矢印アイコン。あれ、いらんやろ。



121 名前:login:Penguin mailto:sage [2010/05/21(金) 11:06:48 ID:ivOBc5wp]
そのむかしiDic入れたとき、クソのような人名と品詞の影響による誤変換で泣きたくなった。
誰がチェックしたかもしれない辞書による、余計なお世話の予測変換は虫唾がはしる。
日本史辞典の水準で人名と固有名詞が登録されている辞書なら欲しいんだけどな。
カタカナ単語は、変換後に慣用語として自動登録してくれりゃいい。

122 名前:login:Penguin mailto:sage [2010/05/21(金) 17:19:42 ID:9H77kE5p]
r23に上がってるね。ibus周りの修正みたいだけど。

123 名前:login:Penguin mailto:sage [2010/05/22(土) 07:00:25 ID:vjYfauX/]
さぁ、今日も辞書を鍛える作業が始まるよ!

124 名前:login:Penguin [2010/05/23(日) 02:07:57 ID:UspU2FkD]
学習の保存量ってどれぐらいだろ?
すぐ忘れてる気がする

125 名前:login:Penguin mailto:sage [2010/05/23(日) 15:50:41 ID:FDXRwsL4]
ibus-setup-mozcの「Sellection Shortcut」は,「l(エル)」が一個多いな.


126 名前:login:Penguin mailto:sage [2010/05/25(火) 20:03:59 ID:D0kMVtAD]
mozc 開発は日本人の最後のフロンティアだな

127 名前:login:Penguin mailto:sage [2010/05/26(水) 11:44:05 ID:tVqPx3QC]
キーバインドが良くわからんです。
変更するってのは検索すればみつかるんだけど。
ことえり準拠?
それでもよくわからんです^^;
と、skkばかりつかってる人間です。

128 名前:login:Penguin mailto:sage [2010/05/26(水) 19:31:15 ID:ttKtttaQ]
twitter.com/search?q=%23mozc
「Google でインターンをしませんか?」のRTの嵐。
全然役に立たねえ。

129 名前:login:Penguin [2010/05/27(木) 02:12:08 ID:8D3Mnw58]
ibus-mozc-dictの話題が皆無な件について

130 名前:login:Penguin [2010/05/27(木) 04:01:18 ID:A7Erm6S6]
いつの間にか入ってましたMozc Dictionary Tool。ありがたいこってす
カラムとボタンの文字が日本語じゃないのは何ででしょう



131 名前:login:Penguin mailto:sage [2010/05/27(木) 12:37:26 ID:6uBEpbK/]
そろそろdebianのtestingに入れてください

132 名前:login:Penguin mailto:sage [2010/05/27(木) 13:40:36 ID:rhN036Jj]
Google 日本語入力の開発版をアップデートしました。 (Ver 0.11.365.10x)
ttp://googlejapan.blogspot.com/2010/05/google-ver-01136510x.html

ちょっとビルドしてくる

133 名前:login:Penguin mailto:sage [2010/05/27(木) 14:03:04 ID:MgqFshjq]
>>131
まだunstable にもはいってないよ

134 名前:login:Penguin mailto:sage [2010/05/27(木) 14:54:09 ID:oxCJ8BjK]
>>132
mozc-config 短い命だったなあ。

> # Google 日本語入力と同様、変換エンジンを別プロセス化することにより、
> 他のインプットメソッドフレームワーク (SCIM 等) と共存しやすくしました。

+   +
  ∧_∧ + 
 (0゚・∀・)    ワクワク
 (0゚∪ ∪ +     テカテカ
 と__)__) +

135 名前:132 mailto:sage [2010/05/27(木) 15:07:30 ID:rhN036Jj]
>>132
無事、環境設定も辞書登録もできるようになったね
これでWine 経由で辞書登録しなくてすむよー

136 名前:login:Penguin mailto:sage [2010/05/27(木) 16:20:41 ID:oGq87vUm]
都道府県名入力の改善って偉く強引だな
結局、品詞を細かく処理するより辞書に放り込む方が効率的なのか

137 名前:login:Penguin mailto:sage [2010/05/27(木) 16:25:06 ID:cGg44XXv]
qt4関連の依存が増えましたね。

138 名前:login:Penguin mailto:sage [2010/05/27(木) 16:51:15 ID:6tiTtwJ6]
>>134
mozc-configってgtk系じゃなかったっけ。
qt4依存が嫌な人にはいいかもしれないよ

139 名前:login:Penguin mailto:sage [2010/05/27(木) 16:54:00 ID:n0R4gbiR]
Gentoo使いとか特にな。インストール時間に雲泥の差が・・・・

140 名前:login:Penguin mailto:sage [2010/05/27(木) 16:58:01 ID:oxCJ8BjK]
>>138
qtが必要なのはビルド時だけ、ということになっている。



141 名前:login:Penguin mailto:sage [2010/05/27(木) 17:19:35 ID:oxCJ8BjK]
あれ? 依存する qt のパッケージが Wikiと debian/control とで違ってるなあ。
俺うぶんちゅじゃないから関係ないけど。

142 名前:login:Penguin mailto:sage [2010/05/27(木) 17:45:50 ID:YRoffuhF]
あ・・・
ちょっと教えて下さい。
ibus_mozc は ibus-engine-mozc へ
mozc_server, mozc_tool は何にリネームすればよし?

143 名前:login:Penguin mailto:sage [2010/05/27(木) 18:06:00 ID:oxCJ8BjK]
そのままでよろし。

144 名前:login:Penguin mailto:sage [2010/05/27(木) 18:19:27 ID:YRoffuhF]
自己解決。
/usr/lib/mozc を作成してそのまま放り込むのね。
/debian/rules 読んで解決しますた。

145 名前:login:Penguin mailto:sage [2010/05/27(木) 18:21:48 ID:rhN036Jj]
言語パネルを表示しない人向け

Mozc 辞書ツール
/usr/lib/mozc/mozc_tool --mode=dictionary_tool

Mozc プロパティ
/usr/lib/mozc/mozc_tool --mode=config_dialog

146 名前:login:Penguin mailto:sage [2010/05/27(木) 19:26:45 ID:DRUPPUiv]
何かビルドすると競合が起きてエラーが出るようになった。
1回全部消して再ビルドしても同じだった。

# debuild -uc -us
dpkg-buildpackage -rfakeroot -D -us -uc
dpkg-buildpackage: set CFLAGS to default value: -g -O2
dpkg-buildpackage: set CPPFLAGS to default value:
dpkg-buildpackage: set LDFLAGS to default value: -Wl,-Bsymbolic-functions
dpkg-buildpackage: set FFLAGS to default value: -g -O2
dpkg-buildpackage: set CXXFLAGS to default value: -g -O2
dpkg-buildpackage: source package mozc
dpkg-buildpackage: source version 0.11.365.102
dpkg-buildpackage: source changed by Yasuhiro Matsuda <mazda>
dpkg-buildpackage: host architecture i386
dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp
dpkg-buildpackage: warning: Build dependencies/conflicts unsatisfied; aborting.
dpkg-buildpackage: warning: (Use -d flag to override.)
debuild: fatal error at line 1340:
dpkg-buildpackage -rfakeroot -D -us -uc failed

147 名前:login:Penguin mailto:sage [2010/05/27(木) 19:28:15 ID:DRUPPUiv]
とりあえず指示通り"-d"を付けたらビルド通った。

148 名前:login:Penguin mailto:sage [2010/05/27(木) 19:28:27 ID:v0MonnWY]
いや…1340行目でエラーとあるが…1340行目確認したのかい?

149 名前:login:Penguin mailto:sage [2010/05/27(木) 19:32:45 ID:DRUPPUiv]
と思ったらやっぱり同じエラーが出て駄目だ。

>>148
これからチェックします。

150 名前:login:Penguin mailto:sage [2010/05/27(木) 19:38:48 ID:rhN036Jj]
>>146
>dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp

これは入れなくていいのかな



151 名前:login:Penguin mailto:sage [2010/05/27(木) 19:40:49 ID:cGg44XXv]
>>150
僕はそれをapt-get installしてコンパイルとインストールをしたよ。

152 名前:login:Penguin mailto:sage [2010/05/27(木) 19:53:47 ID:6Y+ANOvv]
漏れもそれを入れて、debuildしたよ

153 名前:login:Penguin mailto:sage [2010/05/27(木) 20:05:53 ID:DRUPPUiv]
QT4関連のパッケージが入ってなかった…。
スレ汚し申し訳ないです。

154 名前:login:Penguin mailto:sage [2010/05/27(木) 21:36:13 ID:uPQpxNci]
あえなくなってしまう を変換するには何を辞書登録すべきなんだろうか?


155 名前:login:Penguin mailto:sage [2010/05/27(木) 21:38:22 ID:dxF6D4ZX]
ツールバーが駐車禁止マークなのはなんとかならんのか。
アイコンないの?

156 名前:login:Penguin mailto:sage [2010/05/27(木) 21:43:58 ID:Q5Q/OSyK]
>>155
あなたがデザインして送ればいいじゃないか。

157 名前:login:Penguin mailto:sage [2010/05/27(木) 21:54:18 ID:izabMx5Y]
そのアイコン、何処のディレクトリに何という名前で置けばいいのかな?
/usr/share/ibus-mozc 下?

158 名前:login:Penguin mailto:sage [2010/05/27(木) 21:57:34 ID:dxF6D4ZX]
>>156
他力本願w
Chromeに対するChiromiumのように、青を基調になにかないかねぇ。
Google検索に間違って登録されてる朝昇龍が辞書ツールのお陰で朝青龍になってウマー

>>153みたいになったけど、何か必要なパッケージが増えたんだろうと思って素直に
sudo apt-get install g++ python libibus-dev libcurl4-openssl-dev libssl-dev zlib1g-dev libdbus-1-dev libglib2.0-dev libprotobuf-dev protobuf-compiler libgtest-dev subversion devscripts debhelper qt4-dev-tools gyp
やったら、ずらずらと追加されて、ビルド通ったから、コンパイル通らないとここで書くようなヘマしなくて済んだ。

159 名前:login:Penguin mailto:sage [2010/05/27(木) 22:02:26 ID:izabMx5Y]
以前からUTUMIさんの辞書を追加してビルドしているんだけど、
今回のリビジョンではその辞書が有効になっていない様な気がする。


160 名前:login:Penguin mailto:sage [2010/05/27(木) 22:06:57 ID:YRoffuhF]
>>159
>今回のリビジョンではその辞書が有効になっていない様な気がする。

\(^o^)/オワタ

大丈夫、有効になってる。



161 名前:login:Penguin mailto:sage [2010/05/27(木) 22:09:36 ID:izabMx5Y]
>>160
あ、俺だけかorz

162 名前:161 mailto:sage [2010/05/27(木) 22:16:37 ID:izabMx5Y]
今までの ~/moz を削除して自動的に新しい ~/moz を作らせたら
UTUMIさんの辞書も有効になった。ヨカッタ∩( ・ω・)∩


163 名前:login:Penguin mailto:sage [2010/05/28(金) 02:59:18 ID:SzcMjVfl]
unix/uim/mozc.cc:240: error: cannot allocate an object of abstract type ‘mozc::uim::Session’

で止まった。

164 名前:login:Penguin mailto:sage [2010/05/28(金) 03:00:35 ID:SzcMjVfl]
ウ、誤爆

165 名前:login:Penguin [2010/05/28(金) 15:23:31 ID:XhIFu/as]
mozc_serverが変換するようになったんだよね?
辞書を組み込みは以前と同じように dictionary1.txt でいいの?

166 名前:login:Penguin mailto:sage [2010/05/28(金) 17:37:36 ID:M6g8oFq5]
>>165
いいよ。

本家uimもmozc対応に動いてるみたいね。

167 名前:login:Penguin mailto:sage [2010/05/28(金) 17:58:58 ID:M6g8oFq5]
わーい、uim-mozcイイカンジ。

168 名前:login:Penguin mailto:sage [2010/05/28(金) 18:04:24 ID:mJqoHRFq]
テスト

z+, ‥
z+. …
z+/ ・
z+h ←
z+j ↓
z+k ↑
z+l →

169 名前:login:Penguin mailto:sage [2010/05/29(土) 00:32:58 ID:yDWgz2cr]
uim-mozcって、変換前入力中のカーソルの左右移動がおかしくない?
「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。
ibus-mozcだと問題なさげ。

しかし、俺って今までどんだけアホなIM使ってたんだよと、しみじみ感じている。
文章打つのがたのしくて仕方ない。

170 名前: [―{}@{}@{}-] login:Penguin [2010/05/29(土) 02:01:59 ID:AyL6o9sV]
アイコンの設定はxmlじゃなくてソースに直書きのようで、
ソース漁って見つけた。
ツールのアイコンは
/usr/share/ibus-mozc/unknown.ico
でいけた。中身はpngでいけた。
この先もコロコロ変わるんだろうけど。



171 名前: [―{}@{}@{}-] login:Penguin [2010/05/29(土) 02:08:24 ID:AyL6o9sV]
↑の名前に/usr/share/icons/gnome/scalable/categories/preferences-system.svg
のリンク貼ってもいけた

172 名前:login:Penguin [2010/05/29(土) 04:26:35 ID:AyL6o9sV]
アイコンファイルらしきやつら
./unix/ibus/main.cc:const char kEngineIcon[] = "product_icon.png";
./unix/ibus/path_util_test.cc: const string &icon_path = GetIconPath("test.png");
./unix/ibus/path_util_test.cc: const string kExpected = "/test.png";
./unix/ibus/mozc_engine.cc:const char kMozcToolIconPath[] = "unknown.ico";
./gui/about_dialog/about_dialog.cc: product_image_.reset(new QImage(":/product_logo.png"));
./gui/about_dialog/version_image_widget.cc: pixmap_.reset(new QPixmap(":/update_uptodate.png"));

173 名前:login:Penguin mailto:sage [2010/05/29(土) 05:05:05 ID:HpwUbVkD]
Qtの依存性はとってほしいのう

174 名前:login:Penguin [2010/05/29(土) 05:55:26 ID:AyL6o9sV]
っぽい?
gazo.pandoravote.net/src/1275079999785.png

175 名前:login:Penguin [2010/05/29(土) 06:02:32 ID:AyL6o9sV]
アイコンファイル名まとめ

・エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
・ツールアイコン /usr/share/ibus-mozc/unknown.ico
・なにやら用途不明 update_uptodate.png test.png

ファイル形式はとりあえず、png svg など?

176 名前:login:Penguin mailto:sage [2010/05/29(土) 07:17:39 ID:BVlp1Ywh]
>>174
アイコンはmozc iconsとかで画像でググると・・・・
(gogle以外から取るのが憚れるのなら、本来linuxでは使えない本家をダウンロードしようとしてキャンセルすると右側に・・・)
ツールアイコンは、seahorceのアイコンを使えば・・・

177 名前:login:Penguin mailto:sage [2010/05/29(土) 07:21:55 ID:BVlp1Ywh]
>>176
ごめん
ツールアイコンは>>171使えばいいのか

178 名前:login:Penguin mailto:sage [2010/05/29(土) 07:36:25 ID:BVlp1Ywh]
ツールの方はうまくいったけど、product_logo.pngがうまくいかない。

179 名前:login:Penguin mailto:sage [2010/05/29(土) 07:47:20 ID:AyL6o9sV]
ロゴは>>95に貼ってあるよ

180 名前:login:Penguin mailto:sage [2010/05/29(土) 07:52:21 ID:BVlp1Ywh]
>>179
それを使ってるんだが、うまくいかない。
32ピクセルじゃないと駄目なのかなと思って、変換したんだけど、変換しても駐車禁止マークのままだorz



181 名前:login:Penguin mailto:sage [2010/05/29(土) 08:13:57 ID:AyL6o9sV]
あ、ごめんなさい>>175間違ってる
×エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
○エンジンロゴアイコン /usr/share/ibus-mozc/product_icon.png

182 名前:login:Penguin mailto:sage [2010/05/29(土) 08:18:55 ID:BVlp1Ywh]
>>175
const char kEngineDescription[] = "Mozc Japanese input method";
const char kEngineIcon[] = "product_icon.png";
const char kEngineLanguage[] = "ja";


product_logoじゃなくてproduct_icon>>172じゃないか
いけた!



183 名前:login:Penguin mailto:sage [2010/05/29(土) 08:21:57 ID:BVlp1Ywh]
をを!情報の所のアイコンも歯車から>>95のアイコンになってるよ。
thx!

184 名前:login:Penguin mailto:sage [2010/05/29(土) 14:43:55 ID:owr+HVq8]
おもしろそうだけど
こりゃ、まだ手を出すには早そうだw

185 名前:login:Penguin mailto:sage [2010/05/29(土) 15:14:57 ID:yDWgz2cr]
>>169
> uim-mozcって、変換前入力中のカーソルの左右移動がおかしくない?
> 「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。

これ直った。中の人ありがとう。

186 名前:login:Penguin mailto:sage [2010/05/29(土) 16:13:55 ID:BVlp1Ywh]
www.geocities.jp/ep3797/mozc_01.html
ここの人名辞書と、追加名詞辞書、郵便番号辞書を書いてある通りに辞書書き換えてからビルドすると、google日本語入力と遜色ないね。
アイコンも表示させちゃったし満足。

187 名前:login:Penguin mailto:sage [2010/05/29(土) 16:24:48 ID:Wy6TIjrt]
>>186
ところがまだ当分、アップデートはおおいんじゃない?めんどくさそうだよ。

188 名前:login:Penguin mailto:sage [2010/05/29(土) 16:50:31 ID:BVlp1Ywh]
>>187
そのうち各ディストリビューションで標準で使えるようになるでしょう。
Chromiumブラウザも最初は酷いもんだったし、それと同じ様に完成していく過程を楽しめばよい。

189 名前:login:Penguin mailto:sage [2010/05/29(土) 18:47:37 ID:WFFijhq6]
>186-187
ユーザー辞書にインポートすればok。
186のURLから入手できる辞書ファイルは、ユーザー辞書用とはデータのパターンが違うが、
書き換えればいける。
個人的にはAnthyで作ってたユーザ辞書を変換してmozcで使えるようにしたから、
完全に乗換ちゃった。

190 名前:login:Penguin mailto:sage [2010/05/29(土) 19:15:21 ID:ZqFe9xLl]
>>189
ユーザー辞書にインポート

辞書が更新

さらにインポート

重複した単語が増えて無意味に辞書が膨れ上がる

と、ならないか?



191 名前:login:Penguin mailto:sage [2010/05/29(土) 19:30:12 ID:yDWgz2cr]
あるかもしれんけど、mozcが辞書に本格的に手を入れることはあるのか。
あるとしても当分先なのでは。

192 名前:login:Penguin mailto:sage [2010/05/29(土) 19:47:39 ID:3OqiOhkT]
どれ位なら本格的と言えるかわからないが
この間の更新では7万語ほど追加された

193 名前:login:Penguin mailto:sage [2010/05/29(土) 21:17:05 ID:yDWgz2cr]
>>192
まじで? そういうの Commit Log に残らないのかな?
7万語ものdiff見せられても困るけど。

194 名前:189 mailto:sage [2010/05/29(土) 22:43:57 ID:WFFijhq6]
>190
重複することは考えてなかったけれど、重複はしてるんでしょうね。
ただ、実際に使っていて、気にはならないよ。
むしろ、今まで育ててきた辞書に登録してある単語が変換できなくなる方が困る。
辞書が脹れ上がったばあい、何が問題になるの?


195 名前:189 mailto:sage [2010/05/29(土) 22:57:54 ID:WFFijhq6]
>190
~/.mozc にあるユーザー辞書へのインポートだから、mozc本体をアップデートしても
再インポートにはならないです。

196 名前:login:Penguin mailto:sage [2010/05/29(土) 23:10:09 ID:yDWgz2cr]
ちょっと調べてみたが、すでに重複が存在する。
例えば、
$ grep "ILO条約" *.txt
dictionary1.txt:あいえるおーじょうやく 2310 2239 7323 ILO条約
mozc-meisi-20100516ut.txt:あいえるおーじょうやく 2239 2239 14771 ILO条約

ついでに、UITUMIさんの辞書自身の内部にも重複があったりした。
例えば、
$ grep "0741273.*北海道深川市音江町" *.txt
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町

読みと漢字は同じだが、真ん中の数字が違うのがオリジナルの辞書にあったりするから、
正確な重複数までは確認できてない。

197 名前:login:Penguin mailto:sage [2010/05/29(土) 23:16:18 ID:yDWgz2cr]
>>194
> 辞書が脹れ上がったばあい、何が問題になるの?

その程度次第だけど、重複していることがわかると、
「どのくらい重複しているのか」
「果たしてこの追加辞書にどれだけの追加する価値があるのか」
とかいろいろ気になってしまう。

198 名前:login:Penguin mailto:sage [2010/05/29(土) 23:54:45 ID:yDWgz2cr]
オリジナルの辞書に「赤木リツコ」や「涼宮ハルヒ」はあんのに「磯山さやか」がないのはどう言うことだ?
納得できんな。

199 名前:login:Penguin mailto:sage [2010/05/30(日) 00:17:22 ID:72nIDqZ2]
>>186
あとユーザー辞書でベクターにあったカタカナ語辞書入れてみたらいい感じだな。
Book Offはあるのにbookがないとかはまああるけど。

200 名前:login:Penguin mailto:sage [2010/05/30(日) 00:24:14 ID:ctRryZlG]
mozc-jinmei-20100517ut.txt とオリジナル辞書との重複
3357 / 105793 (約3%)

mozc-meisi-20100516ut.txt とオリジナル辞書との重複
8452 / 96378 (約9%)



201 名前:login:Penguin [2010/05/30(日) 00:34:41 ID:AWGjLpyv]
もずく

202 名前:login:Penguin mailto:sage [2010/05/30(日) 01:00:44 ID:ysTkCy8z]
UTUMIさんの辞書が更新されているね。

203 名前:login:Penguin mailto:sage [2010/05/30(日) 01:50:49 ID:ctRryZlG]
>>202
付属辞書を全部置き換えるとか言われるとちょっと躊躇しちゃうなあ。
付属辞書が今後更新されたときどうすべきか悩む。

204 名前:login:Penguin mailto:sage [2010/05/30(日) 02:06:32 ID:SVG1hTFg]
mozcプロジェクトに辞書をコミットしちゃえばいいような

205 名前:login:Penguin mailto:sage [2010/05/30(日) 07:33:37 ID:nCq3cr+o]
あと、ダウンロード元だと、5/28じゃなくて5/30版になってるけど、それはいいとして
apply-mozcdic-ut.shが

#! /bin/sh

cat mozcdic-ut-*.txt edict-katakanago/mozcdic-ut-*.txt ../data/dictionary/dictionary1.txt > dictionary1.txt.new
cp -f dictionary1.txt.new ../data/dictionary/dictionary1.txt

になってるので、展開した ~/src/mozcdic-ut-20100530からみて、位置が異なるので、
../data/dictionaryの部分を../mozc/src/data/dictionaryのように書き換えてから実行するといいと思う。


206 名前:login:Penguin mailto:sage [2010/05/30(日) 08:20:01 ID:nCq3cr+o]
>>205
ごめん、~/src/mozc/srcに展開すればいいだけの話だね。

207 名前:login:Penguin mailto:sage [2010/05/30(日) 09:27:18 ID:/q37kFvx]
普通に端末からcat実行すれば良いのでは?

208 名前:login:Penguin mailto:sage [2010/05/30(日) 09:35:37 ID:nCq3cr+o]
>>207
コマンド書いてあるだけだから、それもありだね。

209 名前:login:Penguin mailto:sage [2010/05/30(日) 09:38:04 ID:nCq3cr+o]
あいぱっどを変換するとipodが出てくるんだが、どの辞書の間違いだ?

210 名前:login:Penguin mailto:sage [2010/05/30(日) 10:50:29 ID:YvZiFHSE]
dictionary1.txt:あいぱっど 2239 2239 7203 ipod
Googleの辞書っぽい



211 名前:login:Penguin mailto:sage [2010/05/30(日) 17:07:00 ID:72nIDqZ2]
ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う?
最長一致とかの方式だと文節変えないと出ないとかあるけど、
mozcで出ない場合はむしろ基本単語に漏れや頻度データの間違いがあるだけな気がする。

特定熟語が頻出すぎてそれ以外の組み合わせの頻度が低いと、それが辞書から落ちて
変換できなくなってるケースがあるんじゃない?

212 名前:login:Penguin mailto:sage [2010/05/30(日) 17:29:24 ID:uJai2QSu]
やっとmozc入れたけど、辞書登録のバーが出て来ないんだけどなぜだ?
ちなみに、
$ /usr/lib/mozc/mozc_tool --mode=dictionary_tool
とコマンドで打てばあるので、辞書登録はできるっぽいです。
バーを出すにはなんかやる必要があるのでしょうか?

ちなみに、憩いの場さんのとこのリポジトリから9.10のをとりました。



213 名前:login:Penguin mailto:sage [2010/05/30(日) 17:34:15 ID:IJqAauuC]
>>212
「iBusの設定」の言語パネルの表示が表示しないになってるんじゃね

214 名前:login:Penguin mailto:sage [2010/05/30(日) 17:38:32 ID:ctRryZlG]
>>211
> ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う?

もしかしてUTSUMIさんの私家版辞書のこと言ってるなら、もう削ってないよ。

215 名前:login:Penguin mailto:sage [2010/05/30(日) 17:59:01 ID:uJai2QSu]
>>213
iBusの設定のそれは「when active」になってます。

入力時のバーが
[mozc|あ|☆]
しか出てなくて、調べてみると本家は
[mozc|あ|@|☆]
と、@のところに、propertyやらdictionaryがあるみたいなんです。

216 名前:login:Penguin mailto:sage [2010/05/30(日) 18:20:19 ID:nCq3cr+o]
>>215
憩いの場氏の使ってるんだったら、前バージョンのは非公式なツールが悪さしてるんじゃないかな?
鍛えた辞書が勿体ないが、~/.mozcを消してみるといいのかも。


217 名前:login:Penguin mailto:sage [2010/05/30(日) 18:24:09 ID:/q37kFvx]
>>215
自前ビルドしてみると幸せになるかも。

218 名前:login:Penguin mailto:sage [2010/05/30(日) 18:33:14 ID:RB6LrfSr]
最新ビルドの辞書バーのアイコンが重複してるのは既出か…。

219 名前:login:Penguin mailto:sage [2010/05/30(日) 19:12:32 ID:uJai2QSu]
>>216
.mozcを消しでみましたがかわりませんでした。

>>217
ビルドはちょっと…
もう一つのパソがビルドでうまくごちゃごちゃになってしまったので、こっちは憩いの場さんに頼らせていだだいたというわけです。

220 名前:login:Penguin mailto:sage [2010/05/30(日) 22:53:10 ID:XBBIE1D1]
mozcってnew BSDライセンスなのにCopyrightがgoogleになってていいのか?
chromiumはBSDライセンス(3-clause)でubuntu ppaのCopyrightはChromium Authorsになってる。
ようしらんけどppaのはわざわざCopyrightをChromium Authorsにかえてるのかそうでないのか。
あるいはmozcもgoogle以外のコードが入った時点でCopyrightを変えるのか。
ま、わりとどうでもいいけど。



221 名前:login:Penguin mailto:sage [2010/05/31(月) 03:17:09 ID:OxheF7AP]
>>219
バージョンは0.11.365.102となってる?
一度synapticでmozcとなのつくもの全てアンインストールして入れなおしてみたら?


222 名前:login:Penguin mailto:sage [2010/05/31(月) 03:20:02 ID:OxheF7AP]
>>219
sudo apt-get remove mozc-server mozc-utils-gui ibus-mozc
sudo apt-get update
sudo apt-get install mozc-server mozc-utils-gui ibus-mozc

223 名前:login:Penguin mailto:sage [2010/05/31(月) 03:27:36 ID:u2z9heZ1]
PPAにMOZC置いた人って信用出来る?
もう面倒なのでこれでいれちゃうよ?

224 名前:login:Penguin mailto:sage [2010/05/31(月) 07:43:28 ID:XQ2ccCmp]
うちのとこ(9.10)も設定ツールが言語バーに出ないな。
再インストールしても同じ。

225 名前:login:Penguin mailto:sage [2010/05/31(月) 08:54:01 ID:4NQTaTq8]
>>223
信用できないから自分でビルド
憩いの場のSawa氏のリポジトリも、Modified Anthyに変わるということで、
>勝手に変えるなバカヤロー、という人は使わないでください
と言ってるので自分でビルド




226 名前:login:Penguin mailto:sage [2010/05/31(月) 11:17:54 ID:7jMwOMF4]
PPA は 鯖側がビルドするので、鯖がクラックでもされない限り、バイナリパッケージの中身は
担保される。
元ソースと差分も表示されるので、野良ビルドと比べて比較にならないほど安心できる。

227 名前:login:Penguin mailto:sage [2010/05/31(月) 16:14:30 ID:FTkWWhkF]
>>226
PPAも野良と同じだろ
PPAもその辺のユーザが作っていて、他のと変わりないと思うが?
まともにメンテされてないパッケージの多いこと多いこと
GPG署名が入ってれば改変されているか分かるし。
違いはdiffの提供ぐらいか

228 名前:login:Penguin mailto:sage [2010/05/31(月) 16:38:48 ID:wf2jYEJD]
mozc入れてみたけど全然ダメだ
preeditテキストが表示されない
ほんまにテストしてリリースしてんのか?

229 名前:login:Penguin mailto:sage [2010/05/31(月) 17:04:45 ID:HeOjte/K]
>>219
qt4関連入ってんの?

230 名前:login:Penguin mailto:sage [2010/05/31(月) 18:38:45 ID:1o5Z8GAq]
>>228
buildにつかったlibibus-devのバージョンがmozcで使うibusのバージョンより
古いとpre editが表示されなかった
だからdebian sid(ibus 1.3.x)相当の環境でubuntu 10.04(ibus 1.2.x)でbuild
されたパッケージ使おうとするとそういうこと起こるかも

自分でbulidしてだめだったら分からんが



231 名前:login:Penguin mailto:sage [2010/05/31(月) 21:18:42 ID:Ol5eUFST]
UTSUMIさんの辞書が更新された。
で、それと知らず使ってる人が誤解するのを危惧してる。

232 名前:login:Penguin mailto:sage [2010/05/31(月) 21:20:46 ID:Ol5eUFST]
いや違う、辞書は更新されてないか。
SF.netのフィードの配信遅すぎ。

233 名前:login:Penguin mailto:sage [2010/05/31(月) 22:27:56 ID:G2NqXecX]
mozcのプロパティの一般タブで
候補選択ショートカット を A-Lにしても
候補表示窓では1-9になっちゃってるね。
実質A-Lは使えないみたい。

234 名前:login:Penguin mailto:sage [2010/05/31(月) 23:53:43 ID:HhhYtfRc]
219です。
昨日はいろいろと、mozc関連のファイル消したりしましたがダメでした。(もちろん0.11.365.102です)

>>229
qt関連は入っておりません。
mozcの設定に関して重要なのでしょうか?


texが使えないので10.04には当分のあいだ手を出せません…

235 名前:login:Penguin mailto:sage [2010/05/31(月) 23:57:49 ID:4NQTaTq8]
>>234
Sawa氏のやめて自分でビルドして入れろ。

236 名前:login:Penguin mailto:sage [2010/06/01(火) 08:58:36 ID:Khp/NcXq]
>>226
鯖というより、パッケージングしてる人かな?
パッケージングしてる人が複数いるようだけど、ばらばらにやるのではなくチームとしてやってくれるといいんだけど。
それまでは素性のわからんやつのPPAは躊躇する。

237 名前:login:Penguin mailto:sage [2010/06/01(火) 09:22:43 ID:Khp/NcXq]
某はてなのブログにコメントしてる人
ブロガーの義務でもなんでもないのに、UTSUMI氏の辞書入りPPAを紹介して、UTSUMIに迷惑かけなきゃいいけど。

238 名前:login:Penguin mailto:sage [2010/06/01(火) 09:24:13 ID:Khp/NcXq]
>>237
最後の敬称が抜けてた。
UTUMIに迷惑かけなきゃ→UTSUMI氏に迷惑かけなきゃ

239 名前:login:Penguin mailto:sage [2010/06/01(火) 12:43:06 ID:4zExM02R]
>>236
自分でビルドするから楽しいんだろうが。
自分でやれ。

240 名前:login:Penguin mailto:sage [2010/06/01(火) 12:53:30 ID:XI8koRaq]
>>237
そこまで書くなら url書けよ。




241 名前:login:Penguin mailto:sage [2010/06/01(火) 13:34:08 ID:Khp/NcXq]
>>239
だから自分でビルドしてると言ってるじゃん。
>>240
書こうと思ったけど、ブログ主に迷惑掛かると思ったからやめた。
そのくらいggrks

242 名前:login:Penguin mailto:sage [2010/06/01(火) 13:35:45 ID:Khp/NcXq]
ごめん。ID変わってた。
>>235もおれな。

243 名前:login:Penguin mailto:sage [2010/06/01(火) 13:41:31 ID:XI8koRaq]
>>241
だったら、ブログへの愚痴をここに書くなよ。
わけわからん。

244 名前:login:Penguin mailto:sage [2010/06/01(火) 13:55:12 ID:Khp/NcXq]
>>243
一般論として捉えればいいこと。
例えば、Sawa氏が、UTUMI氏の趣旨を理解して辞書を同梱したとして、ホームページにその旨を書いたとしても
それを紹介する第三者が、単にリンクとか手順だけ紹介したら意味はない。
これはたとえ話なので、はてなのブログの話はSawa氏のリポジトリのことではないが、趣旨はそういうこと。

245 名前:login:Penguin mailto:sage [2010/06/01(火) 14:42:35 ID:XI8koRaq]
>>244
? かなり自己中だとおもう。

246 名前:login:Penguin mailto:sage [2010/06/01(火) 16:16:29 ID:0n41Qhbr]
Googleの人自身が追加辞書に否定的だからなあ。

twitter.com/taku910/status/15075896507
通常どんなIMEでもデフォルト状態が一番性能が高いように設計されています。
はてな辞書などをデフォルトで有効にしていいものをしていないのは、
精度が下がるからです。
手元で実験していますが基本デフォルト状態が一番良くて
ユーザ辞書でもなんでも余計な物を突っ込むと精度が落ちます。
6:13 PM May 30th webから

ただ文章表現って多様だから、
とあるケースでの精度がいかに良くても、
ある人にとっては全体としてイマイチだったりすることもある。
「基本デフォルト状態が一番性能が高い」とはちょっと思い上がりかもなあ。
ちょっと前まで県名を変換できなかった完成度だし、
はてな辞書にしても、単純に全部足したら精度は落ちるけど、
選別したうえで必要なものを足せばそれなりに使える。
なによりGoogleの秘密版の辞書って余計なものの盛り合わせじゃね?

辞書は色々あっていいと思う。ハッカーにしてみればうぜーのかもしれないが。
ただ今はバグ出しとか必要なので、デフォルトで使ってみるのも大事。
ディストリ標準で非公式辞書を最初から埋め込むのはまだ早い。
メーリングリストで注意喚起したって見てるやつほとんどいねえしな。
アイコンがないのも現状の完成度を暗示してると思うので、
あえて足すことはない。

あ関係ないけどHideaki ABEさんmozc-configの開発お疲れ様でした。
公式版はQt依存めんどくせえのでちょろっと使わせていただくかもしれません。
ABEさん自身が使ってるのであればフリーズすることもないのでは。
それとGoogleのひとIssues報告放置しすぎ(出張中か?)

247 名前:login:Penguin mailto:sage [2010/06/01(火) 16:23:50 ID:Khp/NcXq]
>>245
は?なにが?

248 名前:login:Penguin mailto:sage [2010/06/01(火) 16:31:12 ID:XI8koRaq]
>>246
辞書の育成はセンスもあるからな。
作者が最適化している辞書だとしても
それより優れたものは現れるかもしれない。チューニングする人しだいだね。
ま、遺伝的アルゴリズムみたいなもんだからね。
良いセンスの人がチューニングした辞書がオープンソースとして公開されたら
たすかるからね。

249 名前:login:Penguin mailto:sage [2010/06/01(火) 16:34:29 ID:Khp/NcXq]
それはそれ
ID:XI8koRaqみたいなアホが知らずにgoogleとは違う辞書を使ってフィードバックするようなことがあれば、迷惑な話。

250 名前:login:Penguin mailto:sage [2010/06/01(火) 17:17:22 ID:X3cZthyj]
>>246
そもそもデフォルト状態って、大規模コーパス版のことだろ。
エンジンの設計が同じならIPADic使ってる時点で性能落ちてるんじゃないか?
そこから追加した微妙な部分が付属辞書にあってそれが肝だってことなら、
どういう方針で調整がなされたのか誰か差分取って調べてくれないかな?

ユーザー辞書は登録時に頻度情報が入れられないので変換精度が落ちるに決まってるじゃん
組み込み追加辞書の場合は頻度情報入ってるから全然違うと思うけど。
しかしその頻度情報の精度というのが母集団、つまりコーパスデータによるから
まんべんなく集めてるグーグルより桁が落ちるかもとか、統計学的にデータまぜるなきけん、
って話なだけでしょ。

結局、GPSのわざと下げられている精度をどうやって向上させるかみたいな話なんだから、
中の人なら否定するに決まってる。




251 名前:login:Penguin mailto:sage [2010/06/01(火) 17:19:24 ID:+xUAPRzh]
GPSの軍用コードはすべてにおいて民間用を超えるわけではないらしいけど
戦時に精度低下があれば補正値知ってると良いかもしれないけど

252 名前:login:Penguin mailto:sage [2010/06/01(火) 17:22:17 ID:6lXEiumK]
午後を入力するのに、「ご」と「ご」を区切るなよ

253 名前:login:Penguin mailto:sage [2010/06/01(火) 17:39:27 ID:XI8koRaq]
>>249
粘着お断りです。ごめんね。

254 名前:login:Penguin mailto:sage [2010/06/01(火) 18:15:44 ID:Khp/NcXq]
ID:XI8koRaq

255 名前:login:Penguin mailto:sage [2010/06/01(火) 18:28:50 ID:0n41Qhbr]
>>246
> そもそもデフォルト状態って、大規模コーパス版のことだろ。

そうなのかな?
Google辞書だったら開発者が意図しようがしまいが、
「はてな辞書」の語彙は収集されて有効になってると思う。
まあ直接聞かないと分からんが

256 名前:login:Penguin mailto:sage [2010/06/01(火) 18:29:31 ID:0n41Qhbr]
>>250 だった

257 名前:login:Penguin mailto:sage [2010/06/01(火) 18:55:15 ID:X3cZthyj]
>>255
追加単語そのものより、漏れが出る事が問題な気がする。
>>252とかもそうでしょ。

258 名前:login:Penguin mailto:sage [2010/06/01(火) 19:24:49 ID:XI8koRaq]
ごご か。 変換してないな。
英英辞典とか そのへんの言葉が漏れてたりもするし、
いまはこまめに辞書を育てるしかないなぁ。とはおもってるよ。
それでもanthyよりは使い易いけど、


259 名前:login:Penguin mailto:sage [2010/06/01(火) 19:40:59 ID:iRw/MYCq]
辞書の問題っていちいちバグトラッカーにあげることになんの?
いちいちめんどくさいよね。

「はりつけて」で「貼り付けて」がでない。

260 名前:login:Penguin mailto:sage [2010/06/01(火) 19:47:12 ID:biQ6ox7/]
そういうのは鍛えりゃいいだけだよな



261 名前:login:Penguin mailto:sage [2010/06/01(火) 19:53:01 ID:iRw/MYCq]
>>260
そんなこと言い出したら何でもそうじゃん。

UTSUMIさんの名詞辞書をもってしても「ポルチオ」がないのはしょうがないかなとは思うが。

262 名前:login:Penguin mailto:sage [2010/06/01(火) 20:01:56 ID:biQ6ox7/]
Anthyのデフォルト状態とかひどいもんだからな

263 名前:login:Penguin mailto:sage [2010/06/01(火) 20:26:01 ID:2EYeyyHj]
ライフサイエンス辞書が登録できるようにしてくれ
あれがないと話にならん

264 名前:login:Penguin mailto:sage [2010/06/02(水) 00:05:59 ID:qoQj5wV4]
誰かフォークするものはおらんのか!
誰か!

265 名前:login:Penguin mailto:sage [2010/06/02(水) 01:29:17 ID:HiSOFHLt]
>>244
そういう話を当のブログにコメントで書いてあげたら?
URL 書けないならそれができるのは君しかいないんだから。

266 名前:login:Penguin mailto:sage [2010/06/02(水) 01:40:28 ID:408ZUOE4]
とりあえずSKKのスモール辞書辺りの単語は網羅されているのか比較してみた人居る?
っていうか>>200のツール教えて欲しいな。

267 名前:200 mailto:sage [2010/06/02(水) 02:05:04 ID:w3pItDF+]
>>266
辞書ファイルの読みと漢字だけを sed で抽出して sort -u したものを、
sort -m して uniq -d して wc -l しただけ。だったはず。
ていうか、細かいこともうすっかり忘れてて愕然としている俺がいる。

268 名前:login:Penguin mailto:sage [2010/06/02(水) 02:33:17 ID:nCOjwefR]
>>263
Google日本語入力、ATOKやことえり辞書のインポートに対応
internet.watch.impress.co.jp/docs/news/20100319_355796.html
Google IME/Mozcのユーザ辞書は同じ形式のはずだから、
Windowsで何とかインポートしてLinuxに持っていけば使えるはず。
LSD(なんつう名前だ)はMS-IMEシステム辞書形式だから、
バイナリエディタでいじらないとインポートできないかもな。

>>266
meisiは0601では重複ないはず。
jinmeiは重複チェックしてないはず。
同じのをModified Anthyでも使ってるから。
の割には重複少ないな。
まあ収録数多いから比率的に小さくなるか。

> SKKのスモール辞書辺りの単語は網羅されているのか比較
くだらねー。
それに単に網羅したって意味ないよ。
要らない単語削って頻度指定して…とやらないとな。
ためしにユーザ辞書として一律にインポートしてみれば。

しかしこんな「要望」によく応えたもんだよ。「当然のこと」とか「絶対対応するべき!」とか。
日本のLinuxユーザのレベルを示したスレ↓。
> Linuxユーザーにこそ必要なものです。
www.google.com/support/forum/p/ime/thread?tid=4d9cb7b1ce293ed1&hl=ja

> Linuxユーザは共同でプロジェクトをより良いモノに完成させたい意識は
> マックやWindowsのユーザよりも高く、
経験的にはWindowsユーザのほうが人数多いぶん反響あるし、
より良くしたいという人も多いんじゃねえかなー

269 名前:login:Penguin mailto:sage [2010/06/02(水) 03:07:20 ID:HDGBUJC9]
>>268
そりゃ単純に母数が大きいだけじゃないか?
Linuxは開発コミュニティへの貢献意識が強いユーザが多いというより
そういう人間しかLinuxを使ってないという側面がある

270 名前:login:Penguin mailto:sage [2010/06/02(水) 03:26:40 ID:fMpvOFIK]
>>269
> そういう人間しかLinuxを使ってないという側面がある
それはないわ



271 名前:login:Penguin mailto:sage [2010/06/02(水) 03:32:32 ID:7kI2YFS9]
>>268
LSDは確かことえり形式の辞書がダウンロードできたはず。
ちなみに名前はあえてそういうのを狙ったんだとさ。

272 名前:login:Penguin mailto:sage [2010/06/02(水) 06:43:02 ID:02i5Uj0J]
>>265
コメントしましたがなにか?
きみに言われる筋合いはない。

273 名前:login:Penguin mailto:sage [2010/06/02(水) 06:46:10 ID:02i5Uj0J]
>>268
で、Google側は辞書の提供はなく、ユーザ側は辞書よこせだったわけだw
もうアホかと。

274 名前:login:Penguin mailto:sage [2010/06/02(水) 07:10:05 ID:5crcoY3W]
>>268
> しかしこんな「要望」によく応えたもんだよ。…

そりゃ 戦略上のことをいうとgoogleって自社osつくるんだし
日本での普及を考えたらimeは無視できないのは当然かと。
web tvがどんなことになるのかわからないけど、こっちでも
重要な役割でしょうしね。
また、脱msのものを普及させようと思ったらこの辺の周辺のことって
無視できないからね。
だから、答えたとしても利益があるんだろうね。

まるでウインドウズユーザーのような連中の声って、その辺を
機敏に感じるにはよいのかもね。

ないものは作れという思想のもとでlinuxを利用しているものから見れば
苦笑いの連中だけど、それだけ昔よりは普及してきているという証でも
あるんだろうね。彼らを蔑んでみるのはわからんでもないけどね。

275 名前:login:Penguin mailto:sage [2010/06/02(水) 10:03:44 ID:HiSOFHLt]
>>272
ならいいけど。
「なにか」とか言われても URL わからないから
コメントしたかどうかおれにはわからなかったよ。

276 名前:login:Penguin mailto:sage [2010/06/02(水) 14:43:48 ID:SuZRONSu]
何の話をしてるかわからなかったが
linux.ikoinoba.net/index.php?UID=1275323887
のことを言っているのか
ここの「またまた帰ってきた某所の匿名」と「ID:Khp/NcXq」は同一人物だろう
「某はてなのブログ」がどこかはわからなかった

277 名前:login:Penguin mailto:sage [2010/06/02(水) 15:02:37 ID:02i5Uj0J]
>>276
某はてなはそこではない。

278 名前:login:Penguin [2010/06/02(水) 15:40:49 ID:SVlKWBuX]
Linux界隈でバイナリ配布禁止をはじめて見た

279 名前:login:Penguin mailto:sage [2010/06/02(水) 15:44:09 ID:HiSOFHLt]
>>278
禁止はしてないでしょ。

280 名前:login:Penguin [2010/06/02(水) 16:32:49 ID:SVlKWBuX]
禁止と言っているようなものだろ
これで配布したら

作者の気持ちを考えないなんてサイテー

と喚く馬鹿が大量発生する



281 名前:login:Penguin mailto:sage [2010/06/02(水) 16:51:06 ID:KEng9W8y]
ていうかnon-freeぐらい珍しくもないだろ

282 名前:login:Penguin mailto:sage [2010/06/02(水) 16:57:43 ID:5crcoY3W]
ライセンスを発行した上でライセンス以外のお願いをするというのは
あまり褒められたものではないとは思うよ。

ありとかなしじゃなくて記述しているかしてないかだけが意味するのにね。
ライセンスってそうゆうもんだって理解してたんだが。

鬼車のrubyマージ騒動みたいになっちゃうよ。

283 名前:login:Penguin mailto:sage [2010/06/02(水) 17:00:56 ID:1sMEC1wh]
他人のライセンスを制約するならともかく
自身の著作物にコメントするのは何も問題ない

284 名前:login:Penguin mailto:sage [2010/06/02(水) 17:04:19 ID:5crcoY3W]
>>283
うん。そこをトラブルしないために、自分の著作物に新たなライセンスを加えて
しまえばいいというのは当然だとおもうよ。加えないのに別のお願いをする場合
そのライセンスと矛盾するならば当然作者に問題があるし、矛盾しないならば
なんのトラブルもならないだろう。

285 名前:login:Penguin mailto:sage [2010/06/02(水) 17:19:02 ID:QoktT3oR]
まあ、よくないわな。しこりが残る

Google曰く「Mozcのバイナリ配布は避けてください」

286 名前:login:Penguin mailto:sage [2010/06/02(水) 17:22:49 ID:02i5Uj0J]
バイナリをわければ済む話。


287 名前:login:Penguin mailto:sage [2010/06/02(水) 17:40:27 ID:nCOjwefR]
>>280
ソースパッケージに突っ込むのは勝手だけど、
有効にするのは各自でビルドオプション付けてねってことでしょ。
「意識的に」各自でやってもらわないと、
Googleにワケの分からないことを報告するバカが大量発生するから。
何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

Googleにしてみればこう。
ユーザ「Mozc最高だぜ」
Google「(うんうん)」
ユーザ「人名xxxxもアレな名詞xxxxも出てくるぜ」
Google「(ん???)」
Google発表「基本的にはデフォルトで使うのが一番精度が高いのであります」

それに非公式辞書追加を知らずして
「Googleさん辞書追加ありがとー!!」とか言われても、
Googleも辞書作者も甲斐がないだろ?

>>278
debianだと2ch辞書を選択制にしたりとか、
gentooだとmplayerとか?のビルドオプション選ばせたりとか。
「各自で意識的に選んでね」というのはよくある方式よ。
文句あるなら選択ダイアログ出せばいいじゃん。
辞書がアドオン形式ならパッケージ名で明確に分割できるけど、
Mozcは全部一体だからしょうがない。

バイナリ禁止自体は昔LAMEで見たような気がする

288 名前:login:Penguin mailto:sage [2010/06/02(水) 17:51:17 ID:02i5Uj0J]
>>287
Anthyよりmozcの方が変換精度が高いとか言ってるやつらはみんなそれだよな。
同じ辞書を追加した状態でのAnthyとmozcは大差ないだろ。

289 名前:login:Penguin mailto:sage [2010/06/02(水) 18:01:18 ID:grruSKdq]
LAMEのバイナリ配布は特許にひっかかる恐れがあるからではなかったかと。
今回の問題とは若干違うような。

>「意識的に」各自でやってもらわないと、
>Googleにワケの分からないことを報告するバカが大量発生するから。
>何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

これはほぼ同意。

290 名前:login:Penguin mailto:sage [2010/06/02(水) 18:02:11 ID:nCOjwefR]
まあどうしてもバイナリ配布したくて(各自でビルドすりゃいいことだと思うけど)、
非公式版であることをハッキリさせたいのであれば、
デフォルトのバイナリパッケージ+差分パッチぐらいか?
パッチで非公式バイナリを意識的に「再現」させるという形。

しかし自分好みにしたいんだったら自分でビルドくらいは当たり前じゃねえの?
それに辞書作者の意向つうかMozcプロジェクトの現状レベル考えたら、
今はデフォルト状態でテストしたほうがいい。
原作者が「余計な辞書入れたら精度下がる」つってんだしさ



291 名前:login:Penguin mailto:sage [2010/06/02(水) 18:50:57 ID:9TUUxqr0]
バイナリ配布が基本的に禁止というと思い出すのがかつてのqmail。

292 名前:login:Penguin [2010/06/02(水) 19:06:18 ID:/GEmtGf2]
>>289-290
辞書作者もそう思ってるだろうが、
それならなんでバイナリ配布OKのライセンスで配布するのか分からない

293 名前:login:Penguin mailto:sage [2010/06/02(水) 19:26:14 ID:O5aiTgdT]
ぶっちゃけリポジトリを公開したら、webの注意書きなんて読むような
聞き分けのいい人じゃなくてタコ以外使うわけないだろ。
特にubuntuなんでデフォルトで対応しているのに、作っておきながら
組み込んでますなんて意味不明だ。
しかも、バグ報告は送るなといってるけど、じゃあ誰に送るんだ?
お前が引き受けろよ、そうでなければ公開すべきじゃない。

294 名前:login:Penguin mailto:sage [2010/06/02(水) 19:29:49 ID:1sMEC1wh]
>>292
もとはModifiedAnthy向けに公開されていた辞書だから
Mozc用に改めてライセンスをいじっても仕方ない

295 名前:login:Penguin mailto:sage [2010/06/02(水) 19:37:51 ID:CGmWTyeQ]
>>293
誰に言っているのか知らないが、俺のubuntuで
apt-get install ibus-mozc
とやってもインストールできない。本当にデフォルトで対応してるの?

296 名前:login:Penguin mailto:sage [2010/06/02(水) 19:44:23 ID:x5YErinu]
>>293
日本語が不自由な人のような

297 名前:login:Penguin mailto:sage [2010/06/02(水) 20:00:24 ID:OEd5PW/N]
>>293
すまん、意味不明すぎて何をいってるのかさっぱりわからん。

298 名前:login:Penguin mailto:sage [2010/06/02(水) 20:00:48 ID:9DErp56Y]
>>295
Currently, we only support Ubuntu 9.10 and 10.04 for building Mozc.
code.google.com/p/mozc/wiki/LinuxBuildInstructions

299 名前:login:Penguin mailto:sage [2010/06/02(水) 20:02:49 ID:t70gHhyq]
>>295
リポジトリは加えなくてはダメ
加えても性能のいいModifiedAnthyは使うなといわれた
初心者にはibus-mozicの魅力が薄れた

いまここ

300 名前:login:Penguin mailto:sage [2010/06/02(水) 20:04:18 ID:L1cbISCc]
anthyがいいとか言ってる池沼レベルの人間がまだいるんだな



301 名前:login:Penguin mailto:sage [2010/06/02(水) 20:07:31 ID:w3pItDF+]
>>288 とかもね。

302 名前:login:Penguin mailto:sage [2010/06/02(水) 20:08:54 ID:fe2DcE2M]
人それぞれさ、お気に入りのを使えば良いだけ

303 名前:login:Penguin mailto:sage [2010/06/02(水) 20:17:47 ID:RpWCZxYd]
Google -IMEって変換エンジンはVJEの流用だったっけ?

304 名前:login:Penguin mailto:sage [2010/06/02(水) 20:41:06 ID:HiSOFHLt]
>>303
そんな話どこで読んだの?

305 名前:login:Penguin mailto:sage [2010/06/02(水) 20:48:51 ID:408ZUOE4]
>>267
ども、UNIX的手法だったんですね。全然身についてないなあこういう即席データ処理。

>>268
>> SKKのスモール辞書辺りの単語は網羅されているのか比較
>くだらねー。
>それに単に網羅したって意味ないよ。
>要らない単語削って頻度指定して…とやらないとな。
>ためしにユーザ辞書として一律にインポートしてみれば。

なにが言いたいのかさっぱりです。
デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
その場合の追加辞書という意味では、まあ確かに意味が無いですが、
判断の為の辞書内容の分析が下らないというのは意味不明です。

抜けている単語を抽出して、それが本当に変換出来ないのか確認してみるのは、
やみくもに探したり、ひたすらバグ報告を待つより早いのでは?


306 名前:login:Penguin mailto:sage [2010/06/02(水) 21:22:35 ID:408ZUOE4]
>>287
そもそも、純正版と改造版を共存できるようにしたほうがわかり易いんじゃないですかね?
ビルドしない人にとっては意識できないままで、単純に退化したとしか思わないでしょうし。

307 名前:login:Penguin mailto:sage [2010/06/02(水) 21:31:19 ID:RpWCZxYd]
>>304
あー、ごめん、VJE使ってるのはYahoo!の方だったわ。

308 名前:login:Penguin mailto:sage [2010/06/02(水) 21:35:29 ID:408ZUOE4]
Google SONY連合ということで、mozcにsj3を合体させたらなにができるんだろうか?

309 名前:login:Penguin mailto:sage [2010/06/02(水) 21:58:00 ID:nCOjwefR]
>>305
だからさ、やってみりゃいいじゃん。
S辞書とMozcデフォルト辞書の差分だろ?

SKK辞書は動詞の形式が特殊だから、
単純に比較できるのは名詞系だけかもな。

> デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
網羅してるかどうか分からんのでしょ?
試しにやってみて動作を確認すればと言ったわけよ。
Mozcのユーザ辞書のシステム辞書に対する優先度は知らないんだけど、
「漏れてる」と判断された短い単語がたくさんあれば、
おかしな変換結果が大量に発生して、
単純差分じゃ意味がないことがすぐに分かると思ったから。
実際どうなるかは俺も知らん。

Mozcのデフォルト辞書は長年編集されてきて収録数も膨大なIPAdicでしょ?
> SKKのスモール辞書辺りの単語は網羅されているのか比較
こんな発想おれにはないよ。「スモール」辞書と比較?
バカだなあ、と思いつつも、
>>305が意外な発見をして本家に有益な貢献をするのかもなあ

310 名前:login:Penguin mailto:sage [2010/06/02(水) 22:35:24 ID:nCOjwefR]
>>305
とりあえずやってみた。
雑にやったものだからソースとかは出さねえよ。
確認したのは「存在しない表記」だけな。読みは無視。

SKK-Sには重複除いて4581の表記がある。
このうち単漢字・アルファベット・記号以外で
Mozcデフォルト辞書に入っていないのは次の通り。

仮名漢字変換
全角仮名
半角仮名
半角片仮名
日帰
最寄
相変
見掛
見落
記事選択

以上。
単漢字は自分で探してくれ。
記事選択とかは分けて変換できると思うので、
全部網羅されてると言っていい。

じゃあな



311 名前:login:Penguin mailto:sage [2010/06/02(水) 22:41:13 ID:408ZUOE4]
>>309
詳しいやり方がわかりませんので、簡単にできるなら是非どうぞ。

とりあえず茶筅やメカブの辞書をgrepして眺めているだけですが、
IPAdicはあくまで形態素のコーパスで、熟語は音声処理用かなんかの逆変換で使いにくい
短い単語とかは結構足りないんじゃないかって気がします。
例えば宮城県で探しても大学の名前しかでてこなくて県名単体すら入ってない。
Mozcの辞書も傾向は似ていますが、unicodeな単語とかも入ってて
多少改善してる感じは気のせいでしょうか?

312 名前:login:Penguin mailto:sage [2010/06/02(水) 23:00:23 ID:408ZUOE4]
っと入れ違いでした
>>310
どうもです。とりあえず予想通りって事ですよね。
単漢字の漏れというのはどうなんですかね?
まあ扱いは難しそうですが。

313 名前:login:Penguin mailto:sage [2010/06/03(木) 00:50:31 ID:0C19uf7w]
>>311
なにがしたいのか意味が分からないのだけど
「宮城」「県」が入っていれば
「宮城県」は変換できる。
というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
ディスクの無駄だし。
短い単位で解析できるように、というのが UniDic。
自分でクロールしてきたデータに UniDic の MeCab をかけてコーパス作ればいいんじゃないかな

314 名前:login:Penguin mailto:sage [2010/06/03(木) 00:59:29 ID:wmng9tJY]
>というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
そもそも大規模コーパスというのはそういう方針とは思えませんが?

パーツの頻度を掛け算した予測頻度を実際の頻度が上回るのであれば登録するべきでしょう。

315 名前:login:Penguin mailto:sage [2010/06/03(木) 09:15:19 ID:1uwN98gG]
>>300-301
私家版辞書追加して、さすがGoogleって言ってる馬鹿約2名発見しますた。


316 名前:login:Penguin mailto:sage [2010/06/03(木) 09:29:34 ID:1uwN98gG]
確かに午後と打ちたければ、午と打って後と打てばいいよなwww
それとも午後の紅茶と打って、の紅茶を削るか?w
もうアホかと。

317 名前:login:Penguin mailto:sage [2010/06/03(木) 10:29:33 ID:cLHYQIlM]
>>42
つきはWakame(ワカメ)だな

318 名前:login:Penguin mailto:sage [2010/06/03(木) 11:03:56 ID:yHIg/azl]
いやcombだろ

319 名前:login:Penguin mailto:sage [2010/06/03(木) 11:43:56 ID:8rrDcIso]
libiconvェ…

320 名前:login:Penguin mailto:sage [2010/06/03(木) 12:20:21 ID:r9B8lAgG]
uim-mozcのビルド方法おしえてくだい



321 名前:login:Penguin mailto:sage [2010/06/03(木) 12:38:19 ID:dyOLzhIN]
# make; make; make clean


322 名前:login:Penguin mailto:sage [2010/06/03(木) 13:37:11 ID:u1itOj+L]
>>320
code.google.com/p/macuim/source/browse/trunk/Mozc/build

323 名前:login:Penguin mailto:sage [2010/06/03(木) 14:11:44 ID:zicLG5/c]
mozcは低能糞ソフトでまともに使えないから、中の辞書だけが欲しいんだよね。

mozcの辞書はどこに置いてあって
どうやってplaintextに変換できるわけ?


324 名前:login:Penguin mailto:sage [2010/06/03(木) 15:01:06 ID:bG0s/qhN]
糞で低能な奴に「低能糞ソフト」呼ばわりされるmozcとその開発陣は不憫だな。

325 名前:login:Penguin mailto:sage [2010/06/03(木) 15:07:37 ID:0C19uf7w]
>>314
そうか? 「宮城県」は「宮城」と「県」であって、
「宮城(固有名詞)」の左に来る品詞と「県(接尾辞)」の右に来る品詞は違うのに、
登録してしまうと区別できなくなってしまう。
連接コストまで考えると単語の頻度だけで簡単に決まるものではないので、
なんでもかんでも登録するとむしろ精度悪化することもあるんじゃないかなあ。
(くっつけても品詞が変わらないものはくっつけたものを登録してもいいと思うが)

326 名前:login:Penguin mailto:sage [2010/06/03(木) 16:11:34 ID:uFbeO/du]
結局、AnthyとMozcってどこが違うの?
Ubuntuで使ってるけど、はじめからあるAnthyよりはMozcの方がよさげだけど

327 名前:login:Penguin mailto:sage [2010/06/03(木) 16:30:35 ID:AE+ltDI6]
>>326
anthyは開発停止してたんじゃなかったっけ?
mozcは開発公開が始まったばかり。

かなり初期の段階だから、開発協力者だけにしたい状態じゃないかな。
だから、辞書のバイナリうんぬんの話もでる。
stableちかくまで普通は待ったほうがいいだろうね。それでもanthyよりmozcの
ほうがいいように思う。

328 名前:login:Penguin mailto:sage [2010/06/03(木) 16:50:09 ID:8XZFMkrD]
>>327
> anthyは開発停止してたんじゃなかったっけ?
再開したよ。
sourceforge.jp/projects/anthy/lists/archive/dev/2010-May/003705.html

329 名前:login:Penguin mailto:sage [2010/06/03(木) 17:30:21 ID:xiIjB+In]
>>326
anthyは親指シフトに対応している

330 名前:login:Penguin mailto:sage [2010/06/03(木) 18:24:16 ID:u1itOj+L]
辞書が同じなら云々言ってる人たちは文節ごとに変換してる人たちでしょ。
文章で変換すれば違いは一目瞭然。



331 名前:login:Penguin mailto:sage [2010/06/03(木) 18:26:44 ID:wmng9tJY]
>>355
県の後ろにつながるの品詞と、宮城県の後ろにつながる品詞は大差ない。
つまり語頭と語尾の文脈IDを継承すれば済む話。

332 名前:login:Penguin mailto:sage [2010/06/03(木) 18:28:03 ID:wmng9tJY]
>>325 失礼

333 名前:login:Penguin mailto:sage [2010/06/03(木) 19:31:44 ID:HrnMknGo]
>>330
筋がいいのはMozcだけど、
IPAdicのせいか文章を細かく区切りすぎるような感じはしてる。
「ご|ご」とか「する|シ」みたいな感じで。
ある程度の長さを入力すれば改善するけど、
やっぱりちょっと細かい感じはするな。
語尾とか複合語の切り方がおかしくなるときがある。

Anthyだとdepgraphだったか語のつながりをある程度まとめてくれるので、
「細かい」って感じはしない。
複合語もcompound.tか何かに大量登録されてるしな。

IPAdicは文章を単語に分割するツールでも使われてるんだっけ。
短い単語に比重がかかりすぎな感じがちょっとする。
複合語を大量追加+短い単語の優先度をちょっと下げる、
くらいの調整はいるかもね。

ちょっと使った感想なんで勘違いかもしれん

334 名前:login:Penguin mailto:sage [2010/06/03(木) 19:59:43 ID:AE+ltDI6]
>>333

そうだなぁ。検索するときには文章をキーワードにすることはないから、
検索屋さんが作ってるだけに、切り替えみたいなのは欲しいかも。
ibusのプラグインでSKK一発切り替えがあればなぁ。と変態的に思ってる。

mozcの一番良い使い方はおおよそ感じ取れるようになったけど、
やっぱり文節ごとに変換させるのはあまり良くなさそうだな。

335 名前:login:Penguin mailto:sage [2010/06/03(木) 20:00:21 ID:eXkP2joF]
anthyを頻りに擁護するバカがいついてる模様

336 名前:login:Penguin mailto:sage [2010/06/03(木) 20:56:17 ID:0C19uf7w]
>>331
あなた中国出身? (煽りじゃなくてね)
後ろにつながる品詞は同じだが、
県の前に接続する品詞と、宮城の前に接続する品詞が違うという話。
「宮城県に出張に行った」は言うけど「県に出張に行った」は言わないでしょ?
あと、確かに左文脈と右文脈は別々に定義できるようになっているけど、
実際の辞書は左文脈ID=右文脈IDなので、やっぱり区別できないと思うよ。

337 名前:login:Penguin mailto:sage [2010/06/03(木) 21:44:04 ID:PxaC1S8F]
uze-

338 名前:login:Penguin mailto:sage [2010/06/03(木) 21:52:20 ID:pPPT4Ls/]
一般名詞と接尾の「県」は別個に登録されているから区別できるんじゃないのか?

339 名前:login:Penguin mailto:sage [2010/06/03(木) 22:26:56 ID:wmng9tJY]
>>336
宮城県に
県に
言うでしょ。

340 名前:login:Penguin mailto:sage [2010/06/03(木) 23:00:05 ID:wmng9tJY]
駅名なんかをみると、左文脈IDと右文脈IDが異なっている複合語を見かけるけど、幻覚なんだろうか?
それとも、変換エンジンが無視しているって話?



341 名前:login:Penguin mailto:sage [2010/06/04(金) 01:57:57 ID:ZO43vMX/]
コンパイル中暇だからソース漁ってたら…
これは酷い
mozc.googlecode.com/svn/trunk/src/data/dictionary/suggestion_filter.txt

342 名前:login:Penguin mailto:sage [2010/06/04(金) 02:06:05 ID:kzCJPyMQ]
いまさら。

343 名前:login:Penguin mailto:sage [2010/06/04(金) 02:14:04 ID:ZO43vMX/]
あれ?
mozcってLinuxだけだよね?
Windows用のプログラムも混じってない?


344 名前:login:Penguin mailto:sage [2010/06/04(金) 04:21:19 ID:4TzFfVhZ]
いまさら。

345 名前:login:Penguin mailto:sage [2010/06/04(金) 06:17:40 ID:mBX7YmR0]
私家版辞書を追加したmozcを変換効率だなどと頻りに擁護するバカがいついてる模様

346 名前:login:Penguin mailto:sage [2010/06/04(金) 10:04:52 ID:NpMgVDdo]
PCが無いと「頻りに」なんて漢字出てこないバカどもの議論ってこと?

347 名前:login:Penguin mailto:sage [2010/06/04(金) 11:01:45 ID:sE1oayZo]
345はただの基地外なので放置推奨

348 名前:login:Penguin mailto:sage [2010/06/04(金) 13:00:07 ID:mBX7YmR0]
>>335 >>347
>>345

349 名前:login:Penguin mailto:sage [2010/06/04(金) 17:15:10 ID:YpJdVChb]
mozc/ipc/unix_ipc.ccだとローカルソケット(socket AF_UNIX)使っていて、
mozc/ipc/win32_ipc.ccだと名前付きパイプ(CreateNamedPipe)使っているけど、
ローカルソケット(socket AF_UNIX)をwindowsでそのまま使わなかった理由はなんなのだろう。

350 名前:login:Penguin mailto:sage [2010/06/04(金) 19:08:43 ID:YpJdVChb]
自己解決した。たぶん理由は2つ
1.IPスタック
 WindowsのAF_UNIXソケットはIPスタックを回避できない
2.セキュリティ上の問題
WindowsのgetsocketoptはSO_PEERCREDが使えないため、
 アクセス元の情報を取得出来ない

これを避けるには名前付きパイプを使えばいいのか...な...たぶん



351 名前:login:Penguin mailto:sage [2010/06/04(金) 19:38:47 ID:2qDpkCoq]
もずく酢

352 名前:login:Penguin mailto:sage [2010/06/04(金) 19:46:47 ID:ov5hWS+Q]
iBus立ち上がらねぇぇぇええええ
藻屑はインストール出来て設定まで出来ているのに・・・・・    @SUSE

353 名前:login:Penguin mailto:sage [2010/06/04(金) 20:06:23 ID:QQcLRn+n]
そういえば、モズクの辞書を逆にメカブで使ったら性能どうなるんだろ?

354 名前:login:Penguin mailto:sage [2010/06/04(金) 22:07:20 ID:kzCJPyMQ]
mozc の辞書ってそんなにいいの?

355 名前:login:Penguin mailto:sage [2010/06/05(土) 02:12:01 ID:lBoLIUKF]
>>352 ん?iBus何か難しいことあったっけ?シェルからibus-daemonでどんなエラー出てる?

356 名前:login:Penguin mailto:sage [2010/06/05(土) 06:19:24 ID:D5PsWP6U]
>>354
mozcの辞書がいいのではなく、UTUMIさんの辞書がいいだけ。
それを勘違いしてGoogleってスゲーって言ってるバカが、変換効率がいいとかいってるだけの話。

357 名前:login:Penguin mailto:sage [2010/06/05(土) 06:49:54 ID:xabQhbJd]
たしかにUTUMIさんの辞書はいい
mozc使う人は素のmozcの能力を見極めて
改良に努めるべき。

358 名前:login:Penguin mailto:age [2010/06/05(土) 08:30:41 ID:g/NHqkpU]
>>356
しつこいなanthy君w

359 名前:login:Penguin mailto:sage [2010/06/05(土) 09:10:15 ID:r9Lhvdmg]
Mozcのデフォルト辞書はあんまり人の目でチェックされてない感じがする。
「べっさつ」と入力して方向キーの↓を押し続けると、
別冊すてき
別冊家庭画
別冊花

別冊すてきな奥さん、家庭画報、花とゆめ、が途中で切れたのかな。

べびーざら 2239 2318 6181 ベビーザら
「ベビーザらス」だな。

未知語の自動収集精度が良くないのかもなあ。
いや全体的にはそこそこの精度なのかもしれないが、
ノーチェックで収録してしまう感覚がまずいのかも。

わかりやすいのは「ん」ではじまるやつ。
ンコ気持、ンコさん、ンコたち、ンコちゃん、ンバーワン、ンピングカー、
ンブラー、ンプ場...
全くチェックしてないんだろうなあ。
きちんとしたIPAdic+雑な自動収集語という感じ。

頻度設定も怪しいところが。
「ふくらはぎ」と入力すると「フクラハギ」が第一候補。
よく使われるのは平仮名表記のはず。

何度か話でてると思うけど、短い文節だと極端に精度下がるのも気になる。
(入力終えて部分修正するときに、目的の表現がなかなか出てこないことがある)
「云い始めた」が第一候補になったり。
「そんな事を言い始めた」だと「言い始めた」になるんだが。

360 名前:login:Penguin mailto:sage [2010/06/05(土) 09:19:22 ID:fhMYXk7C]
人力でどうこうやるのはGoogleの文化じゃないんだろう。




361 名前:login:Penguin mailto:sage [2010/06/05(土) 09:29:33 ID:r9Lhvdmg]
なんじゃこりゃ系の登録

わーほりいぎりす 2239 2239 8157 ワーホリイギリス
ーとくん 2239 2319 6228 ートくん
ーままさん 2239 2319 7097 ーママさん
ヾの 2239 2239 8280 ヾノ
ぇんと 2239 243 7023 ヴェンと
いきちやん 2303 2303 8986 益暢
けんてんのう 2303 2239 7136 謙天皇
(孝謙天皇?)
このごろろ 2290 2239 7931 このごろろ
こんじょうてんのう 2239 2239 7590 今上天皇
(きんじょう)
こんすか 2979 2239 7552 今スカ
こんすたじお 2979 2239 7788 今スタジオ
こんすたっふ 2979 2239 7540 今スタッフ
こんすとれす 2979 2239 7788 今ストレス
こんすぽーつ 2979 2239 7626 今スポーツ
こんすーぱー 2979 2239 7227 今スーパー
こんせいかつ 2979 2234 7293 今生活
こんせいふ 2979 2239 7841 今政府
こんせいり 2979 2234 7849 今整理
こんせいり 2979 2239 7392 今生理
こんせけん 2979 2239 6929 今世間
こんせっけい 2979 2234 7924 今設計
こんせっと 2979 2239 7746 今セット
こんせつめい 2979 2234 7180 今説明
こんせぶん 2979 2301 6735 今セブン

適切な表現も混じってるかもしれないが、収録するほどでもないだろと

362 名前:login:Penguin mailto:sage [2010/06/05(土) 09:38:44 ID:r9Lhvdmg]
>>360
まあなあ。

Google IMEの辞書ぐらい質を量で押し切ればいいんだろうけど、
現状だと中途半端な感じ

363 名前:login:Penguin mailto:sage [2010/06/05(土) 10:12:08 ID:D5PsWP6U]
>>358
しつこいな変換精度くんw
辞書以外のところでmozcがどう変換精度が優れてるのか説明してみろ

364 名前:login:Penguin mailto:sage [2010/06/05(土) 10:38:19 ID:FvoE5wGr]
anthyがバカってことを認められないバカが一匹いるなw

365 名前:login:Penguin mailto:sage [2010/06/05(土) 10:43:36 ID:GieRvdIi]
変な日本語w

366 名前:login:Penguin mailto:sage [2010/06/05(土) 11:44:27 ID:r9Lhvdmg]
こんな記法もあるのか?
{こうたろう/ひろたろう} 2303 2303 5867 廣太郎

あとゴミっぽい収録語の続き
ヶせっと 2239 2239 8037 ヶセット
ヶらヶら 2239 2239 7784 ヶラヶラ
ぁでふぉるまにあこれくしょん 2239 2239 8118 ぁでふぉるまにあこれくしょん
んたーねっと 2239 2239 8085 ンターネット
んでぃーず 2239 2239 8230 ンディーズ
んぷさいと 2239 2239 8410 ンプサイト
んぷふぁいやー 2239 2239 8385 ンプファイヤー
んらんど 2310 2310 5391 ンランド

中黒付きの未知語は取れない?
ばらくおばま 2239 2239 7916 バラクオバマ
バラク・オバマ無し

変わった読みかたのチェックが甘い?
ばり 2239 2239 6859 尿

どこかで出てたご変換(「誤変換」が出ないし「誤」もなかなか出ない)
あいぱっど iPod

「がい 買い」も出にくい。「臥位」よりも後。
「あと 後」の優先度も低いなあ。
「よりも|あと」だと7番目。
「あと」単体でも「跡」より下になる。

367 名前:login:Penguin mailto:sage [2010/06/05(土) 12:26:17 ID:R3XOmDMP]
>>366
イって打ったあと、ンターネットって打ったりする人のために・・

368 名前:login:Penguin mailto:sage [2010/06/05(土) 12:44:57 ID:D5PsWP6U]
>>364
結局変換精度の説明は出来ないってことですね?w

369 名前:login:Penguin mailto:sage [2010/06/05(土) 13:27:13 ID:r9Lhvdmg]
単漢字で出にくいもの。

「ち 日」出るのが早すぎ。そもそも必要?
「こ 子」なかなか出ない。
「だん 男」なかなか出ない。
「くん 組ん」出るのが早すぎ。「君」「くん」を優先。
「じん 腎」出るのが早すぎ。「人」を優先。
「かみ 上」最優先にするものではないと思う。「紙」「神」を優先。
「せい 生」全然出てこない。かなり下にある。
「とう 頭/冬/島など」なかなか出てこない。
「かい 回」なかなか出ない。
「きょう 強」なかなか出ない。
「じ 時」なかなか出ない。
「さる 申」「猿」を優先。

「そよぐ」普通に変換すると「そよぐ」になるが、
「戦ぐ」が第一にサジェストされるのはなぜ?
こういうケース結構ある。

「たんさん 単三」候補がない。

370 名前:login:Penguin mailto:sage [2010/06/05(土) 14:58:33 ID:7VLh6t0e]
>>368
そんなこと言ってると、mozcの変換精度が他と比べてたいしたことないってこと
説明してよと言いたくなるじゃないか。



371 名前:login:Penguin mailto:sage [2010/06/05(土) 15:17:11 ID:R3XOmDMP]
まあ何はともあれAnthy以外に選択肢ができたのはいいことだ。

372 名前:login:Penguin mailto:sage [2010/06/05(土) 16:19:04 ID:SieYDk6Z]
? ATOKがあるじゃん。

373 名前:login:Penguin mailto:sage [2010/06/05(土) 16:32:36 ID:ZADDM2Q0]
>>367
ゴミとか言ってる奴は変換辞書を国語辞典かなにかと勘違いしてるんじゃないの?

基本的には自動収集で大は小を兼ねるって思想だよな、元々の辞書に比べて足りない方が問題。
ケチくさい奴は他の変換使ってればいいよ。

検索屋の発想だから、悪影響のあるゴミはルールで排除って感じでしょ?
結局そこんとこがグーグルの肝なのでフリーになってない訳で。

374 名前:login:Penguin mailto:sage [2010/06/05(土) 17:21:43 ID:rTZo1uGy]
ヶセットは〜個セット、ヶラヶラは笑い声の擬音かな
「こせっと」「けらけら」の読みで変換できるといいね

ところで、「か」「が」「こ」で「ヶ」が出ない

375 名前:login:Penguin mailto:sage [2010/06/05(土) 17:44:16 ID:D5PsWP6U]
>>370
変換精度云々言い出したのは、Googleとmozcをマンセーしてるやつの方。
一般的には選択肢が増えた程度の認識しかない。

376 名前:login:Penguin mailto:sage [2010/06/05(土) 18:00:55 ID:r9Lhvdmg]
>>373
>>362 >>359

>>374
> ヶセットは〜個セット
そうだな。
しかし「けせっと」だと「毛セット」、
「こせっと」だと「小セット」になって、
「ヶセット」が出ない。
sannxkesetto、とかじゃないと出ないな。

Google IMEの辞書から秘密情報を取り除いて、
低頻度の表現をバッサリ削ったもののほうが、
精度としては良くなる気がする。

377 名前:login:Penguin mailto:sage [2010/06/05(土) 18:13:22 ID:r9Lhvdmg]
Mozcで困るのは、先々の方針がよくわからないことだなあ。
これだけ早く設定ツール出すんだったら、
mozc-configの人もCUIまででやめてたんじゃないかな。
(止めてたんじゃないかな、が出ない。)
辞書をチェックするにしてもツール作るにしても
ムダデマ(無駄手間、が出ない)になる恐れがある。
あとで嫌な思いしないように(ように、の順位低い)、
眺める程度のことしかできない。

変換確認にしたって辞書がゴソッと変わったらイチからやり直しだもんな。

378 名前:login:Penguin mailto:sage [2010/06/05(土) 18:31:21 ID:ZADDM2Q0]
>>376
取り除いたら出なくなって駄目駄目だろ。
品詞別にフィルタでも掛けてたんじゃないの?

379 名前:login:Penguin mailto:sage [2010/06/05(土) 18:42:40 ID:ZADDM2Q0]
mozcの作りは聞いた限りでは意外と教科書通りというか、オーソドックスな印象を受ける。
むしろ、最新研究てんこ盛りの筈のanthyの結果が振るわないのがおかしいんだよ。
辞書に関してはmozcに流用しただけで評価されているのだから問題は無さそうなのに。

380 名前:login:Penguin mailto:sage [2010/06/05(土) 19:12:30 ID:ZADDM2Q0]
>>377
選択肢を増やすことを、無駄手間と考えてしまうエコノミックアニマルこそ開発にとって問題なのかもしれない。
例えばGCCがあったからこそ他の開発ツールが対抗して無償化したりした訳で、それと同じだと考えればいい。
大体そんなこと言ってたら、gtkだのqtとかこそ無駄手間でバカバカしい。



381 名前:login:Penguin mailto:sage [2010/06/05(土) 19:58:50 ID:r9Lhvdmg]
時々語尾がおかしいな。
そんなやつが痛な (いたな)
冷静な自分が板 (いた)

やっぱ人名弱いな。
損|正義

やっぱ中黒なしだけか。
ジョニーデップ

現時点での感想。
・ある程度の長さを入力した時の第一表記は筋がいい。
・しかしよくある第二表記を選ぼうとするとなかなか見つからないことがある。
・短い読み入力だと精度がぐっと落ちる。
・特に単漢字に関しては頻出語がなかなか出てこなかったり、
頻出語に変な読みを当てたものが上位に来たり。
(人がチェックしていないのでしかたない)

ちょっとずつ変換する人や、
推敲して部分修正を繰り返す人は、
変換精度のギャップに戸惑うかも。

テストはぜんぶ素もずくでやった。
他の人もテストしてくれるとありがたいな

382 名前:login:Penguin mailto:sage [2010/06/05(土) 20:24:21 ID:ZADDM2Q0]
>>381
実証は大切だけど、そもそも辞書眺めてれば気がつくよ。
ipadic辞書を人がチェックしてないということは有り得なくて、
元々変換とは逆の目的の、漢字を読み下したり解析するための辞書だったからってだけでしょ。

追加分も手動だとかどっかに書いてなかったっけ?
まあフィルタが封印されている以上、吟味するしかないんだろうけど。

383 名前:login:Penguin mailto:sage [2010/06/05(土) 22:54:03 ID:9mDSEu8Q]
>>381
そうやっていちいちダメ変換を調べること自体は悪くないんだけど、
やっぱりある程度のカバレッジを持ったテストデータを作って自動で評価できるようにしないとダメだと思うよ

細かい問題を直したら他のところがおかしくなるなんてざらにあるだろうし、
何でもほいほい辞書に足せば精度が上がるというものでもなかろう

384 名前:login:Penguin mailto:sage [2010/06/05(土) 23:31:30 ID:EmRTT+mM]
>>372
ibusで使えたっけ

385 名前:login:Penguin mailto:sage [2010/06/06(日) 00:45:41 ID:OSNssyVe]
ibus-mozcだよ。

386 名前:login:Penguin mailto:sage [2010/06/06(日) 02:57:14 ID:7kplvdM/]
「云いました」「そんなふうに言いました」みたいに
「いいました」がずれるのは、品詞が細かすぎるからかもなあ。

いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

1258 動詞,自立,*,*,五段・ワ行促音便,連用形,*
1259 動詞,自立,*,*,五段・ワ行促音便,連用形,いう
1260 動詞,自立,*,*,五段・ワ行促音便,連用形,いく
1261 動詞,自立,*,*,五段・ワ行促音便,連用形,おこなう
1262 動詞,自立,*,*,五段・ワ行促音便,連用形,おもう
1263 動詞,自立,*,*,五段・ワ行促音便,連用形,使う
1264 動詞,自立,*,*,五段・ワ行促音便,連用形,思う
1265 動詞,自立,*,*,五段・ワ行促音便,連用形,行う
1266 動詞,自立,*,*,五段・ワ行促音便,連用形,行く
1267 動詞,自立,*,*,五段・ワ行促音便,連用形,行なう
1268 動詞,自立,*,*,五段・ワ行促音便,連用形,言う
1269 動詞,自立,*,*,五段・ワ行促音便,連用形,買う
1270 動詞,自立,*,*,五段・ワ行促音便,連用形,違う

「いい/言い」を1258にしたら常に前に出るんだろうな、
少なくとも頻度的には。

前に言葉がないとき1259/1268が弱すぎるのかなあ

387 名前:login:Penguin mailto:sage [2010/06/06(日) 07:05:02 ID:icwZ8Ez7]
いいま 2239 2291 6486 言いま
じゃないの?

388 名前:login:Penguin mailto:sage [2010/06/06(日) 08:18:04 ID:zbnKys/K]
mozc-server+dict入れられないんだけど

389 名前:login:Penguin mailto:sage [2010/06/06(日) 18:53:11 ID:7kplvdM/]
>>387
そうかもと思ったが、違うかもねー。
品詞 2239/2291 言いま の頻度を上げたところで、
品詞 1258/1258 云い にはあまり影響しないんじゃないかな。

単純に同品詞の 1258/1258 言い を作るほうが確実に潰せる。
「他に影響あるかも」と不安になるのであれば、
0 みたいな極端な頻度じゃなく (元の頻度 + 2000) 言い ぐらいにしておけばいい。

何にしても品詞体系をもうちょっと簡素化するか、
1259以降の特殊品詞の項目を1258の一般品詞にも重複登録するほうが
いいんじゃないかと思った。

こんな感じ。
いい 1258 1258 2000 いい
いい 1258 1258 2000 言い
いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

抑えめの頻度で登録すればそれほど悪影響もないと思う

390 名前:login:Penguin mailto:sage [2010/06/06(日) 19:07:38 ID:icwZ8Ez7]
>>389
汎用品詞の登録を増やしても先祖帰りするだけでしょ。
接続コストの実測値でパターンが似通っているならクラスタ化しても問題ないと思うけど、
そんなデータあるの?



391 名前:login:Penguin mailto:sage [2010/06/06(日) 22:07:07 ID:NlLwXMcQ]
「おーすとこ」ってやったらサジェストにオーストコリアが出てくるのはさすが。

392 名前:login:Penguin mailto:sage [2010/06/07(月) 03:47:24 ID:szI55KPJ]
はやくQt依存を切ってGtkにしろよ
libqtなんて入れたくないんだよ

393 名前:login:Penguin mailto:sage [2010/06/07(月) 04:18:46 ID:9HlTgDD4]
グーグルアースもQtだし、社の方針でしょ
KDEに乗り換える人が増えそう

394 名前:login:Penguin mailto:sage [2010/06/07(月) 05:00:56 ID:y4gOikgu]
>>392
Gtk版を作ればええやん

395 名前:login:Penguin mailto:sage [2010/06/07(月) 22:43:32 ID:mmfdo0Vn]
工学系で使える辞書欲しいな

396 名前:login:Penguin mailto:sage [2010/06/07(月) 22:53:41 ID:P9Ov0s9m]
>>381
短いとやっぱ弱いのかな?
おもわんが重ワンとなるのに
そうはおもわんと入れるとそうは思わんとちゃんと変換される。
わりと区切って入力するのでちょっと戸惑う。

397 名前:login:Penguin mailto:sage [2010/06/07(月) 23:08:44 ID:LJSwkYCS]
思い
思うとき
思えば
オモワン

なんだろうなこれ。

398 名前:login:Penguin mailto:sage [2010/06/07(月) 23:29:43 ID:LJSwkYCS]
思わぬ が変化したのが 思わん なのか、日本語って難しいな。

399 名前:login:Penguin mailto:sage [2010/06/08(火) 05:34:28 ID:B/3137Xj]
難しいっつうより頭がおかしい。

400 名前:login:Penguin mailto:sage [2010/06/08(火) 10:43:12 ID:X+aW8Khr]
>>396
「思う」という動詞が他動詞で、必ずその前に節を持つからかな?
「思わん」も「ん」が否定の助動詞「ぬ」の音便化なら、未然形に活用してるだけで、
特に不思議でも難しくもないと思うけど。

思わ/ない(ぬ、ん)
思い/ます
思う
思う/とき
思え/ば
思え



401 名前:login:Penguin mailto:sage [2010/06/08(火) 11:58:56 ID:umojQr77]
思はぬ → 思わぬ → 思わん

402 名前:login:Penguin mailto:sage [2010/06/08(火) 15:53:25 ID:M67rsOKg]
>>400
完成した文章を1文単位で分析して頻度を出した場合、
「xxxxである。思わん。xxxx。」みたいな表現はまず出てこない。
だから「思わん」単体だと全然優先されないのかも。

でも実際の入力では考え考え入力するわけだから、
1-3文節ずつぐらいで入力することが多いのだろう。
推敲の過程で「思わん」だけを入力することもよくあるはず。

1文単位で分析して語の結びつきを調べるだけでなく、
1-3文節ぐらいでの優先度も加味して辞書の頻度を出せたらいいのかもね。

まあこれを簡易にやるとしたら、
「思わん」の表記と頻度情報を
汎用動詞のところにも追加することかな。
(手元に資料がないので「思わん」の品詞がどうなってるかわからんけど)
>>389みたいな感じ

403 名前:login:Penguin mailto:sage [2010/06/08(火) 20:56:27 ID:M67rsOKg]
www.google.com/codesearch?q="TODO"+package:"mozc.googlecode.com/svn"
TODO 99件ですか。確かに大変そう。

trunk/src/converter/candidate_filter.cc
136: // This is a temporal workaround for fixing "おそう" => "御|総"
137: // TODO(taku): remove it after intorducing a word clustering for noun.
138: if (candidate_size >= 3 && candidate->nodes.size() > 1 &&

一時的とはいえ、場当たり的にフィルタ作ってもキリがないかも

404 名前:login:Penguin mailto:sage [2010/06/09(水) 22:18:15 ID:nAHqWJMV]
mozc 空気嫁内
anthy 食う清めない

どっちも馬鹿だorz

405 名前:login:Penguin mailto:sage [2010/06/09(水) 22:21:21 ID:f1C41BBe]
空気を読めない、が正しい日本語であって、
変な日本語まで相手にしないといけないからIMって大変だよな。

406 名前:login:Penguin mailto:sage [2010/06/09(水) 22:33:39 ID:Ws4Lks8p]
空気嫁を辞書に載せる必要あるのかって

407 名前:login:Penguin mailto:sage [2010/06/09(水) 22:36:40 ID:RIVNiz1o]
損なことは主っていません
(そんなことは思っていません)

辞書いじったからかと心配したら、
デフォのもずくでもこうだった

>>404
「てにをは」抜きはユーザのバカもちょっとある。
リロードしたら>>405が書いてたか

408 名前:login:Penguin mailto:sage [2010/06/09(水) 23:12:10 ID:nAHqWJMV]
mozc それは位置理あるぜ
Anthy それは一理あるぜ

やっぱmozc馬鹿だ
変換精度とか言ってた馬鹿出てこい

409 名前:login:Penguin mailto:sage [2010/06/09(水) 23:12:47 ID:SiUAEJXW]
>>406
とりあえずオレのTENGAに謝ってくれるかね

410 名前:login:Penguin mailto:sage [2010/06/09(水) 23:15:32 ID:nAHqWJMV]
>>407
mozc そんなことは主っていません
Anthy そんなことは思っていません

やっぱmozc馬鹿だ
↓こういう馬鹿
364 名前:login:Penguin [sage]: 2010/06/05(土) 10:38:19 ID:FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなw




411 名前:login:Penguin mailto:sage [2010/06/09(水) 23:22:03 ID:NYLHc+6y]
一度変換したらサジェストで出るのが賢いって事じゃないの?
物を知らない奴とバカな奴は別だな。

412 名前:login:Penguin mailto:sage [2010/06/09(水) 23:26:36 ID:mucBmdtX]
ごくわずかな部分を見て全体をわかったつもりになる馬鹿

413 名前:login:Penguin mailto:sage [2010/06/09(水) 23:36:17 ID:qhED6547]
>>408
あなたが使っているAnthyは「素」のAnthy?
それともUTUMIさんのModified Anthy?

私はmozcもAnthyもどちらか一方に肩入れするつもりは無いが、
変換精度とかいう話を持ち出すのであれば、どちらも「素」の状態で、
なおかつ、未学習の状態で比較すべきだと思うが。

414 名前:login:Penguin mailto:sage [2010/06/09(水) 23:50:28 ID:h+8Jcbr2]
ずっとそんな状態で使うわけじゃないんだから、
その条件で比較する意味なくね?
例えばその条件でanthyの方が優れているとしても、
使うにつれ個人用の学習データが小さい素のanthyのが
素のmozcより使いにくく感じるだろうし。

415 名前:login:Penguin mailto:sage [2010/06/10(木) 01:23:25 ID:mbMJMOce]
>>413
お前が、それじゃ辞書の初期の重みづけを判別するだけってことすら理解出来ない
知能ってことは理解してあげた。

416 名前:login:Penguin mailto:sage [2010/06/10(木) 01:25:38 ID:rK/aqtCT]
>>415
日本語でおk

417 名前:login:Penguin mailto:sage [2010/06/10(木) 01:38:32 ID:f9YWW83E]
>>413
変換精度に辞書は関係ないと思うんだ。
UTUMI氏の辞書追加してGoogleってすげーってか。

418 名前:login:Penguin mailto:age [2010/06/10(木) 08:03:02 ID:YeHzUdmw]
anthy擁護し続けてる一匹のバカはニホンゴもまともにかけないんだから
変換精度がどうのこうのの問題以前だw

419 名前:login:Penguin mailto:sage [2010/06/10(木) 08:14:27 ID:YW5C5UEV]
多さ、
が出てこないで大さになるのには閉口した。
Rev28

420 名前:login:Penguin mailto:sage [2010/06/10(木) 12:23:39 ID:sjq9s/0m]
>>417>>418
コテつけて他の人と区別できるようにしてから
二人で殴り合いしてくれないか



421 名前:login:Penguin mailto:sage [2010/06/10(木) 18:04:01 ID:f9YWW83E]
>>418
バカじゃなくて馬鹿
ニホンゴじゃなくて日本語
かけない→書けない
確かにお前は日本語もまともに書けないね。

422 名前:login:Penguin mailto:sage [2010/06/10(木) 18:26:27 ID:fPMmYVAZ]
そんなことは思っていません

423 名前:login:Penguin mailto:sage [2010/06/11(金) 18:00:40 ID:7svKIEvM]
目糞と鼻糞が罵り合ってるスレと聞いてやって来ましたw
>>417が目糞で、>>418が鼻糞ですか?

424 名前:login:Penguin mailto:sage [2010/06/11(金) 19:18:48 ID:dbkzlWEr]
>>423
いえ、耳くそですキリッ

425 名前:login:Penguin mailto:sage [2010/06/11(金) 19:26:16 ID:7svKIEvM]
>>424
耳糞さんも参戦ですか!?
目糞、鼻糞、耳糞の3竦みはどうなっているのでしょうか?


426 名前:login:Penguin mailto:sage [2010/06/11(金) 21:31:44 ID:HBiF4xvh]
なんか、使ってると少しずつ馬鹿になってない?
UTSUMIさん辞書を追加した直後は、オレ的に一発目で9割以上思い通りに変換してくれるように
なった印象があったんだけど、最近ちょいちょい変な変換するようになってきたような気がする。
一発目でほぼちゃんと変換してくれるので文節とか全然気にしてなかったせいなのか、辞書を
追加した副作用なのかよくわからんけど。
なんかチャーリー・ゴードンを思い出したぜ。

427 名前:login:Penguin mailto:sage [2010/06/12(土) 00:40:01 ID:LX/B/Aqs]
勝手に辞書追加しておいて文句言ってもダメだと何回言われたらわかるんだ

428 名前:login:Penguin mailto:sage [2010/06/12(土) 00:42:14 ID:CoCYPUhz]
説教房

429 名前:login:Penguin mailto:sage [2010/06/12(土) 00:47:55 ID:g96ojhEY]
UTUMI氏の辞書追加して変換精度とかほざいてた馬鹿涙目www



430 名前:login:Penguin mailto:sage [2010/06/12(土) 02:45:59 ID:vZS9Vjdk]
>>427
目糞乙。
>>429
鼻糞乙。



431 名前:login:Penguin mailto:sage [2010/06/12(土) 09:24:21 ID:HwPSTama]
mozc きょう体
Anthy 筐体

ちょw

432 名前:login:Penguin mailto:sage [2010/06/12(土) 09:37:18 ID:Ba4d1iMj]
時代は変わる→mozc
自大は変わる→anthy

433 名前:login:Penguin mailto:sage [2010/06/12(土) 12:39:17 ID:vZS9Vjdk]
比較するなら、ちゃんとした一文で行うことも必要。
おれAnthyもmozcも無印じゃないから報告できないけど。

434 名前:login:Penguin mailto:sage [2010/06/12(土) 12:46:22 ID:g96ojhEY]
>>433
つまりおまえも、UTUMI氏の辞書で変換精度とか言ってる目糞くんか

435 名前:login:Penguin mailto:sage [2010/06/12(土) 16:08:11 ID:p2A/0vlu]
だれか
mozc vs anthyのスレを作ってそっちに誘導してやって。
スレが作れないから。

436 名前:login:Penguin mailto:sage [2010/06/12(土) 17:57:36 ID:qhFozSGF]
とりあえず、辞書のフォーマットは、よみと品詞相当の左右の文脈IDの組と頻度と変換語で計5要素使ってるって事でいいの?
で、公開版に含まれていないのは、自動収集の膨大な単語と、精密な頻度データと、ググル八分で有名なお得意の不正語フィルタ
って事で合ってる?

437 名前:login:Penguin mailto:sage [2010/06/13(日) 02:42:49 ID:JhkzJet+]
>>436
公開版のフォーマットは合ってるけど、
非公開版は何せ非公開なのでわからない。

sourceforge.jp/magazine/10/05/11/0335246
> Google日本語入力の辞書データはGoogle検索のランキング・
> インデクシングアルゴリズムを反映するような単語の頻度情報を含む

Google検索での単語ランキングとインデクス作成アルゴリズムは隠したい、
ということかな。

> 自動収集の膨大な単語と、ランキングデータ
これは入ってる。

> ググル八分で有名なお得意の不正語フィルタ
これは入ってるかどうかわからない。

短い読みを入力するとズタボロになるっていうのは、
MS-IMEがちょっと前に経験したことだよね。
MSがそれをどう克服したか、っていうのがヒントになるのかも。

変換アルゴリズム変更も含めていろいろ考えていらっしゃるようなので、
twitter.com/taku910/status/15785334647
まったりと期待
(Mozc以外のアルゴリズムのことかもしれないけど)

438 名前:login:Penguin mailto:sage [2010/06/13(日) 06:12:08 ID:IohsGueo]
現状もずくに足りない単語いくつかあるみたいだから、一文節で変換できないものをリストアップするのはいいかもね

439 名前:login:Penguin mailto:sage [2010/06/13(日) 07:32:51 ID:JhkzJet+]
最終的にはMozcとGoogle IMEの辞書は同じものになるんじゃないかな。
Google社内の人だってWindowsとChrome OSとで同じ変換結果が欲しいだろう。

語彙数を減らしてランキング精度も落とした辞書なら、
公開に大きな支障はないんじゃないかな。
もともと及川さんは「辞書だけ配ったら」って言ってたようだし。
twitter.com/mamoruk/status/15055959325
> プロダクトマネージャの及川って人がいて、
> なんかIME作るの大変そうだから辞書だけ配ったら、と言ったんですね。

秋後半にChrome OSが出るんだっけ?
www.itmedia.co.jp/news/articles/1006/03/news022.html
てことは9月頃にはMozcがどういう形になるか確定するんじゃない

440 名前:login:Penguin mailto:sage [2010/06/13(日) 13:36:49 ID:SDyczpAN]
>>421
当て字の馬鹿よりはバカの方が自然だと思う。

莫迦。



441 名前:login:Penguin [2010/06/13(日) 14:11:06 ID:kc5+QLJB]
しらんけど
しらんケド
シランケド
白んケド

442 名前:login:Penguin mailto:sage [2010/06/13(日) 14:13:03 ID:kc5+QLJB]
しらんけれど
白んけれど

知りませんわ
知りませんことよ
知らないです
知るかボケ
シーラ内
知らな言ったら
知っとるけ

443 名前:login:Penguin mailto:sage [2010/06/13(日) 16:46:26 ID:ubyQDCwZ]
なんか変な呪文を見せられてシラケる。

444 名前:login:Penguin mailto:sage [2010/06/13(日) 18:41:24 ID:fkFT0NTC]
IMEの変換精度って定量的な評価基準ってあんのかね。
論文とかあったりする?

445 名前:login:Penguin mailto:sage [2010/06/13(日) 19:06:30 ID:voBenHq7]
変換精度より学習能力の方が重要な気がしてきた。

446 名前:login:Penguin mailto:sage [2010/06/14(月) 20:37:05 ID:cFzAXehZ]
目糞と鼻糞の戦いに決着着いたの?
もっと、罵り合って欲しいな。

447 名前:login:Penguin mailto:sage [2010/06/14(月) 20:44:38 ID:itjtAE+X]
安thyの糞ブリは誰もが思うことなのに、Gに対する憎しみの余り安thyを擁護する池沼ブリw

448 名前:login:Penguin mailto:sage [2010/06/15(火) 09:56:22 ID:WWgmOQND]
>>447
午後
五後
御後
碁後
伍後

さすがmozcの変換精度はすばらしいw

449 名前:login:Penguin mailto:sage [2010/06/15(火) 16:53:38 ID:eTqgSqS2]
>>448
なにそれ?
地方ローカルの変換精度??

450 名前:login:Penguin mailto:sage [2010/06/16(水) 08:23:23 ID:aoHW7luQ]
>>449
ごごをmozcで変換してみろよカス



451 名前:login:Penguin mailto:sage [2010/06/16(水) 17:41:20 ID:wWoolAjK]
>>450
午後
午后
ご後
ごご
ゴゴ
gogo
GOGO
gogo


自分で好きな辞書いれて使えばいいんじゃない?
ttp://www.geocities.jp/ep3797/mozc_01.html

452 名前:login:Penguin mailto:sage [2010/06/16(水) 19:28:46 ID:Gp0Lw4o3]
r30きてるよ!

453 名前:login:Penguin mailto:sage [2010/06/17(木) 08:30:23 ID:9frVqmCm]
>>451
私家版辞書で、Googleってすげー、mozcってすげーってか
mozcは私家版辞書で変換精度も向上しますキリッ
さすがmozcすげーぜwww

454 名前:login:Penguin mailto:sage [2010/06/17(木) 08:44:24 ID:9frVqmCm]
>>452
そうそう
毎度のことながらまたbuildに必要なソフトが増えてるから、そのままbuildしてbuildできねーとか書くなよな
とくにGoogle妄信的マンセー野郎はな

455 名前:login:Penguin mailto:sage [2010/06/17(木) 11:30:57 ID:nd3z9T0m]
なんという自演……


456 名前:login:Penguin mailto:sage [2010/06/17(木) 13:02:40 ID:XA+wvXLt]
わかりやすいanthyバカ自演w

457 名前:login:Penguin mailto:sage [2010/06/17(木) 13:56:54 ID:9frVqmCm]
自演だって・・・
なんちゅう単純な思考


458 名前:login:Penguin mailto:sage [2010/06/17(木) 16:48:51 ID:7Jb8hXGr]
>>453
当たり前なことを興奮しながら言うな
気に入ったIMEと辞書を組み合わせて使えばいい

459 名前:login:Penguin mailto:sage [2010/06/17(木) 16:53:19 ID:mnF1tUm+]
まずはデフォの辞書で精度上げようぜ、って話じゃなかったっけ。

460 名前:login:Penguin mailto:sage [2010/06/17(木) 16:59:11 ID:7Jb8hXGr]
>>459
そんなのGoogle次第じゃないの?
オープンソースのプロジェクトなんだし
派生版とか野良辞書とか組み合わせて使うほうがLinuxっぽくていいと思うけどね
何でも受身(デフォルト)で使うならLinuxなんていらないんじゃないか



461 名前:login:Penguin mailto:sage [2010/06/17(木) 19:00:14 ID:iNMpus7y]
>>459
Googleのデフォルトの辞書の定義次第でしょ。
Googleが色々弄った辞書をデフォルトですって言われれば
それがデフォルトな訳だし。

さあ、もっと目糞と鼻糞の掴み合いの取っ組み合いを魅せてくれw

462 名前:login:Penguin mailto:sage [2010/06/17(木) 23:37:35 ID:O9N+TpoV]
SCIM対応になって、実質誰でも使えるようになったわけだが、
なんでいまさらSCIM対応??

463 名前:login:Penguin mailto:sage [2010/06/18(金) 01:45:02 ID:IRUjfEYT]
sj3辞書の単語使ったmozcとかどうか?

464 名前:login:Penguin mailto:sage [2010/06/18(金) 02:11:30 ID:IRUjfEYT]
そういえばさ、2chブラウザのログなんかをコーパスに使って頻度値を書き換えてみたらどうなるのかとかって
やってみた人居ないのかな?

465 名前:login:Penguin mailto:sage [2010/06/18(金) 17:29:22 ID:179siXes]
>>464
2chからのデータで頻度値を書き換える意味ってあるのか?
日本語を正しく使えない奴らの集まりだぞw

466 名前:login:Penguin mailto:sage [2010/06/18(金) 17:37:11 ID:CO7JxFy0]
会話が成立してないもんな

467 名前:login:Penguin mailto:sage [2010/06/19(土) 03:52:58 ID:zfGxTSJm]
r30 だけど、濁音語で濁音なしでないと変換できないことが多いような。
例えば
寿司三昧
とかくのに、
すしざんまい
ではだめで、
すしさんまい
としないと変換出来ない。

何となくだけど、もとの辞書と変換アルゴリズムのコンボで起きてる希ガス

468 名前:login:Penguin mailto:sage [2010/06/19(土) 13:31:46 ID:Mym/g2aK]
郵便番号辞書が追加出来ない

$ ../../dictionary/gen_zip_code_seed.py --zip_code=KEN_ALL.CSV --jigyosyo=JIGYOSYO.CSV > ./zip_code_seed.tsv
../../dictionary/gen_zip_code_seed.py: line 43:
The tool for generating zip code dictionary.
Input files are shift-jis csv.
Output lines will be printed as utf-8.

usage:
./gen_zip_code_seed.py --zip_code=zip_code.csv --jigyosyo=jigyosyo.csv > zip_code_seed.tsv

Zip code sample input line:
01101,060: No such file or directory
../../dictionary/gen_zip_code_seed.py: line 46: __author__: コマンドが見つかりません




469 名前:login:Penguin mailto:sage [2010/06/19(土) 14:31:04 ID:l3MgG8Oj]
>>468

python ../../dictionary/gen_zip_code_seed.py …

でやってみそ。
mozcのビルド関連のpythonスクリプトは1行目に #!/usr/bin/python 的なのが書かれてないのが多い。
もしかしたら全部書かれてないかも。


470 名前:login:Penguin mailto:sage [2010/06/19(土) 16:53:26 ID:iMfoCnRm]
code.google.com/p/mozc/issues/detail?id=15

dictionary.gypのパッチもあてたほうがいいかもしれない。



471 名前:login:Penguin mailto:sage [2010/06/19(土) 19:16:12 ID:l3MgG8Oj]
おれもにほんおうえんでいそがしい。

オレも日本脳炎で忙しい。

「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
正しい文法じゃないけど、あんまりじゃないか。
ていうか、n の打ち漏らしとかも意識してるんか?

472 名前:login:Penguin mailto:sage [2010/06/19(土) 19:21:38 ID:G/AvUYZN]
>>471
ちゃんと変換されたぞ?

俺も日本応援で忙しい。

473 名前:login:Penguin mailto:sage [2010/06/19(土) 19:37:06 ID:CBTzBt9M]
>>471
おれも472と同じだ。0.11.365.1 学習なし で利用してる。
バージョンはなに? どんな環境で使ってる?

474 名前:login:Penguin mailto:sage [2010/06/19(土) 19:55:53 ID:l3MgG8Oj]
>>473
mozc は r29、学習は有り。
ちょっとあとで ~/.mozc 消してやり直してみる。
もちろん、過去に日本脳炎と変換したことはなかったし、単に「にほんおうえん」
では「日本脳炎」という候補はあがってこない。

475 名前:login:Penguin mailto:sage [2010/06/19(土) 20:18:56 ID:Mym/g2aK]
いまビルドしたばっかりだが、結果は>>471とおなじ
なぜか似た様な変換で
おれはにほんおうえんでいそがしいは
俺は日本応援で忙しい
と正しく変換される

476 名前:login:Penguin mailto:sage [2010/06/19(土) 23:24:46 ID:kbul/T1y]
けっきょくmozcもいまいちでAnthyの二の舞か…

477 名前:login:Penguin mailto:sage [2010/06/19(土) 23:34:45 ID:l3MgG8Oj]
>>476 は試合開始5分で1点入れられると「あーあ、この試合も負けか」とか
言い出すタイプ。

478 名前:login:Penguin [2010/06/20(日) 00:53:48 ID:sY951/ta]
476は典型的な百姓

479 名前:login:Penguin mailto:sage [2010/06/20(日) 01:31:11 ID:XLNwSoJz]
>>471
>>472
> 「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
> 正しい文法じゃないけど、あんまりじゃないか。
> ていうか、n の打ち漏らしとかも意識してるんか?

多分、それ。ローマ字かな変換のキータッチのゆらぎに対応するのにややこしいことになってるっぽい。
これに慣れるとまとまった文を書き連ねる場合にSCIM-Anthyのローマ字かな変換の繊細すぎるのが使い物にならなくなる位便利だけど


480 名前:login:Penguin mailto:sage [2010/06/20(日) 10:02:02 ID:JCImfZ7g]
日本脳炎
てす
日本農業新聞 ワラ



481 名前:login:Penguin mailto:sage [2010/06/21(月) 00:55:00 ID:0ZkvIPI4]
ページによるんだけどブラウザ(firefox)のフォームに入力しようとすると
全く反応しなかったり入力途中で消えることがあるなぁ。

通常の使い勝ってはもうホント決定版だと思ってるので早くバグ潰して完成度を上げてください。>エロイ人

482 名前:login:Penguin mailto:sage [2010/06/21(月) 01:19:36 ID:pzeyIawF]
わかる。
よく、サスペンドから復帰した後に、しかも3文字打って、その3文字を変換しようとした時に消えたりする。

483 名前:login:Penguin mailto:sage [2010/06/21(月) 04:39:00 ID:T/SvdD9E]
うーむ、
Baidu Type
ascii.jp/elem/000/000/528/528201/
Google 日本語入力
journal.mycom.co.jp/news/2009/12/08/069/

Googleのほうは女子力が足りないかも
おっさんばかりでむさ苦しい
男性女性で入力傾向違うと思うので、
(性差よりも個人差の方が大きいとは思うが、)
チームに女性をいれた方がいいかもね (もういるのかな)
端的にいえば「Mozc☆リリースしました!」とリリースノート書いたり、
かわいいツールバーを企画する人がGoogle IME/Mozcにはいなさそう

ブログ見ても女子色つよい
staffblog.baidu.jp/category/type/
スタッフ一同の写真?だよな、スタッフ証つけてるし
staffblog.baidu.jp/wp-content/uploads/2010/06/IMG_2867-300x225.jpg

ASCIIのBaidu Typeの記事はなかなか興味深い
> Google 日本語入力と比較されることが多いのですが、
> 実際ユーザー様からの要望などを見ていると、やはり、
> よりライトで、カジュアルな使い方をされている方が多いという印象です。
> かなり短い文節や単語単位で変換を行っている傾向が見てとれ、
> そこからもカジュアルユース中心であると推測しています。
> 『MS-Wordでは他のIMEを使い、ブログやチャットなどでは
> Baidu Typeを使う』というコメントもありました。

Linux版が出たら使い分けできて楽しいかもね
アイコンとかもかわいい感じかつ差し替え可能になったりして

484 名前:login:Penguin mailto:sage [2010/06/21(月) 04:41:31 ID:T/SvdD9E]
>>481-482
再現手順かいてMozcのIssuesに投げとけば。
code.google.com/p/mozc/issues/list

開発者日本人だから日本語でOK

485 名前:login:Penguin mailto:sage [2010/06/21(月) 04:55:47 ID:T/SvdD9E]
しかしGoogleスタッフの服装は暗いのお
googlejapan.blogspot.com/2010/06/google.html

あんまり愉快な発想が出そうな感じがしない

486 名前:login:Penguin mailto:sage [2010/06/21(月) 05:03:42 ID:cPfJbWjU]
>>483
偏見かもしれんが、例えば江沢民市ねとか
変換したら、その日から何かに脅えて
暮らすことになったりするのかな

487 名前:login:Penguin mailto:sage [2010/06/21(月) 06:42:13 ID:T/SvdD9E]
>>486
そりゃ偏見だし、
Googleだったら安心かというとそうでもない

というか入力すること自体のリスクは極めて小さい
問題なのは入力した文章を公開すること
>>486の文章をMS-IMEで書こうがMozcで書こうがSKKで書こうが、
公開してしまえば最大のリスクが等しく降りかかる
MS-IMEで書いて投稿したらリスクが減るってもんじゃない

いままで「Baidu Typeで『〜』って書いたらまずいことになるんじゃない」
みたいな書き込みは何度も見た
その投稿自体に全てのリスクがあるのになあ

つうわけで>>486は今日から
何かに脅えて暮らすことになったりするのかも

488 名前:login:Penguin mailto:sage [2010/06/21(月) 07:13:41 ID:40qedJmi]
中の人宣伝乙と書けばいいだろうのか
それともスレ違いと言えばいいのだろうか

489 名前:login:Penguin mailto:sage [2010/06/21(月) 07:58:13 ID:T/SvdD9E]
スレ違いってのは「小橋建太が結婚とは」ぐらいでないと。
許容度が小さすぎるぞ

> 中の人宣伝乙

Baidu Typeは初期にちょっと使ったけど、
長文変換が弱すぎたのですぐ消した
なにより基本的にLinux使ってるので動かせない

まあ記事中でGoogle日本語入力の話もちょろっと出てたし、
Mozcが短い入力に弱い→
意外とユーザは短い文節で入力してるみたい(Baidu Typeは特にそうなのかも)
とういうのが興味深かったのよ

490 名前:login:Penguin mailto:sage [2010/06/21(月) 07:59:18 ID:ylQvidjt]
Baidu Typeを使おうとは思わない
怖いしなんかキモいし



491 名前:login:Penguin mailto:sage [2010/06/21(月) 09:05:18 ID:iwCpYBpi]
>>ID:T/SvdD9Eスレ違い。宣伝乙
百度の話題ならこちらへ
日本語入力総合スレッド 4
ttp://pc11.2ch.net/test/read.cgi/linux/1151823044/l50

492 名前:login:Penguin mailto:sage [2010/06/21(月) 10:50:05 ID:shlRNFY2]
遅ればせながら、↓で発見。
blog.goo.ne.jp/minoh_edubuntu/e/632a79175331b039aa116109b76a6378?fm=rss

これまでanthyで苦労していたので助かった。
googleは嫌いだけど。

493 名前:login:Penguin mailto:sage [2010/06/21(月) 18:18:12 ID:R7JTwQ8k]
>>492
testerのmozcは辞書もなにも弄ってないbuildかな?

494 名前:login:Penguin mailto:sage [2010/06/21(月) 18:24:24 ID:iwCpYBpi]
>>493
jaチームとしてのものだから、弄っていないはず
というか、弄ってあっちゃまずい
ubuntu公式に限りなく近い野良ビルド

495 名前:login:Penguin mailto:sage [2010/06/21(月) 18:35:17 ID:w8Pl4equ]
また変なの発見。>>479がらみかな。

「きょにゅう」は辞書にないのはいいとして、それを一文節にすると、
「居に夕」、「虚に夕」…と、「きょにゆう」になってる。

うーん、バグ報告しづらい事例だなあ。

496 名前:login:Penguin mailto:sage [2010/06/21(月) 18:42:00 ID:QhOxbV10]
>>495
ちょっと待てw

r30 ツルシ辞書 学習あり

きょにゅう → 巨乳ちゃん

しか候補に来ないw
そんな変換した記憶はないのだが…

497 名前:login:Penguin mailto:sage [2010/06/21(月) 19:00:35 ID:w8Pl4equ]
>>496
「巨乳ちゃん」は辞書にあるよ。

498 名前:login:Penguin mailto:sage [2010/06/21(月) 19:49:24 ID:+Vw920Rk]
「知りたい」が変換できないな。これってひょっとして日本語の使い方間違ってる?

499 名前:login:Penguin mailto:sage [2010/06/21(月) 19:51:01 ID:3Pda7xvX]
ひんちちすき→貧乳好き

500 名前:login:Penguin mailto:sage [2010/06/21(月) 20:09:37 ID:R7JTwQ8k]
ふいんき 雰囲気
なぜか変換出来る
ネタとしてNG



501 名前:login:Penguin mailto:sage [2010/06/21(月) 20:19:40 ID:KDWRbYvc]
なんだか分節判定馬鹿になってない?
変な区切りしてるような気がするんだけど。

502 名前:login:Penguin mailto:sage [2010/06/21(月) 21:19:50 ID:w8Pl4equ]
>>501
同感。俺は学習に問題があるのかなあとか思ってたんだけど。

503 名前:login:Penguin mailto:sage [2010/06/21(月) 22:08:17 ID:O0BxWBxz]
学習単語ってどこで見れるのかな?

504 名前:login:Penguin mailto:sage [2010/06/21(月) 22:10:41 ID:Wiq3Lzso]
skkからこっちに切り替えてつかってると 文章ごとの変換になれてないために、
細切れ変換しやすいかな。
ずいぶんなれたけどさ。

505 名前:login:Penguin mailto:sage [2010/06/23(水) 07:45:52 ID:JOhAuhsd]
Mozcに関係あるかわからないんだけど知っていたらおしえて欲しい
Japanese team のppaからMozc いれたら、火狐で表示する一部サイトのアルファベットのフォントが変わってしまった。
解決方法を知っている人がいたら教えてもらえないだろうか?


506 名前:login:Penguin mailto:sage [2010/06/23(水) 07:52:48 ID:+DGSrOjN]
zenheiフォントをアンインストールしてみるとか

507 名前:login:Penguin mailto:sage [2010/06/23(水) 08:41:19 ID:JfXd+1aw]
firefoxの”webページが指定したフォントを優先にする”にチェックが入ってるだけとかは?
firefoxのフォント関係の設定は全部確認した?

508 名前:login:Penguin mailto:sage [2010/06/23(水) 11:45:50 ID:pC1bACa4]
>>505
ppa なんか使っちゃーいかんな。

509 名前:login:Penguin mailto:sage [2010/06/23(水) 11:52:19 ID:hLzgIJgE]
何様だよ

510 名前:login:Penguin mailto:sage [2010/06/23(水) 11:56:24 ID:5255hG7t]
俺様だろ



511 名前:login:Penguin mailto:sage [2010/06/23(水) 17:32:42 ID:pC1bACa4]
ppa を使うのは、うぶん厨だけw

512 名前:login:Penguin mailto:sage [2010/06/23(水) 18:36:17 ID:ReoAaQ2h]
つーか、Japanese teamなんてmozc出してたっけ?
testerなら知ってるけどさ。

513 名前:505 mailto:sage [2010/06/23(水) 20:19:11 ID:JOhAuhsd]
>>507
チェック外したら取り敢えず上手いこと表示された。
ありがとん

>>508
これからは気を付けるよ


514 名前:login:Penguin mailto:sage [2010/06/24(木) 02:35:58 ID:sjChCSOS]
>>505
「testerの意味のわかる人だけ使ってください」って書いてたでしょ。
不具合報告は提出してもいいけど対処法を教えてくれとか全く意味わかってないじゃん。

515 名前:login:Penguin [2010/06/24(木) 07:32:17 ID:33cH6iYm]
ppaってubuntu以外使えないの?
酷いディストリばかりなんだね(苦笑

516 名前:login:Penguin [2010/06/24(木) 19:45:16 ID:icPu4CVC]
>515
使える。
libcとか依存するライブラリ揃えて、ar とtar で deb の中身を
展開して、適切に設定したら、別のトリでもいけるだろ。

517 名前:login:Penguin mailto:sage [2010/06/24(木) 20:08:53 ID:YIW19YhL]
だったらソースから各ディストリのスタイルでビルドしたほうが早いじゃん。

518 名前:login:Penguin mailto:sage [2010/06/24(木) 20:35:20 ID:icPu4CVC]
使えるか、使えないかで質問したからだ。
ソースがあるから、ライセンス条件に従えるなら、
>577の方法でいいとは思うが、しょーもない煽り
だったので、上記で答えた。ウソではないからね。

519 名前:login:Penguin mailto:sage [2010/06/24(木) 20:47:17 ID:5qxOtEj8]
openSUSEがクロスプラットフォームなビルドサービスを持ってるよ

520 名前:login:Penguin mailto:sage [2010/06/24(木) 20:48:04 ID:3yGS5Qoa]
>>515は、どうせVine(笑)使いだろ
困るね世界標準じゃないディストリ使いは



521 名前:login:Penguin mailto:sage [2010/06/24(木) 21:00:08 ID:YIW19YhL]
>>518
ナイーブなやつだな。
オレなら>>516のあとに一言>>517を付け加えるけどね。
そのほうがよりマシな回答になるだろ?

うーむ、
「その|ほうが」で「その|方が」がでてこない。

522 名前:login:Penguin mailto:sage [2010/06/24(木) 22:55:44 ID:CkCzMIm3]
make; make; make clean

523 名前:login:Penguin mailto:sage [2010/06/24(木) 23:21:36 ID:wGZ7Y5MZ]
>>522
誰かツッコんでやれw 放置でカワイソウじゃないか。

524 名前:login:Penguin mailto:age [2010/06/26(土) 18:52:05 ID:Xg08UkVD]
しかしMozcの動きずいぶん止まってるね
辞書の作り直しとかやってるのかな

googlejapan.blogspot.com/2010/06/google-ver-011382x.html
> ユーザーフォーラムでのフィードバックをもとに、
> ローマ字ルールの評価方法を改良しました。

これで日本応援→日本脳炎が解消するのかな

> ローマ字のタイプミスの修正機能を拡充しました
> (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)

これは余計なお世話になりそうな予感

念のためだけどMozcには変化なし
> オープンソース版は更新されず

レポートするならMozcのIssuesよりヘルプフォーラムのほうがいいのかも?
Issuesは放置気味だしな
> ヘルプフォーラムをご利用ください。

525 名前:login:Penguin [2010/06/26(土) 19:13:52 ID:Z6prY9ic]
>>524
おれは
にほんのうえん→日本脳炎
だぞ。私家版Mozc辞書入れてるからな。
どうせお前は淹れ方分からないんだろwwww
へたれwww



526 名前:login:Penguin mailto:sage [2010/06/26(土) 19:30:45 ID:ECr4l6RM]
>>524
日本脳炎の件だけど、変換前が”にほんのうえん”になってる?”n”が足りてなかったりしない?
意識してないタイプミスのせいだと思うんだけど
その辺の問題があって、 > ローマ字のタイプミスの修正機能を拡充しました。て、ことじゃないかな
たぶん、> ローマ字ルールの評価方法を改良しました。 よりも
タイプミスの修正機能の方が、ユーザーにとっては嬉しいと思う
面倒なんでupdateしてない”Mozc-0.11.356.0”だけど
ちゃんと”にほんのうえん→日本脳炎”になってるよ

527 名前:login:Penguin mailto:sage [2010/06/26(土) 19:31:48 ID:lGgUdOwJ]
>>525
>>471氏のとおり、「にほんのうえん」だけの変換では正しく変換される
「おれもにほんおうえんでいそがしい」と入力すると
俺も日本脳炎で忙しい
となる
これは私家版辞書が追加されてるとか関係なさげ

528 名前:526 mailto:sage [2010/06/26(土) 19:42:20 ID:ECr4l6RM]
>>527
横からごめん。上記バージョンで、ちゃんと一文丸々一発変換された
おれもにほんおうえんでいそがしい→俺も日本応援で忙しい
辞書は全く弄ってない。変換時に文節区切ってない
過去に、この文を変換したことないんだが

529 名前:login:Penguin mailto:sage [2010/06/26(土) 20:17:29 ID:zqTu1dTq]
にほんおうえん 日本応援
にほんおうえんで 日本脳炎で
おうえんで 応援で
・・・なんだろうね。

530 名前:login:Penguin mailto:sage [2010/06/26(土) 20:25:58 ID:zqTu1dTq]
ほんおうえん 本農園
これが怪しいな




531 名前:login:Penguin mailto:sage [2010/06/26(土) 21:11:38 ID:7kGVyWfJ]
>>529
全部ちゃんと応援になる
脳炎となるのは誤字して学習させただけと思うが
履歴クリアしてみれば


532 名前:login:Penguin mailto:sage [2010/06/26(土) 21:16:40 ID:lGgUdOwJ]
>>531
~/.mozc消してビルドしたてのmozcでなるわけだが?
誤字の履歴も関係ない

533 名前:login:Penguin mailto:sage [2010/06/26(土) 21:24:33 ID:tZ6xhvBL]
とりあえず、mozc r29 (r30) 以外のやつは会話に入ってくんなよ。

534 名前:login:Penguin mailto:sage [2010/06/26(土) 21:33:17 ID:UNe+Fxsq]
r30 辞書そのまま

にほん|おうえん 日本応援
にほんおうえん 日本脳炎

で、デフォルトは「にほん|おうえん」の区切り。

おれも|にほん|おうえんで|いそがしい

で普通に変換されたけど。日本脳炎言ってるやつは
どんな区切りで打ってるんだ?

535 名前:login:Penguin mailto:sage [2010/06/26(土) 21:43:40 ID:kzVXlbYu]
日本応援って正しい日本語か?

「俺も日本応援で忙しい」
「俺も日本の応援で忙しい」

どう考えても日本語的に、「日本の応援」だろw
正しい日本語も分かってない奴がクレーム付けてもどうしようもないだろ!


536 名前:login:Penguin mailto:sage [2010/06/26(土) 21:56:25 ID:tZ6xhvBL]
>>535
>>471 を一字一句音読してこい。

537 名前:login:Penguin mailto:sage [2010/06/26(土) 22:32:33 ID:kzVXlbYu]
>>536
だからよ、「おれもにほんおうえんでいそがしい。」って打ってる時点で日本語変だろw
変換する前に気がつけよw
ブラインドタッチしてたら気が付くだろ変な日本語打ってるの。
こんな変な日本語音読する方が恥ずかしいわw

538 名前:login:Penguin mailto:sage [2010/06/26(土) 22:37:09 ID:tZ6xhvBL]
>>537
だから>>471は文法的におかしいと分かっている上で書いている。
そして文法的におかしいからと言って、それが「にほんおうえん」→「日本脳炎」という
誤変換のエクスキューズにはならない。
早く宿題済ませて寝ろ。


539 名前:login:Penguin mailto:sage [2010/06/26(土) 22:54:32 ID:kzVXlbYu]
>>538
* 入力補助機能の改良点
o ローマ字のタイプミスの修正機能を拡充しました (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)

この機能の副産物だろ。それをグチャグチャ言ってる時点で可笑しいんだよw
タイプミス時の修正機能のロジックなんて、お前等に合わせて組んでたら一生掛かっても完成しないだろ。
お前も>>471も揚げ足を取って笑ってる愉快犯じゃねーかw
お前こそママのおっぱい吸ってさっさと寝ろw

540 名前:login:Penguin mailto:sage [2010/06/26(土) 22:58:01 ID:kzVXlbYu]
>>538
おいw顔と耳真っ赤だぞw



541 名前:login:Penguin mailto:sage [2010/06/26(土) 23:02:58 ID:tZ6xhvBL]
>>540
ワロスw
俺はおまいがモニタの前で顔真っ赤にしてるメガネっ子の女子校生とみなしてるから
全然構わんぞ。

542 名前:login:Penguin mailto:sage [2010/06/26(土) 23:15:44 ID:kzVXlbYu]
おっ!?
揚げ足も取れなくなりましたかw
まあ、「日本脳炎」にこだわる小さい人間だから仕方ないかw

543 名前:login:Penguin [2010/06/27(日) 00:59:51 ID:CTEwBljB]
>>535

(((;-д-)=3ハァ?
日本語的なんて日本語があると思ってるの?
典型的な間違った現代語じゃねぇか。


544 名前:login:Penguin mailto:sage [2010/06/27(日) 01:17:45 ID:wU0enjNj]
>>543
てき【的】(接尾)
名詞に付いて、形容動詞の語幹をつくる。
1.そのような性質をもったものの意を表す。「文学―表現」「詩―発想」
2.それについての、その方面にかかわる、などの意を表す。「教育―見地」「政治―発言」「科学―方法」
3.そのようなようすの、それらしい、などの意を表す。「大陸―風土」「平和―解決」「徹底―追求」

日本語ちゃんと勉強ちまちょうねw
馬鹿なのがばれまちゅよw

545 名前:login:Penguin mailto:sage [2010/06/27(日) 01:58:49 ID:+QfA3FbB]
面白いバグを見つけたと思ってレスしたら自分だけだった
そんな事態になったら焦るよ
同情します

546 名前:login:Penguin mailto:sage [2010/06/27(日) 02:02:28 ID:pwuJ8VLE]

オマエら m9(^Д^)プギャーーーッ

twitter.com/taku910/status/17096522332
> Anthyでもそうだったらしいのですが、MeCabもMozcもソフトウェアの動作だ
> けを見て、憶測だけで動作アルゴリズムを「さも専門家のように語る」
> Linuxユーザは本当に勘弁して欲しい。たいてい間違ってるし。オープンソー
> スなんだからソース読んでほしい。


547 名前:login:Penguin mailto:sage [2010/06/27(日) 02:08:45 ID:ZR0jbQ7b]
間違ってるならちゃんと指摘すればいいのに。
リーナスだってlinuxの全部のソースは知らないって教育テレビで言ってたよ。

548 名前:login:Penguin mailto:sage [2010/06/27(日) 02:09:35 ID:toNIO6Zd]
>>546
マジレスすると、Linuxはオープンソースなんだからソース読めと言うのは
ソースが読めなければLinuxを使ってはいけないと言う意見なのかね?

頭悪すぎるだろう。

549 名前:login:Penguin mailto:sage [2010/06/27(日) 02:15:00 ID:a0nWQ38h]
ソース読めないやつは黙って使え
ということだね

550 名前:login:Penguin mailto:sage [2010/06/27(日) 02:15:04 ID:+QfA3FbB]
>>546
宛先は誰だよ?
>>1-1000にして自分入れるの忘れるなよ



551 名前:login:Penguin mailto:sage [2010/06/27(日) 02:18:01 ID:YrTT2Rln]
まぁ普通オートマトンの設計者はコーディングもするし

552 名前:login:Penguin mailto:sage [2010/06/27(日) 02:19:41 ID:ZR0jbQ7b]
そもそも自分以外のソース見て動作がわかる人は、他人のソースは使う必要が無いんだよね。

553 名前:login:Penguin mailto:sage [2010/06/27(日) 02:21:38 ID:a0nWQ38h]
んなことはない

554 名前:login:Penguin mailto:sage [2010/06/27(日) 02:23:33 ID:ZR0jbQ7b]
まあ他人のソースを使う人は、自分のソースの動作がわからない人だったりはするね。

555 名前:login:Penguin mailto:sage [2010/06/27(日) 02:31:13 ID:a0nWQ38h]
何を言いたいんだか

556 名前:login:Penguin mailto:sage [2010/06/27(日) 02:38:10 ID:ZR0jbQ7b]
バグが治らなくて使いにくいってことだよ

557 名前:login:Penguin mailto:sage [2010/06/27(日) 02:44:07 ID:a0nWQ38h]
バカが治らないとかそんなに自分を責めなくてもいいと思うよ

558 名前:login:Penguin mailto:sage [2010/06/27(日) 02:46:38 ID:+QfA3FbB]
例えば、「予測変換」と変換した後に
「よそく」と入力した時点で第一候補に「予測変換」と出るけど
日本語文章で予測変換が続くことは、ほぼあり得ない
携帯辞書も似た様なもんだけど
この辺は設定で変えられたらいいなと思う
さっきの日本応援も一度変換しちゃうと
次は「にほ」で日本応援が第一候補だし


559 名前:login:Penguin mailto:sage [2010/06/27(日) 02:48:20 ID:ZR0jbQ7b]
流石にバグをバカと変換する仕様なんてのはmozcには無いと思う。
で、それをソースで確認するのってどうやるの?

560 名前:login:Penguin mailto:sage [2010/06/27(日) 02:49:49 ID:a0nWQ38h]
gdbでも使えば?



561 名前:login:Penguin mailto:sage [2010/06/27(日) 02:51:34 ID:ZR0jbQ7b]
>>560
じゃあ実演しといて

562 名前:login:Penguin mailto:sage [2010/06/27(日) 02:53:30 ID:a0nWQ38h]
いやです

563 名前:login:Penguin mailto:sage [2010/06/27(日) 02:57:12 ID:+QfA3FbB]
しまった
バカの馴れ合いに挟まっちゃった
寝よ

564 名前:login:Penguin mailto:sage [2010/06/27(日) 02:57:30 ID:a0nWQ38h]
ワタシ、ニホンキライアルヨ
みたいな、日本語変換は難しいよねきっと

565 名前:login:Penguin mailto:sage [2010/06/27(日) 02:57:31 ID:ZR0jbQ7b]
以上、証明終わり。

566 名前:login:Penguin mailto:sage [2010/06/27(日) 02:58:40 ID:a0nWQ38h]
バカの証明

567 名前:login:Penguin mailto:sage [2010/06/27(日) 03:00:47 ID:a0nWQ38h]
バカ証明で忙しい

568 名前:login:Penguin mailto:sage [2010/06/27(日) 03:10:23 ID:ZR0jbQ7b]
マジメな話、バグの証明って仕様がわからなければ無理だよね。
マシンの中に虫なんか居ないから、意図はともかくプログラムは誰かの書いた通りに動いているわけで。

569 名前:login:Penguin mailto:sage [2010/06/27(日) 03:41:36 ID:a0nWQ38h BE:1141095694-2BP(50)]
マジメに話をしてもバカw

570 名前:login:Penguin mailto:sage [2010/06/27(日) 03:47:20 ID:wU0enjNj]
やっぱり、馬鹿ばっかりだなここw



571 名前:login:Penguin mailto:sage [2010/06/27(日) 03:56:56 ID:UWF/v0LL]
「にほんのうえん」はnihonnnouennだが、nihonnouennとタイプしてしまいそうな・・・。
入力時点ではとりあえず「にほんおうえん」と表記されるが「ん」をn一個でやっちゃったんじゃないかと
思ってくれる親切設計なんじゃないかな。
「官能的」なんかも「かんおうてき」で変換できるんじゃ内科医。

572 名前:login:Penguin mailto:sage [2010/06/27(日) 04:17:38 ID:ZR0jbQ7b]
>>571
>>546によるとソース読まなければ語るのは勘弁してくれだそうですよ。
しかし日本語関連の人間ってライセンス以外の制約付けるの好きだなあ。

573 名前:login:Penguin mailto:sage [2010/06/27(日) 04:34:48 ID:a0nWQ38h]
> けを見て、憶測だけで動作アルゴリズムを「さも専門家のように語る」

バカ丸出しで語るオマエはOK

574 名前:login:Penguin mailto:age [2010/06/27(日) 04:50:50 ID:LwleNs7B]
日本脳炎の話は、
nihonnouenn と入力してスペースキー押すと「日本応援」になり、
そこから shift+方向キー右 を押すと「日本のうえん」になる。

nihonn|ouen → nihonno|uen → にほんの|うえん

この挙動は意図的なものなんだろうけど、
ぱっと見不思議な感じがするのでIssuesにもレポートが上がってる

入力補助機能の弊害についてはヘルプフォーラムで話が出てる
www.google.com/support/forum/p/ime/thread?tid=0441973e77355bc8&hl=ja
> 「しんじよう」と入力すると、サジェストの先頭が「新庄」になってます。

>>546
せめて「〜という記述を見かけたのですが」と書いておけば、
誰が間違ってるのか勘弁して欲しいのか分かるのにな
ああいう書き方だと「本当に勘弁して欲しい」相手はしゃべり続け、
役に立つことを書いてる人は気を遣って黙っちゃう

> 憶測だけで動作アルゴリズムを「さも専門家のように語る」
> オープンソースなんだからソース読んでほしい。

「ソース読んでほしい」じゃなく「この解説文読んでほしい」
にならないのは残念
読める文章がないから怪しい解説にみんな食いつくのでは

575 名前:login:Penguin mailto:sage [2010/06/27(日) 07:04:46 ID:iCru6Fog]
かな入力で、「に ほ ん の う え ん」と
七打すればいいだけなのに馬鹿じゃないかと思うよ
おまえら
悪い頭を良い頭に取り替えてかな入力すればすむ話じゃねーか
身体障害者なのか精神薄弱なのか知らないがバカ入力選んでバカ入力の話を無限ループかよ?

576 名前:login:Penguin mailto:sage [2010/06/27(日) 07:11:27 ID:a0nWQ38h]
え?

577 名前:login:Penguin mailto:sage [2010/06/27(日) 09:29:43 ID:AB/w4Yqf]
よくしらんけどいつのまにか、にほんおうえんがにほんのうえんと、それこそ脳内変換されてる。

にほんおうえん→日本応援
にほんおうえんで→日本脳炎で

にほんのうえんを変換したいわけではない
勘違いバカはすっこんでろ

578 名前:login:Penguin mailto:sage [2010/06/27(日) 09:33:15 ID:EYDo0gAo]
助詞を落とした間違った日本語に訂正機能が働くのは正常。
訂正機能で自分の意図と違う変換結果になったからって文句を言うのはアホ。

579 名前:login:Penguin mailto:sage [2010/06/27(日) 09:47:35 ID:AB/w4Yqf]
だからって、にほんおうえんでを日本脳炎でと変換していいという理由にはならない

580 名前:login:Penguin mailto:sage [2010/06/27(日) 10:09:48 ID:ZR0jbQ7b]
ただしイケメンに限る



581 名前:login:Penguin mailto:sage [2010/06/27(日) 10:14:21 ID:a0nWQ38h]
nihonn ouen
nihon nouen
区切りなしに判別するのは論理的に不可能
日本脳炎という単語が辞書にあるからサジェストされるのが当たり前

わかったか?

582 名前:login:Penguin mailto:sage [2010/06/27(日) 10:20:37 ID:ZR0jbQ7b]
いや、そもそも設定に項目を作るべきなのでは? そういう副作用がわかっている機能ならば。

583 名前:login:Penguin mailto:sage [2010/06/27(日) 10:23:17 ID:a0nWQ38h]
いや、そもそも助詞を使うべきなのでは? そういう日本語がわかっている日本人ならば。

584 名前:login:Penguin mailto:sage [2010/06/27(日) 10:24:56 ID:a0nWQ38h]
だいたい一回やれば学習するものをなんで設定なんかするんだよバカ

585 名前:login:Penguin mailto:sage [2010/06/27(日) 10:27:05 ID:a0nWQ38h]
だからバカは黙って使ってろって話なんだよ
使ってりゃ学習するんだから
おまえはちっとも学習しないみたいだけどな


586 名前:login:Penguin mailto:sage [2010/06/27(日) 10:31:09 ID:AB/w4Yqf]
バカなサジェストは不要


587 名前:login:Penguin mailto:sage [2010/06/27(日) 10:32:50 ID:a0nWQ38h]
バカとして博物館に飾っておきたいくらい

588 名前:login:Penguin mailto:sage [2010/06/27(日) 10:40:55 ID:AB/w4Yqf]
>>581
>nihonn ouen
>nihon nouen

やっぱりこの馬鹿わかってなかった・・・
にほんおうえんで
にほんおうえんで
にほんおうえんで
  ・    ・
  ・    ・


100回変換してろ

589 名前:login:Penguin mailto:sage [2010/06/27(日) 10:44:43 ID:Z9uQG43o]
”n=ん”は、ローマ字入力上の慣習
mozcのルールでは、厳密に言えば”ん=nn”
な行の前の”ん”はnnで入力しないと、文節の判定がうまくできなかった
Atokが優秀なのは、それを含めてユーザーのタイプミス等を予想して変換に組み入れていたから
今回、ローマ字のタイプミスの修正機能を拡充したので
少しはイメージ通りの変換に近くなっているはず

590 名前:login:Penguin mailto:sage [2010/06/27(日) 10:44:44 ID:AB/w4Yqf]
高円宮妃久子さま 日本応援で私的に南ア訪問
www.sponichi.co.jp/soccer/news/2010/06/12/14.html


高円宮妃久子さま 日本脳炎で私的に南ア訪問

mozcで書いたら馬鹿誤植になったわけだ



591 名前:login:Penguin mailto:sage [2010/06/27(日) 10:51:08 ID:ZR0jbQ7b]
>>589
個人的には、シングルクリックで開く並に余計なお世話だと思う。
まあ設定できれば別にデフォルトでも気にしないけど。

592 名前:login:Penguin mailto:sage [2010/06/27(日) 10:51:09 ID:a0nWQ38h]
バカが使うとそうなりますね

593 名前:login:Penguin mailto:sage [2010/06/27(日) 10:52:31 ID:a0nWQ38h]
設定こそ大きなお世話だよバカ

594 名前:login:Penguin mailto:sage [2010/06/27(日) 10:54:56 ID:ZR0jbQ7b]
nn=ん が染みついちゃってるし、今更訓令式で入力する気なんか無いよ。

595 名前:login:Penguin [2010/06/27(日) 10:56:21 ID:pDidW01s]
>>544

それで?
絶対にどこかのアフォが辞書引いて反論すると思った。
辞書のコピペだけで勝った気になる能無し乙。
その定義のどれを使っても、
「日本語的」「世界的」とか、変な用法の正しさは証明できない。
むしろ、「的」は中国語で「of」に相当するから、
日本語でも誤った用法が定着してるけど、
適当に漢字や熟語を並べても漢語としては主張できるけど、
日本語の熟語には認められない。

大学の教授も同じこと言ってたけど、中学でも習って知ってた。


596 名前:login:Penguin [2010/06/27(日) 10:57:30 ID:pDidW01s]
最たる誤用法が「自分的」


597 名前:login:Penguin mailto:sage [2010/06/27(日) 11:02:23 ID:zdDUWrPs]
俺思ったけれど、ID:pDidW01sさんはもっと馬鹿のいない、素晴らしい方々がたくさんおられるスレに行くべきだと思うの
所詮馬鹿ばっかりしかいないし、馬鹿と遊んでたって時間の無駄だし、なにより貴方様まで馬車になるよ

598 名前:login:Penguin mailto:sage [2010/06/27(日) 11:08:11 ID:a0nWQ38h]
学習によって補完されるのに別に設定を設けろとか
言い掛かりや嫌がらせに近い
そんくだらないパラメータをいちいち加えていたらプログラムが煩雑になるだけ
そんなバカな話をもっともらしく語る始末
>>546の人の気持ちも分かる


599 名前:login:Penguin mailto:sage [2010/06/27(日) 11:35:03 ID:tn5sadQB]
>>598
バカほど大きい声で言い切るしね。
分かっている人は控えめで謙虚だ。


600 名前:login:Penguin mailto:sage [2010/06/27(日) 11:38:53 ID:ZR0jbQ7b]
そうやってさも専門家のように語るイケメンさんはソース読んだの?



601 名前:login:Penguin mailto:sage [2010/06/27(日) 13:41:53 ID:LwleNs7B]
一応だけど、
Anthyでは
nihonnouenn で shift+→ すると、
にほんお|うえん になる
この挙動で苦情は出なかったと思うし、
個人的にも自然に思える

しかしtakuさんの逆鱗に触れたの誰だろ
直前にこれ↓を読んでたので対照的だなあと思った
staffblog.baidu.jp/2010/06/25/baidu-type-022/
> さすがブロガーの皆さん、アウトプットする言葉の正確さや、
> 入力しやすさに非常に関心・ご要望をお持ちで、大変参考になるお話をいただきました。

ユーザが勘違いなことを書くのはある意味当たり前
有益と思える部分だけすくい取っていけばいい
誤解があると思うならドキュメントを書いて説明することも大事

ID:ZR0jbQ7b (14)
ID:a0nWQ38h (20)
書きすぎ

602 名前:login:Penguin mailto:sage [2010/06/27(日) 13:45:27 ID:zdDUWrPs]
休みの日くらいイッパイ書かせてもいいぢゃないでせうか、と思ふのですが
平日に20とか行ってたらちょっと書きすぎって言ってもいいだろうけど

603 名前:login:Penguin mailto:sage [2010/06/27(日) 15:10:45 ID:8AXtkjxO]
uim-anthyだと 日本|応援 って最初からでるYO!

604 名前:login:Penguin mailto:age [2010/06/27(日) 15:14:02 ID:iIFZfXGC]
そもそも日本応援なんかしなくていい
弱いのが勘違いしてるだけなんだから

605 名前:login:Penguin mailto:sage [2010/06/27(日) 16:00:35 ID:AB/w4Yqf]
>>604
またそうやって、出来ないことは必要ないことであると脳内変換するのか?

例えば、我々はDRMが必要なのではない。
Gyao!がDRMを使わなくても見れるならそれでいいのだ。
出来なくても構わないが、代わりのものが整備されてこそだと思うのだが。

606 名前:login:Penguin mailto:sage [2010/06/27(日) 16:25:36 ID:1lb4fVSL]
で、おまえらは何と戦ってるんだ?

607 名前:login:Penguin mailto:sage [2010/06/27(日) 16:53:47 ID:IDzQ/UyC]
>>606
俺も是非知りたいな。

608 名前:login:Penguin mailto:sage [2010/06/27(日) 22:20:33 ID:rwYplf+A]
現実とだな。

609 名前:login:Penguin mailto:sage [2010/06/27(日) 22:45:58 ID:a0nWQ38h]
ソースコンプレックスw

610 名前:login:Penguin mailto:sage [2010/06/28(月) 19:05:29 ID:YjEsd8O2]
日本脳炎でもっと盛り上がってくれよw



611 名前:login:Penguin mailto:sage [2010/06/28(月) 20:50:04 ID:6R0fDxVd]
hennaisuru => space => 偏愛する => shift+左左左 =>
変ないする

ローマ字かな変換の話なので、
日本語としての正しさとか辞書のスコアがどうとかは別の話

つまり、
hennaisuru と入力した人が、
区切りを変更しただけで「へんないする」が出たときどう思うか
Anthyみたいなほうがいいんじゃね?と

しかしtwitterでMozcスレ読んでます的なこと書くの恥ずかしいぞお前ら
Aさん
> mozcスレ、おれもにほんおうえんでいそがしい。→オレも日本脳炎で忙しい。
> でどんだけレス消費してるんだ

Bさん
> 2ch の mozc スレが全く不必要に荒れていて
> どんどん ID をあぼーんしていったらスカスカのスレになってしまった!!。
> もう読むのやめよう。

612 名前:login:Penguin mailto:sage [2010/06/28(月) 20:55:47 ID:6R0fDxVd]
takuさん
> Mozcの「日本脳炎」の話は、UTSUMI氏の辞書に
> 日本脳炎が4206という低いコストで登録されていて、
> 日本応援のコストよりスペルチェックしたほうが有利に働いただけ。

そういう話だったのかな?
スペルチェックそのものがどうなのかという話かと思ってた

> 同氏の辞書を入れない通常のコストは6529と大きくこの問題は発生しない。
> 適当なコスト付けだと副作用が起きる典型例

あー、takuさんが怒ってたのはこれか
素人がコードも読まずに変換精度語るなよ的な

まーMozcが今後どういうふうになるかわからんしね、
mozc-configみたいにさっさと引くのが正解だね

「ぼくに」→「ボク妊娠」
「おれは」→「オレハマッテルゼ」
「すーし」→「徐煕[女弟]」
たまに面白いサジェストが出てきて救われる
笑いって大事ね

613 名前:login:Penguin mailto:sage [2010/06/28(月) 20:58:54 ID:Ig8ewDwa]
実際、へんないと打ちたいときはhennnaiと、nが3つ続くわけだが。
変換前はひらがななわけで、ローマ字ではない。
しかも、nが3つ続くことを意識して打ってるわけでもない。
多分、Direct inputでも同じだろう。
ローマ字ではへんないだが、へんあいと表示されたのを見て変換してるわけだ。
なのになぜ未だにこういう勘違い馬鹿がいるのか不思議でならない。

614 名前:login:Penguin mailto:sage [2010/06/28(月) 21:36:39 ID:vE1RuP2O]
>>612
要するに使ったコーパスが偏ってて日本脳炎の出現頻度が不当に高すぎるって話?
そうじゃないなら頻出語が登録されてない暫定辞書の問題じゃないの?

でもそれはこの話の本質的な問題じゃないんだよね。
大体ソース見たってそんな事はわからないもの。
大規模コーパス版のソースが見れれば別かもしれないけど。

615 名前:login:Penguin [2010/06/28(月) 21:47:30 ID:teKDYFoA]
だから、追加辞書の内容も確認しないでガタガタ騒ぐなって事だろ?
そんなのソース以前の問題だろw
いかにここがバカの集まりだって遠回しに言われてるの気がつけよw
もう、お前等が日本脳炎にかかってしまえよw


616 名前:login:Penguin mailto:sage [2010/06/28(月) 21:56:24 ID:vE1RuP2O]
デフォルトで出なければ良いって問題じゃないだろう。
学習すればバカになるって言っているのと同じ事だし。
そもそも間違っても仕方がないと思うような間違いなら誰も騒がないんだよね、

617 名前:login:Penguin mailto:sage [2010/06/28(月) 22:09:34 ID:to9RUFmG]
あーあ、ついにUTSUMI氏辞書公開停止。
人名辞書はありがたく使わせてもらってたんだけど、仕方ないか。

618 名前:login:Penguin mailto:sage [2010/06/28(月) 22:15:16 ID:vE1RuP2O]
それこそ全然関係ない話なのに八つ当たりだねえ。

本応援と打とうとしたら本農園が出るのは変わらないし。

619 名前:login:Penguin mailto:sage [2010/06/28(月) 22:19:06 ID:rfPkQ9oX]
あー、ここなんか話かみ合わないと思ったら追加辞書がデフォだったからか
自分でコンパイルしたの入れてたから日本脳炎とか分からなかった。

620 名前:login:Penguin [2010/06/28(月) 22:26:52 ID:YjEsd8O2]
デフォルト辞書と学習辞書をゴッチャにする馬鹿w
もう死んでしまえよw

【日本脳炎】
日本脳炎ウイルスの感染によって起こる脳炎。法定伝染病の一。
コガタアカイエカの媒介によるため、夏に流行する。感染しても症状の現れないことが多いが、
発病すれば致命率が高く、治っても重い後遺症を残す。

まるで今のお前等のようだwww



621 名前:login:Penguin mailto:sage [2010/06/28(月) 22:41:02 ID:vE1RuP2O]
しかしcannaやanthyがそんな変換したって誰も話題にしないで放置だよ多分。
そういう話が出てくるのはむしろ熱心なユーザーに恵まれてるんだと思ったほうが良いと思うんだけどなあ。

622 名前:login:Penguin mailto:sage [2010/06/28(月) 22:52:10 ID:rfPkQ9oX]
考えようによってはヘタレ辞書がトロイ的に本家の評判を落とすことが可能ってことだな
UTSUMIとか言うのがジャストなんとかの手先だったらおもしろいけど

623 名前:login:Penguin mailto:sage [2010/06/28(月) 23:05:53 ID:vE1RuP2O]
付属辞書とかサンプルというのは大抵ヘタレだからなあ、それで本体がたいしたことないやって評価になったり、
サンプルが熱心なファンが作ったものに差し変わった途端に評判が段違いに高まるソフトとかはよくある話じゃない?
でも逆は無いね。

624 名前:login:Penguin mailto:sage [2010/06/28(月) 23:21:26 ID:kV4nwtmV]
>>611>>613
重ねうちの数をミスるとか打ち損じで不要な子音が混ざるとかは
よくあるミスなので自動補正が掛かる動作のほうがまとも。

625 名前:login:Penguin mailto:sage [2010/06/28(月) 23:28:29 ID:sPL4dOyN]
ワシモソーオモウ(´・ω・) ス

626 名前:login:Penguin mailto:sage [2010/06/29(火) 01:10:39 ID:6VqNbmTh]
むしろ、問題は無いなんて強弁している奴が手先だろう。
だってそんな事言わなくたって、じゃあ原因突き止めてパッチ出してねで済む話なんだし。

627 名前:login:Penguin mailto:sage [2010/06/29(火) 01:18:07 ID:YfC2OShb]
日本脳炎の原因はどっかの誰かが作った追加辞書だろ?

628 名前:login:Penguin mailto:sage [2010/06/29(火) 01:28:02 ID:6VqNbmTh]
それだったら一蹴できた話。
結局>>246のやっかみだね。

629 名前:login:Penguin mailto:sage [2010/06/29(火) 01:38:07 ID:R344iBrK]
そもそも学習によって吸収されてしまう話で
粘着するような話じゃないし、バグでもない

630 名前:login:Penguin mailto:sage [2010/06/29(火) 01:44:41 ID:6VqNbmTh]
まあ、打ったつもりの無い変換結果を見てもストレスに感じない人は、この話に参加するべきではなかったんだろうね。



631 名前:login:Penguin mailto:sage [2010/06/29(火) 01:52:03 ID:R344iBrK]
「日本脳炎」で決定して学習させておいて
バグだバグだと喚き散らす

もういい加減にしてほしい

632 名前:login:Penguin mailto:sage [2010/06/29(火) 01:57:00 ID:6VqNbmTh]
>>631
じゃあなんで無視できないのさ?
中の人なの?

633 名前:login:Penguin mailto:sage [2010/06/29(火) 01:58:34 ID:R344iBrK]
しまいには認定ごっこだし

634 名前:login:Penguin mailto:sage [2010/06/29(火) 01:59:31 ID:TiCyv9WP]
学習じゃなくて私家製辞書のせいじゃなかったのか。

635 名前:login:Penguin mailto:sage [2010/06/29(火) 02:08:59 ID:R344iBrK]
>>634
私家製辞書のせいで「日本脳炎」とサジェストされるわけだけど
おばかさんはその結果で決定してるから、いつまでも「日本脳炎」が上位のまま

おれもUTSUMI辞書を取り込んでるけど、
一回ちゃんと変換すれば日本脳炎なんてでない


636 名前:login:Penguin mailto:sage [2010/06/29(火) 02:12:54 ID:SRaABgeP]
ようはあほですね→要はアホですね

637 名前:login:Penguin mailto:sage [2010/06/29(火) 02:15:26 ID:R344iBrK]
例えるなら
「クサイ、クサイ」と喚き散らしながら
自分でウンコ漏らしてることにいつまでたっても
気づかないような欠陥人間

638 名前:login:Penguin mailto:sage [2010/06/29(火) 02:19:02 ID:6VqNbmTh]
ID:R344iBrK はいつもの煽り屋かな?

639 名前:login:Penguin mailto:sage [2010/06/29(火) 02:20:36 ID:R344iBrK]
ソースが読めるかどうかとか以前の問題ですね


640 名前:login:Penguin mailto:sage [2010/06/29(火) 02:23:50 ID:6VqNbmTh]
どちらの方面の方か存じませんが離間工作は順調のようですね。



641 名前:login:Penguin mailto:sage [2010/06/29(火) 02:28:27 ID:R344iBrK]
認定ごっこばかりじゃなくて
その「臭い」についてきちんと説明してみたらどう?

実際おれの環境じゃもうnihonnnouenと打たないかぎり
「日本脳炎」なんてでないからね

642 名前:login:Penguin mailto:sage [2010/06/29(火) 02:34:39 ID:R344iBrK]
ローマ字入力の揺らぎまでうまく学習しているように見えますよ

643 名前:login:Penguin mailto:sage [2010/06/29(火) 04:00:09 ID:TiCyv9WP]
>>R344iBrK
>>630

644 名前:login:Penguin mailto:sage [2010/06/29(火) 04:17:25 ID:RAWQ0/Y1]
使えりゃいい

645 名前:login:Penguin mailto:sage [2010/06/29(火) 04:20:14 ID:RAWQ0/Y1]
Win版ATOKにすら入っていない化学薬品名が入っているからレポートが書きやすい
小分けに変換してるからか全然変換アルゴリズムに不満は感じないな

646 名前:login:Penguin mailto:sage [2010/06/29(火) 04:20:44 ID:R344iBrK]
>>643
解決方法を指南してあげてるのだから
排除される筋合いはありませんね
それでもダメというなら
自分の状況をきちんと説明するべきです


647 名前:login:Penguin mailto:sage [2010/06/29(火) 05:59:08 ID:+TY4WfEN]
にほんおうえんで日本脳炎が出てくるのに多少の違和感もあるのは確かだが、
むしろ間違った時に救済されることを感謝したい気もします。
設定でこの機能がオンオフ出来ればもっとよいのでしょうね。

648 名前:login:Penguin mailto:sage [2010/06/29(火) 07:29:56 ID:3uyU/vOl]
男は黙ってかな入力。
ローマ字入力するやつ市ね

649 名前:login:Penguin mailto:sage [2010/06/29(火) 07:43:27 ID:R344iBrK]
どうしても辞書以外のバグと言いたい人は他の語句で再現性を証明してください

再現しない例ですが
きほんおうりょくで
基本応力で

「基本能力」は内蔵辞書にあります

650 名前:login:Penguin mailto:sage [2010/06/29(火) 08:37:33 ID:ttl/G4LE]
ていうか、急速に増えた*うぶん厨*がうんこ過ぎたんだろう。



651 名前:login:Penguin mailto:sage [2010/06/29(火) 13:38:46 ID:74Hv5Pp4]
>>650
泥舟vineのあなたには関係ないことですねw

652 名前:login:Penguin mailto:sage [2010/06/29(火) 17:59:43 ID:51I9Kix3]
バグじゃないものをバグだと強弁し続けるバグが涌いてるだけだろう。

653 名前:login:Penguin mailto:sage [2010/06/29(火) 18:02:45 ID:TiCyv9WP]
原因がわかったあともバグだと言ってるやつはどこにいるんだ?

654 名前:653 mailto:sage [2010/06/29(火) 18:04:11 ID:TiCyv9WP]
ん、なんかオレの日本語が変かな。

原因がわかったあともバグだと言ってるやつってどこにいるんだ?

655 名前:login:Penguin [2010/06/29(火) 21:15:16 ID:hXbNgCIt]
結論は日本脳炎でバグだと騒いだバカ。>>471
結局、分節句切りすら晒してない。

それに便乗して偉そうに語った日本脳炎信者w

結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw

>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…

656 名前:login:Penguin [2010/06/29(火) 21:17:15 ID:hXbNgCIt]
結論は日本脳炎でバグだと騒いだバカ。>>471
結局、分節句切りすら晒してない。

それに便乗して偉そうに語った日本脳炎信者w

結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw

>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…

657 名前:login:Penguin mailto:sage [2010/06/29(火) 21:18:46 ID:D7+eznK6]
>>655のようなmozc脳炎信者にも呆れるね

658 名前:login:Penguin mailto:sage [2010/06/29(火) 21:46:52 ID:KBAUeBKs]
ローマ字のスペル修正機能をユーザ側でオンオフできるようにするらしい
code.google.com/p/mozc/issues/detail?id=16
よかったよかった

659 名前:login:Penguin mailto:sage [2010/06/29(火) 21:59:15 ID:D7+eznK6]
みんあで→皆で
なるほどね


660 名前:login:Penguin mailto:sage [2010/06/29(火) 22:14:34 ID:KBAUeBKs]
なんあで =>
第一候補 南アで
第二候補 ナンナで

不自然な感じがするのでたぶん無効にするかな



661 名前:login:Penguin mailto:sage [2010/06/29(火) 22:23:40 ID:/XiPgLe+]
UTSUMI氏の私家製辞書、配布停止か。
本家辞書が充実してくれるのを期待するしかなさそうだね。

662 名前:login:Penguin mailto:sage [2010/06/29(火) 22:31:26 ID:D7+eznK6]
ユーザ辞書として公開してくれれば、配布停止する必要もなかった気がするんだが・・・
下手に一緒にコンパイルかけて一体化させるから勘違い野郎が増える。

663 名前:login:Penguin mailto:sage [2010/06/29(火) 22:34:21 ID:ozzcNwln]
野良パッケージを作るのはいいけど、安易にバラまくな。

664 名前:login:Penguin mailto:sage [2010/06/29(火) 22:51:45 ID:yJjHv7qA]
話題がループしているがいい加減にしてくれ。
せっかくLinuxでまともな日本語入力がフリーソフトで開発されているのに開発者側も利用者側も不快になるような書き込みばかり。
もう少し楽しい話題をしないか?

665 名前:login:Penguin mailto:sage [2010/06/29(火) 22:54:57 ID:OS6yFplC]
>>664
楽しい話題を提供してくれ

666 名前:login:Penguin mailto:sage [2010/06/29(火) 23:05:02 ID:6VqNbmTh]
>>662-663
勘違い野郎とか言う方が勘違いしてる。
バイナリの動作に不満だったらそいつが自分でソース修正してコンパイルすればいいだけの話。
その為の情報を探しているんだろうから周りがごちゃごちゃ言う必要は何もない。

667 名前:login:Penguin mailto:sage [2010/06/29(火) 23:08:26 ID:yJjHv7qA]
>>665
それもそうだな…
少なくともanthyのようなとんちんかんな文節区切りが無いのと、枯れた最小コスト法(コスト最小探索?)アルゴリズムでMS-IME程度の文節区切りを実現している点が良い。
俺は常用していてもう手放せないと感じている。

668 名前:login:Penguin mailto:sage [2010/06/30(水) 07:36:56 ID:LCHbCgjY]
>>667
RT @taku910: 憶測だけで動作アルゴリズムを
「さも専門家のように語る」Linuxユーザは本当に勘弁して欲しい。
たいてい間違ってるし。オープンソースなんだからソース読んでほしい。

アルゴリズムは語らない方がいい
>>667がソースを熟読した専門家ならいいけど
それに「MS-IME程度の文節区切り」ってのは感覚でしかないでしょ
自動テストして正解率を比較したのならあれだけど

開発者がいろんな考えを持つのは自由として、
「ですよねー」的な?RTをしている人たちばかりなのが気になった

669 名前:login:Penguin mailto:sage [2010/06/30(水) 07:45:15 ID:LCHbCgjY]
Mozcのストレステストには「吾輩は猫である」が使われている
src/data/test/stress_test/sentences.txt

src/data/dictionary/collocation.txt
「ねこをかいたい」を変換すると「猫を解体」になる

670 名前:login:Penguin mailto:sage [2010/06/30(水) 10:56:52 ID:ituddthA]
>>668
何がいいたいのだ?

「アルゴリズムはソースコード読まないなら専門家以外語るな、と開発者がtwitterでつぶやいている。」

「MS-IME程度の文節区切りってのは感覚でしか無い。自動テストして正解率を比較したのならあれだけど」
との発言は矛盾していないか?

Mozcを利用する人はソースコード読まない&専門家以外は黙って使っていろという結論も出せるぞ。
日本語入力の利用者は変換効率を感覚で「良い」「悪い」と捉えるのが普通だと思ったが。

開発者が…のくだりは読解できなかった。

Mozcのストレステストの例は、「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。

まあ専門スレだから技術中心の話題をしたいということか?
行間から俺が勝手に読み取っただけだが。



671 名前:login:Penguin mailto:sage [2010/06/30(水) 11:49:27 ID:POSxyKof]
>>670
そのmozcは公式から落としてきて、自分でコンパイルした物?
それとも、非公式な所から落とした野良ビルドの物?

672 名前:login:Penguin mailto:sage [2010/06/30(水) 12:46:27 ID:LCHbCgjY]
>>670
空行そんなに入れなくていいよ

> 枯れた最小コスト法(コスト最小探索?)アルゴリズムで
?とかいってるから、
憶測で動作アルゴリズム語ると怒りだすかもしれんよと。
まあひょっとしたら>>667が専門家でソースも読んでいて、
MS-IMEとの比較も自動テストなり何かして確かな根拠があるのかもしれないけどさ。
なんにしてもその書き方じゃまた切れるかもしれんよと

ただ基本的なことを言うと、
takuさんのコメントは1つの考え方だけど私は賛同しないし、
「そーですねー」的に?RTしてる人たちばかりで
諌めるっちゅうか違う意見を言う「専門家」が誰もいないのが
ちょっと気になったなーというか気持ち悪いなーというか

素人ユーザにしてみりゃ変換結果が全てで、
そこからアルゴリズムっちゅうか何かの憶測をするのもありきたりな話で、
それが大外れだとしてもある意味あたりまえというか、
「本当に勘弁して欲しい」とは小せえなあと。
誤解があるならドキュメント書くなりして説明すりゃいいじゃん

> 「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。
Mozc-0.11.383.102 (「ばーじょん」と入力して変換) だけど変換されないよ。
~/.mozc を削除して再起動して変換してみて。
(知らずに非公式版使ってんじゃねえかなあ)

673 名前:login:Penguin mailto:sage [2010/06/30(水) 12:51:49 ID:Rcg/NbLp]
>>672
他力本願だな。

674 名前:login:Penguin mailto:sage [2010/06/30(水) 15:33:01 ID:ukEf+Mdo]
>>672
細かいことは気にすんな。

675 名前:login:Penguin mailto:sage [2010/06/30(水) 15:37:09 ID:doYQnZyx]
ワカチコワカチコw

676 名前:login:Penguin mailto:sage [2010/06/30(水) 15:48:58 ID:r/2ENvNO]
せっかく学習したデータ消せとか軽く言うよね

677 名前:login:Penguin mailto:sage [2010/06/30(水) 16:09:17 ID:doYQnZyx]
学習辞書から通常辞書に登録出来るようになれば問題はないんだけどね。
まあ、その内実装されるでしょう。多分w

678 名前:login:Penguin mailto:sage [2010/06/30(水) 18:00:18 ID:pwJmuJKz]
なんか信者化した純正厨がうざいよね、一体どこに競合相手が居るというんだろう?
ソース読まない奴は語るなとかいう開発支援スレが2chに欲しいのならム板にでも立てたら良いと思うんだけど。

679 名前:login:Penguin mailto:sage [2010/06/30(水) 18:07:13 ID:doYQnZyx]
>>678
いやいや認識おかしいでしょ。
デフォルト以外の辞書入れて、バグだなんだと騒ぐ方がおかしいわけで。
デフォルト版で検証しないで騒ぐこと自体が間違い。
Googleの人だって、私家辞書落としてきて調べたりしてくれてるんだし、
使う人が他力本願なのが根本的に間違ってるんだよ。
ここで騒ぐことで開発が遅れてしまってるって事を少しでも考えたほうがいいと思う。


680 名前:login:Penguin mailto:sage [2010/06/30(水) 18:10:56 ID:JNIOOCJk]
>>658,660
おれも無効にするな。
ていうか、ローマ字タイプミス修正機能はいいとして、変換候補に混ぜこむんじゃなくて、サジェスト的に
表示すりゃいいのに。

>>672
「そーですねー」と思わない人は黙ってるんだと思うよ。2chじゃないんだし。

カッコとカッコ閉じの、片方を変えるともう片方を自動で合わせてくれるのが何気に嬉しい。



681 名前:login:Penguin mailto:sage [2010/06/30(水) 18:11:40 ID:pwJmuJKz]
2chやつぶやきでおかしいもなにもないじゃない。
公式に乗り込んでいって騒ぐのはバカだけど。

682 名前:login:Penguin mailto:sage [2010/06/30(水) 18:16:15 ID:KlM7I6oY]
2ch でも twitter でもおかしいものはおかしいよ。

683 名前:login:Penguin mailto:sage [2010/06/30(水) 18:16:59 ID:doYQnZyx]
開発陣だって見てると思うよここ。
じゃなかったら、コメント出すとは思えないし。
公式で初期の頃にだしてる要望とかバグ報告に回答寄せてないのあるのに
日本脳炎だけ、コメント出すって事は見てるんだよ。

684 名前:login:Penguin mailto:sage [2010/06/30(水) 18:18:27 ID:pwJmuJKz]
windowsが起動しなくなっちゃいました。 ←なにもおかしくない話、本人に原因があるだけ。

685 名前:login:Penguin mailto:sage [2010/06/30(水) 19:39:11 ID:ukEf+Mdo]
>>676
まあディレクトリをリネームして試せばいいと言いたいのだろう。行間を読んでみたが。

野良ビルドだろうが公式ビルドだろうが自前ビルドだろうが個人的にmozc日本語入力自体は使いやすいから開発者には感謝している。
いったい何を議論しているんだ?

686 名前:login:Penguin mailto:sage [2010/06/30(水) 19:41:00 ID:pwJmuJKz]
>>679
デフォルトで報告しろというのは、開発者(ハッカー)が環境を再現するため。
いじっていなければ責任があるだのそんな話のほうがおかしい。
もしなにかお仕着せたいのなら、当然そういうライセンスにしているだろう。

687 名前:login:Penguin mailto:sage [2010/06/30(水) 19:42:51 ID:TBI0xEi8]
>>685
感謝してるとかそういう話じゃないことは確か

688 名前:login:Penguin mailto:sage [2010/06/30(水) 19:50:54 ID:ukEf+Mdo]
>>687
了解。

689 名前:login:Penguin mailto:sage [2010/07/01(木) 02:04:58 ID:O1Rx4a6P]
code.google.com/p/mozc/issues/detail?id=16

690 名前:login:Penguin mailto:sage [2010/07/01(木) 17:11:32 ID:eMXnGfuN]
きぞん
が出ねぇ
既存設備
既存顧客
なんてのは出る
辞書にないだけ?



691 名前:login:Penguin mailto:sage [2010/07/01(木) 17:31:56 ID:80xQIa/W]
まず辞書を引け

692 名前:login:Penguin mailto:sage [2010/07/01(木) 17:33:01 ID:oD/W1S7f]
>>690
きそんでやってみろ

>>辞書にないだけ?
こんなこと書くと袋だたきにあうぞ
神はソースを見れるやつ以外は発言するなと言っている

twitter.com/taku910/status/17096522332

693 名前:login:Penguin mailto:sage [2010/07/01(木) 17:35:59 ID:JQPkG31l]
>>690
atokx3に切り替えれば幸せになれるよ

694 名前:login:Penguin mailto:sage [2010/07/01(木) 17:37:35 ID:oD/W1S7f]
これからはソースを見ないで発言することを禁止する
変換について文句があっても、ソースを見てアルゴリズムを理解した奴以外は
黙ってろ。わかったな

695 名前:login:Penguin mailto:sage [2010/07/01(木) 17:47:37 ID:eMXnGfuN]
なるほど既存が変換できないなんていいがかりは名誉を毀損するわけですね

696 名前:login:Penguin mailto:sage [2010/07/01(木) 17:51:28 ID:8YRnsdtB]
>>690
> 「きぞん」と読むのは、本来は誤り。

なんだってよ。
ttp://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%81%8D%E3%81%9D%E3%82%93&dtype=0&dname=0na&stype=0&pagenum=1&index=05088804253700

ついでにmozc r31でてる。
相変わらず何が変わったかわからないログ。
ソース読めってことですね、失礼しました。

697 名前:login:Penguin mailto:sage [2010/07/01(木) 17:51:46 ID:u6t0dJ7U]
きぞん出来ぞん

698 名前:login:Penguin mailto:sage [2010/07/01(木) 17:52:58 ID:u6t0dJ7U]
きぞんで既存
・・・あれ?

699 名前:login:Penguin mailto:sage [2010/07/01(木) 18:02:00 ID:u6t0dJ7U]
>>696
dictionary1.txt:きぞんせつび 2234 2234 7728 既存設備
dictionary1.txt:きぞんこきゃく 2234 2239 7298 既存顧客
dictionary1.txt:きぞんじゅうたく 2234 2239 7271 既存住宅
dictionary1.txt:きぞんてんかぶつ 2234 2318 7746 既存添加物

じゃあこの辺は削除でおk?

700 名前:login:Penguin mailto:sage [2010/07/01(木) 18:09:37 ID:8YRnsdtB]
>>699
そーだねー。

ついでに既出だけど、
dictionary0.txt:ふいんき 2239 2239 5645 雰囲気
も削除してもらったほうがいいよねー。
ネタで使えないから。

ま、決めるのはオレじゃないけど。



701 名前:login:Penguin mailto:sage [2010/07/01(木) 18:23:32 ID:WtGrFZjB]
「きぞん」も慣用読みとして広まってるから
別に変換できてもいいんじゃない。

702 名前:login:Penguin mailto:sage [2010/07/01(木) 18:24:08 ID:jk6rV2dr]
mozc (0.12.402.102) lucid; urgency=low

* Ver. 0.12.402.102 on 2010-06-30

-- Yasuhiro Matsuda <mazda> Wed, 30 Jun 2010 13:22:54 +0900

mozc (0.11.383.102) lucid; urgency=low

* Ver. 0.11.383.102 on 2010-06-16

-- Yasuhiro Matsuda <mazda> Wed, 16 Jun 2010 15:39:33 +0900

mozc (0.11.365.102) lucid; urgency=low

* Ver. 0.11.365.102 on 2010-05-25

-- Yasuhiro Matsuda <mazda> Tue, 25 May 2010 16:54:03 +0900

mozc (0.11.354.100) lucid; urgency=low

* Ver. 0.11.354.100 on 2010-05-17

-- Yusuke Sato <yusukes> Mon, 17 May 2010 19:22:54 +0900

mozc (0.10.288.102) jaunty; urgency=low

* Ver. 0.10.288.102 on 2010-03-09

-- Hiroyuki Komatsu <komatsu> Tue, 09 Mar 2010 16:01:11 +0900

changelog ブッ飛んでんなぁ…

703 名前:login:Penguin mailto:sage [2010/07/01(木) 19:19:55 ID:dA7ZCbkv]
ふいんき→雰囲気
何故か変換出来るのに変な基準だ

704 名前:login:Penguin mailto:sage [2010/07/01(木) 21:23:58 ID:QNOaF+w5]
>>692
『憶測だけで動作アルゴリズムを「さも専門家のように語る」』のがダメなんだろ、
動作アルゴリズムを語るならソース読めってことだ。


705 名前:login:Penguin mailto:sage [2010/07/01(木) 23:05:29 ID:8YRnsdtB]
>>704
それネタにマジレスってやつじゃないのか。

706 名前:login:Penguin mailto:sage [2010/07/01(木) 23:48:10 ID:NXCs2WvM]
ローマ字スペル修正は、ユーザがすべてをオンオフできるんじゃないんだな。
無効になるのはshift+左右で区切りを変更した時だけ。

これはOK。
nihonnouenn => shift+右 => にほんお|うえん

これはNGのまま。
nannade =>
第一候補 南アで
第二候補 ナンナで

必死で「ローマ字スペル修正を無効にする」の項目を探しちまった

707 名前:login:Penguin mailto:sage [2010/07/01(木) 23:58:29 ID:8YRnsdtB]
>>706
> 無効になるのはshift+左右で区切りを変更した時だけ。

code.google.com/p/mozc/issues/detail?id=16
ではそういうことになってる。
「r32でやったお」と書かれてるが、実際はr31。

708 名前:login:Penguin mailto:sage [2010/07/01(木) 23:59:06 ID:NXCs2WvM]
辞書は変更ないみたい?
朝昇竜
ごご

郵便番号辞書がちゃんと作られるようになったのと、
credits_*.html が追加されたのと、
バイナリの生成先がout_linuxになったのと、
xmlファイルの生成位置が変わったのと、
/lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、
ぐらいか。

debian/ubuntu以外でパッケージ作る人は毎回振り回されるのお

709 名前:login:Penguin mailto:sage [2010/07/02(金) 00:08:36 ID:rmeJlg4T]
r33になってるし

710 名前:login:Penguin mailto:sage [2010/07/02(金) 00:08:53 ID:89cUsAe4]
>>707
そう。issue 16読み直したらそういうことかとがっかりした。
あそこ反応遅いし下手なこと言ったら揉めそうだしなあ



711 名前:login:Penguin mailto:sage [2010/07/02(金) 00:18:23 ID:89cUsAe4]
けっ構な異気負いで飛んでった
結構な勢いで飛んでった

賢い時とひどい時の差が激しいなあ
間隔が空いたんで辞書に大変更があるかと期待していたんだが

712 名前:login:Penguin mailto:sage [2010/07/02(金) 00:33:47 ID:c2/62KOP]
>>708
ググッても朝昇竜ってのが出てくるからな。
馬鹿が大勢いるようだ。
馬鹿は死ね

713 名前:login:Penguin mailto:sage [2010/07/02(金) 00:35:33 ID:nMrk595a]
起き上がり昇龍拳のことじゃね?

714 名前:login:Penguin mailto:sage [2010/07/02(金) 01:13:12 ID:fNK5e64Z]
>>708
> /lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、

/usr/lib/ibus-mozc/ibus-engine-mozc のままじゃね?

>>709
だからそれはwikiの更新だと何度言えば (ry

715 名前:デムパゆんゆん@ルーピーズ mailto:sage [2010/07/02(金) 01:15:03 ID:nEU/qQll]
朝昇竜
朝立ちが収まらず嫁のパンツ引きずり下ろすんだろ
若い夫婦によくあること

716 名前:login:Penguin mailto:sage [2010/07/02(金) 16:26:08 ID:6ZhhasPq]
svn繋がらねぇ…

717 名前:login:Penguin mailto:sage [2010/07/02(金) 18:56:58 ID:tmua+Inw]
こっちは
朝青龍
朝青龍明徳
しか出ない

718 名前:login:Penguin mailto:sage [2010/07/02(金) 23:01:29 ID:NGCZVs6o]
>>717
疑問に思うならソースを読め


719 名前:login:Penguin mailto:sage [2010/07/03(土) 00:02:35 ID:fNK5e64Z]
朝昇竜も朝青龍も辞書にはない。
朝青龍、朝青龍明徳はもはやアンタッチャブルな雰囲気の例の人名辞書にある。


720 名前:login:Penguin mailto:sage [2010/07/03(土) 00:02:52 ID:DSeRllmA]
SCIMなんかいまさらどうでもいいのに。もったいない。



721 名前:login:Penguin mailto:sage [2010/07/03(土) 03:23:29 ID:mJCm1+DY]
vineユーザはビルドの鬼というイメージがあるから、詳しい人が多いだろう。
ubuntuユーザの線がつよいな、間違えて喚いているのは。

722 名前:login:Penguin mailto:sage [2010/07/03(土) 03:46:57 ID:osDO+o7j]
ソース読めと怒られそうだが質問させてください
単語のコストを15000ぐらいの低めにすると変換候補に出てこない場合があるのですが
いくら以上だったら確実に候補に出てくるのでしょうか?

723 名前:722 mailto:sage [2010/07/03(土) 03:51:54 ID:osDO+o7j]
例えば私家版辞書の
ぞうとう 2239 2239 15273 増頭
が出てきません。


724 名前:login:Penguin mailto:sage [2010/07/03(土) 08:03:34 ID:Gayxgvn6]
>>721
たまにはgentooさんのことも思い出してあげてください

725 名前:login:Penguin mailto:sage [2010/07/03(土) 09:30:48 ID:/RusR1qf]
>>722
「贈答」のスコア+100ぐらいだったら出るんじゃないですか。
憶測で語るなと怒られそうだけど。
自分で1000ずつスコアを減らして試してみてください。
10数回やれば答えが出ると思いますよ

誰の私家版辞書か知りませんが公式辞書以外を語ると
やっぱりGoogleさんが苦い顔をするので勘弁

726 名前:login:Penguin mailto:sage [2010/07/03(土) 11:29:21 ID:ijDcKIcn]
人名辞書は増やすほどクソ変換が増える。
歴史辞典に載っているクラスの有名人だけでいい。
夜露死苦みたいな当て字のDQN人名なんか絶対いらね。

727 名前:login:Penguin mailto:sage [2010/07/03(土) 13:29:07 ID:i0Hzsx4Q]
>>725
巫山戯んな。そういうのは日本語変換の話をわざわざ英語で話すような場所にでも書いとけ。
公式ったってそもそも単なるIPADICの加工品で別に純正でもなんでもないだろ。
しかしICOT条項とやらは関係しないのかねえこれ。

728 名前:login:Penguin mailto:sage [2010/07/03(土) 17:05:55 ID:xhrL1imB]
標準辞書に入っている
くらかろ 2680 2680 9957 蒙かろ
つよう 2710 2710 12383 勍う
けっか 2234 2234 11491 缺課
も変換できないな。他にも沢山ある。

別の同音の言葉が沢山あっても変換できる場合もあれば
同音の言葉がないのに変換できない場合もある

729 名前:login:Penguin mailto:sage [2010/07/03(土) 17:22:24 ID:Gayxgvn6]
>>727
私家版辞書で使ってる奴は、それを作った奴のところで話をしろというだけの話だと思う
私家版辞書の変換候補の登録順位の問題までgoogleに押し付けるのはダメだろ

730 名前:login:Penguin mailto:sage [2010/07/03(土) 17:31:13 ID:i0Hzsx4Q]
>>729
ここは林檎屋でも検索屋でもないよ。
それともキャッシュでここを見ていて勘違いでもしてんの?



731 名前:login:Penguin mailto:sage [2010/07/03(土) 19:26:06 ID:6kwkatsd]
>>728
他に優先度が強烈に高い単語があると、
多少のことでは他の単語がでなくなるね。
まあバランスを見て候補数を適当に絞るとそういうことになるんだろうね、
って推測で語るなって言われそうだが

732 名前:login:Penguin mailto:sage [2010/07/04(日) 17:44:55 ID:rTB+DtcV]
r34 uim-mozcで
してみるとか
と打とうとすると、なぜか途中でmozcが死亡する。
ので旧ビルドに戻した。

733 名前:login:Penguin mailto:sage [2010/07/04(日) 17:55:58 ID:/oZBUpT3]
うちでは問題ないな。

734 名前:login:Penguin mailto:sage [2010/07/07(水) 02:21:37 ID:gfyG56xq]
質問。
uim-mozcでユーザー辞書ってどう反映させるの?
/usr/lib/mozc/mozc_tool --mode=dictionary_tool で辞書ツールに単語を
登録しても、肝心の uim-mozc の変換候補に反映されない……

735 名前:login:Penguin mailto:sage [2010/07/07(水) 09:54:08 ID:LbLHp4YO]
>>734
うちでは問題ないな。

736 名前:login:Penguin mailto:sage [2010/07/07(水) 10:59:15 ID:7/lcNwPK]
サーバが二つインスコされちゃってるとか?

737 名前:login:Penguin [2010/07/07(水) 12:30:25 ID:5hffJYd6]
mozc_serverを再起動

738 名前:login:Penguin mailto:sage [2010/07/07(水) 13:04:51 ID:0T6OZxc7]
辞書の登録漏れかな?
獲る/とる がない。

739 名前:login:Penguin mailto:sage [2010/07/07(水) 13:51:17 ID:LbLHp4YO]
正しい日本語では、「獲る」の読みは「える」。

740 名前:login:Penguin mailto:sage [2010/07/07(水) 13:57:23 ID:dhaU/Avr]
>>739
「とる」が間違いとも言えないんじゃね。
dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%82%C6%82%E9&dtype=0&index=15681013538700
には「「穫る」「獲る」とも書く」とある。



741 名前:login:Penguin mailto:sage [2010/07/07(水) 15:48:00 ID:arkDi++C]
漢字源には

〔音〕カク〈クヮク〉
〔訓〕える
とあるな。

742 名前:login:Penguin mailto:sage [2010/07/07(水) 15:53:30 ID:ibgrwrRp]
獲(と)るはまあ、当て字だろうけれども、
Mozcに関して正しい日本語っていうのは、ギャグにしか聞こえないなw

743 名前:login:Penguin mailto:sage [2010/07/07(水) 16:21:44 ID:eoJolC+Y]
ところで、日本脳炎は治ったの?

744 名前:login:Penguin mailto:sage [2010/07/07(水) 16:24:21 ID:CFzMSs9E]
治すモノじゃないから

745 名前:login:Penguin mailto:sage [2010/07/07(水) 17:32:57 ID:2tU+hFGz]
正しい日本語と聞くと笑いがこみ上げてくるんですが

746 名前:デムパゆんゆん@ルーピーズ mailto:sage [2010/07/07(水) 17:38:03 ID:Nq72GyjF]
そのこみあげる熱いエネルギーをもずくにぶちまけるんだ

747 名前:login:Penguin mailto:sage [2010/07/07(水) 17:59:59 ID:x0DmD9TD]
もずく酢食いたくなったな

748 名前:デムパゆんゆん@ルーピーズ mailto:sage [2010/07/07(水) 18:04:56 ID:Nq72GyjF]
お酒は温めのカンでいいか

749 名前:login:Penguin mailto:sage [2010/07/07(水) 18:52:04 ID:LbLHp4YO]
>>740
うん、わかってて書いてます。
>>742 と同感で、皮肉を込めて。

750 名前:login:Penguin mailto:sage [2010/07/07(水) 18:54:32 ID:dhaU/Avr]
そういう皮肉はいりません。



751 名前:login:Penguin mailto:sage [2010/07/07(水) 20:24:07 ID:DUPoVHAZ]
文系はパソコンを使うな
pc12.2ch.net/test/read.cgi/tech/1240851827/

752 名前:login:Penguin mailto:sage [2010/07/07(水) 21:20:30 ID:gfyG56xq]
>>735-737
ごめんなさい。
uim を入れ直したときに、mozc が unregisuter されて
いつの間にか anthy になってたというオチでした。
そら反映されんわな……

753 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 18:44:57 ID:fnG/9xmH]
uim-mozcをEmacsで使うと、変換候補のリスト表示が最初のページのままで次のページに
切り替わらないな。変換自体はちゃんと次ページ以降の候補が選べるんだけど。

754 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 18:55:41 ID:oYxx0F+E]
>>753
uim 1.5.7 のリリースバージョンだとその症状だった。
svn 先端では修正されてるはず。

755 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 19:57:06 ID:fnG/9xmH]
>>754
ヘー、uimの問題なん?
Anthyだと問題ないんだけど。
ちょっとHEADでやってみっか。
サンクスコ。

756 名前:login:Penguin mailto:sage [2010/07/12(月) 20:28:19 ID:jl3YeuYq]
r35。
変更点ですか?
モードアイコンのモード表示に変更があったようですけど、
その他のたくさんの修正点はソースを見てください。

757 名前:login:Penguin mailto:sage [2010/07/14(水) 14:32:21 ID:KzaUL5HE]
UTSUMIさん辞書が再び公開されてた。ただし名詞と人名辞書は再配布禁止で。
公開停止にしたことでUTSUMIさん辞書搭載版mozcがゾンビ状態で出回ってどっかでトラブったんかな。
人名辞書はユーザ辞書にして重宝してたので個人的にはありがたい。
システム辞書に入れる気はないけど。

758 名前:login:Penguin mailto:sage [2010/07/16(金) 14:58:58 ID:3jcOIbqL]
Google日本語入力とMozcの関係は、Google chromeとchromiumの関係と同じ?

759 名前:login:Penguin mailto:sage [2010/07/17(土) 11:49:53 ID:Fp+heB0t]
う、うん……(´・ω・`)

760 名前:login:Penguin [2010/07/24(土) 14:28:32 ID:1IbcTVQB]
zh zj zk zl って打ってみてよ



761 名前:login:Penguin [2010/07/24(土) 14:55:40 ID:HvKMLpfC]
>>758
過去 debian で firefox 仕様にしていたら
"check off"[update] でも seamonkey に成る…
あちら系の関係ですか?

762 名前:login:Penguin mailto:sage [2010/07/24(土) 18:55:08 ID:9gH7KxjX]
それとは無関係という関係ではないだろか

763 名前:login:Penguin [2010/07/24(土) 19:15:44 ID:HvKMLpfC]
そうですか…
当時 directory 把握は error を見ながら訂正したのですが…

764 名前:login:Penguin mailto:sage [2010/07/28(水) 20:29:16 ID:D6c+m0Eo]
r36






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<188KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef