[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 02/03 05:26 / Filesize : 152 KB / Number-of Response : 638
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

mozc / Google 日本語入力 #2



1 名前:login:Penguin [2010/10/12(火) 11:28:32 ID:vOG98dtl]
code.google.com/p/mozc/

関連URI
sourceforge.jp/magazine/10/05/11/0335246
googlejapan.blogspot.com/2010/05/google_10.html

過去ログ
#1 hibari.2ch.net/test/read.cgi/linux/1273719530

206 名前:login:Penguin mailto:sage [2010/11/02(火) 23:20:30 ID:2Y+xahQy]
>>205
こんなところで報告しても、何にも起こらないと思うけど。

207 名前:login:Penguin mailto:sage [2010/11/03(水) 02:31:53 ID:91YapOGy]
>>206
それを言ったらこのスレの存在価値がなくなるので
適当に報告しあったらいいじゃん


208 名前:login:Penguin mailto:sage [2010/11/03(水) 03:09:05 ID:8wL0PaU+]
辞書にある誤りを見つけるたびにいちいちissueとしてあげるって、めんどくさいよなあ。
AnthyWikiの誤変換晒しあげ的なのがあればいいんだけどね。

うぉ、むかし「誤変換」が辞書になかったと思うんだけど、いまはあるんだな。

209 名前:login:Penguin mailto:sage [2010/11/03(水) 07:47:53 ID:RdavSDk6]
「二重になっている」と打ちたいんだが、
「二十二なっている」になる。
rewriterが強権発動してるのかな。

>>205
ライセンス問題って、
基地予定地に県外の非土地所有者が乗り込んでくるのと
似たような違和感を覚える。
本人は善意なんだろうけど、
なんつうかトラブル好きなんだなあと。

個人的には、
表記と読みは公知の事実で他に書きようがない。
ここにGPL主張するのは無理がある。
大量に入力する手間はわかるし感謝もしている。
しかし例えば自分が5000語入力したとして、
それの表記読みを誰かが流用したからといって
別になんとも思わない。
謝辞を書いてくれたら嬉しいな、という程度。
ja.wikipedia.org/wiki/著作権
> 五十音順に人名と電話番号を配しただけの電話帳は著作物ではない
五十音順の読みと表記もそんなもんだと思うけどね。

法律語りたがる人もいるんだろうが、
模擬裁判みたいなもので、結論でても効力がない。
結局はユーザが自分で判断するしか。

Mozcの中の人が「GPL辞書のかけらでもダメだ」と言うなら
それはそれでひとつの考え方。
Googleなら人もカネもあるからどこかの辞書を買って、
そいつを基本に据えるのもいいんじゃない。
大事なのは今の辞書じゃダメってことで、どう変えるかは中の人しだい。

210 名前:login:Penguin mailto:sage [2010/11/03(水) 08:02:34 ID:pGq1jz45]
中の人言わく、
辞書の誤エントリを直すのは大変だから、
誤エントリの報告は全部スルーですよ。
おまえら誤変換があったら全部報告しろ。

ようするに誤変換データを学習データにして
辞書の自動生成がやりたいってことだろ。
ユーザーの利便よりも、自分の研究が優先ってことだ。
おまえら、どこまで付きあってやるんだ?

211 名前:login:Penguin mailto:sage [2010/11/03(水) 11:37:03 ID:79jpaC7f]
>>209
法的にメチャメチャなこと言ってると思うが、気持ちは分かる

>>210
あれは結局のところ報告はうぜーから黙ってろと言っているわけだよな

212 名前:login:Penguin mailto:sage [2010/11/03(水) 12:08:46 ID:+mHxq1R3]
気にいらないならfolkすればいいじゃない

213 名前:login:Penguin mailto:sage [2010/11/03(水) 13:42:49 ID:pGq1jz45]
>>211
辞書のエントリなんざチマチマとメンテしてられっかよ (#ノ`Д´)ノ≡≡≡≡≡≡≡┻━┻
って意味だろうな。

214 名前:login:Penguin mailto:sage [2010/11/03(水) 14:03:57 ID:8wL0PaU+]
報告来たのを一々馬鹿丁寧に対処しないからそこんとこよろしく、
って予防線はってるだけでしょ。



215 名前:login:Penguin mailto:sage [2010/11/03(水) 14:26:39 ID:pGq1jz45]
>>214
ちがうよ。ちゃんと発言読んだ?
ttp://twitter.com/#!/taku910/status/29487577851
ttp://twitter.com/#!/taku910/status/29489974332

216 名前:login:Penguin mailto:sage [2010/11/03(水) 14:32:32 ID:fPaYoC38]
行間から「アホなお前らのやり方に付き合うつもりが無い」という感情が
滲み出ている文章ですね

217 名前:login:Penguin mailto:sage [2010/11/03(水) 15:07:45 ID:v6dh9rjS]
>>215
けど、twitterで呟いたのがgoogle 公式見解になるのは解せないな。

218 名前:login:Penguin mailto:sage [2010/11/03(水) 20:06:47 ID:N2m9/6JT]
言われるままに修正してると他に影響が出ることがあるからでしょ
いきなり、完成品を要求するのはどうかと

219 名前:login:Penguin mailto:sage [2010/11/03(水) 20:58:32 ID:/fIoZ3nn]
>>209
君は他人事かも知れないが、
リリースするエンジニアにとっては大問題だろ。
辞書のライセンス汚染は。

220 名前:login:Penguin mailto:sage [2010/11/03(水) 21:17:29 ID:jSq5Ix4/]
UTUMIさんは私家版辞書を引っ込めたのか。

221 名前:login:Penguin mailto:sage [2010/11/03(水) 22:05:34 ID:fPaYoC38]
今回、アップデート遅いね


222 名前:login:Penguin mailto:sage [2010/11/04(木) 00:33:04 ID:Zz4rplSe]
www.google.com/support/ime/japanese/?hl=ja
これの誤変換の不具合ページを消したらどうでしょうか?

223 名前:login:Penguin mailto:sage [2010/11/04(木) 00:44:25 ID:c6PEi/a/]
>>222
なぜ?

224 名前:login:Penguin mailto:sage [2010/11/04(木) 01:59:26 ID:gfgWDteS]
>>220
そして新しい試みの整理辞書は、サイズがオリジナルの半分以下になってんね。
ちらっとなめてみただけでも、無駄と思えるデータがずいぶんあるんだなと。
無駄じゃないデータもちょいちょいおとしてるっぽいけど。



225 名前:login:Penguin mailto:sage [2010/11/04(木) 05:57:49 ID:tasiiFno]
>>219
bsdライセンスぽくしたのは正解だとおもうけどね。好きに使えるから。それがいやならコンフリクトするライセンスにかえたほうがよい。

226 名前:login:Penguin mailto:sage [2010/11/04(木) 08:03:52 ID:siEagweF]
openlab.ring.gr.jp/skk/wiki/wiki.cgi?page=SKK%BC%AD%BD%F1#p11
>SKK-JISYO.geo は、日本郵政公社(以前は郵政省 → 郵政事業庁) のページにあるデータをもとに
> SKK 辞書形式の「地名辞典」に加工したものです。
>2004 年 12 月 12 日現在、 www.post.japanpost.jp/zipcode/dl/readme.html によれば、
>"日本郵政公社は著作権を主張しません。自由に配布していただいて結構です"とあります。
>同社のご厚意に感謝しつつ、自由に配布できるよう、明示的に GPL を適用しました。

>この辞書については、DDSKK独自の加除や加工がかなり加えられており、
>単純なコンバートとは性質をやや異にしています。

うう、GPL汚染怖ぇ、、

227 名前:login:Penguin mailto:sage [2010/11/04(木) 14:43:40 ID:Zz4rplSe]
「"加工した辞書も著作権を主張しません。自由に配布していただいて結構です"」
と言ってくれたらいいのにな

228 名前:login:Penguin mailto:sage [2010/11/04(木) 14:52:35 ID:BuJOJLo8]
>>227
著作権は放棄出来ないので無理
あと漢字の読み自体には著作権は発生しないけど、
集合体である辞書には発生するんじゃなかったかしら

229 名前:login:Penguin mailto:sage [2010/11/04(木) 14:55:35 ID:xLTlo5hi]
>>228
放棄って言ってないじゃん。

230 名前:login:Penguin mailto:sage [2010/11/04(木) 15:12:08 ID:wqiVPxGa]
>>228
著作人格権の以外の著作権上の権利は放棄できるよ。財産権だからね。

231 名前:login:Penguin mailto:sage [2010/11/04(木) 17:21:49 ID:R/cz4t0b]
r49
googlejapan.blogspot.com/2010/11/google-01352310x.html


232 名前:login:Penguin mailto:sage [2010/11/04(木) 17:50:18 ID:jvtMYlYT]
>>226
勝手にライセンス適用なんてできるの?ライセンスの変更にあたるよね?

233 名前:login:Penguin mailto:sage [2010/11/04(木) 17:55:44 ID:xLTlo5hi]
>>232
郵政公社が文句言わないならいいんじゃない?

234 名前:login:Penguin mailto:sage [2010/11/04(木) 17:58:18 ID:sCoOiEkM]
「女子高生」は直ったな
麻雀用語がえらく充実したけど要望でもあったのか



235 名前:login:Penguin mailto:sage [2010/11/04(木) 18:51:51 ID:wqiVPxGa]
>>232
新規に追加した分は著作権が主張できる。

↓以下の部分については、改変の程度による。
>この辞書については、DDSKK独自の加除や加工がかなり加えられており、
>単純なコンバートとは性質をやや異にしています。


236 名前:login:Penguin mailto:sage [2010/11/04(木) 19:34:04 ID:1tiop6Bm]
>>226
> >同社のご厚意に感謝しつつ、自由に配布できるよう、明示的に GPL を適用しました。

元データをそのまま転載し、加除の差分データとSKK形式への変換スクリプトを
あわせて配付すりゃいいものを。
詳しい説明なしでライセンス変更って、なんというか、やったもん勝ちっていうか。

237 名前:login:Penguin mailto:sage [2010/11/04(木) 20:26:25 ID:X0RFj6KQ]
またゴミみたいな登録が追加されてる。
也まん 2306 2235 7370 也マン
也みち 2235 2314 7839 也みち
也みつ 2306 2235 7948 也みつ
也りつ 2306 2235 7949 也りつ

言葉として変なのはもちろん、
読み仮名が漢字って。

あとおんなじ単語追加してる。品詞も読みも表記も同じ。
重複確認してないのか。
さいずとう 2235 2314 6411 サイズ等
+さいずとう 2235 2314 6822 サイズ等

反面、残してても良さそうな単語は削られてる。
-さいだいていいん 最大定員
-さいだいとうろくすう 最大登録数
-さいたまめいぶつ 埼玉名物
-じょしぶいん 女子部員
-じょしやきゅう 女子野球
-じょじんき 除塵機
-じょせいかんごし 女性看護師
-じょせいけい 女性系

「じょしこうせい」と「じょしだいせい」は直ってる。

そしてやっぱり何じゃこりゃ的なものが自動登録。
+じょじくつとう 女児靴盗
www.google.com/search?&q="女児靴盗"
5件しかないすけど、産経から引っ張ってるのかな。

たぶんNGワードフィルタに通しただけであとは自動登録なんだろう。

238 名前:login:Penguin mailto:sage [2010/11/04(木) 20:39:39 ID:X0RFj6KQ]
id.defがごっそり変わってるから、
以前の公式/私家版辞書を使いたい場合は
mozc-0.13.499.102/data/dictionary/
から
boundary.txt connection.txt id.def
と辞書全部を上書きすればいいのかな。
(dictionaryが 09.txt までないときは split して作る。)

id.defは連番だから、
1個変更されるとそれ以降は全部変更になってしまう。
500番台は動詞、
1000番台は名詞、
みたいにすれば変更の幅が小さくなるのに。

毎回品詞記号を変更する辞書ってどうなのさ…
せめて「名詞, 一般」みたいな汎用枠は数字を固定してほしいなあ。


239 名前:login:Penguin mailto:sage [2010/11/04(木) 21:07:15 ID:X0RFj6KQ]
なんでこれを削ったんだろ。方言?
-かえしとく 返しとく

「IMEは総合格闘技」と言ったらしいけど、
基礎練習せずに派手な技をやりたがる人みたい。
首以下が豆腐で出来てる。

これはさすがに手で消したか。
-かえらにゅうせき カエラ入籍

何すかこれは。
+かおかろ 加オカロ

これ?何のことかわからん。
> AKB48のたかみなと秋元才加(オカロ)

こういうことか。
> ファンの間では「オカロ」と呼ばれることもある。
> これは「才加」が「オカロ」と読めることに由来

こわいよ。
+かおでめ 顔で目

なぜ削った。
-かかくさいと 価格サイト

これは誤変換起こしそう。
+かかくでて 価格で手

ろくにチェックせず出して、
問題起きたらあとから直す、ってやりかただもんなあ。
報告なんて無駄。やりかたがダメなんだもん。

240 名前:login:Penguin mailto:sage [2010/11/04(木) 21:27:00 ID:qjny2BbR]
どこかに書いてあったけど、これはマジで日本語を壊すために作ってると思う。
文句言うくらいなら使わないほうがいいんじゃね?
おとなしくatok使った方が精神的にも時間的にも得だよ。

241 名前:login:Penguin mailto:sage [2010/11/04(木) 21:27:27 ID:c6PEi/a/]
辞書の不備を指摘する場合、どうやってそれを見つけたか
の情報も添えるといいんじゃないか。差分を眺めていて
たまたま見つけた、とか。読み仮名に漢字が含まれている
とかの指摘はいいね。次から開発者がチェックできるだろう。
ユーザーが眺めてて偶然見つけたようなのは、開発者が全部
チェックできるわけもなかろう。

242 名前:login:Penguin mailto:sage [2010/11/04(木) 22:02:40 ID:hTWac2QG]
ま、自然言語みたいな生物が関わるモノの自動生成なんて土台無理な話ですな
地道に一つ一つ自分の手と目で確認する職人気質の人でないとメンテは無理

243 名前:login:Penguin mailto:sage [2010/11/04(木) 22:22:45 ID:X0RFj6KQ]
>>241
> 次から開発者がチェックできるだろう。
今に始まったことじゃないはず。
読みが日本語になってない登録についてはIssuesで出てたと思う。
つまりは >>187-188 >>192 ってこと。
「じょしたかお」はさすがに直したようだが。

> どうやってそれを見つけたか
釈迦に説法じゃね?
見つける気があるならすぐ見つかる。
辞書がゴミだらけになってますよ、というのは
Issuesでさんざん出てるし。

> 差分を眺めていてたまたま見つけた
差分から見つけたけど、
「たまたま」なんてレベルじゃねえ。
「かえ-かか」だけで >>239 なんだぜ。


244 名前:login:Penguin mailto:sage [2010/11/04(木) 22:43:25 ID:X0RFj6KQ]
もっというと、
「かえ-かか」の「新規差分」だけでこれなわけで。
辞書全体だと1からやり直したほうがいいレベル。




245 名前:login:Penguin mailto:sage [2010/11/04(木) 23:26:49 ID:Zz4rplSe]
>>Google 日本語入力開発版をお使いの皆さま、いつも Google 日本語入力を
>>よりよくするためにご協力いただきありがとうございます。
>>今後とも、みなさんと共に Google 日本語入力を、より使いやすい製品に
>>育てていきたいと思っています。お気づきの点がありましたら、
>>ぜひヘルプフォーラムからお知らせください。
>>みなさんの貴重なフィードバック、お待ちしています。

と書いてある所に >>215 の文を追加して欲しい


246 名前:login:Penguin mailto:sage [2010/11/05(金) 04:44:49 ID:z3Qc1njF]
>>245 >>215 >>210
おお、そんな書き込みがあったのか。
もうたくちゃんの発言見てないので助かった。

報告していくつかの誤変換は直ったけどさ、
もう今後は関わりたくねえ。
ノーチェックだからキリがないし。

やっぱりこういう人が頑張らないとね。
twitter.com/haroperi/status/28516241859
> mozcは銀河一のIMEになる。


247 名前:login:Penguin mailto:sage [2010/11/05(金) 04:48:58 ID:UGkOAlVL]
元々、IMEという略語はMicrosoft社における用語であり、広く文字入力のためのシステムを表す一般名称はインプットメソッドエディターである。
ja.wikipedia.org/wiki/IME

248 名前:login:Penguin mailto:sage [2010/11/05(金) 12:04:03 ID:hskUUW2p]
まあ一般的には「インプットメソッド」だろうな。
昔は「フロントエンドプロセッサー」って呼び方もあった。

249 名前:login:Penguin mailto:sage [2010/11/05(金) 12:12:22 ID:BgtZf8s5]
じゃあ俺はインサートプッシーメソッドで行くわ

250 名前:login:Penguin mailto:sage [2010/11/05(金) 14:33:21 ID:8yokwCmI]
わーすげーおもしれー

251 名前:login:Penguin mailto:sage [2010/11/05(金) 15:12:18 ID:jGEHrHRa]
(´・д・`)

252 名前:login:Penguin mailto:sage [2010/11/05(金) 15:20:12 ID:PnB8HDC9]
やっぱり今時Linux使ってるのっておっさんばっかなんだろうな
ギャグがおやじだしな
JSやJCが使ってたらもうちょっとこの界隈も活気づくだろうにな

253 名前:login:Penguin mailto:sage [2010/11/05(金) 16:30:38 ID:/G8gqY25]
baiduみたいに女子に媚びた方が人気が出るよ
Google日本語入力みたいなオタク向けは流行らない

ime.baidu.jp/type/onegai/
ameblo.jp/manami-moriyama/entry-10573387344.html

254 名前:login:Penguin mailto:sage [2010/11/05(金) 22:45:46 ID:HdpSEJFb]
まずはもずくたんを擬人化しつつ、オサレ系の雑誌で特集組んでもらうところから始めないとな
現代の日本語文化を創ってるのはオタクとギャルだから



255 名前:login:Penguin mailto:sage [2010/11/06(土) 00:33:07 ID:GG/YTsNk]
mozc,Google日本語入力に奇妙なマーケティング戦略は要らん

256 名前:login:Penguin mailto:sage [2010/11/06(土) 06:43:14 ID:Z8HKTDbt]
>>253
この時期に中国系の企業のを使う気にならない。
非国民な宣伝すんなクズ野郎。

257 名前:login:Penguin [2010/11/06(土) 08:49:00 ID:G3N3VGnM]
民主党とそれを応援してるバカどもがそもそも非国民・売国奴扱いなんですがね

258 名前:login:Penguin mailto:sage [2010/11/06(土) 08:50:09 ID:P346/uTp]
>>256-257
キチガイは出ていけ。二度とくるな。


259 名前:login:Penguin mailto:sage [2010/11/06(土) 10:42:26 ID:NGJU7c23]
>>226
> >2004 年 12 月 12 日現在、 www.post.japanpost.jp/zipcode/dl/readme.html によれば、
> >"日本郵政公社は著作権を主張しません。自由に配布していただいて結構です"とあります。
> >同社のご厚意に感謝しつつ、自由に配布できるよう、明示的に GPL を適用しました。

日本郵便のページではこうなってる。
>[使用・再配布・移植・改良について]
>郵便事業株式会社は著作権を主張しません。自由に配布していただいて結構です。

SKK形式データは、もとデータの「使用・再配布・移植・改良」をご自由にという趣旨と
相反するGPLを適用している。
そのうえ、GPLを適用するうえで著作権者の承諾を得ていない。

こんなことって許されるの?

> >>232
> 郵政公社が文句言わないならいいんじゃない?

立場が逆だったらきっと文句を言いまくるだろうところが怖い。

この「漢字と読み」もこの「漢字と読み」もSKK辞書と同じじゃないか、
流用した辞書は全部GPLになるんだぞ〜
え? 流用はしてない、って?
それなら、GPLに違反してないかはっきりさせるために
とにかくそっちの辞書を公開しろ、辞書を組み込んだモジュールも公開しろ、
なんでもいいからとにかく関連ソースを全部公開しろ〜
さもなくば訴えるぞ〜〜

mozcがSKK由来のデータに神経質になるのは分かるような気がする。

260 名前:login:Penguin mailto:sage [2010/11/06(土) 11:34:35 ID:8RkC6RsQ]
追加の制限を禁止している訳ではないからねえ
アンチGPL派がよく言う意味で「自由に」出来るのでないの

261 名前:login:Penguin mailto:sage [2010/11/06(土) 14:20:57 ID:Q0TzkZLh]
UTUMIさん、このスレ見てるようだから忠告しておくけど

>jinmei/ meisi/ はGPLとします。
>MozcのライセンスはBSDなので、
>jinmei/ meisi/ を混ぜたバイナリを配布することはできません。

なんでそんな嘘つくの?

262 名前:login:Penguin mailto:sage [2010/11/06(土) 14:23:21 ID:Q0TzkZLh]
>繰り返しますが完成した辞書ファイルは再配布できません。

なんで嘘つくの?

263 名前:login:Penguin mailto:sage [2010/11/06(土) 15:10:02 ID:P346/uTp]
>>259
> SKK形式データは、もとデータの「使用・再配布・移植・改良」をご自由にという趣旨と
> 相反するGPLを適用している。
> そのうえ、GPLを適用するうえで著作権者の承諾を得ていない。
>
> こんなことって許されるの?

ライセンスは原著作者の専権じゃない上に、ご自由にということだから、許されるでしょう。
GPLに文句があるのなら、GPLにする前の、元データを使えばいいじゃん。
どうして元データを使わないの?GPL版にタダ乗りしたいの?

264 名前:login:Penguin mailto:sage [2010/11/06(土) 15:22:49 ID:bXGJbLMQ]
GPL原理主義者もアレだが正当にGPLで公開されてるデータにいちゃもんつけるやつも大概だよな



265 名前:login:Penguin mailto:sage [2010/11/06(土) 16:25:34 ID:5Me7artN]
UTSUMIさん、辞書を置き換えたforkとして名前変えちゃえばいいんじゃないの。

266 名前:login:Penguin mailto:sage [2010/11/06(土) 17:06:30 ID:Ia+v3TIk]
>>261
宣伝条項のある古いBSDライセンスだったら問題があるな
Mozcがどうなってるか知らないけど

267 名前:login:Penguin mailto:sage [2010/11/06(土) 17:41:39 ID:Euucmb04]
>>263
他人の著作物にただ乗りして「自由」にカセをはめるライセンスを
勝手に適用するのがおかしいと思ってるだけ。
元データと同じような、たとえば
「ご自由にご利用ください。もし間違いを見つけられた方は
ご一報いただけるとありがたいです」みたいにしておけばいいものを。
そもそも辞書(じゃないな、「漢字表記とその読み」の集合)を
GPLにして何を守りたい、あるいは何を得たいんだろ。

268 名前:login:Penguin mailto:sage [2010/11/06(土) 17:51:58 ID:P346/uTp]
>>267
> 他人の著作物にただ乗りして「自由」にカセをはめるライセンスを
> 勝手に適用するのがおかしいと思ってるだけ。

つ 鏡
俺もGPLの自由は好きじゃないが、
他人がGPLで出しているものにただ乗りして「自由」にカセをはめようとしているお前さんは
おかしいと思っているだけ。

そんなにGPL版が嫌いなら、元データを使えばいいじゃないか。
元データまでGPLが適用されるわけじゃあるまいし。
GPL賛同者がデータを加工して流通させているモノを、元データの舷著作者でもないあんたが
あれこれ注文つけるのはGPL原理主義と同じぐらい筋違いだぞ。

269 名前:login:Penguin mailto:sage [2010/11/06(土) 17:56:48 ID:CCsWNvA8]
>>267
ライセンスと言うのは使っても文句言われないって事だけど、
日本語の自由は、勝手に使ったと文句をつけるのも自由って事だから。
使った部分の責任を負わなくていいだけ。

270 名前:login:Penguin mailto:sage [2010/11/06(土) 17:57:18 ID:liWj4Vmq]
>>267
まあ、たしかに変だよね。マージしたあとの辞書データのライセンスがGPL になるならわかる。

271 名前:login:Penguin mailto:sage [2010/11/06(土) 18:01:54 ID:CCsWNvA8]
そもそもライセンスとは許諾なわけで、抱き合わせの条件があったらそれは許諾ではなくてライセンスと称した詐欺契約だよ。

272 名前:login:Penguin mailto:sage [2010/11/06(土) 18:15:23 ID:P346/uTp]
4行BSDですら許諾条件をつけているが、あれは詐欺契約か?

273 名前:デムパゆんゆん@OSSFJ mailto:sage [2010/11/06(土) 18:33:00 ID:hVLd3WO1]
>>226
元データを加工してGPLだお!と言って出してるのはいいけど
GPLの構成要件満たしてるのか?
元データとの改変箇所明記とかしてるならいいの?
GPLの理念て著作者の権利保護が目的やないのか

SKKの辞書が気になるなら郵政はCVSで出してるんだし
www.post.japanpost.jp/zipcode/download.html
揉めるくらいならもずくは自前でライセンス付けて出した方がいいだろ

274 名前:login:Penguin mailto:sage [2010/11/06(土) 18:41:18 ID:Ia+v3TIk]
>>273
何が問題と思っているの?(感情論を除いて)



275 名前:デムパゆんゆん@OSSFJ mailto:sage [2010/11/06(土) 18:55:54 ID:hVLd3WO1]
>>274
もずくが拾ってきた辞書グレーなまま使うくらいなら
自前で作ったほうがいいだろう女子高生

276 名前:login:Penguin mailto:sage [2010/11/06(土) 18:59:19 ID:Euucmb04]
>>268
SKKは使ってないしSKK辞書を流用するつもりもないよ。
mozcには関心はあるけど、まだ試してもいない。

>>259 で書いたみたいに
> この「漢字と読み」もこの「漢字と読み」もSKK辞書と同じじゃないか、
(ちゅうりゃく)
> さもなくば訴えるぞ〜〜

こんなことになると怖いなぁと思ってる。
つまるところ、
>GPLにして何を守りたい、あるいは何を得たいんだろ。
これがわからないんだ。

277 名前:login:Penguin mailto:sage [2010/11/06(土) 19:07:49 ID:Ia+v3TIk]
>>275
誰もそんなこと話してないだろ
明らかにMozcを飛び越えて、郵便番号とGPLの関わりの話になってて
もうそろそろスレ違いと言われる話題になっている

278 名前:login:Penguin mailto:sage [2010/11/06(土) 19:08:50 ID:4jCYGr+2]
>>276
漢字の読みに権利は発生しない

279 名前:login:Penguin mailto:sage [2010/11/06(土) 19:12:36 ID:CCsWNvA8]
>>272
嫁にやると言っておいて実際には婿に入れというような契約のこと。

280 名前:login:Penguin mailto:sage [2010/11/06(土) 19:38:07 ID:Euucmb04]
>>277
いや、そうでもないと思うよ。
ttp://code.google.com/p/mozc/issues/detail?id=55
こんなやりとりを見るとmozc側がSKK辞書のGPLを警戒してるのがよくわかる。

SKK辞書配布者は、「漢字と読み」を集めたデータにGPLを適用して
いったい何をしたいんだろう。んで、mozc側はどんな事態を恐れてるんだろう
ってのを知りたいんだ。

281 名前:デムパゆんゆん@OSSFJ mailto:sage [2010/11/06(土) 20:24:02 ID:hVLd3WO1]
>>280
>mozc側はどんな事態を恐れてるんだろうってのを知りたいんだ。
そりゃ辞書のライセンス、特許違反や権利侵害とかでぐっぐる様が被告になることだろ
skkは何しようと放っとけばいいんじゃねの

282 名前:login:Penguin mailto:sage [2010/11/06(土) 21:33:23 ID:XVTryB8j]
>>268の意見に賛同。

>>280
変な奴

283 名前:login:Penguin mailto:sage [2010/11/07(日) 00:39:35 ID:6fqhx/hy]
UTSUMIさんついに再配布禁止を取り下げたね。
バイナリとか用意しなきゃいいのに。
とりあえずおつかれさま。

284 名前:login:Penguin mailto:sage [2010/11/07(日) 01:33:15 ID:8H75cvB4]
正直言ってどうでもいい

そんなことよりMozc-0.13.523.102の誤変換を晒して暇つぶししようぜ



285 名前:login:Penguin mailto:sage [2010/11/07(日) 02:31:43 ID:TR9XmCl2]
せいれいしていとし→政令指定都し

dictionary09.txt:せいれいしていと 2235 2319 7769 政令指定都
dictionary09.txt:せいれいしていし 2235 2321 7864 政令指定市

どういうふうにデータ採取してんのかね。

286 名前:login:Penguin mailto:sage [2010/11/07(日) 02:39:31 ID:8H75cvB4]
ちょっと見ただけでいっぱい発掘できるなw

287 名前:login:Penguin mailto:sage [2010/11/07(日) 06:38:55 ID:RG+P5DAL]
間違ったデータが入っててもエンジンがそれを入れないようにするんだろ?
mozcにおいては、路上のゲロ以下の一般ユーザが辞書につっこみ入れたり、辞書登録をすることは許されていません。

288 名前:login:Penguin mailto:sage [2010/11/07(日) 08:02:55 ID:6v3ysx9Q]
>>287
いや、ググルがクロールして集めてきたコーパスから辞書を自動生成するはずだから、
辞書を自動生成する時に>>285みたいな「誤変換」を禁則として排除するんだろ。

でも、こう言っちゃナンだけど、自然言語処理的には筋が悪いやり方じゃないかな。
言語モデルの常として、「正しい変換例」の集合よりも「誤った変換例」の集合のほうが
遥かにサイズが大きいのだから、手で仕込むのなら「正しい変換例」を列挙するのが筋。
クロールしてきたコーパス量と同じぐらいの量の誤変換データを収集しないと
マトモな辞書にならん希ガス。

289 名前:login:Penguin mailto:sage [2010/11/07(日) 08:03:03 ID:6OAk89U9]
どうせもうUTUMI氏は信用しないし辞書も使わないからどうでもいい
勝手にやっとけ


290 名前:login:Penguin mailto:sage [2010/11/07(日) 09:10:59 ID:OVXaEx9w]
悪口なのに敬称をつけるのはいわゆるツンデレって奴か?

291 名前:login:Penguin mailto:age [2010/11/07(日) 10:32:30 ID:3BwHrSAe]
せいれいしていとし→政令指定都市
サワさんの辞書

どうでもいいことで熱くなる低能のおまえらが羨ましいよw
だからホイホイとクソ民主に投票するんだろうな

292 名前:login:Penguin mailto:sage [2010/11/07(日) 13:20:38 ID:XgL/CWwM]
どんな話題も最後は民主と韓国の話に持って行く
ネトウヨさんの特技やで

293 名前:login:Penguin mailto:sage [2010/11/07(日) 13:55:57 ID:H8r5NKSp]
そろそろ開発版、普通にインストールしても最新バージョンが提供されるようになったのかな
ブログ見る限りそんなアナウンスは見当たらないけど、どうなんだろ

294 名前:login:Penguin mailto:sage [2010/11/07(日) 14:08:50 ID:8H75cvB4]
Google日本語入力の話か?
二つのパソコンに同じ時期にインストールしたが、同じようにアップデートしない。
どうなってんのかね?
まあ、すれ違いだが



295 名前:login:Penguin mailto:sage [2010/11/07(日) 14:38:01 ID:OdjaKnhB]
>>237 も言っているが、読み仮名が漢字の単語ぐらい外せよ

遙ちゃん 2235 2315 7931 遙ちゃん
ぎゃくじょ援 2976 2235 7347 逆助援
ちゅう受 2976 2235 6910 中受
ごう販きぼう 2235 2230 7629 業販希望

これぐらい調べるの簡単だろ?

296 名前:login:Penguin mailto:sage [2010/11/07(日) 15:54:44 ID:6v3ysx9Q]
変換結果からさらに尤度の高い変換候補に再変換するんじゃね?

297 名前:login:Penguin mailto:sage [2010/11/07(日) 21:45:02 ID:H8r5NKSp]
んごごっ!?
以前うpされた改造済み開発版インストーラーを入れてGoogleJapaneseInput-0.13.499.100使ってたら
今回のうpだてきてないじゃ〜〜ん

正攻法じゃないし、しゃーないか

298 名前:login:Penguin mailto:sage [2010/11/08(月) 04:06:14 ID:3JR9ynAU]
Mozc プロパティダイアログで、

・「辞書」タブで学習機能を「無効」にする。
・「サジェスト」タブで、「全入力履歴を削除」をクリック
・「サジェスト」タブで、「システム辞書からのサジェスト自動表示を有効にする」にチェックマークをつける。

で、プリエディットで「ばくにゅう」と入力すると「爆乳三国志」がサジェストで表示される。

でも、Mozcの辞書データでgrepしても「爆乳三国志」てひっかからない?
Mozc-0.13.523.102

299 名前:298 mailto:sage [2010/11/08(月) 04:11:26 ID:3JR9ynAU]
すまん、ユーザ辞書として追加してる中に「爆乳三国志」があった。
書きこむ前に分かる話だよな自分。

300 名前:login:Penguin mailto:sage [2010/11/08(月) 04:24:28 ID:oWaIHAjb]
どういう事情でで爆乳三国志を登録したのかを小一時間・・・

301 名前:login:Penguin mailto:sage [2010/11/08(月) 04:51:06 ID:4hbKmq0N]
爆乳三国志について





思いました

302 名前:login:Penguin mailto:sage [2010/11/08(月) 05:01:25 ID:P+/VA1aL]
mozcの辞書はいろんなライセンスの辞書が混ざっているから既にグレー。bsdライセンスに追加条項が付いている状態。なんだぜ?

303 名前:login:Penguin mailto:sage [2010/11/08(月) 11:54:41 ID:2iwI7yBz]
>>bsdライセンスに追加条項
これだけなら何も問題ないぞ?
その追加条項に不備があるのか?


304 名前:login:Penguin mailto:sage [2010/11/09(火) 01:53:18 ID:wMEuXfm2]
UTUMI氏 Anthyの拡張辞書を作っている時代から本家にマージして
多くの人が利益を得られることを考えてくれていればな。。。



305 名前:login:Penguin mailto:sage [2010/11/09(火) 02:12:23 ID:XE9V25kc]
副作用とか考えずにマージ勧められてもな

306 名前:login:Penguin mailto:sage [2010/11/09(火) 04:54:13 ID:WVyoMhsr]
クローリングしてきたデータをもとに辞書データをつくった場合、
著作権はどうなるんだろう?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<152KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef