- 1 名前:login:Penguin [2007/08/01(水) 19:53:10 ID:GR1p730l]
- フリーでセキュアな日本語入力システムAnthyのスレッドです。
本家 anthy.sourceforge.jp/ anthy.sourceforge.jp/cgi-bin/hiki/hiki.cgi 前スレ pc11.2ch.net/test/read.cgi/linux/1135922823/
- 554 名前:login:Penguin [2007/11/13(火) 19:25:09 ID:0/oCire4]
- >>553
「あさから、とうきょうにいくよていです」だと、 「朝から、東京に行く予定です」と文節を区切りなおすことなく 正しく変換されるんだな。 だから「あさからとうきょうにいくよていです」にも同じ事を期待したわけだ。
- 555 名前:login:Penguin mailto:sage [2007/11/13(火) 20:06:58 ID:HSvxc5en]
- 昔のanthyは、元々あったcanna辞書を上手く使えるように作ってあった
性能に行き詰まりを感じ、辞書を無視してとにかく良さげなアルゴリズムを使う事だけを考えて大改造した でも辞書は昔のままなので、「姦する」になったりして使い物にならん これであってる? 辞書のメンテナの負担は考えたのか? なんで開発版と安定版に分けなかったのか?これは各ディストリの仕事かもしれないけど
- 556 名前:login:Penguin mailto:sage [2007/11/13(火) 20:29:21 ID:j4s0F97X]
- 朝から東京に郁代邸です。
- 557 名前:login:Penguin mailto:sage [2007/11/13(火) 20:35:26 ID:ytRHIJ73]
- 開発版と安定晩にはわかれてたよ。
下二桁が00になってるのが安定版。 実質的には00bあたりだったけどw
- 558 名前:login:Penguin [2007/11/13(火) 20:54:54 ID:0/oCire4]
- >>556
「あさからとうきょうにくるよていです。」はどうなります?
- 559 名前:login:Penguin mailto:sage [2007/11/13(火) 20:59:23 ID:VNAApg1W]
- 556じゃないけど、朝から東京に久留予定です(・ω・)
- 560 名前:login:Penguin mailto:sage [2007/11/13(火) 22:15:18 ID:JG69Lpby]
- >>555
本当はどこかから、forkしたらよかったんだけど、 以前のアンシーは細かいバグだらけで結局安定版はなかったのさ。 結局すべてのバグも把握した人が、作りつづけるしかないんだと思うんだけど、逃げちゃったからね…
- 561 名前:login:Penguin mailto:sage [2007/11/13(火) 22:21:30 ID:CyYxFPqD]
- 1.ヨクト有情する
2.よくと雨上する 正解: よく登場する ゆうたいばん -> 幽体版 ( ゚д ゚) 死んでもATOK使えってことか?
- 562 名前:login:Penguin [2007/11/13(火) 22:39:24 ID:SUigmv/k]
- 朝から東京に来る予定です
- 563 名前:login:Penguin mailto:sage [2007/11/13(火) 23:19:15 ID:FN+8gT0H]
- 朝から千葉似来る予定です
- 564 名前:login:Penguin mailto:sage [2007/11/13(火) 23:57:57 ID:j4s0F97X]
- >>558
朝から東京にくる予定です。
- 565 名前:login:Penguin mailto:sage [2007/11/13(火) 23:58:42 ID:j4s0F97X]
- >>561
欲登場する
- 566 名前:login:Penguin mailto:sage [2007/11/14(水) 00:46:10 ID:V1TwYX7L]
- 俺はよく「xx歳」の「歳」で困る。なかなか出ない。
- 567 名前:login:Penguin mailto:sage [2007/11/14(水) 11:01:09 ID:TQfZfvPm]
- >>555
俺も大体そんなところだと思ってる。 雰囲気的には、単にヒューズの現象に陥っているだけのような気がする。 ほとんどの不都合は辞書のメンテとちょっとしたパラメータ設定で解決できるのではないか。
- 568 名前:login:Penguin mailto:sage [2007/11/14(水) 14:49:33 ID:3YFatpuC]
- そうやってFreeWnnは永い眠りについてしまったわけですが…
まあ俺は化石な知識しかないので、どういう事態になっても見守ることしか出来ないが。
- 569 名前:login:Penguin mailto:sage [2007/11/14(水) 15:37:54 ID:+LGizqS+]
- 服を来た
教徒から来た 京都もアレだが。。。この「きた」はどうにもならんのだろうか。
- 570 名前:login:Penguin mailto:sage [2007/11/14(水) 15:53:37 ID:IFRauBcy]
- 教徒から来た
服を来た 服を切る 「きょうと」単体で変換しようとすると19/20で、京都よりも上の位置に「凶徒」だとか「兇徒」「恭と」などが鎮座している。 他の単語でも宗だけど、Anthyの作者って、マジで何か特殊な思想でも持ってるか? 「宗だけど」も操舵な('A`)
- 571 名前:login:Penguin mailto:sage [2007/11/14(水) 15:59:53 ID:IFRauBcy]
- 恭と平行→京都|屁|いこう←「京都へ行こう」を出そうと分節区切ると、すげえ笑える
(゚д゚)…
- 572 名前:login:Penguin mailto:sage [2007/11/14(水) 17:34:34 ID:ko8Dh7re]
- 服を来た
京都から来た 服を切る 宗だけど 教徒平行
- 573 名前:login:Penguin mailto:sage [2007/11/14(水) 17:53:57 ID:IFRauBcy]
- 不と思ったのだが、Anthyの生み出す言葉って、80年代の戸川純とかゲルニカの歌のタイトルとか歌詞に出てきそうな
単語が多いよね。妙にアングラチックで…(゚д゚)
- 574 名前:login:Penguin mailto:sage [2007/11/14(水) 18:34:17 ID:ScUFKXXN]
- 散光にして
- 575 名前:login:Penguin [2007/11/14(水) 22:35:08 ID:a81/VJaL]
- >>569
それなら「服」と「着る」の間に関連付けを作ってやればよい。 それを緩やかに行うのが、corpusであり、 それを厳密に行うのが udictの設定だと思っている。 「京都」と「行く」とか、「京都」と「観光」の間に関連付けがあれば、 そんなにおかしな同音異義語が出にくくなるだろう。 それが、 >>567の言う「ちょっとしたパラメータ設定」だと思ってる。
- 576 名前:login:Penguin mailto:sage [2007/11/14(水) 23:06:04 ID:Bd6FzGoW]
- で、辞書のメンテとちょっとしたパラメータ設定が終わったと思ったらまた新アルゴリズムに切り替えですか
- 577 名前:login:Penguin mailto:sage [2007/11/14(水) 23:08:26 ID:6sHrvA8g]
- nanthyってなんだろ?関係あんのかな
ttp://d.hatena.ne.jp/nazodane/searchdiary?word=%2a%5bNanthy%5d
- 578 名前:login:Penguin mailto:sage [2007/11/14(水) 23:11:36 ID:ScUFKXXN]
- >>577
ググれ
- 579 名前:login:Penguin mailto:sage [2007/11/14(水) 23:41:11 ID:y1vGSery]
- Anthy変換のまま小説を書ききったら
ある意味で世紀の作品ができあがるのかもしれない
- 580 名前:login:Penguin mailto:sage [2007/11/14(水) 23:41:59 ID:oOxq3Gyf]
- てーくゆーらーぶみー
- 581 名前:login:Penguin mailto:sage [2007/11/14(水) 23:59:58 ID:1r749re+]
- コーパスの文例を品詞を考えた上でまず増やさないと。corpus_info覗いてみればわかるけど、1個とか2個くらいしかない組成の組だらけだし。 ありがちな組成の組が最悪一つは入っていない状態じゃないと、確率に差が出すぎちゃって変な候補がでてくるyo
- 582 名前:login:Penguin mailto:sage [2007/11/15(木) 00:06:09 ID:p3gPAl6Z]
- 恋済み
ワラタ 小泉が出ない 作者はもう恋なんてしない人なのかw
- 583 名前:login:Penguin mailto:sage [2007/11/15(木) 00:10:09 ID:djOqQP0O]
- とりあえず同音異義語とか難易度が高いものはしかたないとしても
「関する」で「姦する」が出るとか、ありえないような言葉が出てくるのは勘弁して欲しい。 ちなみにATOKとかだと「かんする」では「姦する」なんて出てこないんだな。
- 584 名前:login:Penguin mailto:sage [2007/11/15(木) 00:25:27 ID:+a+rbqpF]
- dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%81%8B%E3%82%93%E3%81%99%E3%82%8B&dtype=0&stype=1&dname=0na&pagenum=1&index=04112003915000
かん・する【×姦する】 「かんする」を大辞林でも検索する [動サ変]Z69C1.gifかん・す[サ変] 1 婦女子を犯す。 2 姦通する。
- 585 名前:login:Penguin mailto:sage [2007/11/15(木) 00:48:50 ID:yWcmaxW2]
- >>584
noun.depwordの問題だyo @名詞のあと "" .@する名詞 .@さ(名詞化) をコメントアウトしたら?
- 586 名前:login:Penguin mailto:sage [2007/11/15(木) 00:49:53 ID:yWcmaxW2]
- >>583 Ne
- 587 名前:login:Penguin mailto:sage [2007/11/15(木) 00:53:27 ID:WPr7WJjs]
- >>582
そんな候補出ないけどな upup.moe.hm/imgbbs/upload/1195054627-48.png 「恋済み」でググってみても 「小泉」の言い替えや誤変換ネタぐらいにしか使われてないっぽいが www.google.co.jp/search?q=%22%E6%81%8B%E6%B8%88%E3%81%BF%22
- 588 名前:login:Penguin mailto:sage [2007/11/15(木) 00:59:19 ID:+a+rbqpF]
- >>587
ヒント: 2ch.t
- 589 名前:login:Penguin [2007/11/15(木) 01:39:11 ID:EisoRklq]
- 以下の例文は、9100dで変換できるようになりました。
ご確認いただき、Anthy Wikiの「誤変換晒しあげ」リストの メンテをお願いします。 * 生還論 | 征韓論 (9100) * 地下○ | 近まる (9100) * 簡単だった全モデル | 簡単だった前モデル (9100) * どう解離時 | 同会理事 (8019) * 後輪芹 | 降臨せり(anthy-9100b) * NOVA死亡 | 伸ばし棒(anthy-9100) * 総小間生が | そう思うが(anthy-9100b) * 再送しん | 再送信(anthy-9100) * 采配しん | 再配信(anthy-9100) * 田方め | 誰が為(anthy-9100) * 雨の日二課さをさす | 雨の日に傘をさす(anthy-9100d) * 注意し魔性 | 注意しましょう(anthy-9100b) * 羽賀検事 | 羽賀研二(anthy-9100b) * 再と名 | サイト名(anthy-9100) * ヌルっと | ヌルッと(anthy-9100b) * 工事日 | 公示日(anthy-9100) * 極意恥部の | ごく一部の(anthy-9100b) * タカかれ引く彼 | 高かれ低かれ(anthy-9100) * 九塁打す | 狂いだす(anthy-9100b) * 場加奈子とをしてしまった | 馬鹿な事をしてしまった(anthy-9100b) * 螺不満が | ラフ漫画(anthy-9100b) * 考えるだろ海栗 | 考えるだろうに(anthy-9100) * テストさせてくださいマシ | テストさせてくださいまし(anthy-9100)
- 590 名前:login:Penguin mailto:sage [2007/11/15(木) 02:23:14 ID:+a+rbqpF]
- >>589
把握。
- 591 名前:login:Penguin mailto:sage [2007/11/15(木) 04:53:06 ID:BmXkt0JF]
- >>589
はて >* どう解離時 | 同会理事 (8019) 度鵜飼理事 >* 再送しん | 再送信(anthy-9100) 再送しん (変化なし) >* 采配しん | 再配信(anthy-9100) 采配しん (変化なし) >* 田方め | 誰が為(anthy-9100) 堕がため >* 雨の日二課さをさす | 雨の日に傘をさす(anthy-9100d) 雨の日二課さをさす (変化なし、ってか9100dで誤変換すると言ってる) >* 極意恥部の | ごく一部の(anthy-9100b) 極意恥部の (変化なし) >* 場加奈子とをしてしまった | 馬鹿な事をしてしまった(anthy-9100b) 場加奈子とをしてしまった (変化なし) >* 考えるだろ海栗 | 考えるだろうに(anthy-9100) 考えるだろ|うに (まだ文節が怪しい)
- 592 名前:login:Penguin mailto:sage [2007/11/15(木) 05:13:00 ID:+a+rbqpF]
- >>589
done. 分節が変なのはそのまま、それ以外は移動。udictに追加した方が良いと思うものも移動してるので注意。 "ごく一部"はどうなってるか未確認。 二課さ(名詞+さ)は方便だろうから問題ないと判断。
- 593 名前:login:Penguin [2007/11/15(木) 09:06:36 ID:EisoRklq]
- >>591
再送信、再配信は9100dのalt-cannadic/gcanna.ctdにありますけど、 そちらの環境では出なかったようですね。
- 594 名前:591 mailto:sage [2007/11/15(木) 13:31:41 ID:Da9qv4nj]
- >>593
第一候補が再送しん、采配しんになるんだよ 再送信も再配信も候補の中にはある
- 595 名前:login:Penguin mailto:sage [2007/11/15(木) 16:04:35 ID:djOqQP0O]
- 9100d
同会理事 再送信 再配信 ダレがため 雨の火に傘をさす 極一部の バカなことをしてしまった 考えるだろ|うに
- 596 名前:login:Penguin mailto:sage [2007/11/15(木) 16:13:39 ID:gBHZX5+t]
- >ダレがため
「誰が為」は「だがため」と読む
- 597 名前:login:Penguin mailto:sage [2007/11/15(木) 16:20:48 ID:djOqQP0O]
- >>596
あら、お恥ずかしい(;・Д・) んで「だがため」だと「堕固め」_| ̄|○、;'.・
- 598 名前:login:Penguin mailto:sage [2007/11/15(木) 16:26:12 ID:p5aeWzAw]
- 「たがため」でしょ。
- 599 名前:login:Penguin mailto:sage [2007/11/15(木) 16:29:50 ID:yWcmaxW2]
- >>593,594
fix.depwordの @の? "" Se@ を @の? "の?" Se@ に直せば、「何々しん」は直るんじゃね。 というか、depgraph、ちゃんと分かる人に 全体的に直してもらったほうがいいyo 素人にはここまでたどり着くのに一日かかったorz
- 600 名前:login:Penguin mailto:sage [2007/11/15(木) 16:36:07 ID:V8mHVO2V]
- >>595
Debian使いか?
- 601 名前:login:Penguin mailto:sage [2007/11/15(木) 16:44:22 ID:djOqQP0O]
- >>600
なぜ、Debian?
- 602 名前:591,596 mailto:sage [2007/11/15(木) 16:55:06 ID:4xzFtqjj]
- >>598
Ω ΩΩ<ナ、ナンダッテー!? 俺あほすぐるwww
- 603 名前:login:Penguin mailto:sage [2007/11/15(木) 17:03:27 ID:/FjSxP+a]
- たがためにかねはなる
って本知らない?
- 604 名前:login:Penguin mailto:sage [2007/11/15(木) 17:21:29 ID:djOqQP0O]
- >>603
「誰がために鐘は鳴る」ってヘミングウエイの本なんだね。 だけどwik見ると「誰が為に鐘は鳴る」って映画の邦題でつけられたものみたい。 まあ、こういう細かい物も変換で切るようになるのはうれしいけど もっと基本的な所を優先的に頑張れよ!といいたい。 #(変換できる)ってパーツで書くと変換するけど、長めの文章で書くと 「変換で切る」になりやがる。
- 605 名前:login:Penguin mailto:sage [2007/11/15(木) 17:27:07 ID:+a+rbqpF]
- >>599
ソース解析して適当にドキュメント化してみた@anthy wiki #depgraphに変なのが含まれてないかは全ての組み合わせを表示して目視でチェックできる気ガス。
- 606 名前:login:Penguin mailto:sage [2007/11/15(木) 20:29:36 ID:BY1UZpgF]
- サイボーグ戦士 誰が為に戦う@scim-anthy1.2.4
一発だが
- 607 名前:login:Penguin mailto:sage [2007/11/15(木) 20:32:04 ID:JWQPvUSL]
- 私の名前花香のです
- 608 名前:login:Penguin mailto:sage [2007/11/15(木) 21:36:55 ID:rbqr7GIO]
- みやげや
で変換すると 土産屋土産 とか出るんだけど
- 609 名前:login:Penguin [2007/11/15(木) 23:05:35 ID:EisoRklq]
- 晒し上げに「美しい国」の誤変換例を書いている人がいるけど、
「うつくしいくにです」にしたら結果はどうなるかな?
- 610 名前:login:Penguin mailto:sage [2007/11/15(木) 23:22:59 ID:kDozd+3d]
- 美しい区に
美しいくにです
- 611 名前:login:Penguin mailto:sage [2007/11/15(木) 23:23:15 ID:p3gPAl6Z]
- 嵐ヶ丘
一発変換 風と共にさりぬ 去りぬが出ない >>606 ゆとりすぎ
- 612 名前:login:Penguin mailto:sage [2007/11/15(木) 23:29:45 ID:kDozd+3d]
- >>609
その程度は、変換候補2〜3回出せば変換で切るからたいした問題ではないのでは? ただ「くにです」で「国です」より上に「六合です」ってのが解せないけど。 「へんかんできる」だと一発で「変換できる」になるけど「へんかんできるから」とか文章が都筑と 「変換で切るから」になるんだな。 あああ、「続く」も文章の中だと「都筑」が上になるー。もう嫌('A`)
- 613 名前:login:Penguin mailto:sage [2007/11/15(木) 23:30:51 ID:kDozd+3d]
- 風と共にさり奴・゚・(ノД`)・゚・。
- 614 名前:login:Penguin mailto:sage [2007/11/15(木) 23:40:42 ID:BY1UZpgF]
- なんかどうでもいいような…
変なところにこだわりのある日と美とだねぇ 誤変換外野なら単文節で変換すりゃ飯野に わざわざ長文の口語体を変換させて誤変換をあげつらうなんてよっぽど暇なんだな っ手三行目一発じゃん
- 615 名前:login:Penguin mailto:sage [2007/11/15(木) 23:46:25 ID:rKxukPZ3]
- 私の名前は中野です 9100d
さすがにこれが出なかったら不味いわ
- 616 名前:login:Penguin mailto:sage [2007/11/15(木) 23:55:12 ID:yWcmaxW2]
- だからコーパス増やさないとだめだとおもうyo。協力してあげてね。
- 617 名前:login:Penguin mailto:sage [2007/11/16(金) 00:04:40 ID:xx62RFyR]
- コーパスは対処療法すぎるyo。副作用大きすぎ。
- 618 名前:login:Penguin mailto:sage [2007/11/16(金) 00:11:18 ID:q48lYqqL]
- わかった!メモリ1GB買い足そうと思ってた1万円でATOK買うお!( ^ω^)
- 619 名前:login:Penguin mailto:sage [2007/11/16(金) 00:25:13 ID:N+Z040/o]
- ヒント: このスレをコーパスにして学習させるw (カオスw)
- 620 名前:login:Penguin mailto:sage [2007/11/16(金) 00:56:02 ID:NzZ0Zluz]
- >>617
何だよ副作用ってw
- 621 名前:login:Penguin [2007/11/16(金) 00:56:07 ID:STPJJiQ8]
- 「このすれ」を入力すると、まず「子のスレ」が出てくるんだけど、
「子」の頻度が254で、「この」の頻度が200だから、 「子の」が優先されてるのでしょうかね。
- 622 名前:login:Penguin mailto:sage [2007/11/16(金) 11:16:04 ID:+HwSmH88]
- 単語の頻度だけでやっちゃあまずい気がするのだが
- 623 名前:login:Penguin mailto:sage [2007/11/16(金) 12:42:51 ID:3IuhgM/L]
- >>621 gcanna.ctdの「こ」のエントリで「#T35*201 こ 娘」があるけど、 これが問題。この部分を「#T35*201 娘」にして、コーパスの計算しなおせば直るyo 辞書の頻度を見るんじゃなく、品詞、コーパスの構造両方の整合性を見ないと。
- 624 名前:login:Penguin mailto:sage [2007/11/16(金) 13:12:28 ID:vfB7Y+Dm]
- >>614
SKK最強!
- 625 名前:login:Penguin mailto:sage [2007/11/17(土) 02:27:37 ID:rz7lMhcB]
- 子のすれ
私の名前は中野です 変な所にこだわりのある日と美とだねぇ 誤変換外野なら単文節で変換スリゃいいのに わざわざ長文の口語体を変換させて誤変換をあげつらうなんてよっぽど暇なんだな 風とともにさり奴 嵐ヶ丘 美しい国 美しいくにです 変換できる 他固めにかね葉なる
- 626 名前:login:Penguin [2007/11/17(土) 12:27:25 ID:YOPzWmbE]
- けんげんいじょう で「権限委譲」が出てくるけど、「権限移譲」は
出てこない。 9100d
- 627 名前:login:Penguin [2007/11/17(土) 12:33:50 ID:YOPzWmbE]
- >>620
コーパスは文節で切れていても、品詞情報が無い。 そのため「このすれ」をコーパスで学習させても、「このスレッド」 でその学習結果が使われるとは限らない。 だからコーパスは膨大な 量を集めないと正しい結果の方向で収束しない。 >>625 映画のタイトルよりも、東証一部の会社名を 正しく変換できる方が先だと思うが。
- 628 名前:login:Penguin mailto:sage [2007/11/17(土) 16:25:38 ID:CZfADcwS]
- それでみんなコーパス送っているのか?
- 629 名前:login:Penguin mailto:sage [2007/11/17(土) 16:42:37 ID:NBnDx9mS]
- >>627
quote.yahoo.co.jp/q?s=2152.j&d=t この会社は変換出来るか
- 630 名前:login:Penguin mailto:sage [2007/11/17(土) 17:16:16 ID:Im1lqxt/]
- >>628
送ってるよ〜でも今SKK使い始めちゃったorz
- 631 名前:login:Penguin mailto:sage [2007/11/17(土) 17:58:48 ID:CZfADcwS]
- いまコーパスって何文?
- 632 名前:login:Penguin mailto:sage [2007/11/17(土) 18:46:54 ID:6HvMzrcd]
- >東証一部の会社名を
興味ね〜オヤジかよw
- 633 名前:login:Penguin mailto:sage [2007/11/18(日) 09:21:58 ID:/VF6+UY7]
- >>627 つ>>623
- 634 名前:login:Penguin [2007/11/18(日) 14:07:50 ID:OMdjDorL]
- うちの犬がベッドにもグリコんできます (ベッドに潜り込んできます)
それは明らかにとしをとった翔子でしょう。 (年を取った証拠でしょう) きょうを逃すと今度ハイツいくのかわからないので (今度は何時行くのか) 再入荷葉美邸 (再入荷は未定)
- 635 名前:login:Penguin mailto:sage [2007/11/18(日) 14:22:48 ID:CsEaqQOp]
- うちのいぬがベッドにもぐり込んできます
それは明らかに都市をとった晶子でしょう 今日を逃すと今度はいつ行くのかわからないので 再入荷は未定 by FreeWnn 「うちのいぬ」の「いぬ」は いぬが い+ぬが(一動幹 基本語彙(pubdic+):398 Freq: 184) S:628 D:648 V:3 だというダメっぷり。
- 636 名前:login:Penguin mailto:sage [2007/11/18(日) 14:23:26 ID:FkaxUM2V]
- 可哀想な翔子やな。
(昔の女の名前だ)
- 637 名前:login:Penguin mailto:sage [2007/11/18(日) 17:00:21 ID:luZnkwPK]
- うちの犬がベッドにもグリコんできます
それは明らかに年を取った翔子でしょう 今日を逃すと今度ハイツ行くのか分からないので 再入荷は未定
- 638 名前:login:Penguin mailto:sage [2007/11/18(日) 17:27:58 ID:ZjKsfEPI]
- うちの犬がベッドにもぐりこんできます
それは明らかに年を取った証拠でしょう 今日を逃すと今度はいつ行くのかわからないので 再入荷は未定 @MSIME うちの犬がベッドにもグリコんできます それは明らかに年をとった翔子でしょう 今日を逃すと今度ハイツ生の川からないので 再入荷は未定 @Anthy9100
- 639 名前:login:Penguin [2007/11/18(日) 17:59:06 ID:STRvLBc1]
- うちの犬がベッドにもグリコんできます
それは明らかに年をとった翔子でしょう 今日を逃すと今度派いつ往くのか分からないので 再入荷は未定 @Anthy9100d
- 640 名前:login:Penguin mailto:sage [2007/11/18(日) 18:04:05 ID:PYfSuXGb]
- うちの犬がベッドにもグリコんできます
それは明らかに年をとった翔子でしょう 今日を逃すと今度ハイツ生川から無いので 再入荷は未定 @Anthy9100d
- 641 名前:login:Penguin mailto:sage [2007/11/19(月) 04:44:54 ID:diyZWk6e]
- ttp://headlines.yahoo.co.jp/hl?a=20071118-00000934-san-spo
左脚内転勤を強化し Atokでも筋肉はでてこないから仕方がないな
- 642 名前:login:Penguin mailto:sage [2007/11/19(月) 21:46:50 ID:kP0LHTTG]
- >>うちの犬がベッドにもグリコんできます
fix.depwordの「@の(名詞化内部)」 の 「"の" "ん"」の "ん" は微妙かもね。 "の" だけにしたらいいyo
- 643 名前:login:Penguin mailto:sage [2007/11/19(月) 22:35:13 ID:UEbfYidz]
- 〜〜とシリーズ
キッと(キット キッとかする(キット化する ベルと(ベルト 張ると(バルト バルト海 目面と(メメント メメンと(メメント スポルと(まあ、どうでもいい 切ると(キルト 単語があるかないかにも問題にも関わるだろうから何ともいえないが 「〜〜と」の優先度が高いからこうなるのかな。 結構な頻度で起こるので気になる。
- 644 名前:login:Penguin mailto:sage [2007/11/19(月) 23:39:50 ID:kP0LHTTG]
- まあ、そーゆー単文節のは辞書がだめなんだわ。てけとーな頻度で登録しとけばいいんじゃね
- 645 名前:login:Penguin mailto:sage [2007/11/20(火) 00:04:09 ID:Ygkh5Pbd]
- >>642
"ん"自体は微妙じゃないと思う…と思ったけど"具離婚お菓子"だとダメだから違う所に"ん"を追加しちゃった感じだねぇ。
- 646 名前:login:Penguin [2007/11/20(火) 02:30:31 ID:5Wd4WjOH]
- 我が谷は緑百鬼 (我が谷は緑なりき)
お図の魔法使い (オズの魔法使い) ベンはー (ベンハー) 戦艦歩著無菌 (戦艦ポチョムキン) 書いて言おうキートン (海底王キートン) 黄金郷時代 (黄金狂時代) ロシア寄り合いを込めて (ロシアより愛を込めて)
- 647 名前:login:Penguin mailto:sage [2007/11/20(火) 02:44:01 ID:hOE3WRDy]
- >>646 暇だねー
- 648 名前:login:Penguin mailto:sage [2007/11/20(火) 06:53:55 ID:P09Gw36B]
- 寄り合いワロス
博士の異常な愛情 または私は異化にして心配するのを止めて水爆を愛するようになったか 長文だけどほぼ完璧惜しい
- 649 名前:login:Penguin mailto:sage [2007/11/22(木) 01:32:37 ID:Z8FBkW+E]
- 明日のために今日頑張ろう!って気合を入れようとしたのに
「明日のため二強頑張ろう」なんて変換してくれるから萎えたわ
- 650 名前:login:Penguin mailto:sage [2007/11/22(木) 14:53:00 ID:fapnhLZG]
- 風とともにサリナ
- 651 名前:login:Penguin mailto:sage [2007/11/23(金) 00:33:56 ID:Hrya9ytw]
- おなじ橋ょ
- 652 名前:login:Penguin mailto:sage [2007/11/23(金) 11:31:16 ID:hMsjYufO]
- ょ
- 653 名前:login:Penguin mailto:sage [2007/11/23(金) 13:04:52 ID:NUNDIUP3]
- なんか誤変換さらすだけでつまらんなぁ。
と、思っていたが>>651はヒットしたぜ!
- 654 名前:login:Penguin mailto:sage [2007/11/23(金) 19:25:17 ID:u0qfcCJ8]
- おみおつけ(←なぜかどのIMEも変換してくれない)
- 655 名前:login:Penguin mailto:sage [2007/11/23(金) 19:39:29 ID:o8IIyaSG]
- 御味御汁 @ Anthy
- 656 名前:login:Penguin mailto:sage [2007/11/23(金) 20:36:51 ID:a3iiUXXy]
- おみおつけ ... 俺の Anthy ではだめだな。
御御御付 (御々々付) じゃなかったっけ?
- 657 名前:login:Penguin mailto:sage [2007/11/23(金) 20:42:15 ID:QTDrrF/W]
- 「おみおつけ」はpubdic+にすら入っているのに
- 658 名前:login:Penguin mailto:sage [2007/11/23(金) 20:57:57 ID:pyRIg+ke]
- 御御御付け
skk でも入ってた。
- 659 名前:login:Penguin mailto:sage [2007/11/23(金) 22:11:50 ID:SUgPRMUR]
- 臣夫付け
@MSIME
- 660 名前:login:Penguin mailto:sage [2007/11/23(金) 22:28:20 ID:xtUalf9n]
- おみおつけ は何の反応もないOS/X-Atok
- 661 名前:login:Penguin mailto:sage [2007/11/24(土) 17:14:47 ID:n6WZg1C+]
- 御味御汁@Anthy9100b
- 662 名前:login:Penguin mailto:sage [2007/11/24(土) 17:52:41 ID:aIDeGWfn]
- つ ttp://www.geocities.jp/wuyongdeye/jupube/m200607.html
- 663 名前:login:Penguin mailto:sage [2007/11/24(土) 18:43:19 ID:KS9aoT96]
- 権威って意味じゃ日本国語大辞典なんだろうなぁ
世俗的には広辞苑なんだろうがw
- 664 名前:login:Penguin mailto:sage [2007/11/24(土) 22:20:19 ID:2bD9pHOV]
- 世俗的にWikipediaといわれるようになったら、終わりだわな。
- 665 名前:login:Penguin mailto:sage [2007/11/24(土) 22:26:56 ID:KS9aoT96]
- むしろgoogle-count?
- 666 名前:login:Penguin mailto:sage [2007/11/24(土) 23:49:08 ID:tuJA0HYl]
- 世俗的(苦笑
- 667 名前:login:Penguin mailto:sage [2007/11/25(日) 17:20:19 ID:OI0EOqTX]
- スイーツ(笑)
- 668 名前:login:Penguin mailto:sage [2007/11/26(月) 01:45:40 ID:CdVuJrzJ]
- 別に難しい言葉柱無くてもいいから、普通の日本語に返還して欲しい。
(゚д゚)…
- 669 名前:login:Penguin mailto:sage [2007/11/26(月) 01:54:44 ID:SZS1rD42]
- 別に難しい言葉は知らなくてもいいから、普通の日本語に変換して欲しい。
あれっ、一発で出たぞ? scim-anthy 1.2.4
- 670 名前:login:Penguin mailto:sage [2007/11/26(月) 01:56:05 ID:CdVuJrzJ]
- >>669
うらやましす。こちら9100d
- 671 名前:login:Penguin mailto:sage [2007/11/26(月) 01:59:43 ID:CdVuJrzJ]
- 別に難しい言葉葉知らなく低位から、
ありゃ?(゚д゚)…
- 672 名前:login:Penguin mailto:sage [2007/11/26(月) 02:02:11 ID:SZS1rD42]
- >>671
もぬけの低位
- 673 名前:login:Penguin mailto:sage [2007/11/26(月) 03:24:57 ID:bnUMiAsz]
- 別に難しい言葉使わなくてもいいから、もう少しまともな日本語を喋れ。
- 674 名前:login:Penguin mailto:sage [2007/11/26(月) 04:30:33 ID:fEwtrRpF]
- 別に難しいこと罰買わなくてもいいから、もう少しまともな日本語を喋れ。
惜しい!anthy7900@Debian-etch。 これだけじゃ何だから、一つ話題を投下。 cannadic改の中の人、辞書メンテやめるっぽいな…。 少しでもcannaの辞書弄った経験があれば判ると思うけど、 確かに些か融通に欠けるわな>cannaの品詞コード 問題は後継がないということだが、個人で地道にメンテするしかないのか。
- 675 名前:canna mailto:sage [2007/11/26(月) 04:58:05 ID:l4R9F4sP]
- 僕が一番cannadicをうまく使えるんだ!
- 676 名前:login:Penguin mailto:sage [2007/11/26(月) 08:01:50 ID:+e+e1hKf]
- >>664
語彙を求めるならwikipediaよりもwiktionaryだろう と言いたいところだが、同じウィキメディア財団の プロジェクトなのにwikipedia以外の知名度は低いよな。
- 677 名前:login:Penguin [2007/11/26(月) 09:25:24 ID:kZ2vLN9w]
- >>668
>>674 | 別に難しいこと罰買わなくてもいいから 「言葉使わなく」ても という助詞を除いた表現に対してanthyは弱いのでは? >>669 これを「言葉『を』使わなくても」と変えても「|難しいこと|場|」に なっているが。。 9100d
- 678 名前:login:Penguin [2007/11/26(月) 12:34:55 ID:SPF5H5N3]
- 別に難しい言葉は知らなくてもいいから、普通の日本語に変換して欲しい
9100d一発
- 679 名前:login:Penguin mailto:sage [2007/11/27(火) 00:12:28 ID:tUTi5znC]
- ttp://shadow-city.blogzine.jp/net/2007/10/vistaos_875e.html#more
まぁMSIMEの方も韓国人が作ってるせいでぐだぐだらしいし、 結局ATOKが最強なんだろうな。 Anthyはコーパス増量での精度向上に期待が持てるだけ まだましなんじゃね?
- 680 名前:login:Penguin mailto:sage [2007/11/27(火) 00:14:54 ID:B8CmetrX]
- 別に難しい言葉を使わなくていいけど
別に難しい言葉使わなくていいけど 別に難しい琴場津買わなく低位から 別に難しい琴×買わなくてもいいから ようわからへん
- 681 名前:login:Penguin mailto:sage [2007/11/27(火) 01:33:59 ID:krvVLDfb]
- >>697 MS-IME も 2007 からコーパス学習するようになったから、
そのリンクにあるように「変な」変換結果するようになった。 これは Anthy も同じ。Vista に最初からついている MS-IME は コーパス使わないバージョンなので、Anthy 7900(だっけ?)と 同じでかなりチューンしてあるから、割と変換はまとも。 コーパス増量でなんとかなると思っているなら MS-IME 使えば?
- 682 名前:login:Penguin mailto:sage [2007/11/27(火) 01:36:45 ID:vHV5wlwH]
- >>679
Anthyも半島仕様なのか?異様に半島系漢字の変換率がいいぞ。 平壌、京城、金大中、金正日 まあ、この辺はメジャーだからまだいいとして のむひょん→盧武鉉 のてう→盧泰愚 ちょんどふぁん→全斗煥 そして 独島が一発変換なのに、たけしま→武島で一発変換しない・゚・(ノД`)・゚・。
- 683 名前:login:Penguin mailto:sage [2007/11/27(火) 04:35:01 ID:krvVLDfb]
- 単漢字で変換できるかどうかは辞書のカバー率の問題なので、
変換アルゴリズムにはあまり関係ない気が。。 cannadic の中の人が半島仕様ってことじゃね?
- 684 名前:login:Penguin mailto:sage [2007/11/27(火) 09:33:16 ID:PE+7IEYU]
- 他に候補が無いから一発ってだけだろ 常考
- 685 名前:login:Penguin mailto:sage [2007/11/27(火) 12:47:18 ID:5QfUVkuo]
- あんまり空気読んでノア→希空って一発変換するような辞書にはなってほしくない
- 686 名前:login:Penguin mailto:sage [2007/11/27(火) 15:30:03 ID:IKRpzhsJ]
- >>682
半島指向なら、任那(みまな)や伽耶(かや)や扶余(ふよ、ぷよ)も一発で 出るようにしないとね。ちなみに任那は3番目、伽耶と扶余は候補なし。 9100d-1
- 687 名前:login:Penguin mailto:sage [2007/11/27(火) 18:21:10 ID:jFu2HW7M]
- 敬銀淑が覚醒剤所持で逮捕
銀淑が一発変換か。やるなAnthy !
- 688 名前:login:Penguin mailto:sage [2007/11/27(火) 18:25:51 ID:ont+1ash]
- >>682
"どくと"や"ぱく"がでないからそこまで半島仕様じゃない気ガス。
- 689 名前:login:Penguin mailto:sage [2007/11/27(火) 18:40:46 ID:jFu2HW7M]
- kasumiとuim-dicだと登録できる品詞の細かさが全然違うんだね。
しかもanthy-dic-toolでお互い書き出し、読み込みができるくせに 互換性があるようで無いと。 この辺統一してくれた方がいいように思うんだけど、どうなんだろう?
- 690 名前:login:Penguin [2007/11/28(水) 12:23:46 ID:HsSh0n/f]
- 「にほんかい」と入力して「東海」とならなければおk
- 691 名前:login:Penguin mailto:sage [2007/11/28(水) 12:27:32 ID:Vdoyppru]
- >>689
文法は、かな漢字変換のキモであり個性の部分だと思うので、 統一は難しいんじゃないかな。 郵便番号辞書とか固有名詞辞書とかそういう方向に特化した 共通辞書フォーマットはありかもしれないが。
- 692 名前:login:Penguin mailto:sage [2007/11/28(水) 12:36:32 ID:m9OsNA12]
- kstarsには地上の場所の設定があって、
恐らく必要と思われない竹島なんかがわざわざ候補にしてあって、 慶尚南道:韓国としてある。 なんとかせにゃならんのう
- 693 名前:login:Penguin mailto:sage [2007/11/28(水) 13:42:21 ID:E9TygqCX]
- >>691
> かな漢字変換のキモであり個性の部分 とはいえ、かな漢字変換エンジンはAnthyで同じなんだけどね。 scim+anthy+kasumiよりuim+anthy+uim-dicの方が細かく品詞登録が出来て変換が賢くなる。
- 694 名前:login:Penguin mailto:sage [2007/11/28(水) 21:56:31 ID:dTSp3d0C]
- >>692
Korea Desktop Environment略してKDEだからね
- 695 名前:login:Penguin mailto:sage [2007/11/29(木) 00:55:03 ID:/u5wVart]
- 念のために書いておくけど、韓国と北朝鮮は60年くらい前からすでに漢字は
使っていません。韓国の一般人のほとんどは自分の名前を漢字で記すのが やっとで、漢字の読み書きはできない状態らしいです。
- 696 名前:login:Penguin mailto:sage [2007/11/29(木) 01:02:50 ID:BCXsC5p/]
- チョンだもん。
- 697 名前:login:Penguin mailto:sage [2007/11/29(木) 01:32:56 ID:++k/bRw5]
- 細かく登録できればできるほど誤登録による被害が甚大。
- 698 名前:login:Penguin mailto:sage [2007/11/29(木) 02:07:43 ID:FacZ1wQN]
- >>692
kstarsのメニューから ヘルプ>kstarsについて>翻訳 を見ると半島工作員の名前とメアドが載ってるぞ。
- 699 名前:login:Penguin [2007/11/29(木) 05:51:28 ID:QyEdaJmd]
- 別に難しい言葉は知らなくてもいいから、普通の日本語に変換して欲しい。ATOK2007
- 700 名前:login:Penguin mailto:sage [2007/11/29(木) 07:09:08 ID:v25fctn7]
- >>695
年代が不正確だな
- 701 名前:login:Penguin mailto:sage [2007/11/29(木) 10:36:37 ID:yBx6PguD]
- 別に難しい言葉は知らなくてもいいから、普通の日本語に変換して欲しい。
anthy9100d + depgraph,コーパス私家版
- 702 名前:login:Penguin mailto:sage [2007/11/29(木) 11:30:35 ID:yBx6PguD]
- >>671-672
こんなんで、「も抜き+いい」使えるようになるけど。 日本語難しいyo --- a.depword 2007-10-27 22:53:59.000000000 +0900 +++ a.depword 2007-11-29 10:54:14.000000000 +0900 @@ -19,7 +19,7 @@ @形容詞連用形NA "" @ない @も @形容詞連用形NA "" @なる @する @形容詞連用形NA "" @は @の @とも -@形容詞連用形NA "って" "て" Sy@ @も @よ @でも @ね +@形容詞連用形NA "って" "て" Sy@ @も @よ @でも @ね @いい # # "遅くまで" 全ての形容詞に当てはまるわけではないので、直した方が良い @形容詞連用形NA "" @まで --- fix.depword 2007-06-16 06:26:30.000000000 +0900 +++ fix.depword 2007-11-29 11:15:08.000000000 +0900 @@ -1,5 +1,6 @@ # 活用しない付属語 # +@いい "い" @形容詞語幹 @が "が" Sk@ :Sk@間投助詞 @です @が "が" @か? @が "がです" @か?
- 703 名前:login:Penguin mailto:sage [2007/11/30(金) 00:28:32 ID:WdFb1T8g]
- Anthy自体には魂がこもっているのだが
- 704 名前:login:Penguin mailto:sage [2007/12/01(土) 04:28:45 ID:VGhgOK00]
- ATOK ダウンロード優待版は5千円でおつりが来る値段だな。
- 705 名前:login:Penguin mailto:sage [2007/12/01(土) 04:41:54 ID:07zhJrKM]
- でっていう。
- 706 名前:login:Penguin mailto:sage [2007/12/02(日) 02:00:05 ID:inbjxOdP]
- 男鹿さ輪光男がサッカーに本題表に復帰(゚д゚)…
- 707 名前:login:Penguin mailto:sage [2007/12/02(日) 02:36:21 ID:zoUnkrvF]
- >>706
おがさわ じゃなくて おがさわら じゃないの? 後半は同じような感じでだめだったけど
- 708 名前:login:Penguin mailto:sage [2007/12/02(日) 13:54:28 ID:b3Q1+gGg]
- 料金効能郵便を出す
- 709 名前:login:Penguin mailto:sage [2007/12/02(日) 17:57:43 ID:b3Q1+gGg]
- >>608
> みやげや > で変換すると > 土産屋土産 > とか出るんだけど 9100dの /mkworddic/compound.t にあった。 みやげものや #T35 #_5土産物_1屋 みやげや #T35 #_3土産_1屋土産 <== みやげよう #T35 #_3土産_2用 「料金後納郵便」も、このファイルの中に登録したらよいことがわかった。
- 710 名前:login:Penguin mailto:sage [2007/12/06(木) 00:38:00 ID:YnB5T8yJ]
- ATOKが出た途端、誰も居なくなったな。
- 711 名前:login:Penguin mailto:sage [2007/12/06(木) 01:12:19 ID:/X9xbDvX]
- 誤変換晒しに飽きたから。
|

|