[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 2chのread.cgiへ]
Update time : 05/09 19:45 / Filesize : 150 KB / Number-of Response : 712
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Anthy スレッド 8



1 名前:login:Penguin [2007/08/01(水) 19:53:10 ID:GR1p730l]
フリーでセキュアな日本語入力システムAnthyのスレッドです。

本家
anthy.sourceforge.jp/
anthy.sourceforge.jp/cgi-bin/hiki/hiki.cgi

前スレ
pc11.2ch.net/test/read.cgi/linux/1135922823/

533 名前:login:Penguin mailto:sage [2007/11/13(火) 12:55:57 ID:nUsqIDI1]
>>532 それは半分くらい正しいと思うけど、
うつみタンかわいそうな方向に行っている希ガス。。
あれするんだったら変換モデル変更する前のバージョンの Anthy から fork
してその上で調整しないと、わざわざコーパス外して使っている人あまり
いないだろうし、ほとんど無駄じゃないのかな

534 名前:login:Penguin mailto:sage [2007/11/13(火) 13:03:05 ID:j4s0F97X]
猿公

535 名前:login:Penguin mailto:sage [2007/11/13(火) 13:21:53 ID:JG69Lpby]
>>533 品詞間の頻度の差はコーパスとアンシー内部の計算にすべてまかして、同品詞内の頻度差のみを辞書であたえればいいんじゃないかと思ってるけどどうかな? だから、今みたいに、違う品詞間の頻度差も辞書に与えてしまっている方向性はだめだと思うよ。

536 名前:login:Penguin mailto:sage [2007/11/13(火) 13:57:20 ID:ztK3M4l8]
まとめ: 口ばかり動かして手を動かさないやつばかりだから変になっている。

537 名前:login:Penguin mailto:sage [2007/11/13(火) 15:06:20 ID:JG69Lpby]
手の動かしかたが間違ってるって話なんだけどね。手動かさなきゃ変になりようないじゃんw


538 名前:login:Penguin mailto:sage [2007/11/13(火) 15:39:38 ID:ztK3M4l8]
>>537
歩く口君、乙!!

539 名前:login:Penguin mailto:sage [2007/11/13(火) 16:03:38 ID:fS2Lo3ov]
品詞にフラグ付けられるようには出来ないのかねぇ。
ライオン #T35@ANIMAL
ネズミ #T35@ANIMAL
小 #PRE@ANIMAL
親 #PRE@ANIMAL
とか
林檎 #T35@FRUIT
レモン #T35@FRUIT
果汁 #SUC@FRUIT
酒 #SUC@FRUIT
みたいに。

540 名前:login:Penguin mailto:sage [2007/11/13(火) 16:21:51 ID:ztK3M4l8]
言い出した人がやらないなら誰もやらない――言い出しっぺの法則

541 名前:login:Penguin mailto:sage [2007/11/13(火) 16:32:21 ID:VNAApg1W]
ATOKx3夕胎盤のメールきたお(´・ω・`)

って、なんだ?夕胎盤って('A`)



542 名前:login:Penguin mailto:sage [2007/11/13(火) 16:36:42 ID:VNAApg1W]
「ゆうたい」だと「優待」になるんだけど
「ゆうたいばん」って続けると「夕胎盤」(・∀・)9100d

区切り変えたら覚えたからいいんだけど、相変わらずAnthy語は笑わせてくれますな。

543 名前:login:Penguin mailto:sage [2007/11/13(火) 16:36:44 ID:fS2Lo3ov]
>>540
そりゃそうだ。気が向いたら作ってみようと思う。

544 名前:login:Penguin mailto:sage [2007/11/13(火) 16:45:11 ID:JG69Lpby]
うちのanthyだと雄太イバンになったwwwなんだよそれwww


545 名前:login:Penguin mailto:sage [2007/11/13(火) 16:47:37 ID:VNAApg1W]
ちょいと質問

「案内が来た」って出そうとすると「案内が着た」って最初に出てくるんだけど
これを「案内が来る」と一つの単語で登録するには、何の瀕死で登録すればいいのかな?

#「ひんし」は「品詞」より「瀕死」の方が上ですか、そうですか(・ω・)


546 名前:login:Penguin mailto:sage [2007/11/13(火) 16:49:02 ID:uCv2IKAb]
(・∀・)9100d
  ↓
(・∀・)b
に見えた。

547 名前:login:Penguin mailto:sage [2007/11/13(火) 16:51:46 ID:j4s0F97X]
裕太イバン

548 名前:login:Penguin mailto:sage [2007/11/13(火) 16:56:10 ID:j4s0F97X]
案内が来た
瀕死
優待
裕太イバン
燗する
やる気

移動者
レッカー移動者
先生と子供
二度目のな津が杉タコ炉、あなたは突然変わったの
背理直す
背理な幼い


549 名前:login:Penguin mailto:sage [2007/11/13(火) 16:57:37 ID:fS2Lo3ov]
>>545
試して無いけど 案内が来 #KX かな。読みどうなるんだろ

550 名前:login:Penguin mailto:sage [2007/11/13(火) 17:14:36 ID:VNAApg1W]
案内は【来た】であって「着た」「北」「木田」「喜田」なんてあり得ないし
どう考えても、案内が【来る】であって「繰る」「刳る」「久留」なんて変な言葉絶対に使わないから
とりあえず単漢字扱いで霞に登録しておいたわん。

551 名前:login:Penguin [2007/11/13(火) 18:35:06 ID:0/oCire4]
>>542
「優待版」って辞書登録されて無いだけだろ。

>>545
udict に以下のように登録してから、calctransの中で make update_params
して、その後にmake clean, make , make install

こ () #kxo 来
あんない () #T35 案内




552 名前:login:Penguin [2007/11/13(火) 18:42:20 ID:0/oCire4]
あさからとうきょうにいくよていです
誤: 浅香らと右京に郁代邸です
正: 朝から東京に行く予定です

問題点: 辞書に「ゆく」はあるが「いく」が無い。

version 9100d


553 名前:login:Penguin mailto:sage [2007/11/13(火) 18:54:01 ID:VNAApg1W]
>>552
9100dだけど、分節区切り直したら「いくよていです」で「行く予定です」になったお。
最初は郁代邸でヒロミカワイソスで笑ったけど(・ω・)

554 名前:login:Penguin [2007/11/13(火) 19:25:09 ID:0/oCire4]
>>553
「あさから、とうきょうにいくよていです」だと、
「朝から、東京に行く予定です」と文節を区切りなおすことなく
正しく変換されるんだな。 
だから「あさからとうきょうにいくよていです」にも同じ事を期待したわけだ。




555 名前:login:Penguin mailto:sage [2007/11/13(火) 20:06:58 ID:HSvxc5en]
昔のanthyは、元々あったcanna辞書を上手く使えるように作ってあった
性能に行き詰まりを感じ、辞書を無視してとにかく良さげなアルゴリズムを使う事だけを考えて大改造した
でも辞書は昔のままなので、「姦する」になったりして使い物にならん
これであってる?

辞書のメンテナの負担は考えたのか?
なんで開発版と安定版に分けなかったのか?これは各ディストリの仕事かもしれないけど

556 名前:login:Penguin mailto:sage [2007/11/13(火) 20:29:21 ID:j4s0F97X]
朝から東京に郁代邸です。

557 名前:login:Penguin mailto:sage [2007/11/13(火) 20:35:26 ID:ytRHIJ73]
開発版と安定晩にはわかれてたよ。
下二桁が00になってるのが安定版。
実質的には00bあたりだったけどw

558 名前:login:Penguin [2007/11/13(火) 20:54:54 ID:0/oCire4]
>>556
「あさからとうきょうにくるよていです。」はどうなります?


559 名前:login:Penguin mailto:sage [2007/11/13(火) 20:59:23 ID:VNAApg1W]
556じゃないけど、朝から東京に久留予定です(・ω・)

560 名前:login:Penguin mailto:sage [2007/11/13(火) 22:15:18 ID:JG69Lpby]
>>555
本当はどこかから、forkしたらよかったんだけど、 以前のアンシーは細かいバグだらけで結局安定版はなかったのさ。
結局すべてのバグも把握した人が、作りつづけるしかないんだと思うんだけど、逃げちゃったからね…


561 名前:login:Penguin mailto:sage [2007/11/13(火) 22:21:30 ID:CyYxFPqD]
1.ヨクト有情する
2.よくと雨上する
正解: よく登場する

ゆうたいばん -> 幽体版  ( ゚д ゚)
死んでもATOK使えってことか?



562 名前:login:Penguin [2007/11/13(火) 22:39:24 ID:SUigmv/k]
朝から東京に来る予定です

563 名前:login:Penguin mailto:sage [2007/11/13(火) 23:19:15 ID:FN+8gT0H]
朝から千葉似来る予定です

564 名前:login:Penguin mailto:sage [2007/11/13(火) 23:57:57 ID:j4s0F97X]
>>558
朝から東京にくる予定です。

565 名前:login:Penguin mailto:sage [2007/11/13(火) 23:58:42 ID:j4s0F97X]
>>561
欲登場する

566 名前:login:Penguin mailto:sage [2007/11/14(水) 00:46:10 ID:V1TwYX7L]
俺はよく「xx歳」の「歳」で困る。なかなか出ない。


567 名前:login:Penguin mailto:sage [2007/11/14(水) 11:01:09 ID:TQfZfvPm]
>>555
俺も大体そんなところだと思ってる。
雰囲気的には、単にヒューズの現象に陥っているだけのような気がする。
ほとんどの不都合は辞書のメンテとちょっとしたパラメータ設定で解決できるのではないか。

568 名前:login:Penguin mailto:sage [2007/11/14(水) 14:49:33 ID:3YFatpuC]
そうやってFreeWnnは永い眠りについてしまったわけですが…

まあ俺は化石な知識しかないので、どういう事態になっても見守ることしか出来ないが。


569 名前:login:Penguin mailto:sage [2007/11/14(水) 15:37:54 ID:+LGizqS+]
服を来た
教徒から来た

京都もアレだが。。。この「きた」はどうにもならんのだろうか。

570 名前:login:Penguin mailto:sage [2007/11/14(水) 15:53:37 ID:IFRauBcy]
教徒から来た
服を来た
服を切る

「きょうと」単体で変換しようとすると19/20で、京都よりも上の位置に「凶徒」だとか「兇徒」「恭と」などが鎮座している。
他の単語でも宗だけど、Anthyの作者って、マジで何か特殊な思想でも持ってるか?

「宗だけど」も操舵な('A`)

571 名前:login:Penguin mailto:sage [2007/11/14(水) 15:59:53 ID:IFRauBcy]
恭と平行→京都|屁|いこう←「京都へ行こう」を出そうと分節区切ると、すげえ笑える

(゚д゚)…





572 名前:login:Penguin mailto:sage [2007/11/14(水) 17:34:34 ID:ko8Dh7re]
服を来た
京都から来た
服を切る
宗だけど
教徒平行


573 名前:login:Penguin mailto:sage [2007/11/14(水) 17:53:57 ID:IFRauBcy]
不と思ったのだが、Anthyの生み出す言葉って、80年代の戸川純とかゲルニカの歌のタイトルとか歌詞に出てきそうな
単語が多いよね。妙にアングラチックで…(゚д゚)

574 名前:login:Penguin mailto:sage [2007/11/14(水) 18:34:17 ID:ScUFKXXN]
散光にして

575 名前:login:Penguin [2007/11/14(水) 22:35:08 ID:a81/VJaL]
>>569

それなら「服」と「着る」の間に関連付けを作ってやればよい。
それを緩やかに行うのが、corpusであり、
それを厳密に行うのが udictの設定だと思っている。
「京都」と「行く」とか、「京都」と「観光」の間に関連付けがあれば、
そんなにおかしな同音異義語が出にくくなるだろう。
それが、 >>567の言う「ちょっとしたパラメータ設定」だと思ってる。

576 名前:login:Penguin mailto:sage [2007/11/14(水) 23:06:04 ID:Bd6FzGoW]
で、辞書のメンテとちょっとしたパラメータ設定が終わったと思ったらまた新アルゴリズムに切り替えですか

577 名前:login:Penguin mailto:sage [2007/11/14(水) 23:08:26 ID:6sHrvA8g]
nanthyってなんだろ?関係あんのかな
ttp://d.hatena.ne.jp/nazodane/searchdiary?word=%2a%5bNanthy%5d

578 名前:login:Penguin mailto:sage [2007/11/14(水) 23:11:36 ID:ScUFKXXN]
>>577
ググれ

579 名前:login:Penguin mailto:sage [2007/11/14(水) 23:41:11 ID:y1vGSery]
Anthy変換のまま小説を書ききったら
ある意味で世紀の作品ができあがるのかもしれない

580 名前:login:Penguin mailto:sage [2007/11/14(水) 23:41:59 ID:oOxq3Gyf]
てーくゆーらーぶみー

581 名前:login:Penguin mailto:sage [2007/11/14(水) 23:59:58 ID:1r749re+]
コーパスの文例を品詞を考えた上でまず増やさないと。corpus_info覗いてみればわかるけど、1個とか2個くらいしかない組成の組だらけだし。 ありがちな組成の組が最悪一つは入っていない状態じゃないと、確率に差が出すぎちゃって変な候補がでてくるyo



582 名前:login:Penguin mailto:sage [2007/11/15(木) 00:06:09 ID:p3gPAl6Z]
恋済み

ワラタ

小泉が出ない

作者はもう恋なんてしない人なのかw


583 名前:login:Penguin mailto:sage [2007/11/15(木) 00:10:09 ID:djOqQP0O]
とりあえず同音異義語とか難易度が高いものはしかたないとしても
「関する」で「姦する」が出るとか、ありえないような言葉が出てくるのは勘弁して欲しい。
ちなみにATOKとかだと「かんする」では「姦する」なんて出てこないんだな。

584 名前:login:Penguin mailto:sage [2007/11/15(木) 00:25:27 ID:+a+rbqpF]
dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%81%8B%E3%82%93%E3%81%99%E3%82%8B&dtype=0&stype=1&dname=0na&pagenum=1&index=04112003915000
かん・する【×姦する】
「かんする」を大辞林でも検索する

[動サ変]Z69C1.gifかん・す[サ変]

1 婦女子を犯す。

2 姦通する。

585 名前:login:Penguin mailto:sage [2007/11/15(木) 00:48:50 ID:yWcmaxW2]
>>584
noun.depwordの問題だyo
@名詞のあと "" .@する名詞 .@さ(名詞化)
をコメントアウトしたら?


586 名前:login:Penguin mailto:sage [2007/11/15(木) 00:49:53 ID:yWcmaxW2]
>>583 Ne


587 名前:login:Penguin mailto:sage [2007/11/15(木) 00:53:27 ID:WPr7WJjs]
>>582
そんな候補出ないけどな
upup.moe.hm/imgbbs/upload/1195054627-48.png

「恋済み」でググってみても
「小泉」の言い替えや誤変換ネタぐらいにしか使われてないっぽいが
www.google.co.jp/search?q=%22%E6%81%8B%E6%B8%88%E3%81%BF%22

588 名前:login:Penguin mailto:sage [2007/11/15(木) 00:59:19 ID:+a+rbqpF]
>>587
ヒント: 2ch.t

589 名前:login:Penguin [2007/11/15(木) 01:39:11 ID:EisoRklq]
以下の例文は、9100dで変換できるようになりました。
ご確認いただき、Anthy Wikiの「誤変換晒しあげ」リストの
メンテをお願いします。
  * 生還論 | 征韓論 (9100)
* 地下○ | 近まる (9100)
* 簡単だった全モデル | 簡単だった前モデル (9100)
* どう解離時 | 同会理事 (8019)
* 後輪芹 | 降臨せり(anthy-9100b)
* NOVA死亡 | 伸ばし棒(anthy-9100)
* 総小間生が | そう思うが(anthy-9100b)
* 再送しん | 再送信(anthy-9100)
* 采配しん | 再配信(anthy-9100)
* 田方め | 誰が為(anthy-9100)
* 雨の日二課さをさす | 雨の日に傘をさす(anthy-9100d)
* 注意し魔性 | 注意しましょう(anthy-9100b)
* 羽賀検事 | 羽賀研二(anthy-9100b)
* 再と名 | サイト名(anthy-9100)
* ヌルっと | ヌルッと(anthy-9100b)
* 工事日 | 公示日(anthy-9100)
* 極意恥部の | ごく一部の(anthy-9100b)
* タカかれ引く彼 | 高かれ低かれ(anthy-9100)
* 九塁打す | 狂いだす(anthy-9100b)
* 場加奈子とをしてしまった | 馬鹿な事をしてしまった(anthy-9100b)
* 螺不満が | ラフ漫画(anthy-9100b)
  * 考えるだろ海栗 | 考えるだろうに(anthy-9100)
* テストさせてくださいマシ | テストさせてくださいまし(anthy-9100)


590 名前:login:Penguin mailto:sage [2007/11/15(木) 02:23:14 ID:+a+rbqpF]
>>589
把握。

591 名前:login:Penguin mailto:sage [2007/11/15(木) 04:53:06 ID:BmXkt0JF]
>>589
はて

>* どう解離時 | 同会理事 (8019)
度鵜飼理事

>* 再送しん | 再送信(anthy-9100)
再送しん (変化なし)

>* 采配しん | 再配信(anthy-9100)
采配しん (変化なし)

>* 田方め | 誰が為(anthy-9100)
堕がため

>* 雨の日二課さをさす | 雨の日に傘をさす(anthy-9100d)
雨の日二課さをさす (変化なし、ってか9100dで誤変換すると言ってる)

>* 極意恥部の | ごく一部の(anthy-9100b)
極意恥部の (変化なし)

>* 場加奈子とをしてしまった | 馬鹿な事をしてしまった(anthy-9100b)
場加奈子とをしてしまった (変化なし)

>* 考えるだろ海栗 | 考えるだろうに(anthy-9100)
考えるだろ|うに (まだ文節が怪しい)



592 名前:login:Penguin mailto:sage [2007/11/15(木) 05:13:00 ID:+a+rbqpF]
>>589
done. 分節が変なのはそのまま、それ以外は移動。udictに追加した方が良いと思うものも移動してるので注意。

"ごく一部"はどうなってるか未確認。
二課さ(名詞+さ)は方便だろうから問題ないと判断。

593 名前:login:Penguin [2007/11/15(木) 09:06:36 ID:EisoRklq]
>>591
再送信、再配信は9100dのalt-cannadic/gcanna.ctdにありますけど、
そちらの環境では出なかったようですね。


594 名前:591 mailto:sage [2007/11/15(木) 13:31:41 ID:Da9qv4nj]
>>593
第一候補が再送しん、采配しんになるんだよ
再送信も再配信も候補の中にはある

595 名前:login:Penguin mailto:sage [2007/11/15(木) 16:04:35 ID:djOqQP0O]
9100d
同会理事
再送信
再配信
ダレがため
雨の火に傘をさす
極一部の
バカなことをしてしまった
考えるだろ|うに

596 名前:login:Penguin mailto:sage [2007/11/15(木) 16:13:39 ID:gBHZX5+t]
>ダレがため
「誰が為」は「だがため」と読む

597 名前:login:Penguin mailto:sage [2007/11/15(木) 16:20:48 ID:djOqQP0O]
>>596
あら、お恥ずかしい(;・Д・)

んで「だがため」だと「堕固め」_| ̄|○、;'.・

598 名前:login:Penguin mailto:sage [2007/11/15(木) 16:26:12 ID:p5aeWzAw]
「たがため」でしょ。

599 名前:login:Penguin mailto:sage [2007/11/15(木) 16:29:50 ID:yWcmaxW2]
>>593,594
fix.depwordの
@の? "" Se@

@の? "の?" Se@
に直せば、「何々しん」は直るんじゃね。
というか、depgraph、ちゃんと分かる人に
全体的に直してもらったほうがいいyo

素人にはここまでたどり着くのに一日かかったorz


600 名前:login:Penguin mailto:sage [2007/11/15(木) 16:36:07 ID:V8mHVO2V]
>>595
Debian使いか?

601 名前:login:Penguin mailto:sage [2007/11/15(木) 16:44:22 ID:djOqQP0O]
>>600
なぜ、Debian?



602 名前:591,596 mailto:sage [2007/11/15(木) 16:55:06 ID:4xzFtqjj]
>>598
Ω ΩΩ<ナ、ナンダッテー!?

俺あほすぐるwww

603 名前:login:Penguin mailto:sage [2007/11/15(木) 17:03:27 ID:/FjSxP+a]
たがためにかねはなる

って本知らない?

604 名前:login:Penguin mailto:sage [2007/11/15(木) 17:21:29 ID:djOqQP0O]
>>603
「誰がために鐘は鳴る」ってヘミングウエイの本なんだね。
だけどwik見ると「誰が為に鐘は鳴る」って映画の邦題でつけられたものみたい。

まあ、こういう細かい物も変換で切るようになるのはうれしいけど
もっと基本的な所を優先的に頑張れよ!といいたい。

#(変換できる)ってパーツで書くと変換するけど、長めの文章で書くと
「変換で切る」になりやがる。


605 名前:login:Penguin mailto:sage [2007/11/15(木) 17:27:07 ID:+a+rbqpF]
>>599
ソース解析して適当にドキュメント化してみた@anthy wiki

#depgraphに変なのが含まれてないかは全ての組み合わせを表示して目視でチェックできる気ガス。

606 名前:login:Penguin mailto:sage [2007/11/15(木) 20:29:36 ID:BY1UZpgF]
サイボーグ戦士 誰が為に戦う@scim-anthy1.2.4
一発だが

607 名前:login:Penguin mailto:sage [2007/11/15(木) 20:32:04 ID:JWQPvUSL]
私の名前花香のです

608 名前:login:Penguin mailto:sage [2007/11/15(木) 21:36:55 ID:rbqr7GIO]
みやげや
で変換すると
土産屋土産
とか出るんだけど

609 名前:login:Penguin [2007/11/15(木) 23:05:35 ID:EisoRklq]
晒し上げに「美しい国」の誤変換例を書いている人がいるけど、
「うつくしいくにです」にしたら結果はどうなるかな?


610 名前:login:Penguin mailto:sage [2007/11/15(木) 23:22:59 ID:kDozd+3d]
美しい区に
美しいくにです

611 名前:login:Penguin mailto:sage [2007/11/15(木) 23:23:15 ID:p3gPAl6Z]
嵐ヶ丘
一発変換

風と共にさりぬ
去りぬが出ない

>>606
ゆとりすぎ



612 名前:login:Penguin mailto:sage [2007/11/15(木) 23:29:45 ID:kDozd+3d]
>>609
その程度は、変換候補2〜3回出せば変換で切るからたいした問題ではないのでは?
ただ「くにです」で「国です」より上に「六合です」ってのが解せないけど。

「へんかんできる」だと一発で「変換できる」になるけど「へんかんできるから」とか文章が都筑と
「変換で切るから」になるんだな。

あああ、「続く」も文章の中だと「都筑」が上になるー。もう嫌('A`)

613 名前:login:Penguin mailto:sage [2007/11/15(木) 23:30:51 ID:kDozd+3d]
風と共にさり奴・゚・(ノД`)・゚・。

614 名前:login:Penguin mailto:sage [2007/11/15(木) 23:40:42 ID:BY1UZpgF]
なんかどうでもいいような…

変なところにこだわりのある日と美とだねぇ
誤変換外野なら単文節で変換すりゃ飯野に
わざわざ長文の口語体を変換させて誤変換をあげつらうなんてよっぽど暇なんだな
っ手三行目一発じゃん

615 名前:login:Penguin mailto:sage [2007/11/15(木) 23:46:25 ID:rKxukPZ3]
私の名前は中野です 9100d
さすがにこれが出なかったら不味いわ

616 名前:login:Penguin mailto:sage [2007/11/15(木) 23:55:12 ID:yWcmaxW2]
だからコーパス増やさないとだめだとおもうyo。協力してあげてね。


617 名前:login:Penguin mailto:sage [2007/11/16(金) 00:04:40 ID:xx62RFyR]
コーパスは対処療法すぎるyo。副作用大きすぎ。

618 名前:login:Penguin mailto:sage [2007/11/16(金) 00:11:18 ID:q48lYqqL]
わかった!メモリ1GB買い足そうと思ってた1万円でATOK買うお!( ^ω^)

619 名前:login:Penguin mailto:sage [2007/11/16(金) 00:25:13 ID:N+Z040/o]
ヒント: このスレをコーパスにして学習させるw (カオスw)

620 名前:login:Penguin mailto:sage [2007/11/16(金) 00:56:02 ID:NzZ0Zluz]
>>617
何だよ副作用ってw


621 名前:login:Penguin [2007/11/16(金) 00:56:07 ID:STPJJiQ8]
「このすれ」を入力すると、まず「子のスレ」が出てくるんだけど、
「子」の頻度が254で、「この」の頻度が200だから、
「子の」が優先されてるのでしょうかね。




622 名前:login:Penguin mailto:sage [2007/11/16(金) 11:16:04 ID:+HwSmH88]
単語の頻度だけでやっちゃあまずい気がするのだが

623 名前:login:Penguin mailto:sage [2007/11/16(金) 12:42:51 ID:3IuhgM/L]
>>621 gcanna.ctdの「こ」のエントリで「#T35*201 こ 娘」があるけど、 これが問題。この部分を「#T35*201 娘」にして、コーパスの計算しなおせば直るyo 辞書の頻度を見るんじゃなく、品詞、コーパスの構造両方の整合性を見ないと。

624 名前:login:Penguin mailto:sage [2007/11/16(金) 13:12:28 ID:vfB7Y+Dm]
>>614
SKK最強!

625 名前:login:Penguin mailto:sage [2007/11/17(土) 02:27:37 ID:rz7lMhcB]
子のすれ
私の名前は中野です
変な所にこだわりのある日と美とだねぇ
誤変換外野なら単文節で変換スリゃいいのに
わざわざ長文の口語体を変換させて誤変換をあげつらうなんてよっぽど暇なんだな
風とともにさり奴
嵐ヶ丘
美しい国
美しいくにです
変換できる
他固めにかね葉なる

626 名前:login:Penguin [2007/11/17(土) 12:27:25 ID:YOPzWmbE]
けんげんいじょう で「権限委譲」が出てくるけど、「権限移譲」は
出てこない。 9100d



627 名前:login:Penguin [2007/11/17(土) 12:33:50 ID:YOPzWmbE]
>>620
コーパスは文節で切れていても、品詞情報が無い。
そのため「このすれ」をコーパスで学習させても、「このスレッド」
でその学習結果が使われるとは限らない。 だからコーパスは膨大な
量を集めないと正しい結果の方向で収束しない。

>>625
映画のタイトルよりも、東証一部の会社名を
正しく変換できる方が先だと思うが。


628 名前:login:Penguin mailto:sage [2007/11/17(土) 16:25:38 ID:CZfADcwS]
それでみんなコーパス送っているのか?

629 名前:login:Penguin mailto:sage [2007/11/17(土) 16:42:37 ID:NBnDx9mS]
>>627
quote.yahoo.co.jp/q?s=2152.j&d=t
この会社は変換出来るか

630 名前:login:Penguin mailto:sage [2007/11/17(土) 17:16:16 ID:Im1lqxt/]
>>628
送ってるよ〜でも今SKK使い始めちゃったorz

631 名前:login:Penguin mailto:sage [2007/11/17(土) 17:58:48 ID:CZfADcwS]
いまコーパスって何文?



632 名前:login:Penguin mailto:sage [2007/11/17(土) 18:46:54 ID:6HvMzrcd]
>東証一部の会社名を

興味ね〜オヤジかよw

633 名前:login:Penguin mailto:sage [2007/11/18(日) 09:21:58 ID:/VF6+UY7]
>>627>>623






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<150KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef