自然言語処理スレッド ..
482:デフォルトの名無しさん
07/09/22 13:52:00
はぁ?
483:デフォルトの名無しさん
07/09/22 14:36:55
ウィキペディアってネタとしてちょうどいいと思うんだけど、
HTML化するようなパーサってないのかな?
484:デフォルトの名無しさん
07/09/22 14:37:33
↑無かったら作ろうと思うんだけど
485:デフォルトの名無しさん
07/09/22 17:30:43
haa?
486:デフォルトの名無しさん
07/09/22 17:32:50
>>483
日本語でおk
487:デフォルトの名無しさん
07/09/22 18:51:22
>>485
>>486
お騒がせしました。
結局パーサー書きました。
488:デフォルトの名無しさん
07/09/22 22:52:38
なぜHTMLにする?
489:デフォルトの名無しさん
07/09/24 05:22:47
TeXにしたほうがいいよな。
490:デフォルトの名無しさん
07/09/24 05:23:15
なぜtex
491:デフォルトの名無しさん
07/09/24 05:23:50
レスはやっ
492:デフォルトの名無しさん
07/09/24 08:57:38
>>468
芝公園の小僧、出てきたな
493:デフォルトの名無しさん
07/09/24 09:05:14
その件はカテゴリー文法の研究を参照しるといったのに
あとは『構造の自動抽出』(ADIOS)な
494:デフォルトの名無しさん
07/09/24 11:25:04
wikipediaなら、XMLで持ってきて後はどうにでもなるんじゃないの?
495:デフォルトの名無しさん
07/09/24 12:04:54
>>494
どういう風に?
やっぱりRubyとか使うんですか?
496:デフォルトの名無しさん
07/09/24 13:29:35
HTMLにする理由がよくわからないってだけで、
XMLを読み込んでどうするかは、何やるか次第だからわからんけど。。
rubyが好きとか、使いたいモジュールがrubyにあるなら、rubyにするんじゃない?
俺はたぶんJavaを使う。XML関係は充実してるし、jdk1.5から入った、
concurrent周りが結構充実してるので、そういうの使って、
(無理矢理)並列化して、たくさんあるCPU/CPU coreをフル稼働するのが最高。
まあ、このスレだと、こういう低レベルな話は関係なさそうだけど…
497:デフォルトの名無しさん
07/09/24 13:51:44
要約すると単なる妄想
498:デフォルトの名無しさん
07/09/24 14:33:30
ありがとう。
499:デフォルトの名無しさん
07/09/24 16:49:55
>>497
確かに酷いもんだな
ゲノムやっとけゲノム。
なまばけがくじょうほうしょり。
500:デフォルトの名無しさん
07/09/25 03:21:25
rubyとかゲノムとかここは酷いインターネットですね
501:デフォルトの名無しさん
07/09/25 10:36:30
ruby最高!フォー!
502:デフォルトの名無しさん
07/09/25 14:06:53
まつもと乙
503:デフォルトの名無しさん
07/09/25 18:51:17
ruby乙
504:デフォルトの名無しさん
07/09/25 20:48:05
>>500
HTMLにする理由がわからない・・・XMLを読み込んで・・・
というあたりから、なにも知らないというか調べてもいないってことが分かる。
尚且つ、何やってんの馬鹿?みたいな態度で批判してる。
これらを合わせると、rubyとlinuxを使ってるかなーと。
rubyとかlinuxは実践しなくても妄想力だけで偉くなれるから。
それでrubyが出てくるわけで他意はない。
505:デフォルトの名無しさん
07/09/26 03:06:51
rubyを批判するのはいくないと思います
506:デフォルトの名無しさん
07/09/26 03:58:05
_____
(すた☆らき)
 ̄ ̄\| ̄
URLリンク(www.freewebs.com)
507:デフォルトの名無しさん
07/09/26 12:53:18
HTMLにする理由は確かにわからんなw
XMLデータ取ってきて、タグ排除して、生コーパスにして、インデキシング作成するならともかく・・・
508:デフォルトの名無しさん
07/09/26 16:48:50
HTML厨自重
509:デフォルトの名無しさん
07/09/26 19:27:43
>>505
rubyを批判してるんじゃなくて、rubyを使うやつにはなぜかカスが多いと・・・
510:デフォルトの名無しさん
07/09/27 00:15:09
ruby好きとバイオインフォ屋にはろくなの居ないな
511:デフォルトの名無しさん
07/09/27 00:19:15
かすでも何となく使えるのがrubyだから。
512:デフォルトの名無しさん
07/09/27 01:56:14
rubyのコンセプトは?
513:デフォルトの名無しさん
07/09/27 09:47:32
>>512
loveとend
514:デフォルトの名無しさん
07/09/27 10:39:42
短小・・
515:デフォルトの名無しさん
07/09/27 20:17:22
もうrubyしか見えない
516:デフォルトの名無しさん
07/09/27 21:03:11
Javaもいい言語なのに、なぜか使ってるやつはカスばかり。
不思議だよねぇ。
517:デフォルトの名無しさん
07/09/27 21:05:59
> XMLデータ取ってきて、タグ排除して、生コーパスにして、インデキシング作成するならともかく・・・
馬鹿発見。
518:デフォルトの名無しさん
07/09/28 03:07:06
なんでも馬鹿馬鹿言えば良いものではない。
馬鹿の典型。
519:デフォルトの名無しさん
07/09/28 03:08:46
>>507
ちょw
それで共起取るのが俺の卒研ww
そしてその処理はCだがな。Rubyとか馬鹿言語は死んでも使わん。
520:Ruby
07/09/28 08:27:15
<馬鹿馬鹿言うなー!
お前らより余程頭が良いわ!
と申しております。
521:デフォルトの名無しさん
07/09/28 09:27:26
>>519
ダメだこりゃ
522:デフォルトの名無しさん
07/09/28 10:18:21
XML意味ねえ
523:デフォルトの名無しさん
07/09/28 10:30:50
XMLは、単に元から提供されてるデータ構造でしょ。
わざわざXMLを選んでるんじゃなくて、元がその形式だからしょうがない。
多分、話がかみ合ってない人は、wikipediaのデータが、xml形式で提供されてるのを知らないんだろうな。
まぁ、そこからHTML化はありえないが・・・
524:デフォルトの名無しさん
07/09/28 10:33:52
>>519
よう俺
タグ外しは流石にperlの正規表現使ったけどな。Cって共起計算の方だよな?タグ外しまでCでやってるとかならテラアフォすw
XMLパーサー使えば、データだけ簡単に取れると思ってたら、ファイルサイズが巨大すぎてそもそもパーサーが読み込んでくれなかった罠・・・orz
525:デフォルトの名無しさん
07/09/28 10:40:51
rubyとかperlはCを使えないようなアホが使う言語
俺は死んでもあんなもん使わない
526:デフォルトの名無しさん
07/09/28 13:13:05
やりたい処理への向き不向きでプログラミング言語は使い分けるだろう。常考。
527:デフォルトの名無しさん
07/09/28 13:26:08
>>525
お前が一番アホ
528:デフォルトの名無しさん
07/09/28 23:17:58
>>527
Cを使いこなせない低脳乙w
529:デフォルトの名無しさん
07/09/28 23:37:38
∩_
〈〈〈 ヽ
〈⊃ }
∩___∩ | |
| ノ ヽ ! !
/ ● ● | /
| ( _●_) ミ/ <こいつ最高にアホ
彡、 |∪| /
/ __ ヽノ /
(___) /
530:デフォルトの名無しさん
07/09/28 23:43:34
URLリンク(www.premiumtv.12gbfree.com)
531:デフォルトの名無しさん
07/09/29 03:54:45
>>528
ruby = Cが使えない低脳
rubyがCで実装されていることをふまえて証明してくれ
532:デフォルトの名無しさん
07/09/29 04:36:51
機械言語処理を語るスレはここですか?
533:デフォルトの名無しさん
07/09/29 06:10:36
>531
それが何か意味のある事か?
perlを見たまえ
534:デフォルトの名無しさん
07/09/29 06:16:18
∩_
〈〈〈 ヽ
〈⊃ }
∩___∩ | |
| ノ ヽ ! !
/ ● ● | /
| ( _●_) ミ/ <こいつ最高に低学歴
彡、 |∪| /
/ __ ヽノ /
(___) /
535:デフォルトの名無しさん
07/09/29 10:57:58
∩_
〈〈〈 ヽ
〈⊃ }
∩___∩ | |
| ノ ヽ ! !
/ ● ● | /
| ( _●_) ミ/ <こいつら最高だぜ!
彡、 |∪| /
/ __ ヽノ /
(___) /
536:低学歴
07/09/29 14:08:52
よんだかー
技術で返せるなら付き合ってやるぞー
ちとヒマなんだ
537:Pustejovsky
07/09/30 20:40:30
Cで書かれたXMLパーサもしらねぇようなクズが、
自然言語そっちのけで低レベルな自作自演やってるなw
538:デフォルトの名無しさん
07/10/01 10:12:02
自然言語ってなに?
539:デフォルトの名無しさん
07/10/01 10:23:40
別に、Cじゃなくてもいいじゃん。
540:デフォルトの名無しさん
07/10/01 15:02:13
ソース見て思いましたが、自然言語処理って
必要なソース規模が意外に小さいですね
541:デフォルトの名無しさん
07/10/01 23:27:50
>>540
>必要なソース規模が意外に小さいですね
意味解析のソースのサイズはチェックした?
542:デフォルトの名無しさん
07/10/02 09:13:33
自然言語処理で、形態素解析とn-gramのことを指していました。
人工無脳用に自作可能か考えていました。
自然言語処理の意味解析はプログラミング言語(型や有効範囲)と比べて、
かなり複雑そうですね。
543:デフォルトの名無しさん
07/10/02 11:16:32
比べる対象があって小さいとか大きいと言えるんだと思うが
544:デフォルトの名無しさん
07/10/02 11:23:06
人間の経験則に基づく感覚だろう。
機械には真似が出来ない芸当だね!
545:デフォルトの名無しさん
07/10/02 11:24:44
形態素解析は1から作るとやる事が案外多いぞ。
基本的なことは簡単なんだが、前線で使われてるようなのは、かなり改良が加えられたり
新しい技術が入ってるから、それらを全て調べた上で、ベストなものを選んで取り入れるのは骨が折れる。
車輪の再開発以外の何物でもないから、自作はやめとけ。
546:デフォルトの名無しさん
07/10/02 11:41:58
>>545
対象を万葉集の短歌などに限定すれば、
形態素解析も良い課題だと思うが。
547:デフォルトの名無しさん
07/10/02 11:45:37
人口無能用っしょ?
548:デフォルトの名無しさん
07/10/02 17:32:03
人口無能って芸がないよな
万葉集って何?
とかすぐ聞く奴だろ?
549:デフォルトの名無しさん
07/10/02 17:55:09
それお前。
550:デフォルトの名無しさん
07/10/02 18:22:53
549ってアホ?
551:デフォルトの名無しさん
07/10/02 19:07:24
550は古今和歌集を知らないアホ
552:デフォルトの名無しさん
07/10/02 19:50:18
おーい551は人口無能だよー
ていうか無能だひょ
553:デフォルトの名無しさん
07/10/02 22:34:01
正解w
554:デフォルトの名無しさん
07/10/06 20:18:51
インサイダー情報で株式投資するか
極秘情報を横流しすれば小遣い稼ぎになるよ
555:デフォルトの名無しさん
07/10/07 17:32:17
犯罪
556:デフォルトの名無しさん
07/10/07 17:37:42
は?何でだよw
557:デフォルトの名無しさん
07/10/07 18:08:16
犯罪
558:デフォルトの名無しさん
07/10/07 18:09:24
は?何でだよw
559:デフォルトの名無しさん
07/10/07 18:36:33
クズめ
560:デフォルトの名無しさん
07/10/11 00:07:09
なんか糞スレ化してるなw
NAISTのヤツって変なヤツが多いんだな
561:デフォルトの名無しさん
07/10/11 01:03:33
全入だからしょうがない
562:デフォルトの名無しさん
07/10/11 20:04:03
学部ならともかく、大学院なんてどこも全入みたいなもんだろ
563:デフォルトの名無しさん
07/10/11 23:40:50
NAISTは「みたいなもの」じゃなくて本当の全入だから困る
564:デフォルトの名無しさん
07/10/14 18:07:54
そんなことないすと
565:デフォルトの名無しさん
07/10/14 22:52:57
NAISTって、妙にプライドだけ高い人増えたよね。
全入だし、人材はどんどんダメになって行ってるのに…。
Namazuの人やChasenの人の頃がピークだったが
所詮後が続かんよね。お得意のモジュール化も、出来る人材居なくて全然出てこないし。
目を付け出してそこそこ力入れだした国立大に、もはや勝ち目無い。
出来る人材は、こんな所より京大行くだろw
566:デフォルトの名無しさん
07/10/17 07:05:49
昔はChasenが業界標準だったけど
今はMeCabだよね〜
JUMANなんか使ってる人いるの?
567:デフォルトの名無しさん
07/10/17 08:32:45
昔から使ってて変えられない(周辺ツール含めて)所はあるでしょ?
568:デフォルトの名無しさん
07/10/17 09:30:33
ねーよw
569:デフォルトの名無しさん
07/10/17 09:41:43
製品に組み込まれた、とかいう話を聞かないよね>>JUMAN
570:デフォルトの名無しさん
07/10/19 23:08:41
パーセプトロンエンジンってどう?
571:デフォルトの名無しさん
07/10/20 01:52:31
どうって?
何が聞きたいの
572:デフォルトの名無しさん
07/10/20 10:31:34
そこの人の論文出てないよね?
573:デフォルトの名無しさん
07/10/22 16:35:43
そもそもパーセプトロンとか言い出してるところが
なんかアレだなあ・・・
574:デフォルトの名無しさん
07/10/22 20:30:01
アレって何かね
575:デフォルトの名無しさん
07/10/22 21:54:40
ちくび
576:デフォルトの名無しさん
07/10/23 16:16:40
結局誰も知らないのかw
577:デフォルトの名無しさん
07/10/23 16:54:14
何を?
578:デフォルトの名無しさん
07/11/02 09:04:14
URLリンク(googlejapan.blogspot.com)
579:デフォルトの名無しさん
07/11/02 10:00:20
学部生の卒論にぴったり
580:デフォルトの名無しさん
07/11/02 12:57:42
> パ
あそこはさぁ、近年の研究成果無視で
ただ単に商売ッ気がたっぷりあるだけだろ。
元になったエンジンは、ちょっと使い物にならないレベルだった、
ってコアな人から聞いた。
581:デフォルトの名無しさん
07/11/02 13:16:39
コアな割には話が抽象的すぐる
582:デフォルトの名無しさん
07/11/02 13:52:28
え?なになに?
パーセプトロンエンジンのこと?
583:デフォルトの名無しさん
07/11/03 12:19:10
>>578
あれ?工藤さんって、googleに行ったんだっけ?
ずっとyahooに行ったと思ってたんだが・・・。
584:デフォルトの名無しさん
07/11/03 16:17:20
F2→やほおはたつを
585:デフォルトの名無しさん
07/11/06 00:43:32
>>578
グーグル太っ腹と思ったら、金取るんだよな。
やだやだ。オープンソースで、データーもみんなのWebなのに、
自分が作ったデーターは金取るんだぜ。
酷くない。
586:デフォルトの名無しさん
07/11/06 01:01:10
うん。
酷くない。
587:デフォルトの名無しさん
07/11/06 11:08:30
っていうか、勝手に人のサイトのデータ収集して売って良いの?
そこから生成された統計データなら灰色だとは思うけど、n-gramって事はガチで文字がそのまま入るんでしょ?
まずい単語が入ってたりしてそう
588:デフォルトの名無しさん
07/11/06 11:50:48
金とるから非難て…
こんなのタダみたいなもんだろ。
589:デフォルトの名無しさん
07/11/06 12:01:38
>>587
文字というか形態素n-grams (頻度20以上) だけど。
入ったらまずい単語って何?
イメージできんのだが。
590:デフォルトの名無しさん
07/11/06 13:17:00
>>589
おまんこ、でも検索結果が出た。ちょっちビックリ。
591:デフォルトの名無しさん
07/11/06 13:22:28
卑猥な言葉だろうが差別用語だろうがテレビじゃないんだから別に問題ねーだろ。
固有名詞はアレだがどうせアノニマイズくらいしてるだろ。
592:デフォルトの名無しさん
07/11/08 20:09:23
小泉潤一郎、とかもあるかな
593:デフォルトの名無しさん
07/11/09 18:18:15
肖像権?の問題か?
594:デフォルトの名無しさん
07/11/10 16:27:29
□が□に□した
こんな風に穴抜きパターンを考えたら
入れ替わりが多いだけでパターン数は
そう多くないと思った
595:デフォルトの名無しさん
07/11/10 19:44:46
構文解析と何が違うんだ?
596:デフォルトの名無しさん
07/11/14 00:09:15
>>587
>っていうか、勝手に人のサイトのデータ収集して売って良いの?
短くても、短歌や俳句は著作権上<1作品>と認められるから、
著作権の切れていない作品を著作権者に無断で配布するのは、
有料でも無料でも違法。Googleのn-gramは、多分、使用頻度
が極端に低いものを削除しているはずなので、短歌や俳句1作品
が入ってくる可能性は極めて低いはず。
597:デフォルトの名無しさん
07/11/22 05:41:28
日記やブログは著作物にはならんの?
まぁ、それ言い出したらイメージ検索なんて、完全にアウトな気がするが・・・w
598:デフォルトの名無しさん
07/11/24 12:19:54
著作権法の引用じゃないか?引用元のURLは乗せてるから
599:デフォルトの名無しさん
07/11/25 21:57:43
>>597
>日記やブログは著作物にはならんの?
「今日は本当に死ぬほど暑かった。」などという、
多くの人が使用するような表現には、著作権は
ない。Googleのn-gramsは他人のWebから無断で
このような使用頻度の高い表現を抜き出して、無
断で売っているのだが、元の表現に著作権がない
からOK。
600:デフォルトの名無しさん
07/12/02 03:57:18
そういえば俺が初めてプログラミングに触れたのは
自然言語処理がやりたいからって理由だったんだが
このスレ見てたら何だか悲しくなってきた...
601:デフォルトの名無しさん
07/12/02 04:14:15
同感
602:デフォルトの名無しさん
07/12/02 07:03:50
俺の自然言語処理の走りは、中学時代にハマった「えんいー」
('A`)
ごめんなさい。崇高な意志の方々。
今じゃそんな事も忘れて
何かに追われるように
毎日文字列処理してる。
意味処理?俺にはムーリ。
国語出来ません。英語読めません。
文法判りません。分類出来ません。
統計判りません。根気ありません。
プログラミングだけは出来ます。
\(^o^)/オタワー
603:デフォルトの名無しさん
07/12/02 08:12:55
工学出身のヤツはそんなもん。
プログラマが根気無いのは普通。だから賢くやるんだろ。
統計だけはがんばっとけ。って言うか統計が判らないってのがわからん。
対象を知れば、自ずと適用すべき統計モデルはわかってくるでしょ?
統計モデルを知らんって話だったら、類似した研究の論文を読めとしか・・・。
ああ、ここで根気は必要だな。。。
604:デフォルトの名無しさん
07/12/03 04:29:08
>>602
>俺の自然言語処理の走りは、中学時代にハマった「えんいー」
安心しろw
俺も同じだ。っていうか人工無能系にハマって始めたやつって結構居るぞ。
人間の小さい頃の発端なんて、みんなそんなもんでしょ。
むしろ、なんか判らんけどこの道に入っちゃった人の方が哀れと言うか、計画性ナス。
605:デフォルトの名無しさん
07/12/03 13:09:12
なんで哀れなの?
勝ち組じゃないの?
606:デフォルトの名無しさん
07/12/03 13:47:46
ジャストシステムに入るくらいしかないでしょ
607:デフォルトの名無しさん
07/12/03 13:55:25
NTTとかIBMは?
ヤフー、マイクロソフト、グーグルあたりとか。
ミクシィみたいなベンチャーとか。
608:デフォルトの名無しさん
07/12/03 14:28:27
なんか判らんけど入っちゃったって人にとって
その辺は大手過ぎてハードル高いっしょ。
手ごろな企業が無い。
609:デフォルトの名無しさん
07/12/03 18:33:18
自分で新しいことやってやろうって漢はいないの?
610:デフォルトの名無しさん
07/12/04 06:33:47
質問です。
SuffixTree⇔パトリシア Trie
SuffixArray⇔PAT Array
この違いが未だにわからないんですが
同じものなんですか?
資料によって書いてる事が違ってて、
すげぇ混乱してるんですけど。
611:デフォルトの名無しさん
07/12/04 08:44:49
>>610
お前去年も同じ事どっかに書いてなかったか?
その2つの違いは派閥だよ。
たまにSuffixTreeの圧縮したものがパトリシアとか書かれてるのがあるが
あれは、SuffixArrayの勘違い。
結論言うと、同じ。
612:デフォルトの名無しさん
07/12/04 14:34:47
ちげーよ
613:デフォルトの名無しさん
07/12/04 22:34:17
ググって見ると、サイトによって
パトリシアトライは、トライの分岐してないノードを消して
圧縮するものである。って主張と
SuffixTreeと同じものである。って主張の2つが存在するなw
多分原因は、長尾氏の
URLリンク(www.amazon.co.jp)
この本では前者が書いてあって
北・辻井両氏の
URLリンク(www.amazon.co.jp)
この本では、パトリシアTrieの説明で、SuffixTreeの
説明が図付きで書いてあるからだと思う。
どっちの教科書で勉強したかで、全然違う理解になってるはず。
614:デフォルトの名無しさん
07/12/05 08:37:37
>>613
ネットは嘘が多いからな。
本の内容も信用できない。
元論文読んで自分で理解しないとダメだな。
615:デフォルトの名無しさん
07/12/05 18:03:49
辻井がボケかましたってこと?
長尾タンを信じてればいいの?
616:デフォルトの名無しさん
07/12/05 23:57:28
北・辻井本のパトリシアTrieの説明って何ページ?
索引に出てないんだが。
617:デフォルトの名無しさん
07/12/06 01:40:38
p.179〜
普通にあってる。
PATトライとSuffixArrayが同じものとして書かれてるところを
読んだ人が勘違いしてるだけのような・・・。
618:617
07/12/06 01:41:21
間違えた。
PATトライ→PATアレイ
619:デフォルトの名無しさん
07/12/06 07:45:07
じゃあゆとり乙ってこと?
620:デフォルトの名無しさん
07/12/06 09:40:53
元論文読まずに最初に教科書で勘違いしたヤツが出る
→教科書すら読まないやつが、そいつが書いた資料を見る
→その資料をry
どうせこんな感じの魔の連鎖が発生したと思われ。
しょぼい論文でも勘違いしてるのたまに見るしな。
そもそもトライとSuffixTreeのデータ構造そのものは同じで
登録の方法が違う程度だから、トライ関連の改良の紛らわしい
サーベイ論文読んで、勘違いする人が続出なんだろう。
621:デフォルトの名無しさん
07/12/06 09:55:38
このスレ以外で間違えてる人見たことないけどな。
622:デフォルトの名無しさん
07/12/06 10:04:49
個人ブログを挙げるのはアレなんだけど
たまに見るぞ。
623:デフォルトの名無しさん
07/12/06 18:06:42
トライは一個で派生があるだけって感じ?
624:デフォルトの名無しさん
07/12/06 21:44:04
1 名前: 諸君、帰ってきたで?φ ★ Mail: 投稿日: 2007/12/06(木) 21:28:02 ID: ???0
米マイクロソフトがクリスマスシーズンの子供向けに、自動応答形式で行っていた
サンタクロースとのチャット・サービスをめぐり、「特定のメッセージを送ると、わいせつな
内容の応答が返ってくる」との指摘が寄せられ、同社は5日までに、このサービスを
停止した。
625:デフォルトの名無しさん
07/12/07 14:31:17
【特許】ワープロの仮名漢字変換技術は23万円?・・発明者が東芝に対価2億6千万円請求
スレリンク(newsplus板)l50
この人知らない
626:デフォルトの名無しさん
07/12/07 21:59:37
会った事は無いが先輩だな
627:デフォルトの名無しさん
07/12/17 13:40:18
>>112の「言語と計算 (4) 確率的言語モデル」読んでるんだけど、
9ページ10行目の「最小となるのはx1, ... , xnのうちの1つが…」ってのは
P(x1), ... P(xn)の間違いだよね?一応確認。
628:デフォルトの名無しさん
07/12/17 14:41:13
NAIST Japanese Dictionary
URLリンク(sourceforge.jp)
形態素解析用辞書 IPADIC の ICOT 条項をクリアするとともに表記ゆれ情報、複合語情報を付与した辞書の公開
629:デフォルトの名無しさん
07/12/31 15:20:04
>>624
自動応答システムってこんなんばっか・・・
630:デフォルトの名無しさん
08/01/04 02:27:01
自然言語処理、全く分からないんですが、日本語の誤字を自動検出するようなプログラムって作れないでしょうか?
また、自作でなくとも公開されている何かがあって、利用できると言うのならば構いません。
現在、フリーのWEBサーバーisweb上で動く、誤字自動検出CGI、もしくはAppletのようなものが作れないかと考えております。
どなたか、よい参考書、ないし、よいツールをご存知の方がいらっしゃいましたら教えてください。
よろしくお願いいたします。
631:デフォルトの名無しさん
08/01/04 02:46:39
誤字?
タイポの事?それとも紙に書いた字が間違ってる方?
字が間違ってるのを判別するのは無理だけど
より出現確率の高い候補を提示するようなのは出来る。
単語の確率を漠然と見るのではなく、単語の種類(例えば品詞)が
bi-gramで見たときに、より良い品詞の遷移があるものを選べばよい。
とりあえず、難しい事考えずに結果を出したいなら
適当なニューラルネットワークのプログラムを拾ってきて
学習させればいいんじゃないか?
632:デフォルトの名無しさん
08/01/04 02:52:31
>>630
お前には無理。
超えるべき壁が山ほどある。
っていうかそういうプログラムあるんだから拾ってこいよ。
それすらググれないようでは、話にならん。
633:デフォルトの名無しさん
08/01/04 07:41:50
>>632
お前には聞いてないからw
知らないなら素直に知らないって言えよ、お馬鹿さんwww
634:デフォルトの名無しさん
08/01/04 13:08:07
妥当な評価だと思うがな。
まぜっかえされるのが嫌なら2chなんかで質問しないだろうし。
何を書こうがあるいは書くまいが自由。
635:デフォルトの名無しさん
08/01/04 16:22:17
ちなみに>>631の前者は、大体学部の卒研レベルの話なので
素人でも頑張れば出来なくも無いが、即席を求めるなら後者をお勧め。
既に形態素解析が行える状態で、
common prefix searchとMarkovModelがわかるなら、問題ないが…。
前者を行うなら、まぁ勉強するこった。
どの道この程度の手法だと、どっちでやってもたいした結果が出ないので…。
636:デフォルトの名無しさん
08/01/05 02:56:37
>>631
全然話がわからない。
ちゃんとした方法はないの?
637:デフォルトの名無しさん
08/01/05 06:22:42
>>636
やっぱりお前には無理。
638:デフォルトの名無しさん
08/01/05 13:08:48
>>637
自分の能力を疑ってみることも大切だよ。
639:デフォルトの名無しさん
08/01/05 14:06:49
>>638
もうちょっと上手いことやらないと、釣れるものも釣れなくなっちゃうよ。
話題がないスレなんだしさじ加減を間違えなければそれなりに釣れてただろうに、惜しいことしたね。
640:デフォルトの名無しさん
08/01/05 14:56:42
>>639
保険かけるのかっこ悪いね
641:デフォルトの名無しさん
08/01/05 22:15:13
>>636
あほかw
それすらわからなくて、もっとちゃんとした方法をとろうとしてるのか?
今のお前には、知識的に無理、計算量的に無理、(開発)時間的に無理だと思われ。
普通に一般的な方法なんだが、お前がちゃんとした方法を自分で考えれるなら
勝手にすればいいじゃん。そんな奴がここで聞くとは思えないがな。
642:デフォルトの名無しさん
08/01/05 22:18:42
質問するときはトリップつけたほうがいいよね
643:デフォルトの名無しさん
08/01/05 23:26:55
ドコモの携帯にATRで開発した音声入力の翻訳機能がつくらしいんだけど、だれか使ったことある?
644:デフォルトの名無しさん
08/01/05 23:42:56
TOEIC600程度ってニュースで言ってた奴?
自分でしゃべったほうがマシそうなんだが
645:デフォルトの名無しさん
08/01/06 00:19:12
NECとの共同研究のだよな。
あれ使い物にならんぞ・・・。
何とか形にした感じだけど、おそらく製品になっても
玩具程度だと思われ。
そもそも、音声入力自体が、全然まともに出来上がってないw
次に、分かち書きが基本的に不可能に近い。理論的には文字での方法と同じだが
現実は遠くかけ離れてる。
あと、最近のATRって確実に質堕ちてるよな?
646:デフォルトの名無しさん
08/01/06 03:49:14
ATRはそりゃ落ちてるだろうな、最近なんか随分出来の悪い人材が行ってる気がする。
昔は東大・京大ばっかだったのにな。
京阪奈周辺の大学の教授が自分ん所の学生送り込んでたが、優秀な人材はみんな企業行っちまうから…
647:デフォルトの名無しさん
08/01/06 05:10:57
NAISTの馬鹿が行ってるくらいだからなぁ
648:デフォルトの名無しさん
08/01/06 06:33:26
完全に人材不足だからなぁ…。
加えて、マネージメントやってるNICTが国会で槍玉に挙がったもんだから、色々絶望的だよ。
NAISTの人間ですら今じゃGoogleやYahooやNTTに行くもん。あんな所誰が行くんだよw
649:デフォルトの名無しさん
08/01/06 08:21:15
なんでNAISTってこんなに馬鹿にされてんの?w
そりゃあ、東大・京大と比べられたらどうしようもないんだろうけど。
650:デフォルトの名無しさん
08/01/06 14:46:21
全入だからでしょ
やってることのレベルで馬鹿にされてるわけじゃないと思う
651:デフォルトの名無しさん
08/01/06 16:59:26
馬鹿にするならせめてより優れたものを作ってからにしようや
652:デフォルトの名無しさん
08/01/06 17:20:47
NAISTに優れたものなんてあったっけ?
売りの辞書も、構造が随分時代遅れで、東大・京大よりレベル低いし。
NAISTにEnjuのようなものが作れるとは思えん。
653:デフォルトの名無しさん
08/01/06 17:23:51
知らんくせに馬鹿にしてのか
最低だな
654:デフォルトの名無しさん
08/01/06 17:29:32
学生のレベルが低いからなあ
655:デフォルトの名無しさん
08/01/07 15:53:52
nlpに限っては
山下、工藤らが在籍していた前後がピークだよね
656:デフォルトの名無しさん
08/01/08 09:29:51
彼らは、既存の積み重ねの成果を実装しただけで
実際に偉いのは、彼らの先輩の構築したもの。
運と時期が良かっただけ。Googleの登場時期も良かった。
言っちゃあ悪いが、単なる実装屋さんだよ。そのくせ、その辺の専門卒プログラマより質は悪いし。
ま、工学の分野は作ったものが偉いってのも確かなんだがな。
657:デフォルトの名無しさん
08/01/08 18:00:29
NAIST批判が多いね
658:デフォルトの名無しさん
08/01/08 22:27:07
批判すればそれを超えたつもりになれる患者さん達
659:デフォルトの名無しさん
08/01/09 00:02:50
>>656はNAISTの蓄積は評価してるように見えるが…
あとは、それを実際に世に出した、k_takuとたつをも評価してるし
案外まっとうな意見じゃないかと。
660:デフォルトの名無しさん
08/01/10 10:12:31
今後も蓄積だけでやっていくつもりかな
661:デフォルトの名無しさん
08/01/12 19:13:01
工藤がただの実装屋って…
ここの連中は論文も読めんのか
662:デフォルトの名無しさん
08/01/13 00:24:44
サーベイばっかだろ。
元論文読んだ事無いってオチじゃないだろうな?
663:デフォルトの名無しさん
08/01/13 15:20:57
やっぱり研究者は批判されて一人前ってことか。
東大・京大がすごいと言われているようだけど、
(実際凄いとは思うが)個人名は出てこないもんな。
664:デフォルトの名無しさん
08/01/13 20:25:00
工藤山下あたりは単なるエンジニアじゃなくてサイエンティストだろ
高林はエンジニアよりだけど
665:デフォルトの名無しさん
08/01/13 20:43:12
奈良先は学生が足を引っ張ってるからな、残念だ
666:デフォルトの名無しさん
08/01/14 05:45:29
>>664
そんなに有名な理論系の論文出してるか?
基本的に既存の理論の実装を中心にやってると思うが…。
PATアレイやら、ダブル配列やら、CRFやら、形態素解析やら。
>>665
学生がって・・・。
学生以外居ないだろ。学校なんだから。
大学院大学だから、学部生が居るわけでもあるまいし。
667:デフォルトの名無しさん
08/01/14 10:00:05
論文読めよ
668:デフォルトの名無しさん
08/01/14 10:30:08
>>628 ってその後どうなったのかな
↓日記が見られないから経緯が良く分からんです
URLリンク(groups.google.com)
669:デフォルトの名無しさん
08/01/14 10:46:18
>>666
何もやってないってのがわからないのが今のNAISTの学生。
なんか、それっぽい事してるからだまされるだけで
基本的に彼らのやってるのは、既存の実装技術の欠陥を、あまり注目されてない理論で改良してるだけ。
他の研究者の着眼点が悪いのか、それともそもそも研究者がやるべきことじゃないから目を当てないのかは知らないけどな。
670:デフォルトの名無しさん
08/01/14 11:23:33
NAIST叩きスレになっててワロスw
別に、そんな叩くほどの価値があるわけでもなく
何らかの理論に対しての論争をするまでも無いレベルなのに
何やってるんだ。
理論が叩かれてるとかなら、有る意味「叩かれてこそ」って言えるけど
そういうレベルの議論でもなさそうだし。馬鹿だなぁ。お前らも。
671:デフォルトの名無しさん
08/01/14 14:41:20
理論も持ち出さずに叩くからただの妬み嫉みにしか見えない。
NAISTがろくな研究してないっていうなら会議なり論文なりで否定して見せろよ。
672:デフォルトの名無しさん
08/01/14 15:11:59
だから、そういう議論をするようなレベルの学校じゃないって事でしょ。
会議や論文で叩くにも、相手が何も理論を作ってなきゃやりようがない罠
まさにその話自体が本末転倒
673:デフォルトの名無しさん
08/01/14 15:22:17
毎年国際会議もジャーナルも大量に出てるのに会議や論文で叩けないってどういうことだ。
674:デフォルトの名無しさん
08/01/14 15:23:56
NAISTの馬鹿学生が必死に書き込んでることだけはわかった
675:デフォルトの名無しさん
08/01/14 15:24:59
なにこのスレ
676:デフォルトの名無しさん
08/01/14 15:30:19
>674
また嫉妬か。みっともない。
もっとも俺はNAIST関係者じゃないが。
677:デフォルトの名無しさん
08/01/14 15:42:10
嫉妬する要素が一つもないw
678:デフォルトの名無しさん
08/01/14 15:54:17
だから、もうやめろってw
学校批判したけりゃ、お受験板にスレたてて来い。
どっちにしろ、そんなレベルの低い話しても、誰もうれしくない。
679:デフォルトの名無しさん
08/01/15 16:48:25
>>673
会議や論文は叩くためのものじゃないだろ・・・
680:デフォルトの名無しさん
08/01/18 14:55:31
事件は会議室で起こってる
681:デフォルトの名無しさん
08/01/18 14:57:40
・・・んじゃない。現場で起こってるんだ。
682:デフォルトの名無しさん
08/01/18 20:12:11
が現場が会議室だった。
683:デフォルトの名無しさん
08/01/19 05:38:42
/( ^o^ )\ なんてこったい
684:デフォルトの名無しさん
08/01/22 15:43:56
もしも現場が会議室だったら・・・
685:デフォルトの名無しさん
08/01/25 20:14:59
正規文法に従って設計された人工言語ってどっかない?
あればコンピューターで解析させるのに楽
686:デフォルトの名無しさん
08/01/26 03:50:34
それがプログラミング言語じゃねぇの?
687:デフォルトの名無しさん
08/01/26 08:42:19
( ´,_ゝ`)
688:デフォルトの名無しさん
08/01/26 09:01:48
なでしこでも使っとけ
689:デフォルトの名無しさん
08/01/26 10:05:40
ロジバン?
690:24歳
08/01/26 12:06:28
お前らって何歳くらいなの?
691:デフォルトの名無しさん
08/01/26 12:17:33
26歳
692:デフォルトの名無しさん
08/01/26 19:00:44
>>685
ジャバって言語がいいらしいよ
693:デフォルトの名無しさん
08/01/26 21:18:11
えっちてぃーえむるう
っていう まーくあっぷ げんご
が いいらしい よ
694:デフォルトの名無しさん
08/01/26 21:19:10
オブジェクト指向は、世界を表現出来ます。
エレガントにそれを取り込んだJavaに不可能はありません。
695:デフォルトの名無しさん
08/01/27 14:45:28
>>690-691みたいなガキばっかだったのか・・・
どーりで、話のレベルが低いと思った。
この業界って、普通30代後半からじゃないの?
696:デフォルトの名無しさん
08/01/27 14:51:24
え、院生とかばかりだと思ってた。
697:デフォルトの名無しさん
08/01/27 15:08:59
26才
698:デフォルトの名無しさん
08/01/27 19:06:47
45歳
699:デフォルトの名無しさん
08/01/28 06:11:25
ごめん、学部生だ
700:デフォルトの名無しさん
08/01/28 08:31:17
伊代はまだ16歳だーからー
701:デフォルトの名無しさん
08/01/28 09:01:43
M1です^^
702:デフォルトの名無しさん
08/01/28 13:22:01
>>695>>698
やーいおっさんおっさん!
703:デフォルトの名無しさん
08/01/28 13:23:46
B1です
704:デフォルトの名無しさん
08/01/29 15:19:39
助教とか准教授がこんなとこ見てたら幻滅するわ・・・
705:デフォルトの名無しさん
08/01/29 21:03:24
ごめん。。。
706:デフォルトの名無しさん
08/01/29 21:12:11
本当に助教授とか居るなら何かネタ投下してよ
最近やってる研究とか読んだ論文とか
707:デフォルトの名無しさん
08/01/30 01:30:44
この業界狭いから、そんな事するとすぐ特定されるだろw
708:デフォルトの名無しさん
08/01/30 07:56:23
>>706
年齢だけでも危ういのにそんなことできるかw
709:O大学
08/01/30 17:43:42
じゃあ、どこの研究室出身か名乗り上げてみようか〜♪
710:デフォルトの名無しさん
08/01/30 17:47:45
大阪大学
岡山大学
大阪工大
大阪府立大
などなど・・・。
多すぎるw
○大学って言う意味だったらぶっころ
711:MIT大学
08/01/30 18:20:57
いやまて
>>709は、そもそもnlp出身とも、そもそも理系出身とも言ってないぞw
712:B大学
08/01/30 18:26:58
MITなんてお金がなくていけませんでした
713:デフォルトの名無しさん
08/01/30 18:45:28
井上研究室
714:デフォルトの名無しさん
08/01/30 18:51:00
>>714-1000
以下NAIST出身の提供でお送りいたします。
715:714
08/01/30 18:51:33
間違えた。
>>714は無し。俺NAIST出身じゃないし。
716:デフォルトの名無しさん
08/01/30 18:59:49
俺も違う
717:デフォルトの名無しさん
08/01/30 20:35:40
>>715=NAIST出身
718:デフォルトの名無しさん
08/01/30 20:43:32
じゃあ俺はNAISTでいいや
719:デフォルトの名無しさん
08/01/30 23:39:17
じゃあおれはJAISTで
720:デフォルトの名無しさん
08/01/31 13:47:58
じゃあKAISTで
721:デフォルトの名無しさん
08/02/02 22:22:48
atrがやってるドコモの翻訳サービスってどうなの?
722:デフォルトの名無しさん
08/02/03 03:04:32
>>645-
723:デフォルトの名無しさん
08/02/03 17:55:54
>>772
そんなこと聞いてなくて,実際に使ってみてどうなんだ?
724:デフォルトの名無しさん
08/02/03 22:23:56
あれに参加した研究者の論文を見りゃわかるだろ。
どのレベルかは・・・。
この業界に居れば、使うまでも無くわかるだろうに。
725:デフォルトの名無しさん
08/02/03 23:24:42
アホアンチうざいよ
726:デフォルトの名無しさん
08/02/04 00:15:15
>>724
精度はコーパス次第だろうけどね。
あれは一応関西の学生バイトをかき集めて人手で作ったものだから
それなりには出来るだろうね。
問題は、機械による、単語の同定どころか、発話区間の同定すら出来てない(コーパス構築は人手?)
状態で、どこまで出来るのかが問題。
まー、はっきり言ってしまえばダメだろうねw
727:孟宗
08/02/04 00:18:32
割と使えるものだったよ。
凄い凄い。
728:デフォルトの名無しさん
08/02/04 00:23:23
今この研究やれば波に乗れるって研究は何?
トレンドが読めなくなってきた。
729:デフォルトの名無しさん
08/02/04 00:26:44
>>728
mp3データからの歌詞トランスクリプトの生成
730:728
08/02/04 01:19:33
mp3データから、歌詞の子音を判断して、それに合わせてキャラに口パク(6パターン)させるプログラムなら
高校時代に趣味で作ったことがある。もちろん精度悪い。
そこから歌詞まで行くのは、色々別の過程が難しい気がしてならんw
731:デフォルトの名無しさん
08/02/04 01:36:04
>>730
多分、特定したw
あのゴーストの作者か…。懐かしいな
732:デフォルトの名無しさん
08/02/05 07:08:26
野村先生のパーティ
733:デフォルトの名無しさん
08/02/06 02:45:54
このスレ内輪すぎるからうんこ
734:デフォルトの名無しさん
08/02/06 05:21:12
どうせ
>>730も>>731も>>732も>>733も顔見知りなんだろ?
735:デフォルトの名無しさん
08/02/06 06:03:23
そりゃ、みんなNAISTの学生だモンな
736:デフォルトの名無しさん
08/02/06 06:05:26
俺はNAISTじゃないぜ
NAIST出身の友達は居るが
737:デフォルトの名無しさん
08/02/06 07:54:00
まぁ、話の内容的に
NAIST、京大、NICT、ATRあたりの関西の機関の人間が多いのは確かだろうな。
しかも、あの辺共同研究ばっかだし人材の移動もあるので、スレの人間は殆ど身内じゃね?
738:デフォルトの名無しさん
08/02/06 07:57:46
俺はそのうちのどれでもない
739:デフォルトの名無しさん
08/02/06 08:39:11
俺は海外組。
英語処理ならそこそこ研究したが、日本語処理は正直わからん。
740:デフォルトの名無しさん
08/02/06 09:31:46
こんなスレあったのな。ム板住人なのに気づかなかったぜ。
俺の学部時代は、文字列(高速検索・動的処理)・統計処理(のごくごく一部)で終わった・・・orz
修士で伸ばせなかったら俺はおしまいだ・・・・。
周りのレベルがアレ(つーか論外)なので特に言われる事は無いんだが、
どう考えても大学出た後がヤバい。所詮ここはその程度の大学だし。。。
京大生の知り合いの仕事見てると、こいつには勝てないんじゃないかって
ある種の絶望を覚える・・・。
741:デフォルトの名無しさん
08/02/06 09:37:21
IQが20違うと
ものの見方が全然違うよ
試しに自分よりIQが20低そうな相手を考えてごらん?
742:デフォルトの名無しさん
08/02/06 09:47:04
IQ200とIQ180だからあんまり変わらんと思うけど
743:デフォルトの名無しさん
08/02/06 10:55:45
違うよ
全然
744:デフォルトの名無しさん
08/02/06 16:13:47
↑何でこんなアホが紛れ込んでるの?
お前には10年早いよ
745:デフォルトの名無しさん
08/02/06 18:08:22
>>740
自覚があるだけマシ
周りのレベルに流される奴は、外を見ないからなぁ。
746:デフォルトの名無しさん
08/02/06 23:25:28
>>740
プライドがあるだけたちが悪い
周りのレベルが低いとか言う奴は、自分の能力を見ないからなぁ。
747:デフォルトの名無しさん
08/02/06 23:34:23
どちらにせよ足りないと思ってるなら変わりないだろう。
うぬぼれているならともかく。
748:740
08/02/06 23:50:33
>>746
なるほどww
それは言えてるねw
でも、自分に対して低いとは言ってないよ?同じくらいかもしれないし、少し周りの方が高いかも知れない。
そもそもそんな狭いフィールドで比較なんてしてないんだからww
全体の中での自分の立ち位置を確認する為に、外を確認しただけ。それは自分の能力を把握する事ではなくて?w
俺も自分の能力をはっきりとは知らないわ。誰も知らないんじゃない?
でも他人よりは知ってるよ。
ところで、プライドとただの馬鹿の区別が付かない人が多いよね。
自覚とプライドも違う筈だよね。馬鹿馬鹿しい話だと思わないかい?
749:デフォルトの名無しさん
08/02/07 00:02:05
>>748
自重・・・。
若いのはわかるけど、ちょっと喧嘩売ってるというか
君は色々無駄に人生苦労してそうだ。発言には気をつけような。
明らか>>740じゃないような。釣りなのか。
750:デフォルトの名無しさん
08/02/07 00:07:07
はいはいNAIST、NAIST
751:740
08/02/08 14:32:56
>>750
関西の大学だけじゃなく、地方も忘れんでください・・・。
752:デフォルトの名無しさん
08/02/08 17:37:25
え?北陸先端?徳島?静岡?北大?長岡?筑波?
753:デフォルトの名無しさん
08/02/08 23:14:42
>>752
ワロタ
754:デフォルトの名無しさん
08/02/09 00:07:59
北陸で学部はないだろw
755:デフォルトの名無しさん
08/02/09 22:25:50
ふむ
結局文系は俺だけのようだな
756:デフォルトの名無しさん
08/02/10 16:41:06
>>755 言語学系の人?
757:デフォルトの名無しさん
08/02/10 18:20:34
なんか入門書を紹介してください。高卒ですがよろしくお願いいたします。
758:デフォルトの名無しさん
08/02/10 18:26:59
>>757何をやりたいの?
759:デフォルトの名無しさん
08/02/10 18:46:34
自然言語処理です。
760:デフォルトの名無しさん
08/02/10 18:52:40
>>759
自然言語処理の何をしたいの?
761:デフォルトの名無しさん
08/02/10 18:54:19
>>756
商学系ですサーセン
762:デフォルトの名無しさん
08/02/10 18:54:51
>>760
検索エンジンとかです。
763:デフォルトの名無しさん
08/02/10 19:31:53
検索エンジン関連技術全体のごくいちぶだなぁ、自然言語処理らしい自然言語処理は。
764:デフォルトの名無しさん
08/02/10 19:33:31
検索エンジンって儲かりますか?
765:デフォルトの名無しさん
08/02/10 20:02:08
検索エンジンつっても
PowerSetのような自然言語理解の分野に手をかけたようなのもあるし。
766:757
08/02/10 21:18:14
なんでか偽物がでてる…。自分は日本語文章を機械的に要約してみたいんです。
ぐぐってみた結果、文を要素にバラす形態素解析というのをやったあと意味を解析するらしい事はわかりましたが、
なにぶん無学なもので体系的に勉強しておきたいのです。
MeCab で形態素にバラした後に日本語の構文知識をどう適用したらいいのか途方にくれています。
767:デフォルトの名無しさん
08/02/10 21:36:46
>>766
「確率的構文解析」でググれ。
768:デフォルトの名無しさん
08/02/10 22:09:14
knpじゃだめなのか?
769:デフォルトの名無しさん
08/02/10 22:14:12
どこまでやりたいか,アプリケーションとして何をやりたいかによるなあ
応用によっては形態素解析で表層情報だけあれば十分な場合も多々あるし
770:デフォルトの名無しさん
08/02/10 23:32:31
>>766
とりあえず「。」で区切って文の配列をつくって、
最初の文と1/3あたりの文と2/3あたりの文と最後の文を表示する。
これだけでも結構つかえるぞ。
771:デフォルトの名無しさん
08/02/11 03:27:03
文の同定ってどうするんかなぁ。
前から疑問だったんだけど。
確かに自分でデータ作るときは「。」で判別してるけど
もっと、ちゃんとした方法があるはず。
ちゃんとした文じゃなくても
形態素や係り受けみたいな、コンピュータ的に扱える単位であればいいんだけど
それの文に相当するものってないよね。
772:デフォルトの名無しさん
08/02/11 07:45:36
>>771
コーパス用意して、bigramかtrigramで終端モデルつくればいいんじゃね?
773:デフォルトの名無しさん
08/02/11 12:34:38
bigram、て響きがかっこいいよな
宇宙戦隊バイグラム、とかありそうじゃん
774:デフォルトの名無しさん
08/02/11 12:53:35
宇宙怪獣トリグラム
宇宙戦艦エヌグラム
宇宙刑事マルコフ
775:デフォルトの名無しさん
08/02/11 15:25:29
宇宙刑事マルコフwww
776:デフォルトの名無しさん
08/02/11 15:27:54
バイファムは「銀河漂流」だけどね
777:デフォルトの名無しさん
08/02/11 15:30:30
俺今までビグラムって呼んでた
778:デフォルトの名無しさん
08/02/11 16:07:38
ビグラム量産の暁には連邦など >>777オメ
779:デフォルトの名無しさん
08/02/11 16:09:48
>>775
なんか手錠が数珠つなぎになってそうだw
780:横レス
08/02/11 17:02:58
>>768
それだと形態素解析もjuman限定になるしね
さすがに形態素解析にルールベースはきつい
(個人的には日本語構文解析だとルールベースのほうが結局得策な気はするけど)
781:デフォルトの名無しさん
08/02/12 02:37:19
>>780
ルールベースの構文解析器を紹介してください。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5390日前に更新/189 KB
担当:undef