- 550 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:23:04.91 .net]
- > Encode::Detect::CJK
> Unicode::Japanese > CharsetDetector > Lingua::DetectCharset > activeperlで使えるこの4つ総合してもcp1256とkoi8が判別しにくいようだが こういうのもね。ライブラリの精度の問題じゃないんだよ。 cp1256とkoi8が区別しにくいのは、文字の問題。 同じバイナリ列にかぶってるんでしょ? 区別しにくい(誤判定する)のは文字自体の問題で、 それをどのように判定するのは、ライブラリの癖というか仕様。 Encode::Guess が使いものにならないというのは、 Encode::Guess が日本語以外の多くの文字コードに対応していて、 対応しているもの全てを列挙するからだよ。一番正確。
|

|