- 641 名前:デフォルトの名無しさん mailto:sage [2008/03/13(木) 02:54:37 ]
- 日本語コーデックの自動判別モジュール探してたんだけど、よく考えたら
この判定コードで十分じゃね? jp_codecs = ("euc-jp", "sjis", "utf-8") jp_patterns = "あいうえお…わをん" def get_jp_codec(s): def tryenc(s): for i in jp_codecs: try: u = s.decode(i) yield i, u except UnicodeDecodeError: pass for enc, u in tryenc(s): if len(set(jp_patterns) & set(u)) > 0: return enc return None
|

|