Pythonのお勉強 Part ..
641:デフォルトの名無しさん
08/03/13 02:54:37
日本語コーデックの自動判別モジュール探してたんだけど、よく考えたら
この判定コードで十分じゃね?
jp_codecs = ("euc-jp", "sjis", "utf-8")
jp_patterns = "あいうえお…わをん"
def get_jp_codec(s):
def tryenc(s):
for i in jp_codecs:
try:
u = s.decode(i)
yield i, u
except UnicodeDecodeError:
pass
for enc, u in tryenc(s):
if len(set(jp_patterns) & set(u)) > 0:
return enc
return None
次ページ続きを表示1を表示最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5394日前に更新/203 KB
担当:undef