Pythonのお勉強 Part ..
[2ch|▼Menu]
641:デフォルトの名無しさん
08/03/13 02:54:37
日本語コーデックの自動判別モジュール探してたんだけど、よく考えたら
この判定コードで十分じゃね?

jp_codecs = ("euc-jp", "sjis", "utf-8")
jp_patterns = "あいうえお…わをん"

def get_jp_codec(s):
 def tryenc(s):
  for i in jp_codecs:
   try:
    u = s.decode(i)
    yield i, u
   except UnicodeDecodeError:
    pass

 for enc, u in tryenc(s):
  if len(set(jp_patterns) & set(u)) > 0:
   return enc
 return None




次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5394日前に更新/203 KB
担当:undef