文字コード統一スレ 1文字目

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 20:42 / Filesize : 257 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード統一スレ 1文字目

1 名前：とりあえず立ててみた [05/02/24 00:07:38 ]: プログラムにおける文字コードの取り扱いについて議論する統一スレッド
です。

ほぼ前スレ
【UTF8】文字コード変換【SJIS】
pc5.2ch.net/test/read.cgi/tech/1063177450/

参考ホームページ
Unicode Home Page
www.unicode.org/
Java Character Encodings
www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
357 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 08:52:17 ]: よしUTF-128ぐらいで手を打とうじゃないか
言語問わず、今現在使われてる部分は意地でも文字振りません
358 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 16:22:59 ]: Unicodeがマッピング・テーブルを公開していた頃も
ベンダはそれに従ってなかったし。
359 名前：デフォルトの名無しさん [2005/08/24(水) 18:55:15 ]: >>357
UTF-8でも、36bitコードまでリニアな拡張で扱えるが。
360 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 19:11:20 ]: それはUTF-8ではない。
361 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 19:31:36 ]: ＞36bitコード
(　´д)ﾋｿ(´д｀)ﾋｿ(д｀　)
362 名前：デフォルトの名無しさん [2005/08/24(水) 20:05:55 ]: >>360
だから、「UTF-8の *リニアな拡張* 」だって言ってんだろ？
先頭バイトの上位ビットに7個1が並んでいたら、↓ 36bitになるだろうが。

11111110 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
363 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 21:23:35 ]: UTF-8 符号化では 0xfe と 0xff のバイトは絶対に使用しない。
364 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 21:35:56 ]: 拡張って言葉の意味が分からないの?
365 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 21:36:49 ]: ちなみに0xfeと0xffを使わない理由はUTF-16のBOMが100%判別できるようにするためだな
366 名前：347=350 mailto:sage [2005/08/24(水) 22:50:04 ]: >>351 >>352
ええと、理屈はわかるんですが、現実として、WinとMacとLinuxの混在環境
で全部UTF-8に統一しても、人間から見たら「同じ」と認識されるはずの
ものが異なるバイトパターンを構成するために、システム的には「同じ」
にならないと言う問題があって、これを解決するためには、どこかで
UTF-8 to UTF-8変換をする必要があるのではないでしょうか。

この状況を称して「UTF-8の日本語はすでに複数存在する」と言っても
過言ではない、と思うんですけれども。
367 名前：デフォルトの名無しさん mailto:sage [2005/08/24(水) 22:59:33 ]: > UTF-8 to UTF-8
お前が言わんとすることに似たようなことは既に存在する。
www.google.co.jp/search?hl=ja&c2coff=1&q=Unicode+%E6%AD%A3%E8%A6%8F%E5%8C%96&lr=lang_ja
368 名前：デフォルトの名無しさん [2005/08/24(水) 23:02:00 ]: >>366
UTF-8は文字エンコードの規格。
見た目は同じで違う文字、というのは文字セットの問題。
だから、UTF-8云々の議論はかみ合わない。

それに、バイトパターンが一致しないのは、BOM有無とか改行の問題じゃないの？
あるいは、UTF-8なら本来2バイトで表せる文字を3バイトで記録するような誤った実装の
アプリを使っているとか、サロゲートペアをそのまま2文字で扱うエラーとか…
369 名前：366 mailto:sage [2005/08/25(木) 00:49:19 ]: >>367
ぅぃ。問題自体が今さらなのは承知しております。

が、その対策が、この関数／メソッドを呼べばOK!にはなってなくて、
未だにアプリケーション毎の個別対応に依存しているようにしか
見えないのはどうしたものかと。

Javaの世界ですら、10年前から既知の問題なのにどこにも(ベンダ依存
マッピング問題を含む)統一されたフレームワークが見あたりません……。

私が知らないだけだったら、是非教えてください。
370 名前：366 mailto:sage [2005/08/25(木) 01:02:13 ]: >>368
厳密にはそうなんですが、現状は、
Conten-Type: text/html; charset="UTF-8"
や
export LANG=ja_JP.UTF-8
のように、文字セットの情報は交換してないので、事実上UTF-8というだけで
文字セットまで含んでしまってます。せめてUTF-8-msとかUTF-8-appleのよう
に区別してくれたら～(;_;)

ちなみにバイトパターンについては、「スケジュール4月～9月」という文字列
を、Windowsのメモ帳とMac OS Xのテキストエディットで入力、エンコーディ
ングはどちらもUTF-8で保存すると、以下のようになります。
od -j 3 -tx1 win.txt (BOMが入るので頭3バイト切り捨ててます)
0000003 e3 82 b9 e3 82 b1 e3 82 b8 e3 83 a5 e3 83 bc e3
0000023 83 ab 34 e6 9c 88【ef bd 9e】39 e6 9c 88
od -tx1 mac.txt
0000000 e3 82 b9 e3 82 b1 e3 82 b8 e3 83 a5 e3 83 bc e3
0000020 83 ab 34 e6 9c 88【e3 80 9c】39 e6 9c 88
おや、MacでもNFCなのか。WebDAVのリクエストはNFDで投げてくるので、
てっきりNFDになるのかと……。
371 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 02:16:26 ]: MACのwebdavリクエストってかなり行儀悪いよねえ

俺も複数あるようにとれちゃうけど、
とにかくあれだUTF-8って統括してるってのりじゃないんだ

マッピング誰がつけたの？
372 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 05:15:33 ]: >>370
厳密な指定が無い限りユーザが何を入力するかは好み(運)次第でしょ。
MacOSXのinput methodだとU+301C WAVE DASHの方が入力し易いけど、
U+FF5E FULLWIDTH TILDEも入力できるし、WindowsのIMEで「から」を
入力するとU+301C WAVE DASHになるみたいだし。

MacOSXではHFS+との互換性や同じファイル名を作らせないためにVFSは
NFDにnormalizeしてるけど、NFC/NFD/複雑な合成文字のいずれも扱えます。
developer.apple.com/ja/qa/qa2001/qa1173.html
373 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 08:02:25 ]: >>370
あほ? (w
374 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 08:48:22 ]: >>370
だからUTF-8の問題ではないだから、UTF-8-msとかUTF-8-appleとかを作って解決すべき問題ではないの。
375 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 08:54:41 ]: euc.jp/i18n/ucsnote.ja.html
これだろ?

UnicodeじゃなくてJIS X 0208に限っても、
－～ー─と利用者が入力し間違う余地はある。

これを文字コード(のエンコーディング)の問題だと思う奴は馬鹿じゃないの?
376 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 14:11:34 ]: >>370
これ読んで出直し。
www.unicode.org/reports/tr17/
377 名前：デフォルトの名無しさん mailto:sage [2005/08/25(木) 15:23:50 ]: Content-Typeがutf-8で萎えた、こだわって欲しかった

こんなんに任せてっからだめなんだよ！そのうちUとuの変換表作り始めるぜ
378 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 06:02:23 ]: >>374
GNU libiconvはNFDが扱えないため、DarwinのlibiconvはUTF-8にだけNFCへの
normalizerを追加してUTF-8-MACと称してます。
Darwin的にはUTF-8の問題ではない物をUTF-8-APPLEを作って解決するのはありw
379 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 07:13:57 ]: そもそもAppleのNFDって互換漢字をNormalizeしないよな
されたらそれはそれで困るけど。
380 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 07:15:27 ]: ↑はHFS+に格納する場合
381 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 15:03:48 ]: >>380
詳しく
382 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 21:29:09 ]: >>381
developer.apple.com/ja/technotes/tn1150.html#UnicodeSubtleties
383 名前：デフォルトの名無しさん mailto:sage [2005/08/26(金) 21:35:39 ]: 規格上は同一の文字コードでも出力時の選択に応じて
便宜上別の名前をつけるのはよくあることだべ
エンディアンの違いでx-utf-16le-bomとx-utf-16be-bomとか
使用するエスケープシーケンスの違いでiso-2022-jp-3とiso-2022-jp-3-strictとか
384 名前：デフォルトの名無しさん mailto:sage [2005/08/27(土) 07:42:26 ]: >>383
IANAにもUTF-16LEとかあるのでその辺は承知してます。
それらの場合、UTF-16やISO-2022に直結した問題なので説得力があるのですが、UTF-8-MAC
はSambaが動かないバグに泥縄で対処するために作った物の様です。
UTF-8-DARWIN-VFSとでも名付けるのが機能や泥縄感wを表して良いと思うのですが、
UTF-8-MACを使ったためにこのスレでも見られる変な誤解が広まっています。
385 名前：デフォルトの名無しさん mailto:sage [2005/08/27(土) 07:59:42 ]: Mac OS Xは、HFS+のドライバ@Darwinや
CarbonのFrameworkに個別の変換実装を持っていてアホ丸出し。
386 名前：デフォルトの名無しさん mailto:sage [2005/08/27(土) 09:01:44 ]: >>384
UTF-16LEはBOM禁止でUTF-16とは明確に違うべ
387 名前：デフォルトの名無しさん mailto:sage [2005/09/12(月) 17:09:19 ]: MSGOTHICの文字情報を
euc-jpのマッピングに揃えたら
euc見れる？？サイズかわって無理？
388 名前：デフォルトの名無しさん mailto:sage [2005/09/12(月) 19:33:41 ]: >>387
何が知りたいのかよくわからんが、

「MS Gothic フォント内のグリフの並び方をEUC-JPの並びに変えたら、
Win32 API の文字表示APIでシフトJIS文字列を渡すところでEUC-JP文字
列を渡して画面に表示できるようになるか？」

という意味？
389 名前：デフォルトの名無しさん mailto:sage [2005/09/12(月) 22:24:07 ]: 相手にしないのが吉
390 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 06:29:36 ]: >388
ですです！
フォントについて知らな過ぎのくせにイメージだけで喋っちゃってました。
グリフって？ってとこから構築してました
伝わってよかったありがとう

>389
ひどい！

shiftjisもeucもアスキーよけた同じような感じだと思ってたんだけど
結論は無理っぽい？？
391 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 06:33:51 ]: これ半角カナ全滅しますね、フォントだけで吸収できないもんですか
ハイもう喋りません、ごめんなさい
392 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 09:20:39 ]: 半角カナｲﾗﾈ
393 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 09:47:44 ]: 392 名前：デフォルトの名無しさん[sage] 投稿日：2005/09/13(火) 09:20:39
　　半角カナｲﾗﾈ
394 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 10:22:05 ]: 393 Name：デフォルトの名無しさん [sage] Date： 2005/09/13(火) 09:47:44 ID: Be:
392 名前：デフォルトの名無しさん[sage] 投稿日：2005/09/13(火) 09:20:39
　　半角カナｲﾗﾈ
395 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 10:25:18 ]: 質問です。
WindowsAPIもしくは、C言語関数で
ISO-8859-*からUNICODEへ変換する関数はありますか？
教えて君で申し訳ないですが、いくら調べても見つからないので、
書き込ませてもらいました。
ご存じでしたらお願いします。
396 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 11:01:03 ]: >>395
> 教えて君で申し訳ないですが、いくら調べても見つからないので、

このスレくらい読め。
397 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 11:49:10 ]: iconv <- unix
MultiByteToWideChar <- win32api
# MultiByteToWideChar, 新しいMSDNのページだと検索に引っかかってこない……。
398 名前：半角撲滅ﾘｰﾀﾞｰ mailto:sage [2005/09/13(火) 12:07:48 ]: 半角に包まれたcursesダイアログが目に染みるあなた
起動時のくるくるインジケータ※に￥が混ざりどっち回転なのかわからなくなるとお悩みの方！
コピーライトゥにせんご、と読んでる天然も共に戦いましょう！
今こそ立ち上がるのです！！！
399 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 12:16:29 ]: 半角って難ですか?
400 名前：395 mailto:sage [2005/09/13(火) 13:14:44 ]: >>397
MultiByteToWideCharで可能と言うことでしょうか？
因みにmbstowcsでも可能でしょうか？
あと、対象OSはWindowsCEなのですが、
第1引き数のCP_UTF7・8はCEでサポートされないとMSDNに書いてあるのですが、
ここには何をしていすれば良いですか？
全くの素人で申し訳ないですが、宜しくお願いします。
401 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 17:28:11 ]: >>400
最初の引数はIsValidCodePage()の引数がそのまま使える。
IsValidCodePage()の項目にはコードページの一覧がある。
402 名前：デフォルトの名無しさん mailto:sage [2005/09/13(火) 20:43:08 ]: >>400
第一引数はマルチバイト文字列に関するコードページなので、
ISO-8859-*に対応するコードページを指定してやればいい。
変換後はUCS-2かUTF-16固定のはず。
403 名前：デフォルトの名無しさん mailto:sage [2005/09/14(水) 09:45:15 ]: >>401-402
ありがとうございます。
助かりました。
404 名前：デフォルトの名無しさん mailto:sage [2005/09/15(木) 01:53:38 ]: 太玄経(U+1D300～)の文字名間違い指摘キター
405 名前：デフォルトの名無しさん [2005/09/15(木) 07:20:39 ]: UTF-8な以下のXMLファイルを（notepadで作成し、UTF-8でセーブしました）、

<?xml version="1.0" encoding="UTF-8"?>
<RootNode><ChildNode value="てすと" /></RootNode>

以下のMSXMLを使ったプログラムで読み込もうとしています。

#import "msxml4.dll"
using namespace MSXML2;
int main()
{
CoInitialize(0);
{
IXMLDOMDocumentPtr pzDomDoc( "MSXML.DOMDocument" );
pzDomDoc->validateOnParse = VARIANT_FALSE;
pzDomDoc->load( "C:\\temp\\japanese_text.xml" );
IXMLDOMElementPtr pzDomRoot = pzDomDoc->documentElement;
IXMLDOMElementPtr pzDomNode = pzDomRoot->firstChild;
/*-->*/_variant_t varAttr(pzDomNode->getAttribute( "value" ));
}
CoUninitialize();
return 0;
}

"-->"の行のvarAttrに空文字が帰ってきてしまいます。環境はVisualC++6.0英語版です。
原因がわかる方いらっしゃいますでしょうか。
406 名前：405 [2005/09/15(木) 07:22:42 ]: （XML関連のスレはあまり人がいらっしゃらないような気がしたので敢えてここで質問させていただきましたが
もしスレ違いでしたらすみません、、、。）
407 名前：405 mailto:sage [2005/09/15(木) 08:00:41 ]: ちなみに>>405のコードの中で
pzDomDoc->save( "C:\\temp\\japanese_text_out.xml" );
としてファイルにセーブしなおしてみたところ日本語の属性がきちんと元のままセーブされていました。属性を取り出すところで何かが起こってるのだと思うのですが、、、。
言い忘れましたがOSは"英語版"WindowsXP(SP1)です。VC++も含めて英語版の環境であることが問題なのでしょうか？
408 名前：デフォルトの名無しさん mailto:sage [2005/09/15(木) 08:12:24 ]: とりあえずBSTRはwcharらしいから
リテラルにL付けてみたら？
409 名前：405 mailto:sage [2005/09/15(木) 08:17:33 ]: すみません、私の勘違いだったようです。デバッガでは>>405のコードのvarAttrの値が
varAttr{"" VT_BSTR}
と表示されるので空文字が返ってきているのだと思ってしまっていました。文字列はちゃんと返されているようです。
一人でスレを汚してすみませんでした！
410 名前：デフォルトの名無しさん mailto:sage [2005/09/15(木) 08:18:32 ]: XMLのｽﾚへ帰れ。原因は知ってるがここでは教えてやらん。
ただ、ヒントだけは出しておく pzDomRoot != "/RootNode"
411 名前：デフォルトの名無しさん mailto:sage [2005/09/15(木) 17:51:38 ]: >>410
カコワルイ
412 名前：デフォルトの名無しさん [2005/09/16(金) 01:56:08 ]: 我々も文字コードで天下を統一するぞ！！！！

UTF-8で天下統一だ！！！

UTF-8は尾張の織田信長だ！！！！
413 名前：デフォルトの名無しさん mailto:sage [2005/09/16(金) 09:10:01 ]: UTF-8でなくて、Unicodeと言っちゃダメなのか? と突っ込んでみる。
414 名前：デフォルトの名無しさん mailto:sage [2005/09/16(金) 12:47:52 ]: 413＝明智光秀
415 名前：デフォルトの名無しさん mailto:sage [2005/09/16(金) 22:42:58 ]: >>413
UTF-8はUnicodeの一形態なんだから、お前の文は意味がない。
416 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 02:20:17 ]: UTF-7も仲間に入れてよ～、ということだろう。
417 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 02:42:46 ]: UTF-7イラネ
RFCも更新されずに見捨てられてるし
418 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 15:56:13 ]: >>416
いやいや、UTF-32も仲間に入れてよ～、ということだな。
419 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 16:24:41 ]: UCS-2＝松平家康
UCS-4＝羽柴秀吉
UTF-7＝明智光秀
UTF-8＝織田信長
UTF-16＝徳川家康
UTF-32＝豊臣秀吉
420 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 16:54:46 ]: UTF-8がUTF-7にヌッコロされるという図は想像出来んのだが
421 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 17:30:51 ]: ISO-2022 毛利
422 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 17:50:30 ]: Shift_JIS＝武田信玄
EUC-JP＝上杉謙信
423 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 17:50:46 ]: >シフトJISは共通基盤となっている。この共通基盤を維持することが、
>言語の共通性を維持するために、とても大事なのだ。
ttp://openblog.seesaa.net/article/6106946.html#comment
424 名前：423 mailto:sage [2005/09/17(土) 17:58:36 ]: 16秒遅かったか。
425 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 22:01:10 ]: >>423
南堂、あいかわらずだなヽ( ´ー`)ノ
426 名前：デフォルトの名無しさん mailto:sage [2005/09/17(土) 22:26:34 ]: 「シフトJISが共通基盤」って鎖国でもするつもりか？
内部コードSJIS対応パッチなんてどこもマージしてくれないぞ。
Citrus Projectでもない限り。
427 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 02:22:29 ]: >>423
> 私の旧型パソコン（Windows98）は、対応できなかった。google に接続するたびに、異常を起こした。
> たいていは、マシンがビジー状態になってストップするだけであり、再起動すれば直った。しかし、
> あるときついに、ビジー状態のあげく、CPUが過熱して、パソコンが壊れてしまった。
>
> 　つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。
> 　つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。
> 　つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。
> 　つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。
> 　つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。

お茶吹いたｗ
428 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 03:27:22 ]: >>426
それも日本のプロジェクトだな。
429 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 07:47:36 ]: >>427
UTF-8って怖いね(w
430 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 10:01:33 ]: UTF-8のせいでうちのおじいちゃんは…
431 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 10:07:50 ]: 巷で「UTF-8最強！！！！」と叫ぶ輩を見掛けるのには
こんな理由があったのか。
432 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 10:49:41 ]: 　　　　　|;:;:;:;|　　　　　　　　　　　　　　　　　　ヾ;:;:;:|
　　　　　|;:;:;:;|　　　 ,,,;;:iii;;;;;　　　　,.-＝＝--､.　`!;:;|ヽ
　　　　　〉;:;:|　,.-''"￣￣￣`ヽ⌒|　　--｡､-､ヽ-`'　|　　　　
　　　　　i　`u　i　-‐'"ヾ'"　　::　::!　　　　　　:　|　　ノ　　これはUTF-8の独裁政治だ！
　　　　　 i　　　|　　　　　　ノ　　ヾ､＿＿＿ノ　　::|　　　　　日本の未来が不安。
　　　　　　|　|　ヽ､＿＿,.-i　　　　　i　､　　　　:　　:|　　
　　　　　　 | |　　:　　　: '" `～ー～'"　ヽ　:　:　　 ::|　
433 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 11:41:41 ]: 皆で文字化け検査テスト用に最適な文字列を考えようぜ！！？
とりあえずざっくりこんな感じでどう？

ｾﾞﾝｶｸ&ハンカク表う～。
434 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 17:00:26 ]: >>427
PCが壊れた原因をUTF-8のせいにするとは
とんだアフォだなw

もっと賢い対応方法を考えることができないのかよw
435 名前：デフォルトの名無しさん mailto:sage [2005/09/18(日) 21:18:47 ]: とりあえずGoogleにShift JISをはくように指定できる。
436 名前：デフォルトの名無しさん mailto:sage [2005/09/19(月) 01:44:04 ]: そこで UTF-9 と UTF-18
437 名前：デフォルトの名無しさん mailto:sage [2005/09/19(月) 02:24:37 ]: 俺なんかUTF-256を指定したら赤ちゃん出来たよ。危険すぎ。
438 名前：デフォルトの名無しさん mailto:sage [2005/09/20(火) 11:58:58 ]: 織田信長=「パソコンをぶっ壊す！！！」だったのか。分かった。
439 名前：デフォルトの名無しさん mailto:sage [2005/09/20(火) 13:10:34 ]: サイバーな戦国時代ですね
440 名前：デフォルトの名無しさん mailto:sage [2005/09/26(月) 01:46:41 ]: 俺はUTF+8で保存したら、ディスクの空き容量が増加したよ。
441 名前：デフォルトの名無しさん mailto:sage [2005/09/26(月) 08:00:27 ]: science4.2ch.net/test/read.cgi/infosys/1045473594/64

64 名前：非決定性名無しさん[] 投稿日：2005/09/01(木) 16:06:49
www.itmedia.co.jp/news/articles/0508/31/news062.html

＞　JIS委員の南堂久史氏は、Webサイト「2004 JISをめぐる混乱」で、
＞「従来のJISでは、略字が大幅に取り入れられ、日本の伝統的な
＞文字遣いが犠牲になってしまっていた」などと、新JISで正字体を
＞採用した経緯を説明。略字を使っていた一部機関などに犠牲が出る
＞ことを詫びつつも、正字体の必要性を訴えている。

南堂氏ってJIS委員・・・・あｑｗせｄｒｆｔｇｙふじｋ
442 名前：デフォルトの名無しさん mailto:sage [2005/09/26(月) 09:27:04 ]: >>441
> 初出時、「JIS委員の見解」として掲載した部分は、JIS委員のものではありませんでした。お詫びして訂正いたします
となってITmediaの記事には、もうない。初出のインチキ記事のせいで、
本物委員・安岡先生、反論をあちこちに書き込んでたな。ごくろうさま。
443 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 09:12:29 ]: 麻雀牌文字の提案キタコレ
www.dkuug.dk/jtc1/sc2/wg2/docs/n2975.doc

それにしてもカナダとドイツのファビョりようが面白すぎる
そこは漢字圏の人間が10年前に通った道ですよ?
444 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 09:46:07 ]: 中国ってどうやって文字打ち込んでるの？？！！
漢字それぞれ発音が違うんでしょ？アルファベットで無理やり当て字っぽくだすんだべ？
他想像つかない、そすっと連文節とか出なそうだ、1字ずつ変換してんだろうか

韓国はカナ入力みたいな事してもキーボードあまるだろう
日本語が5音だけでよかった
445 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 09:57:29 ]: >>444
前に中国語のGlobal IMEで遊んでみたことがあるんだが、
それぞれのキーに簡単な漢字が割り当てられていて、
それを組み合わせていくようだ。（木を2つ入力して変換すると林になるという具合）
あと、ローマ字みたいなピンイン入力もあった気がする。
446 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 10:06:58 ]: 流石に赤五筒を入れないだけの良識(wは持ち合わせているか。
447 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 10:10:18 ]: SJ３はpin-inで入力できたな。
448 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 10:10:39 ]: >>444
大陸のネイティブな中国人はたいがい五筆。
日本語のような読み入力→変換ではなく、
目的の漢字に対応するコード(基本はキー4つ)による直接入力。
そのキーは漢字の造りや画を元に決められる。
中国の本屋やスーパーにいくと教本が山のようにある。

中国語学習者はピンインが多いと思う。
同じピンインに対応する漢字が多いので入力メソッドが馬鹿だと
しんどいことこの上ない単漢字変換になってしまうが、
よく使われてるやつでは辞書を元に入力予測方式や短縮入力
ができるので、かなり楽。

俺は以前五筆を覚えかけたが日本にいる間はDvorakで生活してるので
ピンインに戻ってしまった。
QWERTY前提なんだよな五筆。

個人的に一番楽なのは携帯で使える筆画入力だったりする。
たまに書き順わからなくなってピンインに逃げるけど。
449 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 12:53:25 ]: 俺の知り合いはピンインだったよ。
五筆は国定なんでしょ。あんなの馬鹿馬鹿しいって言っていた。
450 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 14:13:21 ]: IMEがバカでも問題がない五筆と
IMEの品質次第のピンインってとこ？
451 名前：デフォルトの名無しさん mailto:sage [2005/10/08(土) 15:52:09 ]: 大陸 … ピンイン
台湾 … 注音

だったと思っていたけど、現実はもっと複雑なのかな。
ちなみにSCIMにはpinyin, chewing両方のIMEがある。
452 名前：デフォルトの名無しさん mailto:sage [2005/10/09(日) 01:27:03 ]: 漢字読めるけど書けない人大量生産の日本とはだいぶ違うんだ
書けなきゃ話にならないね
453 名前：デフォルトの名無しさん mailto:sage [2005/10/09(日) 01:44:01 ]: その代わりはらわないでとめたから×とか
そういうアホな教育はやってませんから
454 名前：デフォルトの名無しさん mailto:sage [2005/10/09(日) 02:18:26 ]: つーか細部に注意をいきとどかせるなんてことやってる余裕がない。
やってたら中国製品の質もずっとマシになってたんじゃないかと思わないでもない。

なんせガキは喋れるけど書けない文字がいっぱいある。ひらがなねーし。
自分の名前くらいは幼稚園で教わるけど。
ちんたらやってたら他の教科の学習も不自由するんじゃなかろうか。
455 名前：デフォルトの名無しさん mailto:sage [2005/10/09(日) 02:18:29 ]: クォック・グーから漢字＆チュノムに変換できるベトナム語のIMEがあるといいな。
現状ではチュノムのフォントですら文字鏡くらいしかなかったような気がするが。
456 名前：デフォルトの名無しさん mailto:sage [2005/10/09(日) 04:02:31 ]: このフォントを無償公開しているって事はないのかな。
www.mojikyo.org/html/institute/sokai/02/sokai02.htm
457 名前：デフォルトの名無しさん mailto:sage [2005/10/11(火) 09:27:43 ]: NIK-code、T-code、TUT-codeを試してみたが、覚えられ中田 orz

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef