1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net] プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
4 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:19:08.83 .net] ■これまでに行われた議論 ・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え 内部的には Unicode -> CP932 -> CP5022x って変換な気もする ・人名をソートかけたらバストサイズ順の並びになる? ・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか ・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる) ・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた? ・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題 ・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。 Macではフォントによっては表示されないし、フォントによっては表示される ・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に 機種依存文字はサポートされるか? ・Safari文字コード変換のバグは ・Microsoft文字コード変換のバグは ・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件 ・なぜ携帯業界はunicode化しないのか? ・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか ・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
5 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:19:56.25 .net] ・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る ・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない ・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか) ・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES ・UnicodeとUTF-8の違いは? ・日本のCJK Ext.D Submissionに{魚針}が含まれてる件 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針) ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。 中国ではってレベルじゃねーぞ。 ・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで) サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い) ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。 ・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。 ・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。 ・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ ・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか ・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。 ・Unicodeサニタイズが面倒になるのか
6 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:20:29.23 .net] ・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉 ・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。 ・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定 → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。 ・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。 ・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。 ・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→ コントロールパネル-地域と言語のオプション-[言語]タブで 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック ・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。 ・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!! ・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。 ・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。 ・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。 ・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。 ・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る? ・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。 ・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理
7 名前:矢理突っ込むのは許さん。」 ・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。 [] [ここ壊れてます]
8 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:28:31.92 .net] テンプレ乙でござるよ
9 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:02:44.42 .net] もうひとつの過去スレ: 文字コード統一スレ 1文字目 pc8.2ch.net/test/read.cgi/tech/1109171258/ 隔離スレ: UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ UnicodeとUTF-8の違いは? その2 hibari.2ch.net/test/read.cgi/tech/1274937437/ UnicodeとUTF-8の違いは? その2 toro.2ch.net/test/read.cgi/tech/1291075205/ UnicodeとUTF-8の違い4(インディアン隔離スレ) toro.2ch.net/test/read.cgi/tech/1342963035/
10 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:13:16.40 .net] ■ライブラリ IBM Globalization - ICU www-306.ibm.com/software/globalization/icu/ NKF32.DLL www.vector.co.jp/soft/win95/util/se020949.html www1.ttcn.ne.jp/~kaneto/dll/nkf32dll.html バベル tricklib.com/cxx/ex/babel/ バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。 tricklib.com/cxx/ex/babel/scoremap.csv mlang msdn.microsoft.com/ja-jp/library/aa767865 (en-us).aspx iconv www.gnu.org/software/libiconv/ ICU www.icu-project.org/
11 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:14:10.43 .net] ■単語一覧 ・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある 表現できる文字空間はUTF-8と同じく20ビットとちょっと ・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。 今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。 似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、 素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。 ・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある ・MSでのウニコードとSJIS変換のバグ。 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】 ・SafariでのウニコードとSJIS変換のバグ。 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA ・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで 再変換しているので、それをしなければよい。 ・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。 ・JISのエスケープシーケンスが正しく認識されない本文とか。 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。 あるいはmasaka.dw.land.to/mr/jmr.php とか。
12 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:15:50.02 .net] JTC1/SC2/WG2 - ISO/IEC 10646 - UCS std.dkuug.dk/JTC1/SC2/WG2/ ISO/IEC JTC1/SC2/WG2/IRG Ideographic Rapporteur Group appsrv.cse.cuhk.edu.hk/~irg/ 日本の委員 (JSC2) www.itscj.ipsj.or.jp/meibo/020000.pdf
13 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 18:18:17.85 .net] スレ立てサンキュ
14 名前:デフォルトの名無しさん mailto:sage [2012/12/03(月) 21:21:2
] [ここ壊れてます]
15 名前:3.27 .net mailto: 西夏文字、女文字、インダス文字、女真文字なんかはまだなんだな。 日本や中国の研究者頑張れ。 [] [ここ壊れてます]
16 名前:デフォルトの名無しさん mailto:sage [2012/12/03(月) 23:51:37.30 .net] ところでさ、U+1F5FEの日本列島絵文字なんだけど、 例示図形に普通に北方四島が入ってるんだよね。 これロシアとかからクレームなかったのかな。 あるいは、奄美と沖縄が単独の点として描かれてるのに 北方四島が本土とくっついてるのはあえてどうとでも解釈できるようにしたごまかし? でも佐渡とか壱岐対馬はそもそも存在さえ描かれてないわけで、なんかちょっと変。 では、そもそもの元になったと思われるau絵文字#214「地図」ではどうだったのかと見てみたら、 なんと日本領部分は「本土4島だけ」のシンプルなものだった。 ここからどういう経緯で北方四島と奄美沖縄が加わったんだろう。
17 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 01:09:59.61 .net] >>14 日本列島という島の絵文字であって、日本という国の絵文字じゃないということだと思う。 でないと、国旗の絵文字でアレだけ揉めたのと整合性がつかなくなる。
18 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 03:19:38.20 .net] ただ、国境以外の理由で4島と千島を区切る理屈ってのもちょっとなさそうなのよね
19 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 05:19:19.05 .net] 南樺太も日本です 台湾も日本です
20 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 06:09:50.32 .net] U+1F5FCが固有名詞的な「東京タワー」じゃなくて「電波塔」という曖昧な名前で規格化する案もあったことを考えると U+1F5FEも「弧状列島」とか表現されることになっていてもおかしくなかったかも
21 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 09:09:38.01 .net] 尖閣諸島を入れて欲しかった
22 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 09:45:40.17 .net] >>18 まあ、MOYAIさんが通った時点でそのへん曖昧だよね。 これに自由の女神と並ぶレベルの公共性なんてないと思うw
23 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 19:17:25.01 .net] >>20 あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし (文字名はモヤイ像なのに)、 「モアイ像」として入れたほうがユニヴァーサリティがあって良かったんじゃないかと思うんだけど まあ渋谷とかの意味で使われる絵文字として解釈できなくなるからやっぱダメか
24 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 20:12:50.27 .net] あるいは新島
25 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 23:23:51.55 .net] >>21 > あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし まじだ……一体どうなってるんだこれ
26 名前:デフォルトの名無しさん mailto:sage [2012/12/14(金) 13:36:10.61 .net] slashdot.jp/~yasuoka/journal/559968/ >JTC1/SC2/WG2/IRG N1883 >(大正新脩大蔵経「外字」のISO/IEC 10646追加提案) これ結局、日本提案から外されたのね
27 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 21:05:28.98 .net] >>5 >・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか ISO2022なら楽勝でできる多スクリプトの混合表記がunicodeではできないってスクリプトレベル の問題を、多言語問題にすりかえるなよ 言語情報が中国語でも、それを日本漢字で表記しても何も問題はない それどころか、日本の漢文の教科書では、言語は中国語だが、字体は日本の教科書体で表記 しないといけないっての
28 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 22:53:11.62 .net] 正則漢文は中国語ではない
29 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 23:54:59.27 .net] >>25 文書そのものの言語よりむしろユーザーが理解可能なスクリプトの方が重要、 なのかなあ。 とりあえず自分のお仕事では、文書の言語情報が中国語だったら中国語のフォントを 割り当てるようにしてますけどw 例えばOSの言語設定を優先するようにしたりとかしたら... って? ...ちょっと無理かなw (ちょっと持田香織を意識してみた) 現実問題として例えば普通の日本語フォントは中国語の簡体とか持ってないから、 下手にやるとつぎはぎの脅迫文状態になってしまう。そういうのでも見たいかな?
30 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 00:26:57.58 .net] 漢字のフォントって今も全部手作業で作ってるの? 偏旁の情報流し込んだらざーっとバリエーションつくってくれて、細部だけ手修正、みたいな感じなら せっかくだから和文で使わない文字も全部含めてくれればいいのに。クオリティ落ちてもいいからさ。
31 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 05:39:55.98 .net] じゃあおまえがやれよ
32 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 09:22:41.68 .net] e漢字というプロジェクトがあってだな
33 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 10:30:33.04 .net] つまんね
34 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 11:52:51.57 .net] 結局GlyphWikiみたいに人肉制作が一番成果物につながりやすいのかな
35 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 19:09:10.91 .net] Glyphwikiは曲線を実現する方法が改善されたら無敵かも。
36 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 19:33:32.32 .net] 現状のGlyphWikiで作った記号とかネタレベルだもんな。
37 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 21:08:27.21 .net] 花園は非漢字だけ別のフォントから借りてきた方がいいと思うんだけど 明朝だとなかなか選択肢がないのかな
38 名前:デフォルトの名無しさん [2012/12/21(金) 22:43:08.51 .net] IPA明朝丸取りで良いやん。
39 名前:デフォルトの名無しさん mailto:sage [2012/12/28(金) 22:20:50.30 .net] さて年の瀬なわけだが
40 名前:デフォルトの名無しさん mailto:sage [2012/12/28(金) 22:38:05.25 .net] 年の瀬くらい、おとなしくしてなさい
41 名前:デフォルトの名無しさん mailto:sage [2012/12/29(土) 21:59:11.75 .net] 年の瀬だから、いいじゃん
42 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 14:27:54.18 .net] こんなの始まってた www.ipa.go.jp/about/kobo/tender-20121228-2/ >今回、変体仮名⽂字の字形を調達し、今後のフォント拡張及び文字符号の国際標準化の >素材として使用するものとする。 変体仮名の符号化が動き出したか
43 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 18:45:39.07 .net] 良くも悪くも、今回デザインされた字形が「正しい変体仮名」として未来に残っていくんだな。
44 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 20:49:44.39 .net] だろうなあ。変体仮名の字形に熟知したデザイナーなんてどれだけいるやら… 3月〆切ってことは早ければ春先にもまずIPA明朝に収納される可能性ありか。 どんなのが出てくるかちょっと楽しみ。
45 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 00:46:22.92 .net] さて年が明けたわけだが
46 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 02:41:22.10 .net] 「謹賀新年」「迎春」とかは一つの文字コードを与えていいんじゃないだろうか
47 名前: 【凶】 【721円】 mailto:sage [2013/01/01(火) 04:40:04.62 .net] #あけおめ #ことよろ
48 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 15:26:12.83 .net] あけおめー
49 名前:デフォルトの名無しさん mailto:sage [2013/01/02(水) 06:14:56.17 .net] 縦組み専用のワープロソフトも出てくるんだろうか
50 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 00:56:50.23 .net] blog.query1000.com/archives/21819386.html >日本は今まで(他の国の提案を)撃ち落とす方で頑張って来たのに、 WG2/IRGへ邪魔しに行ってるのを認めちゃったよ
51 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 03:41:54.21 .net] >>44 戦前に「天皇陛下」の一体活字を作った新聞社じゃないんだから。
52 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 04:29:39.37 .net] ひょっとしてそれって、文選で間違えると打ち首にされるとかの回避策?
53 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 04:40:26.90 .net] 文中の「陛」文字頻度が低い上に特定の熟語にしか使われないからでしょ
54 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 14:51:44.58 .net] >>48 blog.query1000.com/archives/21798078.html blog.query1000.com/archives/21819386.html blog.query1000.com/archives/21848658.html blog.query1000.com/archives/21886099.html 四連作なのね。結構、裏話っぽくて面白かった。
55 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 15:16:53.92 .net] ああ、例の本の深沢さんか。参考になったわ。
56 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 23:04:36.32 .net] >>52 安岡も耄碌したな。トイレと天気の話しか出来ないのか。
57 名前:デフォルトの名無しさん mailto:sage [2013/01/07(月) 14:54:11.70 .net] >>50 北朝鮮方式か
58 名前:デフォルトの名無しさん mailto:sage [2013/01/07(月) 14:56:08.81 .net] あと、4文字の途中で改行することが許されないから、 (というか、直前で改行して必ず行頭に置くことになってるから) という事情もあるな。
59 名前:デフォルトの名無しさん mailto:sage [2013/01/08(火) 21:03:09.32 .net] JIS Z 8903廃止なのね
60 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 07:20:34.61 .net] ああYさんとこね 変体仮名字形の入札、濁点/半濁点つき字形のことを忘れているような
61 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 16:28:46.12 .net] >>59 戸籍にも住基にも濁点/半濁点付き変体仮名は無いから とりあえず最初のうちは作らないみたい でも今後どうするかは謎
62 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 16:30:30.81 .net] >>59 自分自身を指してしまったorz
63 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 22:23:43.57 .net] そうなのか…じゃあ本当に行政専用になりそうだな
64 名前:デフォルトの名無しさん [2013/01/11(金) 00:54:51.84 .net] 合成でなんとかしろって事ではないのかな。 アイヌ語の表現みたいに。
65 名前:デフォルトの名無しさん mailto:sage [2013/01/11(金) 02:03:45.26 .net] 欧文のストロークみたいな感じで
66 名前:デフォルトの名無しさん mailto:sage [2013/01/12(土) 01:02:43.90 .net] >>63 kwsk
67 名前:デフォルトの名無しさん mailto:sage [2013/01/13(日) 09:21:45.76 .net] ふむ
68 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 22:23:13.81 .net] ほう
69 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 23:00:03.96 .net] すべてが順調にいったとしても 使えるようになるのは2015年頃かのう
70 名前:デフォルトの名無しさん [2013/01/16(水) 15:44:53.71 .net] 拡張Fきてるし
71 名前:デフォルトの名無しさん mailto:sage [2013/01/16(水) 18:54:26.26 .net] irgはいつの頃からか記念写真やめちゃったのね
72 名前:デフォルトの名無しさん mailto:sage [2013/01/19(土) 00:08:29.61 .net] Ext Fまで来ると、もうIPAmjとGlyphWikiくらいしか 実装されないんじゃなかろーか
73 名前:デフォルトの名無しさん mailto:sage [2013/01/19(土) 23:36:28.62 .net] ExtFどこにきてるの
74 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 07:02:56.46 .net] あなたのうしろよ
75 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 21:41:44.70 .net] 中国語の漢字もう疲れた... 偏が簡体になったやつがやたらコードポイントを 消費しているような。 もう簡体と繁体もunifyすればよかったんじゃんw
76 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 23:15:17.97 .net] 繁体:簡体が多対一で対応してるのとかへのルール作りを考えるとユニるのがめんどくさい
77 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 23:26:09.98 .net] Ext.Fどこで見られる?
78 名前:デフォルトの名無しさん [2013/01/23(水) 00:14:21.88 .net] unicode とか JIS X 0208 だと、ASCII文字(記号含む)の全角版って、互換性維持の為にあるものだよね? JIS X 0208 だと、ほぼ使うなと同等なことが書いてあるけど、 今の unicode standard だと使っても全然問題ないみたいに書いてある。 現実的に、フォントと多くの表示環境では、レンダリングされるときのマージンとかスペーシングを考えると、 日本語を書くときは全角を使った方が見栄えが良くなると思う。 ASCII文字の全角版を使わないという選択はとれないんではないの? 日本人は分かち書きなんてしないから、マージンとかスペーシングを気にしないのかもしれないが、 ラテン文字を使う外国人はマージン・スペーシングに関して全角の方が見栄えがいいから、 unicode standard で禁止されてないし、全角文字を使う風潮が流行るんではないかな。このままほっとくと。 実際、CJK文字を含むテキストで何で半角記号(括弧とか、&とか))を使うのか?全角記号を使うべきではって外国人に言われたし。 まともな反論できなかったわ。
79 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:32:25.32 .net] 英数字に全角文字使えよ
80 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:40:31.84 .net] >>77 まあ、日本語で書くときの話をしてるから。それに解決になってないし。 追記しとくと、 (日本語) みたいに全角括弧でくくった場合、括弧の前後にマージンがあるフォントとないフォントがあると思う。 これを半角にしてしまうと、ほとんどのフォントでマージンがないから、前後に空白文字を入れないと、マージンが無くなってしまう。 これが見た目に影響してしまうんだよね。 また、縦書きの場合に おしっこ&うんこ みたいに書くと、全角&は正立するが、半角&は90度回転する環境がほとんどだと思う。(?!とかもそうかもね) じゃあ、CJKだと普通の文字は正立するから、全角で書かないといけないよねってことになる。 今すぐ役に立つものを作る場合は、規格より、現実を優先させないといけないしなぁ。 っつーか、なんでunicodeの互換エリアって使っても問題ないみたいになってしまったんだ?
81 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:01:38.61 .net] >>78 全角って単にコードの話で、 マージンやスペーシングがどうかなんて規定されてないだろ。 横幅が半分でもコードが全角ならそれは全角だよ。
82 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:15:32.71 .net] >>79 そりゃそうだけど、じゃあどうするべきなの? 俺はマージンとか縦書きの時の配置はレンダラが適切に処理しろと思うけど、 現実PCの表示環境でそんなの気にしてないし。 フォント制作者も文字の効用に合わせて作ってるんだろ? 半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。 現実に合わせても将来がない上に、規格にそってもまともなレンダリングがされない現状って。
83 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 07:33:02.14 .net] NEC PC-98シリーズには、2バイト半角文字がある。
84 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 08:00:06.14 .net] 括弧とかは全角版を「スペースが予め含まれた括弧」みたいに再定義しておくべきだったかもしれんね。
85 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 12:42:32.90 .net] 縦書きの時に何を正立させて何を回転させるかは今UTR50でやってる。 もっとも、外野が口を突っ込みすぎて座礁しかかってるけど。
86 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 13:40:47.76 .net] どうせSJIS⇔Unicode変換には演算入るんだから英数やキリルのJIS全角文字はダイアクリティカルマーク様にコンバインで収録すべきだった
87 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 14:13:01.99 .net] East Asian WidthがAmbiguousなやつどうすんだよって問題も未だ解決されてないし どんなとき縦中横にするのかとか文字コードだけで解決できる問題とは思えないよな
88 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 15:05:26.83 .net] >>80 それは単にあんたの使ってる環境やフォントの機能不足だろ。 >半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。 ヒラギノは文字幅の設定8種類持ってて切替えられる。 OSX上でプロポーショナルにも全角/半角側に統一とかも設定次第で好きにできる。
89 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 16:45:24.79 .net] 「AAAAAA」が全く同じ文字の連続に見えるようなフォントって話だと思ってたけど OSX+ヒラギノの環境ではそれが可能ってことであってる?
90 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:14:59.80 .net] >>87 そう、OpenTypeの機能。 OSXは標準のテキストエンジンでサポートしてる。 他のプラットフォームでも真面目にサポートしてれば使える。
91 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:43:27.76 .net] WinだとDirectWriteでやることになるのかな
92 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:56:57.04 .net] 同じ文字には同じコードを割り当てるべきだと思うの
93 名前:デフォルトの名無しさん [2013/01/23(水) 18:44:14.32 .net] あれ、なんか話題のレベルが落ちてきてない?
94 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:20:18.78 .net] ンとソのちがいは、日本人ならわかるけど カタカナのベ ひらがなのべのちがいは、日本人でもわからん
95 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:23:02.00 .net] シとツのちがい うとラのちがい
96 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:27:37.37 .net] >>93 これだね livedoor.blogimg.jp/conbul/imgs/9/7/97efb758.gif
97 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 21:38:01.20 .net] >>92 何故へとヘではなくべとベなのか
98 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 01:29:41.99 .net] >>86 OSXは使った事ないし知らなかったわ。すまん。 その外国人もマックユーザっぽいから、そういう風なレンダリングできるのを自分で見れば納得するかも。 You & I も あなた&わたし も ひろゆき(2ch管理人) も hirokyuki (the founder of 2ch) も 前後の文字を見て適切な字形とマージンを自動選択できる表示ソフトがあるってことだよね。 その外国人は上みたいな文字列を適切に表示させることが出来る環境なんて見たことないって言ってたから、 なにか適切な設定してやらないといけないってことかな。どうすればうまく表示させられるの?
99 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 04:29:08.26 .net] Unicode Consortiumの内部文書へのパスワードを解除するって ものすごい決断だなあ。これまで水面下でしてきたことも これからすることもすべて丸裸か…
100 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 05:26:08.43 .net] >>90 思うね。ふたつあるΩに、つい「オメーガ悪い!」と叫んじまったぜぃ
101 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 13:30:47.01 .net] ユニコードは日中韓の同じ文字に同じコードを割り当てた所に問題が有った訳だが・・・
102 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 15:05:11.07 .net] iモードはなぜJIS X 0208にすでにある♪を絵文字に追加したのかw
103 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 17:40:08.34 .net] www.nttdocomo.co.jp/service/communication/imode_mail/function/pictograph/ 「るんるん」であって八分音符じゃないから まあ意味も同じな「!」まで追加してるし色つけたいとかアイコンのかわりに使いたいとか 絵文字の水増ししたいとかそういう理由なんだろうな どちらかといえば「黒ハート(赤)」のほうが納得いかないし
104 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 18:28:41.15 .net] 絵文字なんて、ミクシィみたく数値参照みたいな形式でいいのに。 なんでコードポイントなんか与える必要があるんだよ。