1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ] ビッグインディアンとかなんとかかんとか
477 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:56:33 ] それがサロゲートペアだろ。
478 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 10:48:55 ] なんでやねん
479 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:28:35 ] >>473 そいつは画像でやれよ…… 一般的な用途ではある程度ユニファイされてる方がいい。 微妙な違いなんて日常的な文章には不要だし、検索とかにも不便だし。
480 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:53:14 ] >>477 (;゚д゚) ・・・ (つд⊂)ゴシゴシ _, ._ (;゚ Д゚) …!?
481 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 13:30:19 ] >一般的な用途ではある程度ユニファイされてる方がいい これはその通りだと思うけど、符号化のレベルではやらない方が良かったかと・・ もう1つ上のレイヤを用意して表記ゆれを吸収するのはそこの層がやる とかにすればやり方を失敗してもそこの層を差し替えるとかして何とかなったのに
482 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 19:58:48 ] 同意.一番下でマージしちゃったらどうしようもない 画像でやれって言う人は,実際に自分でやってないから どれだけ大変かつ不便で読み難くなるか分からないんだろうな
483 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 20:39:00 ] 実際に文字コード設計したことない人が国コード付けろとか128ビットにしろとか 妄想語るのももはやお約束ですよねー
484 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:19:59 ] UnicodeでAdobe Japan1-6互換の字形切替をする枠組みが既に正式規格化されているにも関わらず、 「みたいな形にすればよかったんじゃない?」 「もう1つ上のレイヤを用意して」 「一番下でマージしちゃったらどうしようもない」 とか言ってるヤツってナンなの?ゆとり? ttp://www.unicode.org/reports/tr37/ ttp://www.unicode.org/ivd/ ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-white-paper.pdf 上記PDFに書かれている対応製品以外にも、フリーソフトやフリーフォントで既に対応しているものもある。 ttp://alpha.sourceforge.jp/ (↑:日記の2008年1月〜に詳細記述) ttp://yozvox.web.infoseek.co.jp/ (↑:掲示板の2008年1月〜に詳細記述) てか、文字コードの話をするなら↓の方がいいだろ、常識で考えて。 文字コード総合スレ part3 ttp://pc11.2ch.net/test/read.cgi/tech/1180250376/
485 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:42:42 ] >>483 いかにも 「ワタシが文字コードを設計しました!」 って言いたげだな
486 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:43:44 ] 何事にも失敗はある。
487 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:48:47 ] Unicodeは失敗
488 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:15:27 ] ROMっているだけだったが、ここが文字コードスレだと錯覚していた。
489 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:17:37 ] ゆとり教育は失敗
490 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:26:55 ] 失敗したら反省が必要。そして次回はどうすべきか案を出し合う。
491 名前:デフォルトの名無しさん [2008/07/23(水) 19:39:46 ] >>453 しゅーまる(何故か変換(ry)は、アラビア語ちゃんと扱えるんだ。すごい。 xyzzyはアラビア語無理なんだよなあ・・・
492 名前:デフォルトの名無しさん mailto:sage [2008/07/23(水) 21:00:50 ] 有名どころだと秀丸とEmEditorくらいだな。
493 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 09:32:45 ] しゅーまるぐみはやわじゃねえ! しゅーまるぐみにはいるんだ!
494 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 10:12:30 ] EmEditorのフリー版のUnicode対応はイマイチだけど 有料版はいいんかな
495 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 14:54:39 ] Alphaはどうよ
496 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:03:58 ] >>494 たぶんエディタ部分のコードは同じだと思うよ。
497 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:38:06 ] >>495 アラビア語の結合は対応してるみたいだけど、キャレットとか選択領域の端とかと重なると切れちゃう。 ただ、いまのところシンタックスハイライティングがびみょんで、この板的な実用には向かんかなあ。 >>492 EmEditorや秀丸って右から左に表示するオプションあったっけ? 前に試したときはどっちもダメだった気がしたんだけど、それから対応したのかな。
498 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:48:06 ] 直接指定するわけじゃなくて、エンコードで判断
499 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:59:43 ] >>498 それはEm? 秀丸? でも、そうなるとUnicode系の文字コードじゃRTL文書書けないのかな。
500 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:25:06 ] >>497 > この板的な実用には向かんかなあ。 プログラム技術@2ch掲示板 ttp://pc11.2ch.net/tech/ この板はプログラムを作る人のための板です。 プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。 ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。 Javascript は Web 制作板、CGI は Web プログラミング板へ。 業界談義、愚痴はプログラマ板へどうぞ。 ゲーム関係の話題はゲーム製作板へどうぞ。 ネタ、板とは関係の無い話題はご遠慮ください。
501 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:31:19 ] >>500 は有名な基地外だから無視していいです
502 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:36:12 ] >>500 Alphaは、アラビア語が(比較的)まともに扱えるけど 「シンタックスハイライトが微妙」だから 「プログラムを作る人」が使うエディタとしては「実用には向かん」 って行ってる様にみえるんだけどなんでそのコピペなのか理解できません!
503 名前:499 mailto:sage [2008/07/24(木) 22:42:59 ] 試してみたけど、秀もEmも右から左にする方法を見つけらんなかった…
504 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:43:33 ] 夏休みだから話題が逸れる前に予防線張ろうとしたと解釈してあげよう。
505 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:00:11 ] /////// ///////____________ ///////  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| ̄ ̄ /////// (~) チリンチリン /////// ノ,, /////// ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ /////// ( ´∀`)( 厨 ) )) < 夏だなあ〜 /////// (つ へへ つ \______ /////// //△ ヽλ ) ) 旦 ////// l ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄l /////  ̄| .| ̄ ̄ ̄ ̄ ̄ ̄ ̄| .| ̄ //// ^^^ ^^^
506 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:29:12 ] >>500 コイツ、バッチファイルのスレで誰にも相手にしてもらえないから こんなスレを荒らしてやがる。
507 名前:デフォルトの名無しさん [2008/07/29(火) 07:43:38 ] ↓メタ夏厨議論どうぞ
508 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 06:59:11 ] Unicode は、夏厨 UTF-8 は、メタ夏厨議論
509 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 15:04:31 ] UNICODE: 数社の企業が決めたもの、使用できる文字とその番号を定義。 UCS: 国際標準、内容はUNICODEとほほ同じ UTF: UNICODEやUCSをコンピュータ上に表現するための仕組み この認識あってる? UNICODEとUCSってのはJavaScriptとECMAScriptの関係に似てるんかねぇ。
510 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:01:28 ] コンソーシアムとその規格が Unicode 国際標準規格が ISO/IEC 10646 そしてそのそれぞれで UCS とか UTF とか定義してる
511 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:16:04 ] ISO/IEC 10646の名称(の頭文字とったもの)がUCSだろ。 509の理解で合っているぞ。
512 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 18:07:10 ] 大は小を兼ねるんだから、 Shift-JistとEUCもこれからはUTF-8で扱えばすべて解決。 ユニックス派のカタブツはEUCにこだわるからいけない
513 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:32:12 ] 文字集合は大は小を兼ねてるけど符号化方式が違ってるだろ
514 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:47:50 ] 最近のUNIXなら、日本語環境でもだいたいUTF-8だと思うが。
515 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 20:54:34 ] >>512 むしろS-JISの方が圧倒的に量が多くて、移行できないだろ。
516 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 02:18:53 ] >>509 > この認識あってる? 間違ってます。
517 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 09:20:32 ] >>516 kwsk
518 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 13:25:21 ] >>517 間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無いだろ。 ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書くしな。
519 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 06:28:17 ] >>518 「間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無い」 「ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書く」 そう考える根拠は? あ、そうか、根拠をはじめから書いていない奴には、詳しく説明できるほどの根拠が無いんだっけ。 ごめんごめん、訊くだけ無駄だった。
520 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:08:55 ] >>519 まあ、その、なんだ、悪かったよ…。図星つかれてレスもまともに読めなくなるほど泣く とは思わなかったんだよ。もう言わないから勘弁してくれ、な?
521 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:25:39 ] 泣かしたな悪者め
522 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 10:47:03 ] 子ども泣かすの良くない
523 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 11:21:50 ] ><
524 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:07:25 ] 、_人_人_人_人_人_人_人_人_人_人_人_, 、_) (_ _) 夏 厨 警 報 !! (_ _) ( '⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒` // ヘ,(゚∀゚)y'^ アーヒャ ヒャ ヒャ ヒャ ヒャ 、 _L_;二;_.j_ , \\  ̄ ト、~Y~,/| ̄ ,|yΛ=スイ|、 アーヒャヒャヒャ _ ' | | !;∀Y i| ` /##;〉 |イYト〉イY.| /  ̄ アヒャヒャ レYy'`vレ| ヽ(゚∀゚ )ノ Vy V' (夏 )ヘ ヽ( ゚∀゚)ノ < ( 夏)ヘ <
525 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:51:53 ] >>520 夏のどさくさに紛れて、そういうキャラ付けで逃げるのはよくないよ。気持ち悪いし。
526 名前:デフォルトの名無しさん [2008/08/02(土) 00:49:27 ] 鸚鵡返し、人格攻撃はスレが機能しなくなるからやめようよ・・・
527 名前:デフォルトの名無しさん mailto:sage [2008/08/02(土) 09:11:38 ] >>516 が>>509 に対して説明すれば済むだけの話。
528 名前:516 mailto:sage [2008/08/03(日) 21:29:00 ] >>509 pc11.2ch.net.nat.homeunix.org:65082/post.pl?b=tech&t=1177930957
529 名前:デフォルトの名無しさん [2008/08/04(月) 01:36:40 ] 本来は Unicode ⊂ UTF-8 であることは明白だが、 事Windows OSではUTF-16の事を単にUnicodeと表記するので、 Windows上では Unicode ≠ UTF-8 とも言える
530 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 10:02:52 ] 釣りですか
531 名前:デフォルトの名無しさん [2008/08/04(月) 14:51:21 ] ググれカス
532 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 21:52:42 ] ネタにマジレス( ´;゚;ё;゚;)きんも〜☆彡
533 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 04:13:34 ] 【JISコード】 デコード↑/↓エンコード シフトJIS EUC 【ユニコード】 デコード↑/↓エンコード UTF8 UTF16LE/UTF16GE UTF32 【音声】 デコード↑/↓エンコード WAV MP3 WMA 【ビデオ】 デコード↑/↓エンコード AVI MPG FLV
534 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 05:55:43 ] 全角で書く奴って、やっぱりアレだな…
535 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 06:28:39 ] ときに、UTF16GEってなんだろ。
536 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 07:17:57 ] デコードした先がコードとは何ともかんとも
537 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 09:48:19 ] >>535 ゲルググエンディアン
538 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 12:00:16 ] あまりの非の打ち所の無い完璧な説明なため 全角や誤字しかツッコミどころが無いな。
539 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 13:13:37 ] 確かにゲルググエンディアンは完璧だ
540 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 14:10:58 ] コンテナはどうなんだ
541 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 23:19:58 ] >>533 おい大漁だなw やったじゃねーかw >>533-539 釣られまくり乙
542 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 02:34:28 ] 全角と誤字以外のツッコミは無いのかい?
543 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 11:32:08 ] へんなのが住みついたね
544 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 13:00:18 ] 夏だね。
545 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:11:48 ] そろそろ秋だよ
546 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:16:05 ] 暦の上でどうだろうと、今は夏真っ盛りだ
547 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:01:12 ] では、全角と誤字以外には非の打ち所の無い カンペキな「Unicode と UTF-8 の違い」の解答という事で 無事にこのスレを閉じたいと思います。 みなさん、長い間ごくろうさまでした。
548 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:16:28 ] お疲れさまでした。
549 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:35:31 ] 先生の次回作にご期待ください。
550 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 04:19:12 ] 世 界 迷 作 劇 場 おわり
551 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 21:56:12 ] 思ったこと。 ・広義の「ユニコード」はUTF-8等の規格を含めることがあるので不正確 ・>>536 指摘済みだけど、音声のenc/decと、文字のenc/decを一緒にするのは 違和感あり。JISコードは既に「符号(コード)化」されてるから。 俺的には 音楽→(量子化)→PCM→(各種圧縮)→MP3 の3段階が 文字→符号化文字集合→テキストエンコーディング に対応する感じ ・AVIって格納形式の概要だけ決まってて、圧縮アルゴリズムは別じゃなかった?
552 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 22:59:54 ] 狭義のユニコードっていうのはM$が決めつけたUnicodeのことか? 例えば、ttp://msdn.microsoft.com/ja-jp/library/ms191200.aspx >Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため つーか、広義も狭義もねーよ。バーヤ。
553 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 00:08:21 ] まだやる気か?
554 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 01:50:13 ] >>552 MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。
555 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 04:17:35 ] サロゲートペア厨必死だな。無視されてんのによw
556 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:21:22 ] サロゲートペアは、32bit wchar_tの入り口ですよ。
557 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:33:01 ] マイクロソフトで統一すれば市場に一致して解決
558 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:38:44 ] けど駄目仕様に駄目実装が蔓延ると思うよ 競合いてもあれだもん
559 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 10:57:45 ] 結論 >>1 みたいなのが現れるのはMSが糞だから
560 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 11:58:30 ] 何でも他人のせい、日本のせいにする人たちみたいですね。
561 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 12:35:44 ] 批判だけならパートのおばちゃんでも出来る。 問題は、どう改善すべきか、改善するに当たって 予算・人員・スケジュールをどう工面するのか、だ。 それを何一つ提示していない。 おまいら、パートのおばちゃん以下のクズ。
562 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 14:04:35 ] その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが
563 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 22:59:01 ] 少なくともパートのおばちゃんは働いてるからな ^^^^^^^^^
564 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 00:51:35 ] >>552 マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533 からの 流れからして 協議:符号化文字集合としてのUnicode 広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格 以外の解釈はありえんと思うが。このスレ>>14 ぐらいまで読み直せ。
565 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 04:22:32 ] だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。
566 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 07:01:57 ] お前ら、紛らわしいと思わないのか? MSは正義だからOKとか、思考停止杉。
567 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 08:34:38 ] え、誰か「MSは正義」とか言ってる? その脳内設定が、お前の思考停止なんじゃないの? 思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
568 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 09:53:28 ] >>567 >>557 >思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
569 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 11:23:13 ] > お前ら たった一人書いてただけで、「お前ら」か。 知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。
570 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:07:27 ] 以下でOK? ・(文字集合としての)Unicode 扱う文字の一覧を定めて、識別用に符号をつけたもの。 「あ」=U+3042、「A」=U+0041・・・ ・UTF-8 Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。 あA(U+3042 U+0041)→E3 81 82 41 エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。 よってUnicodeとは 1. 符号化文字集合の一つ 2. 文字コードの規格 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。
571 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:21:53 ] >>570 > よってUnicodeとは > 1. 符号化文字集合の一つ こんな使い方はない。 > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい アホドキュメント、アホアプリは無視するのがいい。
572 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:24:33 ] ×符号化文字集合 ○文字集合 だよね? MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。
573 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:39:23 ] 「マイクロソフトの」と書いているが、 まともなドキュメントもあるわけで… メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、 > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。
574 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:42:08 ] >>573 メモ帳もUnicode/Unicode big endianだけど。
575 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:52:08 ] とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ
576 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:01:15 ] > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい 典拠は? >>552 だけ? これってSQL Server 2005のドキュメントだよね?
577 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:32:53 ] >>576 Office XP リソース キット Unicode サポートと多国語ドキュメント ttp://msdn.microsoft.com/ja-jp/library/cc389880.aspx >Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。