[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 03/31 11:47 / Filesize : 208 KB / Number-of Response : 1019
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ part8



1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net]
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/

830 名前:デフォルトの名無しさん mailto:sage [2014/04/17(木) 21:36:39.35 ID:sxwy7+Pq.net]
どうでもいいよもう。

とりあえず安岡叩きしてる人はどこか味方のいる場所を見つけてそっちで好きなだけやってくれ。
ここで叩いても誰も賛同せずに今回みたいな流れになるだけだからさ。

831 名前:デフォルトの名無しさん [2014/04/19(土) 02:41:39.74 ID:GMRdES/l.net]
ネットのテキストをコピーすると、たまに文字コードの異なる半角スペースがあるのが困る。

832 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 05:54:36.53 ID:4rjoMz+n.net]


833 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 09:54:13.30 ID:uixitbPb.net]
どちらかというと「安岡」という単語に猿のレベルで脊髄反射して
トロン信者認定のレスを貼る安岡信者の方がすごいと思う

834 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:11:12.57 ID:4rjoMz+n.net]
>>824
過去ログに残る執拗な叩きの痕跡という前提がまるで存在しないかのように、
件の彼に対する反応を「『安岡』という単語に猿のレベルで脊髄反射」ってことにするのはどうかと。
あなたが同列に「どちらがすごいか」を比べてるのが奇妙に思えるほど、件の彼の行動は異質。積み重ねがあるからね。

そしてもちろん、件の彼について話している人は
「この人はなぜ、疎まれることがわかっている場でなお1人で叩き書き込みを続けるモチベーションを持っているのだろう?」
という点を不思議に思って集まっているんであって、書き込みの動機は明確。ここから「安岡信者」と解釈はしづらい。

また、仮にもしそのなかに「安岡信者」が紛れ込んでいたとして、
その信者はこのスレで執拗に「敵」を叩き続けたりはしていない。
件の彼と違って人畜無害なのだから、ほうっておけば良い。

835 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:15:43.09 ID:ZEjCExyP.net]
おれなんでこのスレ常駐してんだっけ……

836 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:43:05.46 ID:kntd4M4V.net]
>信者はこのスレで執拗に「敵」を叩き続けたりはしていない。

これには同意。
安岡信者は被害妄想が激しく
単発のレスで偏執に被害を主張するのが特徴だからね。

837 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 17:03:56.09 ID:C6iMx0Tv.net]
>>822
NBSPが紛れこんでてイラっと来るやつかな

838 名前:デフォルトの名無しさん mailto:sage [2014/04/20(日) 08:23:30.09 ID:KqLq5BGH.net]
信者とか言い出す時点でどの発言も議論として無価値



839 名前:デフォルトの名無しさん mailto:sage [2014/04/21(月) 10:53:47.48 ID:zriSdqBt.net]
> 被害妄想が激しく
> 単発のレスで偏執に被害を主張するのが特徴だからね。

安岡さんに対して執拗に粘着している君の特徴じゃないかw

840 名前:デフォルトの名無しさん mailto:sage [2014/04/21(月) 19:22:16.02 ID:FvrWMSvP.net]
安岡センセイもビットコインに走っちゃったから…
…おっと誰か来たようだ

841 名前:デフォルトの名無しさん mailto:sage [2014/04/22(火) 02:46:51.52 ID:P71sOVmH.net]
誰も来てない

842 名前:デフォルトの名無しさん [2014/04/22(火) 16:39:21.34 ID:lALHniJm.net]
よそでやれよ気違いども

843 名前:デフォルトの名無しさん [2014/04/23(水) 01:02:12.57 ID:sJ3rggrT.net]
サロゲートペアがらみで文字化けとか文字落ちは未だに良くありますか?
合成文字(アイヌ語表記用)などがうまく処理できないんですけど、完全にサポートをしないと割り切った人はいますか?

844 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 01:11:50.85 ID:8DMe2xVl.net]
サロゲートペアかどうかの判定なんていちいち入れないし
固定長に可変長混ぜたら何の意味もない

845 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 01:58:46.32 ID:GjUEx0RG.net]
何か誤解してる様だが、元々Unicodeの文字表現は可変長

846 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 18:34:35.68 ID:TEjyogET.net]
はじめは16bit固定じゃないの?

847 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 20:59:37.84 ID:TEjyogET.net]
「元々」って「当初は」って意味で書いてないのか
すまん

848 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:11:18.40 ID:7vo5B08Z.net]
「か」と「゛」で「が」みたいに
二文字で一文字を表す合字があるんだから、
言語機能かライブラリを使うしか
現実的な対応方法ないだろ。

逆に言えば、それらを使っていれば
無視できる問題。



849 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:34:36.00 ID:T2nRtnpg.net]
UTF-8あたりとごっちゃになってる?

850 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:52:29.17 ID:WcbcT70M.net]
最初から UTF-16 も UTF-32 も可変長だけど
未だに固定長と思ってるやつなんかいるんだ?
そりゃすげーや

851 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:58:56.82 ID:FOWeiF78.net]
そりゃ日本の官公庁相手に仕事してる分には
たいていそれで許されるからな

852 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 22:22:44.74 ID:GjUEx0RG.net]
>>841
「code pointを複数組み合わせた可変長で文字(grapheme)を表現する」っていう
Unicodeの基本をどうしても理解できない(認めたくない)人がいるんですよ。

853 名前:デフォルトの名無しさん [2014/04/23(水) 23:13:15.72 ID:Unh9uImh.net]
>>842

お役所が扱う人名なんて、それが許されない筆頭じゃなかろうか。

854 名前:デフォルトの名無しさん [2014/04/24(木) 11:06:30.10 ID:Cg0dX6qy.net]
Unicode1.0の頃はUCS-2。UTF-16は2.0から。
UCS-2はBMPの固定長エンコーディング。
まだ固定長原理主義者が多い頃だったから。

けどそれじゃBMP以外や合成文字どうすんねん、
規格の中で矛盾してるだろ、固定長原理主義無理だろってことで、
その辺入れたUTF-16になった。
たしかUTF系はベル研のケン・トンプソンが考えた8が最初。

うろ覚え書き込みだから、修正よろ。

855 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 00:12:43.23 ID:zWWRq5q6.net]
修正不可能なくらい間違いまくってるよ。
そもそもUCSは文字集合を定めるものであり、UTFは個々の文字を
どう表現するかを定めるものであってまったく別の概念だし。

856 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:45:09.27 ID:3oy/mjAO.net]
CPUのエンディアンが複数あるため、UTF-16にはBEとLEがあります。
どのサイトも説明見ると大体こんなような事書いてあるけど意味が分からない
エンディアンがどうこうってエンコーディングの内部で解決されるべき問題でしょ?
CPUに合わせてLEを使うと速いですよって事?

857 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:57:28.13 ID:XCREUD3T.net]
絵文字統一か

858 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:03:42.00 ID:t30thbGu.net]
>>847
確かにその説明はおかしいと思う。
画像フォーマットでもtiffにはエンディアンの指定があるが、普通はどちらにも対応する。



859 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:20:19.28 ID:B1sFbtmb.net]
>>847
ちゃんとエンコーディングでBE,LEが考慮されてるでしょ?
それともBEとLEの存在自体が問題だといってんの?
何がおかしいかわからない

860 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:55:02.90 ID:4klH39dY.net]
何を悩んでいるのかしら無いけど、
初期のUTF16の話として16bit固定っていうのはわかるよね?

C言語風に書くならば、WCHAR型(16bit)となって、
WCHAR *text = "あいうえお";
こういう定義になる。

この時のメモリ配列はC言語の仕様によりCPUのエンディアンによって変わる。
このメモリ内容がUTF-16BEやUTF-16LEなんだよ。

ファイルに保存するときはどちらかに統一してもいいが、
処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
だからUTF16-BEかUTF16-LEというものが生まれることになる。

メモリ内で使うために、UTF16-BE と UTF16-LE の存在を無くすことは出来ない。
そのメモリ内容をそのまま保存することもある。テキストファイルではなくて
構造体データの一部としてテキストが含まれている場合とか、一項目ずつ保存するのではなくて
メモリの構造体データを丸ごと保存したりするからね。

だから、UTF16-BEかUTF16-LEという存在はCPUのエンディアンの存在によって生まれ、
それを保存するファイルに格納されたデータの呼び名にもなる。

861 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:14:58.98 ID:gMbJ5qLh.net]
テキストファイルで保存するときでもLEとBEを選べるエディタがあるんだが
それはおかしいのか?

862 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:19:55.61 ID:jrLTZF6i.net]
世の中に二つの形式があるのなら、
二つの形式を選べるのが普通でしょう?

エンディアンが違うCPUとの間でもファイルの交換や、
ネットワーク通信できるんだから。

863 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:57:01.01 ID:m07o/u+5.net]
> C言語風に

864 名前:曹ュならば、WCHAR型(16bit)となって、
> WCHAR *text = "あいうえお";
> こういう定義になる。
WCHAR *text = L"あいうえお";
じゃね?
[]
[ここ壊れてます]

865 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:01:18.03 ID:jrLTZF6i.net]
別にC言語風だからどうでもいいよ

866 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:34:10.60 ID:XZGKxZHW.net]
たまには。PDPエンディアンのことも思い出してあげて

867 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:49:44.73 ID:T54U1ii9.net]
エンディアン嘘つかない

868 名前:デフォルトの名無しさん [2014/04/25(金) 17:51:44.43 ID:4fGC8eBc.net]
>>845
UCSとUTFの区別は最初はなかった。
最初はUCSのみ。
>>845も書いてるけど。



869 名前:デフォルトの名無しさん [2014/04/25(金) 17:56:44.39 ID:991UJ/F9.net]
>>847
UTF-16文字列はuint16_tの並び。
uint16_tだからCPUによってバイト順が違う。
だからエンコーディングのバイトオーダーが決まってると、
逆順のシステムはネットワークにデータを流す時にバイト順を毎回変えないといけない。
それを防ぐためにバイトオーダー順違いのエンコーディングが定義されてる。
こうしておくと必要なときだけバイト順を変えればいい。
DCE/RPCみたいに接続時にバイトオーダをネゴしてもいいし、
どちらを送られても必ず扱えるようにしてもいい。

870 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 18:34:47.40 ID:3oy/mjAO.net]
レスありがとう
2つの(代表的な)エンディアンがあってだからBEとLEがありますだと理由付けとして弱い、何か他にあるんじゃないの??って疑問でした。
だから
>処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
という事情があると知り納得しました。

871 名前:デフォルトの名無しさん [2014/04/25(金) 20:13:07.53 ID:+TF8D1gC.net]
2つ

872 名前:しかない。 []
[ここ壊れてます]

873 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:28:19.84 ID:XFGUZTlf.net]
Unicode規格のエンコーディングフォームと
エンコーディングスキームの区別が全く
ついていない人が集うスレはここですか?

874 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:41:42.68 ID:nsFgzzSj.net]
>>862
あなたもその一人です。

875 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 21:32:54.46 ID:lqZ5R9lm.net]
キター
パーソナルメディア、Unicode IVS/IVDを活用する異体字検索入力ツールを発売
itpro.nikkeibp.co.jp/article/ActiveR/20140422/552244/

876 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 07:57:34.66 ID:ZfEIw6x8.net]
IVS流行るんかねぇ
今3000字くらいだっけ?登録されてるの

877 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 20:11:54.73 ID:Y0Dd5Dys.net]
有料なのかよ
babelmap使えばいいな

878 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:28:54.53 ID:ZQa6pLX5.net]
先月までレビューをやってた新しいIVDはその後どうなったんだろ



879 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:55:39.54 ID:1HDcLnog.net]
>>866
しかも10ライセンス単位
それでも一般販売されるようになっただけ一歩前進

880 名前:デフォルトの名無しさん [2014/05/01(木) 02:19:11.86 ID:jqsfROWp.net]
20年以上前に MS-DOS で
grep "\["
ってやって、関係ない漢字が大量にヒットした時の絶望感。
Microsoft を捨てる理由になり得るということを
理解してくれる人は少ない。

881 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 02:54:30.27 ID:o0DjzHC6.net]
ほー。

882 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 06:02:50.85 ID:cONH9EUi.net]
へー。

883 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:37:23.88 ID:qBGbIEYq.net]
MS-DOSにgrep有ったのか

884 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:56:01.26 ID:SDsBtHY9.net]
アスキーの Software Tools for MS-DOS 他、いろいろあったよ

885 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 18:34:21.61 ID:qBGbIEYq.net]
マイクロソフト以外のツールの出来が悪いと
Microsoft を捨てる理由になり得る のか

886 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 19:06:00.71 ID:SDsBtHY9.net]
「Microsoft漢字コード」って意味じゃねーの?

887 名前:デフォルトの名無しさん [2014/05/01(木) 21:32:54.04 ID:jqsfROWp.net]
「Microsoft漢字コード」って意味です。
それ以外にも理由は山ほどありましたが。
その後、Pentium マシン買ってとっとと Linux 入れて
Microsoft を捨てました。前世紀のことです。
エンコーディングは当初は euc-jp , 後に utf-8 。

プリインストールされていた windows 98 を有効利用しようと
一応は努力したんですよ。10日間くらい。

888 名前:デフォルトの名無しさん mailto:sage [2014/05/02(金) 03:26:51.56 ID:Bonx+GYW.net]
>>873
特に緑の256本にお世話になりました。



889 名前:デフォルトの名無しさん [2014/05/02(金) 08:40:36.13 ID:QU3ScAPG.net]
まあバカには難しいからな

890 名前:ニュース記事より mailto:sage [2014/05/02(金) 12:43:16.91 ID:ufjYsrm8.net]
UTF-16 で、+2D 91+A9 52 7D 00+9F 53+ って何ですか?
tp://headlines.yahoo.
co.jp/hl?a=20140427-00000009-asahi-int

891 名前:880 mailto:sage [2014/05/02(金) 13:14:16.23 ID:ufjYsrm8.net]
Internet Explorer を外したら上手くいきました。(._.)

892 名前:デフォルトの名無しさん mailto:sage [2014/05/07(水) 23:28:11.14 ID:FbKWdn3j.net]
utf-1のオリジナルの仕様書はどこかに無いですかね?

893 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 01:59:00.77 ID:1FoEUPwa.net]
>>881
なにそれ? 1bit encode?

894 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 02:19:16.15 ID:Ejp4CkYN.net]
8bitだな

895 名前:デフォルトの名無しさん [2014/05/08(木) 22:39:56.65 ID:vsk9CRPq.net]
数字の付け方が途中で変わったからねぇ。

896 名前:デフォルトの名無しさん mailto:sage [2014/05/09(金) 22:59:45.07 ID:FKMNP0tp.net]
JIS X 0201の「ヲ」ってなんであんな位置にあるの?
「ワ」と「ン」の間じゃダメだったの?

897 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 00:58:26.77 ID:t6xyZ ]
[ここ壊れてます]

898 名前:zaK.net mailto: 不思議だワン []
[ここ壊れてます]



899 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:01:06.78 ID:ZmQF3HWI.net]
今主流は、ISO/IEC 8859-15? Windows-1252 ? unicode?

900 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:09:42.82 ID:HPEBdtCe.net]
あらゆる隔たりを越えて使われてるコードってなんだろ

901 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 03:27:31.59 ID:J4ChnPls.net]
>>888
ASCIIコード

902 名前:デフォルトの名無しさん [2014/05/10(土) 03:29:41.16 ID:2hs2epHy.net]
JSON
Base64

903 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:13:27.62 ID:KEqrkxpz.net]
せめて文字コードからお願いします

904 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:17:48.14 ID:38X5dwcC.net]
お客さまの文字コードを戴いてもよろしいでしょうか

905 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:20:07.72 ID:KEqrkxpz.net]
>>881
英語版ウィキペからのリンクで見つけた。
kikaku.itscj.ipsj.or.jp/ISO-IR/178.pdf
>>884
UTF-8はUTF-2という名前だったな

906 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 13:26:02.15 ID:N1jI/E1a.net]
>>893
オリジナルは ISO 10646-1:1993 = Unicode 1.1だな。

907 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 15:12:57.31 ID:KEqrkxpz.net]
Unicode 1.1だけはunicode.orgのサイト上にもないんだね。
www.unicode.org/versions/enumeratedversions.html
無慈悲な(paper only)

908 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 20:17:48.99 ID:rzUUktpC.net]
Adobe-Japan1-6が出てもう10年か
これだけ放置ってことは1-7は実質的にキャンセルされたかな



909 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 00:27:45.38 ID:ijhFBXaa.net]
世の中はWindows-1252か、それをUTF-8化した文字コードが主流だね。

910 名前:デフォルトの名無しさん [2014/05/11(日) 14:18:48.58 ID:MFVOcSxg.net]
㐂驒沪𡈽圡玊琢簞箪簟單俱倶傎叱𠮟
咕吒哎噓嘘墟吞呑櫛樿撣
味噌
葛飾区
祇園
進歩

湮滅
恰好
義捐金
眩惑
激昂
幻惑
渾然
駿足
醇朴
饒舌
食事療法
食餌療法
擡頭
醜名

911 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 14:22:59.36 ID:ktmFmLGc.net]
>>876
外部ツールのgrepが特定の文字コードに対応してなかっただけだろ?

912 名前:デフォルトの名無しさん [2014/05/11(日) 14:24:59.03 ID:MFVOcSxg.net]
人名にある漢字
𨌴 U+28334(D860 DF34)
𡍎 U+2134E(D844 DF4E)
𩂗 U+29097(D864 DC97)
𡌛 U+2131B(D844 DF1B)
海  U+FA45
わかりやすい一表式誤字俗字・正字一覧
戸籍の氏又は名の記載・記録に用いる文字
戸籍実務研究会 編 日本加除出版
shift-jisではなくUnicodeで記述してくれ。

むずかしくないぞ!!誤字俗字・正字
小林勝彦 著 日本加除出版
子の名に使える漢字字典
改定常用漢字表対応
戸籍実務研究会 編 日本加除出版
人名用漢字の変遷
子の名に使える漢字の全履歴
日本加除出版株式会社編集部 編
日本加除出版

CJKV日中韓越情報処理 オライリー
新しい国語表記ハンドブック 三省堂
校正必携 日本エディタースクール
記者ハンドブック 共同通信
日本人の知らない日本語

913 名前:デフォルトの名無しさん [2014/05/11(日) 15:03:04.80 ID:MFVOcSxg.net]
外字管理と文字同定
合理的な外字作成のために
長村玄 著 日本加除出版

参考
blog.livedoor.jp/blackwingcat/archives/98340

914 名前:7.html
http://blog.livedoor.jp/blackwingcat/archives/775319.html

🎴
サロゲートペア
1F3B4 花札の坊主
1F3B6
1F4A9
1F4B4
1F5FE
1F5FC
[]
[ここ壊れてます]

915 名前:デフォルトの名無しさん [2014/05/11(日) 16:31:11.95 ID:RoItktFj.net]
結局、どれがええんじゃ?

916 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 16:59:11.70 ID:6gZ3xnJh.net]
>>898
邦題『湮滅 』の仏語原文はeのリポグラムで書かれているそうで、
翻訳の方も「い段」の仮名がなかったりのこだわり本。
どうでもいいな、スレチだし

917 名前:参考 mailto:文字コード [2014/05/11(日) 22:41:39.55 ID:E8GL8yG6.net]
www.amazon.co.jp/dp/4899772939/
文字コード「超」研究 改訂第2版
深沢千尋

www.amazon.co.jp/dp/477414164X/
プログラマのための文字コード技術入門 (WEB+DB PRESS plus)
矢野啓介

www.amazon.co.jp/dp/4891006080/
UnicodeによるJIS X0213実装入門―情報システムの新たな日本語処理環境
(マイクロソフト公式解説書―マイクロソフトITプロフェッショナルシリーズ)
田丸健三郎

www.amazon.co.jp/dp/4822294838/
Unicode IVS/IVD入門
田丸健三郎 小林龍生

www.amazon.co.jp/Unicode/dp/4798100307/
Unicode標準入門  発売日 2001/05
トニーグラハム

918 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 01:09:45.43 ID:Dp5FfogZ.net]
Unicode IVS/IVD入門は誤植とツッコミどころ満載(著者のせいというよりは編集が仕事してない)なので、
togetterだかにまとめられてるツッコミを確認しながら読むべし。



919 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 11:07:44.74 ID:pJ9Xs2pQ.net]
互換漢字の表が正規化で全部統合漢字に化けていたのはひどかった

920 名前:デフォルトの名無しさん [2014/05/12(月) 15:46:50.90 ID:uPA0umXi.net]
>>897
はあ?

921 名前:デフォルトの名無しさん [2014/05/12(月) 15:57:25.31 ID:IpyUrlLw.net]
犭𪜪2A72A𪜸2A738𪜽2A73D𪝆2A746𪝟2A75F𪝘2A758

922 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 21:42:02.38 ID:JxGQtJ4M.net]
>>885
最初無くて(「オ」で代用してたのかな?)後から追加されたという説がある。

923 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 13:59:51.38 ID:bcXG8zlV.net]
>>906
そりゃ回収すべきだなあ。

つーか著者も中で正規化についてふれてるはずだから、
予め事故が起きないように原稿データを作成する
もしくはゲラで気にして眺めるのが当然。

それができていない、ということは、Excelの入門書とかにありがちな
入門者の「ための」本じゃなく、入門者が「書いた」本の類か。

924 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 15:44:02.57 ID:m7IyQf0x.net]
いや、著者はどっちもそれなりな人。経緯はまとめがあるのでそっちを読んでくれ。

925 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:28:52.12 ID:YJDUJNfi.net]
>>909
そんな説があったのか
記号消したのかな

926 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:39:30.11 ID:QNQkB6+v.net]
主に携帯電話絵文字が割り当てられた、UNICODE u1f330〜u1f36f, u1f400〜u1f41f
をtwitter, mixi, Facebookで表示させてみた。
mixiのWeb serverは前から独自の絵文字表示機能があるが、元からある絵文
字から、その文字コードに対応する絵文字を拾いだしてを画像データ
(恐らくGIF)で表示しているみたい。。
twitterのPC(Windows7)のブラウザによる表示でも同様。

Nexus7でのブラウザ表示、smart phoneでのtwitterでは、Web serverの
絵文字表示機能に対応しておら

927 名前:ク、文字コードに対応する絵文字をフォント
で表示させようとしているみたい。
表示させる文字コードに対応する絵文字のフォントデータがその端末にない
場合は表示されない。
[]
[ここ壊れてます]

928 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:47:48.70 ID:QNQkB6+v.net]
UNICODE表示
u1f330〜u1f36f
🌰🌱🌲🌳🌴🌵■🌷🌸🌹🌺🌻🌼🌽🌾🌿
🍀🍁🍂🍃🍄🍅🍆🍇🍈🍉🍊🍋🍌🍍🍎🍏
🍐🍑🍒🍓🍔🍕🍖🍗🍘🍙🍚🍛🍜🍝🍞🍟
🍠🍡🍢🍣🍤🍥🍦🍧🍨🍩🍪🍫🍬🍭🍮🍯

u1f400〜u1f41f
🐀🐁🐂🐃🐄🐅🐆🐇🐈🐉🐊🐋🐌🐍🐎🐏
🐐🐑🐒🐓🐔🐕🐖🐗🐘🐙🐚🐛🐜🐝🐞🐟



929 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 20:17:04.28 ID:rSIFJNU6.net]
そもそもサロゲートペアに対応しているかという話も。

930 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 10:23:36.86 ID:RnX/NH2T.net]
>>913
ブラウザは何?
サーバ側で画像に差し替えてるのは、
UserAgent見て切り替えたりしてんじゃないの?

>>913
> Web serverの 絵文字表示機能に対応しておらず、

そうじゃなくてサーバ側で表示できるブラウザと勘違いしてるんでしょ。
UserAgentがそれっぽいから。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<208KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef