[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 03/31 11:47 / Filesize : 208 KB / Number-of Response : 1019
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ part8



1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net]
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/

855 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 00:12:43.23 ID:zWWRq5q6.net]
修正不可能なくらい間違いまくってるよ。
そもそもUCSは文字集合を定めるものであり、UTFは個々の文字を
どう表現するかを定めるものであってまったく別の概念だし。

856 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:45:09.27 ID:3oy/mjAO.net]
CPUのエンディアンが複数あるため、UTF-16にはBEとLEがあります。
どのサイトも説明見ると大体こんなような事書いてあるけど意味が分からない
エンディアンがどうこうってエンコーディングの内部で解決されるべき問題でしょ?
CPUに合わせてLEを使うと速いですよって事?

857 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:57:28.13 ID:XCREUD3T.net]
絵文字統一か

858 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:03:42.00 ID:t30thbGu.net]
>>847
確かにその説明はおかしいと思う。
画像フォーマットでもtiffにはエンディアンの指定があるが、普通はどちらにも対応する。

859 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:20:19.28 ID:B1sFbtmb.net]
>>847
ちゃんとエンコーディングでBE,LEが考慮されてるでしょ?
それともBEとLEの存在自体が問題だといってんの?
何がおかしいかわからない

860 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:55:02.90 ID:4klH39dY.net]
何を悩んでいるのかしら無いけど、
初期のUTF16の話として16bit固定っていうのはわかるよね?

C言語風に書くならば、WCHAR型(16bit)となって、
WCHAR *text = "あいうえお";
こういう定義になる。

この時のメモリ配列はC言語の仕様によりCPUのエンディアンによって変わる。
このメモリ内容がUTF-16BEやUTF-16LEなんだよ。

ファイルに保存するときはどちらかに統一してもいいが、
処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
だからUTF16-BEかUTF16-LEというものが生まれることになる。

メモリ内で使うために、UTF16-BE と UTF16-LE の存在を無くすことは出来ない。
そのメモリ内容をそのまま保存することもある。テキストファイルではなくて
構造体データの一部としてテキストが含まれている場合とか、一項目ずつ保存するのではなくて
メモリの構造体データを丸ごと保存したりするからね。

だから、UTF16-BEかUTF16-LEという存在はCPUのエンディアンの存在によって生まれ、
それを保存するファイルに格納されたデータの呼び名にもなる。

861 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:14:58.98 ID:gMbJ5qLh.net]
テキストファイルで保存するときでもLEとBEを選べるエディタがあるんだが
それはおかしいのか?

862 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:19:55.61 ID:jrLTZF6i.net]
世の中に二つの形式があるのなら、
二つの形式を選べるのが普通でしょう?

エンディアンが違うCPUとの間でもファイルの交換や、
ネットワーク通信できるんだから。

863 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:57:01.01 ID:m07o/u+5.net]
> C言語風に



864 名前:曹ュならば、WCHAR型(16bit)となって、
> WCHAR *text = "あいうえお";
> こういう定義になる。
WCHAR *text = L"あいうえお";
じゃね?
[]
[ここ壊れてます]

865 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:01:18.03 ID:jrLTZF6i.net]
別にC言語風だからどうでもいいよ

866 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:34:10.60 ID:XZGKxZHW.net]
たまには。PDPエンディアンのことも思い出してあげて

867 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:49:44.73 ID:T54U1ii9.net]
エンディアン嘘つかない

868 名前:デフォルトの名無しさん [2014/04/25(金) 17:51:44.43 ID:4fGC8eBc.net]
>>845
UCSとUTFの区別は最初はなかった。
最初はUCSのみ。
>>845も書いてるけど。

869 名前:デフォルトの名無しさん [2014/04/25(金) 17:56:44.39 ID:991UJ/F9.net]
>>847
UTF-16文字列はuint16_tの並び。
uint16_tだからCPUによってバイト順が違う。
だからエンコーディングのバイトオーダーが決まってると、
逆順のシステムはネットワークにデータを流す時にバイト順を毎回変えないといけない。
それを防ぐためにバイトオーダー順違いのエンコーディングが定義されてる。
こうしておくと必要なときだけバイト順を変えればいい。
DCE/RPCみたいに接続時にバイトオーダをネゴしてもいいし、
どちらを送られても必ず扱えるようにしてもいい。

870 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 18:34:47.40 ID:3oy/mjAO.net]
レスありがとう
2つの(代表的な)エンディアンがあってだからBEとLEがありますだと理由付けとして弱い、何か他にあるんじゃないの??って疑問でした。
だから
>処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
という事情があると知り納得しました。

871 名前:デフォルトの名無しさん [2014/04/25(金) 20:13:07.53 ID:+TF8D1gC.net]
2つ

872 名前:しかない。 []
[ここ壊れてます]

873 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:28:19.84 ID:XFGUZTlf.net]
Unicode規格のエンコーディングフォームと
エンコーディングスキームの区別が全く
ついていない人が集うスレはここですか?



874 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:41:42.68 ID:nsFgzzSj.net]
>>862
あなたもその一人です。

875 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 21:32:54.46 ID:lqZ5R9lm.net]
キター
パーソナルメディア、Unicode IVS/IVDを活用する異体字検索入力ツールを発売
itpro.nikkeibp.co.jp/article/ActiveR/20140422/552244/

876 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 07:57:34.66 ID:ZfEIw6x8.net]
IVS流行るんかねぇ
今3000字くらいだっけ?登録されてるの

877 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 20:11:54.73 ID:Y0Dd5Dys.net]
有料なのかよ
babelmap使えばいいな

878 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:28:54.53 ID:ZQa6pLX5.net]
先月までレビューをやってた新しいIVDはその後どうなったんだろ

879 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:55:39.54 ID:1HDcLnog.net]
>>866
しかも10ライセンス単位
それでも一般販売されるようになっただけ一歩前進

880 名前:デフォルトの名無しさん [2014/05/01(木) 02:19:11.86 ID:jqsfROWp.net]
20年以上前に MS-DOS で
grep "\["
ってやって、関係ない漢字が大量にヒットした時の絶望感。
Microsoft を捨てる理由になり得るということを
理解してくれる人は少ない。

881 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 02:54:30.27 ID:o0DjzHC6.net]
ほー。

882 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 06:02:50.85 ID:cONH9EUi.net]
へー。

883 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:37:23.88 ID:qBGbIEYq.net]
MS-DOSにgrep有ったのか



884 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:56:01.26 ID:SDsBtHY9.net]
アスキーの Software Tools for MS-DOS 他、いろいろあったよ

885 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 18:34:21.61 ID:qBGbIEYq.net]
マイクロソフト以外のツールの出来が悪いと
Microsoft を捨てる理由になり得る のか

886 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 19:06:00.71 ID:SDsBtHY9.net]
「Microsoft漢字コード」って意味じゃねーの?

887 名前:デフォルトの名無しさん [2014/05/01(木) 21:32:54.04 ID:jqsfROWp.net]
「Microsoft漢字コード」って意味です。
それ以外にも理由は山ほどありましたが。
その後、Pentium マシン買ってとっとと Linux 入れて
Microsoft を捨てました。前世紀のことです。
エンコーディングは当初は euc-jp , 後に utf-8 。

プリインストールされていた windows 98 を有効利用しようと
一応は努力したんですよ。10日間くらい。

888 名前:デフォルトの名無しさん mailto:sage [2014/05/02(金) 03:26:51.56 ID:Bonx+GYW.net]
>>873
特に緑の256本にお世話になりました。

889 名前:デフォルトの名無しさん [2014/05/02(金) 08:40:36.13 ID:QU3ScAPG.net]
まあバカには難しいからな

890 名前:ニュース記事より mailto:sage [2014/05/02(金) 12:43:16.91 ID:ufjYsrm8.net]
UTF-16 で、+2D 91+A9 52 7D 00+9F 53+ って何ですか?
tp://headlines.yahoo.
co.jp/hl?a=20140427-00000009-asahi-int

891 名前:880 mailto:sage [2014/05/02(金) 13:14:16.23 ID:ufjYsrm8.net]
Internet Explorer を外したら上手くいきました。(._.)

892 名前:デフォルトの名無しさん mailto:sage [2014/05/07(水) 23:28:11.14 ID:FbKWdn3j.net]
utf-1のオリジナルの仕様書はどこかに無いですかね?

893 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 01:59:00.77 ID:1FoEUPwa.net]
>>881
なにそれ? 1bit encode?



894 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 02:19:16.15 ID:Ejp4CkYN.net]
8bitだな

895 名前:デフォルトの名無しさん [2014/05/08(木) 22:39:56.65 ID:vsk9CRPq.net]
数字の付け方が途中で変わったからねぇ。

896 名前:デフォルトの名無しさん mailto:sage [2014/05/09(金) 22:59:45.07 ID:FKMNP0tp.net]
JIS X 0201の「ヲ」ってなんであんな位置にあるの?
「ワ」と「ン」の間じゃダメだったの?

897 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 00:58:26.77 ID:t6xyZ ]
[ここ壊れてます]

898 名前:zaK.net mailto: 不思議だワン []
[ここ壊れてます]

899 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:01:06.78 ID:ZmQF3HWI.net]
今主流は、ISO/IEC 8859-15? Windows-1252 ? unicode?

900 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:09:42.82 ID:HPEBdtCe.net]
あらゆる隔たりを越えて使われてるコードってなんだろ

901 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 03:27:31.59 ID:J4ChnPls.net]
>>888
ASCIIコード

902 名前:デフォルトの名無しさん [2014/05/10(土) 03:29:41.16 ID:2hs2epHy.net]
JSON
Base64

903 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:13:27.62 ID:KEqrkxpz.net]
せめて文字コードからお願いします



904 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:17:48.14 ID:38X5dwcC.net]
お客さまの文字コードを戴いてもよろしいでしょうか

905 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:20:07.72 ID:KEqrkxpz.net]
>>881
英語版ウィキペからのリンクで見つけた。
kikaku.itscj.ipsj.or.jp/ISO-IR/178.pdf
>>884
UTF-8はUTF-2という名前だったな

906 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 13:26:02.15 ID:N1jI/E1a.net]
>>893
オリジナルは ISO 10646-1:1993 = Unicode 1.1だな。

907 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 15:12:57.31 ID:KEqrkxpz.net]
Unicode 1.1だけはunicode.orgのサイト上にもないんだね。
www.unicode.org/versions/enumeratedversions.html
無慈悲な(paper only)

908 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 20:17:48.99 ID:rzUUktpC.net]
Adobe-Japan1-6が出てもう10年か
これだけ放置ってことは1-7は実質的にキャンセルされたかな

909 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 00:27:45.38 ID:ijhFBXaa.net]
世の中はWindows-1252か、それをUTF-8化した文字コードが主流だね。

910 名前:デフォルトの名無しさん [2014/05/11(日) 14:18:48.58 ID:MFVOcSxg.net]
㐂驒沪𡈽圡玊琢簞箪簟單俱倶傎叱𠮟
咕吒哎噓嘘墟吞呑櫛樿撣
味噌
葛飾区
祇園
進歩

湮滅
恰好
義捐金
眩惑
激昂
幻惑
渾然
駿足
醇朴
饒舌
食事療法
食餌療法
擡頭
醜名

911 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 14:22:59.36 ID:ktmFmLGc.net]
>>876
外部ツールのgrepが特定の文字コードに対応してなかっただけだろ?

912 名前:デフォルトの名無しさん [2014/05/11(日) 14:24:59.03 ID:MFVOcSxg.net]
人名にある漢字
𨌴 U+28334(D860 DF34)
𡍎 U+2134E(D844 DF4E)
𩂗 U+29097(D864 DC97)
𡌛 U+2131B(D844 DF1B)
海  U+FA45
わかりやすい一表式誤字俗字・正字一覧
戸籍の氏又は名の記載・記録に用いる文字
戸籍実務研究会 編 日本加除出版
shift-jisではなくUnicodeで記述してくれ。

むずかしくないぞ!!誤字俗字・正字
小林勝彦 著 日本加除出版
子の名に使える漢字字典
改定常用漢字表対応
戸籍実務研究会 編 日本加除出版
人名用漢字の変遷
子の名に使える漢字の全履歴
日本加除出版株式会社編集部 編
日本加除出版

CJKV日中韓越情報処理 オライリー
新しい国語表記ハンドブック 三省堂
校正必携 日本エディタースクール
記者ハンドブック 共同通信
日本人の知らない日本語

913 名前:デフォルトの名無しさん [2014/05/11(日) 15:03:04.80 ID:MFVOcSxg.net]
外字管理と文字同定
合理的な外字作成のために
長村玄 著 日本加除出版

参考
blog.livedoor.jp/blackwingcat/archives/98340



914 名前:7.html
http://blog.livedoor.jp/blackwingcat/archives/775319.html

🎴
サロゲートペア
1F3B4 花札の坊主
1F3B6
1F4A9
1F4B4
1F5FE
1F5FC
[]
[ここ壊れてます]

915 名前:デフォルトの名無しさん [2014/05/11(日) 16:31:11.95 ID:RoItktFj.net]
結局、どれがええんじゃ?

916 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 16:59:11.70 ID:6gZ3xnJh.net]
>>898
邦題『湮滅 』の仏語原文はeのリポグラムで書かれているそうで、
翻訳の方も「い段」の仮名がなかったりのこだわり本。
どうでもいいな、スレチだし

917 名前:参考 mailto:文字コード [2014/05/11(日) 22:41:39.55 ID:E8GL8yG6.net]
www.amazon.co.jp/dp/4899772939/
文字コード「超」研究 改訂第2版
深沢千尋

www.amazon.co.jp/dp/477414164X/
プログラマのための文字コード技術入門 (WEB+DB PRESS plus)
矢野啓介

www.amazon.co.jp/dp/4891006080/
UnicodeによるJIS X0213実装入門―情報システムの新たな日本語処理環境
(マイクロソフト公式解説書―マイクロソフトITプロフェッショナルシリーズ)
田丸健三郎

www.amazon.co.jp/dp/4822294838/
Unicode IVS/IVD入門
田丸健三郎 小林龍生

www.amazon.co.jp/Unicode/dp/4798100307/
Unicode標準入門  発売日 2001/05
トニーグラハム

918 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 01:09:45.43 ID:Dp5FfogZ.net]
Unicode IVS/IVD入門は誤植とツッコミどころ満載(著者のせいというよりは編集が仕事してない)なので、
togetterだかにまとめられてるツッコミを確認しながら読むべし。

919 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 11:07:44.74 ID:pJ9Xs2pQ.net]
互換漢字の表が正規化で全部統合漢字に化けていたのはひどかった

920 名前:デフォルトの名無しさん [2014/05/12(月) 15:46:50.90 ID:uPA0umXi.net]
>>897
はあ?

921 名前:デフォルトの名無しさん [2014/05/12(月) 15:57:25.31 ID:IpyUrlLw.net]
犭𪜪2A72A𪜸2A738𪜽2A73D𪝆2A746𪝟2A75F𪝘2A758

922 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 21:42:02.38 ID:JxGQtJ4M.net]
>>885
最初無くて(「オ」で代用してたのかな?)後から追加されたという説がある。

923 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 13:59:51.38 ID:bcXG8zlV.net]
>>906
そりゃ回収すべきだなあ。

つーか著者も中で正規化についてふれてるはずだから、
予め事故が起きないように原稿データを作成する
もしくはゲラで気にして眺めるのが当然。

それができていない、ということは、Excelの入門書とかにありがちな
入門者の「ための」本じゃなく、入門者が「書いた」本の類か。



924 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 15:44:02.57 ID:m7IyQf0x.net]
いや、著者はどっちもそれなりな人。経緯はまとめがあるのでそっちを読んでくれ。

925 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:28:52.12 ID:YJDUJNfi.net]
>>909
そんな説があったのか
記号消したのかな

926 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:39:30.11 ID:QNQkB6+v.net]
主に携帯電話絵文字が割り当てられた、UNICODE u1f330〜u1f36f, u1f400〜u1f41f
をtwitter, mixi, Facebookで表示させてみた。
mixiのWeb serverは前から独自の絵文字表示機能があるが、元からある絵文
字から、その文字コードに対応する絵文字を拾いだしてを画像データ
(恐らくGIF)で表示しているみたい。。
twitterのPC(Windows7)のブラウザによる表示でも同様。

Nexus7でのブラウザ表示、smart phoneでのtwitterでは、Web serverの
絵文字表示機能に対応しておら

927 名前:ク、文字コードに対応する絵文字をフォント
で表示させようとしているみたい。
表示させる文字コードに対応する絵文字のフォントデータがその端末にない
場合は表示されない。
[]
[ここ壊れてます]

928 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:47:48.70 ID:QNQkB6+v.net]
UNICODE表示
u1f330〜u1f36f
🌰🌱🌲🌳🌴🌵■🌷🌸🌹🌺🌻🌼🌽🌾🌿
🍀🍁🍂🍃🍄🍅🍆🍇🍈🍉🍊🍋🍌🍍🍎🍏
🍐🍑🍒🍓🍔🍕🍖🍗🍘🍙🍚🍛🍜🍝🍞🍟
🍠🍡🍢🍣🍤🍥🍦🍧🍨🍩🍪🍫🍬🍭🍮🍯

u1f400〜u1f41f
🐀🐁🐂🐃🐄🐅🐆🐇🐈🐉🐊🐋🐌🐍🐎🐏
🐐🐑🐒🐓🐔🐕🐖🐗🐘🐙🐚🐛🐜🐝🐞🐟

929 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 20:17:04.28 ID:rSIFJNU6.net]
そもそもサロゲートペアに対応しているかという話も。

930 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 10:23:36.86 ID:RnX/NH2T.net]
>>913
ブラウザは何?
サーバ側で画像に差し替えてるのは、
UserAgent見て切り替えたりしてんじゃないの?

>>913
> Web serverの 絵文字表示機能に対応しておらず、

そうじゃなくてサーバ側で表示できるブラウザと勘違いしてるんでしょ。
UserAgentがそれっぽいから。

931 名前:デフォルトの名無しさん [2014/05/14(水) 12:07:15.19 ID:FT6VO3mN.net]
JIS2004対応MSゴシック MS明朝フォントパッケージ
Office製品のJIS X 0213:2004への対応状況
go.microsoft.com/fwlink/?LinkID=76814 go.microsoft.com/?LinkID=6179681
JIS X 0213:2004 Unicode 実装ガイド Microsoft
www.microsoft.com/china/windows2000/downloads/18030.mspx


blog.livedoor.jp/blackwingcat/archives/983407.html
ISO 10646:2003 + 修正 1 繁体字中国語サポート (HKSCS 2004)
Windows XP および Windows Server 2003 用の Windows XP フォント パックsupport.microsoft.com/kb/977801/ja
Traditional Chinese ClearType fonts for Windows XP - 繁體中文
www.microsoft.com/zh-tw/download/details.aspx?id=12072
Simplified Chinese ClearType fonts for Windows XP
www.microsoft.com/en-us/download/details.aspx?id=14577
Korean ClearType fonts for Windows XP
www.microsoft.com/en-us/download/details.aspx?id=10490

汎用電子情報交換環境整備プログラム文字対応作業委員会資料
平成19年度経済産業省委託
汎用電子情報交換環境整備プログラム文字対応作業委員会資料(「地名外字」資料)
2008 年3 月発行、独立行政法人国立国語研究所
平成19年度 汎用電子情報交換環境整備プログラム文字対応作業委員会資料 地名外字 資料
www.ninjal.ac.jp/archives/hanyo/
www.ninjal.ac.jp/archives/hanyo/chimeigaiji.pdf
www.ninjal.ac.jp/archives/hanyo/jisyohikeisaiji.pdf

kanji-database.sourceforge.net/dict/daikanwa/index.html
hp.vector.co.jp/authors/VA000964/html/daikanwa.htm
webcat.nacsis.ac.jp/cgi-bin/shsproc?id=BN13621753

932 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 13:26:00.05 ID:Z6IwK1L/.net]
これはいったい何の話?

933 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 20:54:01.03 ID:iRfI2E/u.net]
あまぞんのれびゅーって面白いよね。
専門書の場合、みんなちゃんと根拠を出して
貶しているのに必ず一人だけ闇雲に
マンセーする人がいる。
やっぱ、工作員かな。



934 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 20:57:31.09 ID:kwfzu7ec.net]
漢字データベースはデータファイルへのリンク切れを直してほしいぞ
( /kawabata/kanji-data-base-* → /cjkvi/cjkvi-* )

935 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 21:02:5 ]
[ここ壊れてます]

936 名前:5.66 ID:kwfzu7ec.net mailto: > http://webcat.nacsis.ac.jp/cgi-bin/shsproc?id=BN13621753

ていうか貼る前に飛べるかどうか確認くらいしろ
botかよ
[]
[ここ壊れてます]

937 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 21:26:48.11 ID:GYPuM66Z.net]
ci.nii.ac.jp/ncid/BN13621753
これなのかな?

938 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 22:29:58.06 ID:Z6IwK1L/.net]
サイニーってなんか名前がえろいよね

939 名前:デフォルトの名無しさん mailto:sage [2014/05/15(木) 00:27:38.91 ID:9rPoDGNl.net]
>>919 一人で言ってろw

940 名前:デフォルトの名無しさん mailto:sage [2014/05/15(木) 01:21:02.79 ID:eaRTBJfl.net]
Excel から Cのdllに文字列を渡すとき、VBAからは
ByVal as String を渡して C側で LPCSTR で受け取るのがパターンだけど、
ワークシートから直接呼ぶ場合はC側は BSTR等 で受けなきゃいけない。
そこで C側は BSTR に統一しておいて、VBAからは
StrConv( xxx, vbUnicode) をかましてやればいいことが分かった。

ところが、StrConv("まみむめも", vbUnicode) を渡したら化ける。
ひらがなだと"め"以降が、かたかなだと"ム"以降がダメなようだ。

941 名前:デフォルトの名無しさん [2014/05/15(木) 23:22:03.55 ID:r+glb6GN.net]
ci.nii.ac.jp/ncid/BN13621753
大漢和辞典
諸橋轍次著
藍燈文化事業股份有限公司, 1992.6
修訂版 / 鎌田正, 米山寅太郎修訂

出版地:台北

大学図書館所蔵 2件
実践女子大学 図書館
函館大谷短期大学 図書館

942 名前:デフォルトの名無しさん [2014/05/17(土) 00:34:57.36 ID:FDiSLcBF.net]
毦ト厽厸叕忑忐忐臋膐臡娚妕嫏釱c腥觕槀晟猋

943 名前:デフォルトの名無しさん mailto:sage [2014/05/17(土) 07:02:20.43 ID:HL2kvjJk.net]
Moji_Johoコレクション登録キター
unicode-inc.blogspot.jp/2014/05/new-version-of-unicode-ideographic.html



944 名前:デフォルトの名無しさん [2014/05/23(金) 20:30:12.89 ID:0ops72ts.net]
>>899
なんで10日もたってから反応してくれたのか知らないけど一応返事しとくよ。
確かに grep はシフトJIS に対応してなかったけど問題はそこではない。

945 名前:デフォルトの名無しさん mailto:sage [2014/05/23(金) 22:20:35.88 ID:3CistgHw.net]
じゃあ違う所に問題があるってことになるんだが、
それを書かないのはなんで?

946 名前:デフォルトの名無しさん [2014/05/25(日) 17:43:33.84 ID:+9s7n6Ty.net]
シフトJIS のせいだと理解してくれた人もいるのだから充分だと思う。
それ以上書かなかったのは
「自分のブログでやれ!」
というような内容だから。
20年以上も前の極めて個人的な事情を本当に知りたい?

947 名前:デフォルトの名無しさん mailto:sage [2014/05/25(日) 19:07:02.17 ID:1MTC2E0+.net]
A「シフトJISじゃなくツールの問題」
B「いえ問題はそこじゃない」
A「じゃどこだよ」
B「シフトJISの問題だけど詳細は言えませぬ」

なんかオボカタを彷彿させられたわ

948 名前:デフォルトの名無しさん mailto:sage [2014/05/25(日) 23:53:20.28 ID:sunY8yYk.net]
>>869-877を読む限りgrepがウンコだったとしか読めないのだが
マイクロソフトが嫌いな人はなんでもマイクロソフトのせいにしたがるんだろうな

949 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 01:01:24.96 ID:n7nd7EBV.net]
シフトJISって書くのはShift_JISと区別する意図があるという理解でよろしいか

950 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 01:05:37.47 ID:xHMaMRhQ.net]
シフと辞す

951 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 04:46:50.66 ID:JBieFH3j.net]
>>931
氏ね

952 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 06:15:33.67 ID:4h8ULvHM.net]
>>931
小出しにしないで、何がどうしてどうなったのかを1スレで書けるなら書いてもいいよ。

953 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 07:02:01.76 ID:BDkoTBNa.net]
>>934
そら



954 名前:そうだろ
Shift_JISなんて使ってる人は見たことがない
[]
[ここ壊れてます]

955 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 09:00:03.21 ID:LQ8Ghiak.net]
>>931
実に興味深いので、ぜひともうかがいたい






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<208KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef