[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 03/31 11:47 / Filesize : 208 KB / Number-of Response : 1019
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ part8



1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net]
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/

2 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:19:29.05 .net]
待ってたよ!
www.youtube.com/watch?v=oFt9z2b2BVQ

3 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:18:38.86 .net]
■参考サイト
Unicode Home Page
www.unicode.org/
Java Character Encodings
www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
IANA: Character Sets
www.iana.org/assignments/character-sets
Legacy Encoding Project
sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
www.jisc.go.jp/

4 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:19:08.83 .net]
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
 内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
 機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい

5 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:19:56.25 .net]
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
 UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
 サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
 ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか

6 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:20:29.23 .net]
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
  → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
 コントロールパネル-地域と言語のオプション-[言語]タブで
 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理

7 名前:矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
[]
[ここ壊れてます]

8 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 14:28:31.92 .net]
テンプレ乙でござるよ

9 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:02:44.42 .net]
もうひとつの過去スレ:
文字コード統一スレ 1文字目
pc8.2ch.net/test/read.cgi/tech/1109171258/

隔離スレ:
UnicodeとUTF-8の違いは?
pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
toro.2ch.net/test/read.cgi/tech/1342963035/

10 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:13:16.40 .net]
■ライブラリ
IBM Globalization - ICU
www-306.ibm.com/software/globalization/icu/
NKF32.DLL
www.vector.co.jp/soft/win95/util/se020949.html
www1.ttcn.ne.jp/~kaneto/dll/nkf32dll.html
バベル
tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
tricklib.com/cxx/ex/babel/scoremap.csv
mlang
msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
www.gnu.org/software/libiconv/
ICU
www.icu-project.org/



11 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:14:10.43 .net]
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはmasaka.dw.land.to/mr/jmr.phpとか。

12 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 15:15:50.02 .net]
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
std.dkuug.dk/JTC1/SC2/WG2/

ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
appsrv.cse.cuhk.edu.hk/~irg/

日本の委員 (JSC2)
www.itscj.ipsj.or.jp/meibo/020000.pdf

13 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 18:18:17.85 .net]
スレ立てサンキュ

14 名前:デフォルトの名無しさん mailto:sage [2012/12/03(月) 21:21:2 ]
[ここ壊れてます]

15 名前:3.27 .net mailto: 西夏文字、女文字、インダス文字、女真文字なんかはまだなんだな。
日本や中国の研究者頑張れ。
[]
[ここ壊れてます]

16 名前:デフォルトの名無しさん mailto:sage [2012/12/03(月) 23:51:37.30 .net]
ところでさ、U+1F5FEの日本列島絵文字なんだけど、
例示図形に普通に北方四島が入ってるんだよね。
これロシアとかからクレームなかったのかな。

あるいは、奄美と沖縄が単独の点として描かれてるのに
北方四島が本土とくっついてるのはあえてどうとでも解釈できるようにしたごまかし?
でも佐渡とか壱岐対馬はそもそも存在さえ描かれてないわけで、なんかちょっと変。

では、そもそもの元になったと思われるau絵文字#214「地図」ではどうだったのかと見てみたら、
なんと日本領部分は「本土4島だけ」のシンプルなものだった。
ここからどういう経緯で北方四島と奄美沖縄が加わったんだろう。

17 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 01:09:59.61 .net]
>>14
日本列島という島の絵文字であって、日本という国の絵文字じゃないということだと思う。
でないと、国旗の絵文字でアレだけ揉めたのと整合性がつかなくなる。

18 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 03:19:38.20 .net]
ただ、国境以外の理由で4島と千島を区切る理屈ってのもちょっとなさそうなのよね

19 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 05:19:19.05 .net]
南樺太も日本です
台湾も日本です

20 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 06:09:50.32 .net]
U+1F5FCが固有名詞的な「東京タワー」じゃなくて「電波塔」という曖昧な名前で規格化する案もあったことを考えると
U+1F5FEも「弧状列島」とか表現されることになっていてもおかしくなかったかも



21 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 09:09:38.01 .net]
尖閣諸島を入れて欲しかった

22 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 09:45:40.17 .net]
>>18
まあ、MOYAIさんが通った時点でそのへん曖昧だよね。

これに自由の女神と並ぶレベルの公共性なんてないと思うw

23 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 19:17:25.01 .net]
>>20
あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし (文字名はモヤイ像なのに)、
「モアイ像」として入れたほうがユニヴァーサリティがあって良かったんじゃないかと思うんだけど
まあ渋谷とかの意味で使われる絵文字として解釈できなくなるからやっぱダメか

24 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 20:12:50.27 .net]
あるいは新島

25 名前:デフォルトの名無しさん mailto:sage [2012/12/04(火) 23:23:51.55 .net]
>>21
> あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし

まじだ……一体どうなってるんだこれ

26 名前:デフォルトの名無しさん mailto:sage [2012/12/14(金) 13:36:10.61 .net]
slashdot.jp/~yasuoka/journal/559968/
>JTC1/SC2/WG2/IRG N1883
>(大正新脩大蔵経「外字」のISO/IEC 10646追加提案)

これ結局、日本提案から外されたのね

27 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 21:05:28.98 .net]
>>5
>・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか

ISO2022なら楽勝でできる多スクリプトの混合表記がunicodeではできないってスクリプトレベル
の問題を、多言語問題にすりかえるなよ

言語情報が中国語でも、それを日本漢字で表記しても何も問題はない

それどころか、日本の漢文の教科書では、言語は中国語だが、字体は日本の教科書体で表記
しないといけないっての

28 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 22:53:11.62 .net]
正則漢文は中国語ではない

29 名前:デフォルトの名無しさん mailto:sage [2012/12/19(水) 23:54:59.27 .net]
>>25
文書そのものの言語よりむしろユーザーが理解可能なスクリプトの方が重要、
なのかなあ。

とりあえず自分のお仕事では、文書の言語情報が中国語だったら中国語のフォントを
割り当てるようにしてますけどw
例えばOSの言語設定を優先するようにしたりとかしたら... って?
...ちょっと無理かなw (ちょっと持田香織を意識してみた)

現実問題として例えば普通の日本語フォントは中国語の簡体とか持ってないから、
下手にやるとつぎはぎの脅迫文状態になってしまう。そういうのでも見たいかな?

30 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 00:26:57.58 .net]
漢字のフォントって今も全部手作業で作ってるの?

偏旁の情報流し込んだらざーっとバリエーションつくってくれて、細部だけ手修正、みたいな感じなら
せっかくだから和文で使わない文字も全部含めてくれればいいのに。クオリティ落ちてもいいからさ。



31 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 05:39:55.98 .net]
じゃあおまえがやれよ

32 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 09:22:41.68 .net]
e漢字というプロジェクトがあってだな

33 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 10:30:33.04 .net]
つまんね

34 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 11:52:51.57 .net]
結局GlyphWikiみたいに人肉制作が一番成果物につながりやすいのかな

35 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 19:09:10.91 .net]
Glyphwikiは曲線を実現する方法が改善されたら無敵かも。

36 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 19:33:32.32 .net]
現状のGlyphWikiで作った記号とかネタレベルだもんな。

37 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 21:08:27.21 .net]
花園は非漢字だけ別のフォントから借りてきた方がいいと思うんだけど
明朝だとなかなか選択肢がないのかな

38 名前:デフォルトの名無しさん [2012/12/21(金) 22:43:08.51 .net]
IPA明朝丸取りで良いやん。

39 名前:デフォルトの名無しさん mailto:sage [2012/12/28(金) 22:20:50.30 .net]
さて年の瀬なわけだが

40 名前:デフォルトの名無しさん mailto:sage [2012/12/28(金) 22:38:05.25 .net]
年の瀬くらい、おとなしくしてなさい



41 名前:デフォルトの名無しさん mailto:sage [2012/12/29(土) 21:59:11.75 .net]
年の瀬だから、いいじゃん

42 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 14:27:54.18 .net]
こんなの始まってた
www.ipa.go.jp/about/kobo/tender-20121228-2/
>今回、変体仮名⽂字の字形を調達し、今後のフォント拡張及び文字符号の国際標準化の
>素材として使用するものとする。

変体仮名の符号化が動き出したか

43 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 18:45:39.07 .net]
良くも悪くも、今回デザインされた字形が「正しい変体仮名」として未来に残っていくんだな。

44 名前:デフォルトの名無しさん mailto:sage [2012/12/30(日) 20:49:44.39 .net]
だろうなあ。変体仮名の字形に熟知したデザイナーなんてどれだけいるやら…

3月〆切ってことは早ければ春先にもまずIPA明朝に収納される可能性ありか。
どんなのが出てくるかちょっと楽しみ。

45 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 00:46:22.92 .net]
さて年が明けたわけだが

46 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 02:41:22.10 .net]
「謹賀新年」「迎春」とかは一つの文字コードを与えていいんじゃないだろうか

47 名前: 【凶】 【721円】 mailto:sage [2013/01/01(火) 04:40:04.62 .net]
#あけおめ #ことよろ

48 名前:デフォルトの名無しさん mailto:sage [2013/01/01(火) 15:26:12.83 .net]
あけおめー

49 名前:デフォルトの名無しさん mailto:sage [2013/01/02(水) 06:14:56.17 .net]
縦組み専用のワープロソフトも出てくるんだろうか

50 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 00:56:50.23 .net]
blog.query1000.com/archives/21819386.html
>日本は今まで(他の国の提案を)撃ち落とす方で頑張って来たのに、

WG2/IRGへ邪魔しに行ってるのを認めちゃったよ



51 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 03:41:54.21 .net]
>>44
戦前に「天皇陛下」の一体活字を作った新聞社じゃないんだから。

52 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 04:29:39.37 .net]
ひょっとしてそれって、文選で間違えると打ち首にされるとかの回避策?

53 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 04:40:26.90 .net]
文中の「陛」文字頻度が低い上に特定の熟語にしか使われないからでしょ

54 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 14:51:44.58 .net]
>>48
blog.query1000.com/archives/21798078.html
blog.query1000.com/archives/21819386.html
blog.query1000.com/archives/21848658.html
blog.query1000.com/archives/21886099.html

四連作なのね。結構、裏話っぽくて面白かった。

55 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 15:16:53.92 .net]
ああ、例の本の深沢さんか。参考になったわ。

56 名前:デフォルトの名無しさん mailto:sage [2013/01/04(金) 23:04:36.32 .net]
>>52
安岡も耄碌したな。トイレと天気の話しか出来ないのか。

57 名前:デフォルトの名無しさん mailto:sage [2013/01/07(月) 14:54:11.70 .net]
>>50
北朝鮮方式か

58 名前:デフォルトの名無しさん mailto:sage [2013/01/07(月) 14:56:08.81 .net]
あと、4文字の途中で改行することが許されないから、
(というか、直前で改行して必ず行頭に置くことになってるから)
という事情もあるな。

59 名前:デフォルトの名無しさん mailto:sage [2013/01/08(火) 21:03:09.32 .net]
JIS Z 8903廃止なのね

60 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 07:20:34.61 .net]
ああYさんとこね

変体仮名字形の入札、濁点/半濁点つき字形のことを忘れているような



61 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 16:28:46.12 .net]
>>59
戸籍にも住基にも濁点/半濁点付き変体仮名は無いから
とりあえず最初のうちは作らないみたい
でも今後どうするかは謎

62 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 16:30:30.81 .net]
>>59
自分自身を指してしまったorz

63 名前:デフォルトの名無しさん mailto:sage [2013/01/09(水) 22:23:43.57 .net]
そうなのか…じゃあ本当に行政専用になりそうだな

64 名前:デフォルトの名無しさん [2013/01/11(金) 00:54:51.84 .net]
合成でなんとかしろって事ではないのかな。
アイヌ語の表現みたいに。

65 名前:デフォルトの名無しさん mailto:sage [2013/01/11(金) 02:03:45.26 .net]
欧文のストロークみたいな感じで

66 名前:デフォルトの名無しさん mailto:sage [2013/01/12(土) 01:02:43.90 .net]
>>63
kwsk

67 名前:デフォルトの名無しさん mailto:sage [2013/01/13(日) 09:21:45.76 .net]
ふむ

68 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 22:23:13.81 .net]
ほう

69 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 23:00:03.96 .net]
すべてが順調にいったとしても
使えるようになるのは2015年頃かのう

70 名前:デフォルトの名無しさん [2013/01/16(水) 15:44:53.71 .net]
拡張Fきてるし



71 名前:デフォルトの名無しさん mailto:sage [2013/01/16(水) 18:54:26.26 .net]
irgはいつの頃からか記念写真やめちゃったのね

72 名前:デフォルトの名無しさん mailto:sage [2013/01/19(土) 00:08:29.61 .net]
Ext Fまで来ると、もうIPAmjとGlyphWikiくらいしか
実装されないんじゃなかろーか

73 名前:デフォルトの名無しさん mailto:sage [2013/01/19(土) 23:36:28.62 .net]
ExtFどこにきてるの

74 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 07:02:56.46 .net]
あなたのうしろよ

75 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 21:41:44.70 .net]
中国語の漢字もう疲れた... 偏が簡体になったやつがやたらコードポイントを
消費しているような。
もう簡体と繁体もunifyすればよかったんじゃんw

76 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 23:15:17.97 .net]
繁体:簡体が多対一で対応してるのとかへのルール作りを考えるとユニるのがめんどくさい

77 名前:デフォルトの名無しさん mailto:sage [2013/01/20(日) 23:26:09.98 .net]
Ext.Fどこで見られる?

78 名前:デフォルトの名無しさん [2013/01/23(水) 00:14:21.88 .net]
unicode とか JIS X 0208 だと、ASCII文字(記号含む)の全角版って、互換性維持の為にあるものだよね?
JIS X 0208 だと、ほぼ使うなと同等なことが書いてあるけど、
今の unicode standard だと使っても全然問題ないみたいに書いてある。

現実的に、フォントと多くの表示環境では、レンダリングされるときのマージンとかスペーシングを考えると、
日本語を書くときは全角を使った方が見栄えが良くなると思う。
ASCII文字の全角版を使わないという選択はとれないんではないの?

日本人は分かち書きなんてしないから、マージンとかスペーシングを気にしないのかもしれないが、
ラテン文字を使う外国人はマージン・スペーシングに関して全角の方が見栄えがいいから、
unicode standard で禁止されてないし、全角文字を使う風潮が流行るんではないかな。このままほっとくと。

実際、CJK文字を含むテキストで何で半角記号(括弧とか、&とか))を使うのか?全角記号を使うべきではって外国人に言われたし。
まともな反論できなかったわ。

79 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:32:25.32 .net]
英数字に全角文字使えよ

80 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:40:31.84 .net]
>>77
まあ、日本語で書くときの話をしてるから。それに解決になってないし。

追記しとくと、
(日本語)
みたいに全角括弧でくくった場合、括弧の前後にマージンがあるフォントとないフォントがあると思う。
これを半角にしてしまうと、ほとんどのフォントでマージンがないから、前後に空白文字を入れないと、マージンが無くなってしまう。
これが見た目に影響してしまうんだよね。

また、縦書きの場合に
おしっこ&うんこ
みたいに書くと、全角&は正立するが、半角&は90度回転する環境がほとんどだと思う。(?!とかもそうかもね)
じゃあ、CJKだと普通の文字は正立するから、全角で書かないといけないよねってことになる。
今すぐ役に立つものを作る場合は、規格より、現実を優先させないといけないしなぁ。

っつーか、なんでunicodeの互換エリアって使っても問題ないみたいになってしまったんだ?



81 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:01:38.61 .net]
>>78
全角って単にコードの話で、
マージンやスペーシングがどうかなんて規定されてないだろ。
横幅が半分でもコードが全角ならそれは全角だよ。

82 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:15:32.71 .net]
>>79
そりゃそうだけど、じゃあどうするべきなの?
俺はマージンとか縦書きの時の配置はレンダラが適切に処理しろと思うけど、
現実PCの表示環境でそんなの気にしてないし。

フォント制作者も文字の効用に合わせて作ってるんだろ?
半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。

現実に合わせても将来がない上に、規格にそってもまともなレンダリングがされない現状って。

83 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 07:33:02.14 .net]
NEC PC-98シリーズには、2バイト半角文字がある。

84 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 08:00:06.14 .net]
括弧とかは全角版を「スペースが予め含まれた括弧」みたいに再定義しておくべきだったかもしれんね。

85 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 12:42:32.90 .net]
縦書きの時に何を正立させて何を回転させるかは今UTR50でやってる。
もっとも、外野が口を突っ込みすぎて座礁しかかってるけど。

86 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 13:40:47.76 .net]
どうせSJIS⇔Unicode変換には演算入るんだから英数やキリルのJIS全角文字はダイアクリティカルマーク様にコンバインで収録すべきだった

87 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 14:13:01.99 .net]
East Asian WidthがAmbiguousなやつどうすんだよって問題も未だ解決されてないし
どんなとき縦中横にするのかとか文字コードだけで解決できる問題とは思えないよな

88 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 15:05:26.83 .net]
>>80
それは単にあんたの使ってる環境やフォントの機能不足だろ。
>半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。
ヒラギノは文字幅の設定8種類持ってて切替えられる。
OSX上でプロポーショナルにも全角/半角側に統一とかも設定次第で好きにできる。

89 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 16:45:24.79 .net]
「AAAAAA」が全く同じ文字の連続に見えるようなフォントって話だと思ってたけど
OSX+ヒラギノの環境ではそれが可能ってことであってる?

90 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:14:59.80 .net]
>>87
そう、OpenTypeの機能。
OSXは標準のテキストエンジンでサポートしてる。
他のプラットフォームでも真面目にサポートしてれば使える。



91 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:43:27.76 .net]
WinだとDirectWriteでやることになるのかな

92 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 17:56:57.04 .net]
同じ文字には同じコードを割り当てるべきだと思うの

93 名前:デフォルトの名無しさん [2013/01/23(水) 18:44:14.32 .net]
あれ、なんか話題のレベルが落ちてきてない?

94 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:20:18.78 .net]
ンとソのちがいは、日本人ならわかるけど
カタカナのベ
ひらがなのべのちがいは、日本人でもわからん

95 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:23:02.00 .net]
シとツのちがい
うとラのちがい

96 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 19:27:37.37 .net]
>>93
これだね
livedoor.blogimg.jp/conbul/imgs/9/7/97efb758.gif

97 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 21:38:01.20 .net]
>>92
何故へとヘではなくべとベなのか

98 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 01:29:41.99 .net]
>>86
OSXは使った事ないし知らなかったわ。すまん。
その外国人もマックユーザっぽいから、そういう風なレンダリングできるのを自分で見れば納得するかも。
You & I も あなた&わたし も ひろゆき(2ch管理人) も hirokyuki (the founder of 2ch) も
前後の文字を見て適切な字形とマージンを自動選択できる表示ソフトがあるってことだよね。
その外国人は上みたいな文字列を適切に表示させることが出来る環境なんて見たことないって言ってたから、
なにか適切な設定してやらないといけないってことかな。どうすればうまく表示させられるの?

99 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 04:29:08.26 .net]
Unicode Consortiumの内部文書へのパスワードを解除するって
ものすごい決断だなあ。これまで水面下でしてきたことも
これからすることもすべて丸裸か…

100 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 05:26:08.43 .net]
>>90
思うね。ふたつあるΩに、つい「オメーガ悪い!」と叫んじまったぜぃ



101 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 13:30:47.01 .net]
ユニコードは日中韓の同じ文字に同じコードを割り当てた所に問題が有った訳だが・・・

102 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 15:05:11.07 .net]
iモードはなぜJIS X 0208にすでにある♪を絵文字に追加したのかw

103 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 17:40:08.34 .net]
www.nttdocomo.co.jp/service/communication/imode_mail/function/pictograph/
「るんるん」であって八分音符じゃないから
まあ意味も同じな「!」まで追加してるし色つけたいとかアイコンのかわりに使いたいとか
絵文字の水増ししたいとかそういう理由なんだろうな
どちらかといえば「黒ハート(赤)」のほうが納得いかないし

104 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 18:28:41.15 .net]
絵文字なんて、ミクシィみたく数値参照みたいな形式でいいのに。
なんでコードポイントなんか与える必要があるんだよ。

105 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 20:38:24.03 .net]
絵文字は、排除すべきだ

106 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 21:39:41.69 .net]
無理です

107 名前:デフォルトの名無しさん mailto:sage [2013/01/24(木) 21:47:40.50 .net]
使うものだけを各自subset化する

108 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 06:30:50.06 .net]
>>103
排除はどうかと思うが、
Unicodeに日本の3キャリアのみの変換テーブルねじ込んだのは許せん
しかも往復できないし

109 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 09:59:10.09 .net]
>しかも往復できないし

ここだよね。

キャリアの絵文字相互変換はぶっちゃけ「なんとなくこんな感じだよね」レベルなんだから、
ユニコード収録のタイミングで半ば強引に整理して、
キャリアのサーバー側を“権威ある国際規格”にあわせるべきだった。

中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。

110 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 10:38:04.63 .net]
各キャリアの私用領域絵文字は緩やかに廃止して
全部画像ベースのデコメ絵文字に移行す



111 名前:黷ホ何も問題なかったのに
文字コードオタクが調子に乗るから
[]
[ここ壊れてます]

112 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 10:55:54.76 .net]
>中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。

ないわ

113 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 17:19:55.61 .net]
>>88
それってCoreTextでfont featureをセットするみたいな話のことですか?
CoreTextをあまり真剣に使ったことがなかったので後学のために。

114 名前:デフォルトの名無しさん mailto:sage [2013/01/25(金) 17:48:51.40 .net]
>>110
普通にフォントパネルから指定できる。
左下のポップアップメニューからTypography選んでみ。
ずっと前からサポートしてるOSXの基本機能/基本操作だよ。

115 名前:デフォルトの名無しさん mailto:sage [2013/01/27(日) 04:02:47.85 .net]
>>111
はい。
UI的にはそうなんですけど、プログラム的にはNSTextViewとNSFontPanel
の組み合わせで、だけどそれをコントロールするAPIはないような、と。
ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。

「ターミナルでの」半角全角というのはレガシーなエンコーディングにおいて
1バイトか2バイトかで文字幅処理していた名残だから、フォントのデザインという
より文字コードの問題なんだけど、OpenTypeのフィーチャーは有効かな? と。
あくまでもターミナルでの全角半角問題に限定しての話ですが。

で、OS XのターミナルはCoreTextで作られているので... というのが個人的な今ココ。
ちょっとごにょごにょ試してみます。

116 名前:デフォルトの名無しさん mailto:sage [2013/01/27(日) 14:38:22.59 .net]
>>112
フォントによってサポートしてるfeature違うから、適切なオプションを設定すれば良いはず。
>ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。
OSX 10.2辺りからじゃないかな? 手元で一番古い10.4でも普通に使える。
>で、OS XのターミナルはCoreTextで作られているので...
それは最近の話だね。CoreText以前もfont featureはATSUIでサポートされてる。

117 名前:デフォルトの名無しさん mailto:sage [2013/01/28(月) 22:43:40.82 .net]
「ここに晒しておく。」なんて
あの人は発想がちゃねら並みだな…

118 名前:デフォルトの名無しさん mailto:sage [2013/01/28(月) 23:05:39.65 .net]
実名でやってるだけ俺らよりマシだろ

119 名前:デフォルトの名無しさん mailto:sage [2013/01/31(木) 10:37:53.41 .net]
安岡センセイ
実はバリバリのちゃねらーだろ

120 名前:デフォルトの名無しさん mailto:sage [2013/01/31(木) 10:57:25.02 .net]
>>114
安岡センセイが「晒しておく」って書いてる時は文体にかなり怒りを感じる。
本気で怒ってるんだろうと思う。

slashdot.jp/~yasuoka/journal/562403
slashdot.jp/~yasuoka/journal/535124
slashdot.jp/~yasuoka/journal/514117
slashdot.jp/~yasuoka/journal/494946



121 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 00:57:01.23 .net]
ふむ

122 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 03:06:59.67 .net]
阿辻教授の方へ訊きに行ったのが気に障ったのかしら

123 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 06:27:21.26 .net]
>>117
センセイも時々ボケはるからお互い様な感じはする
IVSの時はただの馬鹿かと思った

124 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 21:58:56.46 .net]
>>120
kwsk

125 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 22:02:49.89 .net]
>>117
「晒しておく」とは書いてないが、かなり怒ってる感じだぞ
joi.jlc.jst.go.jp/DN/JST.JSTAGE/johokanri/55.826

126 名前:デフォルトの名無しさん mailto:sage [2013/02/01(金) 23:43:45.98 .net]


127 名前:デフォルトの名無しさん mailto:sage [2013/02/02(土) 17:53:12.36 .net]
??

128 名前:デフォルトの名無しさん mailto:sage [2013/02/02(土) 20:59:26.62 .net]
リンク切れてるぞ

129 名前:デフォルトの名無しさん mailto:sage [2013/02/03(日) 00:32:44.49 .net]
落ちてるのかな

130 名前:デフォルトの名無しさん mailto:sage [2013/02/03(日) 09:20:06.52 .net]
昨日はPDFでダウンロードできたよ



131 名前:デフォルトの名無しさん mailto:sage [2013/02/03(日) 22:02:28.55 .net]
>>113
少し遊んでみました。なるほどヒラギノというのはいろんなテーブルを持ってるんですね。
こういうテーブルのせいでフォントが過剰に大きくなったりしないのかな。

個人的にOS Xからしばらく遠のいていましたが、ふと気がつくとテキストエディットが
縦書き対応に、SafariはIVSに対応しているようで。
しかしIVS->グリフの対応はどのレイヤーで処理しているのかな?

132 名前:デフォルトの名無しさん mailto:sage [2013/02/04(月) 00:18:37.69 .net]
>>122
やっと読めた
怒ってるというよりは業を煮やした感じ

133 名前:デフォルトの名無しさん mailto:sage [2013/02/04(月) 05:38:16.47 .net]
>>128
ヒラギノ角ゴがときどき怪しげな表示をするのは、そのせいなんだろうか。
文字が重なったり、わけのわからんところでボーンとアキができたり。
こういうのはスレチ? MacとかWordとかのスレでやったほうがいいの?

134 名前:デフォルトの名無しさん mailto:sage [2013/02/04(月) 06:06:07.77 .net]
うん

135 名前:デフォルトの名無しさん mailto:sage [2013/02/06(水) 15:17:40.96 .net]
住基ネットって今年3月廃止なの?

136 名前:デフォルトの名無しさん mailto:sage [2013/02/06(水) 23:33:11.40 .net]
地方自治情報センターが仕分け対象になっただけ。

137 名前:デフォルトの名無しさん mailto:sage [2013/02/09(土) 02:19:05.92 .net]
つまりどういうこと?
改組するだけ?それさえなし?

138 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 03:08:54.33 .net]
変体仮名はタイプバンクが作ることになったのか

139 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 07:05:33.91 .net]
変体仮名づくり自体が未知数すぎてコメントしづらい

140 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 09:12:16.70 .net]
変体仮名はフォントの問題な気がする



141 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 09:48:38.40 .net]
納入期限まであまり日がなかったよな
春過ぎには変体仮名入りのIPAmjが出るんだろうか

142 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 19:42:34.26 .net]
変体仮名は楷書書体の知識が全く通用しないからな。
金があれば知識ある人を引っ張ってこれるはずだが役所仕事はアレだからな。

143 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 23:23:35.07 .net]
これはどうなるのかマジで不安

だめなのが出てきたときにリジェクトってできるの?

144 名前:デフォルトの名無しさん mailto:sage [2013/02/12(火) 00:03:42.36 .net]
外野が物言いを付けるタイミングとしては
・グリフがIPAmj明朝に入った時にフィードバックする
・そのフォントをもとにした符号化提案書がWG2へ回ってきた時にコメントする
のどっちかだと思う。

プロジェクトを指揮してる主体が見えないんでそれぞれ
いつ頃起こるかは分からないけど。

145 名前:デフォルトの名無しさん mailto:sage [2013/02/12(火) 05:04:57.64 .net]
ううむ

146 名前:デフォルトの名無しさん mailto:sage [2013/02/13(水) 21:40:41.76 .net]
漢字6万字の時は
2011/3/14がグリフの納入期限→2011/5/18にIPAmj明朝検証版公開

今回の変体仮名は
2013/3/18がグリフの納入期限→?

147 名前:デフォルトの名無しさん mailto:sage [2013/02/15(金) 00:23:14.23 .net]
内部では基本形はもうできあがってんのかな

148 名前:デフォルトの名無しさん mailto:sage [2013/02/15(金) 05:11:17.45 .net]
入札公告から数えても期限まで80日程
これで200字強か

149 名前:デフォルトの名無しさん mailto:sage [2013/02/16(土) 02:33:57.81 .net]
外字登録についてご存じの方がいたら教えて下さい。

ドコモの絵文字をサロゲートペアのPUA(15面)に外字登録したいのですが、
フリーのツールなどで可能な方法はありますか?

Windowsの外字エディタではサロゲートペアの領域には外字登録できないので。。。

150 名前:デフォルトの名無しさん mailto:sage [2013/02/19(火) 20:17:50.30 .net]
>>146
FontForge使えばできるよ



151 名前:デフォルトの名無しさん [2013/02/20(水) 06:29:14.37 .net]
板の趣旨とまったく関連ないよねこのスレ。

152 名前:デフォルトの名無しさん mailto:sage [2013/02/20(水) 10:07:07.44 .net]
確かにw


ただ、文字コードの総合スレってどこに行けばいいのかよくわからんのよね。
「PC」に限ったもんでもないと思うし。

広義の「ソフトウェア」として捉えようにも、あそこは実質Windowsアプリ板だし。

153 名前:デフォルトの名無しさん mailto:sage [2013/02/20(水) 15:01:12.39 .net]
プログラムで扱うデータ構造だからプログラム板で良いのでは

154 名前:デフォルトの名無しさん mailto:sage [2013/02/20(水) 22:57:52.15 .net]
安岡センセイ荒れてるなあ
slashdot.jp/~yasuoka/journal/563428

155 名前:デフォルトの名無しさん mailto:sage [2013/02/20(水) 23:29:24.54 .net]
IVSに言及されてるのにUCS-2がdeprecatedになったことや
UCS-4の範囲が制限されてることは知らなかったり
色々とちぐはぐな論文だこと

156 名前:デフォルトの名無しさん mailto:sage [2013/02/21(木) 09:22:44.08 .net]
H立は研究所がすごいという感があるが、F通の研究所はなんかこういうのばかりという印象があるなw

157 名前:デフォルトの名無しさん mailto:sage [2013/02/21(木) 11:29:36.87 .net]
不治痛は官公庁がらみの仕事が多くて
文字setにうるさい割に能力は適当な希ガス

158 名前:デフォルトの名無しさん mailto:sage [2013/02/21(木) 16:38:53.44 .net]
>現時点での常用漢字と人名用漢字がどうなっているかぐらい

つまり、どうなっているの?

159 名前:デフォルトの名無しさん mailto:sage [2013/02/21(木) 17:34:48.82 .net]
「富士通総研経済研究所研究レポート」ってエッセイ集でしょ?

160 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 11:01:29.14 .net]
>>156
査読とかが無いみたいだから
こんなのが出てくるんだな



161 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 11:38:37.20 .net]
大学でいうと紀要のようなもんだな。玉石。
10年ぐらい前にも紀要論文で、同レベルの文字コード論があったという記憶がある。

162 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 18:10:31.98 .net]
安岡センセイが暴走中
opendata.openlabs.go.jp/ja/idea/00089/

163 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 19:29:07.64 .net]
00091の方が大事だな

164 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 19:37:59.78 .net]
>>160
マイクロソフトの中の人?

165 名前:デフォルトの名無しさん mailto:sage [2013/02/22(金) 19:40:00.44 .net]
それっぽいね。同姓同名の他人じゃなければ

166 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 01:49:18.18 .net]
00089も00091もコメントついてるけど
何かやり取りがちぐはぐな気が

167 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 15:04:59.97 .net]
うむ

168 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 18:05:17.50 .net]
>>147
ありがとうございます。
FontForge(fontforge-cygwin_2012_08_02)をインストールしてみました。
Webで調べて、フォントからフォントへのコピーの方法は分かったのですが
保存しても0バイトになってしまい、ただいま格闘中です。

169 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 18:15:58.01 .net]
セキュリティで言えば高木先生に相当するのがその安岡って人?

170 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 18:31:33.20 .net]
半年ROMれ



171 名前:デフォルトの名無しさん mailto:sage [2013/02/23(土) 21:31:22.08 .net]
あまり深く考えたことなかったけど
東アジア人文情報学研究センターって何なんだろうな
図書館の凄い版?

172 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 16:48:38.49 .net]
Unicode IVS/IVD入門 ―JIS規格の歴史、異体字問題の解説から、Windows 8での対応方法まで
とかいう本がでるらしいのだが

これは買いですか?糞ですか?

173 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 17:12:09.85 .net]
「UnicodeによるJIS X0213実装入門」の続編みたいな内容でしょ。
新たに加わった著者はUnicodeの人だよね。

174 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 17:21:41.13 .net]
Unicode対応って言うか
Windowsは早くシステムロケール
UTF8に対応してケロ

175 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 17:54:27.91 .net]
コマンドプロンプトはutf-8を選べるようになったの?

176 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 18:05:47.70 .net]
(´‥∀‥`)ほう

177 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 19:26:36.90 .net]
>>172
ttp://fine.ap.teacup.com/hepo/30.html

178 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 19:48:59.90 .net]
>>171
むりぽ
blogs.msdn.com/b/michkap/archive/2006/10/11/816996.aspx

179 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 19:54:52.45 .net]
今出来ないのはわかるけど
将来にわたって無理?

180 名前:デフォルトの名無しさん mailto:sage [2013/02/24(日) 20:32:51.83 .net]
最後の一節はかなり悲観的ですなあ
7年前の記事ではあるけど



181 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 08:15:24.93 .net]
別に全部サポートせんでも
UTF8にする選択肢だけ
用意すりゃええが

182 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 19:19:03.04 .net]
UTF-8にしたら、サイズが1.5倍になるんでしょ。アホかとおもう

183 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 21:34:04.45 .net]
Unicode使いたくてWindows使ってる人は何かの修行ですか?
posixサポートも廃止なんだからUTF-8サポートなんて絶望的だろ。

184 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 21:43:58.01 .net]
Windowsはコンソールを完全にUTF-16仕様にしてくれるだけでいいんだけどな
SJISはcommand.comで対応することにして

185 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 22:01:45.41 .net]
というかいい加減にShift JIS捨てろとw

186 名前:デフォルトの名無しさん [2013/02/25(月) 22:09:34.90 .net]
とりあえずcygwinで満足する努力が必要。

187 名前:デフォルトの名無しさん mailto:sage [2013/02/25(月) 22:11:30.84 .net]
Shift_JISですらないよ、未だにWindows-31J
文字化けするのはUnicode使う方が悪いw

188 名前:デフォルトの名無しさん mailto:sage [2013/02/26(火) 02:35:23.96 .net]
マジ同感。
文字化けはWindwosのせい

189 名前:146 mailto:sage [2013/02/26(火) 22:22:56.55 .net]
>>147
できました!ありがとうございました!

190 名前:デフォルトの名無しさん mailto:sage [2013/02/26(火) 22:48:20.68 .net]
minttyいいね



191 名前:デフォルトの名無しさん mailto:sage [2013/02/28(木) 22:10:27.25 .net]
JEFのコードブックって
まだ手に入るの?

192 名前:デフォルトの名無しさん mailto:sage [2013/03/08(金) 22:20:35.27 .net]
(´・ω・`)?

193 名前:デフォルトの名無しさん mailto:sage [2013/03/25(月) 15:59:14.92 .net]
変体仮名グリフの納入が終わったはずだが、さて。

194 名前:デフォルトの名無しさん mailto:sage [2013/03/27(水) 23:17:38.52 .net]
和文モールスと武雄市図書館が
つながるとは思わんかった

195 名前:デフォルトの名無しさん mailto:sage [2013/04/01(月) 16:40:23.23 .net]
住基文字完全変更って大変だな
slashdot.jp/story/13/03/31/163258/

196 名前:デフォルトの名無しさん mailto:sage [2013/04/01(月) 17:35:25.64 .net]
4/1やっていいのは午前中までだ

197 名前:デフォルトの名無しさん mailto:sage [2013/04/01(月) 22:34:59.80 .net]
スラドなんて年中エイプリルフールだろ

198 名前:デフォルトの名無しさん mailto:sage [2013/04/01(月) 22:41:06.50 .net]
失礼な
昔の東スポよりマシだぞ

199 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 09:37:09.74 .net]
エイプリルフールじゃなかったのか?

>住基ネットで文字化け 231市町村の1万人分 プログラムミス
www.asahi.com/shimen/articles/TKY201304020675.html

200 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 11:09:33.32 .net]
今気付いたが今月はもう4月じゃないか



201 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 12:37:39.49 .net]
原発事故で行政はどこも信用できなくなった

202 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 16:20:46.09 .net]
>>198
それまで信用してたなんて奇特な人だね

203 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 19:09:21.79 .net]
得体の知れない文字コードで管理されている個人情報

204 名前:デフォルトの名無しさん mailto:sage [2013/04/03(水) 19:26:15.74 .net]
>>198
そこで民間企業が作ったユニコードというわけですね。わかります。

205 名前:デフォルトの名無しさん mailto:sage [2013/04/04(木) 07:31:01.03 .net]
さて

206 名前:デフォルトの名無しさん mailto:sage [2013/04/06(土) 15:58:22.34 .net]
そんなわけで

207 名前:デフォルトの名無しさん mailto:sage [2013/04/06(土) 17:39:03.94 .net]
うん

208 名前:デフォルトの名無しさん mailto:sage [2013/04/06(土) 18:00:17.69 .net]
話題なさすぎワラタ

209 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 00:33:20.23 .net]
Javaのnative2asciiが出すエスケープ変換をC/C++のプログラム中でやりたいのですが
簡単な方法はありますかね?
あ、入力はUTF-8なんですが。

そういえばあれって名前はasciiと言ってるけど実際にはISO 8859-1以外をエスケープ
するという噂を耳にしたんですが...

210 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 02:33:07.04 .net]
>>206
1.UTF-8をUTF-16に変換します
2.80hより大きなコードポイントをエスケープします

ほらできた!



211 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 02:43:29.97 .net]
>>207
んーと、
UTF-8 -> UTF-16はどうしたらいいですかね。何かおすすめのライブラリはあります?
あるいは自前で変換します?
ASCIIより上をエスケープすべきという主張ですね。
あとサロゲートはどうしたらいいんですかね。
できるだけnative2asciiの挙動と一致させたいのですが。

212 名前:デフォルトの名無しさん [2013/04/07(日) 02:51:00.36 .net]
ttp://www.seiai.ed.jp/sys/text/java/utf8table.html
UTF-8は1〜4バイト(初期の定義では6バイトまで)の可変長コード
00-7x 1バイト文字 US-ASCIIにおなじ
8x,9x,Ax,Bx 多バイト文字の2バイト目以降
Cx,Dx 2バイト文字の開始バイト
Ex 3バイト文字の開始バイト
Fx 4バイト以上の文字の開始バイト

つまり
00-7fは元の文字
c0-ffなら「u」+バイト列をそれぞれ出せばいいわけだろ

UTF-16なんて必要ないな
native2asciiの挙動?
使いもしねえもの知るかよ

213 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 02:58:03.93 .net]
>>208
1.Unicode規格を読みます
2.規格に従い、UTF-8をUTF-32に変換します
3.規格に従い、UTF-32をUTF16にへんかんします。
このとき、サロペも処理します。

ただしJavaがjarで使用するニセUTF-8が入力の場合は
UTF-8を直接UTF-16に変換する必要があります。

ほらできた!

214 名前:デフォルトの名無しさん [2013/04/07(日) 04:27:18.60 .net]
# cl引数を変換
--
#include <stdio.h>
#include <string.h>

int main(int argc, char *argv[]) {
unsigned char* b; unsigned char* h = argv[1];
int i, hlen; hlen = strlen(h); memcpy(b, h, hlen);
printf("ori:\n%s\nuni:\n",h);
for(i = 0; i < hlen; i++) {
if ((*(h + i)) < 128) {/* [0-7]*なら元の文字 */
printf("%c", *(h + i));
}else{
if ((*(h + i)) > 191) { printf("\\u"); }/* [cdef]*なら\u追加 */
printf("%02X", *(h + i));
}
}
printf("\n");
}
--
>na r元の8文字
ori:
r元の8文字
uni:
r\uE58583\uE381AE8\uE69687\uE5AD97

215 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 04:27:30.15 .net]
馬鹿には無理

216 名前:デフォルトの名無しさん mailto:sage [2013/04/07(日) 05:39:51.63 .net]
>>208 適当に書いてみた。こんな感じ。
ideone.com/2StvbL

217 名前:213 mailto:sage [2013/04/07(日) 10:01:46.67 .net]
Windows限定ならこんな漢字
------------
#include <cstdio>
#include <vector>
#include <Windows.h>
using namespace std;

int main()
{
 char const *p_org="\xE3\x81\xBE\xE3\x82\x93\xE3\x81\x93z"; // UTF-8文字列。

 auto len = ::MultiByteToWideChar(65001, MB_ERR_INVALID_CHARS, p_org, -1, nullptr, 0);
 vector<wchar_t> utf16s(len);
 ::MultiByteToWideChar(65001, MB_ERR_INVALID_CHARS, p_org, -1, &utf16s[0], (int)utf16s.size());

 for ( auto &ch : utf16s )
 {
  if ( ch == 0 )
   break;
  else if ( ch < 0x80 )
   printf("%c", (int)(ch));
  else
   printf("\\u%04x", (int)(ch));
 }
}

218 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 03:27:39.08 .net]
どうせ、UTF8とかサロゲートペアとか順番に解釈しないといけなくなるんだったら、
コードページ切り替え方式でよかったのにな

219 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 17:21:58.60 .net]
ブラジルポルトガル語 と ポルトガルポルトガル語の
アルファベットは同じでしょうか??

ポルトガルポルトガル語のフォントでブラジルポルトガル語が
表現できるのかを調べています。

ご存知の方回答よろしくお願いします。

220 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 17:34:57.34 .net]
同じなので表示できます。



221 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 17:35:46.30 .net]
>>217
 回答ありがとうございました。m(__)m

222 名前:デフォルトの名無しさん [2013/04/09(火) 17:59:23.08 .net]
そーゆーのの違いて基本colorとcolourみたいなもんだろ

223 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 18:04:39.90 .net]
>>219
 やっぱり、スペルと発音だけの違いですか。

224 名前:デフォルトの名無しさん mailto:sage [2013/04/09(火) 20:05:31.51 .net]
厳密に知りたいならポルトガル語 正書法でググるよろし

225 名前:デフォルトの名無しさん [2013/04/10(水) 12:13:56.89 .net]
>>219
そうか?繁体字と簡体字くらいの違いはあるかも知れんぞ

226 名前:デフォルトの名無しさん mailto:sage [2013/04/12(金) 15:20:03.40 .net]
なんかそういうのあったな。
ダイアクリティカルマークだったか合字だったか忘れたけど、
コードポイントは同じでも国によって微妙なデザインを使い分けないと現地民にプギャられるってやつ。

227 名前:デフォルトの名無しさん mailto:sage [2013/04/12(金) 21:42:52.95 .net]
ちょっと点の向きや形が違うと言って大騒ぎ。
しまいにゃ文字幅がどうこう言い出す始末。
そんな現地民が東アジア方面にいるとかいないとか

228 名前:デフォルトの名無しさん mailto:sage [2013/04/12(金) 22:15:53.06 .net]
ピンインの二声・四声の話かな?
どれぐらい現地民が気にしてるのかわからないけど。

229 名前:デフォルトの名無しさん mailto:sage [2013/04/13(土) 02:20:28.57 .net]
その国には "立" の一画目が横か縦かを真面目な学問として
研究して金をもらっている連中もいるらしい

230 名前:デフォルトの名無しさん mailto:sage [2013/04/13(土) 03:44:23.55 .net]
あまり面白い皮肉じゃないな



231 名前:デフォルトの名無しさん mailto:sage [2013/04/13(土) 23:10:53.74 .net]
研究してる奴らって立たなくなった奴ばっかりなんだろ

232 名前:デフォルトの名無しさん mailto:sage [2013/04/15(月) 12:09:40.57 .net]
>>226
「龍」の方がおもしろいな

233 名前:デフォルトの名無しさん mailto:sage [2013/04/15(月) 21:27:01.56 .net]
「正しい字形」は横なのに縦で教えるダブスタ大杉

234 名前:デフォルトの名無しさん mailto:sage [2013/04/15(月) 23:43:58.32 .net]
>>208
iconv

235 名前:デフォルトの名無しさん mailto:sage [2013/04/16(火) 04:06:42.93 .net]
>>209
>UTF-16なんて必要ないな
InDesignというDTPソフトにunicodeテキストを配置する場合、
UTF-16BEなんてもんにしなくちゃいけないんざますの。

236 名前:デフォルトの名無しさん [2013/04/16(火) 04:58:55.88 .net]
>>209はutf8を\u****形式に変換する話してるのに>>232
知障ですか?

237 名前:デフォルトの名無しさん mailto:sage [2013/04/16(火) 06:20:11.15 .net]
要るんです、という話をしただけですのよ。ちなみにわたくしエディタで変換してますわ。

238 名前:デフォルトの名無しさん mailto:sage [2013/04/28(日) 14:29:25.02 .net]
そして誰も

239 名前:デフォルトの名無しさん mailto:sage [2013/04/29(月) 22:33:06.77 .net]
今はもう

240 名前:デフォルトの名無しさん mailto:sage [2013/04/30(火) 03:22:01.47 .net]
初夏



241 名前:デフォルトの名無しさん mailto:sage [2013/05/01(水) 15:50:42.12 .net]
5月か
早いな

242 名前:デフォルトの名無しさん mailto:sage [2013/05/01(水) 23:51:25.22 .net]
アレってどうなったんだっけ

243 名前:デフォルトの名無しさん mailto:sage [2013/05/03(金) 22:41:27.92 .net]
ドレ?

244 名前:デフォルトの名無しさん mailto:sage [2013/05/03(金) 23:27:41.29 .net]
何の&#x30FF;?

245 名前:デフォルトの名無しさん mailto:sage [2013/05/04(土) 19:08:59.48 .net]
コト点でないのか

246 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 00:20:52.26 .net]
BBS_UNICODE=passは万能ではないってこと?

247 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 00:47:04.03 .net]
てすと ヿ

248 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 11:06:17.17 .net]
数値参照だと出るの?ヿ

249 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 13:44:32.35 .net]
241は & が変換されてる

250 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 17:19:43.57 .net]
テスト
&#x30FF;



251 名前:デフォルトの名無しさん mailto:sage [2013/05/05(日) 17:20:33.68 .net]
変換されるなあ

252 名前:デフォルトの名無しさん mailto:sage [2013/05/10(金) 02:10:52.50 .net]
Open2chの文字コードは、UTF-8だ

<html lang="ja">
<head>
<title>宝くじ@open2ch掲示板</title><style>body{ margin:0; padding:0;}</style>
<link rel="alternate" type="application/rss+xml" title="RSS" href="http://engawa.open2ch.net/loto/index.rdf" />
<link rel="alternate" type="application/atom+xml" title="Atom" href="http://engawa.open2ch.net/loto/atom.xml" />
<script type="text/javascript" src="/lib/jquery/jquery-1.7.2.min.js"></script>
<script type="text/javascript" src="/lib/common.js?v2"></script>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link href="/lib/main.css?x" type="text/css" rel="stylesheet" />
</head><body text=#000000 link=#0000FF alink=#FF0000 vlink=#660099 background=/image/ba.gif>

253 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 00:29:20.32 .net]
Old Hungarianは泥沼だな…

254 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 15:25:57.78 .net]
よく知らない人でもわかるように簡単な解説希望

255 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 23:40:04.51 .net]
Eversonが昔出した提案を前進させようとしたらハンガリー国内よりカウンター提案が
出てきた
そっちは稚拙だったのでEversonペースで進みかけたけど、カウンター提案者が
ハンガリーNBの座を獲得したので意向を無視できなくなった

以後ハンガリー国内で支持が割れて、この度ハンガリー国内から「今のEversonベースの
符号化案のまま行ってくれ」という署名リスト(N4420)と、「今の符号化案を投票から
外せ」という署名リスト(N4422)が届いた

256 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 23:53:19.67 .net]
おっおおう…頭抱えたくなる状況だな

257 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 12:17:49.20 .net]
なんか難しい話だな。
n4368(Everson)とn4367の戦いってことみたいだけど、
一例にdzの話を読むと、(梯子zの横に棒がついた文字)
これはもともとold hungerianになかった音/文字で、
n4368は現代では使わないから必要ないって立場(n4368 1.2)
n4367はこれは単なるd+zじゃないんだよ(n4367 5.4.1)

読み込めてないけど、
n4368は現代ハンガリー語に対応する正書法の提案も含まれていて、
n4367は歴史的な経緯を踏まえた提案になっている感じか。
たぶんold hungerianを、現代に復活させようとしている派(n4368)と、
歴史的な文字として登録しようとしている派(n4367)の戦いじゃないか。
n4420の"everyday use"とか、n4368 1.2の後半読むと。
学校でold hungerianを使わせる計画があるみたいだ。

258 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 13:54:42.87 .net]
こういうのっていろんな分野で政治行政と歩調を合わせないといけないからほんと難しいよね。
単に自分(規格がらみ)が各方面と一対一で調整するだけじゃなくて、そいつら同士の橋渡しまで面倒見ないと何もまとまらないし。

259 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 17:37:20.80 .net]
254です。
2,3時間読んでみただけで言うのも無責任だけど、
n4367の方がよさそうな気がするなあ。
Everson版は目的を限定しすぎてて、文字数も相当少ない。
かと言って合字が定義されてるわけでもない。
最初に網羅的にやっとかないと後で公開することになるはず。
あと、n4422によれば間違いも多いと書かれている。
実際どうか検証する知識はないけど、
n4367の方が引用している資料も多いし、一文字に対する検証も徹底的。
Eversonさんは膨大なスクリプトについてUnicodeに多大な貢献があるのは事実だけど、
専門家の意見も謙虚に聴くべきではないか?
まあUnicode専門家の意見も尊重しないといけないがね。

260 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 22:34:08.76 .net]
>最初に網羅的にやっとかないと

日本人が言うとすごい説得力あるよねこれ



261 名前:デフォルトの名無しさん mailto:sage [2013/05/24(金) 01:09:40.80 ID:JuHX2I0P!.net]
Character encoding poetry
ttps://www.facebook.com/cmb/posts/619241744770551

262 名前:デフォルトの名無しさん mailto:sage [2013/05/24(金) 11:45:41.18 .net]
>>252は勘違いで、Everson案がUnicode的稚拙さで、
専門家が本格的な改正案を出してきたってところみたいだな。

263 名前:デフォルトの名無しさん mailto:sage [2013/06/01(土) 11:09:43.05 .net]
そういうものなのかね

264 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 03:10:36.60 .net]
過疎ってるな

265 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 06:46:38.91 .net]
ねたが無いからね

266 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 15:04:34.93 .net]
坂村健みたいな逸材が必要とされている

267 名前:デフォルトの名無しさん mailto:sage [2013/06/27(木) 16:58:52.16 .net]
d.hatena.ne.jp/akane_neko/20130621/1371766405
これ読む限りだと安岡センセイもネタ切れなのかと

268 名前:デフォルトの名無しさん mailto:sage [2013/06/29(土) 23:43:50.69 .net]
安岡は基地外だから もう引退した方がいい

269 名前:デフォルトの名無しさん mailto:sage [2013/06/30(日) 02:05:47.38 .net]
最近のWG2の文書の中だとcedillaと下付commaの件が面白いな
結局下付commaの方は別途符号化することになったようだけど

270 名前:デフォルトの名無しさん mailto:sage [2013/06/30(日) 13:12:55.51 .net]
>>263 >>265 まだ基地外TRON信者いたんだ



271 名前:デフォルトの名無しさん mailto:sage [2013/07/02( ]
[ここ壊れてます]

272 名前:火) NY:AN:NY.AN .net mailto: さて []
[ここ壊れてます]

273 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
来週の

274 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
キテレツ大百科は

275 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
ツレテキ

276 名前:デフォルトの名無しさん mailto:sage [2013/07/10(水) NY:AN:NY.AN .net]
スレが凍りついているわけだが

277 名前:デフォルトの名無しさん mailto:sage [2013/07/10(水) NY:AN:NY.AN .net]
unicodeの歴史について勉強しようと思ったら初めからいきなり2バイト固定にしようとしていてズっこけた。
当時日本人はだれも突っ込まなかったんだろうか
あるいは当時のマシンスペックとの妥協とか政治的な何かとか理由があった?

278 名前:デフォルトの名無しさん [2013/07/11(木) NY:AN:NY.AN .net]
いろんな人が突っ込んでたよ

279 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
スペックもあるだろうけどメモリが高価で容量も小さかったせいじゃないかな
当初は日常で使う字だけを符号化して特殊な字や古代の字はPUAを使わせるつもりだったとか
過去スレでそんな話題してるところがあったはず

280 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
そもそもUnicodeが使われる日が来るなんてみんな本気で信じて無かった



281 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
漢字ROMと文字一覧表(本?)でおk

282 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
ちょっと(かなり?)スレ違いなんだけど、
発音記号もそのうちIPA(国際音声記号)に統一されるのかしら。

283 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
汎用のものとしてはIPAを改正していくのが正攻法でしょう。
2005年にも唇歯はじき音が追加。

284 名前:デフォルトの名無しさん mailto:sage [2013/07/12(金) NY:AN:NY.AN .net]
代用になるようなものもないからねえ…

285 名前:デフォルトの名無しさん mailto:sage [2013/07/13(土) NY:AN:NY.AN .net]
その場しのぎの積み重ねでこんがらがった醜さはUnicodeよりも先輩だな

286 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
古文書がIPAで表されるのを想像……できん

287 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
想像してもいいんだぜ?

288 名前:デフォルトの名無しさん mailto:sage [2013/07/27(土) NY:AN:NY.AN .net]
a%20%20%20a

289 名前:デフォルトの名無しさん mailto:sage [2013/07/28(日) NY:AN:NY.AN .net]
(´・ω・`)?

290 名前:デフォルトの名無しさん mailto:sage [2013/08/01(木) NY:AN:NY.AN .net]
ここ数ヶ月は話題なしか



291 名前:デフォルトの名無しさん [2013/08/14(水) NY:AN:NY.AN .net]
www.itscj.ipsj.or.jp/domestic/sc02/hanyo-denshi/20100331/

最終更新日:2013年7月26日

情報規格調査会Webサイトの改ざんについて


6月17日(月)、情報規格調査会のサイト(www.itscj.ipsj.or.jp)が不
正と思われるアクセスを受け改ざんされたことを確認いたしましたので、直ち
に当該サイトを停止いたしました。

その後の調査で当該サイトに不正な javascript が埋め込まれていることを確
認いたしました。

6月15日(土)箸キ6月17日(月)に当該サイトを閲覧された方は、直ちに最新のウイ
ルス対策ソフトで感染の確認と駆除を実施いただきますよう、重ねてお願いい
たします。

現在、セキュリティ専門会社に詳細な分析を依頼しており、閲覧された皆様に
新たな対策が必要となりましたとき、或いは、追加情報が得られた場合には、
改めて情報規格調査会ホームページにてご案内いたします。

当該サイトを閲覧された方、また、関係者の方々にはに多大なご迷惑をおかけ
しましたことを深くお詫び申し上げます。不正アクセスへの対策を講じた後、
安全性を確認した上で再開の予定ですので、今しばらくお待ち頂きますようお
願いいたします。

情報規格調査会 委員長 伊藤 智

292 名前:デフォルトの名無しさん mailto:sage [2013/08/14(水) NY:AN:NY.AN .net]
ちょっと笑った

293 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
紺屋の白袴

294 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
違うか、医者の不養生かな

295 名前:デフォルトの名無しさん [2013/08/20(火) NY:AN:NY.AN .net]
おまわりさんが痴漢

296 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
そうか、そっちか

297 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 02:40:49.67 .net]
さて

298 名前: 【大吉】 mailto:sage [2013/09/01(日) 13:43:28.79 .net]
9月になりましたが

299 名前:デフォルトの名無しさん [2013/09/01(日) 13:50:07.64 .net]
2ちゃん落ちるのって今日だっけ?

300 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 15:40:01.66 .net]
うそなんでしょう?



301 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 17:59:04.17 .net]
よく見ろ 3ちゃんねるに変わってるだろ

302 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 18:34:41.38 .net]
 _, ._
(; ゚ _゚ ) …

303 名前:デフォルトの名無しさん mailto:sage [2013/09/02(月) 03:09:55.31 .net]
>>297
めったなことを言うんじゃありません。
頑張って見る>>298のような素直な人もいるんだから。
って、勝手に文字コードの数字がズレたら嫌だな。
通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。

304 名前:デフォルトの名無しさん mailto:sage [2013/09/08(日) 21:02:59.58 .net]
>通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
EBCDICディスってるのか

305 名前:デフォルトの名無しさん mailto:sage [2013/09/08(日) 21:31:07.18 .net]
ディスられて当然のゴミコードがどうかした?

306 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 00:08:59.56 .net]
UNICODEも添字系が無茶苦茶

307 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 11:58:12.44 .net]
添字系?

308 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 18:23:36.13 .net]
字は添えるだけ。

309 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 20:26:20.42 .net]
Superscripts and Subscripts

310 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 21:20:07.96 .net]
www.unicode.org/charts/PDF/U2070.pdf
これか。なるほどこれひどい



311 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 18:37:08.00 .net]
小さすぎて読めない

312 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 20:39:14.29 .net]
なんでiが1の位置にあるんだろう?

「数字の1を意味する上付き文字」を全部統合するつもりだった?

313 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 21:22:03.40 .net]
SuperScript 1〜3は別の場所にある。
2: U+00B2
3: U+00B3
1: U+00B9

314 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 21:25:05.86 .net]
oh....

315 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 04:58:45.13 .net]
>>307ちゃんとダウンロードして拡大して見ろ>私 ゴメン

316 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 09:54:06.83 .net]
まあ、前後とか上中下とか甲乙丙丁とかI II III IV V VI VII VIII IX Xとか、
特定の用法においてナンバリングに使われる文字も位置はばらばらで、
こういうのを名前に含むファイルをソートするとうわあああってなるから
実用上は似たようなもんかもしれん

317 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 10:22:47.43 .net]
確かに前後はいつも逆になって鬱陶しい

318 名前:デフォルトの名無しさん mailto:sage [2013/09/12(木) 22:36:56.49 .net]
一九五三四七十二八六

結構イラッとくる

319 名前:デフォルトの名無しさん mailto:sage [2013/09/12(木) 22:54:00.51 .net]
WikipediaのCollationのページに対応する日本語ページってないんだね

320 名前:デフォルトの名無しさん [2013/09/13(金) 04:14:55.98 .net]
欲しければ作れば?



321 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 07:42:40.82 .net]
>>314
これぐらいは順番に並べて欲しいわなあ

322 名前:デフォルトの名無しさん [2013/09/16(月) 11:45:02.26 .net]
>>314 >>317
だれが決めたん?
センスないね

323 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 12:18:33.64 .net]
あほかい。
漢字の読みの順に並んでいるんだから、寧ろ「一二三四五六七八九」の方がいらっと来るわ。

324 名前:デフォルトの名無しさん [2013/09/16(月) 12:23:33.36 .net]
えぇっ!?

325 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:04:28.81 .net]
>>319
確かに

326 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:29:36.80 .net]
読み順で並んでるメリットって何?

327 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:46:41.82 .net]
読み順以外を選ぶメリットって何?

328 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 14:16:25.26 .net]
読み順というか文字コード順でソートしているからこうなるので、
漢数字がいい感じで並ぶ順を定義して実装して使えばいい

329 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 01:24:13.67 .net]
メリットって…
他のところが音読み順なのにそこだけ変えるほうがおかしいだろ
というか>>314 >>317 >>322あたりはもしかしてこの十文字が連続して並んでるとか思ってるんじゃないだろうな

330 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:23:12.95 .net]
CJK Numeralsとかの別枠にしてほしかったってことでしょ



331 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:32:41.19 .net]
訓呉音漢音の優先順位あやふやにローマ字で並べてある
ような始末におえん状況よりはマシでしょ

332 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:38:15.05 .net]
Unicodeの漢字って日本読み順なの?

333 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 03:24:48.54 .net]
読み順を選べば読み順、画数順を選べば画数順、なんじゃないの?

334 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 03:57:19.63 .net]
(´‥∀‥`)?

335 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 05:26:00.76 .net]
>>329は見なかったことにしといて

336 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 14:11:11.79 .net]
(´・‥∀・‥`)?

337 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 17:35:55.62 .net]
>>314 はJIS順なのかな
Unicode順なら 一七三九二五八六十四

338 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 18:49:54.69 .net]
漢数字を文字コードだけで機械的にソートするとか、どんだけ

339 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 19:46:20.12 .net]
0100
0100
〇一〇〇
零百
十〇
〇壱〇〇
最適解が欧文の比じゃない数有るからなあ

340 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 20:49:55.10 .net]
そういうのはフリガナとかヨミガナとかのソートの種を入れますし。



341 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 21:07:54.19 .net]
1024*1024のビットマップフォントにして
黒の数でソートしようず

342 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 21:56:58.21 .net]
それが黒だと誰が決めた

343 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 22:02:47.20 .net]
黄色でもいいけどよ
モノクロ二値にすんだよハゲっが

344 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 23:58:51.49 .net]
意味ない

345 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 00:06:35.40 .net]
yes

346 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 02:19:26.91 .net]
文字コードについて説明してある本が古くて使いものにならない、ってことになるとは、
最初に書いた人は想像してなかったろうな

347 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 03:05:07.93 .net]
>>328
康熙字典の部首順。
だから漢数字が一七三九二五八六十四の順になったりする。

348 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 03:21:07.49 .net]
なるほど部首か

349 名前:デフォルトの名無しさん mailto:sage [2013/09/21(土) 00:40:43.90 .net]
>>342
なわけねえべ。

350 名前:デフォルトの名無しさん [2013/09/23(月) 20:39:39.37 .net]
950 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 18:35:39.06 ID:i/lAwQriP
&#x9A38;豚か。


951 名前:名無しの報告 投稿日:2013/09/23(月) 18:45:49.59 ID:21igwRGo0
>>950
文字実体参照、16進の数値文字参照を全板で禁止
数値文字参照は10進のみ、BBS_UNICODE=passの板で可


952 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 19:38:39.06 ID:i/lAwQriP
せん馬のせんがぁあああ


953 名前:名無しの報告 投稿日:2013/09/23(月) 19:49:53.10 ID:P916m9xr0
せん馬

去勢された牡馬の性別を表す競馬用語。センとも書かれる。
せんは馬に扇で、一部の雑誌やサイトでは騙という字が当てられていることがあるが、それは間違い。


qb5.2ch.net/test/read.cgi/sec2chd/1379117300/951 【規制議論板】質問でも雑談でもOKのスレッド★359



351 名前:デフォルトの名無しさん mailto:sage [2013/09/23(月) 22:53:29.07 .net]
何で10進参照だけ生き残ったの?

352 名前:デフォルトの名無しさん mailto:sage [2013/09/24(火) 08:49:43.08 .net]
2chの運営(=バカ)にまともな理屈を期待しても無駄

353 名前:デフォルトの名無しさん [2013/09/28(土) 07:58:37.70 .net]
この本屋って新宿駅近くにあるんだけど
部屋の区割り自体が迷路のように入り組んでいて
火事で停電になったら出口判らず逃げ遅れて死者多数出ると思う
www.dotup.org/uploda/www.dotup.org4535669.jpg

354 名前:デフォルトの名無しさん mailto:sage [2013/09/28(土) 11:57:32.13 .net]
何?唐突に怖いんだけど…よく見たら心霊系、みたいなネタ画像?

355 名前:デフォルトの名無しさん mailto:sage [2013/09/28(土) 15:20:17.67 .net]
文字コード本の棚

356 名前:デフォルトの名無しさん mailto:sage [2013/09/28(土) 16:41:06.05 .net]
どこだよ
ブックファーストか?

357 名前:デフォルトの名無しさん mailto:sage [2013/09/28(土) 16:58:52.10 .net]
ジャンク堂書店?

358 名前:デフォルトの名無しさん mailto:sage [2013/09/28(土) 20:22:57.57 .net]
コクーンのB1やね

359 名前:デフォルトの名無しさん mailto:sage [2013/09/30(月) 17:14:26.45 .net]
どうやらこのスレの住人は5人+1人のようです。

360 名前:デフォルトの名無しさん mailto:sage [2013/09/30(月) 18:39:30.69 .net]
why?



361 名前:デフォルトの名無しさん [2013/09/30(月) 19:02:26.98 .net]
それはきっと誤認

362 名前:デフォルトの名無しさん mailto:sage [2013/09/30(月) 19:44:52.52 .net]
いや六人だろ

363 名前:デフォルトの名無しさん mailto:sage [2013/10/01(火) 07:46:21.47 .net]
10月ですね

364 名前: 【大吉】 mailto:sage [2013/10/01(火) 08:08:36.28 .net]
もう今年も僅かですね

365 名前:デフォルトの名無しさん mailto:sage [2013/10/01(火) 08:34:07.82 .net]
あと11月と12月しか残ってないなんて!

366 名前:デフォルトの名無しさん mailto:sage [2013/10/06(日) 11:59:55.05 .net]
てす


367 名前:デフォルトの名無しさん mailto:sage [2013/10/10(木) 22:28:23.40 .net]
『歴博』No.180 けっこうおもしろかった

368 名前:デフォルトの名無しさん mailto:sage [2013/10/10(木) 22:36:55.30 .net]
ここは基地外安岡信者が教祖を持ち上げるスレですね。
安岡用語でレスしないで下さい。

369 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 10:24:30.38 .net]
基地外TRON信者はOS板に帰れ

370 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 12:30:47.63 .net]
>>363のように安岡の取り巻きしか理解できない
レスをする方が基地外ではないかと



371 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 12:33:53.50 .net]
数日ぶりに書き込みがあったと思えばいきなり争いごとか

372 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 13:53:42.69 .net]
『歴博』No.180 [特集]文字とコンピュータ2013〜文字コードは踊る〜
> 鈴木卓治:文字とコンピュータと人間と 
> 安岡孝一:日本の文字コードの半世紀−国際社会との軋轢を越えて−
> 小形克宏:Windows外字と、その互換性をめぐる争い
> 川幡太一:異体字とIVS (異体字シーケンス)
> 上地宏一:グリフウィキ−あらゆる漢字・異体字を集積・共有する文字字形データベース
> 高田智和:コンピュータで書き表せる地名漢字
> 狩野宏樹:(インタビュー)フォントとIVS〜フォントベンダーの立場から〜

373 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 13:57:13.42 .net]
>>368
安岡の取り巻きしかいないだろ

374 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 18:24:19.95 .net]
単なる文字コード特集に見える

375 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 21:55:32.62 .net]
>>368
www.book61.co.jp/book.php/N07886
これか。定価560円ってのは、高いのか安いのか。

376 名前:デフォルトの名無しさん mailto:sage [2013/10/11(金) 22:08:25.63 .net]
>Windows外字と、その互換性をめぐる争い
丸数字とか時計文字とか?

377 名前:デフォルトの名無しさん mailto:sage [2013/10/12(土) 12:21:44.57 .net]
>>372
「@」とか「_」とか「」とか「~」とか

378 名前:デフォルトの名無しさん mailto:sage [2013/10/12(土) 12:24:00.80 .net]
@
JISでシフトJISに定義された文字がどうかしましたか?

379 名前:デフォルトの名無しさん mailto:sage [2013/10/12(土) 20:16:36.94 .net]
(´‥∀‥`)?

380 名前:デフォルトの名無しさん mailto:sage [2013/10/13(日) 00:59:36.46 .net]
3点リーダやダーシには、いまだに悩まされてるわ



381 名前:デフォルトの名無しさん mailto:sage [2013/10/13(日) 01:23:39.24 .net]
薄そう
www.rekishin.or.jp/rekihaku180mokuzi.jpg

382 名前:デフォルトの名無しさん mailto:sage [2013/10/13(日) 03:29:03.11 .net]
判ってないな
バベルの塔の逸話は
争ってないで協力しろって意味だよ

383 名前:デフォルトの名無しさん mailto:sage [2013/10/13(日) 04:20:47.49 .net]
できる人がしてください。奴隷は言いなりです。

384 名前:デフォルトの名無しさん mailto:sage [2013/10/15(火) 21:24:01.50 .net]
さて、台風が来るわけだが

385 名前:デフォルトの名無しさん mailto:sage [2013/10/15(火) 22:48:23.76 .net]
買ってきたコロッケをコード番号順に並べ換えてみようか。
ここは雑談スレじゃねえよ>俺

386 名前:デフォルトの名無しさん mailto:sage [2013/10/16(水) 19:35:44.13 .net]
さて、台風が行ってしまったわけだが

387 名前:デフォルトの名無しさん mailto:sage [2013/10/16(水) 23:58:48.34 .net]
Unicode6.3リリースされたけど誰も話題にしないね。

388 名前:デフォルトの名無しさん mailto:sage [2013/10/17(木) 00:18:02.40 .net]
何だっけ?

389 名前:デフォルトの名無しさん [2013/10/17(木) 00:32:13.34 .net]
んー、7.0.0が出たらネタも沢山あるが...

390 名前:デフォルトの名無しさん mailto:sage [2013/10/17(木) 22:06:30.58 .net]
文字の追加は6.2の時みたいにかなり少ないけどStandardized Variantsに互換漢字に対応するのが追加されたんだっけ。



391 名前:デフォルトの名無しさん mailto:sage [2013/10/17(木) 22:30:34.91 .net]
ああ、例のやつか

392 名前:デフォルトの名無しさん mailto:sage [2013/10/18(金) 23:50:33.84 .net]
ただでさえAdobe-Japan1と汎用電子でVSが分けられて問題になってるのにさらに混乱をもたらす事になりそうだ。
例えば「海」の旧字体はこれまでの6D77 E0100(Adobe-Japan1)と6D77 E0103(汎用電子)で表せてたが、更に互換漢字FA45の置換として6D77 FE00が追加されて異体字シーケンスが3通りになってしまったんだな。

あと「あれ?漢字の場合BMPのVSは使わないんじゃなかったっけ?」って言う人に対してちょっと面倒な説明をしないといけなくなったな。

393 名前:デフォルトの名無しさん mailto:sage [2013/10/19(土) 05:48:51.52 .net]
互換漢字はラウンドトリップ用というのが建前だから
新規文書では使わないのが正解
汎用電子もフォントがIPAmjと花園くらいしかないから消去法でAJ1

394 名前:デフォルトの名無しさん mailto:sage [2013/10/19(土) 23:57:56.88 .net]
字体差でなく韓国のKS X 1001の発音の違いによって分離されてる字や台湾のBig5の誤って重複収録された字に対応する互換漢字にまで割り当てられたんだな。

395 名前:デフォルトの名無しさん mailto:sage [2013/10/20(日) 01:36:27.33 .net]
まるで手書きの戸籍簿のようだ

396 名前:デフォルトの名無しさん [2013/10/20(日) 08:57:42.32 .net]
OS Xって >>96 みたいなことをできるテキストレンダリングAPIが標準でついてるの?
組版ソフトつかっても、フォントに合わせて手動で設定しないといけないことがままあるのに、どうやってやってるのか気になるわ。
これが本当ならmac買いにいく。

397 名前:デフォルトの名無しさん mailto:sage [2013/10/20(日) 10:48:41.05 .net]
組版ソフトは何を使ってる?

398 名前:デフォルトの名無しさん [2013/10/20(日) 21:07:21.25 .net]
>>392=>>96か?
それとも基地外が基地外に反応したのか?

399 名前:デフォルトの名無しさん mailto:sage [2013/10/21(月) 10:02:49.98 .net]
文字コードに対して幅とかマージンが決められてないんだから、スレ違いだろ。
まあ、そもそもフォントとOSで対応できるとか言ったやつが悪いんだけどな。
文字コード的には他のエンコードとの変換のためのコードは使わない。ということは選択肢は1つしかない。
文字コードは文字列の全体的な見た目まで定義してない。仮にmacできれいに表示されたとしてもそれはたまたまってこと。

400 名前:デフォルトの名無しさん mailto:sage [2013/10/21(月) 12:37:25.80 .net]
互換性を考えない、一人で完結ならそれでもいいんじゃない



401 名前:デフォルトの名無しさん mailto:sage [2013/10/22(火) 13:16:40.56 .net]
キャラクターとグリフを分けて考えるようになってからややこしくなってきたよな。
「異体字なのか」「同じ字の字形の違い」なのかとかいろいろ

402 名前:デフォルトの名無しさん [2013/10/22(火) 16:10:09.10 .net]
できる事が増えた。特にUnicodeの異体字は処理が簡単。

403 名前:デフォルトの名無しさん mailto:sage [2013/10/22(火) 16:23:09.07 .net]
Unicodeの場合、なし崩し的にどんどん包摂の範囲が狭くなっていってるから初期のものとの整合性がぐちゃぐちゃで

404 名前:デフォルトの名無しさん [2013/10/22(火) 16:27:12.06 .net]
まあその辺は6以降で。

405 名前:デフォルトの名無しさん mailto:sage [2013/10/22(火) 17:01:02.23 .net]
まあ「文字グリフ分離」はここ数年間での文字コードとフォントの進化の頂点だよな。
あとは包摂の範囲や粒度、字形の問題とか規格で決めることをどう決着つけるのかと
フォントベンダーがちゃんとしたものを手抜きしないで作ってくれるかだよな。

406 名前:デフォルトの名無しさん mailto:sage [2013/10/22(火) 17:03:02.82 .net]
ユーザー次第だと思うね。
メーカーがちゃんとコスト掛けてるものについて、それをちゃんと評価し、使うかどうか。

407 名前:デフォルトの名無しさん mailto:sage [2013/10/22(火) 17:05:46.86 .net]
そうだね、凄い手間とお金がかかっているからね。

408 名前:デフォルトの名無しさん mailto:sage [2013/10/26(土) 02:43:56.58 .net]
フォントのグリフ集合に関してはAJ1の一人勝ちになってるから
その辺Adobe次第なのよね

409 名前:デフォルトの名無しさん mailto:sage [2013/10/27(日) 23:12:43.53 .net]
>>395
スペースを始めとして、半角、全角や幅ゼロやそれ以外の幅の文字もあるよ
ja.wikipedia.org/wiki/Unicode%E6%96%87%E5%AD%97%E3%81%AE%E3%83%9E%E3%83%83%E3%83%94%E3%83%B3%E3%82%B0#.E3.81.9D.E3.81.AE.E4.BB.96.E3.81.AE.E7.89.B9.E6.AE.8A.E7.94.A8.E9.80.94.E6.96.87.E5.AD.97

410 名前:デフォルトの名無しさん mailto:sage [2013/10/28(月) 06:01:33.32 .net]
よくわからんけど、silフォントみたいなやつ?



411 名前:デフォルトの名無しさん mailto:sage [2013/10/29(火) 00:31:26.29 .net]
>>405
で、その幅っていうのは具体的にどれだけなんだい?

412 名前:デフォルトの名無しさん mailto:sage [2013/10/29(火) 00:36:08.36 .net]
等幅フォントを使って
スペース文字で文字間を調節するって
活版印刷みたいだな。

413 名前:デフォルトの名無しさん mailto:sage [2013/10/29(火) 07:12:24.68 .net]
ところで入札までした変体仮名グリフはどこへ行ったんだ

414 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 17:42:06.45 .net]
いわれてみれば

415 名前:デフォルトの名無しさん [2013/10/30(水) 17:49:35.04 .net]
ローマ字で長音はサーカムフレックス付けるのに
なんでJISに全角の「サーカムフレックス付O(オー)」が無いんだ?

416 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 18:39:25.87 .net]
そこでいうJISって何?

417 名前:411 mailto:sage [2013/10/30(水) 18:54:48.92 .net]
文字集合JIS X 0208のことです。

418 名前:411 mailto:sage [2013/10/30(水) 19:04:54.16 .net]
文字コードにそれほど詳しいわけではないのですが
どの日本語文字エンコーディングでも「サーカムフレックス付O(オー)」は保存できません。
そもそも文字集合のなかに無いのでしょうか?

ローマ字も日本語なのに無いのは変だと思うんですよね。
ギリシャ文字やキリル文字はあるのに。

419 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 19:14:42.08 .net]
ユニコードにはあるけど。

420 名前:411 mailto:sage [2013/10/30(水) 19:23:32.84 .net]
ユニコード環境なら使えるのは知っています。
大文字と小文字の2文字を追加するだけで良いのになんで日本語の文字集合に入れなかったんでしょうか?
漢字の異体字みたいに青天井化する恐れも無かったのに。



421 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 19:30:02.53 .net]
ちょっとごめん。サーカムフレックスって「^」ですよね?
ローマ字だとマクロンじゃないですか?

422 名前:411 mailto:sage [2013/10/30(水) 19:45:41.02 .net]
交通機関や民間では地名人名にヘボン式ローマ字でマクロンが使われることがありますが

正式な日本語のラテン文字転記である訓令式ではサーカムフレックスが使われます。

>1947年(昭和22年)の文部省通達[17](訓令式とヘボン式の両方を解説していた)ではサーカムフレックスとアポストロフィを使うとしており、
1937年(昭和12年)の内閣訓令が事務的な手違いで誤っていたと言われているが、昭和20年代の教育現場(小学校4〜6年生)ではどちらでも良いと教えるように文部省が指導していた。


例:市の公文書でサーカムフレックス付きオーが使われています。
www.city.nagaoka.niigata.jp/dpage/kokubun/chikyuhiroba/konnichiwa/newsletter/Vol.252.pdf

423 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 20:04:24.94 .net]
歳がバレただけか。言わなきゃよかった

424 名前:デフォルトの名無しさん [2013/10/30(水) 21:30:42.70 .net]
JISに「合成用丸」があることからも分かるように、
アクセント記号は合成でなんとかするつもりだったんだろうよ。

425 名前:デフォルトの名無しさん [2013/10/30(水) 21:32:09.65 .net]
今は合成用丸という名前じゃなくなってるのか…

426 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 21:43:15.81 .net]
◯囲い文字は青天井化しそうだから合成するのは合理的かもしれないけど
ローマ字で長音は母音だけだよ。AIUEOaiueoそれぞれにマクロン付きとサーカムフレックス付きを入れても20文字だけじゃん。
なんで入れなかったんだろうね。

427 名前:デフォルトの名無しさん mailto:sage [2013/10/30(水) 21:51:09.94 .net]
JIS X 0213に入ってるんだからええやん

428 名前:411 mailto:sage [2013/10/30(水) 23:01:56.66 .net]
それもそうですね。

429 名前:デフォルトの名無しさん mailto:sage [2013/10/31(木) 04:21:14.96 .net]
昔は「漢字コード」って言ってたくらいだから
みんな非漢字部分にはあまり意識を払ってなかったのかもね

430 名前:デフォルトの名無しさん [2013/10/31(木) 12:21:54.63 .net]
日本人はローマ字なんて殆ど使ってないしなあ。

0208や0212の頃は、漢字でさえまだあれやこれが足りないって議論が盛んにあった頃で、
ローマ字の長音表記に使う長音記号付きの母音字なんてどうでも良かったんじゃない?
変体仮名や西欧のアクセント記号付きアルファベットの方がまだ需要があったんじゃないかと。

和言葉には長音字はないから国語屋も興味薄そう。



431 名前:デフォルトの名無しさん mailto:sage [2013/10/31(木) 23:44:32.72 .net]
これらのカタカナをユニコードに入れてほしい。
一時期存在したわけだし、入れる資格はあると思う。

ヤ行イ - Wikipedia
ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A4

ヤ行エ - Wikipedia
ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A8

わ行う - Wikipedia
ja.wikipedia.org/wiki/%E3%82%8F%E8%A1%8C%E3%81%86

そうすれば
ear 耳 イアー
year 年 ⊥アー (似た記号で代用)
を区別できるのにね。

韓国のわけのわからない試作ハングルよりは実用価値はあると思う。

432 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 00:00:51.79 .net]
一定の用例があれば符号化される可能性はあるだろうけど
五十音図だけだと厳しい気がする。文を綴った例がないと

433 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 00:37:49.21 .net]
既に入ってる「江」「衣」が有効活用されてるかといえばされてないのよね。
やっぱり、文字コードに入るだけじゃなくて主要な環境でデフォルトで表示できて、入力も出来るというのが普及の最低ラインになるんじゃなかろうか。

434 名前:デフォルトの名無しさん [2013/11/01(金) 00:52:02.50 .net]
> 普及の最低ライン

何の話だ?

435 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 01:12:42.55 .net]
金属活字の活版印刷の時代にそれらのカナの活字が造られて使われていたかどうかが大きかったのかも。

436 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 01:27:53.75 .net]
フォント屋向けにUnicodeの日本語用サブセットみたいなのが必要なんだろうな
今だとAJ1がそれに近いか

437 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 01:45:50.33 .net]
どのフォントでも対応するレベルの現実的な規模のサブセットは0213なんだろうな。
だからそこから外れてるKana Supplementはほったらかされる。

438 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 01:56:41.54 .net]
JIS X 0213もAdobe-Japan1も最後に改訂されたのは9年前だっけ
後者は汎用電子がトリガーになって1-7が来るかなと思ったもんだけど

439 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 02:42:50.59 .net]
JIS X 0213は今後もサブセット集合として存在意義があると思う。Shift-JIS200Xとかはお笑い種になっちゃったけど

440 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 02:44:49.61 .net]
そうだね
JIS信者 安岡信者の心のより所として必要だね



441 名前:デフォルトの名無しさん [2013/11/01(金) 12:22:17.42 .net]
>>435
JIS X 0213なんて意義はもうほぼないだろw
文字コード屋以外には。
世間では既にUnicode+Adobe-Japan1で廻ってる。

442 名前:デフォルトの名無しさん [2013/11/01(金) 12:23:29.58 .net]
> Adobe-Japan1
< Adobe-Japan1フォント

443 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 13:24:11.90 .net]
JavaScriptにようやく正規化とサロゲートペアのメソッドが入るみたいで安心

444 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 15:38:04.53 .net]
>>436 TRON信者は電波お花畑板という適切な板に行ってください

445 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 16:51:12.98 .net]
>>439
Unicodeすらまともにサポートしてなかったのか

446 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 19:49:26.19 .net]
Adobe-Japan1フォントは、欧文がダメだからなー

447 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:50:40.29 .net]
JavaScriptは仕様を巡る争いで数年無駄にしたからなあ

448 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:55:49.16 .net]
仕様を巡る争いなんてないよ。
そもそもネットスケープの独自言語だったわけだし。

単に標準化委員会が、XHTMLなんかはやらせようとしてて
JavaScirptに見向きもしなかっただけ。

標準化委員会が最低限のDOM以外なにも決めようとしないので
各ブラウザベンダーは独自で便利な機能を実装していった。
この時代に標準はない。

それに業を煮やしたブラウザベンダーがJavaScriptを
ふんだんに取り入れたHTML5を作り出した。
ここからやっとJavaScriptの仕様の話に入る。

449 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:58:20.53 .net]
ECMAScript 4でググるよろし

450 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 23:23:10.92 .net]
図解雑学文字コードは分かりやすくて良い本なので
2002年以降の動向を追加した改訂版を出してほしい。



451 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 03:46:05.18 .net]
グリフ集合のデファクトを一企業に握られてるというのは
あんまり健全じゃないよな

452 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 12:52:30.79 .net]
Adobeのことかー!!

453 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 23:40:23.63 .net]
Winも8.1でAJ16フォントを採用したもんなー

454 名前:デフォルトの名無しさん mailto:sage [2013/11/03(日) 00:24:53.83 .net]
ん、そうなのか

455 名前:448 mailto:sage [2013/11/03(日) 00:26:29.81 .net]
ノリで言っただけで
>>447がどの企業のことを指していたのかはわからないんだけどね。

456 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 01:31:55.84 .net]
WG2更新されてゅぅ
でも日本に関係あるのは梵字くらいか

457 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 05:30:08.53 .net]
ユニコード戦記の新古書を神田古本まつりでゲット

458 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 21:37:05.50 .net]
安岡信者がこんなところにも
www.mishimaga.com/tonarimachi/26.html

459 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 01:58:32.56 .net]
ここはお前個人の閻魔帳じゃないんだからせめて何が気に入らないのか第三者に伝わるようなレベルで具体的に説明してくれ。

460 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 21:30:15.62 .net]
マジ基地のTRON信者だから、何を言っても無駄です



461 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 23:06:31.14 .net]
安岡センセイも最近はマイナンバーとタイプライターばかりだからな

462 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 23:08:18.62 .net]
安岡は最近は2ちゃんで自分への否定的なレスを見つけては
TRON信者だ!とか騒ぐだけ

463 名前:デフォルトの名無しさん mailto:sage [2013/11/07(木) 01:44:24.77 .net]
良くも悪くも特別視することないと思うけど
別にJSC2の委員ってわけでもないし>>11

464 名前:デフォルトの名無しさん mailto:sage [2013/11/07(木) 11:36:23.41 .net]
タイプライターの件で必死に噛みついてた狂信的坂村信者以外に、
安岡氏のやることなすことケチつける奴なんて考えられんw

465 名前:デフォルトの名無しさん [2013/11/07(木) 23:26:55.37 .net]
>>445
4で数年も無駄にしてない。

466 名前:デフォルトの名無しさん mailto:sage [2013/11/08(金) 02:07:42.03 .net]
ルーブル記号が決まったらUnicode 7.0の前に6.4が来るかな…

467 名前:デフォルトの名無しさん mailto:sage [2013/11/10(日) 03:44:23.37 .net]
>>459
1997からJIS委員対反JISの戦いなんてないしな。
文句ある奴は意見出せって流れになったので。

争点としては残った包摂基準の良し悪しについても、今はIVSがあるし。

争点がほとんどないのがこのスレの伸びにも現れてる。

468 名前:フ名無しさん [2013/11/10(日) 20:44:11.17 .net]
ITU定義の電話ボタンの*(star)と#(square)が、それぞれ、
U+26B9 SEXTILE
U+2317 VIEWDATA SQUARE
に包摂される模様。
std.dkuug.dk/JTC1/SC2/WG2/docs/n4495.pdf

469 名前:デフォルトの名無しさん mailto:sage [2013/11/10(日) 20:56:57.81 .net]
しめす偏の「ネ」の字形も「示」の字形差も包摂しちゃって書体のデザイン差にしてしまえば良いのだ。

470 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 02:12:34.24 .net]
>>464
いいから、その埃だらけの画像はやめてくれw



471 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 11:37:46.13 .net]
>>464
一昨年の話↓が、やっと決着するのか
slashdot.jp/~yasuoka/journal/537609

472 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 12:37:38.51 .net]
なんと、そんな経緯が

473 名前:デフォルトの名無しさん [2013/11/11(月) 16:06:38.67 .net]
電電公社

474 名前:のプッシュホンの#も
a/bが凄く小さかったり、
αが90度じゃないがあるんだな。

よく見ると目の前の内線電話も#だけ傾いてるな。
[]
[ここ壊れてます]

475 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 18:01:36.75 .net]
経緯を無視して特定の時期のデザインを基準にしちゃうのもなんだけど
今更☆と◇には戻せないしなあ。

476 名前:デフォルトの名無しさん [2013/11/11(月) 18:06:53.31 .net]
IVSで好きな字形選べるしなw

477 名前:デフォルトの名無しさん [2013/11/13(水) 03:05:02.46 .net]
>>167
半年ROMったがお前がクズだということがわかった
とっとと死ね

478 名前:デフォルトの名無しさん [2013/11/13(水) 03:08:05.71 .net]
半年ROMれとか何様だよこの老害
まじむかついてきた
くたばれ

479 名前:デフォルトの名無しさん mailto:sage [2013/11/13(水) 08:58:17.34 .net]
すべったか

480 名前:デフォルトの名無しさん mailto:sage [2013/11/13(水) 09:48:01.75 .net]
>>473
半万年ROMれ



481 名前:デフォルトの名無しさん [2013/11/14(木) 21:09:00.74 .net]
>>464
ITU-T E.161だな。
>>469
推奨値にすぎないが、斜めになるとa/bが0.18になる。
a/bが大きいのに90度なのは、推奨ではない独自のシェイプということになる。
www.itu.int/rec/T-REC-E.161-200102-I/en
ISOだと、ISO/IEC 9995-8。

どうしてa/b、90度を標準的なグリフに変更するように求めているんだろう。

482 名前:デフォルトの名無しさん [2013/11/14(木) 21:17:49.28 .net]
ところでISO/IEC 9995-10に関する提案も出ているんだけど、
std.dkuug.dk/jtc1/sc2/wg2/docs/n4464.pdf
std.dkuug.dk/jtc1/sc2/wg2/docs/n4444.pdf
を見るとびっくりするような記号までキーボードに関連付けられているのだけど。

ドイツ人は、コンマ付きのアポストロフィとか、
ダブルレフトアングルとか、比のスラッシュとか、割り算のスラッシュとか、
いちいちキーボードのキーに割り当てていたんだね。

483 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:26:41.19 .net]
来週からIRGだってのにあまりドキュメントがポストされませんな

484 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:51:44.80 .net]
U+26B9 ⚹
U+2317 ⌗

485 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:59:48.74 .net]
これらを含む日本語フォントがどれだけあるやら

486 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 01:19:13.46 .net]
SEXTILEはWebページならスタイルシートでアスタリスクを90度回転させればいいな。

487 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 01:25:46.20 .net]
いや、見た目だけでいいなら画像貼ればいいんじゃねと思う。
アスタリスクは回転させてもアスタリスクだし、なんとも中途半端じゃないかね。

488 名前:デフォルトの名無しさん [2013/11/15(金) 01:27:10.30 .net]
じゃあ×もいらないな。+を45度(ry

489 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 02:11:51.46 .net]
今はWebFontで特定の文字だけ好きな埋め込みフォントで表示させられる時代ですよ奥さん

490 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 05:13:40.26 .net]
盲人用読み上げソフトや
全文検索エンジンが困るだろう。



491 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 13:44:23.53 .net]
現段階じゃ実質的にWebFontってフォントを自作できる人にしか活用できん罠

492 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 01:04:14.26 .net]
○度回転させる制御文字をUnicodeで定義しておけばいいんじゃね?

493 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 01:19:07.60 .net]
IRGN1959<AJ1・汎用電子に続く第3のIVDを登録するよ!
だって

494 名前:デフォルトの名無しさん [2013/11/16(土) 18:09:38.96 .net]
IPAの文字情報基盤か。
appsrv.cse.cuhk.edu.hk/~irg/irg/irg41/IRGN1959_Japan_Activity.doc

495 名前:デフォルトの名無しさん [2013/11/16(土) 18:44:41.16 .net]
なんや!

496 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 19:15:02.84 .net]
ラニマル文字

497 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 21:30:45.57 .net]
>>489の母体はこれかな
ttp://mojikiban.ipa.go.jp/

498 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 23:52:46.10 .net]
議事録面白い
変体仮名の検討つづいてたんだ

499 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 01:23:43.73 .net]
なんの議事録?

500 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 02:05:15.96 .net]
492の委員会活動状況ってところ
何をどう符号化するかみたいな話がのってる



501 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 03:12:57.30 .net]
変体仮名ってどんだけ使用実績あるの?
戸籍統一文字と相互変換することなんてありえないし。
またゴリ押しして複雑化するのだけはやめて欲しい。

502 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 11:17:00.18 .net]
またというのは?

503 名前:デフォルトの名無しさん [2013/11/17(日) 11:52:59.91 .net]
変体仮名は和歌の世界では日常茶飯時で当然活字もある。

504 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 15:58:49.35 .net]
古典を電子化するために必要ってことだよね。
でも変体仮名ってゴシック体とか明朝体の活字が使われる頃には既に使われなくなっていたから
楷書体の字形しか無いよな?
ゴシック体の変体仮名ってマヌケそう。

505 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 18:52:14.42 .net]
散々言われ尽くしたことを何故いまさら

506 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 01:20:17.70 .net]
>>500
結論出たならいいけどさ
登録するなら必要な話でしょ。
手書き限定ならそもそも活字化出来ない→誰も実装しない→登録する必要性なし
って判断されるかもよ。

507 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 01:21:25.80 .net]
>>498
活字なんてあったっけ?

508 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 02:12:31.08 .net]
行政で必要なものだけ符号化すりゃいいんだよ的な話になってるのは気になるけど
どのみち於可古志八みたいな有名どころは入ることになるか

509 名前:デフォルトの名無しさん [2013/11/18(月) 11:47:29.93 .net]
>>502
当然あった。例えば「築地活文舎 変体仮名」でググれ。
基本的なことも知らないのだから活字には無知だろうに、
どうして「あったっけ?」なんていい方が出来るのか...

510 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 18:52:54.82 .net]
この会社ならいい感じの変体仮名のフォント作れそうだな。
fontworks.co.jp/font/tsukushi/tsukushiboldmin/R.html



511 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 22:20:12.19 .net]
そもそも常識的に考えて「変体仮名の活字はなかった」なんておかしいだろ

512 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 23:35:43.62 .net]
弘道軒清朝体が出てきて懐かしくなった

513 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 16:23:32.63 .net]
>>4-6
UTF-8に統一しろよって言いに来たけどテンプレ読んで頭が下がりました。
すいませんでした。

514 名前:デフォルトの名無しさん [2013/11/19(火) 16:51:04.04 .net]
>>4
>・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?

テキストVRAMに書き込むのは、BIOSかコマンドの仕事。
直接書き込みたければコマンドが自分で変換する必要がある。
ちなみに1byteごとに色等の修飾属性1byteがつくから、漢字は4byte。

515 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:02:59.00 .net]
98のbiosは文字描画無いんじゃなかったっけ?

516 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:19:25.06 .net]
そもそもMS-DOSはShift_JISじゃないし。
>>4の様な安岡信者は相変わらず気が触れているな。

517 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:25:22.58 .net]
学参明朝などという八百長書体のせいで
字形の違いとデザイン差の問題がでたらめになってしまった。

学参明朝を撲滅せよ!

518 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 02:36:10.18 .net]
>>511
安岡のおっちゃんもCP932とShift_JISくらい区別ついてるよ

519 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 12:01:24.92 .net]
安岡はCP932とShift_JISの区別は付いているけど
シフトJISとShift_JISの違いがついていなくて
Shift_JISを妄信しているから困る

520 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 18:16:02.66 .net]
意味のわかんないことを一人で必死に連投してるのは何?



521 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 18:52:26.42 .net]
勉強してきて、どうぞ

522 名前:デフォルトの名無しさん [2013/11/21(木) 10:41:36.55 .net]
「シフトJIS」なんて厳密な定義ない。>>514は馬鹿。

523 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 10:44:02.10 .net]
厳密な定義のない広義のシフトJISとShift_JISとが
区別できてないってことだろ

524 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 13:53:21.11 .net]
slashdot.jp/~yasuoka/journal/334730
↑この話な

525 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 16:13:00.62 .net]
MS-DOS全盛の時代にWindows-31Jがあったとは思えないんだが

526 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 16:49:54.99 .net]
>>519
これ読むと


527 名前:誤解されてる方の意味での
「シフトJIS」ってのは
EUCにふさわしい名前だな
[]
[ここ壊れてます]

528 名前:デフォルトの名無しさん [2013/11/21(木) 17:21:16.17 .net]
>>519
これは「シフトJIS」と「Shift_JIS」を混同している(>>514)んじゃなくて、
世間的にASCII+Microsoftが起源と思われている「シフトJIS」が
実は漢字CP/M由来であるという話の中で、
Shift JIS系のコードの総称として「シフトJIS」と言う言葉を使ってるんじゃないのかな?

529 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 19:02:01.88 .net]
>Shift JIS系のコードの総称として「シフトJIS」
というのが世間の認識なんだけど、
安岡氏は代表であるMSのそれを「MS漢字コード」
という別物としてとらえている感があるような

530 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 19:12:37.27 .net]
「完敗」って書いてるじゃん



531 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 03:13:57.39 .net]
>>523
なんか前半と後半で文書繋がってないけど。
・総称をシフトJISと呼ぶことが多い
・CP932を安岡はMS漢字コードと言ってる
・シフトJISにCP932は含まれる
ってだけじゃないの。

で、スラドに書いてあるのはシフトJIS起源はどの会社かって話でしょ。
これに関しては安岡説は間違ってたと当人が認めてる。

532 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 08:31:16.26 .net]
読解力ないな
スラドのテーマは
「誤解されてる方の意味」の

>「Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが
>「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、
>すなわち「シフトJISコード」でした」

を言ったのはどこの会社の誰かソース出せ
ってことだろ

533 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 09:51:05.75 .net]
誤解されてる方
って何だ?

534 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:02:46.92 .net]
「これを読む限りでは」って限定してるじゃん
しかも今じゃ読めないし

535 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:07:18.05 .net]
安岡はともかく>>4あたりがよく分かっていないのは間違いない

536 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:48:58.53 .net]
4がっつーか当時の書き込みがそのまま使われてるだけだろ
www.bookshelf.jp/2ch/tech/1143375639.html

537 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 15:22:40.61 .net]
質問なのですが
CP932のNEC選定IBM拡張漢字と、IBM拡張漢字の領域で
重複している漢字がいくつかありますが
UTF8から変換した時、どちらに変換するのが正しいんでしょうか?

例) \(U+7E8A)

NEC選定IMBだと
0xED40

IBMだと
0xFA5C

538 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 15:37:34.29 .net]
自己解決しました
Wikipedia先生に答えが書いてありました

> 「NEC選定IBM拡張文字」「IBM拡張文字」が重複する場合は、「IBM拡張文字」に統一

ありがとうございました

539 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 00:08:42.45 .net]
ふむ

540 名前:デフォルトの名無しさん mailto:sage [2013/12/11(水) 00:37:39.94 .net]
ほう



541 名前:デフォルトの名無しさん mailto:sage [2013/12/11(水) 03:30:11.10 .net]
へえ

542 名前:デフォルトの名無しさん mailto:sage [2013/12/12(木) 16:23:27.72 .net]
ところでPRI 259は

543 名前:デフォルトの名無しさん mailto:sage [2013/12/12(木) 20:41:09.81 .net]
TwitterでNさんが夜中にキレてたね

544 名前:デフォルトの名無しさん mailto:sage [2013/12/14(土) 00:35:38.20 .net]
文字コードの判定の精度を確かめたいのですが
よく使われているテストセットみたいのってありますか?

545 名前:デフォルトの名無しさん mailto:sage [2013/12/14(土) 00:38:42.17 .net]
>>536
IPAmjフォント専用みたいな感じだから
良くも悪くも一般ユーザーには関係なさそう

546 名前:デフォルトの名無しさん [2013/12/14(土) 01:41:47.13 .net]
>>538
テスト用にサンプル集めてるところだわ
パスはUTF8で
www2.age2.tv/rd2/src/age5249.zip.html
どれもウェブページとかウェブから拾える

KOI7-switched windows-125[2347] IBM-12{61|64|65|68|76} ISO-2022-KR Big5-HKSCS辺りは見つけられてねえ

547 名前:デフォルトの名無しさん [2013/12/15(日) 04:27:51.02 .net]
Encode::Detect::CJK
Unicode::Japanese
CharsetDetector
Lingua::DetectCharset
activeperlで使えるこの4つ総合してもcp1256とkoi8が判別しにくいようだが
ファイル単位でなら80-ff調べれば一目瞭然だね
totalとの差は80-bfの分
cp1256: 0xc0-0xdf:229, 0xe0-0xff:178 total:422
koi8r: 0xc0-0xdf:62356, 0xe0-0xff:976 total:63359.
koi8u: 0xc0-0xdf:6341, 0xe0-0xff:96 total:6455.

Encode::Detect::CJKの判別能力はかなり高い
>>540の不足分(はテストできないのでそれ)以外だと
koi8とcp1256を区別できないのと
big5とiso-2022-cnとcp1251とgb2312とiso-8859-6とiso-8859-11で誤判定がある程度

ちなみに
Encode::First Lingua::ZH::HanDetect Lingua::DetectCyrillic Lingua::RU::Detect Encode::Guess
は使い物にならなかった

548 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:10:20.08 .net]
文字コードの判定の"精度" という言い方が引っかかるんだよなぁ。
なんでかって考えてみたら、品質が良くなれば精度があがるみたいな
ことを思ってしまうからかな?精度が悪いものはダメみたいな。

文字コードの判定っていうのは、仕様なんだよね。
あるバイナリ列があったとき、それがAという文字コード、
Bという文字コードの両方の当てはまることはあるんだよ。
こういうのは「AかBの文字コード」というのが正しい答えになる。

この場合にどちらを答えるかというのは、精度の問題ではなく単に仕様でしかないんだよ。
例えば、日本語にしか対応していないやつなら外国の文字コードに
当てはまる場合でも答えないだろう。これは精度ではなく、外国の文字コードに
対応していないという話。考え方によっては、低機能と言える。

多くの文字コードに対応していればいるほど、判定の精度は低くなる。
というか精度ではなく、対応しているものが多いから、
多くの文字コードに当てはまることを正確に教えてくれる。

だから判別能力が高いとか低いじゃなくて
迷った時は○○コードよりの判定をしてくれるとか、
日本語だけしか対応してないから、外国の文字コード
判定されることはないとか、そういう話にしなきゃ。

549 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:17:37.68 .net]
1文字で調べても意味ないからね。1文字では正しく判定できたとしても
その文字が含まれている2文字、3文字だったら誤判定することもある。

550 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:23:04.91 .net]
> Encode::Detect::CJK
> Unicode::Japanese
> CharsetDetector
> Lingua::DetectCharset
> activeperlで使えるこの4つ総合してもcp1256とkoi8が判別しにくいようだが

こういうのもね。ライブラリの精度の問題じゃないんだよ。

cp1256とkoi8が区別しにくいのは、文字の問題。
同じバイナリ列にかぶってるんでしょ?

区別しにくい(誤判定する)のは文字自体の問題で、
それをどのように判定するのは、ライブラリの癖というか仕様。

Encode::Guess が使いものにならないというのは、
Encode::Guess が日本語以外の多くの文字コードに対応していて、
対応しているもの全てを列挙するからだよ。一番正確。



551 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:30:43.89 .net]
ベイズ推定かな

552 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 00:39:29.90 .net]
>>545
うん、そうそう。そういうこと。

結局のところ、文字で判断している以上
それは精度ではなく仕様という話でしか無い。
複数の文字コードで解釈できるというのは事実でしか無いからね。

精度という話をするのなら、文字ではなく文字列、文章として考え、
それがどの文字コードであれば意味が通る文字列、文章として解釈できるか?
っていう話に持っていかないといけない。

まあその場合の精度も、どんな辞書を使っているかって所が
差が出る一番の要因で、アルゴリズム的なところではあまり差は出ないだろうけど。

文字列、文章で判断するのなら高い精度で判定できるようになるけど
1文字だったら誤判定する確率はやっぱり高いだろうな。
その文字をよく使っている文字コードはどれ?という程度の判断基準になるからね。

553 名前:デフォルトの名無しさん [2013/12/16(月) 05:17:08.56 .net]
Encode::Detect::CJKはデフォでcharset指定見てるからで
判断材料にしないようにするとかなり落ちるな

精度に反論してる奴がいるけどさ
実際はとりあえず選択して試してみる必要があるわけで
実用面ではある程度当たればいいわけだよ

Encode::Guess が全てを列挙するというんだけど
それが本当なら良いけど実際列挙しないしな

554 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 07:44:53.21 .net]
用途にも拠るかね。
100%の精度が必要な自動データ処理系か、
ブラウザやエディタのように人の目で判断して文字コードを修正出来るものか、とか。

555 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 08:04:17.71 .net]
組版ソフトだと設定で勝手に換えてくれちゃったりするから、
他のところに持って行くとぐだぐだ

556 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 10:28:46.12 .net]
Mac Binary 最強ですねわかります

557 名前:デフォルトの名無しさん mailto:sage [2013/12/16(月) 23:45:08.75 .net]
なんでMac Binaryやめたんだろうね。
糞だったのかな?

558 名前:デフォルトの名無しさん [2013/12/16(月) 23:49:11.89 .net]
>>551
意味分かって喋ってる?

559 名前:デフォルトの名無しさん mailto:sage [2013/12/17(火) 01:09:41.50 .net]
>>552
はい、わかっていますが
言いたいことがあるのならどうぞ。

560 名前:デフォルトの名無しさん mailto:sage [2013/12/17(火) 11:33:31.15 .net]
>>553
MacBinaryはtar等と同様の単なるシリアライズフォーマットだが、
どこが文字コードと関係するのかね?



561 名前:デフォルトの名無しさん mailto:sage [2013/12/17(火) 22:20:19.60 .net]
>>554
Macバイナリの話を始めたのは>>550ですよ?
変なことをいいますね。

562 名前:デフォルトの名無しさん [2013/12/17(火) 22:28:06.16 .net]
>>555
意味分かってないじゃん

563 名前:デフォルトの名無しさん mailto:sage [2013/12/17(火) 22:46:14.63 .net]
これ立てたのお前かよ

Apple固有技術のMac Binaryは復活するべきだと思う
anago.2ch.net/test/read.cgi/mac/1387205359/

564 名前:デフォルトの名無しさん mailto:sage [2013/12/23(月) 20:11:46.30 .net]
検索結果にでてきた
https://groups.google.com/d/forum/emoji-working-group

565 名前:デフォルトの名無しさん mailto:sage [2013/12/23(月) 22:37:34.34 .net]
CNETで絵文字コラムをやってたころのかな
あの連載って完結したんだっけか

566 名前:デフォルトの名無しさん mailto:sage [2013/12/24(火) 00:20:14.25 .net]
確かに最終回を見た記憶がない

567 名前:デフォルトの名無しさん mailto:sage [2013/12/24(火) 00:33:36.47 .net]
小形さんの連載の最終回はどれも見たことがないような…

568 名前:デフォルトの名無しさん mailto:sage [2013/12/24(火) 01:21:06.74 .net]
それでも仕事が取れるのか…

569 名前:デフォルトの名無しさん mailto:sage [2013/12/27(金) 18:44:55.17 .net]
某氏が呟いてた葬り去られるフォントって入札のあれかな

570 名前:デフォルトの名無しさん [2013/12/29(日) 07:02:40.09 .net]
カタカナの「ツ」が海外で顔文字になってるの知ってた? - ねとらぼ
nlab.itmedia.co.jp/nl/articles/1312/20/news111.html
2013年12月20日 15時43分



571 名前:デフォルトの名無しさん mailto:sage [2013/12/29(日) 12:37:53.32 .net]
それ聞いたとき、へー日本語使えるんだぁ、と思った。(´・ω・`)も行っちゃえ〜w

572 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 12:16:35.95 .net]
utf-16って一文字で表せる文字と2文字で表せる文字があるらしいじゃないですか?
そういうばあい
char16_t x[2]="一文字で表せない文字"
ってやらないといけないんですか?

573 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 12:27:51.42 .net]
サロゲートペアとか結合文字とかIVSでググれ
もっと面倒だから

574 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 14:19:00.60 .net]
ユニコードの文字って全種類IMEで出せますか?

575 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 15:02:59.62 .net]
無理。
なぜならUnicodeというのはバージョンアップするものだから。
分かりやすく言えば、今も文字は増えている。

直近だと
2010年10月11日  Unicode 6.0.0  109,449文字
2012年1月31日  Unicode 6.1.0  110,181文字
2012年9月26日  Unicode 6.2.0  110,182文字
2013年9月30日  Unicode 6.3.0  110,187文字

更に言うのならIMEでは全種類出す能力はあっても
フォントが用意されていなければ表示されない。
IMEだけの話では解決しない。

576 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 19:07:27.35 .net]
フォントあっても表示系が対応せんといかんし。
複数のフォントを

577 名前:gみ合わせてできるだけ多くの文字に対応したり。 []
[ここ壊れてます]

578 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 20:21:19.41 .net]
お前らなら知っているかもしれないと思って質問するんだけど

多角形(三角形、四角形、五角形 …)
星型多角形(五芒星、六芒星)
はキャラクターも英語名もそんざいするけど

1本(ある意味放射状2本)― |
2本(ある意味放射状4本) + ×
放射状6本(sextile)
en.wikipedia.org/wiki/Sextile
はわかるんだけど

↓この図形を何て呼ぶか(和名、英名)誰か知らないかい?
i.imgur.com/0gPjO4B.gif

579 名前:デフォルトの名無しさん [2013/12/30(月) 22:11:43.70 .net]
分位数と同じでよければ
3ならtertile
5ならquintile

580 名前:デフォルトの名無しさん [2013/12/30(月) 22:17:08.38 .net]
   ∧_ ∧    喰らえ!
  (´∀` )
    (⊃⌒*⌒⊂)
     /__ノ''''ヽ__)



581 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 22:34:45.24 .net]
>>572
うーん、sextileから判断して分位数で表しても、「本当にそう呼ぶのか」が疑問ですよね。

占星術でもquintileは別の記号ですよね。
en.wikipedia.org/wiki/File:Quintile-symbol.svg

ちなみに前述の記号って文字集合にはあるのかな?

582 名前:デフォルトの名無しさん [2013/12/30(月) 23:05:35.40 .net]
Quintileは天文のでっかいボールドQ
en.wikipedia.org/wiki/Wikipedia:WikiProject_Astrology/Glyphs

583 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 23:36:03.83 .net]
だからそういうことじゃなくて
i.imgur.com/0gPjO4B.gif
この記号は何て呼ぶのかな?っていうことなんだけど…

584 名前:デフォルトの名無しさん [2013/12/31(火) 00:42:08.90 .net]
左はsplit decision

585 名前:デフォルトの名無しさん [2013/12/31(火) 01:26:36.37 .net]


586 名前:デフォルトの名無しさん mailto:sage [2013/12/31(火) 10:13:27.57 .net]
文字としては3本のほうはわからないが、5本はアスタリスクのデザイン差と
いうことになってる。Unicodeの例示図形ではU+FE61のsmall asteriskが5本。

587 名前:デフォルトの名無しさん mailto:sage [2013/12/31(火) 11:01:05.49 .net]
確かに5本はよく見かけるな。

588 名前:デフォルトの名無しさん mailto:sage [2013/12/31(火) 14:12:49.32 .net]
5本って鶏の足の形のことか?

589 名前:デフォルトの名無しさん mailto:sage [2014/01/01(水) 02:01:17.54 .net]
にわとりって足指5本もあるの?

590 名前: 【凶】 【512円】 mailto:sage [2014/01/01(水) 02:52:27.08 .net]
アスタリスクを文字ビューアで見ると,フォントによって字形がさまざま。
中には8本のものも。Helveticaは5本,Timesの類は5本だったり6本だったり。



591 名前:デフォルトの名無しさん mailto:sage [2014/01/01(水) 10:11:02.99 .net]
小塚さんも明朝とゴシックで向きが違うのね

592 名前:デフォルトの名無しさん mailto:sage [2014/01/01(水) 14:00:06.51 .net]
あら,ふぉんとだw 安定のヒラギノ

593 名前:デフォルトの名無しさん [2014/01/01(水) 16:47:01.43 .net]
字にはヒラギノール

594 名前:デフォルトの名無しさん mailto:sage [2014/01/01(水) 19:16:15.53 .net]
>>586
くそ、お前が俺の初笑いだわ

595 名前:デフォルトの名無しさん mailto:sage [2014/01/01(水) 20:03:36.29 .net]
みんな同じこと考えてんだな
https://www.google.co.jp/search?q=%E5%AD%97%E3%81%AB%E3%81%AF%E3%83%92%E3%83%A9%E3%82%AE%E3%83%8E%E3%83%BC%E3%83%AB

596 名前:デフォルトの名無しさん mailto:sage [2014/01/04(土) 17:27:58.24 .net]
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?
ttp://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11116062531

597 名前:デフォルトの名無しさん mailto:sage [2014/01/04(土) 19:02:59.06 .net]
裏技コードみたいなものになってるんだな

598 名前:デフォルトの名無しさん mailto:sage [2014/01/04(土) 20:39:41.22 .net]
https://twitter.com/good_dezaiso

599 名前:571 mailto:sage [2014/01/06(月) 21:11:52.76 .net]
結局誰もわからないのかよ…

>>583
欧文書体の世界では
セリフ(明朝体)は6本
サンセリフ(ゴシック体)は5本
が標準のようです。

600 名前:デフォルトの名無しさん mailto:sage [2014/01/06(月) 22:15:37.37 .net]
記号じゃなく図形聞きたいのかね



601 名前:571 mailto:sage [2014/01/06(月) 22:24:24.27 .net]
記号でも図形でも名称があるかどうかが知りたいのですよ。

自分で勝手に名づけても通用しないわけでしょ?

602 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 00:56:31.16 .net]
おれはそもそも詳しくないからあれなんだけど、
たとえ知ってる人がいてもきっと質問意図を測りかねてると思うんだな。

画像の図形を本か何かで見たのならもっと具体的に文脈を明らかにしたほうが助けになると思うし、
あるいは「こういう形の図形って世界のどこかにあるのかなあ?」という素朴な疑問なのか。

603 名前:571 mailto:sage [2014/01/07(火) 01:19:41.54 .net]
質問の意図としては
同じ長さの棒が一点から等角度で4本放射状に棒が出ている「十字」
同じ長さの棒が一点から等角度で6本放射状に棒が出ている「セクスタイル」
があるのだから3本、5本なども記号として存在して名称があるのではないかと思ったのです。
i.imgur.com/0gPjO4B.gif
この図はPohotshopで自分で描いたので引用元の図書などはありません。

604 名前:デフォルトの名無しさん [2014/01/07(火) 01:32:53.53 .net]
お前が勝手に作っただけじゃん
そういうのが混乱のもとになるっていうのが分からないの?

605 名前:571 mailto:sage [2014/01/07(火) 01:41:42.68 .net]
この程度の幾何学図形は創作でもなんでもないだろ。
なんて呼ぶかわからないから検索のしようがなくて自分で描いただけで
俺が描くまでは地球上に存在しなかった図形のわけないじゃん。
誰もわからないのならこのスレではもうやめるよ。

606 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 01:43:46.40 .net]
6本がそれでいいなら>>572でいいんじゃないのか…?
1週間以上前だけどUnicodeの表はどこまでチェックしてみたんだろう…?

607 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 01:58:31.62 .net]
わかってるとは思うけど「6本の図形の名前=セクスタイル」ではなく、
「6本の図形を占星術で使う場合の名前=セクスタイル」。
まったく同じ図形でも使われかたによっては「アスタリスク」にもなるし、そのへんはほんと文脈次第。

すでに出てるように5本のは「アスタリスク」として通用するので答えは「それの名前はアスタリスクだ」でおkなんだけど、たぶん聞きたいのはそういうことじゃないよね?
もしそうなら3本のは「うーん、“ダイムラー”とかでいいんじゃないかな」と答えれば済むんだけど。
www.daimler.com/Projects/c2c/channel/images/762972_1391486_389_328_713349_1290685_389_328_1998M389.jpg

608 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 02:10:59.47 .net]
いやアスタリスクで調べたらわかると思うんだけどなw
十字でいいなら(逆)Y字でもいいと思うけどw

609 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 04:03:19.01 .net]
地図用の記号で「三叉路」でもいいかな

610 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 08:55:07.93 .net]
アスタリスクは small star という意味のギリシャ語由来だから、星に見えれば
なんだってアスタリスクだぞ。5だろうが6だろうが8だろうが。



611 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 10:55:59.05 .net]
>600なら、3 pointed starだけどね。
ただ、ある程度の幅のある図形を想定しているから、5 pointed starはpentagramになっちゃうねぇ。

612 名前:デフォルトの名無しさん [2014/01/07(火) 12:31:26.12 .net]
あまり一般的な図形じゃないから汎用的な名前はないでしょ。
五本はたしか線文字Aにあったはず。
線文字っていうくらいだから太くない。

613 名前:デフォルトの名無しさん mailto:sage [2014/01/07(火) 17:57:31.54 .net]
>>571
さすまた、菊

614 名前:デフォルトの名無しさん mailto:sage [2014/01/08(水) 11:37:42.05 .net]
一人十大木光米

615 名前:デフォルトの名無しさん mailto:sage [2014/01/08(水) 15:55:51.22 .net]
×






616 名前:デフォルトの名無しさん [2014/01/11(土) 21:49:25.01 .net]
detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10117115845

LINEでUnicode相手に送って重くさせた場合犯罪なの?

相手から送ってこいって言われて送ったんだけど

犯罪犯罪ってうるさくて

* ベストアンサーに選ばれた回答

oretyan_0928さん

Unicodeでの攻撃は
電子計算機損壊等業務妨害という
犯罪になります。
5年以下の懲役または
100万円以下の罰金の重罪です。

相手が訴えればの話ですが…

617 名前:デフォルトの名無しさん [2014/01/11(土) 21:51:29.09 .net]
「ユニコードは犯罪だからやめてください」の衝撃
yanok.net/2014/01/post-301.html
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?
detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11116062531

618 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 02:12:51.62 .net]
UNICODEのコードポイントとUTF-8のバイト列の対応表とかってありますか?

619 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 02:32:38.83 .net]
arimasuyo

620 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 09:20:44.18 .net]
>>612
どこにあります?



621 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 00:30:13.05 .net]
ユニコードの攻撃か... ここに新たなユニコード戦記が

622 名前:デフォルトの名無しさん [2014/01/25(土) 22:09:00.99 .net]
>>611
そういうのは Unicode から UTF-8 のコードをどうやって作るかを調べれば自作出来ると思うが。
まあでもそれが分かればそんな対応表作る気なくなると思うなあ。

623 名前:デフォルトの名無しさん [2014/01/25(土) 22:12:46.97 .net]
Wikipedia に書いてあった。要するにビット単位で抜き出して配置してるだけ。
1バイト目の上位ビットを見ると全体が何バイトかが分かる。
ja.wikipedia.org/wiki/UTF-8

624 名前:デフォルトの名無しさん mailto:sage [2014/01/25(土) 22:46:21.43 .net]
C#だったら、
char ch = Convert.ToChar(128); // コードポイント 128の場合
byte[] bytes = Encoding.UTF8.GetBytes(new char[]{ch});
でUTF8のバイト列が得られるな。

625 名前:デフォルトの名無しさん mailto:sage [2014/01/25(土) 22:49:04.37 .net]
ucs2とutf-8のバイト変換ツールをexcel関数で作ったことが有るな。
DEC2BIN関数使って2進数に変換してMID関数でビット毎に取り出して判定して、、というやつ。

626 名前:611 mailto:sage [2014/01/26(日) 09:47:42.77 .net]
ありがとうございます.
勉強のためunicode同士でコード変換するプログラムを作ったのですが
そのテストのために必要でした

627 名前:デフォルトの名無しさん mailto:sage [2014/01/28(火) 02:47:59.92 .net]
西夏文字はようやく符号化提案書の段階までたどり着いたのね

628 名前:デフォルトの名無しさん mailto:sage [2014/01/28(火) 15:39:21.53 .net]
よくわからんがいろいろ大変なんだなあ

629 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 14:39:56.97 .net]
日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
ほとんどのフォントでは、全角括弧はひらがなと漢字と調和するデザインになっており、
半角括弧はいわゆる半角英数字に調和するデザインになっているからだそうです。
文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

前から、いろいろな人に言われてたんですが、フォントが駄目なだけだろと思っていたので、無視していました。
ですが、言い負かすか、言い負かされるかを決断しないといけなくなったのでお願いします。

JISの文字コード規格でも、組版規格でも全角括弧を使え見たいなことは書いてないので、
個人的には全角括弧を使いたくないです。

630 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 15:00:26.97 .net]
そのへんはまだ「コレダ!」という結論が出るほど成熟してない気がするね。

きれいに見える括弧の幅は和文欧文で違うから、フォントが「駄目」とも言い切れないし、
かといってレンダリング側で機械的に和文欧文を判断してグリフを割り振って問題が出ないレベルのものでもないし。

ほんとは全角・半角がそれぞれ「和文用・欧文用」と定義されてれば有無を言わさぬ現実解になったと思うんだけどな。(括弧以外の記号や全角ラテンを含め。)
今後、電子出版が広がるなかで「あれ、これどうすんの?」って改めて注目されて何らかの仕組みが出来ればいいな。



631 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 15:45:09.77 .net]
>>622
半角括弧にこだわっているようだが句読点は気にしていない時点で
ただのあなたのわがままに過ぎないことがわかる。
横書きでは公文書は「,。」(技術文書は「,.」)という指針がある。

そこまで半角括弧にこだわるなら半角カンマと半角ピリオドも使えや。

632 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 15:48:39.76 .net]
括弧は半角がいいよ派と全角だよ派、いやいや半角の外側に半角スペースを入れるよ派の三つ巴だな。

633 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 16:30:13.98 .net]
括弧の中身に合わせるのが見やすいかな
>>622 のように半角英数記号だけの場合は半角括弧使う

634 名前:デフォルトの名無しさん [2014/02/01(土) 16:56:20.99 .net]
出すときに一括置換するだけだろ

635 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 17:24:04.12 .net]
「アプリはアプリケーション(application)の略である。」
みたいな文章があったとして()を半角にするのか全角にするのか

636 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 17:31:08.11 .net]
それなんだよな。一概にはいえない。

637 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:03:32.27 .net]
>>622
>半角括弧はいわゆる半角英数字に調和するデザインになっているからだそうです。
むしろ半角の括弧類は全角文字に「調和しない」と考えたほうがいいでしょう。
ベースラインが異なるからです。(横組みの場合、半角は少し下がって見えませんか?)
太さや位置などを確認するのには、
国国(国)国(国)国[国]国[国]国<国>国<国>国〈国〉国
などを、フォントを変えて見てみるのがいいと思います。

>>628-629
まあ、そうですね。不統一は避けたいですが。

638 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:07:00.71 .net]
確かWikipedia日本語版あたりは「半角も全角も禁止はしないが、全角を半角に修正するのは禁止」みたいなやや全角寄りの微妙なルールがあった気がする。

639 名前:デフォルトの名無しさん [2014/02/01(土) 18:21:42.52 .net]
というより、こいつメンヘラだろ

640 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:31:20.31 .net]
半角カッコを使うときは、
あああ (hoge) みたいに
括弧の前後を空白で開ける。



641 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:34:27.81 .net]
>>633
括弧の中に入るものが1文字とかだとどうするか少し悩む

642 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:43:22.44 .net]
たとえば (i) こんなのか?

643 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:48:17.77 .net]
>文字コードに対して、フォントの字形を定義する規格
それは知らないがJISX0213にはU+0028,U+0029を使えって書いてあるし
JISX4051を参照してもU+0028,U+0029だ
よかったな

644 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:49:16.64 .net]
>>625 半角の外側に半角スペースを入れるよ
絶対にやめてください。

645 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:49:46.43 .net]
>>633
やめてください

646 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:51:17.77 .net]
>>638
お前のレベルまで落ちるつもりはない。
勝手に変なことしていれば良い。

647 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:53:29.54 .net]
トルツメ

648 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:53:35.18 .net]
Wikipediaの表記ガイドに従ったら?
ja.wikipedia.org/wiki/Wikipedia:%E8%A1%A8%E8%A8%98%E3%82%AC%E3%82%A4%E3%83%89

649 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:54:12.12 .net]
Unicodeでは、丸括弧 (……)・波括弧 {……}・角括弧 [……] にはいわゆる半角のもの(JIS X0201で規定されているもの)のほかに、全角形の(……)・{……}・[……]が規定されています。
括弧の中にいわゆる半角の文字だけがある場合は、いわゆる半角の括弧を用います。
括弧の中にいわゆる全角の文字のうち、漢字・仮名・和文記述記号がある場合は、全角形の括弧を用いるべきだという意見と用いないという意見の2つがありますが、目下の合意はありません。
未了 これについては、当ガイドラインのノートで議論されています。
いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。
直前に、ほかの開き括弧類がある。直後に、句読点やほかの閉じ括弧類が続く。
直前や直後に、和文の句読点や和文の括弧類がある。
括弧が固有名詞や型式番号などの一部で、括弧の前や後を空けずに表記される。
段落の始まりや終わり。

650 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:54:59.60 .net]
> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。

なるほど

> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。

うん、なるほど



651 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 18:58:04.76 .net]
括弧の外側にスペースを入れるのって、
ソフトウェアのUIなんかで「アルファベットと和字の間にスペースを入れる」のとかとも絡んでくるのかな。

652 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:00 ]
[ここ壊れてます]

653 名前::58.26 .net mailto: トルツメだな []
[ここ壊れてます]

654 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:01:58.28 .net]
>>644
単なる英文の文化だからだろ?

半角英数字 = 英文
全角英数字 = 日本語


半角 = 英文を使うなら、その文化に従えってだけの話。
英語は単語をスペースで区切ります。言い換えると単語の前後にスペースを入れます。
そして括弧の前後にもスペースを入れます。

655 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:09:28.90 .net]
>半角英数字 = 英文

ちょっと待て誰が決めた

656 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:10:57.03 .net]
やっぱりこの種の話題は宗教戦争化しやすいな。

657 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:11:51.46 .net]
>>647
昔から。

そもそもコンピュータの文字なんてのは
最初アルファベットしかなく。
それは日本ではなく、外国(アメリカだっけ?)で
生まれたものなんだよ。

そのアルファベットというのは当然半角で
その文字は英語のために作られた文字。

658 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:17:49.86 .net]
ローマ字表記は英文じゃない派

659 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:20:32.03 .net]
英文は訂正しよう。

英字

ローマ字も英字

660 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:22:25.16 .net]
>>649
いろいろぐちゃぐちゃすぎワラタ



661 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:24:36.59 .net]


J

662 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:25:19.70 .net]
>>652
反論はなさそうだねw

663 名前:デフォルトの名無しさん [2014/02/01(土) 19:26:34.88 .net]
12 月 31 日みたいにいちいち空白入れるとか馬鹿げてるだろ
こんなものは詰めた方が見やすいし

664 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:26:36.61 .net]
>>646
jisc6220は英語だったのか

665 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:29:18.14 .net]
みんな英字と呼ぶけど、あれはラテン語のものだからラテン語のルールに従うべきだな。

666 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:29:29.09 .net]
コイン(10円硬貨など)3枚

とか開始と終了で全半角での挟まれ方が異なる場合でも
矛盾なくできるならローカルルールで使いわけてもいいんだろうがな

667 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:31:11.58 .net]
>>657
そして漢字は中国式で、算用数字はインド式を要求されるのだ。なんという悪夢。

668 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:32:45.80 .net]
>外国(アメリカだっけ?)

ワラタ

669 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:33:59.26 .net]
>>658
やっぱ一概に「こうするのが正しい!」は無理だよなあ。

670 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:40:59.45 .net]
なに、インド産のくせにアラビア数字と詐称していたのか ゆるせん



671 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:43:16.28 .net]
英でもcharacter(s)みたいな場合にはスペース入れないしねえ。

672 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:44:42.01 .net]
>>662
インド産のものがアラビア数字と呼ばれ、
アラビア産のものがインド数字と呼ばれている悲劇

673 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 19:47:43.49 .net]
>>645
?

674 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 20:13:29.79 .net]
最初の質問は、>>630の言うベースラインのズレがUNICODEとかの
規格で決まっているかどうかじゃないの?
リファレンス字形みたいのを示せば一発では。

675 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 20:26:16.64 .net]
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

質問自体はこれだがunicodeなんかにはそのようなものはないと思う
しかし他の規格に無いとは言い切れない悪魔の証明と化すので
そこへは立ち入らない

676 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 21:18:56.57 .net]
なんで同じ字形で全角と半角との2種類の存在が許されてるの?

677 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 21:20:38.81 .net]
は?

678 名前:デフォルトの名無しさん mailto:sage [2014/02/01(土) 21:58:02.58 .net]
表記の添削希望
toro.2ch.net/test/read.cgi/tech/1390104181/

679 名前:622 mailto:sage [2014/02/02(日) 02:47:48.68 .net]
>>623
どうも、わたしの近辺では全角括弧が和文用、半角括弧が欧文用としてデファクトスタンダードになっているようです。
>>630
MS ゴシックだとベースライン一緒なんですよね。だからあんまり問題にならなかった。
Windows Vista以降のメイリオとかAndroid他を考えると、文字コード規格や組版規格に従えといっても現実的には無理なんですよね。
あと、全角括弧のベースラインをひらがなや漢字に合わせると、全角英数字のベースラインはどうなるんだっていうところも気になります。
>>633
OSの文字列レンダラに渡すとスペースを入れた方が見栄えがいいけれど、
ワープロソフトで入力すると勝手に前後にアキを入れてくれたりして、なかなか共通にしにくいですね。
>>636
これを言ったら、お前はJIS規格のコードじゃなくて、Unicodeを使っているはずだとか言われました。
あと、昔のfjによくいた、現実を無視したキモイつっこみを入れる奴と一緒だなみたいなことを言われました。
まあ、実際そういう性格に近いですが。

680 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 03:24:30.23 .net]
>>622
> 日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
それがUnicodeだろ



681 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 03:38:22.96 .net]
>>672
字形という言い方が正しくなかったかもしれません。すいません。
ある文字が他のある文字と調和する形状・位置であるかどうかを定義する規格と言ったらいいでしょうか。

682 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 04:03:49.23 .net]
それは言語そのものであって繁体字と簡体字の関係あるいは極論アルファベットが全部同根であるようなもの

683 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 04:13:33.39 .net]
>>671
絶対ルールでなく、あなたのコミュニティーのルールに従うのが良いと思います。

684 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 05:00:58.24 .net]
グリフイメージ(字形)
フォントイメージ(実際に表現されたデザイン)
の話を混同している上に
そもそもどちらも文字コードが扱う問題じゃないんだよな。

685 名前:デフォルトの名無しさん [2014/02/02(日) 05:41:00.57 .net]
ああ、言っちまったぁ

686 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 06:27:00.76 .net]
文字のないところに文字コードはないとでも言えばわかるのか

687 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 08:08:17.34 .net]
組版については,
「日本語組版処理の要件」
www.w3.org/TR/jlreq/ja/
を見たらどうでしょうか。
括弧などの約物処理について詳しく書いてあります

688 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 08:52:52.39 .net]
>>679
クラの編集者に見せたい

689 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 09:34:54.11 .net]
>>676
じゃあ、例示字形ってなんなの?

690 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 10:43:50.50 .net]
> じゃあ、例示字形ってなんなの?
例として示す字形に決まってるじゃん。
^^^^^^^^
絶対これにしろ、と決めるものではない。



691 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 14:36:33.41 .net]
>>679
それの元が>>636のJISX4051で結果が>>671なんだし無駄なことだろ

692 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 15:24:48.86 .net]
その文章にルールが必要なら決まりに従う、または、決めればいい
入力は誰しも間違うから verifier を用意すること
間違ったからお前が悪いとかあほなことは言わない

693 名前:デフォルトの名無しさん mailto:sage [2014/02/02(日) 16:32:39.69 .net]
不統一なものを一括処理するスクリプトでも書いておく、と

694 名前:デフォルトの名無しさん mailto:sage [2014/02/03(月) 11:24:18.72 .net]
ああ、それがいい

695 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 00:30:36.47 .net]
二階建てのaとgの文字コードが欲しいよな。
フォントが指定できない環境で一階建てのaとgとの違いを説明するのに必要だから。

696 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 02:03:46.18 .net]
純粋な字形の説明なんて文字コードの守備範囲外だろう。
それやりだすと「下に棒のある1とない1」「上が閉じている4と開いている4」「横棒が1本の\と2本の\」みたいに収拾がつかなくなるぞ。

697 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 05:03:58.19 .net]
「$」の中の棒を2本にしろとか言われるしorz

698 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 06:44:55.07 .net]
どうしてもプレーンテキストでやりたいなら↓これでどうにかなる

_■■■
____■____■■■
_■■■■___■___■
■___■__■___■
■___■__■___■
_■■■____■■■_■

699 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 07:14:45.36 .net]
そもそも、JIS X 0208で英数記号をISO 646と重複符号化したことが問題。
便宜上全角・半角と呼ばれて字形を区別しているフォントが多いが、本来は全角・半角なんて概念は文字コード自体に存在しない。

700 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 08:20:17.20 .net]
半角2バイト文字とか、いや〜ん



701 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 10:23:20.18 .net]
流石にそれは98機種依存だけどなw

702 名前:デフォルトの名無しさん [2014/02/04(火) 21:31:34.29 .net]
>>625
つ mathモードのカッコを好みのサイズに

703 名前:引き伸ばして使う派 []
[ここ壊れてます]

704 名前:デフォルトの名無しさん [2014/02/04(火) 21:32:40.85 .net]
>>628
(applicationが好き)だとどうなるのだろうか?

705 名前:デフォルトの名無しさん [2014/02/04(火) 21:37:40.51 .net]
>>691
けどomicronとかEPWINGみたいな使い方を想定したんでしょ?

706 名前:デフォルトの名無しさん [2014/02/04(火) 21:45:07.81 .net]
一応一階建てのaとgはU+0251とU+0261に符号化されてる。
発音記号用に符号化されてる(特にaについては一階建てか二階建てかで別の発音を表す)がそれ以外の字形の説明等の用途に使ってもいい筈。
でも二階建て専用コードは無いんだな。活字系のフォントではU+0061とU+0067は二階建てであることが多いが。
一部のフォントでは一階建てになってしまうから、厳密に二階建てであることを示さなければいけないときの為に符号化してほしいよな。
VSを使ってU+0061 U+FE00,U+0067 U+FE00とかでもいいから。

707 名前:デフォルトの名無しさん mailto:sage [2014/02/04(火) 21:51:42.38 .net]
二階建てa用のコードポイントがなくても発音記号用途は現状うまくまわってるの?

708 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 00:12:17.20 .net]
「そ」の上が「ソ」と「フ」どっちなのか「き」「さ」「り」繋がっているかとかは割と話題に上るが
「え」「ん」の「〜」部分の山は角なのか丸なのか直前の斜線と一部同化するのか
「ね」「れ」「わ」の「フ」が「|」にかかるのかあたりはあまり聞かないな
漢字だったらさぞ大騒ぎすることだろう

709 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 01:27:02.52 .net]
固有名詞が平仮名で字形が厳密に決められてる例というと、「さいたま」の「さ」(繋がってる字形)ぐらいか。
でも離した字形使って間違ってるから直せと言われたとか怒る人がいるという話しは聞いた事が無い。

710 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 01:39:48.97 .net]
明朝体だと「お」の左下とか「や」の右上も気になる



711 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 03:17:13.10 .net]
>>695
成り行きの改行で閉じの丸括弧を行頭に来させたくないなら、全角で。

712 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 03:28:33.08 .net]
コード表で Unicode ラテン1補助(aとeがくっついてるの<00E6>があるあたり)見てるんだけど、
こんなところに"×"が入ってるんだな。だから○×と並べるの×が小さく見えるの? 関係ない?

713 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 03:38:53.22 .net]
バツではなく掛け算記号だからしょうがない

714 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 03:49:32.08 .net]
まあね。テヘッ

715 名前:デフォルトの名無しさん mailto:sage [2014/02/05(水) 14:07:24.00 .net]
×✕✖

716 名前:デフォルトの名無しさん [2014/02/05(水) 16:23:52.95 .net]
脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

717 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 01:22:07.85 .net]
このサイトの文字コードはほんと悩まされた、何でこんな珍しい文字コード使ってるのかってのない?
基本はShift-jis,euc-jp,utf-8で終わってしまうけど

718 名前:デフォルトの名無しさん [2014/02/06(木) 01:56:44.96 .net]
昔、x-macjapaneseを見た記憶がある。
もうないと思うけど。

719 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 04:16:23.05 .net]
エディタのエンコーディングリストに
「無損失ASCII(Non-lossy ASCII)」ってのがあるんだけど、これなんだろう。

720 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 06:59:18.67 .net]
>>696
規格票読む限りはその意図はない。
JIS X 0208はJIS X 0201のスーパーセットを作ろうとしただけのはず。



721 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 08:03:16.72 .net]
>>711=アスペ

X 0201のAとX 0208のAが重複してるだろ。

722 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 09:48:29.41 .net]
認定厨死ね。

重複は問題じゃない。

確か、ほんとうはちゃんとスーパーセットにするつもりだったのに、
結局スーパーセットになってないのが問題。

723 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 10:21:37.55 .net]
>>708
2chがいまだにutf8化せずにcp932なのがアレ

724 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 13:48:22.87 .net]
他スレに質問したのですが、このスレ見つけたので移動してきました

[\u3000-\u9fff]とは何を意味しているのでしょうか?
u3000はユニコードの全角空白のようですが、
u9fffは分かりません
おそらくユニコードによる漢字の最後の文字じゃないかと思うのですが

725 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 15:10:55.51 .net]
CJK統合漢字
ja.wikipedia.org/wiki/CJK統合漢字

726 名前:デフォルトの名無しさん [2014/02/06(木) 21:28:49.97 .net]
>>711
スーパーセットつくろうとしたなら、
JIS X 0208を単独で使う意図があったんじゃないの?
実際使われていたし。

727 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 21:40:05.37 .net]
mohta氏はそのように運用してはいたけど...

728 名前:デフォルトの名無しさん mailto:sage [2014/02/06(木) 21:45:31.67 .net]
今みたいにプロポーショナルフォント環境が多ければ、あれも違和感無く受け入れられたかも

729 名前:デフォルトの名無しさん [2014/02/06(木) 22:14:17.02 .net]
ISO 2022で言うところの、
G0にJIS X 0208に指示して、GLにG0を呼び出しっぱなしにした
文字エンコードはあちこちで使われていたよ。(G1-3, GRは使わない)
古くはJISコードというのはこういうもののことを言った。
JUNETコードを指す狭い使い方はずっと時代が下ってからの話。

730 名前:デフォルトの名無しさん mailto:sage [2014/02/07(金) 00:27:02.92 .net]
いわゆるKI/KOコード?



731 名前:デフォルトの名無しさん mailto:sage [2014/02/07(金) 04:45:07.67 .net]
>>718
加齢臭のする思い出クソワロタ

732 名前:デフォルトの名無しさん mailto:sage [2014/02/07(金) 10:41:04.89 .net]
ja_JP.UTF-8とUFT-8とは何が違うのですか?

733 名前:デフォルトの名無しさん mailto:sage [2014/02/07(金) 21:23:20.21 .net]
>ja_JP.UTF-8
何ですか?それは

>UFT-8
Unicode規格で定められたテキスト円コーディングのこと

734 名前:デフォルトの名無しさん mailto:sage [2014/02/07(金) 21:52:06.24 .net]
ドル建てで

735 名前:デフォルトの名無しさん [2014/02/07(金) 21:57:57.94 .net]
>>724
>>ja_JP.UTF-8
>何ですか?それは

ANSI C ロケール名です。

language[_territory][. codeset] [@modifier]

736 名前:デフォルトの名無しさん [2014/02/07(金) 23:29:37.63 .net]
>>724

737 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 01:08:20.49 .net]
>>709
x-japmacanese HAHAHA!

738 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 06:12:59.83 .net]
>>726
「ANSI C ロケール名」とは何なのか。
定義を教えて下さい。

739 名前:デフォルトの名無しさん [2014/02/08(土) 11:03:51.90 .net]
書いてあるがな

740 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 12:19:47.04 .net]
なるほど。では改めて。

>UFT-8
Unicode規格で定められたテキスト円コーディングのこと

>ja_JP.UTF-8
>>723が考えた書式の文字列。特に意味はない。



741 名前:デフォルトの名無しさん [2014/02/08(土) 12:54:03.29 .net]
君の頭の中では面白いのか?

742 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 13:00:43.22 .net]
>>723
文字集合とエンコード方式の違い

なぜかOracleだが丁寧に書いてあるからいいだろう
国際化対応言語環境の利用ガイド
docs.oracle.com/cd/E26924_01/html/E27144/glmbx.html

743 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 13:03:11.48 .net]
知らない言葉を見れば分からないといって荒らし
知っている言葉があれば関係ないところでひけらかして暴れる

サウイフモノニ
ワタシハナリタイ

744 名前:デフォルトの名無しさん [2014/02/08(土) 13:06:16.13 .net]
>>733
Sun由来のSolarisドキュメント

745 名前:デフォルトの名無しさん mailto:sage [2014/02/08(土) 15:35:34.13 .net]
特定のソフトウェア製品で使われる
あることを意味する文字列と
一般的な文字コードの名称を一緒にするなってことだろ

746 名前:デフォルトの名無しさん [2014/02/08(土) 15:39:36.12 .net]
ANSI Cロケールと無縁なシステムなんてないだろw

747 名前:デフォルトの名無しさん [2014/02/08(土) 15:46:35.94 .net]
>>731 いつまで嘘垂れ流し続けるんだ

748 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 00:42:57.53 .net]
>>710
Macのやつね。Javaのnative2asciiと同じ形式(完全に同じかはわかんない)

749 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 01:44:36.74 .net]
>>708
ていうか Shift-jisってcp932とは違うと思うんだけど実際には多くのサイトが
cp932の意味で使ってるよね。あと euc-jp にも似たような事情が。

こういうのに悩まされたことが、俺にはありました。

750 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 02:52:50.51 .net]
cp932はShift-jisなので問題ない



751 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 05:29:52.25 .net]
>>739
ごめん言ってみただけなの、なのに、ありがとう。

752 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 12:09:50.75 .net]
CP932はシフトJISだがシフトJISがCP932とは限らない

753 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 12:11:18.01 .net]
CP9ってなんだっけ?

754 名前:デフォルトの名無しさん mailto:sage [2014/02/09(日) 12:18:27.99 .net]
9は存在しない(あるいはすでに廃止されている)ようだ。
www-01.ibm.com/software/globalization/ccsid/ccsid_registered.html

755 名前:デフォルトの名無しさん mailto:sage [2014/02/11(火) 06:33:45.22 .net]
シフトJISだがShift_JISではないということ。

756 名前:デフォルトの名無しさん mailto:sage [2014/02/12(水) 15:59:51.17 .net]
\xe3って何ですか?
調べてみても、あまりよく分からなかったのですが
Unicodeだと思うのですが

757 名前:デフォルトの名無しさん mailto:sage [2014/02/12(水) 16:20:39.29 .net]
それはどこに出てきたの?

758 名前:デフォルトの名無しさん [2014/02/12(水) 17:39:05.51 .net]
Shift-JISのサイトってどっかない?
有名どころがいいんだけど
ニュースサイトとか

759 名前:デフォルトの名無しさん mailto:sage [2014/02/12(水) 18:32:39.71 .net]
2ちゃんねるっていうサイトがShift-JISで有名だよ

760 名前:デフォルトの名無しさん [2014/02/12(水) 18:37:46.88 .net]
なんてこった、文字通り灯台下暗しだな......
でも教えてくれてありがと、助かった



761 名前:デフォルトの名無しさん mailto:sage [2014/02/12(水) 18:52:22.74 .net]
和んだ

762 名前:デフォルトの名無しさん mailto:sage [2014/02/13(木) 06:10:27.65 .net]
>>747
それが出てきた文脈が大事なんだけど…
何かの処理系で非ASCIIをエスケープシーケンスを用いたUnicodeで表記したものじゃないの?
U+00E3ならãを表してる。

763 名前:デフォルトの名無しさん mailto:sage [2014/02/13(木) 15:53:43.39 .net]
正規表現じゃない?

764 名前:デフォルトの名無しさん mailto:sage [2014/02/13(木) 19:42:23.41 .net]
これが入札した変体仮名グリフなのかな
mojikiban.ipa.go.jp/3467.html

765 名前:デフォルトの名無しさん mailto:sage [2014/02/13(木) 19:54:45.85 .net]
togech.jp/2014/02/10/5969

766 名前:デフォルトの名無しさん mailto:sage [2014/02/15(土) 23:52:34.39 .net]
可の符号位置は上の横棒があるのとないのとで2つ必要な気がする

767 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 23:25:58.95 .net]
EUC-JPがASCIIの「拡張」であって「上位互換」でないのはなぜ?
8ビットコードで0X7F以下はASCIIそのものなんだから上位互換でないの?

768 名前:デフォルトの名無しさん [2014/02/24(月) 23:29:14.48 .net]
上位互換でいいんじゃないの。
両方ISO 2022に適合してるわけだし。

769 名前:758 mailto:sage [2014/02/25(火) 00:11:50.69 .net]
PHP使ってる人だとわかると思うんだけど
PHPのhtmlspecialchars()の第3引数にエンコードを指定するんだ
本家のドキュメントにこの関数に与える引数において事実上同等のエンコードが列挙されてるんだが
そこになぜEUC-JPが入ってないのがわからない

770 名前:デフォルトの名無しさん [2014/02/25(火) 00:31:50.61 .net]
PHPとか知らんが、jp1.php.net/htmlspecialcharsを見る限り、
ASCII, ISO-8859-1, UTF-8しか順序関係はないんじゃないの?



771 名前:デフォルトの名無しさん mailto:sage [2014/02/25(火) 00:48:04.45 .net]
いくつか資料を見てもASCIIをそのままま持ってくるようなこと書いてあるけど
ASCIIの0x5cはバックスラッシュだしEUC-JPの0x5cは円記号だよね

772 名前:デフォルトの名無しさん mailto:sage [2014/02/25(火) 01:45:14.76 .net]
>>762
いいえ、バックスラッシュです。

773 名前:758 mailto:sage [2014/02/25(火) 01:50:52.80 .net]
>>761
うーん そうなんですかね
マニュアルにこう書いてあるんだから、意味は深く考えなくていいじゃん 
で解決といえば解決なんですけども

>>762
バックスラッシュです
GL領域はまんまASCIIだったはず

774 名前:デフォルトの名無しさん [2014/02/25(火) 01:55:49.74 .net]
資料疑うなら根拠を書けよw

775 名前:758 mailto:sage [2014/02/25(火) 01:59:52.01 .net]
& ' " < > これらを変換するためのhtmlspecialchars()は関数なんですね
jp1.php.net/htmlspecialcharsに挙げられてる同等に扱われるエンコーディングは
↑の文字をASCIIと同じ符号位置で扱ってるエンコーディングなんです 
符号表的に同じ位置にあるから引数にどれをいれても動作は同等ですよー とドキュメントに書いてる
でもEUC-JPが入ってないのはどうしてなの?これも同じ符号位置に& ' " < >があるはずなのに!ってのが疑問です

776 名前:デフォルトの名無しさん [2014/02/25(火) 02:08:59.64 .net]
マイナーエンコーディングだからじゃないの?
必要ならpatch書いて送ろう。

777 名前:デフォルトの名無しさん mailto:sage [2014/02/25(火) 22:58:26.60 .net]
むかしむかし、ある男がSafariの中の人に
「どうしてSafariはEUC-JPの0x5cを円記号で表示するんだよ! バグじゃね?」
と聞いてみたそうな。
中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」
とのことじゃった。

そうしてそのメジャーなブラウザとSafariでは0x5cが円記号で表示されるのじゃった。
めでたしめでたし

778 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 06:36:12.48 .net]
もう一回言って?

779 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 16:36:12.72 .net]
むかしむかし、ある男がSafariの中の人に
「どうしてSafariはEUC-JPの0x5cを円記号で表示するんだよ! バグじゃね?」
と聞いてみたそうな。

中の人思った「日本ではバックスラッシュは円記号で表示されるだけで同じ文字なんだよ。
これは国とフォントの問題だ。でもこいつバカっぽいから話もてわからないだろうな。
よし馬鹿向けの回答で」

中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」
とのことじゃった。

>>768は納得した。

780 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 17:01:38.49 .net]
結局「当人も馬鹿なのでそうなった」というパターンに見えるがw



781 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 17:13:11.00 .net]
Safariの場合はEUC-JPの0x5CをU+00A5にわざわざ変換する処理によるもの
なのでフォント以前の問題

782 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 17:15:58.03 .net]
中の人思った「でも馬鹿にはその説明は理解できないから」

中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」

>>768は納得した。

783 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 17:21:00.98 .net]
チョイッ \(..*\) (/*..)/ ポイッ

784 名前:デフォルトの名無しさん mailto:sage [2014/03/01(土) 20:24:39.77 .net]
>>770
>日本ではバックスラッシュは円記号で表示されるだけで同じ文字なんだよ。

別に馬鹿による解答はお願いしていませんが

785 名前:デフォルトの名無しさん [2014/03/01(土) 23:34:03.52 .net]
>>770が馬鹿だと納得した。

786 名前:デフォルトの名無しさん mailto:sage [2014/03/02(日) 11:40:45.99 .net]
急にレベル落ちたな

787 名前:デフォルトの名無しさん mailto:sage [2014/03/07(金) 20:55:49.73 .net]
文字コード関連の論文ってどこがメジャーですか?
探しても全然でてこない

788 名前:デフォルトの名無しさん [2014/03/07(金) 21:33:27.70 .net]
>>778

>>3
Unicode Home Page
www.unicode.org/
ISO-IR - 2.8.1 Coding systems with Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm

789 名前:デフォルトの名無しさん mailto:sage [2014/03/07(金) 22:35:48.09 .net]
論文とはちょっと違うような。
文字コード関連で論文書いてると言ったら
kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications.html
が真っ先に思い浮かんだ

790 名前:デフォルトの名無しさん [2014/03/07(金) 22:42:10.26 .net]
UnicodeやISOのTRその他の方が激しい追求を受けると思いますが。



791 名前:デフォルトの名無しさん mailto:sage [2014/03/08(土) 09:20:49.63 .net]
でも上記のリンクはTRじゃないよ
むしろこっちでしょ
std.dkuug.dk/jtc1/sc2/wg2/

792 名前:デフォルトの名無しさん mailto:sage [2014/03/08(土) 09:23:43.86 .net]
っていうか>>3から引用しただけ?

793 名前:デフォルトの名無しさん mailto:sage [2014/03/08(土) 17:39:51.62 .net]
はてさて

794 名前:デフォルトの名無しさん mailto:sage [2014/03/11(火) 23:28:53.24 ID:aGkLZTRR.net]
>>778
文字研究会
https://sites.google.com/site/mojiken/

795 名前:デフォルトの名無しさん mailto:sage [2014/03/11(火) 23:42:26.16 ID:jQzgMrsx.net]
Unicode の EastAsianWidth.txt について、

00C1;N # LATIN CAPITAL LETTER A WITH ACUTE
00E1;A # LATIN SMALL LETTER A WITH ACUTE

のように同じ文字で大文字小文字の違いしか無さそうなのに
幅の扱いが異なるものがあるのですが、
このようなことになっている理由は何でしょうか?

796 名前:デフォルトの名無しさん mailto:sage [2014/03/12(水) 00:19:12.34 ID:i/nwzYk6.net]
一方しか含まれていないコード体系があるとかじゃね
知らんけど

797 名前:デフォルトの名無しさん mailto:sage [2014/03/12(水) 02:11:29.05 ID:qw9ToN7v.net]
そんなのあったっけ?
JIS X 0212から追加されてるみたいだけど

798 名前:デフォルトの名無しさん mailto:sage [2014/03/12(水) 16:49:07.31 ID:eyJxw9l2.net]
なんで文字に番号振るだけなのに
研究とかしてんの?

799 名前:デフォルトの名無しさん mailto:sage [2014/03/12(水) 16:55:22.46 ID:vd/9/rkK.net]
「文字とは何か」という哲学的な命題が背後にあるから

800 名前:デフォルトの名無しさん mailto:sage [2014/03/12(水) 19:11:13.07 ID:qALwfLVq.net]
>>788
日本の0212はSJIS対象外だから無視w
あれはほぼPC,Macの文字コード範囲くらいしか互換対象になってない。
中国のPCで大文字だけ使えたらしい。



801 名前:786 mailto:sage [2014/03/12(水) 22:16:09.94 ID:NZAlFHc5.net]
>>787
調べてみたら、 GB 2312 だと小文字の方しか含まれていないようでした。
ttp://zh.wikipedia.org/wiki/%C3%81

JIS X 0212 などが反映されていない、というのは、
そもそも East Asian Width が古い文字コードとの互換性のためのものなので、
比較的新しい文字コードには対応しない、ということですかね。

うーん、ややこしい。

802 名前:デフォルトの名無しさん mailto:sage [2014/03/16(日) 19:03:10.60 ID:BBT9IZ2o.net]
Unicodeで互換用に残されてるけど使うべきじゃない文字ってどこかにまとまってる?

803 名前:デフォルトの名無しさん mailto:sage [2014/03/20(木) 21:44:45.24 ID:heUDSwye.net]
バベルのページ見てたら
「バベルでの変換は特に明記していない限り MS-Windows の IE をお手本にしています。」
ってあるけどIEの変換方法って公開してるんだっけ?探しても見つからないんだけど

804 名前:デフォルトの名無しさん [2014/03/20(木) 22:12:54.66 ID:N5eLnApK.net]
バベルってのが分からんが、MS純正の文字コードAPIの変換使ってるだけなんじゃないの?

805 名前:デフォルトの名無しさん mailto:sage [2014/03/20(木) 23:08:51.90 ID:heUDSwye.net]
>>795
えっそういうことなの
バベルは>>9のやつです

806 名前:デフォルトの名無しさん mailto:sage [2014/04/01(火) 00:33:15.13 ID:WUOo5w3/.net]
さて

807 名前:デフォルトの名無しさん mailto:sage [2014/04/05(土) 21:32:13.78 ID:RgNzn3fu.net]
cp932 = シフトJIS?
シフトJISっていう名称はどこかに登録されてる?
Shift_JISはIANAで登録されてると思うけど

808 名前:デフォルトの名無しさん mailto:sage [2014/04/05(土) 21:46:04.47 ID:4p3tjfYN.net]
>>798
されていない

809 名前:デフォルトの名無しさん mailto:sage [2014/04/06(日) 08:01:34.90 ID:B8PUb7p+.net]
JISの用語は「シフト符号化表現」だっけ?

あと、正式でない用語は、正確に実装されていないものとか、似たものを総称してとか、
そういうものを表現するために便利に使われている。

810 名前:デフォルトの名無しさん [2014/04/06(日) 15:32:34.79 ID:SoAcTpCI.net]
JIS X 0208:1997ではね。
JIS X 0213:2004移行はShift_JIS-2004だよ。
JIS X 0213で文字増えた文も含むのはShift_JISX0213で。



811 名前:デフォルトの名無しさん mailto:sage [2014/04/06(日) 16:46:46.91 ID:8UGyvOK/.net]
JISのシフトJISなんて当時の世の中の標準を
無視できなくなって遅れて書いただけだろ。
世間で「シフトJIS」と言ったときには
JISのそれを指すことなど安岡信者とその取り巻きを除いて
皆無に近い

812 名前:デフォルトの名無しさん [2014/04/06(日) 17:21:32.69 ID:SoAcTpCI.net]
カッチリした規格があるのは重要。

813 名前:デフォルトの名無しさん mailto:sage [2014/04/06(日) 20:48:52.12 ID:M292oQRa.net]
どの文字コードであれ正解は役所とかで実際に運用されている文字コードが正解になる
つまり何が正しいかの探求は役所への取材から始まる

814 名前:デフォルトの名無しさん [2014/04/06(日) 22:15:42.61 ID:SoAcTpCI.net]
職場の愚痴はマ板行けよ。

815 名前:デフォルトの名無しさん mailto:sage [2014/04/07(月) 06:25:47.71 ID:6r6QSdOH.net]
やなこったw

816 名前:デフォルトの名無しさん mailto:sage [2014/04/07(月) 09:46:47.69 ID:Y1cs/XQ6.net]
経産省は役所じゃないのか

817 名前:デフォルトの名無しさん mailto:sage [2014/04/07(月) 09:49:42.18 ID:Y1cs/XQ6.net]
>>798
Windows-31JだけどIEが対応していないので事実上使えない
Encoding StandardではShift_JIS = cp932 - PUA

818 名前:デフォルトの名無しさん mailto:sage [2014/04/07(月) 11:17:13.52 ID:QoYPH5Yx.net]
ぷあっ

819 名前:デフォルトの名無しさん mailto:sage [2014/04/08(火) 19:37:24.54 ID:pfMGzHK8.net]
大江健三郎もびっくり、あいまいな日本のエンコーディング
もう疲れたからユニコードでいいです。
昨日ウブンツを適当に入れて日本のホームページを見たら
一部の漢字が見慣れない形をしていましたが
そのぐらいのことは我慢します。

820 名前:デフォルトの名無しさん mailto:sage [2014/04/11(金) 23:11:28.88 ID:Zp0BL2uE.net]
slashdot.jp/~yasuoka/journal/579915
安岡センセイ迷走してるみたいだけど結局何が言いたいのだろう



821 名前:デフォルトの名無しさん mailto:sage [2014/04/12(土) 01:12:45.44 ID:a2NVx4h6.net]
むしろここで一人で安岡ヲチしてる人こそ何をしたいのかよくわからん…

このスレや過去スレを「安岡」でスレ内検索してみるとものすごく異様。

822 名前:デフォルトの名無しさん mailto:sage [2014/04/12(土) 13:33:41.81 ID:EgrmLH2O.net]
安岡さんが、キーボード配列の件で坂村さんを「デマ発信源」認定したのが気にくわない、
某方面のアレな信者でしょw

823 名前:デフォルトの名無しさん mailto:sage [2014/04/12(土) 15:05:23.03 ID:UapBJj1i.net]
坂村さんは今風に言えば
御用学者だよな

824 名前:デフォルトの名無しさん mailto:sage [2014/04/14(月) 11:59:40.17 ID:1onkTecJ.net]
>>813
本人乙

825 名前:デフォルトの名無しさん mailto:sage [2014/04/15(火) 21:27:59.56 ID:xZHXZozl.net]
じゃなきゃ南堂信者か本人

826 名前:デフォルトの名無しさん mailto:sage [2014/04/15(火) 21:51:19.51 ID:xZHXZozl.net]
まあそれはともかく「ちゃんとしたIVSがほしいからあえてIVSと呼んでいる」は
本気で意味わからない。名前が気に入らないってだけ?

827 名前:デフォルトの名無しさん mailto:sage [2014/04/15(火) 23:18:51.37 ID:ZjWcuo2H.net]
スラドにコメントしろよ

828 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 00:47:06.39 ID:xXudedaW.net]
うむ。

829 名前:デフォルトの名無しさん mailto:sage [2014/04/17(木) 21:25:09.42 ID:WnuPjrTt.net]
本人認定とか、完全にまじキチ君だな。

830 名前:デフォルトの名無しさん mailto:sage [2014/04/17(木) 21:36:39.35 ID:sxwy7+Pq.net]
どうでもいいよもう。

とりあえず安岡叩きしてる人はどこか味方のいる場所を見つけてそっちで好きなだけやってくれ。
ここで叩いても誰も賛同せずに今回みたいな流れになるだけだからさ。



831 名前:デフォルトの名無しさん [2014/04/19(土) 02:41:39.74 ID:GMRdES/l.net]
ネットのテキストをコピーすると、たまに文字コードの異なる半角スペースがあるのが困る。

832 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 05:54:36.53 ID:4rjoMz+n.net]


833 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 09:54:13.30 ID:uixitbPb.net]
どちらかというと「安岡」という単語に猿のレベルで脊髄反射して
トロン信者認定のレスを貼る安岡信者の方がすごいと思う

834 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:11:12.57 ID:4rjoMz+n.net]
>>824
過去ログに残る執拗な叩きの痕跡という前提がまるで存在しないかのように、
件の彼に対する反応を「『安岡』という単語に猿のレベルで脊髄反射」ってことにするのはどうかと。
あなたが同列に「どちらがすごいか」を比べてるのが奇妙に思えるほど、件の彼の行動は異質。積み重ねがあるからね。

そしてもちろん、件の彼について話している人は
「この人はなぜ、疎まれることがわかっている場でなお1人で叩き書き込みを続けるモチベーションを持っているのだろう?」
という点を不思議に思って集まっているんであって、書き込みの動機は明確。ここから「安岡信者」と解釈はしづらい。

また、仮にもしそのなかに「安岡信者」が紛れ込んでいたとして、
その信者はこのスレで執拗に「敵」を叩き続けたりはしていない。
件の彼と違って人畜無害なのだから、ほうっておけば良い。

835 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:15:43.09 ID:ZEjCExyP.net]
おれなんでこのスレ常駐してんだっけ……

836 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 13:43:05.46 ID:kntd4M4V.net]
>信者はこのスレで執拗に「敵」を叩き続けたりはしていない。

これには同意。
安岡信者は被害妄想が激しく
単発のレスで偏執に被害を主張するのが特徴だからね。

837 名前:デフォルトの名無しさん mailto:sage [2014/04/19(土) 17:03:56.09 ID:C6iMx0Tv.net]
>>822
NBSPが紛れこんでてイラっと来るやつかな

838 名前:デフォルトの名無しさん mailto:sage [2014/04/20(日) 08:23:30.09 ID:KqLq5BGH.net]
信者とか言い出す時点でどの発言も議論として無価値

839 名前:デフォルトの名無しさん mailto:sage [2014/04/21(月) 10:53:47.48 ID:zriSdqBt.net]
> 被害妄想が激しく
> 単発のレスで偏執に被害を主張するのが特徴だからね。

安岡さんに対して執拗に粘着している君の特徴じゃないかw

840 名前:デフォルトの名無しさん mailto:sage [2014/04/21(月) 19:22:16.02 ID:FvrWMSvP.net]
安岡センセイもビットコインに走っちゃったから…
…おっと誰か来たようだ



841 名前:デフォルトの名無しさん mailto:sage [2014/04/22(火) 02:46:51.52 ID:P71sOVmH.net]
誰も来てない

842 名前:デフォルトの名無しさん [2014/04/22(火) 16:39:21.34 ID:lALHniJm.net]
よそでやれよ気違いども

843 名前:デフォルトの名無しさん [2014/04/23(水) 01:02:12.57 ID:sJ3rggrT.net]
サロゲートペアがらみで文字化けとか文字落ちは未だに良くありますか?
合成文字(アイヌ語表記用)などがうまく処理できないんですけど、完全にサポートをしないと割り切った人はいますか?

844 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 01:11:50.85 ID:8DMe2xVl.net]
サロゲートペアかどうかの判定なんていちいち入れないし
固定長に可変長混ぜたら何の意味もない

845 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 01:58:46.32 ID:GjUEx0RG.net]
何か誤解してる様だが、元々Unicodeの文字表現は可変長

846 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 18:34:35.68 ID:TEjyogET.net]
はじめは16bit固定じゃないの?

847 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 20:59:37.84 ID:TEjyogET.net]
「元々」って「当初は」って意味で書いてないのか
すまん

848 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:11:18.40 ID:7vo5B08Z.net]
「か」と「゛」で「が」みたいに
二文字で一文字を表す合字があるんだから、
言語機能かライブラリを使うしか
現実的な対応方法ないだろ。

逆に言えば、それらを使っていれば
無視できる問題。

849 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:34:36.00 ID:T2nRtnpg.net]
UTF-8あたりとごっちゃになってる?

850 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:52:29.17 ID:WcbcT70M.net]
最初から UTF-16 も UTF-32 も可変長だけど
未だに固定長と思ってるやつなんかいるんだ?
そりゃすげーや



851 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:58:56.82 ID:FOWeiF78.net]
そりゃ日本の官公庁相手に仕事してる分には
たいていそれで許されるからな

852 名前:デフォルトの名無しさん mailto:sage [2014/04/23(水) 22:22:44.74 ID:GjUEx0RG.net]
>>841
「code pointを複数組み合わせた可変長で文字(grapheme)を表現する」っていう
Unicodeの基本をどうしても理解できない(認めたくない)人がいるんですよ。

853 名前:デフォルトの名無しさん [2014/04/23(水) 23:13:15.72 ID:Unh9uImh.net]
>>842

お役所が扱う人名なんて、それが許されない筆頭じゃなかろうか。

854 名前:デフォルトの名無しさん [2014/04/24(木) 11:06:30.10 ID:Cg0dX6qy.net]
Unicode1.0の頃はUCS-2。UTF-16は2.0から。
UCS-2はBMPの固定長エンコーディング。
まだ固定長原理主義者が多い頃だったから。

けどそれじゃBMP以外や合成文字どうすんねん、
規格の中で矛盾してるだろ、固定長原理主義無理だろってことで、
その辺入れたUTF-16になった。
たしかUTF系はベル研のケン・トンプソンが考えた8が最初。

うろ覚え書き込みだから、修正よろ。

855 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 00:12:43.23 ID:zWWRq5q6.net]
修正不可能なくらい間違いまくってるよ。
そもそもUCSは文字集合を定めるものであり、UTFは個々の文字を
どう表現するかを定めるものであってまったく別の概念だし。

856 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:45:09.27 ID:3oy/mjAO.net]
CPUのエンディアンが複数あるため、UTF-16にはBEとLEがあります。
どのサイトも説明見ると大体こんなような事書いてあるけど意味が分からない
エンディアンがどうこうってエンコーディングの内部で解決されるべき問題でしょ?
CPUに合わせてLEを使うと速いですよって事?

857 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 08:57:28.13 ID:XCREUD3T.net]
絵文字統一か

858 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:03:42.00 ID:t30thbGu.net]
>>847
確かにその説明はおかしいと思う。
画像フォーマットでもtiffにはエンディアンの指定があるが、普通はどちらにも対応する。

859 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:20:19.28 ID:B1sFbtmb.net]
>>847
ちゃんとエンコーディングでBE,LEが考慮されてるでしょ?
それともBEとLEの存在自体が問題だといってんの?
何がおかしいかわからない

860 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 13:55:02.90 ID:4klH39dY.net]
何を悩んでいるのかしら無いけど、
初期のUTF16の話として16bit固定っていうのはわかるよね?

C言語風に書くならば、WCHAR型(16bit)となって、
WCHAR *text = "あいうえお";
こういう定義になる。

この時のメモリ配列はC言語の仕様によりCPUのエンディアンによって変わる。
このメモリ内容がUTF-16BEやUTF-16LEなんだよ。

ファイルに保存するときはどちらかに統一してもいいが、
処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
だからUTF16-BEかUTF16-LEというものが生まれることになる。

メモリ内で使うために、UTF16-BE と UTF16-LE の存在を無くすことは出来ない。
そのメモリ内容をそのまま保存することもある。テキストファイルではなくて
構造体データの一部としてテキストが含まれている場合とか、一項目ずつ保存するのではなくて
メモリの構造体データを丸ごと保存したりするからね。

だから、UTF16-BEかUTF16-LEという存在はCPUのエンディアンの存在によって生まれ、
それを保存するファイルに格納されたデータの呼び名にもなる。



861 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:14:58.98 ID:gMbJ5qLh.net]
テキストファイルで保存するときでもLEとBEを選べるエディタがあるんだが
それはおかしいのか?

862 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:19:55.61 ID:jrLTZF6i.net]
世の中に二つの形式があるのなら、
二つの形式を選べるのが普通でしょう?

エンディアンが違うCPUとの間でもファイルの交換や、
ネットワーク通信できるんだから。

863 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 14:57:01.01 ID:m07o/u+5.net]
> C言語風に

864 名前:曹ュならば、WCHAR型(16bit)となって、
> WCHAR *text = "あいうえお";
> こういう定義になる。
WCHAR *text = L"あいうえお";
じゃね?
[]
[ここ壊れてます]

865 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:01:18.03 ID:jrLTZF6i.net]
別にC言語風だからどうでもいいよ

866 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:34:10.60 ID:XZGKxZHW.net]
たまには。PDPエンディアンのことも思い出してあげて

867 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 15:49:44.73 ID:T54U1ii9.net]
エンディアン嘘つかない

868 名前:デフォルトの名無しさん [2014/04/25(金) 17:51:44.43 ID:4fGC8eBc.net]
>>845
UCSとUTFの区別は最初はなかった。
最初はUCSのみ。
>>845も書いてるけど。

869 名前:デフォルトの名無しさん [2014/04/25(金) 17:56:44.39 ID:991UJ/F9.net]
>>847
UTF-16文字列はuint16_tの並び。
uint16_tだからCPUによってバイト順が違う。
だからエンコーディングのバイトオーダーが決まってると、
逆順のシステムはネットワークにデータを流す時にバイト順を毎回変えないといけない。
それを防ぐためにバイトオーダー順違いのエンコーディングが定義されてる。
こうしておくと必要なときだけバイト順を変えればいい。
DCE/RPCみたいに接続時にバイトオーダをネゴしてもいいし、
どちらを送られても必ず扱えるようにしてもいい。

870 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 18:34:47.40 ID:3oy/mjAO.net]
レスありがとう
2つの(代表的な)エンディアンがあってだからBEとLEがありますだと理由付けとして弱い、何か他にあるんじゃないの??って疑問でした。
だから
>処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
という事情があると知り納得しました。



871 名前:デフォルトの名無しさん [2014/04/25(金) 20:13:07.53 ID:+TF8D1gC.net]
2つ

872 名前:しかない。 []
[ここ壊れてます]

873 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:28:19.84 ID:XFGUZTlf.net]
Unicode規格のエンコーディングフォームと
エンコーディングスキームの区別が全く
ついていない人が集うスレはここですか?

874 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 20:41:42.68 ID:nsFgzzSj.net]
>>862
あなたもその一人です。

875 名前:デフォルトの名無しさん mailto:sage [2014/04/25(金) 21:32:54.46 ID:lqZ5R9lm.net]
キター
パーソナルメディア、Unicode IVS/IVDを活用する異体字検索入力ツールを発売
itpro.nikkeibp.co.jp/article/ActiveR/20140422/552244/

876 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 07:57:34.66 ID:ZfEIw6x8.net]
IVS流行るんかねぇ
今3000字くらいだっけ?登録されてるの

877 名前:デフォルトの名無しさん mailto:sage [2014/04/26(土) 20:11:54.73 ID:Y0Dd5Dys.net]
有料なのかよ
babelmap使えばいいな

878 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:28:54.53 ID:ZQa6pLX5.net]
先月までレビューをやってた新しいIVDはその後どうなったんだろ

879 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 06:55:39.54 ID:1HDcLnog.net]
>>866
しかも10ライセンス単位
それでも一般販売されるようになっただけ一歩前進

880 名前:デフォルトの名無しさん [2014/05/01(木) 02:19:11.86 ID:jqsfROWp.net]
20年以上前に MS-DOS で
grep "\["
ってやって、関係ない漢字が大量にヒットした時の絶望感。
Microsoft を捨てる理由になり得るということを
理解してくれる人は少ない。



881 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 02:54:30.27 ID:o0DjzHC6.net]
ほー。

882 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 06:02:50.85 ID:cONH9EUi.net]
へー。

883 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:37:23.88 ID:qBGbIEYq.net]
MS-DOSにgrep有ったのか

884 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 17:56:01.26 ID:SDsBtHY9.net]
アスキーの Software Tools for MS-DOS 他、いろいろあったよ

885 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 18:34:21.61 ID:qBGbIEYq.net]
マイクロソフト以外のツールの出来が悪いと
Microsoft を捨てる理由になり得る のか

886 名前:デフォルトの名無しさん mailto:sage [2014/05/01(木) 19:06:00.71 ID:SDsBtHY9.net]
「Microsoft漢字コード」って意味じゃねーの?

887 名前:デフォルトの名無しさん [2014/05/01(木) 21:32:54.04 ID:jqsfROWp.net]
「Microsoft漢字コード」って意味です。
それ以外にも理由は山ほどありましたが。
その後、Pentium マシン買ってとっとと Linux 入れて
Microsoft を捨てました。前世紀のことです。
エンコーディングは当初は euc-jp , 後に utf-8 。

プリインストールされていた windows 98 を有効利用しようと
一応は努力したんですよ。10日間くらい。

888 名前:デフォルトの名無しさん mailto:sage [2014/05/02(金) 03:26:51.56 ID:Bonx+GYW.net]
>>873
特に緑の256本にお世話になりました。

889 名前:デフォルトの名無しさん [2014/05/02(金) 08:40:36.13 ID:QU3ScAPG.net]
まあバカには難しいからな

890 名前:ニュース記事より mailto:sage [2014/05/02(金) 12:43:16.91 ID:ufjYsrm8.net]
UTF-16 で、+2D 91+A9 52 7D 00+9F 53+ って何ですか?
tp://headlines.yahoo.
co.jp/hl?a=20140427-00000009-asahi-int



891 名前:880 mailto:sage [2014/05/02(金) 13:14:16.23 ID:ufjYsrm8.net]
Internet Explorer を外したら上手くいきました。(._.)

892 名前:デフォルトの名無しさん mailto:sage [2014/05/07(水) 23:28:11.14 ID:FbKWdn3j.net]
utf-1のオリジナルの仕様書はどこかに無いですかね?

893 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 01:59:00.77 ID:1FoEUPwa.net]
>>881
なにそれ? 1bit encode?

894 名前:デフォルトの名無しさん mailto:sage [2014/05/08(木) 02:19:16.15 ID:Ejp4CkYN.net]
8bitだな

895 名前:デフォルトの名無しさん [2014/05/08(木) 22:39:56.65 ID:vsk9CRPq.net]
数字の付け方が途中で変わったからねぇ。

896 名前:デフォルトの名無しさん mailto:sage [2014/05/09(金) 22:59:45.07 ID:FKMNP0tp.net]
JIS X 0201の「ヲ」ってなんであんな位置にあるの?
「ワ」と「ン」の間じゃダメだったの?

897 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 00:58:26.77 ID:t6xyZ ]
[ここ壊れてます]

898 名前:zaK.net mailto: 不思議だワン []
[ここ壊れてます]

899 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:01:06.78 ID:ZmQF3HWI.net]
今主流は、ISO/IEC 8859-15? Windows-1252 ? unicode?

900 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:09:42.82 ID:HPEBdtCe.net]
あらゆる隔たりを越えて使われてるコードってなんだろ



901 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 03:27:31.59 ID:J4ChnPls.net]
>>888
ASCIIコード

902 名前:デフォルトの名無しさん [2014/05/10(土) 03:29:41.16 ID:2hs2epHy.net]
JSON
Base64

903 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:13:27.62 ID:KEqrkxpz.net]
せめて文字コードからお願いします

904 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:17:48.14 ID:38X5dwcC.net]
お客さまの文字コードを戴いてもよろしいでしょうか

905 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 11:20:07.72 ID:KEqrkxpz.net]
>>881
英語版ウィキペからのリンクで見つけた。
kikaku.itscj.ipsj.or.jp/ISO-IR/178.pdf
>>884
UTF-8はUTF-2という名前だったな

906 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 13:26:02.15 ID:N1jI/E1a.net]
>>893
オリジナルは ISO 10646-1:1993 = Unicode 1.1だな。

907 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 15:12:57.31 ID:KEqrkxpz.net]
Unicode 1.1だけはunicode.orgのサイト上にもないんだね。
www.unicode.org/versions/enumeratedversions.html
無慈悲な(paper only)

908 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 20:17:48.99 ID:rzUUktpC.net]
Adobe-Japan1-6が出てもう10年か
これだけ放置ってことは1-7は実質的にキャンセルされたかな

909 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 00:27:45.38 ID:ijhFBXaa.net]
世の中はWindows-1252か、それをUTF-8化した文字コードが主流だね。

910 名前:デフォルトの名無しさん [2014/05/11(日) 14:18:48.58 ID:MFVOcSxg.net]
㐂驒沪𡈽圡玊琢簞箪簟單俱倶傎叱𠮟
咕吒哎噓嘘墟吞呑櫛樿撣
味噌
葛飾区
祇園
進歩

湮滅
恰好
義捐金
眩惑
激昂
幻惑
渾然
駿足
醇朴
饒舌
食事療法
食餌療法
擡頭
醜名



911 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 14:22:59.36 ID:ktmFmLGc.net]
>>876
外部ツールのgrepが特定の文字コードに対応してなかっただけだろ?

912 名前:デフォルトの名無しさん [2014/05/11(日) 14:24:59.03 ID:MFVOcSxg.net]
人名にある漢字
&amp;#164660; U+28334(D860 DF34)
&amp;#136014; U+2134E(D844 DF4E)
&amp;#168087; U+29097(D864 DC97)
&amp;#135963; U+2131B(D844 DF1B)
&amp;#64069;  U+FA45
わかりやすい一表式誤字俗字・正字一覧
戸籍の氏又は名の記載・記録に用いる文字
戸籍実務研究会 編 日本加除出版
shift-jisではなくUnicodeで記述してくれ。

むずかしくないぞ!!誤字俗字・正字
小林勝彦 著 日本加除出版
子の名に使える漢字字典
改定常用漢字表対応
戸籍実務研究会 編 日本加除出版
人名用漢字の変遷
子の名に使える漢字の全履歴
日本加除出版株式会社編集部 編
日本加除出版

CJKV日中韓越情報処理 オライリー
新しい国語表記ハンドブック 三省堂
校正必携 日本エディタースクール
記者ハンドブック 共同通信
日本人の知らない日本語

913 名前:デフォルトの名無しさん [2014/05/11(日) 15:03:04.80 ID:MFVOcSxg.net]
外字管理と文字同定
合理的な外字作成のために
長村玄 著 日本加除出版

参考
blog.livedoor.jp/blackwingcat/archives/98340

914 名前:7.html
http://blog.livedoor.jp/blackwingcat/archives/775319.html

&amp;amp;#127924;
サロゲートペア
1F3B4 花札の坊主
1F3B6
1F4A9
1F4B4
1F5FE
1F5FC
[]
[ここ壊れてます]

915 名前:デフォルトの名無しさん [2014/05/11(日) 16:31:11.95 ID:RoItktFj.net]
結局、どれがええんじゃ?

916 名前:デフォルトの名無しさん mailto:sage [2014/05/11(日) 16:59:11.70 ID:6gZ3xnJh.net]
>>898
邦題『湮滅 』の仏語原文はeのリポグラムで書かれているそうで、
翻訳の方も「い段」の仮名がなかったりのこだわり本。
どうでもいいな、スレチだし

917 名前:参考 mailto:文字コード [2014/05/11(日) 22:41:39.55 ID:E8GL8yG6.net]
www.amazon.co.jp/dp/4899772939/
文字コード「超」研究 改訂第2版
深沢千尋

www.amazon.co.jp/dp/477414164X/
プログラマのための文字コード技術入門 (WEB+DB PRESS plus)
矢野啓介

www.amazon.co.jp/dp/4891006080/
UnicodeによるJIS X0213実装入門―情報システムの新たな日本語処理環境
(マイクロソフト公式解説書―マイクロソフトITプロフェッショナルシリーズ)
田丸健三郎

www.amazon.co.jp/dp/4822294838/
Unicode IVS/IVD入門
田丸健三郎 小林龍生

www.amazon.co.jp/Unicode/dp/4798100307/
Unicode標準入門  発売日 2001/05
トニーグラハム

918 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 01:09:45.43 ID:Dp5FfogZ.net]
Unicode IVS/IVD入門は誤植とツッコミどころ満載(著者のせいというよりは編集が仕事してない)なので、
togetterだかにまとめられてるツッコミを確認しながら読むべし。

919 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 11:07:44.74 ID:pJ9Xs2pQ.net]
互換漢字の表が正規化で全部統合漢字に化けていたのはひどかった

920 名前:デフォルトの名無しさん [2014/05/12(月) 15:46:50.90 ID:uPA0umXi.net]
>>897
はあ?



921 名前:デフォルトの名無しさん [2014/05/12(月) 15:57:25.31 ID:IpyUrlLw.net]
&amp;#29357;&amp;#173866;2A72A&amp;#173880;2A738&amp;#173885;2A73D&amp;#173894;2A746&amp;#173919;2A75F&amp;#173912;2A758

922 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 21:42:02.38 ID:JxGQtJ4M.net]
>>885
最初無くて(「オ」で代用してたのかな?)後から追加されたという説がある。

923 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 13:59:51.38 ID:bcXG8zlV.net]
>>906
そりゃ回収すべきだなあ。

つーか著者も中で正規化についてふれてるはずだから、
予め事故が起きないように原稿データを作成する
もしくはゲラで気にして眺めるのが当然。

それができていない、ということは、Excelの入門書とかにありがちな
入門者の「ための」本じゃなく、入門者が「書いた」本の類か。

924 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 15:44:02.57 ID:m7IyQf0x.net]
いや、著者はどっちもそれなりな人。経緯はまとめがあるのでそっちを読んでくれ。

925 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:28:52.12 ID:YJDUJNfi.net]
>>909
そんな説があったのか
記号消したのかな

926 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:39:30.11 ID:QNQkB6+v.net]
主に携帯電話絵文字が割り当てられた、UNICODE u1f330〜u1f36f, u1f400〜u1f41f
をtwitter, mixi, Facebookで表示させてみた。
mixiのWeb serverは前から独自の絵文字表示機能があるが、元からある絵文
字から、その文字コードに対応する絵文字を拾いだしてを画像データ
(恐らくGIF)で表示しているみたい。。
twitterのPC(Windows7)のブラウザによる表示でも同様。

Nexus7でのブラウザ表示、smart phoneでのtwitterでは、Web serverの
絵文字表示機能に対応しておら

927 名前:ク、文字コードに対応する絵文字をフォント
で表示させようとしているみたい。
表示させる文字コードに対応する絵文字のフォントデータがその端末にない
場合は表示されない。
[]
[ここ壊れてます]

928 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 19:47:48.70 ID:QNQkB6+v.net]
UNICODE表示
u1f330〜u1f36f
🌰🌱🌲🌳🌴🌵■🌷🌸🌹🌺🌻🌼🌽🌾🌿
🍀🍁🍂🍃🍄🍅🍆🍇🍈🍉🍊🍋🍌🍍🍎🍏
🍐🍑🍒🍓🍔🍕🍖🍗🍘🍙🍚🍛🍜🍝🍞🍟
🍠🍡🍢🍣🍤🍥🍦🍧🍨🍩🍪🍫🍬🍭🍮🍯

u1f400〜u1f41f
🐀🐁🐂🐃🐄🐅🐆🐇🐈🐉🐊🐋🐌🐍🐎🐏
🐐🐑🐒🐓🐔🐕🐖🐗🐘🐙🐚🐛🐜🐝🐞🐟

929 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 20:17:04.28 ID:rSIFJNU6.net]
そもそもサロゲートペアに対応しているかという話も。

930 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 10:23:36.86 ID:RnX/NH2T.net]
>>913
ブラウザは何?
サーバ側で画像に差し替えてるのは、
UserAgent見て切り替えたりしてんじゃないの?

>>913
> Web serverの 絵文字表示機能に対応しておらず、

そうじゃなくてサーバ側で表示できるブラウザと勘違いしてるんでしょ。
UserAgentがそれっぽいから。



931 名前:デフォルトの名無しさん [2014/05/14(水) 12:07:15.19 ID:FT6VO3mN.net]
JIS2004対応MSゴシック MS明朝フォントパッケージ
Office製品のJIS X 0213:2004への対応状況
go.microsoft.com/fwlink/?LinkID=76814 go.microsoft.com/?LinkID=6179681
JIS X 0213:2004 Unicode 実装ガイド Microsoft
www.microsoft.com/china/windows2000/downloads/18030.mspx


blog.livedoor.jp/blackwingcat/archives/983407.html
ISO 10646:2003 + 修正 1 繁体字中国語サポート (HKSCS 2004)
Windows XP および Windows Server 2003 用の Windows XP フォント パックsupport.microsoft.com/kb/977801/ja
Traditional Chinese ClearType fonts for Windows XP - 繁體中文
www.microsoft.com/zh-tw/download/details.aspx?id=12072
Simplified Chinese ClearType fonts for Windows XP
www.microsoft.com/en-us/download/details.aspx?id=14577
Korean ClearType fonts for Windows XP
www.microsoft.com/en-us/download/details.aspx?id=10490

汎用電子情報交換環境整備プログラム文字対応作業委員会資料
平成19年度経済産業省委託
汎用電子情報交換環境整備プログラム文字対応作業委員会資料(「地名外字」資料)
2008 年3 月発行、独立行政法人国立国語研究所
平成19年度 汎用電子情報交換環境整備プログラム文字対応作業委員会資料 地名外字 資料
www.ninjal.ac.jp/archives/hanyo/
www.ninjal.ac.jp/archives/hanyo/chimeigaiji.pdf
www.ninjal.ac.jp/archives/hanyo/jisyohikeisaiji.pdf

kanji-database.sourceforge.net/dict/daikanwa/index.html
hp.vector.co.jp/authors/VA000964/html/daikanwa.htm
webcat.nacsis.ac.jp/cgi-bin/shsproc?id=BN13621753

932 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 13:26:00.05 ID:Z6IwK1L/.net]
これはいったい何の話?

933 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 20:54:01.03 ID:iRfI2E/u.net]
あまぞんのれびゅーって面白いよね。
専門書の場合、みんなちゃんと根拠を出して
貶しているのに必ず一人だけ闇雲に
マンセーする人がいる。
やっぱ、工作員かな。

934 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 20:57:31.09 ID:kwfzu7ec.net]
漢字データベースはデータファイルへのリンク切れを直してほしいぞ
( /kawabata/kanji-data-base-* → /cjkvi/cjkvi-* )

935 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 21:02:5 ]
[ここ壊れてます]

936 名前:5.66 ID:kwfzu7ec.net mailto: > http://webcat.nacsis.ac.jp/cgi-bin/shsproc?id=BN13621753

ていうか貼る前に飛べるかどうか確認くらいしろ
botかよ
[]
[ここ壊れてます]

937 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 21:26:48.11 ID:GYPuM66Z.net]
ci.nii.ac.jp/ncid/BN13621753
これなのかな?

938 名前:デフォルトの名無しさん mailto:sage [2014/05/14(水) 22:29:58.06 ID:Z6IwK1L/.net]
サイニーってなんか名前がえろいよね

939 名前:デフォルトの名無しさん mailto:sage [2014/05/15(木) 00:27:38.91 ID:9rPoDGNl.net]
>>919 一人で言ってろw

940 名前:デフォルトの名無しさん mailto:sage [2014/05/15(木) 01:21:02.79 ID:eaRTBJfl.net]
Excel から Cのdllに文字列を渡すとき、VBAからは
ByVal as String を渡して C側で LPCSTR で受け取るのがパターンだけど、
ワークシートから直接呼ぶ場合はC側は BSTR等 で受けなきゃいけない。
そこで C側は BSTR に統一しておいて、VBAからは
StrConv( xxx, vbUnicode) をかましてやればいいことが分かった。

ところが、StrConv("まみむめも", vbUnicode) を渡したら化ける。
ひらがなだと"め"以降が、かたかなだと"ム"以降がダメなようだ。



941 名前:デフォルトの名無しさん [2014/05/15(木) 23:22:03.55 ID:r+glb6GN.net]
ci.nii.ac.jp/ncid/BN13621753
大漢和辞典
諸橋轍次著
藍燈文化事業股份有限公司, 1992.6
修訂版 / 鎌田正, 米山寅太郎修訂

出版地:台北

大学図書館所蔵 2件
実践女子大学 図書館
函館大谷短期大学 図書館

942 名前:デフォルトの名無しさん [2014/05/17(土) 00:34:57.36 ID:FDiSLcBF.net]
毦ト厽厸叕忑忐忐臋膐臡娚妕嫏釱c腥觕槀晟猋

943 名前:デフォルトの名無しさん mailto:sage [2014/05/17(土) 07:02:20.43 ID:HL2kvjJk.net]
Moji_Johoコレクション登録キター
unicode-inc.blogspot.jp/2014/05/new-version-of-unicode-ideographic.html

944 名前:デフォルトの名無しさん [2014/05/23(金) 20:30:12.89 ID:0ops72ts.net]
>>899
なんで10日もたってから反応してくれたのか知らないけど一応返事しとくよ。
確かに grep はシフトJIS に対応してなかったけど問題はそこではない。

945 名前:デフォルトの名無しさん mailto:sage [2014/05/23(金) 22:20:35.88 ID:3CistgHw.net]
じゃあ違う所に問題があるってことになるんだが、
それを書かないのはなんで?

946 名前:デフォルトの名無しさん [2014/05/25(日) 17:43:33.84 ID:+9s7n6Ty.net]
シフトJIS のせいだと理解してくれた人もいるのだから充分だと思う。
それ以上書かなかったのは
「自分のブログでやれ!」
というような内容だから。
20年以上も前の極めて個人的な事情を本当に知りたい?

947 名前:デフォルトの名無しさん mailto:sage [2014/05/25(日) 19:07:02.17 ID:1MTC2E0+.net]
A「シフトJISじゃなくツールの問題」
B「いえ問題はそこじゃない」
A「じゃどこだよ」
B「シフトJISの問題だけど詳細は言えませぬ」

なんかオボカタを彷彿させられたわ

948 名前:デフォルトの名無しさん mailto:sage [2014/05/25(日) 23:53:20.28 ID:sunY8yYk.net]
>>869-877を読む限りgrepがウンコだったとしか読めないのだが
マイクロソフトが嫌いな人はなんでもマイクロソフトのせいにしたがるんだろうな

949 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 01:01:24.96 ID:n7nd7EBV.net]
シフトJISって書くのはShift_JISと区別する意図があるという理解でよろしいか

950 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 01:05:37.47 ID:xHMaMRhQ.net]
シフと辞す



951 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 04:46:50.66 ID:JBieFH3j.net]
>>931
氏ね

952 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 06:15:33.67 ID:4h8ULvHM.net]
>>931
小出しにしないで、何がどうしてどうなったのかを1スレで書けるなら書いてもいいよ。

953 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 07:02:01.76 ID:BDkoTBNa.net]
>>934
そら

954 名前:そうだろ
Shift_JISなんて使ってる人は見たことがない
[]
[ここ壊れてます]

955 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 09:00:03.21 ID:LQ8Ghiak.net]
>>931
実に興味深いので、ぜひともうかがいたい

956 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 09:29:56.46 ID:koz7MUNE.net]
シフトJIS
Shift_JIS
S-JIS
MS932
他もあったと思うが何がちがうん?

957 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 11:51:57.08 ID:wJgJenmS.net]
あだ名が違うだけなんよ

958 名前:デフォルトの名無しさん [2014/05/26(月) 12:31:29.88 ID:798+E0yw.net]
UTF-8ってバイトストリームのくせになんでBOMなんてものがあるの?

959 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 12:35:07.83 ID:LnM16LwK.net]
>>942
深謀遠慮の馬鹿の所為。

960 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 12:37:23.58 ID:n/wMhhQ7.net]
>943
www.w3.org/International/questions/qa-byte-order-mark.en.php

> In the UTF-8 encoding, the presence of the BOM is not essential because,
> unlike the UTF-16 encodings, there is no alternative sequence of bytes in a character.

> However, the BOM may still occur in UTF-8 encoded text, either as a
> by-product of an encoding conversion or because it was added
> by an editor to flag the content as UTF-8.

> In this situation, the BOM is often called a UTF-8 signature.

ということで、UTF-8のBOMは、BOMと似ているバイトデータですが、
BOMという呼び名が気になるなら、UTF-8 signatureと呼びましょう。



961 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 12:42:12.84 ID:n/wMhhQ7.net]
なぜUTF-8 signatureがあるかといえば、
文字化け防止ですね。

マルチバイト文字列を使った文書の場合、
UTF-8で書いていても、他の文字コードだと
誤判定する可能性がある。

その可能性まで考慮する場合、つけても
いいということになっています。

そこまで考えるかどうかですね。

962 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 12:57:20.58 ID:yW4E2WrI.net]
>>940
文字集合が違うものがある。

963 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 13:06:36.83 ID:koz7MUNE.net]
>>946
それはシフトJISの中で
78年とか83年とかって言われるやつ?

964 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 17:54:55.99 ID:2f6IRupb.net]
MS932なんて明らかに別物じゃない

965 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 18:41:56.31 ID:rblDMgf3.net]
>>940
シフトJIS:Shift_JISの俗称
Shift_JIS:正式名書 JIS X 0208とかIANAではこれが使われてる
S-JIS:Shift_JISの略称
MS932:MSによるShift_JISの拡張
あってる?

966 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 19:16:08.25 ID:CNfFVCaw.net]
>>944
どこの馬の骨ともわからないサイトを引用して嬉しいか?

967 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 19:17:17.33 ID:3kQqWzjR.net]
>>949
全然ダメ話にならない
安岡に洗脳された?

968 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 19:36:56.51 ID:n/wMhhQ7.net]
>>950
www.w3.org だよ。

ja.wikipedia.org/wiki/World_Wide_Web_Consortium
> World Wide Web Consortium(ワールド・ワイド・ウェブ・コンソーシアム)は、
> World Wide Webで使用される各種技術の標準化を推進する為に設立された
> 標準化団体、非営利団体。略称はW3C(ダブリュースリーシー)。

ま、知っていて言ってるんだろうけどねw

もしかしてw3がUTF-8 signatureを使用しても
いいものとして解説してるの知って悔しかった?
MS独自の仕様とかじゃないんだよw

969 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 19:42:54.92 ID:Ht/ARlMF.net]
>>952
unicodeの公式はこっちじゃないの?
www.unicode.org/
BOMのFAQは
www.unicode.org/faq/utf_bom.html

970 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 21:15:37.40 ID:n/wMhhQ7.net]
いや、「どこの馬の骨ともわからない」という
無知を馬鹿にしてるだけだからw



971 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 21:59:26.38 ID:rblDMgf3.net]
>>951
正解よろ

972 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 22:20:10.75 ID:YFy2sZt2.net]
>>955
シフトJIS:Windows-31とかShift_JISなどの総称・俗称
S-JIS:シフトJISと同じ
Shift_JIS:シフトJIS系文字コードの一つ。IANAでの正式名称
Windows-31J:シフトJIS系文字コードの一つ。IANAでの正式名称
ms932:Windows-31Jと同じ。俗称

973 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 23:00:00.47 ID:koz7MUNE.net]
>>956
と言うことは
Shift_JISとWindows-31Jの2種類があるんだね
どのあたりのコード規格が違って2種類なの?
入ってるフォントや文字が違うってのは除いてね

974 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 23:00:05.62 ID:jb2ZtUVc.net]
何も説明してないな

975 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 23:02:22.93 ID:n/wMhhQ7.net]
>>957
> 入ってるフォントや文字が違うってのは除いてね

文字コードっていうのは、普通
入っているフォントや文字が違うものなんだけど、
その一番重要な部分を除く理由は何?

976 名前:デフォルトの名無しさん mailto:sage [2014/05/26(月) 23:13:34.23 ID:sKb2ZcEr.net]
>>957
Shift_JISはJIS X 0208文字とJIS X 0201文字を含む
Windows-31Jはさらに「NEC特殊文字」「IBM拡張文字」を含む

977 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 01:20:43.41 ID:7VvgsYMM.net]
>>959
コード体系と文字は別でしょ
Shift_JISでも78年文字とか83年文字とか
最近だと何年まで進んでるのかわからないけど
あと、同じコード位置でも機種依存やOS依存で違うし
これらはコード体系は同じと思ってる
ちがう?

978 名前:デフォルトの名無しさん [2014/05/27(火) 03:20:26.43 ID:Ha9yhWBf.net]
wikipedia貼ってどやとかもう生きていられない次元

979 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 11:43:03.63 ID:empqvUFR.net]
>>961
> コード体系と文字は別でしょ
別ではない。昔は厳密に区別されていなかった。

厳密に区別されるようになったのはUNICODEから

980 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 17:40:32.44 ID:jLhQ2X1r.net]
>>963
昔って83年以前?
その時点でShiftJISの78規格文字とか83規格文字はあったが
規格はShiftJISだったが
機種依存文字も各社バラバラだったが
文字とコードが一緒だとどうなってたの?
意識してない人も居たってところでしょ



981 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 17:47:14.30 ID:LcMluZw6.net]
文字化けというお化けが出る

982 名前:デフォルトの名無しさん [2014/05/27(火) 18:06:25.64 ID:rWEe06X3.net]
>>937
ありがとう。書くよ。
エンコーディングの表記は "Shift_JIS" でいい?

grep の件は Shift_JIS だから起こった。
現在なら Shift_JIS に対応しているのを使えばいいと思うかもしれないけど
インターネット以前の時代だ。
パソコン通信はあったけど、そういうのを使える環境ではなかった。
情報は雑誌や書籍が頼りで、ソフトもそれらの付録の
フロッピーディスクが頼りだった。情報弱者だ。
しかし grep の件のような問題が起こらないエンコーディングが
あるということが解る程度には勉強していた。
自分で書くプログラムでは Shift_JIS にも一応は対応したし
海外産のプログラムを改造したこともあるが、それは
Shift_JIS だから必要なわけで、本当はやりたくない。
nkf はあったから、パイプ処理でなんとかなる場合もあるが
MS-DOS ではパイプ処理はあまり使いやすいものではない。
もし、コンソールドライバにエンコーディングを切り替えるオプションがあれば
海外のプログラムを無修正で使えたかもしれないのだが。
Shift_JIS でなければ何も問題は起こらないというわけではない。
grep もそうだ。しかし Shift_JIS でなければ起こらない問題が多すぎる。
つまり、grep が Shift_JIS に対応していないのが悪いのではなく
Shift_JIS を使っているのが不合理だという立場だ。

983 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 19:15:40.23 ID:5OfN7A1O.net]
>grep が Shift_JIS に対応していないのが悪いのではなく
>Shift_JIS を使っているのが不合理

駅に車を違法駐車するひとが
「みんなやってるし取り締まる方が不合理」
と開き直ったような思考だな

984 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 20:37:49.77 ID:gGML8YGy.net]
>>966
結局シフトJISに対応してない問題しかないじゃないか(呆れ)

985 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 21:12:56.49 ID:d2/Q/hOp.net]
雑誌付録のソフトて大抵日本語対応てか作者日本人だから自然に対応してたよな
VectorがCD-ROMの頃で収録数増やすのにBSDとか海外製のオープンソースものが入ってきてた感じ

986 名前:デフォルトの名無しさん mailto:sage [2014/05/27(火) 21:27:36.82 ID:33vy5Nng.net]
MS-DOSの時代にShift_JISなんてあったっけ?
シフトジスが1983年ぐらいとしてShift_JISは1997年じゃないの

987 名前:デフォルトの名無しさん [2014/05/28(水) 01:03:28.34 ID:LFNjWwYo.net]
x-sjis

988 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 02:31:34.80 ID:8UETi8D4.net]
PC-8801mk2FR (1985年11月発売)
ttp://121ware.com/support/product/data/spec/cpu/b041-1.html
PC-8801mk2MR (1985年11月発売)
ttp://121ware.com/support/product/data/spec/cpu/b042-1.html

私の記憶が正しければ、少なくともNEC製パソコンに関しては上記2機種以降
(FR/MR/FH/MH/FA/MA/FE/MA2/FE2/MC/VA/VA2/VA3)に標準添付された
N88-日本語BASICで、シフトJISコードが採用されていたはず。(MS-DOS全盛期より前)
実際、私も高校時代にPC-8801mk2FRの実機で日本語BASICをよく使っていたものだ。

それより一体いつの間に「シフトJIS」(シフトジス)と「Shift_JIS」が別物って話になってんだ?
上記のN88-日本語BASICにNEC独自の2バイト文字が一部含まれていたのは確かだったように記憶しているが、
基本的には呼び方が少し異なるだけで同じ文字コードを指すんじゃないのか?

989 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 06:56:42.97 ID:OT9ObpmS.net]
いやShift_(アンダースコア)JISだけは別格のキワモノ

990 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 09:38:18.25 ID:LEy/uI+S.net]
コードとフォントを区分けできない奴らが多いんだから
回答も適当なもんだ



991 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 09:48:09.99 ID:am2JQYoj.net]
シフトJISでもShift_JISでも良いんだけど
>Shift_JIS でなければ起こらない問題が多すぎる
これちゃんと説明しないと話にならん

992 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 09:53:02.69 ID:uwTq2IS1.net]
もう済んだことを蒸し返すな。
説明させたら、まったくShift_JISのせいではなかった。
これが事実。

993 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 10:45:31.20 ID:jOoZBmgE.net]
シフトジス
これ以降広い意味ではこれを使うこととする。

994 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 14:34:33.72 ID:VGTs+pfN.net]
>>974
符号と字形っていうかコードとグリフじゃなくて?

995 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 16:42:18.75 ID:1n4l76qf.net]
えらく伸びていると思ったら

996 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 18:04:52.73 ID:6RxarYIU.net]
x-sjis とかが Shift_JIS になったのが 1997 年頃

997 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 19:34:38.71 ID:SK7hf9Gv.net]
x-sjisに定義なんて無かったんじゃないの?
Shift_JISがIANAで定義されてそのとき初めて
JIS X0208+0201という定義がされたのだと思ってたけど。

998 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 20:27:02.63 ID:OGsR5Eh8.net]
2バイト目にASCII文字と同じバイトが出現しうるからEUC-JPなら必要なかった
対応が余分に必要になるってよくある話?
Perlだとこういう問題が知られている。
homepage1.nifty.com/nomenclator/perl/shiftjis.htm

999 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 21:14:42.01 ID:0IHmN3Nq.net]
どこまで読んでも
「文字列をASCII+アルファの未知のデータと仮定して処理したら誤動作した」
でしかないんだよな。
言語やツールの仕様に「\や@と同じバイトは現れない文字コードが前提」
と言う制約が有るわけでもないのに。

1000 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 21:23:03.13 ID:/a0BspTY.net]
文字コードって就職先あんの?



1001 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 21:44:20.16 ID:kjRCJp/2.net]
>>984
無いよ。
このスレを見てわかるとおり
文字コードにこだわる人=アスぺ基地外だからね

1002 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 21:52:01.58 ID:7l0BbTbH.net]
あとIMEのスレもキチガイ率高いな
文字にこだわるやつはキチガイ予備軍なんじゃね?

と思ったけどフォントスレはそうでもないな

1003 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 22:00:10.73 ID:vt8gBzLM.net]
Macのが最も素晴らしいだとかフォントのライセンス無視して改造して配ってたり
GDI++だったか妙なレンダリングに拘ってたりするイメージがあるけど

1004 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 22:11:07.99 ID:7l0BbTbH.net]
なんかそういうのとは毛色が違うんだよなぁ
フォント関係のとこのやつははうぜぇやつ止まり
コードやIMEのとこにいるやつはキチガイ臭がプンプンする

1005 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 22:56:37.48 ID:St2mZNey.net]
てすぽ

1006 名前:デフォルトの名無しさん mailto:sage [2014/05/28(水) 23:58:57.25 ID:c0LERDVkO]
落ちたか?

1007 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 00:37:00.53 ID:dXuX76SH.net]
>>981
Windows-31JはIANAに登録されてた。

1008 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 00:37:59.34 ID:3vKJnOmW.net]


1009 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 03:49:04.43 ID:AMcBMTZL.net]
次スレ
文字コード総合スレ part9
peace.2ch.net/test/read.cgi/tech/1401301779/

1010 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 05:04:37.61 ID:l+cTMUwg.net]
おっつぅ



1011 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 07:50:08.12 ID:3vKJnOmW.net]
埋め

1012 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 07:52:04.05 ID:3vKJnOmW.net]
996

1013 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 07:52:34.79 ID:JfFfn9nO.net]
997

1014 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 07:54:12.96 ID:JfFfn9nO.net]
998

1015 名前:デフォルトの名無しさん mailto:sage [2014/05/29(木) 07:58:01.05 ID:3vKJnOmW.net]
999

1016 名前:デフォルトの名無しさん [2014/05/29(木) 07:58:50.87 ID:3vKJnOmW.net]
1000

1017 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

1018 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<208KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef