[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/02 16:40 / Filesize : 221 KB / Number-of Response : 1012
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ Part12



1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/

613 名前:デフォルトの名無しさん [2019/09/01(日) 01:36:48.58 ID:sYwYgS29.net]
iconv禁止

614 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 09:07:17.74 ID:XF6G4Ohn.net]
NKF(Network Kanji code conversion Filter)を使えば?

Ruby にも、NKF モジュールがある

615 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 10:46:26.40 ID:YneNC5Ev.net]
別にコード変換ツールを探してるわけじゃなくね?w

616 名前:デフォルトの名無しさん [2019/09/01(日) 10:52:49.46 ID:kCJZVLuH.net]
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決

617 名前:デフォルトの名無しさん [2019/09/01(日) 12:53:54.91 ID:k0czTyLP.net]
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。

618 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb.net]
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

619 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:11:25.72 ID:xmxF7u0H.net]
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。

620 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:35:49.57 ID:JCPxJyAV.net]
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ

621 名前:デフォルトの名無しさん [2019/09/01(日) 13:40:59.73 ID:kCJZVLuH.net]
>>612
おまいもかなり可笑しいなω



622 名前:デフォルトの名無しさん [2019/09/01(日) 13:42:43.07 ID:k0czTyLP.net]
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。

623 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:01:22.04 ID:JCPxJyAV.net]
(もしかして: フォント)

624 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH.net]
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない

625 名前:デフォルトの名無しさん [2019/09/01(日) 14:29:25.97 ID:k0czTyLP.net]
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。

626 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:38:49.28 ID:5y1tL0M+.net]
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ

627 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:12:24.21 ID:VpClr4jS.net]
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが

628 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH.net]
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www

629 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 15:56:23.21 ID:8MncpZHQ.net]
魔法(圧力)

630 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 16:24:11.77 ID:KSSQVEnP.net]
>>623
どこからの?
セブンイレブンとか?

631 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 22:33:53.67 ID:8MncpZHQ.net]
マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。



632 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 00:26:14.39 ID:EcUF0HHf.net]
そんな圧力あったかなあ

633 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 06:39:22.40 ID:KovswbEV.net]
>>625
所でLinuxもデスクトップ環境も
一つに統一したほうが良いのではないか?ん?

634 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 08:49:15.73 ID:/ybqtULG.net]
MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある

https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC

635 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 10:21:51.94 ID:KovswbEV.net]
PDFはアドビのプロプラフォーマットってイメージが抜けないw

636 名前:デフォルトの名無しさん [2019/09/03(火) 10:34:53.29 ID:gWEsYspA.net]
JavaだってSunのプロプラ言語だぞ

637 名前:667 mailto:667 [2019/09/03(火) 12:40:23.25 ID:JzHlK+VD.net]
今は違うけどね

638 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 15:04:07.63 ID:jfAsT/N5.net]
そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる

639 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 15:40:05.81 ID:KovswbEV.net]
Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる

640 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 16:56:31.60 ID:MR8tgZNH.net]
>>627
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。

641 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 16:58:35.78 ID:MR8tgZNH.net]
>>628
当時PDFは国際標準にこそなってなかったが,
オープンフォーマットだったし,様々な場面で使われてた。
ただ描画ソフトがクソ重たいのしかなかった記憶がw



642 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 17:26:28.25 ID:KovswbEV.net]
>>634
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ

643 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 17:35:15.54 ID:KovswbEV.net]
>>635
> オープンフォーマットだったし
PDFはオープンではありませんでした。
プロプライエタリだって言ってるだろ

644 名前:デフォルトの名無しさん [2019/09/03(火) 19:23:12.90 ID:i0SweFPn.net]
>>633
いつの知識なのかw

Windowsは表面的にはSJISで、内部ではUTF-16だ。

645 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 19:25:28.03 ID:KovswbEV.net]
> Windowsは表面的にはSJISで
ほらな、SJISじゃないって言ってんのにSJISだっていう
潜在意識レベルでそう思い込んでるから治しようがないw

646 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 19:51:10.42 ID:9BNoj6TJ.net]
WindowsというよりWindowsアプリが特定のOEMコードページやANSIコードページに決め打ちして作られてる物があるということだろ
他言語の状況は知らんけど日本語以外でも似たようなものだろうな

647 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:04:34.10 ID:VgehgunL.net]
Linuxの思想自体は多様性を重んじるのかもしれんが、ユーザーはそれに反して
「UTF-8以外死ね」みたいに言う奴多いよな。

648 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:08:34.33 ID:KovswbEV.net]
そうはいってもLinuxはASCIIと互換性がない文字コード(例 UTF-32)は死ねだからw
影響範囲が大きすぎて、LinuxはUTF-16とかUTF-32には事実上対応できないんだよね

649 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:51:19.99 ID:kvsGhJj2.net]
文字集合を符号化するのは、文字の区切れが判断できないからって解釈してんだけどあってる?

650 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 22:15:09.34 ID:18+sQUYN.net]
>>634
>多様性を重んじる。俺はそっちのほうが好きかな。

ところでホモにつきまとわれたらどうする?

651 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 01:38:53.56 ID:Gs/bLtCt.net]
一橋大学アウティング事件でググれ



652 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 04:00:00.76 ID:xGPrnpMI.net]
>>644
ホモであることは否定しないが、ホモは嫌いという俺の感情も尊重していただきたい
これが多様性だ!

653 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 09:16:30.39 ID:n47u8TF1.net]
>>645
ホモにつきまとわれて困ると友人にこぼしたら、
性癖を暴露されたとか言われて更に嫌がらせで自殺された事件?
ああいうの見てると、ホモの権利拡大とかしちゃいかんよなって思うよなあ

654 名前:デフォルトの名無しさん [2019/09/04(水) 18:11:05.05 ID:gX5VYMvu.net]
>>639
Windowsが作るシステムファイルもSJISですよ?

655 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 18:12:22.94 ID:vwhL3cv7.net]
>>648
そういうネタはいらんから

656 名前:デフォルトの名無しさん [2019/09/04(水) 18:52:19.95 ID:gX5VYMvu.net]
>>649
延々と嘘を書くのはやめてもらえませんか?

657 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 19:01:15.19 ID:vwhL3cv7.net]
ネタにネタをかぶせてもつまらんで

658 名前:デフォルトの名無しさん [2019/09/04(水) 19:24:35.38 ID:gX5VYMvu.net]
妄想か

659 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 22:41:17.45 ID:n47u8TF1.net]
まあWindowsはNTカーネルとは限らないからな

660 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 00:35:42.74 ID:rtvg+Hab.net]
>>653はNTカーネルに限ると完全Unicode対応って意味やで

661 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 00:50:59.59 ID:5i/MxHnj.net]
ここでUnicodeといっちゃうあたりの頭の弱さよ



662 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 01:09:51.35 ID:rtvg+Hab.net]
補足すると、Unicodeは文字列集合で
符号化方式がUTF-16やUTF-8など
どの符号化方式であってもUnicodeといえる

>>655
さて、何か言い返したい言葉は有るかね?

663 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 01:11:05.81 ID:rtvg+Hab.net]
どうせ言い返す言葉は無いだろうから
待ってても時間の無駄なので先に言っておくと
何も言わない or 捨て台詞はくだけ なら俺に喧嘩売らなければいいのにw

664 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 04:37:49.32 ID:5ZYYoPpa.net]
完全Unicode対応ならどの符号化方式も対応してなきゃダメだろ

665 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 05:59:20.80 ID:rtvg+Hab.net]
※ LinuxはUTF-16、UTF-32に対応していません

666 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:00:04.95 ID:rtvg+Hab.net]
※ MacもUTF-16、UTF-32に対応していません

667 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:48:35.75 ID:5ZYYoPpa.net]
他者を貶めたところで>>654が真実になることはない

668 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:54:53.66 ID:rtvg+Hab.net]
他者を貶めるってなんのこと?

669 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 07:53:38.03 ID:5ZYYoPpa.net]
>>662
NTカーネル以外のものは他者だろ

670 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 08:02:45.45 ID:rtvg+Hab.net]
じゃあNTカーネルに限ってはUnicodeっていうのは正しいってこと?

671 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 12:58:50.41 ID:5R9ffMew.net]
どーしても我流を貫きたいんだなw
まあ他人の人生だから干渉するつもりはないが,そういう生き方は苦労すると思うぞ?



672 名前:デフォルトの名無しさん [2019/09/11(水) 17:58:19.49 ID:quHYHgkx.net]
FEFF
https://en.wikipedia.org/wiki/FEFF

673 名前:デフォルトの名無しさん mailto:sage [2019/09/12(木) 12:27:59.62 ID:umd/llTn.net]
全然関係ないけどWPへのリンクはMWの短縮URLが使える。
https://w.wiki/8Ew

674 名前:デフォルトの名無しさん mailto:sage [2019/09/12(木) 12:43:49.99 ID:vEKot6kT.net]
本当に短縮したいところは日本語ページのパーセントエンコードされたところだがうまくいかないもんだな

675 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 09:23:49.73 ID:rpBkWpcK.net]
日本語のページも短縮URLにできるんだけど,そうじゃなくて?

676 名前:デフォルトの名無しさん [2019/09/13(金) 10:11:35.77 ID:wKEqF87n.net]
文字通り文字コードのエンコードを間違えてるんだろう

677 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 16:18:49.47 ID:nYKvQkSU.net]
[%E5は無効なエンコードです。メインページに戻る。]

678 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 17:19:54.63 ID:PF759nqS.net]
当たり前だけど問題ないな
https://w.wiki/8Hy

679 名前:デフォルトの名無しさん mailto:sage [2019/09/14(土) 00:14:10.89 ID:UZ9Fxxpp.net]
これ使われた順に生成されていくの?
そのうち4文字になるんかな

680 名前:デフォルトの名無しさん [2019/09/14(土) 00:23:57.48 ID:FV8dJ/wR.net]
絵文字などサロゲートペアが必要な領域をUTF-7で表現するとUTF-32よりもバイトサイズが大きくなる。まめな。

681 名前:デフォルトの名無しさん [2019/09/14(土) 11:56:27.23 ID:mIZ3m ]
[ここ壊れてます]



682 名前:5oP.net mailto: utf-7が使われてる環境とかデータとか出会ったことが無い []
[ここ壊れてます]

683 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 03:21:10.57 ID:TEajZO+5.net]
見せたろか

684 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 04:11:30.07 ID:LMFjfaUx.net]
見せて!

685 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 04:14:52.61 ID:vhYJbDpr.net]
utf7ってasciiじゃないっけ?

686 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 05:00:59.65 ID:cvkFPip1.net]
ここにはない

687 名前:デフォルトの名無しさん [2019/09/15(日) 10:05:21.58 ID:tu3q64lr.net]
>>678
違う

君の理屈だと中国はチベットの一部ということになる

688 名前:デフォルトの名無しさん mailto:sage [2019/09/16(月) 06:54:09.51 ID:vTAkg/qq.net]
じゃ,そういうことじゃん

689 名前:デフォルトの名無しさん mailto:sage [2019/09/21(土) 16:46:43.93 ID:7QW0JGF+.net]
UTF-8もUTF-7も「ASCII互換にしようと思えばできる」文字符号化方式で
UTF-16/32は端から過去互換性を捨ててるっていう理解OK?

690 名前:デフォルトの名無しさん [2019/09/21(土) 17:12:22.41 ID:icgczTg/.net]
互換の意味判ってるか?

691 名前:デフォルトの名無しさん mailto:sage [2019/09/21(土) 17:13:19.94 ID:AMltcnvP.net]
>>682
ちゃんと仕様読め



692 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 02:18:18.82 ID:tTe+mIIa.net]
>>682
意味がわからない

693 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 11:35:45.78 ID:LQCFANDg.net]
>>682
OK

694 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 12:48:42.82 ID:Uxh+z88Q.net]
684デフォルトの名無しさん2019/09/21(土) 17:13:19.94ID:AMltcnvP
>>682
ちゃんと仕様読め

685デフォルトの名無しさん2019/09/22(日) 02:18:18.82ID:tTe+mIIa
>>682
意味がわからない

686デフォルトの名無しさん2019/09/22(日) 11:35:45.78ID:LQCFANDg
>>682
OK

----
どういうことなの…

695 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 15:28:59.04 ID:yDiw/0G9.net]
教訓:5chで情報収集するな

696 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 21:23:59.11 ID:rg/me2jP.net]
互換って何なの

697 名前:デフォルトの名無しさん [2019/09/22(日) 22:18:40.20 ID:sBc79exV.net]
揚げ足取り終了。

質問。皆さんが普段使っている文字コード変換ライブラリでおススメはなんですか。

698 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 23:28:10.21 ID:JTFkWMft.net]
お勧めもなにもiconvかICUで大体用は足りる
それで満足しなきゃ自分で作るしかない

699 名前:デフォルトの名無しさん mailto:sage [2019/09/23(月) 08:58:26.51 ID:10n0KRvd.net]
文字コードの変換だけ?
いまどきのまともな言語環境なら変換元のエンコーディングさえ分かってれば標準機能で出来るだろうに
それとも全角⇔半角の変換みたいなのをやりたいってこと?

700 名前:デフォルトの名無しさん [2019/09/23(月) 11:35:21.05 ID:3qdqqJ07.net]
こっちはだめ
https://ja.cppreference.com/w/cpp/string/multibyte/wcstombs
https://ja.cppreference.com/w/cpp/string/multibyte/mbstowcs

これ使え
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/mbstowcs-s-mbstowcs-s-l?view=vs-2019
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/wcstombs-s-wcstombs-s-l?view=vs-2019

701 名前:デフォルトの名無しさん [2019/09/23(月) 14:54:10.02 ID:FPxFvDjY.net]
Windows SDK付属のデバッグ用ソースを見たところmbstowcs_sの文字コード変換は、Win32APIであるMultiByteToWideCharを使っているようですね。



702 名前:デフォルトの名無しさん [2019/09/23(月) 15:08:29.22 ID:3qdqqJ07.net]
MultiByteToWideChar / WideCharToMultiByte 最強

703 名前: mailto:sage [2019/09/23(月) 15:53:59.08 ID:ZLX7TvLd.net]
>>695
確かに便利でありがたかったです
https://mevius.5ch.net/test/read.cgi/tech/1434079972/53

704 名前:デフォルトの名無しさん mailto:sage [2019/09/23(月) 16:01:34.44 ID:51KZjw6P.net]
null-terminatedとそうでない場合の仕様の違いをちゃんと理解してなくて
バグった挙句によけいな1byte追加しちゃったりした思い出。

705 名前:デフォルトの名無しさん [2019/09/23(月) 16:24:42.75 ID:3qdqqJ07.net]
奇遇ですね
https://www.vector.co.jp/soft/dl/winnt/net/se472641.html

706 名前:デフォルトの名無しさん mailto:sage [2019/09/24(火) 00:23:12.23 ID:FsJR6FDp.net]
長い上にださい略し方だ…

707 名前:デフォルトの名無しさん [2019/09/24(火) 14:25:04.46 ID:oiN+60ax.net]
python3でlogging使ってsyslogに出力すると
ASCIIで出力してもなぜか最後に\0が付いてログが残る
鯖側のsyslogdの方で付いてるのかと思ったが
そうじゃなくてpython3が勝手に付けてるみたい
python3のstringがunicode化したときにバグ入ったんかな
python2のときはそんなこと無かった気がする

708 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 12:14:01.12 ID:9XZAk7bA.net]
ttps://bugs.python.org/issue12168

709 名前:デフォルトの名無しさん [2019/09/25(水) 13:11:07.39 ID:BmMtZLRv.net]
深い闇を垣間見た気がする

handler.log_format_string = '<%d>%s'
だと no attribute

handler.setFormatter(logging.Formatter('%(message)s'))
だと結局 \0 付いたままでした

710 名前:デフォルトの名無しさん [2019/09/25(水) 13:18:01.66 ID:BmMtZLRv.net]
コンストラクタ呼ぶ前に
logging.handlers.SysLogHandler.append_nul = False
で解決しました
thx!

711 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 14:09:59.51 ID:sdHp2tVC.net]
エンコードされた文字のバイト並びが
utf-8 と cp832 で同じ(にみえる)ものってどんなのがあります?
そもそも 3bytes と 2bytes なのは仕方ないのですが
utf-8 だと (xx yy zz)
みたいなのが
cp932 だと (xx yy) 00
逆に
cp932 だと (uu vv) (ww xx) (yy zz)
みたいなのが
utf-8 だと (uu vv ww) (xx yy zz)
みたいなのでも良いです
そもそもありえない?



712 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 14:11:59.88 ID:cBdVtg+x.net]
cp932 ってことはいわゆる半角カナも入れて良いのカナ

713 名前:デフォルトの名無しさん [2019/09/25(水) 14:14:32.79 ID:sdHp2tVC.net]
出来れば「美乳」みたいなクオリティ高いのが良いです






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<221KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef