1 名前:858 [2007/12/24(月) 03:41:59 ] C++標準ライブラリの一つ、STLについて。 前スレ 【C++】STL(Standard Template Library)相談室 7 pc11.2ch.net/test/read.cgi/tech/1185986999/ 過去ログ・リンク・書籍紹介は >>2 以降
357 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 03:00:31 ] Winではstringは使うな。2バイト目が1バイト目とかぶってやがるからな。 wstringはサロゲートに注意して使え。途中で切るなよ。 Win98とかまだやってるカスはCStringでも使ってろ。 LinuxではstringでもEUCとUTF-8は2バイト目が1バイト目とかぶらないからまだ なんとかなるはずだ。 クロスにしたいなら文字列クラスは当然自前だろ? が俺の現状の認識
358 名前:デフォルトの名無しさん [2008/01/27(日) 03:02:31 ] >>327 ハァ?
359 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 03:09:34 ] >>358 へ?
360 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 03:14:40 ] >>357 追加でMac OS XはCFString使っとけ。以上。
361 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 04:50:39 ] >>357 OS 関係なくてエンコーディングの話だろ? Windows でも UTF-8 使えば問題ないし、 Linux でも Shift_JIS 使えば問題は出る。 クロスにしたければエンコーディングを OS 任せにしなければ良いだけの話。 たとえば UTF-8 を使うと決めれば std::string でもいけるでしょ。
362 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 05:05:46 ] >>361 だけの話・・って、実際にUTF-8でやったことないんだろ?試しにやってみなよ。 APIに渡すとき、コンソルに出すときすべてに変換をかます必要あるだろ? 文字リテラルはどうするんだ?ソース内のUTF-8はまだコンパイラのサポートが微妙だぞ。 現実的じゃないんだよ。OSが正式にサポートしてるSJISとかUTF-16以外を 内部エンコーディングにするのは。
363 名前:デフォルトの名無しさん [2008/01/27(日) 05:33:05 ] 1文字が何バイト使うかはどれ使っても一定ではない どれを使うか決まっていればどれ使ってもよい
364 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 05:48:20 ] UTF-32は4バイト固定。でも合成文字があるので結局同じ問題は残る。
365 名前:デフォルトの名無しさん [2008/01/27(日) 06:53:55 ] 一方ロシアはモールス符号を使った
366 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 06:59:29 ] 合成文字なんて捨てろ すべての文字を表現したいなんて無駄の極み
367 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 08:26:25 ] おいおい、放棄かよ
368 名前:デフォルトの名無しさん [2008/01/27(日) 08:37:31 ] >>362 入出力と多言語以外の問題はなし 日本語使うんだったらどれでも同じ 入出力にコンバートするのに手間がかかるかどうかだけ
369 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 10:08:29 ] 全部画像でおk
370 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 12:33:49 ] 16x16ピクセル(256ビット)のパターンで全ての文字を表現するとかどっかで見たな。
371 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 13:24:31 ] 文字コード総合スレだと思った つーかPDFでおk
372 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 13:25:37 ] ( д ) ゚ ゚
373 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 15:15:28 ] >>365 一方ロシアは画像を使った こっちの方がしっくりくるな。
374 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 15:52:02 ] >>370 宇宙の星にそれぞれ新しい文字で名前つけてもあまるだろw
375 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 16:26:01 ] 一文字32バイトは流石に先取りしすぎだな
376 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 16:37:26 ] string path = "c:\\機能仕様書\\01.doc"; path.find("\\"); こんなであぼーんするstringは危険としか言いようがない
377 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 16:47:52 ] そんなアホなことをする方が悪い。
378 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 16:55:52 ] 1文字に1GB
379 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 16:56:20 ] もう OCR でいいよ・・・
380 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 17:24:37 ] 人間様の認識能力を利用する形が最強
381 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 17:28:05 ] 人間なんてよく読み間違うじゃん
382 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 17:56:59 ] >371 CID(AJ15)のことか? あのコードも印刷以外に使うのは 結構アレなんだけどなー。
383 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:00:16 ] C++ メンバ関数内で スコープ解決演算子で classname::メンバ変数 の値変更するのと this->メンバ変数 の値変更するのは何が違うの?
384 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:04:56 ] struct P{int m;}; struct C : public P{ int m; void f(){ this->m = 0; this->P::m = 1; } }; みたいな話。
385 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:07:20 ] >>377 findが使えないstringって・・・カスめ
386 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:09:21 ] path[path.find("\\")] == '\\'になるじゃん、ちゃんと。
387 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:12:41 ] 返答ありがとう。 最初の this->m は C のオブジェクトのメンバ変数m this->P::m は何でしょうか?
388 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:14:13 ] >>386 まじか?
389 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:16:16 ] >>386 そりゃなるだろwww
390 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:16:42 ] >>387 P の m にきまっちょるだろう
391 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:22:57 ] >>386 マジレスすると「能」の2バイト目の「\」がfindで見つかっちゃったんです。 string s = SJISの日本語; はやっちゃだめなんです。初心者はみんなやってしまうんですが。
392 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:23:56 ] >>384 >>390 継承したときに変数名かぶった場合コウ書くんですね。 でも、多重に継承した場合、どう書くんだろう?
393 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:29:12 ] scope
394 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:35:01 ] >>392 間の型へ一旦 this をアップキャストすると良い。
395 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:35:31 ] >>391 だから、find とか使わない分には使っていいんだってばよ。
396 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:35:39 ] あー、ダイヤモンド継承か。 P1::P2::Pb::a = 100; みたいに、継承順を追いかければ指定できたような・・・
397 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:37:14 ] char []hoge = SJIS文字列; とかやって、 strchr( hoge, '\\'); ってまずいじゃん。 でも、「char配列にSJIS文字列入れるの禁止」って言うのはどうよ、みたいな。
398 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:37:36 ] 別の言語の癖が出てるぜ
399 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:37:59 ] >>397 そうそう。そんな感じ。
400 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:42:17 ] 文字コードの話って、荒れる割に全然面白くないし、有用な知見も得られないんだよな。
401 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:44:35 ] 結局毛唐が ASCII 以外どうでもいいと思ってるからな。
402 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:47:46 ] 何も考えずに動いていたCStringがなつかすぃ。。 そういえばなんでがんばってfind禁止のダウングレードのstd::string使ってるん だったっけ? だれかどこでも動くCString作ってぇぇ
403 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:49:03 ] >>393 >>394 >>396 ありがと。 やっぱC++はスゲーや。 Cのシンプルな文法に慣れきったオレには奥が深いぜ。
404 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:49:05 ] ドザは Windows のことしか考えないから困る。
405 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:52:20 ] どこでも動く? どこでもSJIS使うの?
406 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:52:31 ] Linuxとかカスいらねーし
407 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:54:02 ] Mac では SJIS 使わん事も無い。 UTF-8 や EUC も使うが。
408 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:57:06 ] ASCII自体が腐ってるからな。誰だよ、あんなコードにしたのは。
409 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:58:30 ] >>405 いや、できればマクロとかでプラットフォームごととか文字コードとか 切り替えられてさ、当たり前だけどfindとかも問題なく動いちゃうやつ。 CStringみたいに楽に使えて、でもUTF-8とか16とかも平気な感じ。 std::ustringみたいに統一しちゃってさ。boostとかかな。
410 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 18:59:32 ] findだけの問題ならすぐ解決するけどな。 ただ、SJISのままだと単純サーチにするしかないので効率は悪い。
411 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:01:36 ] >>410 そりゃWinの場合は内部的には_mbsstr呼ぶとかして高速化しる
412 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:01:45 ] wstringに自動変換する const char *n_str();と wstring(char*)を付ければ解決するような気になるけど?
413 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:01:47 ] >>406 普通sunだよな
414 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:05:17 ] Windows なら mbs 系でおkだが、 他の環境だとその手の関数あるんだろうか。
415 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:22:06 ] ついでに質問なのですが、TCHARみたいにstringとwstringを切り分けるにはどう すればよいのでしょうか?以下のようにしておく必要があるのでしょうか? 他にもっといい方法があるのでしょうか? #ifdef UNICODE #define tstring string else #define tstring wstring まだ98でもXPでも動かしたいので・・
416 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:23:31 ] 組み込み型にしてもいい位のデータ構造なのに クロスに作るのが難しいこんな世の中じゃ
417 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:25:51 ] >>415 とりあえず #define よりは typedef のほうがいいだろうな。
418 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:30:39 ] >>415 なにかわからないがよくないことが起こりそうな悪寒
419 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:41:43 ] charとwchar_tも切り替えないと。リテラル使ってるところがあったらそれもマクロで囲まないとね。 …めんどくさいでしょ。
420 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:45:37 ] つまり、C++0xのユーザ定義リテラルの登場を待てと
421 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 19:51:06 ] >>419 それは TCHAR と _T として既に用意されているだろう。
422 名前:デフォルトの名無しさん mailto:sage [2008/01/27(日) 23:53:01 ] >>415 typedef std::basic_string<TCHAR> tstring; >>362 361のようなことを現実にやれるソフトウェアでは、 多言語対応のため、文字列リテラルの大半はソースコードに含まれないとか、 APIはラッパー層があるから変換も余裕とかそういう次元にいると思う。
423 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 00:52:04 ] 実際文字列リテラルをまったく含まないのはたいへんだぞ〜。 メッセージ的なものはともかくfind(":")的なパース類もすべてfind(COLON)とか にして事前にUTF-8で用意しておかなくちゃいけなくなるし、全WinAPIをラップする のはいよいよ無理だろうに。カレントディレクトリ一つ取るのも GetCurDir(string& s){ TCHAR t[PATH_MAX]; ::GetCurrentDirectory(PATH_MAX, t); #ifdef UNICODE Utf-16からUTF-8に変換 #else SJISからUTF-8に変換 } 的にすべてのラップ関数を用意してあげなきゃいけなくなるし。。
424 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 00:57:46 ] > find(":") 他に理由がなければ、ASCII分はそのままソースに書いていいと思った。
425 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 00:59:56 ] そんなわけがないだろ。
426 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 01:02:52 ] A 系使えば大丈夫。
427 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 01:34:22 ] せっかくWinがUTF-16なのに内部エンコーディングをUTF-8にして、API呼ぶたびに UTF-8からUTF-16に変換はちょっとやだなあ。 全てのAPIをラップする開発コストに加えて、実行時の変換コストまでかかるし。。 やっぱWinはUTF-16でいきたいね。
428 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 01:37:11 ] いい加減スレチガイだということに(ry
429 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 09:45:10 ] std::string/wstringは最重要のコンテナだしスレ違いとは思わんが・・ 結局文字コード周りはいまいちなのがわかるだけなんだよなあ。。
430 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 14:04:09 ] 話の流れぶった切って申し訳ないが言わせてくれ。 なんか良スレの悪寒。
431 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 15:13:29 ] 日本語と中国語の区別ができない腐れた文字コードそれがUnicode 中国が大体元凶だけどな
432 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 15:26:40 ] > 内部エンコーディングをUTF-8にして、 > API呼ぶたびにUTF-8からUTF-16に変換 Dのことかー!
433 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 16:15:55 ] >>431 4.0からは区別できますよ
434 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 16:34:19 ] >>431 言語の区別ができない文字コードはUnicodeに限らないんだよ
435 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 17:12:12 ] ユニコードは本格的多国語環境や16ビット固定長を宣伝文句にしていたからねえ。 次々と撤回して期待外れだったよな。
436 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 17:37:19 ] だから、多国語ではなく多文字だったと。
437 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 17:44:51 ] 見苦しい
438 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 18:07:33 ] ユニコードって、UNIXの文字コードだったから ユニコードって言うんだよね。
439 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 18:27:51 ] おまいらいい加減スレ違いだぞコノヤロー。
440 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:13:14 ] >>438-439 しらんかった
441 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:15:54 ] ユニコード表みるとハングルが異様なほど文字数が多い 中国だけじゃないぞ
442 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:24:34 ] >>441 ハングルは現在全く使用されない組み合わせも全部作るように 韓国が強く要求したんだと それでbatangが異常に膨れている。 韓国死ねよ。
443 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:30:25 ] >>442 にほんだって「あ゛」とかいれてるじゃん。
444 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:35:52 ] unicode.org/charts/normalization/chart_Hiragana.html ここをみるかぎり、「あ゛」は単一のコードとして存在しないようだが
445 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:57:49 ] ごめん、勘違いだったかも。でも日本人だって「あ゛」いれたいしぃ。 可変長で6バイトでもよくなったんだから、なんでもいれていいと思う。
446 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 19:59:46 ] >>443 やあチョーセンジン
447 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 20:06:35 ] >>442 欧米人にしたらCJK死ねよなわけだが。 なんでなかよくできんもんかね。
448 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 20:10:36 ] 仲の良い隣国つーのは歴史上稀なわけだが。 稀つーかあるのか。
449 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 20:13:08 ] 日本だって古代は中国と仲良かったじゃん。 あと、中国と韓国。 どちらも、主従関係だけどw
450 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 20:42:13 ] 「仲良かった古代」、って遣唐使廃止まででそ。1000年も前の話だし。
451 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 21:41:37 ] 当時は海ってのは命がけで渡るもの凄い大きな壁だったわけで、 隣国っつーよりは、日本とアメリカ・・・は言い過ぎかもしれんが、 そんな感じだったと思うぜ。
452 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 21:47:52 ] ♪ ♪ \\ ♪ 僕ら〜はみんな〜 生〜きている〜 ♪.// ♪ ♪ ♪ \\ ♪ 生き〜ているけど チョンは氏ね〜 ♪// ♪ ♪ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧∧ ♪ ♪ ∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*) ♪ (゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧ ♪ ∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)∧ ∧(゚0 ゚*)♪ ─♪──(゚0 ゚*)| U(゚0 ゚*)| U(゚0 ゚*)| U(゚0 ゚*)| U(゚0 ゚*)| U(゚0 ゚*)| U | U.| | | U | || U. | || U. | || U. | || U. | |〜♪ ♪ | | U U. | | U U | | U U | | U U | | U U | | U U ♪ U U U U U U U U U U U U
453 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 22:06:43 ] www.open-std.org/jtc1/sc22/wg21/docs/papers/2007/n2271.html こんなのがあったのね。知らんかった 確かにゲームや組み込みではSTLそのまま使うのはキツイわな
454 名前:デフォルトの名無しさん mailto:sage [2008/01/28(月) 22:11:55 ] >>447 電脳創世記っていう本にあったんだが、そもそも「CJKその他ヨーロッパの小国死ねよ」 ってやってる連中はアルファベットしかないコードしか使ってなくて、それを日本人が 「文字コード問題は俺たちが解決して業績上げますからメリケン共は口出ししなくても良いよ^^」 って挑発して今の流れになったんだと思う。
455 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 02:36:05 ] >>453 ゲームがメモリをキツキツに使うからって、数バイト〜数十〜数百バイト単位の 標準ライブラリのメモリ確保までキツキツにしても、あんまり関係ないと思うんだ。 どうせ画像やサウンドデータが1個増えればだけでそこらへんの努力は 吹っ飛ぶもんじゃないの?処理負荷にしてもさ。
456 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 02:42:20 ] >>442 漢字使用国がそれだけは言っちゃいかんだろ 「じゃお前ら文字数が多すぎるから統合ね」と言われても何も言い返せない むしろ韓国みたいにもっと初期の段階で分離しろと言い張れば分離できたかも しれないのに日本人おとなしすぎ
457 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 02:55:03 ] 文字、文字コード関係はこっちいけよ