- 970 名前:デフォルトの名無しさん mailto:sage [2021/11/12(金) 23:33:56.40 ID:qmhW9zZv.net]
- >>945
[補足] このプログラムは、1バイトずつ読み取っているが、文字符合は、このままでも、 無修正で ASCIIだけでなく、SJISやUTF8やEUCにも対応している。 後者のような符合では、例えば、SJISの"あ"の文字だと、1文字単位ではなく、 1バイトずつ処理され、2回ループが回るが、問題ない。 UTF8だと3回ループされる。 つまり、このプログラムでは、SJISの1文字は、2文字のように UTF8の"あ"の文字は、3文字のように処理される。 しかし、それでも結果的には問題ない。 なぜなら、0x0aや0x09は、多バイト文字の中には含まれてないから。 ただし、SJISの場合、\ の文字コードが含まれているので注意が必要ではあるが、 今回は問題ない。
|

|