ほぼ雑記的メモ
以下与太話。 某といろいろやりとりして調べてみたんですが、UTF-8は先頭にBOM(EF BB BF)をつけてもつけなくてもよいというトンデモナイ規格らしい。 しか~し、もし先頭にBOMがあったりするUTF-8のシェルスクリプトやCのソースなどがあったりしたら、それは多分動かない。(動くとしたらエンジニアがどっかで泣いて直したということ) UTF-8のメリットのひとつに既存のコンパイラ等の改良を最小にするということがあったと思うんだけど、BOMが入った瞬間なんじゃこりゃの世界になるわけで、なんでそんな規格になっちゃったんですかねえ・・・ ちなみにiConvではこのBOMがあるUTF-8のファイルをEUCにしようとするとエラーになるんですが、これってやっぱりささやかな抵抗でしょうか?(まぁそれはそれで逆に不便なんだけど)
Powered by Red Leaf ( Rev. c78c769f2 ), © Issei Numata, 2007-2021