TB対策

最近またSPAM TBがうざくなってきました。

今でも日本語を含むブログサイトじゃないとTB出来ないよう自分で手を加えてるんですが、もはやこれだけでは対処は不十分のようです。

最近多いのは日本語コードが間違ってるTB。

しかもこういうTBは機械的に送ってるのがほとんどでロクなもんじゃないのが多いんです。というわけで、Iconvを利用してとコードが間違ってるものは受け付けないようにしました。

いじるのは

jayallen/MTBlPing.pm

ここにさくっと8行くらい追加してみました。

ただ普通にEUC-JPに変換しちゃうとBOMとかWindowsの「~」でこけるのでそのあたりの対処をいれつつ。完成。BOMでこけるのはIconvの不具合じゃないですかねぇ・・

ということで、この状態でしばらく様子を見てみます。

以下与太話。 といろいろやりとりして調べてみたんですが、UTF-8は先頭にBOM(EF BB BF)をつけてもつけなくてもよいというトンデモナイ規格らしい。 しか~し、もし先頭にBOMがあったりするUTF-8のシェルスクリプトやCのソースなどがあったりしたら、それは多分動かない。(動くとしたらエンジニアがどっかで泣いて直したということ) UTF-8のメリットのひとつに既存のコンパイラ等の改良を最小にするということがあったと思うんだけど、BOMが入った瞬間なんじゃこりゃの世界になるわけで、なんでそんな規格になっちゃったんですかねえ・・・ ちなみにiConvではこのBOMがあるUTF-8のファイルをEUCにしようとするとエラーになるんですが、これってやっぱりささやかな抵抗でしょうか?(まぁそれはそれで逆に不便なんだけど)

Posted by issei

カテゴリ: 雑記