リファラSPAMをどうはねるか

 管理者さんは、いかがわしいサイトへのリファラを仕込んでくるサイトのhost名、アドレス、ユーザーエージェントをログ解析でつきとめて、アクセス禁止にするという作業に飽き飽きしてしまったらしい。アクセス禁止にしても、また違うプロバイダのマシン経由で仕込まれるといういたちごっこになるわけだ。それもそのはず、彼らが踏み台にするオープンプロキシは、それこそネットワークにつながるDVDレコーダーの数くらい転がっている危険性があるのであるから、全世界のほとんどをアク禁にするくらいのポリシーでなければ防御できないことになる。
 現在試行中の、書き込まれたものを巡回して消してゆくという方法であるけれど、過去の日記のリファラの浄化には良いが、結局どういうリファラが書き込まれ、そのうちのどれだけを消すことができたのか、ふたつのログをつきあわせないとわからない。
 さて、無責任にthink differentしてみると、リファラに特定の下品な文字列を含むアクセスを謝絶するというポリシーでapacheを動かすなら、対策後うまくはぢけるようになったかどうかも、すり抜けたリファラも、ログ解析で一目瞭然ではないかということだ。はぢくべき単語が無限に増えていくはずもないので、サーバーにかかる負担も有限ですむ。ぐぐればちゃんと先達もいらっしゃるわけで…。
 それはそうと、ログをざっと見せてもらうと、リファラすぱむとコメントすぱむのホストアドレスが同一の場合もある。一回のアクセスで両方同時にやっているケースはないから、人は違うのであろう。[Momonga Linux]

本ブログではamazon associate広告を利用しています。