うるさい素人

質を重んじ物事の本質を見抜く! 脱サラして英語発音講師を目指すオヤジのブログ

HP管理において招かざるロボットの対策を始めた

4月にHPを立ち上げ後、サーバーのアクセスログを毎日チェックしているのですが、攻撃みたいなものやロボットによるアクセスの多さに驚きます。

 

公開後、まだ通常の訪問がないうちから、攻撃と思われる特定パターンのアクセスが来はじめました。それは対策したのですが、その後も不要なロボット(クローラー)がいっぱい来るようになり、ブロック対策を始めました。

 

Google や bing などの検索エンジンのロボットが来るのはわかりますし、それは必要なことです。でも、そういう有益なもの以外に、世界中から「なんじゃ、こりゃ?」というのがいっぱい来るのです。

 

「攻撃やロボットなどによるアクセス」は、「本当に見に来てくれたと思われる人間によるアクセス」の1000倍ぐらいはあると思います(まだ訪問者は僅かなので、そういう比率になる)。特定の攻撃に対しては早期から対策(門前払い)するようにしたので、対策が緩ければ、もっとすごい量のアクセスが来ていただろうと思います。

 

しかも、「本当に見に来てくれたと思われる人間によるアクセス」以外は、すべて「海外から」なんですよね。

 

日本からの巡回は1つもなし。すなわち、日本の検索エンジンは1つもありません。わかりきっていたことですが、改めて強いショックを受けました。「日本人が、あるキーワードで検索をして何が表示されるか」というのは、いわずと知れたあの会社がほぼ完全支配している訳です。

 

「日本人の知識と世論の調整権を完全に握られている」という感じでしょうか。恐ろしい話です。

 

私は、かつて20年以上前にもHP運営をしていたことがあります。セキュリティもSEOも当時からありましたから、基本的に、やっていることは当時とほぼ同じなんです。でも、こんなふうではなかった。

 

普通に、正規の訪問者がメインで、ロボットは時々来るぐらい・・・海外からのアクセスなんてたまにあるぐらい、でした。

 

今の若い方には信じてもらえないかも知れませんが、昔は日本の検索エンジンが多数あったのです。ある検索エンジンで調べて、思うような結果が出なかったときは別の検索エンジンで調べる、なんてことは普通にやっていました。テーマ別おすすめサイトのまとめ(リンク集)なんかもたくさんありましたね。今よりも、よっぽど自分の考えに合った情報に出会えたような気がします(当然、絶対数は少なかったのですが)。

 

話がそれました。

 

前述のような有様であっても Google などのロボットがサイトの内容を見に来るための巡回は必要なことです。しかし、「それ以外のロボットはいったい何なんだ?」という疑問が生まれます。

 

よく来るロボットについて調べるうち、だんだん素性がわかってきたのですが、「サイト運営者にとっては何も嬉しくないものがほとんど」だと言えます。

 

中には、確証はないのですが、どうやら、サイトのコンテンツをコピーしていって別のものを作る。要は、パクって行って別のコンテンツの材料にする、というものすらあるようなのです(あくまで憶測です)。

 

もし、そういうものがあるのなら容認できないと思い、対策を始めました。

 

ロボットの身元偽装などは普通にあるので、なかなか難しいのですが、「明らかにこれは不要」と思われるものを「.htaccess」というファイルに記載してブロックしていくことにしました。

 

完全にブロックすることは無理。でも、放置するよりはうんとマシです。

 

インターネット空間の治安は、思っていたよりもはるかに悪い印象です。本来の私の課題は別のこと。こんな作業をやっているのも悲しい感じがしますが、自分でそこそこ納得できる管理をしたい性分なので、頑張ってやっていきたいと思います。