Scuttleのタグの組み合わせページは機械的アクセスが増えすぎる

Google Analyticsの情報ばかり見ていて気がつかないうちに、Drupal.cre.jpscuttle.cre.jpのあるPHPサーバのアクセスが、人間のアクセスに比べて馬鹿馬鹿しいほど多くなっていました。

そのため、scuttle.cre.jpのテンプレートをいじって、機械的アクセスばかりになるページが必要以上に増産されないようにしてみました。

AdSenseでは人は1000PV/日と50PV/日くらいしかないのに、20000~30000リクエスト/日と10000リクエスト/日以上とになってまして。なるほど、これだけ機械的アクセスが多いんでは、PHPサーバが重いわけですね。検索ロボットとSpambotとRSS取得の山。

今の感じですと、2GBメモリのマシンでは、月間100万PVくらいでMySQL+PHPでへこたれてくるなあ。まあデュアルとかクアッドなら数倍行けそうだし、DBと別マシンにすればかなりなんとかなりそうですけどね。

でまあ、Scuttleはなんかタグの組み合わせすべてがページになるので、機械的アクセスが脹れ上がるのだと判明。wwwstatした結果をメールしていたのが、sendmailのエラーになるほど、酷いことになっていました。

そこでtemplates/sidebar.block.related.phpを編集。

 
<a>">+</a>
 

を削除(正確には編集して+だけ表示するようにした)。

例えばhttp://scuttle.cre.jp/tags/publishingで右の関連するタグのとこに+ amazonってのがありますよね。元々は、その+のとこに publishing+amazon のリンクがあって、さらにさらにと、繋がりのある大量のタグ組み合わせ全てにページが生成されていたのでした。

URLが増えてくると組み合わせで抽出ってのが意義深いのは確かで、多人数が利用してタグが豊富につくようになると特に必要になるんでしょう。しかしまあさすがに人より百倍もアクセスがあるとたいへんなんで。小規模に運用するときのチューニングとしてはおすすめです。

ScuttleはコードそのものはDrupalほど重くはないけど、キャッシュとかしないのでDBにはけっこう負担が掛かってるみたいな感じですかね。

この記事へのトラックバックURL:

http://drupal.cre.jp/trackback/836


この記事をブックマーク

人気コンテンツ