Note: この記事は、3年以上前に書かれています。Webの進化は速い!情報の正確性は自己責任で判断してください。
読了。既に各所で話題になっている良書ですが、大規模システム運営におけるリスクヘッジについて良い参考書かと思います。Googleに倣うとかってより、システム運営に関する新たな視点みたいな感じで読み進めると実になるかなって印象。
内容は検索エンジンの仕組みやロジック、大量のマシンを巧く利用する方法、特性の違う幾つかの分散システムの説明とそれぞれの連携やマシン台数に関連する処理効率、そういったサービスを支えるGoogleの運用コスト、内部の開発体制など。公開された論文や幾つかの資料から、解りやすく外部から分析した感じ。
個人的に面白かったのは、以下の3点。
- CPUのクロックを20%上げると、消費電力は72.8%も増加する
- 逆に20%下げると、性能は13%低下するが消費電力はほぼ半分になる(63%まで落とすと1/4)
- 30億ドルほど投資してマシン40万台規模で5箇所のデータセンターを建設しており、これらを一つの巨大なコンピュータとしてデータ処理に利用しようとしている?
オーバークロックはやめようと思った。あと新しいデータセンターは2008年中に運用がはじまるとのことで、これ利用して新しい検索エンジンのフレームワークが動きそう。つまり、近いうちに大きな動きがありそうですな。主にSEO的な意味で。最後に、文中で紹介されていたTeck Talksから幾つか興味深いものをピックアップ。
- How To Design A Good API and Why it Matters
- 良いAPIはどのようにデザインすべきか
- 7 Habits For Effective Text Editing 2.0
- Vimを使って効率的な編集を行うためのノウハウ
- Performance Tuning Best Practices for MySQL
- MySQLの性能を引き出すためのチューニング方法について
Note: スパム対策が面倒なので、コメント投稿を廃止しました。以前のコメントは残します。
ご意見・ご要望はtwitter@sigwygかはてブコメントにて。