前回 に引き続き、グループスのインフラグループに在席するエンジニア、伊東弘満氏、河村喬樹氏、そして富樫英雅氏の3名にお話を伺っていきます。今回は、グループスにおけるクラウド利用のスタンスや、これまでのトラブル事例などについて話していただきました。
クラウド環境の活用も模索するグループス
ソーシャルゲームを運用するためのインフラとして、仮想サーバを利用できる「IaaS(Infrastructure as a Service) 」が広く使われています。要求されるサーバリソースがユーザ数によって大きく変動するソーシャルゲームでは、必要なサーバ台数を事前に見極めることが極めて困難です。そこで、サーバを柔軟に増減できるIaaSを利用し、事前の予想よりもヒットすれば仮想サーバの台数を増やして処理能力を高めるという方法を採るケースが少なくありません。しかしグループスでは、ここまでオンプレミス環境を中心にソーシャルゲームを運用してきました。その理由について、伊東氏は次のように説明します。
伊東弘満氏
「最も大きな理由は規模感、コストバランスの問題です。現状でグループスが使っているサーバの規模をクラウド上で実現しようとすると、おそらく数倍のコストがかかるのではないでしょうか(伊東氏) 」
確かに単位時間あたりの料金で利用できるIaaSは一見すると安価なようですが、実は長期間使うことを考えると決して安くないというケースが少なくありません。そもそも長期間運用することが前提であり、なおかつ大量のサーバを利用するのであれば、オンプレミスのほうがコストを抑えられるというわけです。
しかし、クラウドにもメリットはあり、オンプレミス環境とどう使い分けるかが重要と伊東氏は話します。ただ、オンプレミスとクラウドをどのように使い分けるかは悩ましい問題のようです。
「たとえばサーバの一部をクラウド環境で運用するという話になると、オンプレミスとクラウド間の通信がボトルネックになりますよね。とくにソーシャルゲームでは『5秒ルール』が存在するので、レスポンスを考えると機能やレイヤーで使い分けるのは厳しいと思います。ゲーム単位でクラウドとオンプレミスを使い分けることも考えられますが、そうするとサーバ台数が圧倒的に膨れてしまい、コスト的に合いません。このようにいろいろと考える部分があり、現状はどのようにクラウドを活用すべきか探っている段階です(伊東氏) 」
ネットワークがボトルネックに! グループス“炎上事件簿”
さて、続けてグループスでのインフラ運用において、最もたいへんだった“ 事件” を聞きました。それに対し、想定以上のアクセスが殺到したときの体験を話してくれたのが河村氏です。
河村喬樹氏
「ある新作ゲームをリリースしたときに、大量のアクセスが発生したんですね。それでサーバがダウンしたことを通知するメールが3分おきぐらいの頻度で送られてきたときは、心臓が痛くなりました(笑) 。このときは、高負荷状態になっているところを1つずつチェックし、問題となっている部分を修正するという作業を続けました。ちなみに、このときの大きな原因にネットワークの帯域不足があったんです。何しろ想定の3倍というアクセスだったので、予想以上に帯域が圧迫される事態になっていました。それで急遽、帯域の拡大とネットワーク機器の設定変更、さらに関連する諸々の作業を行ったのですが、早く安定した環境でプレイしていただきたいという一心で、3時間足らずでこれらの作業を完了させました。このときは本当にたいへんでした(河村氏) 」
このように苦労した経験は、その後のサーバ環境の構築に活かされており、現在ではこれほど大きなトラブルはなくなっているとのこと。ただ、日常的な作業の中でドキっとすることはある、と話してくれたのは富樫氏です。
富樫英雅氏
「私が一番ヒヤヒヤするのは、サーバを監視するための設定でミスしたときですね。サーバに異常があった場合はメールで通知するしくみになっているのですが、監視しているサーバが多いので、設定をミスすると大量のメールが届くんです。テスト時は自分のメールアドレスだけに送るように設定していますが、それでも100通以上のメールが飛んでくるとビクっとしますね(笑)( 富樫氏) 」
個人のチャレンジを奨励するグループスの社風
最後に、グループスでインフラエンジニアとして働くメリットについて伺いました。その点について、3名とも「やりたいことができるところ」だと声をそろえます。
「単にやりがいがあるだけでなく、全員がスピード感を持って運用を行っているという点はグループスならではだと思います。あとはやりたいことができる点ですね。私の場合は負荷の高いインフラ環境を運用したかったのですが、その点については存分に経験できました(河村氏) 」
「やはりチャレンジできる職場だということが一番ですね。実は、現在Hadoop環境を構築しているのですが、それも私がやりたいと手を挙げて始まったんです。このようにチャレンジするための機会が与えられるのは、グループスで働く大きなメリットだと感じています(富樫氏) 」
「グループスでは何かをしたいといったとき、『 できるかどうか』ではなく『できそうかどうか』で判断するんです。そこで『できそうだ』と判断できれば、ある程度任せてチャレンジしてもらうようにしています。そのときに言っているのは、結果にはこだわってほしいということですね。マネージャとして求めるのはその点だけです。もう1つグループスで働くメリットを挙げるとすれば、やはりWindowsやLinuxなどさまざまな環境を経験できることでしょうか。そういう意味で、エンジニアとして成長するための『場』は提供できると思います(伊東氏) 」
インフラエンジニアとして経験を積み、スキルアップしていくことを考えた場合、新しい技術に積極的にチャレンジできる職場であることの魅力は大きいでしょう。また、140億PVを超えるサービスの運用を経験できること、そして多様な環境に触れられることも、その後のキャリア形成において大きな強みとなりそうです。