技術評論社テクニカルセミナー「クラウド時代のサーバ/インフラ運用術」Review

7月29日、8月26日の両日、技術評論社 テクニカルセミナー ⁠クラウド時代のサーバ/インフラ運用術」が開催されました。同セミナーでは、大規模Webサービスプロバイダの運用担当者が語る運用のテクニックや、仮想化技術をベースとするクラウドシステムの統合監視のポイントなど、サーバ/インフラ担当者なら知っておきたい内容が紹介されました。ここでは、そのセッション(東京開催時)の模様を紹介します。

セミナー会場の模様
セミナー会場の模様

会員数2,300万人を超えるmixi.jp! そのサービス運用の舞台裏とは

大規模システムに成長したmixi.jpを舞台に、予測できないもの、突発的なものへの対策や運用監視の仕組み、工夫している点などが紹介されました。

完全な物理環境ながら、クラウドライクな運用を実現

最初のセッションは、株式会社ミクシィのシステム本部、インフラグループの加藤のりひで氏、アプリ運用グループの小池知裕氏による「会員数2,300万人を超えるmixi.jp! そのサービス運用の舞台裏とは」でした。

加藤氏が「mixiインフラの設備」としてmixiのインフラ面について解説。所属するインフラグループでは、mixiサービス向けに最適化されたホスティング環境を提供しており、データセンター、サーバハードウェア、ネットワーク、ハードウェアロードバランシングを担当していることを紹介しました。

ミクシィ 加藤のりひで氏
ミクシィ 加藤のりひで氏

その中で、サーバを合計4千台以上保有しており、スペックを数種類に標準化し、数ラックをひとつのユニットとしていることを述べました。サーバには増強用に準備しているものもあり、サーバラックやネットワーク機器は納期に数カ月かかるため、プロダクト部門からサーバ増設のオーダーを受けて準備するのでは間に合いません。そこで、3カ月後、6ヵ月後に何が必要になるのかを常に考え続ける必要があるといいます。こうした標準化と空気の読み方で先行調達しているおかげで、プロダクト部門からはオンデマンドに設備が提供されているように見えるわけです。

また、サーバはもはや消耗品感覚で、捨てることを躊躇していると逆に余計なコストがかかってしまうといいます。現在は、将来のグランドデザインを試行しており、エッジの広帯域化やロードバランサの効率利用、IPv6への対応などの検討を進める一方、社内IaaSなども考えていると語りました。

続いて登壇した小池氏による「mixi.jpのシステム構成・運用」では、mixi.jpの可用性における主管部門であるアプリ運用グループについて述べ、負荷対策や障害対応、ミドルウェアの管理などを行っていることを紹介しました。

ミクシィ 小池知裕氏
セミクシィ 小池知裕氏

サーバのシステム構成においては標準化を心がけており、具体的には、アプリケーション向け、キャッシュ/データベース向け、コンテンツ向けに性能を特化させた3種類のタイプに分けています。約4千台のサーバを、わずか8名で運用しているため、負荷増大時の追加や障害発生時の入れ替えを容易にできるよう工夫していることがポイントといいます。

最後に小池氏はSNSならではの突発的な負荷として、⁠あけおめ」⁠ことよろ⁠⁠ などの季節的なイベント、⁠バルス!」といったテレビ番組放映時の影響、⁠川島! 長友!」といったスポーツイベントを挙げ、予測できるものはもちろん、予測できない高負荷に対しても、インフラグループが用意しているリソースをすぐに投入して増強できるというクラウド的な側面を強調しました。最近のトピックスとして、 ⁠AKB48」の総選挙による高負荷にも対応できたエピソードを披露し、大規模Webサイト運用のセッションを締めくくりました。

クラウドサーバで実演する 短時間システム構築!

稼働までに時間がかかる新規システムの構築やシステムの追加。その解決策として、エンタープライズ型クラウドホスティングのデモを交えたセッションが行われました。

Webベースのコントロールパネルから容易に仮想マシンを構築

2番目のセッションは、NTTスマートコネクト株式会社の四方直樹氏による「クラウドサーバで実演する短時間システム講築!」です。四方氏はまず、今回のセッションでデモを紹介するクラウド型仮想ホスティングサービス「SmartFLEX」について概要を解説。同杜のデータセンタ内に設置された物理リソース上に、お客様専用の仮想プラットフォーム環境を構築し・ネットワーク経由でオンデマンドに利用できるサービスである点、物理サーバと物理ストレージを2台用意し、冗長化された ⁠HAプラン⁠⁠、ひとつの物理サーバを利用する「シングルプラン」を用意している点を紹介しました。

続いて、SmartFLEXを使用して実際にシステムを構築するデモを行いました。従来のサーバ構築は、設計から始まり機器の調達、設置、OSのインストールやネットワークへの登録、検証、セッティングなど多くの手順を踏まなければならず、場合によっては利用開始まで数ヶ月かかることも珍しくありません。また、構築において人的ミスが発生する可能性もあり、担当者には大きな負担となっていました。

しかし、SmartFLEX は、Webブラウザ経由でアクセスできる「コントロールパネル」を使用して、手軽に自由な構成で仮想マシンを構築、変更できるため、従来のサーバ構築の課題を解決することが可能です。

サービスにログインすると、サーバラックを模した画面が表示され、仮想マシンの新規作成は「新規マシン」ボタンから行います。まさにオンラインショップでPCを購入する際、CPUやメモリ、ディスク容量などをカスタマイズするような感覚で仮想マシンを作成できます。

NTTスマートコネクト 四方直樹氏
NTTスマートコネクト 四方直樹氏

また、同様の手順でファイアウォールやロードバランサを作成することも可能です。仮想マシンへのOSインストールには ⁠テンプレート」が用意されており、よく使用されるOSの構成があらかじめ揃っています。管理者はプルダウンメニューから選択するだけで設定できます。面倒なOSなどのインストールの手間が省けることは大きなメリットとなります。

さらに、CPUやメモリ、ディスクサイズなどはスライダで設定でき、従来のようなマシンを開けて機器を挿し込むといった手間や、その際のミスによって起こる動作不良の可能性も排除できます。物理サーバとネットワークの設定も、あらかじめ登録されている項目をプルダウンメニューから選ぶだけと非常に簡単です。設定が完了したら、内容を確認し「新規作成」ボタンをクリックすることで仮想サーバが作成されました。

これまで作成に要した時間はわずか1分半から2分。作成したサーバは画面上のラックにリアルな画像として表示され、電源ボタンなども実際に使用できます。また、⁠コンソール」を起動することでIPやApacheを設定、サーパとして利用可能になります。

さらに、コントロールパネルではサーバの動作状況をモニタでき、負荷が高いときにはその場でスペックを変更できます。サーバの複製も瞬時に行えるので、担当者の管理・運用の手間を大幅に削減することが可能です。四方氏はさらに、ロードバランサによって負荷分散を行うデモも紹介しました(具体的な作成手順などについては、WebサイトでFlashムービーが公開されています⁠⁠。

これまで数日から数カ月を要していたサーバ構築が劇的な速さで、しかも容易にできることを証明したデモに、サーバ構築の今後の運用のヒントを見たと、来場者は惜しみない拍手を送っていました。

震災を経験した日本における仮想化&クラウド化時代の統合監視システムの構築の仕方、運用の仕方

「想定外」の出来ごとへの対応、ディザスタリカバリ対策、消費電力対策などの要望に対し、新統合監視システムの技術と、構築・運用の仕方が紹介されました。

真の「統合監視システム」とは? そして今後のクラウドはどうなる?

最後のセッションは、株式会社クラウド・スコープ・テクノロジーズの技術部部長である林經正氏による「震災を経験した日本における仮想化&クラウド化時代の統合監視システムの構築の仕方、運用の仕方」でした。

林氏は2005年にNTTにおいて、ネットワークセキュリティの研究開発、また米国でベンチャー企業や新規事業の立ち上げに従事しました。その後ベンチャー企業でモバイルWebマーケティングの世界を開拓、そこで「ノンシフト24時間365日運用」を2年間経験し、運用の大変さと大切さを身をもって知ったといいます。2008年からは現会社において、仮想化システムやクラウドシステムの監視システム ⁠MoonWalker」などの開発、DC事業や通信事業会社のBPRを担当していると、プロフィールを紹介しました。

クラウド・スコープ・テクノロジーズ 林經正氏
クラウド・スコープ・テクノロジーズ 林經正氏

まず、統合監視についての質問を参加者に投げかけ、その解として、統合監視は「サービス ⁠アプリケーション)監視」⁠サーバ監視」⁠ネットワーク監視」の3つを行うことが大切であると述べました。その理由は、それぞれ利用する技術が異なるためで、多くの企業では監視対象ごとに管理者が異なり、インシデント発生時の原因究明に時間がかかっています。しかし、これらを統合化することによって、障害復旧までの時間を最大3分の1まで短縮できるといいます。

また、仮想化技術は「あたかもリソースをユーザが専有しているかのように見せる技術⁠⁠、クラウド技術は「ネットワーク上で利用するリソースを点在させる技術」であるとし、ユーザとプロバイダが監視する対象にも違いがあると説明しました。

さらに、クラウドサービスの種類(SaaS、PaaS、IaaS)によっても監視対象が変わってくるほか、サービス、仮想リソース、物理リソースの関連性を構成情報として管理・監視することも必要であると強調しました。

そして今回の震災を機に、本当のクラウド化が始まったと語り、⁠落ちないシステム、サービス⁠⁠、⁠広域ネットワーク分散の利用(構築⁠⁠、⁠監視拠点の分散化」をポイントに挙げ、特に広域ネットワーク分散でいかに運用コストを低く抑えるかを課題に挙げました。

今後、ビジネスに勝つために重要な点について、林氏は「運用費の削減⁠⁠、特にSpoofing対策を含む「セキュリティ対策の強化⁠⁠、⁠都市から離れた地方の地理を利用したクラウドビジネス⁠⁠、2011年度中に「特損」を活用したインフラ強化など「社会情勢の利用⁠⁠ と指摘。また、最新技術と今後の統合監視では、クラウドにもSLAが要求される時代になる点や、クラウドとクラウドを結びつける「インタークラウド技術⁠⁠ の確立、ネットワークの仮想化技術、クラウド化技術の確立、HTML5上のサービス開発の促進をポイントに挙げ、仮想化&クラウド化時代の統合監視システムのセッションを締めくくりました。

おすすめ記事

記事・ニュース一覧