8月24日、アマゾンウェブサービスは、21日に発表された新しいストレージサービス「Amazon Glacier」(グレイシャー)の勉強会を開催しました。ここでの解説を元にGlacierの概要を紹介しましょう。
Amazon GlacierとS3の違い
Amazon Glacierは、低頻度のアクセスを想定し、運用コストを低く抑えたバックアップ/アーカイブ用のストレージサービスです。Amazonのストレージサービスとしては「Amazon S3」がよく知られていますが、これと比較してみましょう。
| Amazon Glacier | Amazon S3 |
データアクセス | (読み出し)に長時間 | 読み書きともパフォーマンス高 |
耐久性 | 99.999999999%(イレブンデジット) | 99.999999999%(イレブンデジット) |
月額費用 | $0.012/GB(東京リージョンの場合) | ~$0.13/GB |
データの耐久性などはまったく同じで、Glacierはアクセスに時間がかかるぶん、費用がS3の約10分の1となっているわけです。Glecierだと1Tバイトのデータが1ヵ月約1000円程度で保管できる計算です。
このような特徴を持っているGlacierを、Amazonはこれまでテープでバックアップをしていたようなペタバイトクラスの大容量データを数年にわたる長期で保存する、といった用途を想定していると言います。
Glacierサービスの利用方法
具体的な利用方法ですが、まずは他のAWSのサービスと同様、Amazonにユーザ登録、ログインして「マネジメントコンソール」を立ち上げます。どのリージョンのGlacierサービスを利用するかを選択後、Vault(ボルト)を作成します。ここにデータをアップロードする単位のアーカイブを格納できます。このVaultに対してアクセス権限と、Amazon Simple Notification Service(Amazon SNS)を使ったジョブ終了通知などの送り先を設定します。ここまでがWeb GUIを使った最初の設定です。
この後、実際にデータをアップロードしますが、ここからはGUIでできるわけではありません。S3等と同様、Web API、あるいは用意されているSDKを使ってプログラムを作成し、処理を行います。SDKはJavaと.NET用が用意され、サンプルコードも付属しているので、プログラミング経験のある方なら、それほど苦労なく利用できるとのことです。
Glacierサービスの大きな特徴は、データの取り出し処理にあります。Glacierにアップされたデータはその名の通り「氷漬け」のようなイメージで保管されており、データ取り出しを実行できるようになるには「リトリーブ」と呼ばれる処理が必要で、3.5~4時間かかります。かかる時間はデータの大きさに関係ありません。
取り出し実行可能になる(データが「ホットになる」と言うそうです)と、それから24時間の間にダウンロードを実行します。ホットになったかどうかは、先に設定したAmazon SNSによる通知により知らされることになります。ダウンロードももちろん、API経由、またはSDKによるプログラム処理が必要です。
なお、データの削除はワンコマンドで可能とのことです。
長期の保存に特化した料金体系
ではGlacierの価格体系をもう少し詳しく見てみましょう。
東京リージョンのGlacierサービスの価格
ストレージ | $0.012/GB/月 |
リクエスト数(アップロード、データ取り出し) | $0.06/1000リクエスト |
アップロード | 無料 |
データ取り出し | 格納容量の5%まで無料/月
超えた場合は$0.01/GB程度の料金が発生 |
データ削除 | アップロード後90日以内に削除した場合、$0.01/GB程度の料金が発生 |
AWS外へのダウンロード | 通常のダウンロード料金 |
たとえば、1Tバイト(1000Gバイト)のデータを削除せず、毎月1回、50Gバイト未満のデータを取り出すような運用であれば、ストレージの利用料 $0.012×1000=$12と、データを取り出した後のAWS外部へのダウンロード代が$9ほどで済みます。あとは取り出しのリクエスト$0.06が加わり、取り出し料は無料となります。
というわけで、なるべく動かすことがない、かつ大量で重要なデータを長期保管する用途なら、非常に低コストで運用できるしくみだと思います。「クラウド時代のテープバックアップ」といったイメージでしょうか?
- Amazon Glacier
- URL:http://aws.amazon.com/jp/glacier/