濃縮還元オレンジニュース

Apache Cassandra 1.0リリース

2011年10月18日、⁠Apache Cassandra」のメジャーアップデートとなるバージョン1.0がリリースされました。CassandraはNoSQLのカラム指向分散データベースで、当初Facebookの開発チームによって生まれたプロダクトです。TwitterではWebページのメタデータ保存に、SoundCloudではユーザ管理に利用するなど、多くの有名サービスで利用されています

今回のメジャーバージョンアップで改善された主な機能として、カラムファミリ単位のデータ圧縮があります。これは長い間ユーザの間で強く望まれていた機能の一つで、圧縮されることで全体のデータサイズが少なくなり、より少ない台数で運用できるだけでなくディスクI/Oのコストが削減され、読み書きのパフォーマンス向上にも貢献します。また、コンパクション処理[1]について、これまでGoogle BigTable方式で行っていた際に生じていた問題を解消すべく、同じGoogleプロダクトであるLevelDBが採用しているアルゴリズムにも対応しました。ほかにもWindowsサービスとして稼働するための対応やメモリ管理、ディスクスペース管理の改善、一時的に停止したノードにあとで書き込む必要がある情報を別レプリカに記録するHinted Handoff機能に関する改善など数多くあります。

これらの積み重ねにより、ちょうど1年前のバージョン0.6と比較して書き込み性能が40%、読み込み性能はなんと400%も向上しました。

少し残念なのはドキュメントがあまり充実していないことです。公式ドキュメントはWikiのみであり、市販されている洋書も対応バージョンが古いのが気になります。公式以外では、CassandraプロジェクトをリードするJonathan Ellis氏が勤めるDataStax社のWebサイトにていくらかまとまったドキュメントが用意されています。クラスタをきれいなUIで管理できる「OpsCenter」というツールも無料版が公開されています。

URLhttp://cassandra.apache.org/

おすすめ記事

記事・ニュース一覧