高速インプロセスデータベースDuckDB 1.0.0がリリース

DuckDB Foundationは2024年6月3日、オープンソースのインプロセス分析データベース「DuckDB」の正式リリースバージョン1.0.0(コードネーム⁠Snow Duck⁠⁠)をリリースした。

DuckDBは高速に動作するインプロセス分析データベース。ビルドする際に外部依存関係がなく、インストールとデプロイが簡単で、ホストアプリケーション内でインプロセスで実行したり、単一のバイナリとして実行できる。Linux、macOS、Windowsや、すべての一般的なハードウェアアーキテクチャ上で実行可能で、 Python、Rに深く統合されているほか、Java、C、C++といった主要なプログラミング言語用のクライアントAPIを備えている。また豊富なSQL方言が利用可能で、CSV、Parquet、JSONなどのファイル形式で、ローカルファイルシステムやS3バケットなどのリモートエンドポイントとの間で読み書きができる。

高いパフォーマンスも特徴で、並列実行をサポートし、メモリを超えるワークロードを処理できる列指向エンジンをもつため、分析クエリを非常に高速に実行できる。このため、OLAP(オンライン分散処理)と非常に相性が良い。新しいデータ型、関数、ファイル形式、SQL構文などのサードパーティ拡張にも対応している。

バージョン1.0.0を公開するにあたって最も重視されたのは「安定性」である。リリース前に毎晩何百万ものテストクエリを実行する何千ものテストケースを実行し、パフォーマンス低下の問題を確認していたとのこと。こうしたテストを経て、1.0.0をリリースする自信がつき、正式に公開に至ったという。

DuckDBとそのコア拡張機能は、MITライセンスの下でオープンソースとして配布されている。また、各プラットフォームへのインストーラも、DuckDBのサイトで用意されている

おすすめ記事

記事・ニュース一覧