OSSデータベース取り取り時報

第98回次世代RDB劔“Tsurugi”最新情報⁠MySQL HeatWaveの生成AI対応計画⁠PostgreSQL 16リリース

この連載はOSSコンソーシアム データベース部会のメンバーがオープンソースデータベースの毎月の出来事をお伝えしています。

次世代高速RDB 劔“Tsurugi”のOSS版リリースがまもなく

“Tsurugi⁠(劔)という名前の高速で動作する次世代のRDBが開発されていることをご存知でしょうか。この連載でも2019年の第45回以降に何回か開発状況などをお知らせしてきました。⁠Tsurugi⁠という名称が初めてお披露目されたのが、OSSコンソーシアムのデータベース部会が主催したセミナーの場でした。

この劔⁠Tsurugi⁠は2023年7月にアーリーアクセス版(α版)として限定提供になっていましたが、この10月にいよいよOSSとして公開されることが発表されました。

劔“Tsurugi⁠の特徴は、簡単にまとめると、①超高速であること、②バッチとオンラインの同時処理が可能なこと、③JavaAPIやPostgreSQLのインタフェースからの呼び出しが可能なことの3つにまとめられます。

劔“Tsurugi”の3つの特徴(noteのTsurugi解説記事より)
劔“Tsurugi”の3つの特徴
①超高速であること
新しいハードウェアのアーキテクチャに合う設計がされていて、従来のRDBに比べて書き込み性能に強く、世界最速レベルの性能を達成しています。1ノード112コアの環境で、約456万TPSかつ219ナノ秒の応答速度を達成できたそうです。
②バッチとオンラインの同時処理が可能なこと
一貫性を担保した上で高速なバッチ処理を行い、その上で短時間で処理が完了するショートトランザクションの併用を可能になっているので、従来のようにバッチとオンラインを分けて運用する必要がなくなりました。
③JavaAPIやPostgreSQLのインタフェースからの呼び出しが可能なこと
劔“Tsurugi⁠のメリットを享受できるJavaAPIや、SQLを処理するJavaAPIが提供されています。また、以前の報告会にてPostgreSQLのFDW(Foreign Data Wrapper)を使った呼び出しにも対応しているということでした。

また、OSS版リリースと同時に解説本も発売されます。解説本では劔"Tsurugi"の利用法はもちろんですが、内部構造や実装アルゴリズムの詳細まで解説しているとのこと。最新のデータベース技術をじっくり勉強したい方にも適した書籍になっているのではないでしょうか。

最新の状況や詳しい情報は、⁠Tsurugi⁠のWebサイトを参照してください。

[MySQL]2023年9月の主な出来事

9月はオラクルの最大の年次イベントであるOracle CloudWorld 2023にて、MySQLのクラウドデータベースであるMySQL HeatWaveに関する新機能が多数発表されました。昨今話題の生成AI(Generative AI)への対応を筆頭に、第97回でアーキテクチャを紹介したHeatWave LakehouseのAWS対応、これまでご要望の多かったJSONデータ型への対応も発表されています。

MySQL HeatWaveの生成AIへの対応計画

MySQL HeatWaveには機械学習機能のAutoMLが組み込まれていますが、さらにベクトルストアを実装し自然言語で情報の検索を行うAIへの対応の道筋を開きました。MySQL HeatWaveのベクトルストアは大規模言語モデル(LLM)のために、HeatWave Lakehouseのオブジェクト・ストレージに置かれたPDFやテキストなど、各種のドキュメント・ファイルから生成されたベクトル埋め込みを格納します。問い合わせと応答は自然言語(デモでは英語)を使用します。

ベクトルストアを使用することで回答の精度が上がった例(MySQL公式ブログより)
ベクトルストアを使用することで回答の精度が上がった例

公開されたデータのみを使用する他モデルと比べて、MySQL HeatWaveのベクトルストアは自社内のドキュメントや情報を活用するため、自社にとってより正確かつ必要な回答を得ることができます。2023年10月現在は、プライベート・プレビューとなっていてユーザーには公開はされていませんが、MySQL HeatWaveの今後の方向性を示しています。

MySQL HeatWaveのGenerative AI
MySQL HeatWaveのGenerative AI

Oracle CloudWorld 2023で発表されたMySQL HeatWaveの新機能

マルチクラウドへの対応の一環としてMySQL HeatWaveはAWSでも利用可能ですが、HeatWave LakehouseもAWSで利用可能となりました。2023年10月現在は限定公開(Limited Availability)となっています。

機械学習機能であるHeatWave AutoMLがHeatWave Lakehouseでも利用可能となり、オブジェクト・ストレージ上のデータに対する機械学習処理ができるようになっています。IoTデバイスやセンサーなどからのデータをCSVなどでオブジェクト・ストレージに格納し、機材の故障に対処するための予防措置に多変量時系列予測を活用することや、異常値の検出などを行う利用形態が想定されます。

MySQL 5.7からJSONドキュメントを格納できるJSONデータ型をサポートしています。これまではJSONデータをHeatWaveクラスターのカラムナー・データストアで処理できませんでしたが、MySQL HeatWaveでも分析処理の高速化が可能になりました。JSONデータ型を含む複雑なクエリ処理では100倍以上処理時間を短縮できたベンチマーク結果も出ています。

GraalVMの統合によるJavaScriptでのストアドプログラム開発

オラクルは新たなJIT(Just-in Time)コンパイラおよび複数の開発言語の実行環境としてGraalVMを開発してきました。Oracle CloudWorldではこのGraalVMをMySQL HeatWaveに統合し、ストアドプロシージャやストアドファンクションをJavaScriptで開発できるようになることが発表されました。引数や戻り値のデータの型はMySQLとJavaScriptの間でシームレスに変換されます。作成したストアドプログラムはSELECT文のみならず、通常の関数と同じようにWHERE句やORDER BY句の中やDDLなどからでも実行可能です。またJavaScriptの中ではMySQLのNoSQL APIであるX DevAPIを利用することができるため、ストアドプログラムの開発時にはSQLを一切使わずにデータを読み書きすることもできます。2023年10月現在は限定公開(Limited Availability)となっています。

X DevAPIを利用したJavaScriptで書かれたストアドプログラム(MySQL公式ブログより)
X DevAPIを利用したJavaScriptで書かれたストアドプログラム

他にもAutoMLの機能拡張や、運用支援機能のAutopilotの機能強化も行われています。こちらは今後の連載で解説予定です。

[PostgreSQL]2023年9月の主な出来事

PostgreSQLの新メジャーバージョン16が遅延無く正式リリースとなりました。また、EDB Postgres Vision Tokyoの様子と、PostgreSQL認定試験の合格者ランキング情報も簡単にお知らせします。

新メジャーバージョン PostgreSQL 16が正式リリース

この連載にてベータ版からお伝えしてきた、PostgreSQLの新しいメジャーバージョン16が、9月14日に正式リリースになりましたリリースのお知らせ日本語版のプレスリリース⁠ 。前回の記事でベータ3での変更点が落ち着いてきている様子だと書きましたが、予想が外れなくて安心しました。

バージョン16の目玉機能や主要な変更点は、過去のベータ版情報からお伝えしてきましたが、ここで簡単にまとめておきます。バージョン16のリリースノートの先頭に記された主要な新機能と拡張機能は次の7点です。

  • FULLとRIGHTのJOINを問い合わせプランナが並列化できる[性能向上]
  • スタンバイサーバからの論理レプリケーションを許可[論理レプリケーション改善]
  • サブスクライバが並列ワーカを使用して大きなトランザクションを適用できる[論理レプリケーション改善]
  • 新しいビューを使用してI/O統計の監視を許可するpg_stat_io[監視]
  • SQL/JSONコンストラクターとID関数の追加[開発者体験]
  • VACUUM戦略の改善によりテーブル全体をFREEZEする必要性が減少[性能向上]
  • pg_hba.confとpg_ident.confファイルの管理が改善されユーザ名とデータベース名の正規表現マッチングや外部設定ファイルのincludeディレクティブが使用できる[アクセスコントロールとセキュリティ]

また、メジャーバージョンのリリースでは、以前のリリースとの互換性に影響がある変更点も含まれていますので、非互換性にも注意が必要です。以下はその一部のみの抜粋です。

  • PL/pgSQLバインドされたカーソル変数の割り当てルールを変更
  • 主キーのインデックスを禁止
  • システムカタログのインデックスを処理しないように変更

その他も含めてリリースノートでは13点の注意する非互換性が挙げられています。

EDB Postgres Vision Tokyo 2023開催

これも前回にお知らせをした件のつづきです。国内で開催される主要なPostgreSQL関連イベントのひとつであり、OSSコンソーシアムメンバのエンタープライズDB主催のEDB Postgres Vision Tokyo 2023 が9月7日に開催されました。ここでは事例セッションでの講演内容について簡単に紹介します。

株式会社NTTデータ⁠エービック
オンプレ環境向けに提供していたパッケージソフトをSaaS化するに際して、異種DBMSからEDB Postgresに移行された事例で、企画段階でマイグレーション可能性の検証をしてから移行を実施されました。
保険の窓口グループ株式会社
EDB Postgresを含むPostgreSQLを採用されており、コミュニティの知見が活用できた例として、PostgreSQLメーリングリストでのやりとりにより不具合原因が特定できたケースもあるとのこと。業務システムのバッチ処理ではロングトランザクションもあり、さまざまなクエリやトランザクションを処理できるパフォーマンスが必要であったという例が紹介されました。
株式会社フィンズ
FNS系列23局の放送基幹システムの事例で、前述の事例とは別の異種DBMSからの移行事例でした。この事例については本連載の第96回でも紹介しています

なお、10月31日までは事後のオンデマンド配信が実施されています。見逃した方にはご聴講をお薦めします。当日に聴講された方の再聴講も可能です。

OSS-DB認定者数上位企業の2023年版が発表

OSS-DB技術者認定はPostgreSQLの技術認定試験で、⁠OSS-DB Gold」「OSS-DB Silver」という2つのレベルがあります。OSS-DB Goldの認定はPostgreSQLの内部構造についての深い知識を持ち、設計・構築からパフォーマンスの改善やトラブルシューティングまで行える技術力を証明します。OSS-DB SilverはPostgreSQLを使ったデータベースシステムの運用管理を確実に行える技術力を証明するものです。

9月1日、合格者を多く輩出している企業の2023年版ランキングが発表になりました。ランキングは、OSS-DB GoldとSilverのそれぞれについて、単年の合格者数と、有意性期限(5年)以内の認定取得者数が発表になっています。4つのカテゴリ全てで第1位は富士通株式会社となり4冠となりました。1位以外の企業もPostgreSQL技術者育成に積極的な企業であることを示していると言えるでしょう。OSS-DB Silverには国際電子ビジネス専門学校が第3位に入っており、若い技術者が増えてくれることにも期待したいと思います。

2023年10月以降開催予定のセミナーやイベント⁠ユーザ会の活動

オンサイト(会場)開催が復活しつつあります。また、利便性のあるオンライン開催もこの3年間で定着し、オンサイト/オンライン/ハイブリットが混在するようになってきました。興味を持たれて参加したいイベントの開催形態にご注意ください。

OSS-DB Exam Silver 技術解説セミナー

日程 2023年10月15日(日)13:00~14:15(10月13日(金)までに申し込んでください)
場所 オンライン開催(ライブ方式)
内容 今回のセミナーは、PostgreSQL アーキテクチャのポイントをご紹介しつつ、ポイントインタイムリカバリ(PITR)の具体的な使用例を取り上げて解説いたします。OSS-DBアカデミック認定校であるSRA OSS LLCが講師をします。OSS-DB技術者認定試験の概要を知りたい方、受験を予定されている方は是非ご参加ください。本セミナーは試験対策ではなく、試験概要のご説明及びポイント解説です。ご了承ください。
主催 特定非営利活動法人LPI-Japan

EDB Postgres Vision Tokyo 2023 ~ 今こそPostgresで前進 ~

日程 開催中~2023年10月31日(火)
場所 オンライン開催(オンデマンド配信)
内容 記事本文でも紹介しましたが、PostgreSQL関連の主要なイベントのひとつと言っていいでしょう。EDBが提供する各種Postgres関連サービスを活用したストレスフリーな構築、移行について紹介される他、導入企業の方が各社の取り組みについて語られるセッションもあります。
主催 エンタープライズDB株式会社

オープンソースカンファレンス2023 Tokyo/Fall⁠Shimane⁠Hiroshima⁠Niigata⁠Fukuoka

日程 2023年10月21日(土)10:00~16:00〔Tokyo/Fall〕
2023年10月28日(土)10:00~17:30〔Shimane〕
2023年11月12日(日)10:00~18:00〔Hiroshima〕
2023年11月25日(土)〔Niigata〕
2023年12月9日(土)10:00~18:00〔Fukuoka〕
場所 〔Tokyo/Fall〕大田区産業プラザPiO(東京都大田区)
〔Shimane〕松江テルサ
〔Hiroshima〕サテライトキャンパスひろしま
〔Niigata〕(Webサイト準備中)
〔Fukuoka〕福岡SRPセンタービル
内容 オンサイト(会場)開催のオープンソースカンファレンスが戻ってきました。今回ご案内する地域はすべてオンサイト(会場)開催です。Tokyo/Fall(東京)とShimane(島根)は展示のみ。Hiroshima(広島)とFukuoka(福岡)はセミナーと展示の両方です。Niigata(新潟)は開催日は案内されていますが、その他は準備中の模様です。出展者やセミナープログラムはそれぞれの開催回ごとのWebページをご参照ください。
主催 オープンソースカンファレンス実行委員会

PostgreSQL Conference Japan 2023

日程 2023年11月24日(金)10:00~18:00
場所 AP日本橋(東京都⁠⁠ 6F(東京駅より徒歩5分)
内容 日本PostgreSQLユーザ会(JPUG)によるPostgreSQLの総合カンファレンスです。プログラムが公開になりました。午前は基調講演などがあり、午後は複数トラックに分かれて多数の講演が設けられています。一般公募の講演発表募集は締め切られましたが、スタッフはまだ募集中です。参加にはチケットが必要で9月23日から発売開始されています。
主催 日本PostgreSQLユーザ会

おすすめ記事

記事・ニュース一覧