この連載はOSSコンソーシアム データベース部会のメンバーがオープンソースデータベースの毎月の出来事をお伝えしています。
オープンソースカンファレンス2024 Kyotoで企画セミナーを開催
OSSコンソーシアムでは、7月27日
テーマ | ビジネス変革にOSSが武器になる! |
---|---|
日時 | 2024年7月27日 |
会場 | 京都リサーチパーク |
概要 | デジタル技術によるビジネス変革を実現してもらうためさまざまなOSSが武器・
Part 1では、上記を考えるための材料として、OSSコンソーシアムでの取り組みと、独立行政法人情報処理推進機構 Part 2ではもう少し視点を広げて、さまざまなバックボーンの識者たちと一緒に考える場にします。 |
登壇者 |
今村かずき 野原直一 竹岡尚三 内田太志 溝口則行 |
会場
[MySQL]2024年6月の主な出来事
6月はMySQLのバージョンアップはありませんでした。6月27日に、MySQL HeatWaveの生成AI機能であるHeatWave GenAIが発表されました。この機能の方向性は、2023年10月のOracle CloudWorldで実装が発表されていたものです。
HeatWaveの生成AIとLLMサポート
HeatWaveは分散型のインメモリ・
今回ここに加わったのが、HeatWave GenAIと呼ばれる生成AIとLLM
HeatWaveのスケールアウト型アーキテクチャによって、利用するノードの台数に応じてベクトル埋め込みの生成性能が向上します。
LLMをサポートすることで、自然言語でMySQLに対して問い合わせを行い、自然言語で応答を得ることができるようになりました。HeatWaveがサポートするLLMは
- HeatWaveにLLMを同梱するインデータベースLLM
- クラウドLLMサービスに連携する構成
の2パターンです。インデータベースLLMでは
Lakehouseとの機能を活用することで、社内の最新の文書を取り込んでLLMの出力を最適化するために利用されるRAG
HeatWaveは生成AIと機械学習の両方を利用するアプリケーションを高速に実行できる基盤として進化しています。製品発表の動画では、金融機関での不正が疑われる取引の検出のアプリケーションとして、HeatWave AutoMLでの異常値検出にて取引を抽出し、HeatWave GenAIによって理由を含むアラートの文章が出力される例を紹介していました。生成AIや機械学習の専門家でなくても活用できます。
HeatWave GenAIの利用には、他のAIサービスを使わずインデータベースLLMを利用する場合には追加費用がかかりません。OCIのみならず、AWSやAzure, 専用リージョンやOCI Alloyを含むHeatWaveが対応する全ての環境で、HeatWave GenAIを利用可能です。
[PostgreSQL]2024年6月の主な出来事
6月はPostgreSQLのバージョンアップや新しいベータ版のリリースはありませんでした。今回は5月末に開催されて前回106回にお伝えできなかった、PostgreSQLエンタープライズ・
PostgreSQLエンタープライズ・コンソーシアム活動成果発表会の報告
この連載の第105回でお知らせしたとおり、5月31日にPostgreSQLエンタープライズ・
- WG1:定点観測
(バージョン間性能比較) - SRA OSS LLC、正野裕大さんによる報告です。
定点観測として実施しているPostgreSQLの新旧バージョンの性能測定の結果で、今回はマルチコアCPUでのバージョン15と16の性能比較を行っています。比較対象はバージョン15.5と16. 1です。資料には前年に実施した15. 1の性能値も併記していますが、OSなど環境が同一ではないのであくまで参考情報になります。 - 検証を実施した環境は、昨年と同じくAmazon Web Services
(AWS) の仮想マシンを使用し、OSはRocky Linux 9. 3 (前年はRedHat Enterprise Linux) で、セットアップ作業はAnsibleで自動化しています。 - まず、参照処理の性能ですが、同時32接続まではスループット
(TPS) が右肩上がりで増加しますが、32~64接続で頭打ちとなりました。バージョン16. 1が若干高い性能を示していますが5%程度なので大きな差というわけではありません。スループットが頭打ちになった状態ではCPUがボトルネックとなっています。今回の検証はvCPU数32個の環境で実行しているので、CPUリソースを多くすると多重接続時の性能も更に向上するのではと期待したくなります。 - 次に、更新処理の性能ですが、こちらは接続数が256〜432で頭打ちとなっています。こちらもバージョン間で大きな差は無いようです
(15. 5から16. 1で約3%向上)。更新処理が頭打ちになった状態ではCPUにはまだ余裕があり、ボトルネックはソフトウェア割り込みであろうと推察されるとのことですが、その発生原因は特定できておらず解明は今後の課題となっています。
- WG2:はじめてのPostgreSQL移行
- 富士通株式会社、岩田彩さんの報告です。
PGEConsでは、設立した2012年からPostgreSQLへのデータベース移行作業と工程ごとの作業内容について調査・検証を継続してきました。その中で、2018年度の成果物である 「移行ガイドブック」 の改訂の必要性を以前から感じていました。このガイドは現在でも参考になる内容が多くあります。けれど、現時点で移行について知りたい人にとってはPostgreSQLのバージョンが古い情報も含まれていますし、ガイドの公開日が古いために参考にして大丈夫かどうか迷ってしまうのではないかという懸念もあります。 - また、このガイドの作成当時は
「OSS採用を躊躇してしまう人たち向け」 になることを意識していました。しかし、現在はPostgreSQL採用を前向きに検討している方が多いので、そのような採用に前向きな方たち向けのより具体的な情報の必要性が高そうだとの意見もあるようです。この移行ガイドブックの全体像については公開資料をご参照いただくとして、ここでは改定された以降ガイドブックの注目点を紹介します。 - 「5章 データベース移行作業」
では、移行対象をPostgreSQLバージョン16にしています。また、周辺ツール紹介の更新や、テーブル・ インデックスの移行についての部分も更新されています。 - 「6章 アセスメント」
では、Oracle DBと PostgreSQLの差異がまとめられています。
- WG3:適切なVacuum設定の考察
- ヤマトシステム開発株式会社、藤井大和さんによる報告です。
VacuumはPostgreSQLにとって重要な機能ですが、機能の詳細まで理解している方は少ないのかもしれません。そこで、前半では「Vacuumが持つ役割と機能を正しく理解する」 ために、Vacuumについての解説がされています。PostgreSQLの追記型アーキテクチャがどのように処理されているのかの習得や復習の教材としてわかりやすくまとまっています。 - Vacuumの技術解説に続いていくつかの検証結果が報告されました。
- 検証1: Standard VacuumとAutoVacuumでの処理時間
- 検証2: インデックスの量による処理時間変化
- 検証3: 末尾の空白の切り落とし処理の負荷
- 検証4: クエリ処理時間について
(シーケンシャルスキャン) - 検証5: クエリ処理時間について
(インデックススキャン)
- 検証結果はVacuumの挙動を踏まえればもっともな結果を確認するものもありますが、中には少し意外性のある発見もありました。
- 「検証5:クエリ処理時間について
(インデックススキャン) 」は、更新 (UPDATE) が多い場合はVacuumも頻繁に行わないとインデックススキャンでも性能が悪化するかどうかの検証です。ところが、結果としてはVacuumをしなくても性能がどんどん悪化するわけではないことが示されました。 - UPDATEを1度実行した場合、その後のインデックススキャンによるSELECT実行結果は長く
(遅く) なります。ところが、UPDATEとSELECTを複数回実行すると、悪化した処理時間が徐々に短く (速く) なっていく (元に近づいていく) 傾向が見られます。この一連の性能測定ではVacuumを実行していません。 - PostgreSQLでは、UPDATEクエリによる更新が完了し不要となったタプルを指すインデックスは、次のクエリ実行時に削除が行われるため、Vaccumが行われなくてもインデックスの改善がある程度は働き、それにより処理速度が際限なく低下することはないということです。
今回の成果発表セミナーでは、上記で紹介した技術部会の3つのWGの他、CR部会
また、時間の関係で詳細には発表されていない点については、詳細な成果報告資料として公開される予定です。ここには2012年からのPGEConsの成果が残っています。今回発表対象となった2023年度分の成果についても、まもなく公開されるでしょう。
OSS-DB Gold試験対策問題集Ver3.0対応版がリリース
OSS-DB Silver/
試験範囲であるPostgreSQL 12~14の
2024年7月以降開催予定のセミナーやイベント、ユーザ会の活動
イベントごとに利便性のあるオンライン開催や、従来通りのオンサイト
第47回 PostgreSQLアンカンファレンス@オンライン
日程 | 2024年7月1日 |
---|---|
場所 | オンライン開催 |
内容 |
|
主催 | PostgreSQLアンカンファレンス |
MySQL超入門:ゼロから始めるMySQL
日程 | 2024年7月9日 |
---|---|
場所 | オンライン開催 |
内容 | これからデータベースを学ぶ全ての方へ! MySQLは世界で最も普及しているオープンソースのデータベースです。Facebook、Twitter、YouTubeなど、世界中にユーザーがいるWebサイトを支えています。また、最も使いやすいデータベースの1つであり、データベースをこれから学ぶ初心者にも最適です。本セミナーでは、MySQLの利用方法をデータベースの基本的な概念を交えてご紹介します。初めてMySQLやデータベースに触る方におすすめのセミナーです。
|
主催 | 日本オラクル株式会社 MySQL Global Business Unit |
オープンソースカンファレンス2024 Kyoto
日程 | 2024年7月27日 |
---|---|
場所 | 京都リサーチパーク |
内容 | 今回お知らせするKyotoはいずれも展示とセミナーの両方を会場にて開催します。セミナーのオンライン配信は予定されていません。ただし、出展者が独自に配信を行うセミナー枠はあるかもしれません。今回の冒頭でもお知らせしたように、OSSコンソーシアムも出展参加して企画セミナーを行います。その他のOSSデータベース関連の展示やセミナーは公開されたプログラムをご参照ください。 |
主催 | オープンソースカンファレンス実行委員会 |
アシストフォーラム2024(PostgreSQLセッション有り)
日程 | 2024年7月8日 |
---|---|
場所 | ウェビナー |
内容 | 株式会社アシストによるさまざまな分野にまたがる総合的なイベントですが、ユーザ企業によるPostgreSQLの事例発表が含まれています。
|
主催 | 株式会社アシスト |
dbtech showcase 2024
日程 | 2024年7月11日 |
---|---|
場所 | TKP市ヶ谷カンファレンスセンター |
内容 | 国内で開催されるデータベース関連の主要なカンファレンスのひとつです。OSSデータベース専門のセミナーではありませんが、MySQLやPostgreSQLをはじめさまざまなOSSデータベースについての多数のセッションが毎年設けられています。 |
主催 | 株式会社インサイトテクノロジー |
MySQL 8.4 入門セミナー : アーキテクチャ編
日程 | 2024年7月26日 |
---|---|
場所 | オンライン開催 |
内容 | MySQL 8. MySQLの導入や利用にあたって必要となる、体系的な知識を学べると好評のMySQL入門セミナー。本セミナーでは2024年4月にリリースされた最新バージョンのMySQL 8. |
主催 | 日本オラクル株式会社 MySQL Global Business Unit |