T5Gemma ―新たなアプローチのエンコーダ・デコーダモデル
T5GemmaはGemma 2をエンコーダ・
The Gemma family is growing today. First up: T5Gemma ✨, the new generation of encoder-decoder models ↓https://
— Google AI Developers (@googleaidevs) July 9, 2025t. co/ 6Qu7s0K5Ee
従来のGemmaはデコーダのみを装備したモデルで、エンコーダ・
またT5GemmaにはGemma 2 2Bおよび9Bモデルに加え、新たに学習済みのT5サイズモデル
T5GemmaはHugging FaceとKaggleでから入手できるほか、Vertex AIでモデルを使った推論を実行することもできる。
MedGemma+MedSigLip ―医療分野に特化したSigLip搭載のマルチモーダルモデル
医療AI開発に特化されたモデルMedGemmaに新たなマルチモーダルモデルMedGemma 27B Multimodalと画像エンコーダMedSigLIPが追加された。
The Gemma family continues to grow today!
— Google AI Developers (@googleaidevs) July 9, 2025
🩺 Announcing new models for MedGemma, our collection of multimodal open models specifically designed for health AI development that can run on a single GPU.
1️⃣ MedGemma 27B Multimodal
2️⃣ MedSigLIP
(Read the thread to learn more) pic.twitter. com/ OBuvPe49fH
MedGemma 27B Multimodalは、以前リリースされた4B Multimodalと27Bテキストのみのモデルを補完し、複雑なマルチモーダルおよび縦断的に電子健康記録の解釈をサポートする。MedSigLIPは、4Bおよび27B MedGemmaモデルと同じ画像エンコーダをベースに胸部X線、組織病理パッチ、皮膚科画像、眼底画像などの多様な医用画像データを用いてチューニングを行い、視覚埋め込みモデルと比較して同等またはそれ以上の分類性能を実現しながら、医用画像分野全体においてはるかに高い汎用性をもつという。
MedGemma 4BとMedSigLIPは単一のGPUで実行可能で、モバイルハードウェア上でも実行できる。またどちらもApache 2.