AI Daily Digest — 2026年6月6日

本日のAI業界注目ニュースを 30件 厳選してお届けします。

TOP 3

モデル

プロダクト

Gemini Liveがリアルタイムの画像作成と編集に対応

Gemini Liveでは、カメラ共有と音声指示を使って画像の作成や編集をリアルタイムに行えるようになった。部屋の装飾案、数学問題の視覚化、共有用ミーム作成などを、GeminiアプリのLiveボタンからその場で試せる。

Google AIがNano Banana 2、Co-Scientist、Gemma 4など週間アップデートを発表

Google AIは、Nano Banana 2とProの正式提供、科学仮説生成を支援するCo-Scientist、個人化トピックを生成するdreambeans、ノートPC上でオフライン動作できるGemma 4 12Bなど、複数の製品とモデル更新を発表した。Gemma 4シリーズでは量子化対応も進み、メモリ要件の低減が図られている。

PolarDB-X Zeroが30秒で分散データベースを提供

Alibaba CloudはPolarDB-X Zeroを発表した。登録や設定なしにAPI呼び出しだけで分散データベースを短時間で用意でき、MySQL互換エンジンにHNSWベクトルインデックスを組み込む。関係データとセマンティック検索をSQLで扱え、MCPやAI IDEにも対応する。

Google Colab CLIがローカル端末とリモートColab実行環境を接続

GoogleはColabのコマンドラインインターフェースを公開した。開発者やAIエージェントはローカル端末からリモートColabランタイムへ接続し、高性能GPUの要求、Pythonスクリプトの実行、ログやモデル成果物の取得を行える。AIエージェントによる機械学習パイプライン運用にも組み込める。

MiniCPM-V 4.6ベースのAccountingLLMが財務文書分析を自動化

コミュニティ開発者は面壁智能のMiniCPM-V 4.6を使い、IPO目論見書、年次報告書、監査文書などを分析するAccountingLLMを構築した。複雑なPDFから財務表を抽出し、複数ページにまたがる表を再構成し、会計等式との照合や疑わしい項目の検出を支援する。

業界

SpaceXとGoogleがxAIデータセンター向けクラウド契約を締結

SpaceXはGoogleとの新たなクラウドサービス契約を明らかにした。GoogleはxAIデータセンターの計算能力に対して月額9.2億ドル規模を支払うとされ、AI計算資源が打ち上げ能力やエネルギーと同じく戦略的資産になっていることを示す。

AIブームで米国GDPに占める計算基盤投資の比率が倍増

Epoch AIによると、2026年第1四半期にはAI関連のデータセンター建設、計算ハードウェア、ネットワーク設備投資が米国GDPの約0.8%を占めた。計算インフラ全体では約1.5%に達し、AI需要がマクロ経済指標にも表れ始めている。

MetaスマートグラスAppに顔認識コードNameTagが含まれていたと報道

Metaのスマートグラス向けアプリに、顔認識機能NameTagのコードが複数回の更新で組み込まれていたと報じられた。顔特徴テンプレートを端末内データベースと照合し、認識結果を装着者へ通知する構想とされる。Metaは探索段階であり、中央顔データベースは作らないと説明している。

Appleの新版Siriは完成品ではなくBetaとして扱われる見通し

Appleの新版Siriは社内でBeta版として扱われ、完成品として宣伝されない可能性がある。通知センターや写真機能、セキュリティ面の改良に加え、一部のSiri問い合わせではGoogle Cloud上の認可版GeminiとNVIDIA Blackwell B200クラスターを利用する構成が報じられている。

リサーチ

Arenaが実ユーザー任务ベースのAIエージェント排行榜を発表

Arenaは、実際のユーザータスクに基づくAIエージェントランキングを公開した。コード作成、アプリ構築、文書分析などを対象に、30万件以上のタスク、200万回以上のツール呼び出し、4000万行のコードから、成功率、修正への追従、エラー回復、ツール幻覚などを総合評価する。

PixelDiTがCVPR2026ベストペーパー候補に選出

NVIDIA ResearchのPixelDiTがCVPR2026のベストペーパー最終候補に選ばれた。多くの画像生成モデルで使われる事前学習済みオートエンコーダーを省き、ピクセル空間で直接拡散過程を学習する単一段階モデルとして、品質劣化の蓄積を避けることを狙う。

AnthropicがClaudeを化学者として使う研究を発表

Anthropicは化学者と協力し、Claudeの化学分野での実用性を検証した。白書ではNMRスペクトル解析を対象に、Claude Opus 4.7、Opus 4.6、Sonnet 4.6と既存化学ソフトを比較し、構造からスペクトルを予測する正方向タスクと、実験スペクトルから構造を推定する逆方向タスクを評価した。

Meta SAM 3DがCVPR26ベストペーパー佳作に選出

MetaのSAM 3DチームはCVPR26でベストペーパー佳作に選ばれた。計算機視覚の3D理解とセグメンテーション領域での研究成果が評価されたもので、Metaはチームの貢献を公式に紹介している。

Microsoft Project Mosaicがmicro-LED光学インターコネクトを実証

Microsoft Azure CTOのMark Russinovich氏はBuild 2026で、Microsoft Research Cambridgeの実験的光学インターコネクトProject Mosaicを紹介した。micro-LEDを使って低消費電力かつ高速なデータ伝送を狙い、単一LEDの変調で文字を形成するデモも示された。

技術

Tencent Hunyuanと中国人民大学がPlanningBenchをオープンソース化

Tencent Hunyuanは中国人民大学高瓴人工智能学院と共同で、LLMの計画能力を評価・訓練するPlanningBenchを公開した。30件以上の実世界計画タスク、自動検証、訓練機能を備え、LLMを「話す」だけでなく「実行する」方向へ進めることを目指す。