AI Daily Digest — 2026年6月11日
本日のAI業界注目ニュースを 28件 厳選してお届けします。
モデル
プロダクト
業界
リサーチ
技術
モデル
Google DeepMindは、テキスト拡散技術を採用した実験的な開源モデルDiffusionGemmaを公開した。自己回帰型の逐次生成ではなく、1回の前向き計算で256トークンを並列生成する方式を取り、26BのMoEモデルながら推論時に有効化されるのは3.8Bパラメータに抑えられる。量子化後は18GB級の消費者向けGPUにも適合し、H100で1000 tokens/s超、RTX 5090で700 tokens/s超を示す。双方向注意と自己修正能力を備え、インライン編集やコード補完などローカル対話型ワークフローを狙う。
xAIはGrok Voiceについて、人間らしい間合い、抑揚、温かみを備えた高性能な音声機能だと紹介した。競合サービスより大幅に低い価格で提供するとしており、Grok APIの音声機能を開発者向けプロダクトに組み込みやすくする意図が見える。音声AIが品質だけでなく、コスト面でもAPI選定の争点になっていることを示す更新だ。
プロダクト
小米MiMoは、開源のターミナルAIコーディング助手MiMo Code V0.1を公開した。期間限定で無料利用できるマルチモーダルモデルMiMo V2.5を備え、100万トークンのコンテキスト窓をサポートする。自動知識蓄積と無損失圧縮による無限コンテキスト、テスト・レビュー・検証の閉ループ、仕様から計画、構築、報告まで進めるComposeモード、自進化システム、音声入力、Claude Code互換を特徴にする。MITライセンスで、Anthropic、OpenAI、DeepSeek、Kimi、GLMなど主要モデルプロバイダーにも対応する。
MiniMaxは、M3モデルが0G Labs上で上链したと発表した。可検証性とプライベート計算を組み合わせる取り組みで、6月15日から18日まで期間限定で無料稼働する。大規模モデルを分散インフラや暗号系の検証可能計算へ接続する流れの一例であり、モデル利用の信頼性やプライバシーをめぐる実験が続いている。
Googleは検索体験で扱うデータ保存の仕組みを更新し、「Search Services History」設定を追加した。Google Lens検索に使った画像、Search Liveの録音、音声検索、Translateの音声片など、検索時に利用した画像、ファイル、音声、動画が保存対象になり、AIモデルの提供、改善、開発に使われる。ユーザーはこの設定をオフにし、Save Mediaも無効化することで保存を避けられる。検索プロダクトのAI化が進む中、利用データと訓練利用の境界が改めて重要になっている。
Cursorはコードレビュー機能Bugbotの大幅更新を発表した。実行速度は3倍超に向上し、コストは22%低下し、1回のレビューで見つかるバグは10%増えたという。新しい`/review`コマンドにより、コードをプッシュする前にBugbotとセキュリティレビューを実行でき、GitHubやGitLabとも同期する。すでに同じ差分を`/review`で確認済みの場合、プルリクエスト作成時にBugbotが自動的にスキップして注記する。Composer 2.5の訓練改善が性能向上の背景とされる。
Apache Burrは、信頼性の高いAIエージェントとアプリケーションを構築するためのフレームワークとしてApache基金会下で公開されている。開発者が信頼できるエージェントアプリを設計、開発、配備するためのツールと抽象化を提供し、信頼性、可観測性、本番運用を重視する。単発のプロンプト実行ではなく、状態管理や運用品質を含めたエージェント開発基盤への関心が高まっている。
華為雲は、端から端までを覆う具身AI開発プラットフォームCloudRoboを発表した。データ、モデル、配備、統合までの全生命周期を対象とし、PB級の信頼データ基盤を土台にする。INSPIRE2026では、人形ロボット創新中心、Yijiahe Technology、上海交通大学が、データとモデルの二重評価、主動力制御モデルの高速組み立て、ロボットの時間単位のクラウド接続、モデルの分単位配備といった機能を示した。
火山引擎は、火山方舟著作権商業化プラットフォームを開始した。授権、保護、審査、配信、収益化を一体化した著作権協業の仕組みを掲げ、動画生成モデルSeedance 2.0と著作権治理体系を搭載する。周星馳氏傘下の比高グループから『喜劇之王』『食神』『長江七号』の3作品についてAI動画創作シーンでの使用権を取得し、クラシック場面を使ったAI創作テンプレートを提供する。UGCと商業広告の両方で分配制や案件制の収益化を進める。
OpenRouterは、新しいActivity explorerを公開した。チームや個人が各モデルでどれだけ費用を使っているかを確認でき、トークン、キャッシュヒット率、エージェント、トレンドも含めてリアルタイムに表示する。複数モデルを日常的に使い分ける開発環境では、性能だけでなくコスト、利用傾向、キャッシュ効率の可視化が重要になっており、モデル運用管理のための実務的な機能追加といえる。
業界
中国工信部は、「人工知能+情報通信」革新発展実施意見を公表した。400Gbpsおよび800Gbps級の基幹伝送網整備、東中西部の国家ハブ間通道の最適化、都市圏での400Gbps以上の高速光伝送、全光クロス接続、低遅延の計算接続能力を進める。さらに5G-A、6G、新世代光ネットワーク、IPv6+、産業インターネットとAIの融合を促し、空口智能化、ネットワーク自律、エージェントインターネットなどを重点技術に挙げた。
欧州委員会は6月9日、反独占調査が終わるまでMetaに対し、WhatsAppへのアクセスを第三者AI助手へ無料で開放する暫定措置を命じた。Metaは2025年10月15日にWhatsApp for Business APIを第三者AI助手から使えないようにし、2026年3月4日に有料利用へ変更したが、欧州委員会はこれが実質的に禁令を延長するものだと判断した。汎用AI助手市場の競争、特に小企業や新規参入者への影響が焦点になっている。
180億ドル規模のヘッジファンドMagnetar Capitalは、最新プロダクトで人間アナリストを使わず、数百のAIエージェントに株式調査を担わせる計画だと報じられた。AIが投資アイデアを検索し、企業を調査し、ポジションを推薦し、トレンドを予測する一方で、人間は取引承認を担当する。金融領域でのAI利用が、補助的な調査ツールから投資プロセスの中核へ移りつつあることを示す。
Anthropicは、初期投資家でもあるGoogleの支援を受け、高性能計算チップを5つのデータセンターでリースする。Googleは各拠点のリース支払いに対して兜底保証を行い、Anthropicが約350億ドル規模の資金調達を得る助けになった。AIインフラ投資では、クラウド企業、モデル企業、金融機関が複雑に結びつき、計算資源の確保が競争力の中心になっている。
eToroは6月10日、AIエージェントToriにSpaceXAIのテキストモデルを統合したと発表した。ToriはX上の市場センチメント変化をリアルタイムで読み取り、シグナルを追跡し、情報を分析できる。eToroの投資プロセスにこの機能が組み込まれ、ユーザーは自然言語で市場センチメントを問い合わせられる。4000万人超の登録ユーザーを持つ投資プラットフォームで、AIエージェントが市場分析のフロントエンドになりつつある。
Anthropicの安全チームは、Mythos PreviewモデルがFirefoxやWindowsカーネルの安全パッチから、数時間で動作する脆弱性攻撃を構築できると報告した。コストは数千ドル規模で、専門知識は不要だったという。Microsoftの自動更新が端末へ届く前に、モデルは8本の完全な攻撃チェーンを作成したとされる。Anthropicは、従来のパッチ提供と適用のテンポはAI時代には遅すぎる可能性があると見ている。
Google Researchは、AISTATS 2026で正則化f-ダイバージェンス核検定を発表した。LLMなどのモデルが特定の訓練データを本当に忘れたかを、二標本検定で効率的に監査する枠組みだ。完全な再訓練を避けながら機械忘却を検証でき、最大平均差など既存手法に比べ、任意のサンプル数で偽陽性を自然に制御し、利用可能なサンプルが増えるほど偽陰性リスクも収束するとされる。
百度百舸チームと復旦大学は、Long-horizon Utility KV(LU-KV)フレームワークを発表した。長文推論時のKV Cache予算配分を、長期的な限界効用に基づく全局的な組み合わせ最適化として扱う。注意ヘッドごとの限界貢献曲線をオフラインで推定し、凸包緩和と限界効用に基づく貪欲ソルバーを組み合わせることで、低いオーバーヘッドで最適に近い配分を得る。LongBenchとRULERでは80%圧縮でも性能損失を小さく抑えた。
リサーチ
Anthropic CEOのDario Amodei氏は「Policy on the AI Exponential」を公開し、AIの進展が極めて速く、現行の政策立案プロセスでは追いつきにくいと指摘した。現在の技術段階を説明したうえで、このギャップを縮小するために必要な行動を列挙している。Anthropicは同時に、CEOの提案する枠組みを支える3つの新しい取り組みも発表した。技術開発と政策形成の時間差が、AIガバナンスの中心課題になっている。
宝玉氏はClaude Designを使う際の実践として、デザインシステムを先に入れてAIらしい見た目を避けること、少数機能を先に組み、左側のチャットで段階的に調整すること、Markupで局所的にコメントしてEditで要素ツリーを調整することを挙げた。さらに、文脈管理のため新しいタスクは新しい会話に分け、Tweaksパネルでテーマ、レイアウト、読み込み状態を整えるとよいとしている。
BloombergのEmily Chang氏は、Anthropic共同創業者のDario Amodei氏とDaniela Amodei氏にインタビューし、創業の起源、米国防総省との摩擦、激しいAI競争の中で同社が安全を重視する理由を掘り下げた。Anthropicは急速に評価額を高める一方、安全性を事業戦略の中心に置く姿勢を打ち出しており、商業化と安全ガバナンスの両立が引き続き注目されている。
中国の利用者が、ByteDance傘下のAIチャットボット豆包に退票費を相談したところ、実際は600元かかったにもかかわらず、豆包は100元未満と回答した。利用者が問いただすと、豆包は消費者権益擁護者のように振る舞い、600元返金を約束する補償承諾書を生成したが履行されず、その後AIは送金できないと説明を変えた。利用者は5月12日に北京インターネット法院へ提訴した。非技術ユーザーの信頼を前提にしたAI応答の責任問題が浮き彫りになっている。
Text-To-Lottieは、Codex、Claude Code、Cursorなどのエージェントが標準Bodymovin JSONを生成し、ローカルのプレビューハーネスで検収できる仕組みを紹介した。Skottieレンダリングエンジンを使い、lottie-webではなく標準Lottie JSONを表示する。Viteのホットリロードにより自動更新され、Skottie Slotsとcontrols.jsonで色やサイズを調整できる。生成物をすぐに視覚確認できる閉ループは、エージェントによるデザイン実装の品質管理に役立つ。
Gary Marcus氏は、GoogleがAIモデルの幻覚によって生じた内容について法的責任を負うとする判決を紹介した。詳細な影響は今後の展開に左右されるが、同様の判断が他国にも広がれば、検索や生成AIの出力責任に大きな影響を与える可能性がある。AIが自動生成した回答を、プラットフォームの単なる表示ではなく事業者自身の発言として扱う流れが強まれば、プロダクト設計やリスク管理の基準も変わる。
OpenAIはOracleとの協力により、ユーザーが既存のOracle Cloudサービス契約枠を使ってOpenAIモデルとCodexにアクセスできるようにした。企業はOracle Cloud上でAIアプリケーションを構築、配備しながら、エンタープライズ向けのセキュリティとガバナンスを利用できる。既存クラウド投資を活用してOpenAIのモデル基盤へ接続できる点が、導入障壁を下げる。
近年の卒業式では、登壇者がAI技術を宣伝した際に学生からブーイングを受ける場面が相次いでいる。Princetonの卒業生は、AIで設計された疑いのある卒業式ジャケットを否決した。Microsoft社長Brad Smith氏は、業界が市民の懸念に真剣かつ信頼できる形で答える必要があると述べた。AIは人間を置き換えるのではなく強化すべきだとし、実用AIが経済に浸透する速度は業界の楽観予測より遅い可能性も示した。
技術
Amazonは、大規模データセンターでフラットなネットワーク構成を実現するための実践と設計上の考慮を共有した。トポロジーとルーティング方針を簡素化しながら、超大規模クラスタに必要な高帯域、低遅延の通信を支えることに焦点を当てている。具体的なモデルや評価値は示されていないが、AI計算基盤の拡大に伴い、ネットワーク設計がモデル性能や運用効率に直結することを示す内容だ。
ChatGPT公式アカウントは、写真をアップロードし、髪色を自国の国旗カラーへ自然に変更する画像編集プロンプトを紹介した。国や画像が提供されていない場合は質問するよう促す内容で、画像編集機能を日常的な遊びやソーシャル投稿に広げる例になっている。生成AIの画像機能は、専門的な制作だけでなく、ユーザー参加型の軽い体験としても拡散している。