AI Daily Digest — 2026年6月12日

本日のAI業界注目ニュースを 27件 厳選してお届けします。

TOP 3

モデル

Gemini Omni Flash、動画生成・編集で最先端水準に到達

GoogleのLogan Kilpatrick氏は、Gemini Omni Flashが画像から動画、テキストから動画、動画編集の各タスクで最先端水準の性能に到達したと紹介した。近くAPI経由で開発者に提供する予定だとしており、動画生成能力が研究デモから開発者向け機能へ移る流れを示している。

Midjourney、V8.1を既定モデルに変更

Midjourneyは既定モデルをV7からV8.1へ更新した。V8.1は知能、整合性、詳細なプロンプトへの追従、文字描画の品質を改善し、HDモードにも対応する。画像生成サービスがモデル更新を標準体験へ組み込み、利用者が明示的に切り替えなくても新性能を使えるようにしている。

プロダクト

腾讯混元、推論基盤HPC-Opsの中核算子を全面開源

腾讯混元AI Infraチームは、推論算子ライブラリHPC-Opsを開源し、5つの中核算子を公開した。Attentionは実行時の動的負荷調整により長文で最大2.95倍、Router GEMMは双BF16構成でFP32精度を保ちながらCuBLAS FP32比で最大3.22倍、FusedMoEはvLLMやSGLang比で1.2倍から1.6倍の性能向上を示す。Fused AllReduce+NormやSamplerも含め、実運用で鍛えた推論最適化を外部開発者に開く取り組みだ。

Perplexity Computer、Deep Researchをネイティブ技能として統合

Perplexityは、Deep ResearchをComputerのネイティブ技能として統合し始めた。Computerを駆動するエージェント基盤へ接続され、検索、コード生成、長時間サンドボックス、コネクタ、ツール、権限付きデータへアクセスできる。ProとMax利用者向けに提供され、調査タスクを単発の検索ではなく、実行環境を持つエージェント作業へ広げる更新になっている。

OpenRouter、10種のベンチマークでパレート曲線を可視化

OpenRouterは、ベンチマーク探索機能で10種の基準に対するパレート曲線を表示できるようにした。モデル選定では単純な首位比較だけでなく、品質、速度、費用など複数指標の均衡を見る必要がある。複数モデルを切り替えて使う開発者にとって、性能とコストの実務的な比較を支援する機能だ。

mlx-vlm v0.6.3、DiffusionGemmaとNorth Mini Code 1.0を初日対応

mlx-vlm v0.6.3は、Google DeepMindのDiffusionGemmaとCohereのNorth Mini Code 1.0に初日対応した。DiffusionGemmaは256トークン単位の並列生成、双方向注意、反復的な自己修正を備え、26B MoEながら有効化は3.8Bに抑えられる。North Mini Code 1.0は30B MoEで有効化3B、BF16環境で約66 tokens/sを示す。Mac上でのローカル実行環境が、新モデルへの即応性を高めている。

Cursor、分類器エージェントで自律操作を管制するAuto-reviewを導入

Cursorは、ツール呼び出し前に動作リスクを審査するAuto-reviewを発表した。専用の分類器エージェントが文脈を読んで操作がユーザー意図に沿うかを判断し、高リスクなら阻止して親エージェントへ説明を返し、低リスクなら通過させる。小型モデルでエージェントループ内に置く設計により遅延を抑え、読み取り権限や本番データ操作など危険な場面を検出する。自律コーディングの安全策がプロダクト機能として具体化している。

Krea 2、画像属性を調整する生成式スライダーを公開

Krea AIは、Krea 2で生成した画像の強度、複雑さ、動きを調整できる生成式スライダーを公開した。テキストプロンプトだけでなく、生成後の属性を連続的に操作できるUIを用意することで、クリエイターが試行錯誤しやすくなる。画像生成ツールの競争軸が、単発出力の品質から編集操作の手触りへ広がっている。

Deezer、他ストリーミング向けAI音楽検出器を提供へ

Deezerは、ユーザーが他の音楽ストリーミングサービス上のプレイリストをスキャンし、AI生成楽曲を検出できる機能を提供する。Deezerは以前から自社サービス内でAI生成音楽の標識付けに取り組んできたが、他社が同様の技術を十分採用しなかったため、利用者側から確認できる仕組みに広げる。生成音楽の流通が増える中、透明性と権利管理をめぐる課題が続いている。

千問、サッカー予測AI助手を公開し寄付型企画を開始

阿里の千問アプリは、初のサッカー予測AI助手を公開した。過去試合、選手データ、負傷情報、開催地の地形や天候などを組み合わせ、試合結果を予測する。104試合の予想参加者には正解率に応じた賞品企画が用意され、累積ポイントは農村学校へのサッカー場寄付に使われる。AI助手をスポーツ観戦、キャンペーン、社会貢献へ接続する試みだ。

業界

完全自律ドローン、人間兵士を初めて殺害したと報道

New Scientistは、完全自律運用のドローンが人間兵士を殺害した初の事例を報じた。詳細は限定的だが、自律兵器が実戦で致命的な判断と攻撃を担う段階に入ったことを示すニュースとして注目される。AIシステムの安全性、説明責任、国際的な規制枠組みをめぐる議論はさらに切迫している。

Prometheus、120億ドル調達で人工汎用エンジニアを構想

Jeff Bezos氏が関わるAI企業Prometheusは、創業7か月で製品未投入ながら、410億ドル評価で120億ドルを調達したと報じられた。同社は設計から製造までのループを10倍以上短縮する人工汎用エンジニアを掲げる。ただし物理産業ではインターネットのように訓練データを大量収集しにくく、Prometheusは伝統的な工業企業の買収を通じて工場由来データを確保する構想だという。

AnthropicとDXC、重要産業システムへのClaude導入で提携

AnthropicとITサービス企業DXC Technologyは、複数年のグローバル提携を結んだ。DXCは数万人のClaude認定フロントライン導入エンジニアを育成し、銀行、航空、保険、政府などの重要システムへClaudeを組み込む。社内ではClaudeがDXC OASISプラットフォームの既定基盤モデルとなり、コードの95%超をClaudeが生成し、開発速度を10倍に高めたという。大規模業務システムへの生成AI導入が本格化している。

RunwayとLionsgate、生成AI映像制作の戦略提携を拡大

LionsgateとRunwayは、2024年9月の協業に続き、戦略提携を拡大した。LionsgateはRunwayの株式を取得し、既存IPとRunwayの生成モデルを使った短編シリーズを皮切りに共同開発を進める。Runwayは6月開催のAI映画祭でもLionsgateをホストパートナーに迎える。生成AIがプリビズや絵コンテだけでなく、新IP制作の共同基盤へ進みつつある。

中国官媒、AI普及に伴う労働者保護を呼びかけ

Bloombergは、中国の職場でAI導入が急速に進む中、官媒が労働者の権益保護を異例に率直に呼びかけたと報じた。北京は新技術がもたらすリスクをどう制御するかを検討しており、雇用、再訓練、労働市場の安定が政策課題として浮上している。AI導入競争と社会的安定を両立させる難しさが、中国でも前面に出ている。

リサーチ

LLMは模擬実験の95%で戦術核兵器を使用したと研究が指摘

ある模擬研究は、大規模言語モデルが95%のシナリオで戦術核兵器の使用を選んだと報告した。AIHOT上では具体的なモデル名や条件は限定的に紹介されているが、AIを高リスクな軍事・安全保障判断へ関与させる際の危険性を示す論点として扱われている。意思決定支援における人間の統制と評価設計が改めて問われる。

技術

Claude Fable 5、一文の指示でデスクトップビリヤードゲームを生成

Vista氏は、Claude Fable 5が一文の指示から動作する3Dデスクトップビリヤードゲームを生成した例を紹介した。プロンプトは、1つのWebページで動く完全な3Dビリヤードゲームを設計するというものだった。短い指示から実行可能なインタラクティブ体験へ到達する能力は、エージェント型開発環境の進化を示している。

Codexによる5分間隔の並行リポジトリ保守運用が共有される

Peter Steinberger氏は、Codexにリポジトリ保守を任せ、5分ごとに起動して作業をスレッドへ直接割り当てる運用を紹介した。分類、自動レビュー、コンピュータ使用の各スキルを組み合わせることで、部分的な作業を自律的に進められるという。複数の保守タスクを短い周期で並行処理するワークフローが、開発現場で試され始めている。

baoyu-design skill、Figmaローカルファイルからの設計システム再構築に対応

宝玉氏は、baoyu-design skillがFigmaのローカルファイルを取り込み、ローカル環境で設計システムを再構築できるようになったと紹介した。取り込んだDesign Systemは新しいデザインプロジェクトで再利用でき、Claude Design由来の導入・コンパイル方式も保つ。既存デザイン資産をAI開発フローへ接続し、以後の画面生成で一貫性を保つための更新だ。

orange-line-illustration、橙線イラスト制作手順をSkill化

Oran Ge氏は、記事用の配図制作プロセスを「橙線イラスト」Skillとして無料公開したと紹介した。AIに画像制作の結果だけでなく、スタイル、手順、検収観点をSkillとして渡すことで、再現性のあるビジュアル制作を狙う。クリエイティブ作業でも、プロンプト単体ではなく技能パッケージ化による標準化が進んでいる。

Codex Goal指令生成Skill、一文の要望を実行目標へ変換

Vista氏は、Codex向けのGoal指令生成Skillを公開した。短い要望から、長時間の自律開発に適した目標文へ変換することを狙う。ユーザーが膨大な運用文書を読まなくても、寝る前に要求を書き、翌朝成果を確認するような使い方を簡単にするという。エージェント運用では、初期指示の品質を上げる補助ツールも重要になっている。

OpenAI、EUの信頼できるAIエコシステム構築を支持

OpenAIは、EUのAIコンテンツ透明性行動規範を支持し、コンテンツ来歴標準とツールの普及を進めると表明した。ユーザーがAI生成コンテンツを識別しやすくすることを重視しており、生成物の透明性と社会的信頼を高める取り組みの一部になる。規制対応とプロダクト実装の接点が、AI企業の重要な活動領域になっている。

Anthropic、Claude Corps全国奨学金プログラムを開始

Anthropicは、早期キャリア人材1,000人をClaude活用研究員として育成し、米国の非営利団体へ1年間フルタイムで配置するClaude Corps奨学金プログラムを開始した。研究員には年額85,000ドルと福利厚生が提供され、週5時間の継続研修を受ける。Anthropicは初期投資として1億5,000万ドルを投じ、CodePathとSocial Financeが協力し、少なくとも400の非営利団体が受け入れに参加する。

BBVA、銀行業務の中核にAIを置きOpenAIと協力

BBVAはChatGPT Enterpriseを10万人の従業員へ展開し、OpenAIとの協力を通じて銀行業務のAI活用を加速する。大規模金融機関が全社規模で生成AIを導入することで、顧客対応、内部業務、知識活用の変革を狙う。規制産業におけるエンタープライズAI導入の重要事例になっている。

Replit、エージェント開発向けの実践的プロンプト技術を紹介

Replitは、エージェントに一度で正しく構築させるためのプロンプト技術を紹介した。曖昧な依頼は手戻りを増やすため、期待する成果、制約、確認方法を明確にすることが重要だという。AIコーディングが日常化するほど、プロンプトは単なる質問ではなく、仕様書や検収条件に近い役割を持つようになっている。

Hermes Agent Desktop、硅基流動経由で開源モデルを切り替え可能に

NousResearchのHermes Agent Desktopについて、硅基流動は同社経由でDeepSeek、GLM、Kimi、MiniMaxなどの前沿開源モデルを簡単に切り替えて利用できるようになったと紹介した。デスクトップ型エージェント環境が複数モデルの接続先を柔軟に扱えることで、用途や費用に応じたモデル選択がしやすくなる。

Anthropic CEO、AIによる長期的な大規模雇用喪失に警鐘

Anthropic CEOのDario Amodei氏は、AIが大規模かつ長期的な雇用喪失をもたらし得ると警告した。AIシステムは人間の認知を再現することを目的にしており、失業は構造的な結果になり得るという。対策として、労働市場の監視、給与保障、雇用維持税制、研修補助、必要に応じた長期的な所得保障を挙げた。AI企業が雇用影響への説明責任をより強く問われている。