AI Daily Digest — 2026年6月9日
本日のAI業界注目ニュースを 31件 厳選してお届けします。
モデル
プロダクト
業界
リサーチ
技術
モデル
小米 MiMoはTileRT_AIと共同でMiMo-V2.5-Pro-UltraSpeedを発表した。1兆パラメータ級MoEモデルで初めて1,000 tokens/sを超える出力速度を実現し、CerebrasやGroqではなく標準的な単一8-GPGPUノードで動作する点を強調している。期間限定の無料チャット体験も用意され、UltraSpeed APIは通常の3倍価格ながら、出力体験は約10倍高速になる。企業向け申請期間はPDTで6月8日から23日まで。
Appleは第三世代のApple Foundation Models(AFM)ファミリーを発表した。Googleと協力してカスタム構築した5つの基盤モデルで構成され、オンデバイスモデルからPrivate Cloud Compute上のサーバー側モデルまでをカバーする。新しいSiriや各種Apple Intelligence機能を支え、OSに深く統合される一方、プライバシー保護を中核原則に据えている。
OpenBMBは最新の音声生成モデルVoxCPM2の技術報告を公開した。2Bパラメータ規模で、200万時間超の多言語音声データを用いて学習され、30言語と9種類の中国語方言に対応する。自然言語による音声設計、制御可能な高忠実度の継続音声クローン、16kHzの意味符号化と48kHz波形再構成を組み合わせた設計を特徴とする。モデル重み、微調整コード、推論ツールはApache 2.0で公開されている。
Alibaba傘下の高徳は、世界初をうたう3Dネイティブ都市世界モデルABot-Earth0.5を発表した。190以上の国と地域をカバーする3D地図を構築済みで、衛星画像やテキスト入力から、消費者向けGPU上で10分ほどでキロメートル級の3D都市を生成できる。出力は編集可能な3DGS形式でUnityなどに取り込め、地図制作コストを従来比で大幅に下げることを狙う。具身知能、低空経済、緊急対応などへの応用も見込む。
プロダクト
Runwayは編集モデルAleph 2.0の新機能を紹介した。既存動画をアップロードし、必要なアスペクト比を選ぶだけで、モデルがシーンの残り部分を自然に補完し、各フィードやフォーマット向けの動画を作成できる。最初からその構図で撮影したような見え方を目指しており、デスクトップWebアプリで試用できる。
Apple Core AIフレームワークの開発者向けドキュメントがHacker Newsで注目を集めた。Apple Developer上の公式ドキュメントにリンクされており、AppleのAI機能をアプリやOS機能へ組み込むための中核的な枠組みとして関心を集めている。WWDC期の開発者向けAI基盤として、Apple Intelligence関連の実装導線を示す内容になっている。
Moonshot AIのKimi Codeは大規模アップグレードを行った。1行コマンドで導入でき、ミリ秒級で起動するCoding Agentとして、動画理解能力を新たに追加した。動画のスタイル抽出によるLUT生成、長尺動画の切り出し、録画からのコード生成に加え、同花順や天眼查などのデータソースと連携し、株価、財務報告、学術論文なども扱える。ACPプロトコル経由でJetBrainsやZedからも利用でき、Kimi K2.6モデルが視覚推論を支える。
WeChat開発者向け公式アカウントは、WeChat AIが内測段階にあることを発表した。小程序のソースコードをプラットフォームに読み取らせる自動モードでは追加開発なしにWeChat AIがページを操作でき、開発モードでは開発者が独自スキルを作成し、審査後にWeChat AIから呼び出せる。両モードは同時に有効化でき、ユーザーは自然言語対話で小程序を呼び出し、アクセスし、操作できる。
Claudeは公開ディレクトリに掲載済みのConnector向けに、性能監視ダッシュボードのパブリックベータを追加した。所有者はアクティブユーザー数、ツール呼び出し回数、ディレクトリ順位、ヘルススコア、エラー率、レイテンシを確認でき、ツール別のエラー原因分析も可能になる。TeamまたはEnterpriseアカウントの管理権限が必要で、MCPで構築したConnectorの運用改善を支援する。
Appleは次世代のApple Intelligenceを発表し、iPhone、iPad、Macの日常体験にAI機能をより深く統合する方針を示した。ユーザーに合わせた、より個人化された支援をOS全体で提供することを狙い、Siriやアプリ横断のスマート機能と連動する。オンデバイス処理とPrivate Cloud Computeを組み合わせ、利便性とプライバシー保護の両立を前面に出している。
GoogleのNotebookLMは大型アップグレードを行い、会話内でのエージェント能力、高度な推論、複数の新しい出力形式を追加した。複雑な多段階リサーチの質問を扱いやすくすることを目的としており、まずGoogle AI Ultra加入者向けに提供される。ノートや資料をもとにした調査支援ツールから、より能動的な研究エージェントへ近づく更新だ。
ChatGPTは、データや比較情報を直接グラフへ変換する機能を追加した。モバイルとWebの両方で利用でき、表や数値の比較を会話内で視覚化しやすくする。分析、報告、意思決定の場面で、外部ツールに移動せずに図表を作成できる点が実用上の価値になる。
業界
OpenAIはSECに対し、IPO登録届出書にあたるS-1草案を非公開で提出した。現時点では上場時期は決まっていない。非公開提出は正式な上場プロセスへ向けた重要な準備段階であり、生成AI企業の資本市場入りが現実味を帯びた動きとして注目される。
OpenAIのSam Altman氏と首席科学者Jakub Pachocki氏は、同社が第三の発展段階に入ったと表明した。第一段階はAGI技術の研究開発、第二段階はグローバルな製品提供であり、第三段階では自動化されたAI研究者の構築、経済成長の加速、全員に個人AGIを届けることを目標に置く。安全性を守るため、国際機関によるAIリスク対応や、必要に応じた前線モデル研究の一時停止にも言及した。
AppleのWWDC 2026基調講演は公式サイトでライブ配信され、Hacker News上でも高い注目を集めた。Apple Intelligence、Core AI、Siri、OS全体へのAI統合に関する発表が集中する時期であり、開発者とAI業界双方にとって、Appleのプラットフォーム戦略を確認する重要イベントになっている。
NVIDIAとLGグループは、ロボット、自動運転、データセンター、GPUクラウドサービスを支えるAIファクトリーの構築で協力する。NVIDIAのAIファクトリープラットフォームとLGの家電、ロボティクス、モビリティ、スマート空間技術を組み合わせ、AIモデル開発、物理AIデータ生成、ロボットシミュレーション、エッジ展開、工場デジタルツインをつなぐ。LG ElectronicsはIsaac SimやIsaac Labを活用し、家庭用ロボットCLOiDなどの開発を進める。
Appleは、EUのデジタル市場法(DMA)の影響により、Siri AIをiOS 27およびiPadOS 27のリリース時点でEU地域に提供できないと説明した。EUでの提供時期は他地域より遅れる見通しで、具体的な時期は明らかにされていない。規制対応がAI機能の地域展開に直接影響する事例として重要だ。
生数科技と華策影視は6月7日、AIと映像産業の融合を進める戦略提携を締結した。華策影視科技産教示範区を拠点に、Vidu動画生成モデルを技術基盤とするAI視聴覚制作センターを設立し、AIバーチャル制作と実写撮影の融合を探る。浙江華策影視学校にはAI映像制作専攻も設け、AI動画制作技術をカリキュラムに組み込む。
英国は「AIを作る国」になると宣言してから1年で、主権AI計画を実行段階へ進めている。AIクラウド提供者の数は倍増し、NebiusはNVIDIA AIインフラを3件展開、2027年に最大65メガワットへ拡大する見込みだ。5,400基のNVIDIA GH200を搭載したIsambard-AIはゼロカーボン電力で稼働し、Cosine、Cursive、Doubleword、Prima Menteなどの英国スタートアップがコーディング、自己改善AI、推論最適化、生命科学で活用する。
OpenAIは、AIが雇用、生産性、経済に与える影響を研究するEconomic Research Exchangeを開始した。研究プロジェクトの申請も受け付けており、AIの経済的影響をより体系的に測定・議論する場を作る狙いがある。生成AIの普及が労働市場や生産性に与える効果を検証する動きとして注目される。
リサーチ
Anthropicは、生物学分野でAIエージェントを実用化するための課題を検証した。Claude、Biomni、Edison Analysis、GPTなどの科学エージェントにNCBI Virusから配列データを取得させたところ、最も強いモデルでも信頼できるデータセット構築に必要な正確性を安定して満たせなかった。一方、決定論的検索層であるgget virusを追加すると正確性はほぼ100%に近づいた。生物学データ基盤は、AIエージェントを大規模ユーザーとして想定して設計し直す必要がある。
Perplexityとハーバード大学は、チャット型検索からComputerのような自律エージェントへ移る効果を調べた研究を発表した。3か月以上の調査では、Computerを使った労働者は検索だけを使う場合に比べ、タスク完了が87%速く、コストは94%低く、満足度も高かった。知識労働のワークフローが、検索支援からエージェント実行へ移る可能性を示す結果だ。
Tencent Hunyuanは上海交通大学、南洋理工大学などと共同で、AI音声・オーディオ編集能力を評価する初の包括的ベンチマークMMAEを公開した。MMAEは既存音声を理解し、自然言語指示に従って精密に編集する能力を測る。現在のモデルの完全一致率は5%未満で、信頼できる音声編集には大きな課題が残る。2,000件の高忠実度実世界サンプルと17,741件の細粒度評価項目を含み、論文、コード、データセット、デモが公開されている。
技術
Sam Altman氏のOpenAIの将来像に関するブログでは、2028年3月までに同社の研究の大部分をAIが担うようになるとの見通しが示された。主な目標は、自動AI研究者の構築、それを使った科学と生産の加速、そして仕事、学習、プログラミング、ビジネス、健康関連文書、意思決定を支援する個人AGIを全員に届けることだ。
Microsoft AI CEOのMustafa Suleyman氏はDecoderのインタビューで、スーパーインテリジェンスは近づいているが、大規模失業を引き起こすとは考えていないと述べた。MicrosoftはOpenAIとの新契約により協力関係を強化しつつ、独自にスーパーインテリジェンスを追求できるようになった。前線モデルの訓練や全モーダルモデルの発表を進める一方、AI製品には社会的な不安を乗り越える品質が必要だと強調している。
小互氏は、動画翻訳ツールxiaohu-video-translateを公開した。ユーザーがリンクを指定して翻訳を依頼するだけで、動画のダウンロード、Whisperによるローカル文字起こし、AI翻訳と推敲、字幕焼き込み、文稿作成までを自動で行う。YouTube、Bilibili、抖音、本地ファイルに対応し、英語、日本語、韓国語、フランス語、スペイン語などを中国語字幕へ変換できる。Claude Code、Codex、OpenClawなどのAIコーディングツールにも適配する。
HivemindはAIプログラミングエージェント向けの継続学習機能を公開した。Claude Code、Codex、Cursor、Hermes、Piなどのチーム内エージェント実行軌跡を収集し、再利用可能なスキルへ変換して全エージェントへ配布する。データはユーザー自身のクラウドストレージに保存される。内蔵のSkillOptにより、Claude Codeで19.1ポイント、Codexで24.8ポイントの精度向上が報告され、全52テスト設定で最良または同等の結果を示した。
邵猛氏はDesign Skill、Taste Skill、Anti-AI-slop design skillに注目し、ブランドをもとにAgentへデザイン感覚を学ばせるBrand to DESIGN.md Skillを公開した。一方で、こうしたサイト模倣を見続けると、Anti-AI-slopから新たなAI Slopが生まれやすいとも指摘する。表面的な類似だけでなく、デザインの本質をどう保持するかが課題になる。
Claude DevsはClaude CodeのGA一周年に合わせ、最初のデモが受け取ったSlackリアクションから現在までを振り返った。Boris Cherny氏とCat Wu氏が、検証のベストプラクティス、自動モードを構築した理由、ルーチンとループ、今後の方向性を語っている。AIコーディングエージェントの実用化では、生成能力だけでなく検証プロセスと自動実行の境界設計が重要になる。
Hugging Faceのブログでは、パキスタンのユーザーがリンク、電話、OTP共有、支払いの前に不審なメッセージを判定できるPakistan Notice Helperが紹介された。テキストまたはスクリーンショットを入力すると、リスクレベル、短い説明、見える警告サイン、安全な次の行動を返す。英語とウルドゥー語に対応し、最終的にはQwen3.5 4B Q8をllama.cppとCUDAで動かす構成を採用した。高リスク詐欺とスクリーンショットのテストケースをすべて通過した。
OpenRouterは、新しいサーバーツールAdvisorを発表した。小型モデルがより高知能なアドバイザーモデルに相談できる仕組みで、行き詰まりループから抜け出したり、より安価なモデルへ移行したりする際の支援を狙う。モデルルーティングやコスト最適化の実務で、小型モデルを単独で使うのではなく、必要な場面だけ高性能モデルを補助的に使う設計を後押しする。