AI Daily Digest — 2026年6月4日

本日のAI業界注目ニュースを 32件 厳選してお届けします。

TOP 3

モデル

Grok Imagine 1.5プレビュー版が公開

Grok Imagine 1.5のプレビュー版が公開され、同日からAPIで試せるようになった。画像生成分野での機能強化を進めるxAIの新たなモデル展開として注目される。

オープン音声モデルMiso Oneが公開

Miso Oneは、人間らしい温かさとリズムの再現を目指す80億パラメータのオープンウェイト音声合成モデルとして公開された。短い音声サンプルによるワンショット音声クローンに対応し、推論遅延は110ミリ秒とされる。モデルを自前でホストできるため、音声データをローカル環境に保持できる。

Ideogram v4.0が2K解像度とJSONプロンプトに対応

Ideogram v4.0が公開され、ネイティブ2K解像度、文字描画性能の向上、JSON形式のプロンプト対応が追加された。Kreaから利用でき、精密な画像生成と構造化された指示を扱いやすくする。

プロダクト

xAIのGrok音声モデルがVapiで利用可能に

xAIのGrok STTとGrok TTSが企業向け音声AIプラットフォームVapiに追加された。開発者は、顧客の言語で会話し、規制対象の業務フローでも重要情報を扱えるカスタム音声エージェントを構築できる。

GrokモデルがCloudflare AI Gatewayに対応

xAIのGrokモデルがCloudflare AI Gatewayから利用できるようになった。開発者はCloudflareのゲートウェイを通じてモデル呼び出しを管理し、既存のAIアプリ基盤へ統合できる。

OpenShell v0.0.55がVertex AI推論に対応

OpenShell v0.0.55が公開され、Google Vertex AIを推論プロバイダーとして利用できるようになった。設定ファイルに基づくポリシーの可視化、Podman検出、GPUサンドボックスの挙動も改善され、CIとドキュメントの修正も含まれる。

Replitがアプリの発見性を高めるSEO Agentを公開

Replitは、公開済みアプリをスキャンし、Web検索とAI検索で見つけられやすくする改善策を提案するSEO Agentを公開した。アプリ開発後の集客と発見性向上までを支援する機能となる。

OpenClaw 2026.6.1がWindowsノードとSkill Workshopを追加

OpenClaw 2026.6.1が公開され、ネイティブWindowsノードホスト、自律学習型エージェント向けSkill Workshop、Workboardによるオーケストレーション、MiniMax M3対応が追加された。PodmanとGPU環境の運用にも配慮した更新となっている。

業界

MicrosoftとOpenAIの提携関係が崩れ、正面競争へ

MicrosoftとOpenAIの協力関係が大きく後退し、両社は直接競争する段階に入ったと報じられた。Microsoft AI責任者のMustafa Suleyman氏は、必要な能力を自社で一から構築できることを証明しなければならないとの姿勢を示している。

Satya Nadella氏がMicrosoft Build基調講演の要点を共有

MicrosoftのSatya Nadella氏は、Microsoft Buildの基調講演から、最先端のインテリジェントなエコシステムを開発者と共に構築する方針を紹介した。AIエージェントと開発基盤を中心とする同社の戦略を改めて示している。

ChatGPTの月間利用者が10億人を突破したとSensor Towerが推計

Sensor Towerは、ChatGPTの世界月間アクティブユーザーが2025年5月に10億人を突破し、この規模へ最速で到達したアプリになったと推計した。Claudeも月間5600万人へ急成長し、利用者が複数のAIサービスを使い分ける傾向が強まっている。

DeepSeekが初回ラウンドで500億元の調達を計画

DeepSeekは初回資金調達でTencentやCATLなどから約500億元を集め、調達後評価額が3500億から4000億元になる見通しだと報じられた。創業者の梁文鋒氏も200億元を出資する計画で、中国のAIモデルから計算資源、エネルギー基盤までを結ぶ投資の拡大を示している。

Sunoが4億ドルのシリーズD資金調達を完了

AI音楽生成企業Sunoは、評価額54億ドルで4億ドルのシリーズD資金調達を完了したと発表した。音楽制作をより多くの人に開放するという使命の下、製品開発とコミュニティ拡大を加速する。

Qwen Cloudの世界AIハッカソンが開幕

初のQwen Cloud世界AIハッカソンが始まり、参加者は5つの上級トラックでAIエージェントの能力を競う。賞金総額は7万ドルを超え、各トラックの優勝者には1万ドルが提供される。

リサーチ

Stanford Law Schoolの研究でAIが法学教授を上回る

Stanford Law Schoolの研究は、人工知能が特定の課題で法学教授を上回ったと報告した。この結果は法律教育と専門業務におけるAI活用の可能性や、評価方法のあり方をめぐる議論を呼んでいる。

NVIDIA ResearchがCVPR 2026で大規模訓練による汎化研究を発表

NVIDIA ResearchはCVPR 2026で、ロボット把持、自動運転、具身エージェントの汎化能力を扱う3本の論文を発表した。20億回の模擬把持で訓練したGraspGen-X、軽量な潜在表現を使うLCDrive、多数の仮想環境で訓練したNitroGenに加え、運動計画ライブラリと閉ループ把持研究も公開した。

Anthropicが832件のAI悪用アカウントを分析

Anthropicは、2025年3月から2026年3月に停止した832件の悪意あるアカウントをMITRE ATT&CKへ対応付けて分析した。67.3%がマルウェア作成にAIを利用し、中高リスク攻撃者の割合は半年で33%から56%へ上昇した。従来の脅威評価では、エージェントによる攻撃工程の編成を十分に捉えられないと指摘している。

Microsoft Researchが瓶詰め工場で意思決定AIを実証

Microsoft Researchは、米中西部の瓶詰め工場で3か月間行った試験を紹介した。AIが会話支援を越えて意思決定に関与すると、変化する制約や現実のリスクに対応しながら、信頼できる回答を出す必要があることを示している。

技術

世界モデルの機能分類が提示

World LabsとFei-Fei Li氏は、広く使われる「世界モデル」という概念を整理した。言語モデルがテキストの統計を学ぶのに対し、世界モデルは空間と時間、光、物理法則などを学ぶと説明し、部分観測マルコフ決定過程に基づいて異なるシステムを機能別に分類している。

エージェントエンジニアリングの実践的な22の手法が共有

エージェントが実装を担い、人間が方向性を管理する開発方式について、22の実践的な手法が紹介された。Research、Plan、Workの循環と計画ファイルによる制約を中心に、並列実行、入力、遠隔操作、ツール構成などを整理している。

Uberの月額1500ドルAI利用上限が価格設定の参考に

UberがAIツールの利用上限を月額1500ドルに設定していることが、企業向けAIツールの価格と利用管理を考える参考事例として紹介された。高額なエージェント利用の費用対効果を測る具体的な基準になり得る。

AnthropicがClaudeでセルフサービス型データ分析を実現

AnthropicはClaudeを使って業務分析問い合わせの95%を自動化し、約95%の精度を実現したと説明した。データ基盤、検証プロセス、スキルを組み合わせ、概念とデータ実体の不一致、データの陳腐化、検索失敗を抑えることで、データ科学者が戦略的な分析に集中できるようにしている。

Karpathy氏のllm-wikiプロジェクトが5000スターを突破

Andrej Karpathy氏のllm-wikiは、数週間で5000を超えるスターを獲得した。大規模言語モデルに知識を蓄積・更新するWikiを構築させ、セッションごとに同じ知識を再発見する無駄を減らす考え方が支持を集めている。

Reachy MiniにMCPツールが追加

Reachy Miniは、リモートからツールを呼び出すための公開MCP canary Spaceを提供開始した。ロボットやエージェントから外部機能を利用する実験を進めやすくする。

チャットボット以外への直接選好最適化を解説

Dharma-AIは、直接選好最適化の応用範囲をチャットボット以外へ広げる方法を解説した。人間の選好に沿うようモデルを調整する手法を、より多様なタスクやシステムへ適用する可能性を検討している。