AI Daily Digest — 2026年6月5日

本日のAI業界注目ニュースを 29件 厳選してお届けします。

TOP 3

モデル

Nemotron 3.5 Content Safetyが企業向け多モーダル安全評価を強化

Nemotron 3.5 Content SafetyはGemma 3 4B ITを基盤とし、128Kコンテキストでユーザープロンプト、画像、アシスタント応答を一体的に安全評価する。企業が自然言語で独自ポリシーを定義でき、THINKモードでは監査可能な推論過程も出力する。12言語で明示的に訓練され、基盤モデルの汎化により約140言語へ対応する。

Nex-N2-ProがQwen3.5ベースの397B MoE推論モデルとして公開

neolabは、Qwen3.5-397B-A17Bを基盤とする397BパラメータのMoE推論モデルNex-N2-Proを発表した。262Kコンテキストと多モーダル入力に対応し、推論深度を自動調整して思考トークンを30から50%削減しながら、エージェント型コーディング、深い検索、ツール利用で高い性能を狙う。

NVIDIA Nemotron 3 Ultraが長時間稼働エージェントの推論を高速化

NVIDIAは、長時間稼働するAIエージェント向けにNemotron 3 Ultraを公開した。多輪対話で文脈を維持し、ツールやサブエージェントを呼び出す複雑なワークフローを支える。多エージェント協調でトークン量が増える場面でも、推論速度とコスト効率を改善することを目的としている。

Google Magenta RealTime 2がリアルタイム音楽生成に対応

Google AI for Developersは、オープンウェイトのリアルタイム音楽モデルMagenta RealTime 2を発表した。MIDIキーボード、リアルタイムのテキストプロンプト、ジェスチャーで演奏でき、MacBook上で200ミリ秒未満の遅延で動作する。推論エンジン、アプリ、プラグインもあわせて公開されている。

プロダクト

Replit AgentがShopifyと連携して数分で店舗構築を支援

ReplitはShopifyと連携し、Replit Agentに販売したい商品を伝えるだけでカスタム店舗ページの作成、Shopifyストアの生成、商品の追加まで進められる機能を発表した。ユーザーはShopify側で店舗を認証し、決済を設定すれば開業できる。

OpenJarvisがローカル優先の個人AIエージェント基盤として公開

Stanfordの研究者は、推論、エージェント、記憶、学習を端末上で実行するオープンソースフレームワークOpenJarvisを発表した。Intelligence、Engine、Agents、Tools & Memory、Learningという5つの原語に分解し、クラウドAPIコストを大幅に下げながら個人AIシステムを構築できる。

NotebookLMが生成物ごとのソース帰属を表示

NotebookLMは、作成物の背後で使われたプロンプトとソースを確認できるソース帰属機能を追加した。利用者は各出力がどの情報から作られたかを把握し、必要に応じて反復調整できる。

CodexがiOSアプリ構築プラグインを追加

OpenAI Developersは、CodexにBuild iOS Appsプラグインを追加した。Codexがアプリ内ブラウザでiOSアプリを表示・テストし、SwiftUIプレビューを開き、Codex内からホットリロード編集を進められる。

業界

TSMCがAI需要への対応に限界を示す

世界最大の半導体受託製造企業TSMCは、AI需要を背景にした顧客要望への対応が容易ではないことを示した。米国内生産で需要を満たすには非常に長い時間がかかる可能性があり、AIインフラ拡大に伴う先端製造能力の制約が浮き彫りになっている。

Cloudflare Radarでボット流量が人間の閲覧を初めて上回る

Cloudflare Radarの統計によると、直近1週間のHTMLリクエストではボット、クローラー、AI取得、各種自動スクリプトが57.5%を占め、人間のブラウザ閲覧を上回った。Webの主役が人間による閲覧から機械間通信や自動取得へ移りつつあることを示す数字だ。

国連報告が2030年のAIデータセンター水電消費倍増を警告

国連大学の報告は、AI需要によりデータセンターの電力、水、土地、炭素排出の負荷が急増すると警告した。2030年には年間電力消費が945テラワット時、水消費が9.3兆リットルへ増える見通しで、AI導入には環境コストの管理が不可欠になる。

Microsoft AI責任者がAnthropicモデルの高コストを指摘

MicrosoftのAI部門責任者は、Anthropicのモデルが高価すぎるとして、より安価な代替モデルを社内で開発していると述べた。大規模AIの利用拡大に伴い、性能だけでなく推論コストの管理が主要な競争軸になっている。

Nemotron Parakeet ASRがインドネシア語で97.7%の精度を達成

NVIDIAは、Rafiqspace.aiがNemotron Parakeet ASRを微調整し、インドネシア語の文字起こしで97.7%の精度、2.3%の単語誤り率を達成したと紹介した。法務や監督のように転写品質が重要な領域で、コスト削減と高精度を両立する事例になる。

リサーチ

Google Researchがスマートフォンカメラによる受動的心拍監視を発表

Google Researchは、スマートフォンの前面カメラを使って日常利用中に顔動画から心拍数を推定する受動的心拍監視システムPHRMを発表した。心電図を基準にした平均絶対パーセント誤差は10%未満で、さまざまな肌色の人に対して業界精度基準を満たすとしている。

Nemotron事前学習でタスク種子型の合成QA生成が効果を示す

NVIDIAは、Nemotron-3 Nanoの100Bトークン継続学習実験で、タスク種子型の合成データ生成がMMLU-Pro、コード、常識理解、GPQAの成績改善に寄与したと報告した。公開タスクの訓練集合を種子に新しい例を生成し、検証と重複除去を経て訓練データに加える。

技術

OpenAIがAIの再帰的自己改善の初期兆候に言及

OpenAIは、現在のシステムに再帰的自己改善の初期兆候が見られると述べた。AI開発そのものがAIによって加速され、開発者や国家間の競争圧力を高め、既存の制度では扱いにくいガバナンス課題を生む可能性がある。

Boson AIとLMSYSがHiggs Audio v3 TTSのエンドツーエンドサービスを発表

Boson AIとLMSYSは、SGLang-Omni推論フレームワークを基盤にしたHiggs Audio v3 TTSのエンドツーエンドサービスを発表した。約4Bパラメータのモデルで100言語に対応し、感情、スタイル、韻律、効果音をテキスト内タグで制御できる。ストリーミング合成にも対応する。

Nemotron 3.5 ASRが言語・領域・アクセント別の微調整に対応

Nemotron 3.5 ASRは、600Mパラメータの多言語ストリーミング音声認識モデルとして紹介された。40の言語・地域を単一チェックポイントで扱い、低遅延の文字起こしと句読点付きの本番向けテキスト出力に対応する。推論時に遅延と精度のバランスも調整できる。

Ethan Mollick氏が共存と協同知能の終わりを論じる

Ethan Mollick氏は、AIとの共存や協同知能という見方が変わりつつあることを論じた。AIに本を売り込む方法も取り上げながら、人間とAIの分担や相互作用が今後どのように再定義されるかを考察している。

OpenRouterが11モデルでリアルタイム意思決定性能を比較

OpenRouterは、11種類の大規模言語モデルに30ラウンドのリアルタイム意思決定タスクを行わせた。実験は、静的ベンチマークの順位が自律制御や即時判断を必要とするエージェント型タスクの実力を十分に示さないことを明らかにし、ClaudeとGrok系モデルが速度と成功率で目立った。

AGI後に残る希少性をAlex Imas氏とPhil Trammell氏が議論

経済学者のAlex Imas氏とPhil Trammell氏は、AGI後の世界で何がなお希少であり続けるかを議論した。ロボットの数は急速に複製できても、人間固有の技能や身体性を持つ人材は同じようには増えないという観点を提示している。

OpenAIがAI時代の生物防御行動計画を発表

OpenAIは、AIを活用して生物防御とレジリエンスを強化する行動計画を発表した。将来の生物学的脅威に備え、AI駆動のバイオセーフティ能力を構築する方針を示している。