Nemotron 3.5 Content Safetyが企業向け多モーダル安全評価を強化
Nemotron 3.5 Content SafetyはGemma 3 4B ITを基盤とし、128Kコンテキストでユーザープロンプト、画像、アシスタント応答を一体的に安全評価する。企業が自然言語で独自ポリシーを定義でき、THINKモードでは監査可能な推論過程も出力する。12言語で明示的に訓練され、基盤モデルの汎化により約140言語へ対応する。
本日のAI業界注目ニュースを 29件 厳選してお届けします。
Nemotron 3.5 Content SafetyはGemma 3 4B ITを基盤とし、128Kコンテキストでユーザープロンプト、画像、アシスタント応答を一体的に安全評価する。企業が自然言語で独自ポリシーを定義でき、THINKモードでは監査可能な推論過程も出力する。12言語で明示的に訓練され、基盤モデルの汎化により約140言語へ対応する。
neolabは、Qwen3.5-397B-A17Bを基盤とする397BパラメータのMoE推論モデルNex-N2-Proを発表した。262Kコンテキストと多モーダル入力に対応し、推論深度を自動調整して思考トークンを30から50%削減しながら、エージェント型コーディング、深い検索、ツール利用で高い性能を狙う。
NVIDIAは、長時間稼働するAIエージェント向けにNemotron 3 Ultraを公開した。多輪対話で文脈を維持し、ツールやサブエージェントを呼び出す複雑なワークフローを支える。多エージェント協調でトークン量が増える場面でも、推論速度とコスト効率を改善することを目的としている。
Google AI for Developersは、オープンウェイトのリアルタイム音楽モデルMagenta RealTime 2を発表した。MIDIキーボード、リアルタイムのテキストプロンプト、ジェスチャーで演奏でき、MacBook上で200ミリ秒未満の遅延で動作する。推論エンジン、アプリ、プラグインもあわせて公開されている。
ReplitはShopifyと連携し、Replit Agentに販売したい商品を伝えるだけでカスタム店舗ページの作成、Shopifyストアの生成、商品の追加まで進められる機能を発表した。ユーザーはShopify側で店舗を認証し、決済を設定すれば開業できる。
OpenAIは、ChatGPTの新しい記憶システムDreamingを発表した。ユーザーの好みをより効果的に保持し、複数の会話にまたがって文脈を新鮮かつ関連性の高い状態に保つことで、個人化されたアシスタント体験を高める。
macOS版Geminiアプリは、2つのCommandキーを同時に押すだけで現在のアクティブウィンドウをチャットに添付できるようになった。スクリーンショットやタブ切り替えなしに、画面内容に応じた支援を受けられる。
OpenAIは、Responses APIとCompletions APIでmoderation scoresを利用可能にした。生成と同じリクエストフローで審査シグナルを返し、アプリ側で記録、ルーティング、レビュー、ブロックなどに活用できる。
Stanfordの研究者は、推論、エージェント、記憶、学習を端末上で実行するオープンソースフレームワークOpenJarvisを発表した。Intelligence、Engine、Agents、Tools & Memory、Learningという5つの原語に分解し、クラウドAPIコストを大幅に下げながら個人AIシステムを構築できる。
Anthropicは、AIを使ってソフトウェアの脆弱性を発見するための参照フレームワークをGitHubで公開した。AIによるコード解析と検証を組み合わせ、セキュリティ欠陥の発見を支援する取り組みとして注目される。
NotebookLMは、作成物の背後で使われたプロンプトとソースを確認できるソース帰属機能を追加した。利用者は各出力がどの情報から作られたかを把握し、必要に応じて反復調整できる。
OpenAI Developersは、CodexにBuild iOS Appsプラグインを追加した。Codexがアプリ内ブラウザでiOSアプリを表示・テストし、SwiftUIプレビューを開き、Codex内からホットリロード編集を進められる。
世界最大の半導体受託製造企業TSMCは、AI需要を背景にした顧客要望への対応が容易ではないことを示した。米国内生産で需要を満たすには非常に長い時間がかかる可能性があり、AIインフラ拡大に伴う先端製造能力の制約が浮き彫りになっている。
Cloudflare Radarの統計によると、直近1週間のHTMLリクエストではボット、クローラー、AI取得、各種自動スクリプトが57.5%を占め、人間のブラウザ閲覧を上回った。Webの主役が人間による閲覧から機械間通信や自動取得へ移りつつあることを示す数字だ。
国連大学の報告は、AI需要によりデータセンターの電力、水、土地、炭素排出の負荷が急増すると警告した。2030年には年間電力消費が945テラワット時、水消費が9.3兆リットルへ増える見通しで、AI導入には環境コストの管理が不可欠になる。
MicrosoftのAI部門責任者は、Anthropicのモデルが高価すぎるとして、より安価な代替モデルを社内で開発していると述べた。大規模AIの利用拡大に伴い、性能だけでなく推論コストの管理が主要な競争軸になっている。
OpenRouterは、DeepSeekが同プラットフォームのトークンシェアランキングで4週連続首位になったと発表した。モデル利用の実需が拡大していることを示す指標として、API市場での存在感が強まっている。
NVIDIAは、Rafiqspace.aiがNemotron Parakeet ASRを微調整し、インドネシア語の文字起こしで97.7%の精度、2.3%の単語誤り率を達成したと紹介した。法務や監督のように転写品質が重要な領域で、コスト削減と高精度を両立する事例になる。
GitHubは、GitHub Universe 2026を10月28日から29日にサンフランシスコのFort Mason Centerで開催すると発表した。テーマはエージェント時代に焦点を当て、開発者、企業、AIツールの新しい関係が中心になる。
Google Researchは、スマートフォンの前面カメラを使って日常利用中に顔動画から心拍数を推定する受動的心拍監視システムPHRMを発表した。心電図を基準にした平均絶対パーセント誤差は10%未満で、さまざまな肌色の人に対して業界精度基準を満たすとしている。
NVIDIAは、Nemotron-3 Nanoの100Bトークン継続学習実験で、タスク種子型の合成データ生成がMMLU-Pro、コード、常識理解、GPQAの成績改善に寄与したと報告した。公開タスクの訓練集合を種子に新しい例を生成し、検証と重複除去を経て訓練データに加える。
NVIDIA AIは、撮影間の光度変化を補正するPPISPを紹介した。画像の明るさやカメラ設定が一致しない状況でも、放射場ベースの3D再構成品質を高めることを狙う。
OpenAIは、現在のシステムに再帰的自己改善の初期兆候が見られると述べた。AI開発そのものがAIによって加速され、開発者や国家間の競争圧力を高め、既存の制度では扱いにくいガバナンス課題を生む可能性がある。
Boson AIとLMSYSは、SGLang-Omni推論フレームワークを基盤にしたHiggs Audio v3 TTSのエンドツーエンドサービスを発表した。約4Bパラメータのモデルで100言語に対応し、感情、スタイル、韻律、効果音をテキスト内タグで制御できる。ストリーミング合成にも対応する。
Nemotron 3.5 ASRは、600Mパラメータの多言語ストリーミング音声認識モデルとして紹介された。40の言語・地域を単一チェックポイントで扱い、低遅延の文字起こしと句読点付きの本番向けテキスト出力に対応する。推論時に遅延と精度のバランスも調整できる。
Ethan Mollick氏は、AIとの共存や協同知能という見方が変わりつつあることを論じた。AIに本を売り込む方法も取り上げながら、人間とAIの分担や相互作用が今後どのように再定義されるかを考察している。
OpenRouterは、11種類の大規模言語モデルに30ラウンドのリアルタイム意思決定タスクを行わせた。実験は、静的ベンチマークの順位が自律制御や即時判断を必要とするエージェント型タスクの実力を十分に示さないことを明らかにし、ClaudeとGrok系モデルが速度と成功率で目立った。
経済学者のAlex Imas氏とPhil Trammell氏は、AGI後の世界で何がなお希少であり続けるかを議論した。ロボットの数は急速に複製できても、人間固有の技能や身体性を持つ人材は同じようには増えないという観点を提示している。
OpenAIは、AIを活用して生物防御とレジリエンスを強化する行動計画を発表した。将来の生物学的脅威に備え、AI駆動のバイオセーフティ能力を構築する方針を示している。