美団、1.6兆パラメータのLongCat-2.0を公開
美団は新世代の大規模モデルLongCat-2.0を公開した。総パラメータ数は1.6兆、平均約480億を活性化し、100万トークンのコンテキストに対応する。国産アクセラレータ5万基のクラスタで訓練・推論を完結し、SWE-bench Proで59.5、Multilingualで77.3を記録した。
本日のAI業界注目ニュースを 22件 厳選してお届けします。
美団は新世代の大規模モデルLongCat-2.0を公開した。総パラメータ数は1.6兆、平均約480億を活性化し、100万トークンのコンテキストに対応する。国産アクセラレータ5万基のクラスタで訓練・推論を完結し、SWE-bench Proで59.5、Multilingualで77.3を記録した。
NVIDIAはNemotron-3-Nano-30B-A3Bを基盤とするオープンウェイトの拡散言語モデルを公開した。凍結したコンテキスト塔と学習済みデノイザー塔を組み合わせ、自己回帰モデルの98.7%の品質を保ちながら生成スループットを2.42倍に高めた。拡散、模擬AR、ARの3モードでデコードできる。
xAIはGrok Voiceを基盤とするノーコードの音声エージェント構築環境を公開した。電話、ナレッジ検索、ツール、MCP、ガードレール、観測機能を統合し、既存のSIP番号やAPIにも接続できる。料金は音声1分0.05ドル、電話1分0.01ドルで、80種類超の音声と音声クローンに対応する。
GoogleはVS Codeからクラウド上のJupyter環境へ直接接続できるWorkbench Notebooks拡張を公開した。開発者はエディタを離れずにGoogle Cloudの高性能インフラを利用し、機械学習の開発工程を進められる。拡張機能は完全にオープンソース化されている。
Z.aiはGLM-5.2向けの公式開発環境ZCodeを公開した。GLM Coding Plan加入者には1.5倍の利用枠を提供し、既存のサブスクリプションやAPIキーを使うBYOKにも対応する。macOS、Windows、Linuxで利用できる。
Claude Code v2.1.198はClaude in Chromeを全面提供し、バックグラウンドエージェントの通知と`/dataviz`スキルを追加した。worktree内で完了した作業の自動コミット、push、ドラフトPR作成にも対応し、通信切断やバックグラウンドタスク停止などの不具合を修正した。
Cloudflareは検索、AIエージェント、モデル訓練の各クローラーを区別して管理できる新しいトラフィック制御を公開した。一律遮断ではなく用途別にアクセスを許可・制限でき、広告収益を生むページを保護する選択肢も追加した。
GoogleのオープンソースフレームワークGenkitは、履歴、ツールループ、ストリーミングを単一インターフェースにまとめるAgents APIを公開した。状態の永続化、履歴の分岐、長時間タスク、マルチエージェント連携を支援し、TypeScriptとGo向けにプレビュー提供する。
CloudflareはWebページ、データセット、API、MCPツールを有料化できるMonetization Gatewayのウェイトリストを開始した。x402オープンプロトコルとステーブルコイン決済を使い、独自の決済基盤を構築せずにCloudflare配下のリソースへ課金できる。
GoogleはAgent Development Kit 2.0を構築した背景と、主要機能、更新の理由を公式ブログで解説した。開発者が新バージョンへ移行する際に検討すべき設計上の利点を、正式公開翌日に整理している。
Claude Codeがローカルのタイムゾーンや接続先ドメインを参照し、中国の利用者を識別する仕組みを備えるとの解析がコミュニティで報告された。暗号化されたドメイン一覧との照合結果をUnicode文字の置換でリクエストへ埋め込むという指摘で、透明性と信頼を巡る議論を呼んでいる。
MetaはAI計算能力とモデルアクセスを外部へ提供するMeta Computeを計画していると報じられた。AWS、Google Cloud、Azureと競合し、裸の計算資源やホスト型モデルを提供する可能性がある。Metaは今後数年間でAIインフラへ1829億ドルを投じる方針だ。
OpenAIの論文にLuna Pro、Terra Pro、Sol ProというGPT-5.6の3変種が記載された。ゲノミクス評価ではSol Proが31.5%で首位となったが、標準モデルからの改善幅は世代が進むほど縮小した。ChatGPTで同じ階層が提供されるかは明らかでない。
AWSは顧客企業へ5~6組のエンジニアを45日間派遣し、AIソフトウェアやエージェント導入を支援する新部門に10億ドルを投じる。組織は数千人規模を見込み、初期顧客にはNBAとリコーが含まれる。
Runwayはメディア大手Bertelsmannとのクリエイティブ・パートナーシップを発表した。両社は創作コンテンツ分野で協力するが、具体的なプロジェクトや提供内容は今後明らかにされる。
Googleは2026年6月に発表したAI関連の更新をまとめた。Gemini 3.5 Live Translateによるリアルタイム音声翻訳など、同社の製品と研究を横断する主要な機能追加を紹介している。
Googleなどはニューヨークで教育・産業関係者150人を集め、AI教育サミットを開催した。参加者はVibe Coding、Google AI mode、NotebookLMを体験し、問題解決、適応力、協働、批判的判断といった人間の能力、プライバシー、公平なアクセスの重要性を確認した。
Matt Pocockの`/writing-great-skills`は、Skillを予測可能な手順として設計する方法を整理した。自動・手動起動の区別、段階的な情報開示、明確な完了条件、注意力を保つための分割を重視し、早すぎる完了、重複、肥大化、無効な指示などの失敗パターンも診断する。
MetaはTectonic上の階層型BLOBストレージで、GPU利用率と研究速度を高める設計を紹介した。フラッシュを使って予測可能な低遅延を実現し、単一GPUのI/O遅延が学習全体を止める問題を軽減する。統一データレイクにより、地域をまたぐGPUへの高速なデータ供給も支える。
Tom Tunguzは、AIエージェントのコストと性能を左右するのはモデル選択よりルーティングだと論じた。技能分類、ルーター、モデル選択の3層で処理を振り分ければ、70~80%をローカルモデルや非同期推論へ移し、AIコストを90%以上削減できる可能性がある。
Dwarkesh PatelのAI論文コンテストは、AIで空気感染症を根絶する構想、AI供給網の外にある国の成長政策、AI研究所が補完資産を取得して収益化する案を受賞作に選んだ。公衆衛生、国家戦略、事業モデルという異なる角度からAIの影響を論じている。
Cloudflareは「Content Independence Day」から1年を振り返り、自律型AIエージェントによって検索と推薦が変わる中、コンテンツへ対価を還元する動的市場が形成されつつあると説明した。持続可能なWeb経済には新たな課金・取引基盤が必要だとする。