美団LongCat Owl Alpha、OpenRouterで最も利用されるモデルに
美団LongCatの1.6兆パラメータMoEモデルOwl Alphaが、OpenRouterで最も利用されるモデルとなった。累計10兆トークンを処理し、GeminiやOpus 4.6級の性能を示すという。学習には35兆トークンと5万基の中国製ASICを使用した。現行版は近日終了し、後継版が予定されている。
本日のAI業界注目ニュースを 22件 厳選してお届けします。
美団LongCatの1.6兆パラメータMoEモデルOwl Alphaが、OpenRouterで最も利用されるモデルとなった。累計10兆トークンを処理し、GeminiやOpus 4.6級の性能を示すという。学習には35兆トークンと5万基の中国製ASICを使用した。現行版は近日終了し、後継版が予定されている。
Cursorは、有料プラン向けにiOSネイティブアプリのパブリックベータを公開した。スマートフォンから常時稼働のクラウドエージェントを起動したり、PC上のエージェントを遠隔操作したりできる。音声入力、スラッシュコマンド、Live Activities、プッシュ通知に対応し、ローカルとクラウドの作業を相互に引き継げる。
EverMindは、Apache 2.0で公開するエージェント記憶ランタイムEverOSを発表した。編集可能なMarkdownを記憶の中心に置き、SQLiteで状態を管理し、LanceDBでBM25とベクトル検索を組み合わせる。完了タスクをCaseとして蓄積し、再利用可能なSkillへオフラインで抽出する仕組みも備える。
RedKnotはKV Cacheを注意ヘッド単位に分割し、局所ヘッドのスパース化、スパースFFN、SegPagedAttentionを統合する。8基のH800環境ではTTFTを最大3.54倍、単一GPUの同時実行数を最大7.8倍に改善した。DeepSeek-V4-Flashの128KコンテキストではTTFTが5.16倍高速化したという。
OpenClawはiOSとAndroid向けのネイティブモバイルアプリを公開した。スマートフォンからエージェント、チャンネル、タスク、返信を管理でき、外出先でもエージェントを操作できる。
Herdrは、単一のターミナル画面で複数のAIエージェントセッションを管理し、切り替えられるオープンソースのマルチプレクサだ。複数エージェントを並行運用する際の端末作業をまとめる。
Anthropicは、Amazon BedrockとGoogle Cloud上でClaude Codeを運用するためのセルフホスト型制御プレーンを発表した。Linux上のステートレスコンテナとPostgreSQLで構成し、OIDCによるSSO、ポリシーと権限の集中管理、障害時のルーティング、組織・ユーザー別の利用上限を提供する。
Claude Opus 4.8とClaude Haiku 4.5がMicrosoft Foundryで正式に利用可能になった。Azure環境のNVIDIA GB300 GPU上でホストされ、Messages API、プロンプトキャッシュ、拡張思考に対応する。Azureの既存認証、請求、ガバナンスをそのまま利用できる。
Claude Code v2.1.196は、組織の既定モデル表示、添付ファイルのクリック移動、未承認MCPサーバーの安全な保留表示を追加した。コードレビューのトークン使用量を約25%削減し、5分間イベントがないストリームを自動中止・再試行する監視機能も既定で有効化した。
中国国務院は教育発展の第15次五カ年計画を公表し、全教育段階でAI教育を進める方針を示した。AIリテラシー、課題設定・解決力、科学的素養、批判的思考、イノベーション能力を強化し、学際的な人材育成と質の高い学部教育の拡大を目指す。
SemiAnalysisによると、GTC 2026で発表された4ダイ構成のRubin Ultraは、製造上の課題から中止された。新たにRubin Ultraと呼ばれる設計はサイズが半分となり、実効性能も当初計画の約半分になるという。
米軍はイラン攻撃でPalantirのMaven Smart Systemに組み込んだClaudeを大規模に使用し、初日に約1000の標的候補を提示させた。しかし学校への攻撃で多数の子どもが死亡した。学校への転用を示す過去の情報が旧式の公式標的データベースに連携されず、指揮系統へ届かなかったことが問題視されている。
SamsungとSK hynixは韓国政府の支援を受け、工場、パッケージ拠点、次世代半導体研究へ総額5900億ドルを投じる計画だ。AIデータセンター需要でメモリ価格の上昇が続くなか、両社は世界のHBM市場の約8割を握る。新規供給の本格化には時間がかかるとみられる。
SKグループは、2035年までに韓国内で15GWのAIデータセンター容量を整備し、総額1000兆ウォンを投資する計画を発表した。国家規模のAI基盤として、今後10年間に年平均100兆ウォン超を国内投資し、SK hynixも韓国南西部で大規模な半導体投資を進める。
Metaは、脳信号から文章をリアルタイムに復号するBrain2Qwerty v2を発表した。生の非侵襲脳信号から文字だけでなく単語や意味まで推定するエンドツーエンド構成に進化し、脳損傷や疾患で意思疎通が難しい人を支援する可能性を示した。
MozillaのGenAI脆弱性報奨金プラットフォーム0DINで、新たな攻撃手法が報告された。セットアップスクリプトがDNSレコードから命令を取得するため、悪性コードはリポジトリ内に現れない。AIコーディングツールがスクリプトを自動実行すると、認証情報の窃取や継続的な侵入につながる恐れがある。
OpenAIは、AIがEU域内の雇用に与える影響を分析した新たな報告書を公開した。職種ごとに自動化、成長、業務フロー変化の可能性を整理し、欧州のAI労働市場における機会と移行課題を示している。
DiScoFormerは、再学習なしでデータ点から確率密度とスコアを推定するモデルだ。クロスアテンションを使って一度の前向き計算で両方を出力し、整合性損失で分布外にも適応する。100次元の評価では、最適化したKDEよりスコア誤差を約6.5分の1、密度誤差を37分の1以下に抑えたという。
AnthropicのMargot Van Laar氏は、実務では新規プロンプト作成より既存プロンプトのデバッグと保守が中心だと説明した。XMLによる構造化、旧モデル向け禁止事項の整理、計算ツールの利用、生成・評価・修正の分割を例示し、評価なしの改善は偶然に頼ることになると強調した。
Qwen 3.6 27Bは256Kコンテキストにネイティブ対応する密なローカルLLMだ。MacBook Max M5上のllama.cpp Q8_0量子化で毎秒30トークン、RTX 5090上のQ6_Kで毎秒50トークンとの報告があり、創作やアプリ生成など幅広いローカル作業での実用性が評価されている。
AIHOT開発者は、類推ではなく基本事実から再構成させる「第一原理」と、悪意ある利用者の視点でコードを検証させる「対抗的レビュー」を紹介した。前者はデータ取得経路の構造的問題、後者はOOMループや未来時刻によるデータ汚染などの発見に役立ち、生成と検証の閉ループを形成するという。
Anthropicの計算資源支出はエンジニア1人あたり年間51.5万ドルで、総報酬22.4万ドルの2.3倍に達するとの分析が示された。上位1%のソフトウェア企業では8.9万ドル、中央値は1.37万ドルで、AI開発企業のコスト構造が従来型企業と大きく異なることを示している。