Ornith-1.0、Agentic Coding向けオープンモデル群を公開
Ornith-1.0は、9B/31B Dense、35B MoE、397B MoEを含むエージェント型コーディング特化モデル群だ。SWE-Bench VerifiedやTerminal-Benchなどで高い成績を示し、タスクの足場作りと最終解決を強化学習で同時に最適化する。全シリーズはMITライセンスで公開され、GGUF版も用意される。
本日のAI業界注目ニュースを 25件 厳選してお届けします。
Ornith-1.0は、9B/31B Dense、35B MoE、397B MoEを含むエージェント型コーディング特化モデル群だ。SWE-Bench VerifiedやTerminal-Benchなどで高い成績を示し、タスクの足場作りと最終解決を強化学習で同時に最適化する。全シリーズはMITライセンスで公開され、GGUF版も用意される。
OpenRouterは、モデル一覧、ベンチマーク、価格、ドキュメントを開発環境から直接参照できるMCPサーバーを公開した。Claude Code、Codex CLI、Cursorなどに導入でき、モデル選定、価格比較、テスト推論をタブ移動なしで実行できる。
Midjourneyは、`--preview`でV8.2の美学とパーソナライズを先行体験できるようにした。さらにV8.1の大規模ドラフトモードで`--sref random`を使えるようにし、24枚の低解像度案を低コストで生成しながらスタイル空間を高速に探索できる。
OpenAIは、CodexをChatGPTモバイルアプリでGAにした。通知、目標、サイドチャット、ファイルプレビュー、インラインレビューコメントを追加し、スマートフォンから作業開始、結果確認、実行方針の指示、次ステップ承認ができる。
Runwayは、マーケティング担当者が広告、動画、キャンペーンを作成、テスト、最適化するためのAgent 2.0を公開した。Meta、YouTube、TikTok、Google広告のデータ分析、次回テスト用クリエイティブ生成、複数比率への自動展開、製品ポジショニング検討などを会話で進められる。
Midjourney V8.1のドラフトモードに、`--sref random`によるランダムスタイル生成が追加された。プロンプトに指定するだけで24種類のスタイル案を一括生成でき、提示欄のアイコンまたは`--draft`でドラフトモードを有効化できる。
Claude Code v2.1.193は、すべてのBash/PowerShellコマンドをAuto Mode分類器に通す`autoMode.classifyAllShell`を追加した。拒否理由の表示、OpenTelemetryイベント、Bashモードのファイル補完、MCP認証プロンプト、アイドル状態のバックグラウンドshell回収なども改善している。
Google FinanceはAndroid正式版アプリとグローバルな投資ポートフォリオ追跡機能を公開した。スクリーンショット、CSV/PDF、自然言語からポートフォリオを作成し、AI研究ツールや自動市場ブリーフ、株価変動の説明などを利用できる。
Interactive BrokersはGrokと連携し、既存口座を接続するだけで自然言語によるポートフォリオ分析、リスクシナリオ作成、市場調査、ヘッジ注文などのリアルタイム取引指示生成を可能にした。投資判断から実行までを一つの対話フローにまとめる狙いだ。
The Informationによると、米政府は安全上の懸念からOpenAIにGPT-5.6の広範公開を延期し、管理されたプレビューに切り替えるよう求めた。自動化された高度なサイバー作業能力が焦点で、早期アクセスは政府が顧客ごとに承認する形式になる。
Anthropicは、AlibabaがClaude AIモデルの能力を無断で抽出したと主張した。調査では、リバースエンジニアリングなどによりClaudeの中核的な能力が複製された可能性があるとしており、Alibaba側の公開回答はまだ確認されていない。
Metaは2025年に人間の審査リクエストの約半分を大規模言語モデルへ置き換え、一部領域では年末までに90%以上のAI審査を目指す。会社は精度改善を強調する一方、社員は無害な投稿の削除や制限、監督不足、外注審査員の削減を懸念している。
General Intuitionは評価額23億ドルで3.2億ドルを調達した。ゲームクリップ基盤Medalから得た数億時間の操作データを使い、Fortniteなどの仮想環境と四足ロボットを同一モデルで扱う。API公開と次世代モデルの事前学習に資金を充てる。
Sunoは、未契約の独立歌手、作曲家、プロデューサーを対象にしたSparkプログラムを開始した。選出者には制作資金と追加マーケティング費、著名アーティストとのソングライティング機会、新機能へのフィードバック参加が提供される。作品の創作管理権と商業権はアーティスト側に残る。
研究者は高解像度X線CTと機械学習を使い、物理的に開かずにPHerc.1667を連続的に読み取った。ストア派哲学の文献とみられ、別の巻物では高解像度撮像によって3Dデータ内のインクが直接確認された。データとコードも公開されている。
IBMは0.7nmノードと3Dナノスタック構造を使うサブナノメートル級チップ技術を発表した。爪ほどの面積に約1000億トランジスタを集積し、2nm世代比で性能最大50%、エネルギー効率最大70%の改善をうたう。
OpenAIの社内観測では、2025年8月から2026年6月にかけて、CodexがChatGPTに代わる主要業務ツールになった。各部門の出力トークンに占めるCodex比率は10%未満から99.8%へ上昇し、法務、財務、採用など非開発部門でも利用が急拡大した。
Google ResearchとGoogle Cloudは、キャッシュ管理を線形コスト最適化として扱う線形弾性キャッシュを提案した。データごとにメモリを借り続けるか、キャッシュミスを許容するかを判断し、軽量な機械学習でメモリ使用量とミス率のバランスを動的に調整する。
Exponential Viewの報告によると、重複を除いた消費側AI支出は過去12か月で1100億ドル、年率換算で1750億ドルを超える。新規収益の形成速度は急加速しており、トークン価格低下は利用量を強く押し上げる一方、電力とデータセンターコストが拡大制約になる。
Washington Postの調査では、主要AIチャットボットの多くが政治的質問で左派寄りの回答を示した。GPT-5.5やDeepSeek V4 Pro、Grok 4.3、GabのAryaでも偏りが確認され、Gemini 3.1 Proは左右双方の論点提示が多い例外とされた。
AllenAIは、7B規模のOLMo 3 TransformerとOLMo Hybridを比較した。Hybridは名詞、動詞、形容詞などの実義語や文脈推論が必要な代名詞で低い予測損失を示す一方、反復n-gramや閉じ括弧など入力からの正確な検索が必要な箇所ではTransformerの優位が残る。
MetaはPrivacy-Aware Infrastructureの資産分類で、コード、系譜、意味ラベルを含む文脈証拠を構築し、曖昧なケースにLLMを使う混合方式を採用した。LLMを本番判断に直接使わず、安定した挙動をバージョン管理された決定的ルールへ蒸留する点を重視している。
GitHubは、Copilotのagentic harnessを複数モデルとタスクで評価した。複数の基準で強い性能を示しつつ、トークン効率にも優れ、20以上のモデルを柔軟に選べる点を強調している。
Sail Researchは、同期チャットから数時間続く非同期・多段エージェントへ移るAIワークロードに合わせ、クラスタ認識型の推論オーケストレーションを構築している。目的は、1ドルあたりの推論スループットを最大化することだ。
Gary MarcusはGenerative AI Fizzleという表現で、生成AI業界の過大評価と利益化の難しさを指摘した。LLMはコモディティ化し、価格競争が激化しており、新たな中国オープンモデルの登場も米国LLM企業への圧力になると見る。