AI Daily Digest — 2026年6月29日

本日のAI業界注目ニュースを 7件 厳選してお届けします。

TOP 3

モデル

Grok 4.5、SpaceXとTeslaでクローズドテスト

Elon Musk氏は、1.5兆パラメータのV9基盤モデルとCursorのデータを用いたGrok 4.5を、SpaceXとTeslaでクローズドテスト中だと明らかにした。初期評価ではClaude Opusに近いか、上回る性能を示しているという。SpaceXは今年、ゼロから学習した新モデルを毎月公開する計画だ。

Sina、3BパラメータのVibeThinker-3Bを公開

Sinaは、Qwen2.5-Coder-3Bを基盤に多段階の後学習を行ったVibeThinker-3Bをオープンソースで公開した。AIME26やLiveCodeBenchで大型モデルに匹敵する一方、知識集約型のGPQA-Diamondでは大きく劣る。開発チームは、論理推論は少数のパターンに圧縮できるが、広範な事実知識には大きなパラメータ数が必要とする仮説を示した。

プロダクト

Wayfinder Router、LLMクエリをローカルとホスト間で高速振り分け

Wayfinder Routerは、プロンプトの長さ、見出し、リスト、コードなどの構造特徴から、ローカルとホスト型LLMのどちらに送るかをマイクロ秒単位で決定する。別のモデル呼び出しを必要とせず、オフラインで動作する。OpenAI互換APIに対応し、セルフホストも可能だ。

Adrafinil、AIエージェント稼働中だけMacのスリープを防止

Adrafinilは、Claude Code、Codex、Cursorなど対応す9種類のAIコーディングエージェントにアクティブなセッションがある間だけ、Macのスリープを防ぐメニューバーアプリだ。エージェントが停止すると通常のスリープ動作に戻り、温度やアイドル状態に応じた強制解除機能も備える。

リサーチ

500日間の起業運営テスト、元本を上回ったAIモデルは3種のみ

プリンストン大学のCEO-Benchは、AIエージェントにサブスクリプション型ソフトウェア企業を500日間運営させた。14モデルのうち、最良試行で初期資本100万ドルを上回ったのはClaude Fable 5、Claude Opus 4.8、GPT-5.5の3種だった。固定ルールの単純なヒューリスティックは、その他すべてのモデルを上回った。

技術

4大AIが『シヴィライゼーションVI』で対戦、感知と実行の弱点が鮮明に

Liam Wilkinson氏は76のMCPツールを構築し、Claude Opus 4.6、GPT-5.4、Gemini 3.1 Proなど4モデルに『シヴィライゼーションVI』をプレイさせた。モデルが自発的に全体状態を確認した割合は1〜2%、計画後10ターン以内の実行率は48〜66%にとどまり、知能よりも感知と実行がボトルネックになると結論づけた。

Artifacts 22、オープンモデル生態系の広がりを分析

InterconnectsのArtifacts 22は、オープンモデルの開発主体が、中国の一部企業から、Zyphra、Cohere、Poolsideなど世界の多様な組織へ広がっていると指摘した。モデル専業企業、テック大手、特定用途の小型モデルを作る製品企業それぞれの動機と、NVIDIAやCohereの最新公開モデルを整理している。