AI Daily Digest — 2026年7月1日

本日のAI業界注目ニュースを 26件 厳選してお届けします。

TOP 3

モデル

Claude Sonnet 5を発表

Anthropicは最新のSonnetモデルClaude Sonnet 5を発表した。計画、ブラウザ、ターミナルを使って自律的に動作し、Opus 4.8に近い性能をより低価格で提供する。Sonnet 4.6から推論、ツール利用、コーディング、知識作業を大幅に改善し、幻覚や迎合も減らしたという。

Google DeepMind、Nano Banana 2 LiteとGemini Omni Flashを発表

Google DeepMindは、シリーズ最速・最安の画像モデルNano Banana 2 Liteと、動画生成・対話編集に対応するGemini Omni Flashを公開した。前者は1K画像を4秒、0.034ドルで生成し、後者は動画を1秒0.10ドルでAPI提供する。

美団LongCat、旗艦モデルLongCat-2.0を発表

美団LongCatは1.6兆パラメータのMoEモデルLongCat-2.0を発表した。約480億パラメータを動的に使用し、100万トークンのコンテキストに対応する。LSA疎注意、Zero-Compute Experts、用途別の専門家ルーティングを組み合わせ、エージェント型コーディングに最適化した。

プロダクト

X、AIエージェント向けhosted X MCPを公開

XはAIエージェントがMCP経由でX APIのリアルタイム情報を取得できるhosted X MCPを公開した。GrokやCursorなどから利用でき、個人向け優待価格は1回0.01ドル。X APIアプリの作成、課金、構成IDの取得、認可で利用を開始できる。

shot-scraper videoでAIエージェントが操作デモを録画

shot-scraper 1.10は、storyboard.ymlで操作を定義し、Playwrightでブラウザ動画を録画するvideoコマンドを追加した。Playwright 1.61のscreencast機構により、冒頭の白画面や固定幅など従来の問題も解消した。詳細なヘルプによりコーディングエージェントから直接利用できる。

Acti、AIエージェントをスマートフォンのキーボードに統合

シンガポールのActiは、Google Geminiを使ってアプリ内操作を代行するエージェント型キーボードを公開した。自然言語で作るSkillsにより、キーの長押しで翻訳や会議リンク送信などを実行できる。ローカル優先設計で、初期設定では私的メッセージにアクセスしない。

AI News Radar、自媒体購読とマルチプラットフォーム対応を追加

AI News Radarは、自媒体セクションと複数SNSアカウントの購読機能を追加した。毎日の注目情報を熱度順または時系列で表示し、公式情報やGitHub更新も情報源・種類・信頼度で分類する。完全オープンソースで、APIなしでも独立したAI日報サイトを構築できる。

NotebookLMのShort Video Overviews、英語Web版で全面提供

NotebookLMは、複雑な資料を60秒の縦型動画に変換するShort Video Overviewsを英語Webユーザーへ全面展開した。これまでGoogle AI UltraとProの利用者向けだった機能で、無料ユーザーにも順次提供される。

ADK Go 2.0、グラフ型マルチエージェント・ワークフローを導入

GoogleはAgent Development Kit for Go 2.0を公開した。複雑なマルチエージェント構成を組み立てるグラフ型ワークフローエンジン、人間参加型の制御、純Goによる動的実行、指数バックオフ再試行を追加。単一エージェントと複雑なグラフを同じ実行基盤に統合した。

Claude Desktop、Linux版パブリックベータを開始

Claude DesktopのLinux版がUbuntuとDebian向けにベータ公開された。有料プランではブラウザとターミナルに加え、Claude Code、Claude Cowork、チャットをデスクトップ環境から利用できる。

Anthropic、研究ワークベンチClaude Scienceを公開

Anthropicは文献分析から多段階研究までを支援するClaude Scienceをベータ公開した。ゲノム、単一細胞、プロテオミクスなど60以上の技能とコネクタを備え、ローカルやSSH/HPCで実行可能。コードと環境を含む監査可能な成果を生成し、reviewer agentが引用や計算を検査する。

業界

Tesla Cybercab量産版、オースティン公道で試験開始

Teslaは、ハンドルとペダルを持たない量産版Cybercabの公道エンジニアリング試験をオースティンで開始した。安全監督員を同乗させ、34台でハードウェアの信頼性を検証する。現時点では一般乗客を乗せない。

Meta、未成年者を装い競合AIへ危機関連プロンプトを大量送信

Metaは委託先を通じ、未成年者を装ってChatGPT、Gemini、Character.AIへ自殺や自傷などの敏感な質問を送る安全性試験を実施した。2025年8月の一回だけで4万5000件超に上り、対象企業には事前通知がなかった。Metaは業界標準の試験で、学習には使っていないと説明した。

Blackstone、日本のAIデータセンターへ300億ドル投資を計画

Blackstoneは今後3~5年で日本のAIデータセンターに300億ドルを投じ、1GW超の容量を追加する計画だ。Apollo、Broadcomと設立したAI XPVプラットフォームでは、2028年までにOpenAIやAnthropicなどへ20GW超の計算能力を提供することも目指す。

リサーチ

prover-verifier型LLMループで9件の未解決数学問題を解決

コロンビア大学の協力者らが、証明生成役と検証役を反復させるLLMループにより、理論計算機科学の主要な未解決問題9件を解いたと報告した。研究者が2年間取り組んだ問題も含まれ、この手法を他の科学分野へ広げる計画だという。

OpenAI、計算生物学ベンチマークGeneBench-Proを公開

OpenAIは、曖昧な研究課題への判断と分析力を測るGeneBench-Proを公開した。統計遺伝学や集団遺伝学など10領域21分野の129問で構成し、現実的で乱雑なデータを探索して分析方針を選ぶ能力を評価する。82問は外部専門家が現実性を確認した。

Anthropic、Turn-Averaged SAEを提案

Anthropicは会話ターン内の全トークンの残差ストリームを平均して学習する疎オートエンコーダーを提案した。トークン単位SAEより識別性能は低い一方、モデル行動の高水準な特徴を捉え、ターン全体の説明範囲で上回った。学習時の150倍の長さにも外挿できたという。

技術

1人で5製品を運用するEveryの「複利エンジニアリング」

EveryはPlan、Work、Review、Compoundの循環で、1人のエンジニアが5製品を保守する方法を公開した。解決策をCLAUDE.mdやdocs/solutionsへ蓄積し、AIが次回から再利用できるようにする。担当者は時間の80%を計画とレビュー、20%を実装に使うという。

Claude Code入門、4種類のエージェントループを解説

Claude Codeチームは、停止条件まで反復するエージェントループを、対話型、目標型、時間型、プロアクティブ型の4種類に整理した。`/goal`、`/loop`、`/schedule`の使い分けに加え、SKILL.mdへ人間の検証手順を組み込んで端から端まで自己検証する方法も紹介する。

AI投資企業では雇用が増加、AI雇用論争に新データ

RampとRevelio Labsが約2万2000社を分析したところ、AI支出の多い企業では総雇用が10.2%、初級職が12%増えた。AIが生産コストを下げ、資金力のある技術企業の拡大を促している可能性がある一方、継続投資のない企業では同様の増加が見られなかった。

ロボット教師となる具身知能データ収集員

中国では日給200~250元で、遠隔操作ロボットや装着型機器を使って物体整理、紙コップ積み、衣類たたみなどを繰り返すデータ収集員の募集が増えている。高品質な物理相互作用データは2026年初頭でも約50万時間にとどまり、大規模な人手収集が必要とされる。

OpenAI Signals、ChatGPTの世界的な普及傾向を公開

OpenAI Signalsによると、利用開始6か月後には1日当たりメッセージ数が50%増え、試すタスクの種類は倍増する。アフリカとアジア、低HDI国で成長が速く、非英語ユーザーは過半数となった。女性名の利用者も世界全体で多数を占める。

Grant Sanderson、AIと数学の未来を語る

3Blue1BrownのGrant Sandersonは、AIのIMO金メダルはAGIではなく一つの基準達成にすぎないと指摘した。千年紀問題をAIが解いても自動化できない人間の仕事は残り得るとして、証明の理解可能性、文献間の隠れた接続、現実の経済課題に強化学習を適用する難しさを論じた。

英国の職場AI利用率が倍増、15%の先行層に利益が集中

Google UKとPublic Firstによると、英国の職場AI利用率は1年で34%から73%へ上昇した。一方、深く使いこなす15%の先行層は昇進、評価、昇給で大きく優位となり、週約8時間を節約する。単発のプロンプト利用や明確な利用許可の欠如が普及の障害だという。

専門化が避けられない理由を最適化・生物・市場から説明

Dharma AIは、無償昼食定理、有限資源下の最適化、生物学的な特化のトレードオフ、市場競争から専門化の必然性を論じた。資源を限定された課題へ集中する仕組みは、広く平均配分する汎用システムを上回り、適応度の最大化には特定環境への精密な適合が必要だとする。