AI Daily Digest — 2026年5月29日

本日のAI業界注目ニュースを 30件 厳選してお届けします。

TOP 3

モデル

Claude Opus 4.8、コーディング・エージェント能力・推論を全面強化

Anthropicは新世代モデルClaude Opus 4.8を公開した。Opus 4.7からのアップグレードとして、コーディング、エージェントスキル、推論、実用的な知識作業などのベンチマークで改善を示している。価格は前世代と同じで、タスクに投入する労力をユーザーが制御できる機能、Claude Codeの「動的ワークフロー」、Opus 4.8の2.5倍速モードの値下げも同時に導入された。早期テスターは、エージェントタスクでの判断がより信頼でき、ツール呼び出しも効率的だと評価している。Online-Mind2Webでは84%を記録し、Opus 4.7とGPT-5.5を上回ったほか、誠実性とアラインメントも改善し、コードエラーの見落とし率は約75%低下した。

xAI、エージェント型コーディングモデルGrok Build 0.1をAPIで公開テスト

xAIは最新のコーディングモデルGrok Build 0.1を、xAI API経由で公開テストに投入した。このモデルはエージェント型コーディングタスク向けに訓練され、Web開発、デバッグ、MCPに対応する。Grok Build CLIを支えるモデルと同じもので、推論速度は毎秒100トークンを超える。価格は入力100万トークンあたり1ドル、出力100万トークンあたり2ドル。コーディング以外にも、汎用エージェントやツール呼び出しの場面で使えるとされ、OpenRouterとVercel AI Gatewayからも利用できる。

Nano Banana ProとNano Banana 2が正式公開

Google AI for Developersは、Nano Banana ProとNano Banana 2を正式に公開した。Nano Banana Proはgemini-3-pro-image、Nano Banana 2はgemini-3.1-flash-imageとして提供され、Gemini APIから本番利用できる。発表では、両モデルの実力を示すコミュニティ事例も紹介されており、画像生成モデルの実用段階への展開が進んでいることを示している。

商湯、情報グラフィック生成モデルを更新し中核能力を強化

商湯科技は、情報グラフィック生成モデルSenseNova-U1-8B-MoT-Infographicのアップグレードを紹介した。8Bパラメータのモデルで、テキストの正確性と可読性、レイアウトの一貫性と合理性、背景の安定性、グラフや図解の品質が改善されている。さらに学術コンテンツのレンダリングにも対応した。投稿ではHugging Face上のモデルページと能力展示ページが案内され、実務的な図解生成への適用範囲を広げる更新となっている。

プロダクト

Claude Codeに動的ワークフロー、数十から数百のサブエージェントを並列実行

Claude Codeは「動的ワークフロー」機能を導入した。Claudeが動的にスクリプトを書き、単一セッション内で数十から数百のサブエージェントを並列実行し、結果提示前に検証まで行うことで、複雑なタスクを端から端まで処理できるようにする。大規模コードベースでのバグ探索や、BunをZigからRustへ移植するような大規模移行など、多角的な分析が必要な作業を想定している。研究プレビューとして、Claude Code CLI、デスクトップ版、VS Code拡張、API、Amazon Bedrock、Vertex AIなどで利用でき、Max、Team、有効化済みEnterpriseプランのユーザーが対象となる。

Perplexity Computer、Microsoft Officeスイートに統合

Perplexityは、Perplexity ComputerがMicrosoft Excel、Word、PowerPoint、Outlookに対応したと発表した。各アプリのサイドバーからComputerを直接使い、作業の調整、文書の下書き、モデリング、プレゼンテーション作成、メール処理を行える。Office業務の中に対話型エージェントを組み込み、日常的なナレッジワークをアプリ内で完結させやすくする取り組みとなる。

Mistral AI、Search Toolkitの公開プレビューを開始

Mistral AIはSearch Toolkitの公開プレビューを発表した。これは、AIアプリケーション向けに本番品質の検索パイプラインを構築するための組み合わせ可能なフレームワークである。データ取り込み、検索、評価ツールが分散し、検索基盤づくりに多くの工数がかかる問題に対応するため、三つの要素を単一のフレームワークと共通インターフェースへ統合した。オープンソースで提供され、クラウド、オンプレミス、エッジに展開でき、企業検索やRAGなど幅広い検索シナリオを想定している。

Replit Canvas、エージェント向けデザインツールとして登場

Replitは新しいReplit Canvasを発表した。チャットボックスだけでは最高のデザイン作業は生まれないという考えのもと、アイデアの探索、バリエーション作成、反復のための空間を提供する。Webサイト、アプリ、マーケティング素材などを構築するためのエージェント向けデザインツールとして設計されている。

Google Pay & Wallet Developer MCP server、統合開発ワークフローを高速化

GoogleはGoogle Pay & Wallet Developer MCP serverを発表した。AI開発アシスタントやIDEを、リアルタイムのAPIとアカウントコンテキストへ安全に接続するオープン標準のツールである。開発者は開発環境を離れずに、公式ドキュメント検索、Wallet pass定義の検証、統合状態の確認、加盟店アカウント管理を行える。コンテキスト切り替えを減らし、信頼できるリアルタイムのAI支援を提供することで、統合作業の摩擦を下げる狙いがある。

Oculus創業者による対話AIスタートアップSesame、iOSアプリを公開

TechCrunchによると、Oculus創業者らが立ち上げた対話型AIスタートアップSesameは、一般ユーザー向けにiOSアプリを公開した。アプリは会話型AIエージェントを提供し、従来のチャットボットとは異なる、より自然な往復のやり取りを目指している。人と話しているように感じられる体験を重視したプロダクトとして紹介されている。

MuleRun、阿里雲マーケットプレイスで24時間稼働のAI労働力を提供

Alibaba Cloudは、阿里雲マーケットプレイスでMuleRunを提供すると発表した。MuleRunは研究、レポート、コード、デザインなどを支援する24時間稼働のAI労働力として位置づけられる。個人利用に十分な機能を備えつつ、チーム向けにはSSO、RBAC、プライベートネットワーク、チーム知識管理、シームレスな統合にも対応する。料金は月20ドルからと案内されている。

業界

Anthropic、650億ドルのシリーズHを完了し評価額は9,650億ドルに

Anthropicは、Altimeter Capitalなどが主導する650億ドルのシリーズH資金調達を完了し、投資後評価額が9,650億ドルに達したと発表した。同社は、旗艦モデルClaudeの企業導入が伸び続け、年換算収益が470億ドルを突破したとしている。調達資金はAI安全性と解釈可能性研究の推進、Claude需要に対応する計算資源の拡張、製品とパートナーシップのスケールに使われる。Anthropicは最近、計算容量を大きく拡大し、ClaudeがAWS、Google Cloud、Microsoft Azureの三大クラウドに対応したことも発表している。

DeepSeek、資金調達完了後ただちに科創板IPO申請を計画との情報

X.PIN氏は、DeepSeekが現在進めている約500億ドル、人民元で約3,500億元規模の資金調達ラウンドを終えた後、ただちに科創板でA株IPOを申請する計画だと投稿した。情報源はこの資金調達に参加する大型ファンドマネージャーとされている。未確認情報ではあるが、中国AI企業の資本市場入りをめぐる注目度の高さを示す話題となっている。

Altman氏とAmodei氏、AI雇用危機の予測を相次ぎ修正

Fortuneは、OpenAIのSam Altman氏とAnthropicのDario Amodei氏が、AIが雇用危機を引き起こすという以前の予測を相次いで修正していると報じた。AIによるホワイトカラー雇用への影響について、当初想定されたほど急激な破壊にはなっていないという見方が広がりつつある。AI導入の現実は、単純な代替だけでなく、生産性向上、職務再設計、導入ペースの制約を含む複雑なものとして捉えられている。

Mistral AI、AI Now Summit 2026で産業AIと新データセンター計画を発表

Mistral AIはAI Now Summit 2026で複数の進展を発表した。産業AIソリューション「Mistral for Industrial Engineering」は、物理モデルと工学知識を統合し、Airbus、BMW Group、ASMLと協力して設計と最適化を加速している。AIエージェント製品Vibeもアップグレードされ、推論とエージェントタスク能力が強化された。さらに同社は、2026年第3四半期にLes Ulisで10MW規模の新データセンターを稼働させ、推論運用に特化して計算資源の安全性を高める計画を示した。

Qwen3.7-Max、OpenRouterの人気大規模モデルランキングで首位に

Alibaba Cloudは、Qwen3.7-MaxがOpenRouterの人気大規模言語モデルランキングで首位に立ったと発表した。使用量は773億トークンに達したとされる。投稿は短いが、Qwenモデルの利用拡大と、OpenRouterのようなモデル集約プラットフォームにおける存在感の高まりを示している。

OpenRouter、1.13億ドルのシリーズBを調達

AIモデル集約プラットフォームのOpenRouterは、1.13億ドルのシリーズB資金調達を完了した。本ラウンドはCapitalGが主導し、NVentures、ServiceNow Venturesなど複数の投資家が参加した。既存投資家のAndreessen HorowitzとMenlo Venturesも引き続き参加している。モデル利用のハブとしてのOpenRouterへの資金流入を示す動きとなる。

Apple、新Siri向けに巨大GeminiモデルをiPhoneへ組み込む取り組みとの報道

Ars Technicaは、Appleが新しいSiri機能を支えるため、大規模なGeminiモデルをiPhoneへ統合しようとしていると報じた。モデル規模が非常に大きいため、完全なローカル処理は難しく、クラウド側の構成要素が必要になる可能性が高いとされる。Apple IntelligenceとSiri刷新をめぐり、オンデバイス処理とクラウド推論の境界が重要な設計課題になっている。

OpenAI、前沿ガバナンスフレームワークを公開

OpenAIは「前沿ガバナンスフレームワーク」を公開した。これは同社のAI安全、安全保障、リスク管理の実践を、EUやカリフォルニア州の新たな規制要件とどのように整合させるかを示すものだ。前沿モデルの開発と展開プロセスを規律づける枠組みとして位置づけられ、急速に進む高性能モデル開発に対するガバナンスの透明性を高める狙いがある。

リサーチ

hexoai、AIエージェントの再帰的自己改善を実現するSIAフレームワークを公開

hexoaiはSIA、すなわち自己改善AIフレームワークをオープンソース公開した。このフレームワークは、AIエージェントが外部ワークフローだけでなく、タスクからのフィードバックを通じて自身のモデル重みも直接更新できることを示す。人間が与えるプロンプトやツール改善に頼るだけでなく、領域知識と能力を自律的に向上させる試みである。論文では、SIAがLawBenchで56.6%の性能向上を示し、GPU kernel実行では所要時間を91.9%削減し、単一細胞RNAノイズ除去ではベースライン比502%の改善を達成したと報告されている。

SGLangとAMD、MI355XでDeepSeek-R1分離推論のTCO競争力を実証

SGLangチームとAMDは、全スタック最適化により、AMD Instinct MI355X GPUでDeepSeek-R1の大規模分離推論を実行する際に競争力ある総所有コストを実現したと発表した。129 tok/s/userの対話遅延では、100万トークンあたり0.169ドルとなり、NVIDIA B200のDynamo TRT-LLM構成より5%、B200のSGLang構成より40%低い。スループットでは、24枚のAMD GPUが2,436 tok/s/GPUを達成し、48枚GPUのB200 SGLang構成よりGPUあたり1.25倍高い。MoRIの混合FP4/FP8量子化通信など、通信、メモリ、実行効率にまたがる最適化が中核となっている。

技術

華為・何庭波氏、秋の新Kirinチップは性能などで飛躍的向上と説明

人民日報のインタビューで、華為の何庭波氏は半導体の新たな進化経路として「韬、すなわちτの法則」を提唱した。これは幾何学的な微細化ではなく、論理折り畳みのような「時間の縮小」を新たな指針にする考え方である。華為は過去6年でこの考えに基づき381種類のチップを自主開発してきたという。今年秋に発表予定の新しいKirinスマートフォンチップは、初の完全な「韬チップ」であり、性能や集積度が昨年比で飛躍的に向上すると述べている。

NVIDIA、AIフレームワークPolarを公開しCodex評価を594.74%向上

NVIDIAの研究チームは、エージェント強化学習フレームワークPolarをオープンソース公開した。PolarはCodex CLI、Claude Code、Qwen Code、Piなど既存のエージェント実行フレームワークを書き換えず、モデルAPIの境界にエージェントを置くことでGRPO訓練へ接続する。実験では、Qwen3.5-4Bを用いたCodexのSWE-Bench Verified pass@1が3.8%から26.4%へ上昇し、594.74%の改善を示した。効率面ではprefix_mergingにより訓練ステップが1,185回から218回へ減り、速度は約5.39倍、GPU平均利用率は20.4%から87.7%へ上がった。

pgvectorで意味・ハイブリッド・スパース・量子化ベクトル検索を構築するガイド

MarkTechPostのチュートリアルは、Google Colab上でpgvector実験環境を構築し、PostgreSQLを現代的なAIアプリケーション向けベクトルデータベースとして使う方法を解説している。PostgreSQLのインストール、pgvector拡張のコンパイル、Psycopgによる接続、Pythonとの滑らかな統合のためのベクトル型登録を扱う。最後にSentenceTransformersで埋め込みを作成し、保存する流れを示している。

OpenRouter、対応モデルでFlexとPriorityのサービス階層を選択可能に

OpenRouterは、対応モデルでFlexとPriorityのサービス階層を使えるようになったと案内した。OpenAIやGoogle Vertexなどのモデルが対象で、ユーザーは用途に応じて価格や優先度の異なる階層を選べる。モデルごとの価格情報は各モデルページで確認できるとしており、モデル集約サービス上での運用コストと応答品質を調整しやすくする機能である。

Replit、AI生成アプリを安全にする4ステップを提示

Replitは、vibe codingで作ったアプリを安全に公開するための4ステップを紹介した。速度は安全性が伴わなければリスクになるという前提のもと、Replitでアプリを公開する際にバックドアを残さない方法を案内している。AIによる高速なアプリ生成が広がるなか、デプロイ前のセキュリティ確認を実務フローへ組み込む重要性を示す内容である。

コミュニティ、TunixとTPUでGemmaに思考能力を訓練

Googleは、Kaggleで開催されたTunixハッカソンについて紹介した。参加者はTPUと限られた計算資源を使い、小型の基盤モデルを汎用推論エンジンへ変える課題に取り組んだ。優勝チームは、教師あり微調整とGRPO、SimPOなどの高度なアラインメント技術を組み合わせた多段階の後訓練プロセスで目標を達成した。結果は、コミュニティがオープンソース資源を活用して高能力な構造化推論モデルを訓練できることを示している。

AIエージェント時代のセキュリティ変革をTomer Tunguz氏が整理

LemonadeのCISOであるJonathan Jaffe氏は、AIエージェント時代の新しいセキュリティ課題を論じた。AIは攻撃者と防御者の双方に強力だが、AIがコード生成、レビュー、修正を高速化するため、悪用可能な脆弱性の窓は短くなっているという。そのためセキュリティチームはエンジニアリングチームへ変わりつつあり、Lemonadeのセキュリティ部門は全員がエンジニアで構成されている。また、単一端末上で200から1万体のエージェントが動く可能性があるため、各エージェントにIDを付与し、操作地点でより複雑なポリシー制御を行う必要があると指摘している。

Cloudflare、統合データ基盤と社内AIエージェントSkipperの構築を紹介

Cloudflareは、Town Lakeと呼ぶ統合分析プラットフォームを構築し、その上で社内AIエージェントSkipperを開発したと紹介した。公開内容は短いが、企業内データ基盤をAIエージェント活用の土台として整備する動きであり、分析基盤とエージェントを結びつける実例として位置づけられる。