AI Daily Digest — 2026年5月21日

本日のAI業界注目ニュースを 28件 厳選してお届けします。

TOP 3

モデル

Qwen3.7、エージェント最前線へ

Qwen StudioはQwen3.7を公開した。チャットボット、画像・動画理解、画像生成、文書処理、Web検索統合、ツール呼び出し、成果物生成までを広くカバーし、現在のAIエージェントに求められる主要能力を統合している。マルチモーダルな対話と実務タスク実行を、より包括的で自律的な方向へ進めるモデル更新として位置付けられる。

Kling AI、世界初のネイティブ4K動画生成モデルを公開

Kling AIは、プロ向けコンテンツ制作を狙った世界初のネイティブ4K動画生成モデルを発表した。ワンクリックで真の4K画質動画を生成でき、画面の細部表現と制作効率を高める。ハリウッド制作チームやアニメーションスタジオも採用しており、従来のアップスケーリングに伴うキャラクター変形を避け、画面の一貫性や複雑な質感表現を保てる点が評価されている。

SenseNova U1、テキストと画像を同時に考えるAIとして紹介

SenseTimeはSenseNova U1を、テキストと画像を同時に扱えるAIとして紹介した。多くのAIツールが文章作成か画像生成のどちらかに寄るのに対し、U1はアイデアを物語性のあるビジュアルへ変換しながら、言語と画像を一体で処理することを強調している。クリエイティブ制作における発想、文章化、視覚化を一つの流れにまとめる方向性を示す発表だ。

プロダクト

GPT-5がまもなく公開へ

ChatGPT公式アカウントは、GPT-5がまもなく公開されると短く予告した。詳細な機能や提供時期はまだ示されていないが、OpenAIの次期主力モデルに関する直接的な告知として大きな注目を集めている。ChatGPT、API、開発者向け機能の更新につながる可能性が高く、モデル競争とプロダクト体験の両面で重要な節目になり得る。

Tencent、OSレベルAIアシスタント「Mavis」をWindows、Mac、Androidで公開

Tencentの張軍氏は、OSレベルのAIアシスタント「Mavis」が正式に稼働を始め、Windows、Mac、Androidで同時に提供されたと発表した。文書の分類・解析、画像の認識と処理、システム保守などに対応し、OSとの深い統合を通じて複数モデルをタスクに応じて呼び分ける。一部機能はオフラインでも使え、デスクトップからスマートフォンアプリを操作する能力も備えるとされる。

Google Stitch、AIデザイン支援を全工程構築へ拡張

GoogleはAIデザインパートナーStitchの重要な更新を発表した。リアルタイムのストリーミング構築により、ユーザーは制作フローを止めずに編集やフィードバックを行える。既存コードベースやDesign.mdファイルの取り込みにも対応し、実際の本番コンポーネントを基にブランド一貫性を保った設計が可能になった。動的UI生成と共有可能なオンラインURLへの書き出しも加わり、プロトタイプから公開までの流れを短縮する。

ChatGPTモバイル版がCodexに対応、端末をまたいだ協業を実現

OpenAI Developersは、ChatGPTモバイルアプリからCodexを利用できるようになったと紹介した。外出先で質問や開発作業の相談を始め、後からコンピューターで同じ会話を継続できる。コーディング支援がデスクトップ中心の作業から、モバイルを含む継続的なワークフローへ広がる更新だ。

Midjourney V8.1、ネガティブプロンプト機能を追加

MidjourneyはV8.1に、旧バージョンで使われていたネガティブプロンプト機能を復活させた。`--no` フラグとして実装され、画像から人物など特定の要素を除外したい場合に使える。生成結果から不要な対象を取り除く制御が戻ったことで、V8系モデルでの細かな出力調整がしやすくなる。

MiniMax音声モデル、600種類超の新ボイスを追加

MiniMaxは、MiniMax Speech 2.8 Turboを基盤とする600種類以上の新しい音声がTogether AIに追加されたと発表した。利用者は幅広い声質を選べるようになり、音声生成やナレーション、対話型プロダクトの表現力が広がる。生成音声の選択肢が増えることで、多言語・多用途の音声AI制作における実用性が高まる。

OpenClaw 2026.5.19版を公開

OpenClawは2026.5.19版を公開した。Android Talk Modeのリアルタイム化、Mac設定画面の整理、xAIログインのヘッドレスモード対応、Telegramトピック機能の安定化などが含まれる。大規模更新としては簡潔な告知だが、複数プラットフォームでの実用性と運用安定性を高めるリリースとなっている。

Gemini 3.5 Flash、OpenCodeに登場

OpenCodeはGemini 3.5 Flashをプラットフォーム上で利用可能にした。高速な応答、100万コンテキスト、GLM、Kimi、DeepSeek Proに近い価格帯が特徴として示されている。長い文脈を扱う開発支援やコード理解に、Googleの高速モデルを選択肢として組み込めるようになる。

業界

SpaceX、Anthropicとの協業で大規模AI計算サービスを提供

Elon Musk氏は、Anthropicとの協業拡大を例に、SpaceXが大規模なAI計算サービスを提供していると述べた。ほかの企業とも同様の協業を協議しており、将来的には軌道上データセンターを含め、極めて大きな規模でAIサービスを提供する見通しを示した。宇宙インフラとAI計算資源が結び付く可能性を示す発言として、業界競争上の意味が大きい。

OpenAI、YC参加スタートアップ全社に200万ドル相当のAPI投資を提供

OpenAIは、Y Combinatorの現在のバッチに参加する各スタートアップへ、株式と引き換えに200万ドル相当のAPIクレジット投資を提供すると発表した。AI計算資源を初期企業に供給し、次世代のAIアプリケーション創出を支援する狙いだ。Sam Altman氏がYCパートナーだった時代の投資事例を想起させる取り組みで、OpenAIがスタートアップ・エコシステムへ深く入り込む動きでもある。

欧州委員会、EU AI法の高リスクAI分類ガイドライン草案を公表

欧州委員会は2026年5月19日、EU AI法第6条に基づく高リスクAIシステム分類のガイドライン草案を公表し、意見募集を開始した。AIシステムの提供者、導入者、市場監督機関に対して明確な分類基準を示し、EU全域で一貫した執行を図る。分類は主にAIシステムの想定用途に基づき、規制対象製品の構成要素か、特定の高リスク場面で使われるかを判断する。補助的タスクのみを担う場合の一部免除も示されている。

SoftBankのOpenAI投資が600億ドル超に、孫正義氏への内部懸念も浮上

SoftBankのOpenAIへの投資コミットメントが600億ドルを超え、創業者Sam Altman氏への過度な信頼を懸念する声が社内で出ていると報じられた。一部幹部は、巨額資本を単一企業へ集中させるリスクや、10%超を保有しても取締役会席を持たない点を問題視している。Anthropicなど競合の台頭もOpenAIの優位性への疑問を強めており、市場はSoftBankの株価下落や信用見通しの引き下げでこの賭けに慎重な見方を示している。

Metaが大規模再編、裁員とAI転換を同時に推進

Metaは約8000人の削減を計画する一方、約7000人を新たなAI関連職へ配置する大規模再編を始めた。単なるコスト削減ではなく、AIを中心に社内構造を作り替える動きと見られる。AIインフラ、基盤モデル構築、AI技術の商業化へ資源を集中し、モデル訓練から製品開発、収益化までをつなぐ体制づくりを狙う。

GoogleのAIが操作攻撃に直面、検索大手は静かに反撃

GoogleのAIシステムは、生成結果を悪意ある形で操作されるリスクに直面している。これに対し同社は、検索やAIサービスの信頼性を守るため、防御策を静かに進めている。AI生成コンテンツが検索体験の中心へ近づく中、敵対的な操作への耐性は安全性と信頼性の重要課題になっており、Googleの対応はAI安全分野の対抗的問題が拡大していることを示す。

Microsoft内部で警告、AIコーディングツールがGitHubの存続リスクに

Microsoft内部で、コードホスティング基盤GitHubが「存続級リスク」に直面しているとの警告が出たと報じられた。CursorやClaude CodeなどのAIコーディング支援が開発者の作業フローを変え、コードを継続的にGitHubへアップロードする必要性を弱めていることが主因とされる。Microsoftは一部チームに対し、2026年6月末までにClaude Codeの試用を停止し、自社ツールのGitHub Copilot CLIへ移行するよう求めている。

GeminiとXPRIZE、世界規模のハッカソンを共同開催

Google AI for Developersは、XPRIZEと共同で世界規模のハッカソンを開催すると発表した。Geminiの新しいエージェントツールを使い、現実世界の課題解決を目指す開発者を募る。AIエージェントを社会的インパクトのある応用へ接続する取り組みであり、Googleの開発者エコシステム拡大にもつながる。

リサーチ

OpenAIモデル、離散幾何学の中核的予想を反証

OpenAIが開発したAIモデルは、数学界で80年以上未解決だった「単位距離問題」に関する研究を前進させ、離散幾何学の中核的な予想を反証した。この成果は、AIが基礎科学の理論探索で実質的な発見を生み出せることを示す節目と受け止められている。複雑な幾何問題を扱う新しいアルゴリズムにより、数学的予想の自動発見と検証における機械の可能性を示した。

ZCube、超大規模LLM推論向けネットワーク最適化を提示

Zhipu AIは、超大規模LLM推論に向けたネットワークアーキテクチャZCubeを紹介した。Spine層をなくし、Leafスイッチをグループ化して全結合する設計により、推論ネットワークの輻輳を抑える。実クラスタでの検証では、スイッチと光モジュールの設備投資を33%削減し、GPU平均推論スループットを15%高め、初回トークン遅延のP99を40.6%低減した。コスト削減と推論性能向上を同時に狙う技術だ。

技術

オープンソースのユーザースクリプト、複数プラットフォームのスクリーンショット投稿と内容処理を実現

Vista氏は、小紅書、Douyin、WeChat公式アカウントへのスクリーンショット貼り付け自動アップロードに対応するオープンソースのユーザースクリプトを紹介した。YouTube字幕のコピー、再生速度調整、NotebookLMやChatGPT向けの内容エクスポートにも対応する。X上の内容を中国国内プラットフォームへ同期する作業を楽にする一方、一部プラットフォームの体験にはまだ課題があるとしている。

オープンソースプラグイン、Codex Appに高度機能を追加

Vista氏は、Codex Appの機能を拡張できるオープンソースプロジェクトを紹介した。APIログインでもプラグインをインストールすることでComputer Use機能を有効化し、Goal指令を追加できる。UIのカスタマイズにも対応し、Chrome風の上部タブ表示や、タスク開始・完了時の通知音設定などが可能になる。Codex Appをより実験的に使いたいユーザー向けの拡張として注目される。

OpenRouter、自動ルーティングのキャッシュ固定の仕組みを説明

OpenRouterは、自動ルーティングと個別モデルでのキャッシュミスを利用者が過度に気にする必要はないと説明した。OpenRouterは、キャッシュが期限切れになるまで会話を特定のモデルまたはプロバイダーに固定する。複数モデルを横断する自動ルーティング環境でも、会話の一貫性とキャッシュ効率を保つための仕組みとして重要だ。

Rampエンジニア、Codexでコードレビューを高速化

Rampのエンジニアチームは、CodexとGPT-5.5モデルを統合し、コードレビューの流れを大幅に高速化した。数分以内にコード変更へ実質的なフィードバックや改善提案を出せるため、従来は数時間かかっていたレビュー周期を短縮できる。プロダクトの反復とリリースを速める実務的な導入事例として、AI支援レビューの効果を示している。

プロンプトで超リアルなサッカー自撮り動画を生成

PixVerseは、超リアルなスマートフォン自撮り風のサッカー動画を生成するための複雑なプロンプト例を紹介した。大規模スタジアムで5人の友人が撮影している設定を、人物の外見一貫性、競技場環境、手持ちスマートフォンらしい揺れやピントずれ、自然な動作シーケンスまで細かく指定している。動画生成で一貫性とリアリティを引き出すプロンプト設計の実例だ。

Anthropic営業責任者、Claude Coworkで4000顧客アカウントを管理

Anthropicの米国ミッドマーケット事業責任者Travis Bryant氏は、Claude Coworkを使って営業管理業務を自動化している。顧客の優先度スコアリング、毎日の顧客ブリーフ、週次売上予測レポートを効率化し、毎晩4000アカウント分のデータを処理する。従来は部門横断チームが数百時間かけていた作業を置き換え、同氏は毎日約90分を節約し、顧客対応と戦略判断により集中できるようになった。

生成AIはテック業界の「ベトナム戦争」になるのか、社会的抵抗が進路を変える可能性

Gary Marcus氏は、生成AIの急進的な拡大が深い再検討を迫っており、リスクと社会的反発によって長期的な泥沼に入る可能性があると論じた。データプライバシー、コンテンツの真実性、倫理的影響などへの懸念が、業界に根本的な反省を求めている。こうした抵抗は発展を遅らせる一方、安全性、透明性、責任ある開発へ方向修正する力にもなり得る。