Aleph 2.0とEdit Studioを公開
RunwayはAleph 2.0と、それに対応するEdit Studio制作ツールを正式に公開した。今回の更新では、生成、編集、ポストプロダクションを単一のプラットフォームへ統合し、制作フロー全体をまとめて扱えるようにした。マルチモーダルコンテンツの処理効率も大きく改善され、構想から完成物までを一つの環境で進められる。クリエイターにとって、より滑らかで統合されたデジタルコンテンツ制作体験を提供する狙いだ。
本日のAI業界注目ニュースを 26件 厳選してお届けします。
RunwayはAleph 2.0と、それに対応するEdit Studio制作ツールを正式に公開した。今回の更新では、生成、編集、ポストプロダクションを単一のプラットフォームへ統合し、制作フロー全体をまとめて扱えるようにした。マルチモーダルコンテンツの処理効率も大きく改善され、構想から完成物までを一つの環境で進められる。クリエイターにとって、より滑らかで統合されたデジタルコンテンツ制作体験を提供する狙いだ。
TencentはHy-MT2多言語翻訳モデルを正式にオープンソース化した。33言語間のシームレスな相互翻訳に対応し、7B版と30B-A3B版はオープンモデルとして最先端級の翻訳性能を示し、はるかに大きなモデルも上回るという。さらに1.8Bの軽量版はMicrosoftなどの主要商用APIを超える性能を持ち、Tencent AngelSlim 1.25-bitの極限量子化により、440MBの保存容量で主要スマートフォンチップ上のローカル実行が可能になる。高品質AI翻訳の導入障壁を大きく下げる発表だ。
Meituan LongCatチームは、音声駆動のデジタルヒューマン動画生成に特化したオープンソースフレームワークLongCat-Video-Avatar-1.5を公開した。中核的な更新はWhisper-Large音声エンコーダーの採用で、唇の動きの滑らかさと自然さを大きく改善している。正確なリップシンク、全身の時間的一貫性、長尺動画での同一性維持に対応し、アニメ、動物、複数人のやり取りなど複雑な場面にも一般化できる。DMD2ベースのステップ蒸留により、わずか8ステップで効率的に推論できる点も特徴だ。
OpenAI Developersは、Codexが場所や端末を問わず利用しやすくなったと発表した。Macのロックを解除しなくても、Codexがコンピューター上のアプリを安全に操作できる。ユーザーはスマートフォンから、画面がオフでロックされた状態のMac上のアプリをCodexに扱わせることができるため、外出先や離席中でも開発作業やデスクトップ操作を継続しやすくなる。
Googleは、スマートホーム領域を拡張するため、フルスタックのGemini AIソリューションを発表した。高度なカメラインテリジェンス、自然言語による問い合わせ、日常活動の要約機能を統合している。サービス事業者やハードウェアメーカーは、すぐ使えるリファレンスデザインとAPIを利用でき、大規模な研究開発を行わずに、能動的でブランド化されたスマートホームサービスを構築できる。単なるデバイス制御を超え、文脈を理解してリアルタイムに応答するAIネイティブなスマートホームへ進む取り組みだ。
複数の企業がClaude Opusモデルを使ってサイバー防御を強化している。WizはRed Agentを通じて毎週15万件を超える本番資産に継続的な侵入テストを行い、数千件の高リスク脆弱性を誤検知ゼロで発見している。Palo Alto Networksは、従来なら1年分に相当する侵入テスト作業を3週間未満で完了した。Accentureはセキュリティテストのカバレッジを約10%から80%以上へ引き上げ、1600個のアプリと50万件超のAPIを対象に、スキャン周期を3から5日から1時間以内へ短縮した。大規模な攻撃的テスト、脆弱性の発見から修復までの短縮、制御されたAIシステムの本番投入が主な活用領域となっている。
Claude Code v2.1.147では、決定論的なマルチエージェント編成を可能にする`Workflow`ツールが導入された。初期状態では無効になっている。`/simplify`コマンドは`/code-review`へ名称変更され、コードの正しさに関する問題を報告し、GitHub PRのインラインコメント生成にも対応する。自動更新機能にはリトライとエラー報告が追加され、大きなdiffの描画性能やプロンプト履歴の重複回避も改善された。企業ログイン制限、Windows上のPowerShellツールやターミナルのちらつき、プラグインシステム、shellスナップショットに関する不具合も修正され、サンドボックス安全性とターミナル互換性が強化されている。
Replit Enterpriseはセルフサービスで購入できるようになった。利用者は数分でReplit Enterpriseを購入し、SSOとSCIMを設定し、チームで共同開発を始められる。契約交渉や営業プロセスを待つ必要がなくなり、企業チームがReplitの開発環境をより素早く導入できるようになる。
Datasette Agentは、Datasette初の拡張可能なAIアシスタントとして公開された。ユーザーは対話形式でデータを問い合わせ、プラグインを通じてグラフ生成も行える。このツールはLLM Pythonライブラリを基盤としており、LLMとDatasetteの統合における重要な成果と位置付けられる。公式プラグインとして、グラフ生成、AI画像作成、サンドボックスコード実行が提供されている。Gemini 3.1 Flash-Liteのようなクラウドモデルでも、LM Studio経由のローカルオープンモデルでも動作し、信頼性のあるツール呼び出しとクエリ能力を備える。
PixVerseは、プラットフォームに適したネイティブ広告動画を素早く生成するShoplift by PixVerseを紹介した。スタジオや編集待ちの工程は不要で、商品URLを貼り付けるだけで、数分以内に広告動画を公開できる。継続的にクリエイティブテストを行うDTCチーム向けに設計されており、広告制作の速度と試行回数を高める狙いがある。早期アクセスと期間限定のポイント施策も案内されている。
Googleは、開発者向けの新しいツールキットとして、Kotlin版ADKとAndroid版ADK 0.1.0を公開した。どちらもAIエージェント構築を支援するためのものだ。Kotlin版ADKはエージェントワークフローをバックエンド開発へ持ち込み、Android版ADKはモバイルアプリに特化した機能を提供する。Androidエコシステムとより広いプラットフォーム上でAIアプリを作るための、公式な基盤整備といえる。
カリフォルニア州のGavin Newsom知事は、AIによる失業を公共政策上の課題として初めて明確に位置付ける行政命令に署名した。各部門に対し、退職手当、失業保険、従業員持株制度などの保護策を研究するよう求めている。この命令は、AIが職務全体を一気に置き換えるのではなく、仕事の中のタスクを段階的に代替する可能性を認識し、影響を早期に把握するための新しい労働データダッシュボードの構築も計画する。AIによる生産性向上の利益を、株式や賃金支援などを通じて企業と労働者の間でより公平に分配することが政策の焦点となる。
TeslaのFSDが中国本土市場に正式投入されると報じられた。詳細は短い告知にとどまっているが、中国本土での提供開始は、自動運転支援機能をめぐる競争と規制対応の両面で大きな意味を持つ。世界最大級の自動車市場でFSDが展開されることで、Teslaの現地競争力やデータ活用、スマートEV市場の勢力図にも影響する可能性がある。
The Wall Street Journalの報道によると、Anthropicは初の黒字四半期に近づいており、第2四半期の売上高は109億ドル、営業利益は5億5900万ドルに達する見通しだ。同社は昨年夏の時点では、早くても2028年まで黒字化しないと見込んでいた。主な成長要因は、プログラミングツールとClaudeのエージェント機能の利用拡大であり、需要が利用可能な計算資源を上回る場面もあったという。この転換は、Anthropicが主要AI研究機関として業界で初めて収益性を実現する可能性を示す。
ソフトウェア企業Intuitは、戦略再編の一環として3000人を超える従業員を削減すると発表した。今回の人員削減は、同社のリソースを人工知能分野の発展へ再集中させ、技術トレンドに適応しながら長期的な競争力を高めることを目的としている。削減規模は世界の従業員数の約10%に相当する。
AI映画プロジェクトRAPHAELがカンヌで披露された。この作品はMateo AI Studioと韓国MBC C&IのAIコンテンツラボが共同開発し、制作全体にKling AI動画モデルを使用している。独自の視覚効果と差別化された鑑賞体験を実現することを狙い、2026年の劇場公開を計画している。大規模な制作を通じて、純粋なAI映画制作が産業として成立し得ることを示す試みであり、AIネイティブな劇場映画の新しい流れを象徴する。
Google DeepMindは、アジア太平洋地域で「AI for the Planet」に焦点を当てた初のアクセラレータープログラムを開始すると発表した。この地域は経済成長が速い一方で気候変動の影響を受けやすく、既存のグリーン技術の発展速度は環境リスクの増大に追いついていない。3か月間のプログラムは、スタートアップ、研究チーム、非営利組織を対象に、自然、気候、農業、エネルギーなどの課題へ先端AIを応用することを支援する。選出された組織には専門家の指導、カスタマイズされた支援、Google AIの先端モデルの統合機会が提供される。
SenseTimeは、IDCから中国コンピュータービジョン市場の首位に10年連続で選ばれた。主な要因として、CV 2.0アーキテクチャの進化を主導し、生成AI能力をネイティブに組み込んだことが挙げられる。海外市場は12の国際地域へ広がり、500社を超える企業顧客を抱え、高い継続率を維持している。年間経常収益の成長を軸に収益性を高め、プロジェクト型の納品から拡張性の高いAIプラットフォームへ移行している点も重要だ。10年間の市場リーダーシップは、コンピュータービジョンと生成AIの融合を主導する基盤になっている。
AdventHealthは、OpenAIのChatGPT for Healthcareソリューションを採用し、医療ワークフローの最適化を進めている。狙いは、医療従事者の事務負担を軽減し、患者ケアにより多くの時間を戻すことだ。この連携では、文書作成や調整などの非臨床業務をAIで処理し、医療現場全体の効率と患者体験を高める。
Grokは、AIがゲーム開発へ深く入り込む新しいワークフローを示した。プロンプトでキャラクター画像を生成し、画像からアニメーション動画を作り、自動でスプライトシートへつなぎ、ゲームエンジンへ取り込むという4段階の流れだ。従来はアーティストやアニメーターが数日かけていた作業を数分で完了できる。AIが静止画生成にとどまらず、UnityやGodotなどへ直接取り込める実行可能アセットをリアルタイムに作る段階へ進んだことを示している。ゲーム試作の反復周期を「日」から「秒」へ短縮し、独立開発者の創作ハードルを大きく下げる。
Suno AI音楽生成ツールを利用したスキル実装が紹介された。簡単な指示で、ドイツ語の空気感ある楽曲など、ユーザーの要望に応じたさまざまなスタイルの曲を生成できる。購読料金は月10ドルで、高度なスタイル指定に対応する。技術面では、約6000種類の音楽スタイル検索が追加され、精度が向上しているほか、Google CDP経由でログインなしに呼び出せる。プロジェクトはオープンソースで、GitHubリポジトリとインストール手順も提供されており、音楽制作の入り口を広げる。
CloudflareのCEOはThe Wall Street Journalへの寄稿で、同社が一部従業員をAIで置き換える際の判断ロジックを共有した。記事は2026年5月21日に公開され、技術コミュニティで広く議論を呼んだ。Hacker Newsでも大きな反応を集めており、企業がAI導入による職務代替をどのように意思決定するのかという実務的で敏感な論点を浮き彫りにしている。
Gary Marcus氏は、OpenAIとAnthropicの最近の重要なプロダクト更新をめぐる数字を検証している。Claude 3.5 Sonnetは複数のベンチマークでGPT-4oを上回り、API価格の50%引き下げも発表された。Anthropicはモデル訓練コストが年平均約3.2倍で増加していることを明らかにし、OpenAIは企業向けサービスで単四半期10億ドル超の売上を実現したと報じられている。両社は技術的進展と商業化競争の中で、コスト、性能、収益性の精密なバランスを通じて業界構造を塗り替えつつある。
Google上級副社長のJames Manyika氏は、AIが短期的に雇用市場を破壊することはなく、大規模失業という急進的な予測にも同意しないと述べた。自身が2017年に関わったMcKinseyの報告書を引き、オートメーションは雇用の減少、新しい仕事の創出、既存職務の再定義を同時に引き起こすと説明している。現在の論点は、この三つがどの割合で起きるかであり、起きるかどうかではないという。Manyika氏は、AI業界が社会不安を増幅しているとも批判し、AIの最大の影響は職業を消すことではなく、仕事の内容と進め方を変えることだと強調した。
SpaceXはS-1提出後、AI時代のコングロマリットとしての姿を見せている。同社はStarlink、宇宙事業、AI事業の三つで構成され、2025年の総売上高は187億ドルに達した。中核となるStarlinkは売上の61%を占め、39%の営業利益率を実現する現金創出源だ。宇宙事業は売上の22%を占め、AI事業はXプラットフォームとxAIを含めて17%にとどまり、巨額投資段階にある。それでもAI事業は将来の戦略方向を示しており、Starlinkの強い収益性が宇宙探索とAIへの野心を支える重要な資金基盤になっている。
クラウドエージェントは、ローカルエージェントを単に拡張したものから、独立した環境を持ち、長時間タスクを無人で並列処理できるシステムへ進化している。構築上の重要な教訓は、完全な開発環境が出力品質の鍵になるという点で、そのためには多くの基盤インフラを再構築する必要がある。信頼性については、自社開発アーキテクチャからTemporalへ移行することで99.9%以上に高めた。同プラットフォームは毎日5000万回を超える操作を処理し、コードプルリクエストの40%以上を支えている。さらに、エージェントループ、マシン状態、会話状態を切り離すことで、複雑なクロス環境協業へ対応している。