AI Daily Digest — 2026年5月17日

本日のAI業界注目ニュースを 20件 厳選してお届けします。

TOP 3

モデル

SANA-WM、1分720p動画を生成する26億パラメータ級オープンソース世界モデル

NVIDIAの研究チームは、SANA-WMを公開した。これは26億パラメータ規模のオープンソース世界モデルで、最大1分、720p解像度の動画生成を目的としている。プロジェクトは公開されており、高品質な長尺動画生成の研究開発を後押しする。Hacker Newsでも高い注目を集め、長尺動画生成と世界モデルへの関心の強さを示した。

Ring-2.6-1Tがオープンソース化されOpenRouterに登場、エージェントワークフロー向けに設計

AntLingAGIは、Ring-2.6-1Tをオープンソース化し、OpenRouter上で提供開始した。5月末までは75%割引で利用できる。同モデルは現実世界のエージェント向けに作られた兆規模推論モデルで、単に質問へ回答するだけでなく、手順の計画、ツール利用、文脈維持、複雑なワークフローの完遂を重視している。高推論モードを備え、Async RLとIcePopによる学習手法も採用している。

プロダクト

Codex、キーボードショートカットのカスタマイズ機能を追加

Codexに一連の使い勝手改善が加わり、キーボードショートカットをユーザー自身の作業スタイルに合わせて変更できるようになった。既定の操作体系に合わせるのではなく、設定画面から自分のワークフローに沿って調整できるため、日常的な開発作業の操作効率が高まる。

Notion、開発者プラットフォームとCLIツールを公開

Notionは開発者プラットフォームを正式に発表した。中核にはNotion CLI、Workersコンピュートサービス、データベース同期機能、複数のエージェントツールとAPIが含まれる。開発者はNotionの基盤上でコードを実行し、外部データソースと接続し、自動化ワークフローを構築しやすくなる。将来的には、非開発者もAIエージェントを通じてNotion上にアプリを作れるようにする構想だ。

業界

米国でAI関連職の大規模な雇用喪失が始まる

Bloombergの報道によると、米国ではAIの影響を受けやすい職種で大規模な人員削減が始まっている。AIが労働市場にもたらす影響は理論上の議論から現実の雇用変化へ移りつつあり、対象となる業種や職種、削減規模の具体化が進んでいる。

研究者がAnthropic MythosでmacOSカーネル攻撃を構築、Apple M5のメモリ整合性実行を突破

3名の研究者はAnthropicのMythosを用い、Apple M5チップのMemory Integrity Enforcementを回避するmacOSカーネル攻撃コードの開発に成功した。この機能はM5とA19向けの中核的な安全機構で、メモリ破壊脆弱性を根本的に減らすことを狙っている。研究チームは4月25日に脆弱性を発見し、5月1日には攻撃コードを完成させ、Apple Parkで直接報告した。攻撃はポインタ操作を必要としない純粋なデータ攻撃で、非特権ユーザーの通常のシステムコールだけでroot権限を得られるという。詳細な技術報告はAppleの修正後に公開される予定だ。

OpenAI、大規模組織再編でBrockman氏が製品戦略を全面統括

OpenAIは過去最大規模の組織再編を行い、ChatGPT、Codex、APIの三大中核プロダクトラインを統合した。共同創業者兼社長のGreg Brockman氏が製品戦略を全面的に統括し、ChatGPTの従来責任者だったNick Turley氏は中核ポジションから外れたと報じられている。再編の狙いはリソースを統合し、エージェント時代へ向けた開発を加速することにある。複数機能を統合したスーパーアプリ型のデスクトップ製品も水面下で進められているという。

杭州に国家級の具身智能訓練拠点、ロボット向け職業技能の実証場が稼働

国家人工知能応用中試基地の具身智能拠点が5月16日に浙江省杭州市で稼働した。ロボットに国家級の職業技能訓練場を提供する総合プラットフォームで、シナリオ体験、技術展示、研究開発協業、産業支援を一体化している。杭州市では5月1日に具身智能ロボットに関する地方条例も施行され、コア研究開発、プラットフォーム整備、実証シーン開放を支援している。市内にはロボット関連企業が700社以上集まり、2025年の具身智能産業クラスター生産額は1,068億元に達した。

OpenAI、マルタ政府と提携し全市民にChatGPT Plusを提供

OpenAIはマルタ政府と提携し、同国の全市民にChatGPT Plusサブスクリプションを無料提供する。提携には、市民がAIを責任ある形で使えるようにするための実践的なAIスキルトレーニングも含まれる。国家規模でChatGPT Plusを広く提供する初の取り組みであり、国民全体のAIリテラシーと活用力を高めることを目指す。

リサーチ

エージェント駆動のArticraft、3Dアセット生成を自動化し1万件超のデータセットを公開

ケンブリッジ大学のチームは、エージェント駆動型のコーディングシステムArticraftを発表した。AIエージェントが自律的にコードを書き、実行し、物理フィードバックを受けて反復改善することで、関節を持ち動作可能なインタラクティブ3Dアセットを自動生成できる。従来は数日から数週間かかる制作工程を大幅に短縮する。チームは同時にArticraft-10Kデータセットも公開し、250カテゴリ、1万点超のシミュレーション対応オブジェクトを提供した。ロボット訓練や物理AIに必要な高品質3Dデータの不足を補う取り組みとなる。

技術

PPT Skills更新、AIがスクリーンショットを自動で美しく整える

藏師傅PPT Skillsに、スクリーンショット美化機能が追加された。GPT-Image 2.0のリソースを使わず、画像のサイズ、縦横比、PPTテンプレートの種類、配色テーマに応じて背景を自動で選び、CleanShot Xのような見た目に整える。長すぎる画像など扱いにくい素材も自動で裁断し、2列配置にするなどの処理が可能だ。

MagicPathとCodexが深く統合、設計と開発の流れを一本化

MagicPath AIのCEOである@skirano氏は、MagicPathとCodexの深い統合をデモした。ユーザーはMagicPathをCodex内のネイティブキャンバスとして動かし、UIをドラッグ操作で設計できる。Codexはプロジェクトをリアルタイムに把握し、コードの生成や編集を行うため、FigmaとIDEを行き来する必要が減る。Codexに1行のコマンドを貼り付けるだけで設定でき、設計、開発、反復改善を単一の作業画面へ集約する。

Codex、複数デバイスの遠隔操作とコンテキスト共有に対応

CodexはChatGPT経由の接続と遠隔操作に加え、別のコンピューターも制御できるようになった。ユーザーはChatGPT上で複数のデバイスを直接管理でき、プロジェクトを切り替えるだけで異なるデバイスのコンテキストやファイルへアクセスできる。リモートSSHで別のVMを設定する用途にも対応し、多端末での協調作業の柔軟性を高める。

Show HN:トークンを燃やすオープンソースプロジェクト

開発者は、暗号資産領域のインフレ問題に対応するため、保有トークンを自発的に焼却できるオープンソースプロジェクトを公開した。総供給量を減らすことで、残るトークンの希少性や潜在価値を高める狙いがある。GitHubで公開され、Hacker Newsでも一定の注目を集めた。

AnthropicのFounder's Playbook、AIが起業失敗率を高める可能性を警告

Anthropicの内部手引きFounder's Playbookは、Claude CodeのようなAIが起業の失敗率を下げるのではなく高める可能性があると指摘している。AIはプロトタイプを素早く作れるため、創業者が「動くもの」と「市場需要があるもの」を混同しやすくなる。また、確証バイアスや調査エンジンとしての能力が誤った仮説を強化する恐れもある。手引きはIdea、MVP、Launch、Scaleの各段階でAIが増幅するリスクを整理し、実行コストが下がるほど判断力が最も希少な資源になると結論づけている。

ツール利用エージェントの認知と行動の断絶メカニズムを分析

この解釈可能性研究は、ツール利用エージェントにおいて、モデルがツールを呼ぶべきだと内部的には認識していても、実際の呼び出しに失敗する現象を扱っている。隠れ状態のプローブにより、不一致率は26%から54%に達し、問題は認知そのものではなく認知から行動へ移る段階に集中していることが示された。内部のプローブ方向は解読可能だが、後段層の最終トークン機構により信号が回転し、生成される行動とほぼ直交してしまう。プロンプトや訓練不足だけでは説明しきれない性能上限を示す研究として注目される。

Eric Jang氏、AlphaGoをゼロから構築した経験と知見を共有

Eric Jang氏は、2016年に自身が深層学習へ入るきっかけとなったAlphaGoを、数カ月かけてゼロから実装した。最初はAlphaGoを「自己対局で訓練された探索強化型の深層ニューラルネットワーク」と捉えていたが、実際に構築することでより深い理解を得たという。最先端の深層学習研究は高価だが、特定能力の再現コストは急速に下がっており、2026年には強力な囲碁AIの訓練も数千ドル規模の計算資源で可能だと述べている。詳細なチュートリアルとコードも提供している。

Latest Open Artifacts第21回、Gemma 4やDeepSeek V4などオープンモデルの集中更新を紹介

Nathan Lambert氏のInterconnectsは、最新のオープンAIモデル群をまとめた。Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1など、重要な新バージョンが相次いで登場している。これらのモデルはCAISIのV4評価フレームワークでも評価されており、複数チームがほぼ同時期に旗艦級の更新を進めていることから、オープンソースAIコミュニティの高速な競争と反復が続いていることが分かる。