AI Daily Digest — 2026年5月18日

本日のAI業界注目ニュースを 12件 厳選してお届けします。

TOP 3

プロダクト

Grok Imagine画像生成機能が正式公開

xAIの画像生成機能Grok Imagineが正式に公開され、すべてのユーザーが利用できるようになった。最新のテキストから画像への生成モデルを基盤とし、リアルで高品質な画像を作成できる。複数のアスペクト比に対応し、X上から直接利用できるため、Grokの消費者向けクリエイティブ機能が大きく拡張された。

ChatGPTモバイルアプリにCodex構築機能が統合

ChatGPTのモバイルアプリからCodexを使い、直接プロジェクトを構築できるようになった。デスクトップ環境に限らず、スマートフォン上でも開発作業の開始や調整を進められるため、Codexの利用場面が日常的なモバイルワークフローへ広がる。

Zerostack、純Rust製のUnix哲学型プログラミングエージェントとして公開

Zerostackは、Rustで実装されたUnix哲学に着想を得たプログラミングエージェントで、バージョン1.0.0としてRustのパッケージレジストリに公開された。シンプルさとモジュール性、メモリ安全性と性能を重視した設計で、開発者のコード支援や自動化作業を効率化することを狙う。Hacker Newsでも注目を集め、軽量で構成しやすいエージェントツールへの関心を示した。

リサーチ

Anthropic Claude、5日でApple M5 macOSカーネル脆弱性を攻略

AnthropicのClaude Mythos Previewは、セキュリティチームCalifがApple M5チップ搭載macOSカーネルに対する公開実証可能なメモリ破壊型権限昇格チェーンを構築する作業を支援した。攻撃は、Appleが長年かけて構築したハードウェア級のメモリ整合性保護を回避し、通常ユーザー権限から純粋なデータ操作でroot権限を取得できるとされる。Appleは後続アップデートで修正し、関係者に謝辞を示した。AI支援型のセキュリティ研究が最先端ハードウェア防御を短期間で突破し得ることを示す事例となった。

LLMエージェントの記憶書き換えが信頼性を損なう仕組みを研究が指摘

イリノイ大学と清華大学などの研究チームは、LLMエージェントが経験から学習する一方で、元の経験をLLMが文章化された教訓へ圧縮する記憶書き換え機構が信頼性を損なうと報告した。ウェブショッピング、シミュレーション世界、ARC形式のパズルなどで検証した結果、記憶を繰り返し書き換えると、誤った分類、ルールの過度な一般化、過学習が起き、細部の忘却やタスク種別の混同につながった。研究は、エージェント記憶では原体験を証拠として保持し、必要に応じて選択的に要約する設計が重要だと主張している。

業界

Anthropic CEO、ソフトウェア無料化と職業構造の大変動を予測

Anthropic CEOのDario Amodei氏は、ソフトウェアのコストが急激に下がり、実質的に無料に近づく可能性があると述べた。従来のソフトウェアは多数のユーザーで開発費を分担する前提に支えられてきたが、その構造は崩れる可能性がある。同時に、数十年かけて築かれた多くの仕事や職業が消える恐れにも触れ、社会は適応できるとしながらも、現在の人々は変化の規模を十分に認識していないと警告した。

Microsoft AI CEO、18カ月以内にAIがホワイトカラー業務を自動化すると予測

Microsoft AI CEOのMustafa Suleyman氏は、AIが18カ月以内に人間レベルの性能へ到達し、会計、法律、マーケティング、プロジェクト管理など多くの専門業務を自動化すると予測した。コンピューターの前で行うホワイトカラー業務はAIに置き換えられる可能性が高いとし、自身の使命はスーパーインテリジェンスの構築だと語った。将来は新しいAIモデルを作ることが、ポッドキャストやブログを作るのと同じくらい身近になるとも見ている。

技術

オープンソースの微信読書データ可視化ツールyao-weread-skillが公開

開発者の姚氏は、微信読書のデータをローカルで可視化するSkill、yao-weread-skillをオープンソース化した。過去2年の読書時間や読書リズム、本棚の構成、読書カテゴリ、作者の傾向を分析し、メモや感想の意味分析にも対応する。最終レポートはワードクラウド、ヒートマップ、レーダーチャートなど26種類の図表で表示され、コードはGitHubで公開されている。

Codexで説明動画を自動生成するワークフローが紹介

紹介された動画生成ワークフローは、PPT Skillによるビジュアルとモーション、HyperFramesによるタイムラインとレンダリング、Listenhub Skillによる音声、即夢CLIによる補足クリップを組み合わせる。ユーザーはCodexにテキストで指示するだけで、動きのある説明動画を生成し、チャット画面内でプレビューできる。製品紹介などの動画制作を大幅に効率化する構成として示された。

Garry Tan氏のGBrain、個人AIの記憶基盤として注目

Garry Tan氏が公開したGBrainは、単純なRAGツールではなく、AIエージェントの記憶欠陥を補う知識システムとして位置づけられている。8層構造のうち前半は基礎検索を強化し、後半は生涯記憶と自己進化を担う。OpenClawやHermesなどのエージェントが、人間関係、意思決定の履歴、認知の変化を継続的に追跡できるようにする。Markdownを最優先のデータソースとして扱い、個人AIの実用化を後押しする取り組みだ。

微信読書Skillのインストールと利用手順が共有

Berry Xia氏は、微信読書SkillをCodexやClaude Codeで利用するための導入手順を共有した。公式のSkillパッケージを使う方法、コミュニティが改善したSkillを追加する方法、必要に応じてAPIキーを取得する流れが整理されている。利用例として、AIに微信読書Skillを呼び出して特定の本のハイライトやメモを確認させる使い方も示された。

生成AIの幻覚、超大規模投資の熱狂、世界モデルと神経記号AIの道筋

Gary Marcus氏は、最近の複数のインタビューを通じて、現在の大規模言語モデルには幻覚があり、回答の信頼性に限界があると改めて指摘した。業界の超大規模化への巨額投資は非合理的な熱狂に陥る恐れがあるという。代替的な方向性として、AIに物理世界の規則を理解させる世界モデルや、深層学習と記号推論を組み合わせる神経記号AIを挙げ、信頼性、説明可能性、論理的推論を高める次世代AIの基盤として論じている。