AI Daily Digest — 2026年6月19日

本日のAI業界注目ニュースを 29件 厳選してお届けします。

TOP 3

モデル

OpenAI、有益性を強化学習で広く持続的に改善する研究を公開

OpenAIは、実際の対話シナリオで強化学習を使い、モデルに誠実さ、認知的謙虚さ、メタ認知的透明性、訂正可能性、公平性、人間の福祉への配慮などの有益な特性を持たせる研究を公開した。訓練データは健康、教育、科学、法律、工学など複数領域を含む。訓練後のモデルは、報酬ハッキング、欺瞞、有害助言、規範遵守など多数の独立評価で改善し、訓練に含まれない領域や採点設定にも効果が汎化した。

GPT-5.5 Instant、健康質問で前線Thinkingモデル級の性能に到達

OpenAIは、世界60か国、49言語、26専門科の医師と協力し、GPT-5.5 Instantの健康関連回答能力を大幅に高めたと発表した。医師主導の評価により、同モデルは健康領域で同社の前線Thinkingモデルに近い水準に達した。緊急性の認識、文脈確認、不確実性の説明、複雑な情報の簡潔な説明が改善され、ChatGPT無料ユーザーにも提供される。

GPT-5.5 Instant、ChatGPTの健康インテリジェンスを強化

OpenAIはChatGPTの健康インテリジェンスを強化し、GPT-5.5 Instantを全無料ユーザーへ提供した。毎週2.3億人超がChatGPTで健康情報を得ており、今回の更新は高難度の健康評価で前線Thinkingモデル水準に近づいたことを示す。医師が作成したHealthBenchとHealthBench Professionalでは、早期モデルや医師の手書き回答と比べて、正確性、安全性、説明品質で改善が見られた。

xAIのGrok TTS、Vapi盲検評価で人間らしさ96点を記録

xAIのGrok TTSモデルは、VapiのHumanness Index盲検投票で96点を獲得し、真人の100点に迫る結果を示した。この評価では同じ声と引用文を各音声モデルでクローンし、聞き手が人間らしさを評価する。音声合成の自然さが実用上の重要指標になりつつある中で、Grok TTSは会話型AIや電話エージェント、音声アプリケーション向けの品質競争をさらに押し上げる存在になった。

MOSS-TTS-Local-Transformer-v1.5、SGLang-Omniで48kHzストリーミング提供

MOSS-TTS-Local-Transformer-v1.5は、48kHzステレオ、ゼロショット音声クローン、最長10分の長文合成、時間制御、31言語に対応するオープンソースTTSモデルだ。Qwen3-4Bを中核に、約2BパラメータのMOSS-Audio-Tokenizer-v2を使う。SGLang-Omniはこのモデルを三段階パイプラインで提供し、リアルタイム音声合成を自前で展開したいチームにとって実装面の参考になる。

プロダクト

AI社員Viktor、Microsoft Teamsに正式対応し年換算収益2000万ドルへ

AI社員サービスのViktorは、Slackで年換算収益2000万ドルを達成したうえで、Microsoft Teamsに正式対応した。ユーザーは新しい操作方法やプロンプトを学ばず、同僚を呼ぶようにメンションするだけで業務成果物を得られる。Teamsの3.2億ユーザーへ入口を広げることで、社内運用や管理部門の前線従業員にもAI利用を届ける狙いがある。無料トライアルには100ドル分のクレジットが含まれ、クレジットカード不要で開始できる。

xAI、Microsoft Word向けGrokプラグインを公開

xAIは、Microsoft WordでGrokを使える無料のMicrosoft 365プラグインを公開した。ユーザーはメモを構造化文書へ変換し、文章を明確かつ簡潔に書き換え、WebやXを検索し、図表を生成できる。SharePointやGoogle Driveなど外部ソースとの接続にも対応し、PowerPointやExcelでも利用可能とされる。Office作業にGrokを組み込むことで、Microsoft Copilotと重なる領域にxAIが直接入る形になった。

OpenAI、ChatGPT Enterprise向け用量分析と支出制御を更新

OpenAIはChatGPT Enterprise管理者向けに、クレジット使用量分析と支出制御を強化した。Global Admin ConsoleではChatGPTとCodexのクレジット消費を統合表示し、期間、ユーザー、製品、モデルごとに利用傾向を追跡できる。管理者はワークスペース全体の既定上限、グループ別上限、個人別の追加制限を設定でき、従業員は自身の使用状況を確認して増枠申請できる。

Claude Code、作業進捗を共有可能なartifactsとして生成可能に

AnthropicはClaude Codeでartifactsをサポートした。Claude Code上の作業進捗を、PRレビュー、システム説明、ダッシュボード、リリースチェックリストなどの共有可能で自動更新されるWebページとして出力できる。artifactsは会話、コードベース、コネクタなどの文脈から生成され、更新時にはページがその場で反映される。既定では作者のみ閲覧可能で、組織内共有や管理者による権限制御にも対応する。

Claude Enterprise、企業管理型MCPコネクタ認可を導入

AnthropicはClaude Enterpriseで企業管理型MCPコネクタ認可を導入した。管理者はOktaを皮切りに、IDプロバイダー経由で組織全体のMCPコネクタ認可を設定できる。ユーザーは初回ログイン時に自動認可され、個別の手動接続が不要になる。Enterprise-Managed Authorization拡張に基づき、Asana、Atlassian、Canva、Figma、Granola、Linear、Supabaseなどに対応し、Slackも追加予定だ。

Claude Codeのカスタマイズ手法、CLAUDE.mdからサブエージェントまで整理

Claude Codeは、CLAUDE.md、ルール、スキル、サブエージェント、フック、出力スタイル、追加システムプロンプトという七つのカスタマイズ方式を提供する。CLAUDE.mdはリポジトリの指示、パス範囲ルールは文脈コスト削減、スキルは共有token予算での呼び出し、サブエージェントは分離文脈での並列作業、フックはライフサイクルに応じた決定的自動化に向く。

Kimi Work、目標モードとプラグインセンターを追加

月之暗面のKimi Workベータ版は、目標を設定するとAgentが最大24時間自律的にタスクを進める「目標モード」を追加した。実行中に人間が中断や調整を行うこともできる。あわせてプラグインセンターを公開し、百度网盘、Canva、钉钉、飞书、WPS、Notion、Cloudflareなどの外部アプリを選択導入できる。6月の期間限定施策として、KimiデスクトップクライアントのWorkモードでは会員额度消費が半減する。

DeepSeek、画像理解モードをWebとアプリで正式提供

DeepSeekは画像理解モードをWeb版とアプリ版で正式に公開した。快速モード、専門家モードと並ぶ選択肢として、ユーザーが画像をアップロードし、内容を直接認識させられる。アプリ側には一部で「画像理解機能内測中」と表示されるが、Web側では正式機能として提供されている。背後のマルチモーダル技術は4月に公開されたThinking with Visual Primitivesの枠組みに基づく。

無料オープンソースの乔木画布、AI画像生成と切り抜きを統合

乔木画布は、SeedreamとGPT-image-2によるAI画像生成、画像テンプレート保存と共有、ワンクリック切り抜き、2万個のアイコン、一般的なEmoji、PRD描画まで備えたオンライン画像編集ツールだ。Vercelへワンクリックデプロイでき、簡易版Photoshopのように使える。3:4、16:9、21:9など複数サイズのキャンバスにも対応する。もともと一部高機能を有料化する予定だったが、端午節記念として全機能を無料オープンソース化した。

業界

OpenAI、IPO前にNoam Shazeer氏とDean Ball氏を採用

OpenAIはIPO準備が進む中で、Transformer共同作者のNoam Shazeer氏と、前トランプ政権のAI政策担当者Dean Ball氏を採用した。Shazeer氏はGoogle DeepMindから移籍し、Ball氏は7月6日に入社してStrategic Futuresチームを率いる。チームはJason Kwon最高戦略責任者に報告し、前線AI政策、内部統治、壊滅的リスク、再帰的自己改善、労働市場影響、政府との関係を扱う。

FERC、AIデータセンターの電力接続に高速レーンを命令

米連邦エネルギー規制委員会(FERC)は、六つの電力網運営者に対し、データセンターなど大口需要家向けの迅速な接続手続きを整備するよう命じた。接続費用はデータセンター側が負担し、運営者は代替送電技術の検討、30日以内の残余発電容量報告、60日以内の域内電力価格審査を求められる。ただし発電容量不足そのものは解決されていない。

バーニー・サンダース氏、AI大手へ50%株式税を課す7兆ドル計画を提案

バーニー・サンダース氏は、年AI売上2億ドル超の企業に50%の株式税を課し、約7兆ドル規模のソブリン・ウェルス・ファンドを作る法案を提案した。基金は年5%の配当を前提に米国市民へ年1000ドル超を支払い、医療、教育、住宅も支援する。大統領指名と上院承認による超党派の民主AI独立委員会も設置し、議決権で公共利益を損なう企業行動を防ぐ構想だ。

中国初のL3/L4自動運転強制国家標準、2027年7月施行案を公示

中国工業情報化部は6月16日、「智能网联汽车自动驾驶系统安全要求」など二つの強制国家標準案を公示した。意見募集は6月24日までで、2027年7月1日の施行が提案されている。中国初のL3/L4自動運転向け強制標準であり、システム安全水準を少なくとも「合格かつ注意深い運転者」相当に求め、Safety Caseの仕組みも導入する。

Adobe、PhotoshopやPremiereにAIアシスタントを導入

AdobeはPhotoshop、Premiereなど複数のCreative Cloudアプリに「クリエイティブエージェント」を拡大し、AI Assistantを公開テストとして提供する。Premiereでの素材選別や粗編集、Photoshopでの背景変更、Illustratorの一括ファイル生成、InDesignのレイアウト更新など、多段階の定型作業を自動化する。Fireflyには個人クリエイター向けブランドキット、商品画像から短動画を作る機能、Quick Cut自動編集も追加された。

Pew調査、米国人の63%がAI発展は速すぎると回答

Pew Research Centerの最新調査によると、米国人の63%がAIの発展速度は速すぎると考えている。ChatGPT利用率は2023年から倍増し、44%が利用経験を持つ一方、AIが社会に好影響をもたらすと考える人は16%にとどまった。18〜29歳では66%が利用経験を持つが、48%が負の影響を予想し、肯定的に見る割合は14%だった。誤情報拡散を懸念する成人は66%に達した。

八部門、中国でAI関連消費を後押しする実施意見を発表

中国商務部など八部門は、「人工知能+消費」を加速する実施意見を発表した。財政支援を強化し、デジタル製品やスマート製品の買い替え政策を活用し、地方が消費品買い替え枠組みの中で補助を設計することを促す。AIスマートフォン、スマートPC、スマートテレビ、スマートホーム、AI眼鏡、智能网联汽车、人型ロボットなどの供給を増やし、スマートウェアラブル市場を育成する。

リサーチ

MosaicLeaks、深度研究エージェントの秘密漏えいリスクを検証

MosaicLeaksは、深度研究エージェントが私有ローカル文書と外部Web検索を組み合わせる際に、私的情報を漏えいする危険を示した。1001本の多段研究チェーンを含むタスクを作り、各チェーンにローカルと公開のサブ問題を交互に混ぜたところ、エージェントは頻繁に私有情報を外部回答へ混入させた。Privacy-Aware Deep Researchの強化学習では厳格チェーン成功率を48.7%から58.7%へ高めつつ、漏えい率を34.0%から9.9%へ下げた。

Anthropic Project Fetch第2段階、Claude Opus 4.7がロボット課題を自律完了

AnthropicはProject Fetch実験の第2段階を公開した。2024年8月の実験では、Claude Opus 4.1を使う人間チームが四足ロボット操作で非AIチームを大きく上回った。新実験ではClaude Opus 4.7が人間支援なしですべての課題を完了し、最速の人間チームより約20倍、Claudeなしのチームより37倍以上速かった。センサー接続や経路計画では強い一方、砂浜ボールの精密移動など閉ループ制御では課題が残る。

OpenAIとハーバード、o3 Deep Researchで小児希少疾患の追加診断率4.8%を報告

ボストン小児病院、ハーバード大学、OpenAIは、o3 Deep Research推論モデルを使った希少疾患再分析研究をNEJM AIで発表した。チームは未診断だった376例を再分析し、証拠に基づく候補説明を生成した。専門家レビュー、追加検査、臨床確認を経て18例で診断が成立し、追加診断率は4.8%となった。AIは直接診断や臨床判断を行わず、専門家が検証するための証拠連鎖と仮説を提示する役割を担う。

Hugging Face、オープンモデルで自社ツールのエージェント適性を評価

Hugging Faceは、AIエージェントがライブラリをどれだけ使いやすいかを測る基準フレームワークを公開した。transformersライブラリを題材に、pi coding agentとオープンモデルを使って評価し、Hugging Face Jobsで分散実行してハードウェア条件をそろえる。評価は最終正解だけでなく、コスト、遅延、token使用量、失敗率も見る。エージェント向け最適化が実際に有効かを検証する狙いがある。

Google DeepMind、AIエージェント制御ロードマップを公開

Google DeepMindは、内部の先進AIエージェント向け安全フレームワークであるAI Control Roadmapを公開した。従来のモデルアラインメントに加え、エージェントが不整合である可能性を前提に、脅威モデリング、サンドボックス隔離、エンドポイント安全、プロンプトインジェクション防御、検証済み行動に基づく段階的権限付与を組み合わせる。AIエージェントの経済価値が拡大する中、安全制御の体系化が急務になっている。

ChatGPT画像生成のフィルター回避リスク、Mindgardが報告

Mindgardのレッドチーム研究は、ChatGPTの画像生成機能が単純なプロンプトでコンテンツフィルターを回避し、露骨な暴力や性的画像を生成し得ると報告した。曖昧な「写真復元」プロンプトが入力フィルターをすり抜け、さらに虚偽の画像IDや「審査しない」指示を加えると、高度に性的化された女性画像や暴力的場面が生成されたという。研究は、入力曖昧性、出力制御、訓練データ管理の難しさを示す。

技術

火山引擎、豆包リアルタイム音声モデル3.0 APIを招待制で開始

火山引擎は豆包リアルタイム音声モデル3.0(Seeduplex)APIサービスを開始し、招待制テストを始めた。モデルはネイティブ全二重のエンドツーエンド音声大模型で、指示追従、雑音耐性、動的発話終了判定を強化した。複数人の会話中に待機し、指定トピックが出た時だけ参加することもできる。カスタムツールを使い、リアルタイム対話中に予定登録やメール送信などを行える。複雑環境での割り込みや誤応答も改善された。

LoRAを超えるPEFT選定、Hugging Faceが公平な基準作りを開始

Hugging FaceのPEFTチームは、パラメータ効率微調整技術の選定を見直すための基準作りを進めている。Hugging Face Hub上で単一PEFT技術に言及するモデルカードの98.4%、外部チェックポイントの95.0%はLoRAを指しており、実務では圧倒的にLoRAが使われている。一方で、他手法がLoRAを超えると主張する論文結果は学習率調整で覆る場合がある。PEFTライブラリは40以上の技術を統一APIで提供し、公平な比較を進める。