AI Daily Digest — 2026年6月13日

本日のAI業界注目ニュースを 19件 厳選してお届けします。

TOP 3

モデル

MiniMax、開源重みモデルM3をHugging Faceで公開

MiniMaxは、約428B総パラメータ、23B有効パラメータの開源重みモデルM3をHugging Faceに公開した。コーディングとエージェント能力ではSWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8%、MCP Atlas 74.2%を示す。MiniMaxの疎注意機構により100万トークンの文脈窓を備え、ネイティブマルチモーダルにも対応する。MiniMax CodeツールとAPIプラットフォームにも同時に展開され、重みと技術報告は約10日後に公開予定とされた。

Kimi、最新コードモデルKimi-K2.7-Codeを公開

Kimiは、最新のコード向けモデルKimi-K2.7-Codeを公開し、開源化した。K2.6と比べ、Kimi Code Bench v2で21.8ポイント、Program Benchで11.0ポイント、MLS Bench Liteで31.5ポイント向上したという。推論効率も改善され、推論トークン使用量は30%低下し、長時間のコーディングタスクで指示追従とエンドツーエンド成功率を高めた。6倍高速モードも予告されており、Kimi APIとKimi Codeから利用できる。

プロダクト

Apple、iOS 27のヘルスケアAppをカード型UIへ刷新

AppleはiOS 27でヘルスケアAppを更新し、従来のリスト中心の画面をカード型レイアウトへ変更する。視覚インテリジェンスを使った栄養識別では、対応iPhoneで食品を撮影すると加工度、タンパク質量、糖分、栄養価の目安を確認できる。周期記録は更年期周辺の変化にも対応し、長期的な異常傾向の分析や通知を行う。Fitness+には更年期関連のコースが追加され、GymKitはApple WatchなしでiPhoneから機器連携できるようになる。

olmo-eval、モデル開発ループ向け評価ワークベンチを公開

Allen AIは、LLMの継続開発で繰り返し評価を行うためのワークベンチolmo-evalを紹介した。OLMES標準を土台にしつつ、新しい評価を追加する実装負荷を下げ、エージェント型評価や多ターン評価を一級のユースケースとして扱う。軽量な直接実行とコンテナ隔離実行を選べ、モデル、ツール、補助モデル、実行環境を独立に差し替えられる。スコアだけでなく標準誤差と最小検出可能効果も報告し、開発中の改善とノイズを見分けやすくする。

豆包、定時実行やファイル生成に対応するタスクモードを展開

ByteDance傘下の豆包は、AIアプリ内に「タスクモード」を大規模展開した。定時実行、ノーコードWebページ生成、ワンクリックPPT生成、データ可視化分析など、エージェント型の実行機能をまとめて提供する。従来の「思考モード」は「専門家モード」へ更新され、豆包大模型2.0 Proを呼び出す。基本機能は無料で、高度なサービスには複数段階の有料プランを用意し、消費者向けAIアプリでも実行型エージェントが前面に出始めている。

OpenAI Codex、速率リセットを後で使える保存機能を導入

OpenAIはCodexで、ユーザーが速率制限のリセットを都合のよいタイミングまで保存できる機能を開始した。Go、Plus、Pro、Business利用者から展開し、各ユーザーに1回分の無料リセットを提供する。長時間の開発作業や集中して進めたい時間帯に合わせて利用枠を調整できるようにし、AIコーディング環境の運用性を高める更新だ。

Codex、Chromeと内蔵ブラウザ向け開発者モードを導入

OpenAI Developersは、ChromeとCodex内蔵ブラウザに開発者モードを導入したと発表した。CodexはChrome DevTools Protocolを使い、JavaScript性能、コンソール出力、ネットワーク通信、ページ状態を解析できる。Webアプリの不具合調査やブラウザ上の状態確認を、コード編集だけでなく実行環境の観察まで含めて進められるようにする機能だ。

Claude Code v2.1.175、利用可能モデル制御を強化

Claude Code v2.1.175では、管理設定`enforceAvailableModels`が追加された。この設定を有効にすると、利用可能モデルの許可リストが既定モデルにも適用され、既定モデルが禁止対象に解決される場合は最初の許可モデルへ自動的に戻る。ユーザー設定やプロジェクト設定で管理側の許可リストを広げられないため、企業やチームのモデル利用統制を強める更新になる。

Claude Code v2.1.174、モデル選択と環境継承の不具合を修正

Claude Code v2.1.174は、全画面時のマウスホイール加速を無効にする設定を追加し、モデル選択や表示に関する複数の不具合を修正した。OpusとSonnetの表示区分、固定Sonnet版のラベル、企業アカウントの不要なクレジット表示、Bedrock GovCloudのリージョン処理、バックグラウンドセッションの環境変数継承、終了時の遅延、共同著作者名などが対象になっている。日常運用での細かな摩擦を減らす保守更新だ。

Claude Code v2.1.176、会話タイトル生成と接続安定性を改善

Claude Code v2.1.176では、会話タイトルが対話言語に合わせて生成されるようになり、フッターリンクを正規表現で検出する設定も追加された。Bedrock資格情報キャッシュを最適化し、環境変数によるモデル制限回避、`/fast`での禁止モデル選択、autoモードの退化、パスhook条件、Linuxサンドボックス内のシンボリックリンク起動、tmux内SSHクリップボード、Remote Control接続などの問題も修正している。

業界

TCSとAnthropic、規制産業へのClaude導入で提携

Anthropicは、タタ・コンサルタンシー・サービシズ(TCS)との提携を発表した。TCSは56か国の5万人の従業員にClaudeを提供し、金融、医療など規制産業の顧客向けにClaudeベースの製品を構築する。自社内でもエンジニアリング、財務、法務、マーケティング、営業でClaudeを使い、専任チームが顧客向けの設計と運用を担う。大手ITサービス企業を通じて、生成AIが厳格な業界システムへ入り込む動きが進んでいる。

リサーチ

Google Research、AIが皮膚症状理解を支援する研究を発表

Google Researchは、一般ユーザーが自身の皮膚問題を理解する際にAIがどう役立つかを調べた研究を紹介した。JAMA Dermatologyに掲載された2件の研究では、AI支援が皮膚疾患名の識別能力を高め、受診やセルフケアの次の判断にも影響することが示された。医師との会話とAIツールの利用を比較する混合手法の研究も行われ、SCINデータセットと鑑別診断モデルを基盤に、皮膚健康に関する情報アクセスを改善する可能性を検証している。

技術

Oran Ge、人間味を残す文章改稿Skillを公開

Oran Ge氏は、Claude Fable 5で文章を何度も磨くと整っていく一方で「人間味」が薄れるという観察から、「人味儿写作心法.skill」を公開した。人間が書いた文章には、具体的な場所や経験に基づく存在感があり、AIはそこをそのまま再現しにくいという考えに基づく。自分で書いた文章や口述をAIに改稿させる際、人間らしい質感を残すための技能として提供されている。

小互、公众号自動排版Skill群を開源

小互氏は、公众号向けの自動排版Skill群を公開した。文章リンクや文書位置をClaude Code、Codex、OpenClawなどに渡すだけで、排版、カバー生成、公众号草稿箱への送信までを一文で進められる。20種類のテーマ色を選べ、非Markdownファイルも扱える。AIエージェントがコンテンツ制作の最終整形や配信準備まで担うワークフローの一例だ。

qiaomu-ai-prd、AIエージェント向けPRD生成プロンプトを公開

Vista氏は、AIエージェント開発では人間とAIが必要とするPRDの形が異なるとして、AI向けのPRD生成プロンプト`qiaomu-ai-prd`を公開した。開発者はこのプロンプトで仕様文書を作り、その後AIに実装を任せることで、機能の完全性と豊かさを高めやすくなるという。エージェントが実装しやすい仕様を先に整える発想が広がっている。

Spec駆動開発、仕様から検証までを3つのSkillで接続

邵猛氏は、Spec Driven Developmentを3つのSkillで実践する方法を共有した。`write-product-spec`、`write-tech-spec`、`validate-changes-match-specs`により、製品仕様、技術仕様、実装、仕様整合性検証、コンピュータ操作によるエンドツーエンド確認までを閉ループにする。仕様は`PRODUCT.md`と`TECH.md`に分けてPRへ含める構成で、AIエージェントによる開発に検収可能な土台を与える。

Anthropic、米国人のAI期待と懸念に関する大規模調査を公開

Anthropicは、約5万2,000人の米国人を対象にした初の公開意識調査を発表した。回答者の48%は癌などの疾病治癒をAIへの最優先期待に挙げ、36%は障害のある人への支援を望んだ。一方で64%が失業、56%が認知依存、52%が誤情報を懸念し、70%超が政府規制を支持した。プライバシー、児童安全、責任帰属が主要な関心で、AI企業への信頼は限定的だった。

OpenAI、仕事でAIを活用するAcademy新講座を公開

OpenAIは、実用的なAIスキル、再利用可能なワークフロー作成、日常業務でのAIエージェント活用を学ぶ3つのAcademy講座を公開した。AIツールの導入が個別のプロンプト利用から、職場の反復可能な手順やエージェント運用へ移る中、利用者教育を体系化する狙いがある。

OpenRouter、最低コストでLLM推論を使う方法を解説

OpenRouterは、LLM推論コストを抑えるための実践方法を紹介した。モデル名に`:floor`を追加して最安のプロバイダーを選ぶ方法、`max_price`で支出上限を設定する方法、無料利用可能なモデルを活用する方法を挙げている。同時に、プロバイダーや課金条件の違いによる想定外の費用にも注意が必要だとしている。