AI Daily Digest — 2026年6月16日

本日のAI業界注目ニュースを 17件 厳選してお届けします。

TOP 3

モデル

MiniMax、M3モデル重みとMSA技術論文をオープンソース公開

MiniMaxは、総パラメータ428B、アクティブパラメータ23BのM3モデル重みをオープンソース公開し、同時にMSA(MiniMax Sparse Attention)技術論文を発表した。MSAは長文コンテキスト計算のコストを大きく下げる設計で、M3は事前学習段階からテキストや画像などのマルチモーダル交互混合学習を行った初のオープンモデルだとしている。公開から2週間で、Artificial Analysis総合知能指数とGDPval-AAでオープンモデル首位、Code Arena WebDevでパレート最適系列入り、Vals.AIで中国産モデル首位を獲得した。出力速度は約30 TPSから約80 TPSに改善し、さらに30〜40%の高速化を計画している。

DFlashとSpec V2、次世代投機的デコードを発表

Z Lab、Modal、SGLangの各チームは、DFlash投機的デコードモデルと、SGLangの標準エンジンとなるSpec V2を発表した。DFlashはブロック拡散とKV注入を用いて、まとまったdraft tokenを並列生成する。Qwen 3.5 397B-A17B(BF16)のHumanEvalデータセットで、同時実行数1の場合にスループットがベースライン比4.3倍に達したという。大規模モデル推論の遅延削減に向け、投機的デコードをより実運用しやすくする動きとして注目される。

プロダクト

Flash-KMeans、GPU上でFAISS比200倍超の高速化を実現

UC BerkeleyとUT Austinのチームは、Apache 2.0ライセンスのFlash-KMeansを公開した。標準的なLloyd法による厳密なk-meansを、数学的な近似ではなくGPUデータフローの再構成で高速化する実装で、`pip install flash-kmeans` から利用できる。NVIDIA H200ではエンドツーエンドで最良ベースライン比17.9倍、cuML比33倍、FAISS比200倍超の速度を示した。FlashAssignカーネルは完全なN×K距離行列の物体化を避け、IO複雑度をO(NK)からO(Nd+Kd)へ下げる。Sort-Inverse UpdateカーネルはクラスタIDのソートでアトミック競合を抑え、大規模クラスタリングの実用性を高める。

Grok Build、複数のコーディングセッションを管理するAgent Dashboardを公開

xAIはGrok Build向けにAgent Dashboardを公開した。複数のコーディングセッションを単一画面で管理でき、待機中、作業中、アイドルなどの状態ごとにグループ化して表示する。各行には状態、名前、ブランチ、権限モード、現在の操作が示され、選択したセッションはpeekパネルで最新出力を確認し、その場で返信できる。待機中セッションは矢印キーや数字キーで選択でき、下部入力欄から新規セッションの割り当て、モデル指定、計画モード起動、自動編集承認の設定が可能。`grok dashboard`、`/dashboard`、`Ctrl+` で開け、閉じてもセッションは継続する。

Meta、Facebookに公開情報を要約するAI Modeを導入

MetaはFacebookに「AI Mode」検索機能を導入した。Meta AIが公開投稿、グループ、Reelsなどから情報を抽出して回答を合成し、ユーザーは自然言語で質問して要約を得られる。あわせて動画コラージュ、トランジション効果、服装や髪型、アクセサリーを変更できるAI写真プリセットも追加した。スポーツファンはStories上の「AI Edit」から仮想的にチームユニフォームを着用できる。Marketplace自動返信やクリエイターAIアシスタントに続き、Facebook本体の検索体験にも生成AIを組み込む動きが進んでいる。

Kimi K2.7 Code高速版、5〜6倍速の出力で提供開始

月之暗面は、Kimi K2.7 Code高速版を公開した。通常版と同一モデルながら、出力速度は約5〜6倍で、一般的なコーディング場面では約180 Token/s、短いコンテキストでは最大260 Token/sに達する。API価格は通常版の2倍で、モデルIDは `kimi-k2.7-code-highspeed`。Kimi Code Planユーザーは先行体験計画から利用でき、利用量は通常版の3倍として消費される。思考モードを有効にする必要があり、無効の場合はエラーまたはK2.6へのフォールバックが起きる。長文コンテキストの指示追従や長期タスク性能を改善し、平均token消費も30%削減したとしている。

OpenRouter、gpt-oss-20bとGemma 4 26Bの無料枠を追加

OpenRouterは、Eigen LabsのDarkbloom提供による無料容量として、gpt-oss-20bとGemma 4 26Bを追加した。開発者はOpenRouter経由でこれらのモデルを試せるようになり、軽量な検証やプロトタイプでの選択肢が広がる。モデルルーティング基盤に無料枠が追加されることで、複数モデルの比較やコストを抑えた初期実験がしやすくなる。

GitHub、多言語AI研究を支援する新オープンデータセットを公開

GitHubは、CC0-1.0ライセンスでリポジトリ単位のデータセットを公開した。README、issue、pull requestなど、多言語の開発者コンテンツを含み、研究者や開発者が言語をまたいだ技術文書やコミュニティ議論を発見、活用できるようにする。多言語AIの構築や評価では、実際の開発現場に近い文脈を持つデータが重要であり、今回の公開はコード補助や技術QA、ドキュメント理解の改善につながる可能性がある。

Claude Code v2.1.178、権限ルールと技能読み込みを改善

AnthropicはClaude Code v2.1.178を公開した。権限ルールでツール入力パラメータを照合する `Tool(param:value)` 構文が追加され、入れ子の `skills` ディレクトリは自動読み込みされる。名称衝突時は `<dir>:<name>` 形式で保持され、`agent`、`workflow`、`output-style` の衝突では最も近いディレクトリが優先される。自動モードではサブエージェント生成前の分類器評価が改善され、`/doctor` はフラットなツリー表示になった。CLIのWebSocket/OAuthファイル記述子継承によるクラッシュ、ChromeのOAuth tokenアカウント不一致、サブエージェント転写表示、バックグラウンド復帰時の再起動挙動なども修正された。

業界

Salesforce、AI客服プラットフォームFinを36億ドルで買収へ

Salesforceは、AI客服プラットフォームFinを36億ドルで買収すると発表した。FinはIntercomから生まれたサービスで、リアルタイムチャット、WhatsApp、SMS、電話、Slackなど複数チャネルで顧客の問題解決を支援するAIエージェントを提供する。SalesforceはFinの技術とチームを取り込み、企業が独自のAIエージェントを構築して業務を自動化するAgentforceプラットフォームを強化する計画だ。取引はSalesforceの2027年度第4四半期、つまり2027年初頭に完了する見通しで、Fin共同創業者兼CEOのEoghan McCabe氏はCEOを継続し、研究開発責任者のDes氏も同部門を率いる。

Nvidia、AI債務ブームに加わり200億ドル規模の社債発行へ

Nvidiaは、2021年以来となる社債発行で少なくとも200億ドルを調達する計画だと報じられた。AIインフラ需要の拡大を背景に、関連企業が大型の資金調達や債務調達を進める流れが強まっている。半導体、データセンター、電力、ネットワークなどAI基盤投資の規模が膨らむ中、Nvidia自身も資本市場を活用して成長投資を支える局面に入っている。

Cloudflare、Ensemble AIチームを迎えAI基盤開発を加速

Cloudflareは、AIインフラ研究開発を加速するため、Ensemble AIの主要メンバーが同社に加わると発表した。Ensembleはモデル圧縮と高効率推論を専門とし、Transformerの標準線形層を置き換えながら多次元の活性化構造を保つNdLinearや、大規模モデル微調整の訓練可能パラメータを減らすNdLinear-LoRAを開発してきた。これらは量子化などの手法と補完関係にあり、大規模言語モデルやマルチモーダルアーキテクチャのメモリ、計算、デプロイコスト削減を狙う。Cloudflareは成果をWorkers AIに統合し、グローバルネットワークとserverless GPU推論サービスの効率を高める。

xAI、GrokをWarpターミナル開発環境に統合

xAIは、約100万人の開発者が利用するターミナルベースのエージェント開発環境Warpとの統合を発表した。ユーザーはGrokまたはX Premiumのサブスクリプションを通じて、Warp内でGrokモデルにアクセスできる。Grok Build CLIを駆動する `grok-build-0.1` モデルも対象で、Warpをダウンロードし、Agent設定ページでSuperGrokサブスクリプションを接続し、モデルを切り替えることで利用できる。今後さらに多くのエージェントや統合が追加される予定だ。

技術

Skydio CEO、シリコンバレーはドローン利用に過度な線引きをすべきでないと主張

米国最大のドローンメーカーSkydioのAdam Bry CEOは、ドローン利用をめぐってシリコンバレーが過度な線引きをすべきではないと述べた。Skydioは公共安全、軍事、エネルギー、インフラ点検など企業市場を主力とする。トランプ政権が昨年末に中国製ドローンを禁止した後、低価格の消費者向けドローンはほぼ消え、Skydio製品が主要な代替案になったという。同社はドローンを単なる道具ではなく、自律インフラへ移行する存在と見ており、格納庫、遠隔操作、ソフトウェア統合を通じた大規模運用でAIが重要な役割を担うとしている。

AIによる人員削減の波、社会的な火種に

TechCrunchは、AIを理由にした人員削減の波が社会的な火種になりつつあると報じた。今年のテック企業の人員削減は累計約15万人、1日平均974人に達し、速度は昨年より44%速い。先月は約4万人が削減され、2年ぶりの高水準となった。AIは3カ月連続で人員削減の主要理由に挙げられている。Blockでは従業員の約半数が削減されたが、Jack Dorsey CEOはAIが根本原因ではないと否定した。AIチップ企業Cerebrasの上場初日評価額、SpaceX、Anthropic、OpenAIの高評価額と、大規模解雇の同時進行が、生活コストや中間層不安と結びついて政治的な論点になっている。

AIアプリ黄金時代、Fable停止とNadella氏の護城河論が示す転換点

Tomer Tunguz氏は、AIアプリケーションの黄金時代が始まったと論じた。米政府によるAnthropicのFableアクセス停止は、開源モデルやローカルモデルを必須の選択肢にし、Satya Nadella氏の主張はAIエコシステムの護城河が人間の専門知識とモデル周辺システムにあることを示す。さらにSalesforceによるFin買収は、開源モデルを活用した高コスト効率のAIアプリが企業価値を生むことを裏付ける。今後の難所は、Kimi K2.6、Qwen 3.6 27B、GLM 5.1など異なる特性を持つモデル選択、エージェントシステムのhill-climbingループ設計、モデルとループの継続評価によるtoken予算内の知能最大化だとしている。

GitHub Copilot CLI入門、主要スラッシュコマンドを解説

GitHubは、GitHub Copilot CLIの初心者向けガイドを公開し、よく使うスラッシュコマンドの概要を紹介した。ターミナル内のAIエージェントをコマンドで操作するための基本を整理し、開発者がCLI上での対話、作業指示、状態確認を始めやすくする。AIコーディング支援がエディタ内補完から端末上のエージェント操作へ広がる中、CLIワークフローの学習コストを下げるための導入資料として位置づけられる。