GoogleのAIフレームワークAlphaProof Nexus、56年間未解決だった数学問題2問を解決
AI HOT日報の掲載内容は、GoogleのAIフレームワークAlphaProof Nexusが56年間未解決だった数学問題2問を解決したという見出しと出典リンクであり、概要本文は記載されていない。
本日のAI業界注目ニュースを 23件 厳選してお届けします。
AI HOT日報の掲載内容は、GoogleのAIフレームワークAlphaProof Nexusが56年間未解決だった数学問題2問を解決したという見出しと出典リンクであり、概要本文は記載されていない。
面壁智能は新世代の端末向け大規模言語モデルMiniCPM5-1Bをオープンソース公開した。パラメータ数は1Bにとどまりながら、AA-Indexでは2B未満のすべてのモデルを上回り、3カ月前のQwen3.5-2Bより少ないパラメータで優れた性能を示す。INT4量子化後の重みはわずか0.5GBで、スマートフォンやブラウザ上で実行できる。Base Model版は同社独自のAI訓練フレームワークForgeTrainで事前学習され、モデル重み、訓練データセット、デプロイ手法が全面公開された。
Tencent Hunyuanは翻訳モデルHy-MT2を発表した。Hugging Faceのオープンモデル・トレンドランキングでは、1.8B版が1位、30B-A3B(MoE)版が4位となり、ダウンロード数は7,000件を超えた。同社は同モデルを基盤とするWeChatミニプログラム「腾讯混译」も公開し、音声入力、オフライン翻訳、翻訳スタイルや指示のカスタマイズに対応する。モデルのコードと重みも公開されている。
Qwen3.7-MaxはCode Arenaで1541点を獲得し、Claudeに次ぐ世界第2位のAIコーディングモデルとなった。生産環境向けに設計され、35時間のタスク実行、1,000回超のツール呼び出しに対応し、通常なら2週間かかるプロジェクトを数時間で納品できるとしている。
XiaomiはMiMo-V2.5シリーズのAPI料金を恒久的に引き下げ、最大値下げ幅は99%に達した。MiMo 2.5 ProはDeepSeek V4 Proと同価格になり、tokenパッケージも更新され、同じ価格で利用できるtoken量が5倍から8倍に増える。既存ユーザーのパッケージ枠は全額リセットされる。値下げはMiMoの推論スタック全体の最適化とサービス効率向上によるもので、新料金は5月26日に発効し、MiMo-V2.5-TTSは期間限定で無料提供される。
Claude Codeは、コード記述中の脆弱性の発見と修正を支援するセキュリティガイダンス・プラグインを公開した。すべてのClaude Codeユーザーが利用でき、プラグインマーケットプレイスからインストールできる。
Replitはアプリにログインを追加する方法として、設定不要で利用者がReplitアカウントによりサインインするReplit Authと、独自ブランドのログイン画面を開発環境・本番環境の双方で単一のプロンプトにより導入できるClerk Authを案内した。詳細な文書と動画も公開されている。
Wonder Project創業者兼最高クリエイティブ責任者であり、Innovative Dreams最高経営責任者、Amazon Primeの人気ドラマ『House of David』の制作者でもあるJon Erwin氏は、Kling AIが同作のシーズン1と2を支える中心的技術だったと述べた。完成したドラマ作品でAI生成シーンを初めて利用したこと、ネイティブ4Kモデルを初めて採用したことなど、複数の業界初を実現したという。また、モーション制御によりAI生成でも俳優の本物の感情や感覚を保てたとしている。
AnthropicのエンジニアSholto Douglas氏によれば、Claude Mythosは週末の間にOpenAIが提示したErdosの単位距離予想の問題を解決し、「巧妙で簡潔な証明」を提示したという。この成果は、数学的発見においてAIが著しく先行しつつある兆候として報じられている。
SynthIDはすでに1,000億件を超えるコンテンツへ透かしを付与しているが、透明性の確保には業界の協力が必要だとしている。Google DeepMindはOpenAI、ElevenLabs、Kakaoと協力し、各社のモデルへSynthIDの透かし技術を統合する。この取り組みはNVIDIAと進めてきた業界全体の流れをさらに拡大するものだという。
OpenRouterはCapitalGが主導するシリーズBで1億1300万ドルの資金調達を完了したと発表した。AIが実験段階から急速に本番利用へ移る中、同社の週間処理量は過去6カ月で5兆tokenから25兆tokenへ増加した。
Anthropicは、ソウルに開設予定のオフィスを支援するため、KiYoung Choi氏を韓国代表理事に任命した。Anthropic Economic Indexによれば、韓国はClaude.aiの世界で最も活発な市場の一つで、人口規模から想定される利用率の3.5倍を記録し、主に技術分野とクリエイティブ分野で使われている。Choi氏はSnowflake韓国法人のゼネラルマネージャーを務めたほか、Google CloudやAdobeなどで30年以上の技術業界リーダー経験を持つ。韓国で市場戦略を率い、Law&CompanyやSK Telecomなど、Claudeで製品を構築する現地企業とスタートアップを支援する。
Qwen Conference 2026で、Alibaba CloudのCTO兼国際事業総裁である李飛飛博士は、クラウドネイティブからエージェントネイティブへの転換について説明した。AIを広く普及させるため、同社はモデル、エージェントクラウド、ツールとサービス、スケールという4つの基盤を構築しているという。
Microsoft Research Asiaは、AIが人間の価値観の現実的な複雑さを理解できるかを探る、新たなグローバルAI価値観チャレンジを開始した。哲学、倫理学、法学、社会科学分野の研究者に参加を呼びかけている。
チームは大規模MoEモデルのエージェント強化学習を安定化させるKPopを発表した。KPopは、従来のIcePop手法で用いられていた固定比率マスキングを、二項KLダイバージェンスに基づく適応的マスキング機構へ置き換え、学習時と推論時の不一致度合いに応じて動的に調整する。この改善によりRing-2.6-1Tは、基盤設備の変更やルーティング再生を必要とせず、純粋なRL訓練のみでSWE-bench Verifiedにおいて76点超を達成した。
GoogleおよびAlphabetのCEOであるSundar Pichai氏はGoogle I/O後のインタビューで、ChatGPTに対応するために実施した戦略再編と経営陣の調整を振り返った。対談では、新しいGeminiモデルと製品への統合、とりわけ検索を結果提示からタスク開始へ変える新しいスマート検索ボックスとGemini Sparkエージェント基盤に焦点が当てられた。Pichai氏は、こうした変化がオープンウェブへ与え続ける影響や、Googleからウェブサイトへの流入がゼロになり得るという「Google Zero」の概念に応答し、動画の検索と索引のあり方を変えるためYouTube動画をモデル学習に利用していることにも言及した。日報ページに表示された概要は、この先が省略されている。
Peter氏は、AIエージェントのスキルプロンプトを診断し最適化するskill-cleanerをオープンソース公開した。ツールはスキルプロンプトの予算監査、重複スキル検出、未使用スキルの確認、スキルルートディレクトリ監査、説明の簡潔化という5つの主要機能を備える。標準的なtoken予算計算ロジックにより、冗長な説明がtoken予算とコンテキストウィンドウを圧迫するのを抑える狙いがある。利用例では、90語超のスキル説明を40語未満に短縮すると、エージェントのスキル選択精度が向上したという。
GoogleはマルチモーダルモデルGemini Omniの動画生成機能に関する利用ガイドを公開した。同機能はGeminiアプリやGoogle Flowなどで体験できる。ガイドでは、モデルが持つ現実世界の知識を活用して簡潔に記述すること、動画内のテキスト描画と組版を精密に制御すること、パンやズームなどの専門的なカメラ指示を用いること、反復編集で効率的に動画を修正すること、生成時に登場人物の動きの速度や感情を直接調整することという5つのヒントを示す。正確なプロンプトで複雑かつ制御可能な動画を生成することが中心となる。
Ethan Mollick氏は、人間に残すべき特質とAIへ委ね得る領域を考察する新しい記事を発表した。教育やカウンセリング分野の実験、近時の文学賞を巡る論争を取り上げている。
RunwayはProject Luxoの研究を通じて、AI生成動画が「不気味の谷」を越えたと報告した。クリエイティブ業界の従事者にAI短編作品『The Rogue』や広告サンプルを提示したところ、視聴者は技術上の欠点ではなく物語そのものへ注目し始めたという。全作品は一人の制作チームによって作られ、制作期間は3週間から4時間までだった。Runwayは、技術が意識されないほど成熟し、視聴者が物語に没入する時点がAIメディア成熟の指標だとしている。
Anthropicは、利用者による誤用、モデルの異常挙動、外部攻撃を含むClaudeエージェントの展開リスクを三重の仕組みで制御している。保護策は、サンドボックス、仮想マシン、ネットワーク出口制御による実行環境の制限、システムプロンプトとモデル訓練による行動誘導、MCPサーバーや第三者プラグインなどの外部コンテンツに対する細粒度の権限管理に重点を置く。記事はClaude Code、claude.ai、Claude Coworkを例に、製品ごとに対応する隔離アーキテクチャの設計を説明している。
OpenSenseNovaは、SenseNova-U1の8B密集モデルおよびA3B MoEアーキテクチャを支える完全な訓練コードベースをオープンソース公開した。統一フレームワークで、テキストから画像の生成、画像編集、交互生成、テキストと視覚の理解など複数のマルチモーダルタスクを同時に訓練できる。大規模訓練向けに設計され、ハイブリッド並列処理、ストリーミング型で復旧可能なデータパイプライン、環境変数による構成、1台8GPUから複数ノードのクラスタまでの拡張に対応する。コードはApache-2.0ライセンスで公開されている。
この記事は、2026年5月時点におけるAI分野の動向を展望する。Gemini Flash 3.5の公開、Mythosと呼ばれる新たな製品またはプロジェクト、オープンとクローズドのエコシステム間の均衡、米国におけるオープンソース勢力の著しい伸長、そこから生じる新しい力関係を取り上げている。