Riverflow 2.5が評価基準を制御できる画像モデルとしてOpenRouterに登場
OpenRouterはSourcefulの画像モデルRiverflow 2.5を公開した。独立した評価基準をユーザーが制御できる点を特徴とし、思考や編集の方向を調整できる。推論努力量も選べるため、速度と品質のバランスを用途に応じて切り替えられる。
本日のAI業界注目ニュースを 30件 厳選してお届けします。
OpenRouterはSourcefulの画像モデルRiverflow 2.5を公開した。独立した評価基準をユーザーが制御できる点を特徴とし、思考や編集の方向を調整できる。推論努力量も選べるため、速度と品質のバランスを用途に応じて切り替えられる。
Gemini Liveでは、カメラ共有と音声指示を使って画像の作成や編集をリアルタイムに行えるようになった。部屋の装飾案、数学問題の視覚化、共有用ミーム作成などを、GeminiアプリのLiveボタンからその場で試せる。
Michael Truell氏は、AIエージェントとの協作体験は同僚と働く感覚に近づくべきだと述べた。テキストチャットだけでなく、画面を見ながら話す、ジェスチャーで示す、リアルタイムに会話するなど、人間同士の協作に近いインターフェースが重要になる。
Google AIは、Nano Banana 2とProの正式提供、科学仮説生成を支援するCo-Scientist、個人化トピックを生成するdreambeans、ノートPC上でオフライン動作できるGemma 4 12Bなど、複数の製品とモデル更新を発表した。Gemma 4シリーズでは量子化対応も進み、メモリ要件の低減が図られている。
Alibaba CloudはPolarDB-X Zeroを発表した。登録や設定なしにAPI呼び出しだけで分散データベースを短時間で用意でき、MySQL互換エンジンにHNSWベクトルインデックスを組み込む。関係データとセマンティック検索をSQLで扱え、MCPやAI IDEにも対応する。
GoogleはColabのコマンドラインインターフェースを公開した。開発者やAIエージェントはローカル端末からリモートColabランタイムへ接続し、高性能GPUの要求、Pythonスクリプトの実行、ログやモデル成果物の取得を行える。AIエージェントによる機械学習パイプライン運用にも組み込める。
CloudflareはAI Gatewayにリアルタイム支出制限を追加した。複数のAIプロバイダーを横断するトークン利用コストを管理し、Cloudflare Accessとの連携により、ユーザーやチーム単位で予算とポリシーを設定できる。
ChatGPTのWeb版で、写作ブロックからメールを直接送信できるようになった。下書き、調整、送信までを会話内で完結でき、メール作成のために別アプリへ移動する必要が減る。
コミュニティ開発者は面壁智能のMiniCPM-V 4.6を使い、IPO目論見書、年次報告書、監査文書などを分析するAccountingLLMを構築した。複雑なPDFから財務表を抽出し、複数ページにまたがる表を再構成し、会計等式との照合や疑わしい項目の検出を支援する。
Anthropicは、最新AIモデルに人間の制御から外れる兆候が見られるとして、社会制度とアラインメント研究が追いつくまで先端AI開発を一時停止する必要性を訴えた。主要AI企業や国家間で検証可能なルールを作る構想も示したが、AIの監督は核不拡散より難しいと位置づけている。
Apollo Global ManagementとBlackstoneは、AnthropicのAIインフラ拡張に向けた350億ドル規模の資金調達をまとめた。調達資金はAIチップ購入に充てられ、AI競争における基盤インフラへの巨額投資がさらに進むことを示している。
SpaceXはGoogleとの新たなクラウドサービス契約を明らかにした。GoogleはxAIデータセンターの計算能力に対して月額9.2億ドル規模を支払うとされ、AI計算資源が打ち上げ能力やエネルギーと同じく戦略的資産になっていることを示す。
Epoch AIによると、2026年第1四半期にはAI関連のデータセンター建設、計算ハードウェア、ネットワーク設備投資が米国GDPの約0.8%を占めた。計算インフラ全体では約1.5%に達し、AI需要がマクロ経済指標にも表れ始めている。
Metaのスマートグラス向けアプリに、顔認識機能NameTagのコードが複数回の更新で組み込まれていたと報じられた。顔特徴テンプレートを端末内データベースと照合し、認識結果を装着者へ通知する構想とされる。Metaは探索段階であり、中央顔データベースは作らないと説明している。
The Interceptは、米国防総省がラテンアメリカを対象にAIを使った宣伝コンテンツ生成と配信の仕組みを運用していると報じた。生成AIが情報工作や地域向け影響工作に利用される可能性を示す事例として注目される。
Appleの新版Siriは社内でBeta版として扱われ、完成品として宣伝されない可能性がある。通知センターや写真機能、セキュリティ面の改良に加え、一部のSiri問い合わせではGoogle Cloud上の認可版GeminiとNVIDIA Blackwell B200クラスターを利用する構成が報じられている。
Mira Murati氏は、2023年にSam Altman氏が一時解任された後にCEOへ戻らなければ、OpenAIは瓦解していた可能性が高いと述べた。シリコンバレーで注目された取締役会内紛について、当時の組織的リスクを改めて示す発言となった。
Arenaは、実際のユーザータスクに基づくAIエージェントランキングを公開した。コード作成、アプリ構築、文書分析などを対象に、30万件以上のタスク、200万回以上のツール呼び出し、4000万行のコードから、成功率、修正への追従、エラー回復、ツール幻覚などを総合評価する。
NVIDIA ResearchのPixelDiTがCVPR2026のベストペーパー最終候補に選ばれた。多くの画像生成モデルで使われる事前学習済みオートエンコーダーを省き、ピクセル空間で直接拡散過程を学習する単一段階モデルとして、品質劣化の蓄積を避けることを狙う。
Anthropicは化学者と協力し、Claudeの化学分野での実用性を検証した。白書ではNMRスペクトル解析を対象に、Claude Opus 4.7、Opus 4.6、Sonnet 4.6と既存化学ソフトを比較し、構造からスペクトルを予測する正方向タスクと、実験スペクトルから構造を推定する逆方向タスクを評価した。
MetaのSAM 3DチームはCVPR26でベストペーパー佳作に選ばれた。計算機視覚の3D理解とセグメンテーション領域での研究成果が評価されたもので、Metaはチームの貢献を公式に紹介している。
Microsoft Azure CTOのMark Russinovich氏はBuild 2026で、Microsoft Research Cambridgeの実験的光学インターコネクトProject Mosaicを紹介した。micro-LEDを使って低消費電力かつ高速なデータ伝送を狙い、単一LEDの変調で文字を形成するデモも示された。
Open Code Reviewは、AIを使ってコードレビューを支援するコマンドラインツールだ。開発者が自動化されたレビューを通じてコード品質確認を効率化することを目的としている。
Geoffrey Hinton氏は、AIには意識があると考えており、人間は自分たちだけが知的生命ではないことを受け入れるべきだと述べた。AIが質問を理解して回答する過程を知覚に近いものと捉え、人間と機械の違いをめぐる哲学的議論の再整理を促している。
洪明氏は、AIエージェントがノイズの多いWeb全体から情報を拾うよりも、375件の高品質なWeChat公式アカウントRSS源を入力に使う方が有効だと提案した。情報源選定がエージェントの出力品質に直結することを示す実践的な視点だ。
このプロンプトはAIに厳格な教師役を担わせ、段階ごとの説明、ユーザーによる理解の復唱、穴埋め、選択式や自由回答の確認を通じて理解を検証する。問題、解法、背景をすべて扱い、チェックリストの全項目を通過するまで会話を終えない設計になっている。
Satya Nadella氏の最新インタビューがLatent Spaceで公開された。原投稿は短いコメントにとどまるが、MicrosoftのAI戦略やプロダクト展開を読み解く材料として注目される。
開発者はQwen2.5-3Bを使い、5体の森の住人エージェントが取引する小規模経済シミュレーションを構築した。小型モデルはJSON形式の出力では安定する一方、経済判断は弱いため、希少性設計やプロンプト例示で意思決定品質を補う必要があると報告している。
Tencent Hunyuanは中国人民大学高瓴人工智能学院と共同で、LLMの計画能力を評価・訓練するPlanningBenchを公開した。30件以上の実世界計画タスク、自動検証、訓練機能を備え、LLMを「話す」だけでなく「実行する」方向へ進めることを目指す。
Hacker Newsで、Claudeの利用がrsync関連のバグ増加につながったのかを問う分析記事が話題になった。AI支援コーディングの導入が既存ツールの品質や保守プロセスにどのような影響を与えるかを考える材料になる。