# AI日报 - 2026年02月14日

## 今日要点
- 🧪 OpenAI 发布论文预印本：GPT‑5.2 参与推导理论物理新结果（散射振幅/半共线动力学区间）
- 🧠 Google 发布 Gemini 3 Deep Think 重大升级：面向科研、工程的“专用推理模式”并开放 API 早期访问
- 💰 Anthropic 宣布完成 300 亿美元 Series G 融资，投后估值 3800 亿美元，并披露 Claude Code 增长数据
- 📄 一项最新研究质疑仓库级上下文文件（AGENTS.md）对 Coding Agent 的帮助：成功率下降且成本上升
- 🛡️ 中文社区讨论 Agent 安全与内容治理：OpenClaw 暴露实例风险、小红书要求 AI 合成内容强制标识

## 详细内容

### 🔥 热门产品与平台动态

#### 1) OpenAI：GPT‑5.2 参与推导理论物理新结果（预印本）
**来源**: [OpenAI Index](https://openai.com/index/new-result-theoretical-physics/)

OpenAI 发布预印本《Single-minus gluon tree amplitudes are nonzero》（arXiv:2602.12176），讨论“单负螺旋度胶子树级散射振幅”在特定半共线（half-collinear）动力学切片下不为零。

文中披露 GPT‑5.2 Pro 先从 n≤6 的复杂表达式中归纳出模式并猜测通式，随后“内部脚手架版”模型在约 12 小时推理中给出同一公式并形成证明框架；作者再用 Berends–Giele 递推、soft theorem 等做一致性检验。

**链接**: https://openai.com/index/new-result-theoretical-physics/

---

#### 2) Google：Gemini 3 Deep Think 重大升级，面向科研/工程挑战
**来源**: [Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/)

Google 宣布对 Gemini 3 Deep Think（专用推理模式）进行升级，强调与科学家共同打磨，用于“缺乏明确护栏、数据噪声大/不完整”的科研工程问题，并开始通过 Gemini API 提供早期访问申请。

文章给出的代表性能力/指标包括：ARC-AGI-2 84.6%，Codeforces Elo 3455，以及在多项数学、物理、化学评测上达到“金牌级”表现；同时展示从草图到 3D 可打印建模文件的工程化工作流。

**链接**: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

---

#### 3) Anthropic：完成 300 亿美元 Series G 融资，估值 3800 亿美元
**来源**: [Anthropic News](https://www.anthropic.com/news/anthropic-raises-30-billion-series-g-funding-380-billion-post-money-valuation)

Anthropic 宣布完成 300 亿美元 G 轮融资（投后估值 3800 亿美元），并披露多项经营数据：run-rate revenue 14B 美元；Claude Code run-rate revenue 超 2.5B 美元、且 2026 年初以来翻倍；并引用第三方分析称“GitHub 公共提交中约 4% 由 Claude Code 生成”。

**链接**: https://www.anthropic.com/news/anthropic-raises-30-billion-series-g-funding-380-billion-post-money-valuation

---

### 📄 研究与方法论

#### 4) 研究：AGENTS.md 等仓库级上下文文件，可能让 Coding Agent 更难成功
**来源**: [arXiv:2602.11988](https://arxiv.org/abs/2602.11988)

论文《Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents?》评估了“仓库级上下文文件”对多类 Coding Agent/SWE-bench 任务的影响。

核心结论：上下文文件往往会降低任务成功率、同时将推理成本提高 20%+；其行为层面会促使更广泛的探索（测试/遍历更多文件），但“多余要求”反而让任务变难。作者建议：人类编写的上下文文件应尽量只写最小必要约束。

**链接**: https://arxiv.org/abs/2602.11988

---

#### 5) 研究：SToRM 用监督式 Token Reduction 将多模态自动驾驶 MLLM 计算成本降至 30×
**来源**: [arXiv:2602.11656](https://arxiv.org/abs/2602.11656)

论文提出 SToRM（Supervised Token Reduction），用轻量重要性预测器 + 全 token 路径伪监督 + anchor-context merging，将视觉 token 冗余压缩并尽量保持端到端驾驶性能。

在 LangAuto 基准上，作者声称在相同 reduced-token 预算下优于 SOTA，并实现“接近全 token 性能”的同时将计算成本最多降低 30×。

**链接**: https://arxiv.org/abs/2602.11656

---

### 💡 治理与产业观察（中文社区）

#### 6) 小红书：AI 生成/合成内容必须显著标识，违规将限流/封禁
**来源**: [AIbase](https://www.aibase.com/zh/news/25515)

小红书发布公告，要求创作者对 AI 生成或合成内容在发布环节主动勾选声明；平台也将通过检测工具识别疑似 AI 内容，未标注则强制加标并限制分发；对“仿冒公众人物”“恶意魔改”“教唆去标”等行为将严厉打击。

**链接**: https://www.aibase.com/zh/news/25515

---

#### 7) 中文资讯聚合：围绕 Agent 安全与供应链风险的讨论升温（OpenClaw 暴露实例）
**来源**: [AI Hub Today](https://ai.hubtoday.app/)

AI Hub Today 今日摘要中提到社区讨论：在大量实例暴露于公网的情况下，技能市场/供应链审核不足可能导致恶意技能传播与数据窃取风险；提示用户在授予 Agent 权限与托管部署时要格外谨慎。

**链接**: https://ai.hubtoday.app/

---

### 🔗 生态与安全观察

#### 8) Simon Willison：梳理 OpenAI 2016–2024 IRS 申报中的使命表述变化
**来源**: [Simon Willison](https://simonwillison.net/2026/Feb/13/openai-mission-statement/)

Simon Willison 从 ProPublica Nonprofit Explorer 中整理 OpenAI 2016–2024 的 IRS 使命描述字段，并用 git revision 方式呈现差异演化。

他指出 2024 年版本显著简化为“确保 AGI 造福全人类”，其中安全、开放共享、以及“不受财务回报约束”等措辞逐渐淡出。

**链接**: https://simonwillison.net/2026/Feb/13/openai-mission-statement/

---

#### 9) Simon Willison：Anthropic 的“公共利益目标”文件线索（Delaware 公司注册文件）
**来源**: [Simon Willison](https://simonwillison.net/2026/Feb/13/anthropic-public-benefit-mission/)

作为 public benefit corporation，Anthropic 不像 501(c)(3) 需要公开 IRS 申报；但通过 Delaware 公司注册文件（由他人获取并共享在 Google Drive），可以看到其“公共利益目标”表述从 2021 起到 2024 的更新轨迹。

**链接**: https://simonwillison.net/2026/Feb/13/anthropic-public-benefit-mission/

---

#### 10) HN Buzzing：IronClaw（Rust clawd）主打 WASM 隔离沙箱运行工具
**来源**: [HN Buzzing](https://hn.buzzing.cc/)

HN 热门中出现 IronClaw 项目介绍：用 Rust 实现的 clawd，强调将工具执行放在隔离的 WASM sandbox 中，以降低 Agent 工具链的权限爆炸与供应链攻击面。

**链接**: https://hn.buzzing.cc/

---

#### 11) HN Buzzing：Rowboat（AI coworker）将工作流程沉淀为知识图谱
**来源**: [HN Buzzing](https://hn.buzzing.cc/)

HN 热门中出现 Rowboat 项目：定位为“AI coworker”，将工作过程结构化沉淀为可查询/可复用的知识图谱，反映 Agent 工程化与知识管理结合仍是热点方向。

**链接**: https://hn.buzzing.cc/

---

#### 12) HN Buzzing：Waymo 宣布第六代 Driver 的 fully autonomous operations 进展
**来源**: [HN Buzzing](https://hn.buzzing.cc/)

HN 热门链接到 Waymo 博客，讨论第六代 Waymo driver 的 fully autonomous operations 进展，并引发“远程辅助/边界条件”与“完全自动驾驶定义”讨论。

**链接**: https://hn.buzzing.cc/

---

## 来源汇总

| 来源 | 抓取状态 | 内容摘要 |
|---|---|---|
| OpenAI News | ✅ | 页面可访问，但列表动态加载，正文提取有限；改用 OpenAI Index 单篇文章补充 |
| Karpathy | ✅ | 个人主页可访问，主要为履历与项目链接，无新博文列表 |
| Sam Altman Blog | ✅ | 首页为长文内容，抓取正常；未检出清晰“近24小时”更新线索 |
| Greg Brockman Blog | ✅ | 旧文章列表（2015-2019 为主），无近期更新 |
| François Chollet | ✅ | 个人主页/作品索引为主，无近期更新 |
| Lilian Weng | ✅ | 可抓取，近期公开长文停留在 2024-2025 年，今日无新更新 |
| colah | ✅ | 文章索引页为主，无近期更新 |
| Woj Zaremba (Medium) | ❌ | 抓取失败（访问受限/反爬） |
| Mustafa Suleyman | ✅ | 可抓取，首页为简介与写作入口，未检出近期更新 |
| Google DeepMind Blog | ✅ | 成功抓取到 2026 年 1-2 月更新条目（含 Gemini 3 Deep Think） |
| Dario Amodei | ✅ | 个人简介页为主，无更新条目 |
| Karina Nguyen | ✅ | 个人主页含研究/经历汇总，未检出近期更新 |
| steipete.me | ❌ | 抓取失败（连接/访问异常） |
| Simon Willison | ✅ | 成功抓取到 2/13 多条 AI 相关新动态（使命表述/治理讨论等） |
| AI Hub Today | ✅ | 成功抓取到 2026/2/14 中文 AI 资讯聚合与摘要 |
| Anthropic Research | ✅ | 成功抓取研究列表（1/29 等），今日无新增但可作为研究索引 |
| 腾讯混元研究 | ✅ | 页面可达，但提取到的公开文本极少（疑似动态渲染） |
| HN Buzzing | ✅ | 成功抓取热门列表，可作为补充线索池（含多条 AI/Agent 相关话题） |

---
*由 OpenClaw AI 自动生成 | 数据截止: 2026-02-14 09:00 CST*