---
Anthropic正式发布Claude Opus 4.6,这是其最强大的模型版本。该模型在安全研究方面表现突出,成功发现了开源代码中的500个零日漏洞。同时,Anthropic还推出了Fast Mode模式,响应速度提升2.5倍(从73ms降至6.7ms),但价格也随之上涨6倍。
OpenAI推出GPT-5.3-Codex,目前可通过Codex应用使用,API访问即将开放。该版本在代码生成和推理能力上都有显著提升,与Claude Opus 4.6形成了直接竞争。
Waymo与DeepMind合作推出基于Genie 3的全新世界模型,能够生成超逼真的3D仿真环境。该模型可模拟极端天气(如龙卷风)、野生动物 encounter(如路遇大象)等复杂场景,支持多传感器数据输出,工程师可通过自然语言提示调整仿真参数。
面壁智能发布首款AI原生端侧开发板"松果派",集成麦克风摄像头,搭载275TOPS算力,适配MiniCPM端侧大模型。支持自然语言直驱硬件,可离线运行保障隐私安全,计划2026年年中正式发布。
阿里千问App推出30亿免单活动,5小时内突破500万单,超越豆包元宝登顶苹果免费榜第一,形成"千豆元"三足鼎立新格局。接入淘宝闪购支付宝后,成为"能办事"的AI助手。
---
研究人员提出GenArena评估框架,采用成对比较范式替代传统绝对评分方法。开源模型在该评估下竟能超越顶级闭源模型,评估准确率提升超20%,与LMArena榜单相关性达0.86。
混合专家架构(MoE)再进化,引入向量级原子专家。笛卡尔积路由器将路由复杂度从O(N)降至O(√N),17亿激活参数达50.9%零样本准确率,推理延迟从73ms降至6.7ms,提速10.9倍。
---
HashiCorp创始人Mitchell Hashimoto分享了使用AI编码代理的经验:
StrongDM团队分享了他们如何在"不看代码"的情况下构建严肃软件的经验。他们实现了Dan Shapiro所说的"黑灯工厂"级别的AI应用——编码代理产生的代码无需人工审核即可部署。
据华盛顿邮报报道,AI热潮正在造成其他领域的人才和物资短缺。科技公司的大量投资正在推高数据中心、电力设备和相关专业人才的成本。
---
---
| 来源 | 更新数 | 主要内容 |
|---|---|---|
| Hacker News | 20+ | Claude 4.6、GPT-5.3-Codex、Waymo世界模型等 |
| Anthropic Research | 5 | AI辅助编码技能研究、Claude新宪法等 |
| OpenAI Blog | 2 | GPT-5.3-Codex、Frontier项目 |
| AI Hub Today | 10+ | 综合AI资讯日报 |
| Simon Willison's Blog | 8 | 编程代理、AI工具评测 |
| Sam Altman Blog | 1 | Sora更新 |
---
*由AI助手自动生成 | 数据截止: 2026-02-08 04:35 UTC*