洞察:Karpathy 点出了 AI 编程的演进方向。早期是代码补全(行级),然后是代码生成(函数级),现在进入代码库理解(项目级)。200万字符上下文让 AI 可以记住整个项目的架构、依赖关系和编码规范。这意味着 AI 可以从"写新代码"进化到"维护老代码"——而后者才是软件工程的主战场。
洞察:4.7 个任务/会话和 78% 成功率是令人印象深刻的数字。这表明 Agent 已经从"偶尔能用"进化到"经常能用"。关键转折点在于:当成功率超过 75%,用户会开始依赖而非只是尝试。Operator 可能成为第一个真正进入日常 workflows 的通用 Agent。
洞察:Sutskever 强调的"自我修正机制"可能是一个范式转变。当前 LLM 的问题是"不知道自己错了",而自我修正意味着元认知能力的出现。如果模型能检测并纠正自己的错误,这不仅是安全对齐的进步,也可能是通向更可靠推理的关键突破。
洞察:Howard 的观察印证了一个趋势:开源模型正在快速缩小与闭源模型的差距。这对于 AI 生态系统至关重要——当开源达到"足够好"的水平,商业应用的门槛将大幅降低。中国模型在中文任务上的优势也说明:区域化、垂直化的模型仍有巨大机会。