教程|

AI 开始自己决定要不要申请权限了:Claude Code 这步,像极了打工人熬成组长

Anthropic 给 Claude Code 加了一个很关键的新能力:不是单纯放权,也不是继续让人类一下一下点确认,而是让 AI 先判断这步操作值不值得打扰你。对开发者来说,这可能比再提一点模型分数更重要。

AI 开始自己决定要不要申请权限了:Claude Code 这步,像极了打工人熬成组长

现在的 AI 编程工具,很多时候都卡在一个很尴尬的状态:

  • 不放权,它干活像在等你按电梯
  • 太放权,你又怕它一个转身把现场整成事故片

所以这类工具过去经常给人一种感觉:看起来很聪明,用起来很需要陪护

Anthropic 这次给 Claude Code 加的自动模式,我觉得真正重要的点不在“又多了一个新功能”,而在于它终于开始正面处理一个现实问题:AI 到底什么时候该自己做,什么时候该闭嘴等人批准?

根据 TechCrunch 的报道和 Anthropic 的说法,这个模式会先让系统检查一次操作风险。安全的动作直接执行,风险高的动作则拦下来继续要确认。它不是简单粗暴地把权限全开,而是把“要不要申请权限”这件事,也交给 AI 先做一轮判断。

说白了,这像什么?像一个刚从实习生熬成组长的人。不是所有事都要来问你,但也不敢什么都自己拍板。

这件事为什么比想象中重要

很多人聊 AI 编程,注意力容易都放在模型能力上:

  • 代码写得准不准
  • 补全快不快
  • 能不能自己修 bug

但真正把工具用进日常工作之后,你会发现另一个更烦的瓶颈:操作链太碎,人类确认太密。

你让它改个配置,它先问;
你让它跑个命令,它再问;
你让它顺手补个测试,它还问。

问多了以后,人不是更安全,而是更麻木。最后你不是在做审查,而是在机械点同意。这个状态其实很危险,因为它会把“确认”从安全机制,变成纯粹的流程噪音。

所以自动模式如果真能做好,价值不只是省几次点击,而是把确认这件事重新变回“只在该出现的时候出现”。

它解决的不是能力问题,是协作问题

我越来越觉得,AI coding 的下一轮竞争,不是谁 benchmark 又涨了 2 分,而是谁更懂怎么跟人类协作。

因为大部分开发场景里,人类真正想要的不是一个满脑子冲动的天才,也不是一个什么都不敢做的乖宝宝。大家要的是一个靠谱同事:

  • 小事你自己推进
  • 碰到边界你知道停
  • 可疑输入你别上头
  • 真有风险时你会举手

Claude Code 这次的自动模式,本质上就是往这个方向挪了一步。

Anthropic 还特别提到,它会检查是否存在用户没要求的危险行为,以及提示注入这类风险。这个点很关键。因为一旦 AI 工具开始更主动执行,最大的敌人就不只是“它笨”,而是“它被带偏”。

以前大家担心 prompt injection,更多还是停留在聊天机器人层面。现在它进入 coding agent 时代后,问题直接升级:一段恶意内容不只是让模型胡说八道,还可能让它真的去执行不该执行的动作。

这就不是社死了,这是实打实的事故。

但先别急着喊‘终于全自动了’

这类功能最微妙的地方,也恰恰在这里。

自动模式听起来很爽,可真正决定它值不值得信任的,不是宣传语,而是那条安全线到底怎么画。Anthropic 目前并没有把判定标准讲得特别细,这对开发者来说其实是个问号。

因为所有这类系统最后都会撞到同一个问题:

哪些算低风险?哪些又必须人工兜底?

如果边界太保守,那它只不过是把确认弹窗换了一种出现方式;
如果边界太激进,那它就可能把“少打扰你”直接进化成“少通知你”。

所以我认同 Anthropic 自己的建议:这种能力现阶段更适合在隔离环境里用,而不是一上来就往生产系统里冲。

对开发者来说,接下来该怎么看这类工具

我会建议别只问一句“它能不能自动干活”,而是多问几句更现实的:

  • 它会在哪些操作上自动放行?
  • 它怎么识别注入和越权?
  • 出错之后能不能追溯决策路径?
  • 团队能不能自己定义边界?
  • 失败成本高的时候,它会不会老老实实停下?

这些问题,比 demo 里一句“它自己完成了整个任务”重要得多。

如果你最近也在关注 agent coding 这条线,可以顺手看看 TechCrunch 的报道 和 Anthropic 的 官方说明。一个是外部视角,一个是产品方视角,放一起看会更清楚。

我的判断

我对这种方向是偏看好的。不是因为“AI 终于要接管一切”这种老掉牙叙事,而是因为工具终于开始从“会不会生成”走向“会不会做事”。

这两个阶段看起来只差一步,实际差得很远。

会生成代码,只能说明它像个答题机器;
会在边界里持续执行,才说明它开始像一个能合作的人。

Claude Code 自动模式未必已经把这道题做对了,但它至少问对了题。

而在 2026 年,这可能比再来一次花里胡哨的模型秀,更有含金量。


延伸阅读:

准备好了吗?

免费注册,立即体验全部功能