Tag

#AI Agents

13 articles

#A18 Pro#AGENTS.md#AGI#AI#AI Agent#AI Agents#AI Benchmark#AI Coding#AI Gateway#AI 商业化#AI 编程#AI军事化#AI助手#AI安全#AI工具#AI幻觉#AI投资#AI推理#AI教育#AI泡沫#AI编程#AI翻译#AI聊天#AI融资#AI行业#AI训练数据#AI记者被开除#AI配置教程#AI隐私#AI风险#API安全#ASR#Agent#Agentic Infrastructure#Agents#AirSnitch#Android#Anthropic#App Distribution#Apple#Apple Intelligence#Ars Technica#AutoML#Automation#Benchmark#Benchmarks#Benj Edwards#Bluesky#Browser Automation#Bug Bounty#CDN#CEO#CLI#CMS#ChatGPT#Chrome#Claude#Claude Code#Claude Sonnet#Cloud Infrastructure#Cloudflare#Code Review#Computer Use#Cron自动化#Cursor#Dario Amodei#Data Privacy#DeepL#DevOps#Developer Tools#Developer Verification#Engineering#Enterprise AI#FBI#GCP#GPT#GPT-5.4#Gemini#Gemma#GitHub Copilot#Google#Google Cloud#Google Play#Hacker News#Hugging Face#IBM#Infrastructure#JavaScript#Kagi#Karpathy#LLM#LinkedIn#Linux#LiteLLM#MCP#Mac#Mac Studio#MacBook#MacBook Neo#Machine Learning#Mercury#Meta Ray-Ban#Meta眼镜隐私#MicroGPT#Multimodal#Node.js#Nvidia#OAuth#Open Source#OpenAI#OpenClaw#OpenSSL#Performance#Privacy#Productivity#Prompt Injection#Proton Mail#Pull Request#PyTorch#Python#Qwen#Qwen3.5#RAG#Rust#SQLite#SaaS#Sam Altman#Sama#Sandbox#Security#Serverless#Skill开发#Software Engineering#Supply Chain Security#TDD#TLS#Terminal#Token优化#Tool Use#Transformer#TypeScript#Vercel#Vibe Coding#Voice AI#Voice Agent#Whisper#WiFi安全#ai-code-generation#ai-codegen#ai模型#code-safety#code-security#facial recognition#formal-verification#gpt-5#lean-theorem-prover#macOS#memoryFlush#npm#quitgpt#software-quality-2026#vibe-coding-risk#wrongful arrest#中间人攻击#五角大楼#亚马逊#人工智能#人工智能风险#人脸识别#代码安全#代码审查#代码生成#优化#估值#内存短缺#军事AI#分布式计算#创业#副项目#加密邮件#加密邮箱#协作#去中心化#去匿名化#向量数据库#命令行#商业模式#团队协作#国防部#地缘政治#大模型更新#子Agent#安全#安全漏洞#工具#工程师成长#工程师焦虑#工程文化#广告#开发工具#开发效率#开发者#开源#开源模型#形式化验证#性能优化#成本优化#执法#扩散模型#技术职业#技术选型#数据标注#新闻伦理#智能眼镜#本地大模型#本地部署#机器学习#深度学习#漏洞挖掘#版权#独立开发#瑞士隐私法#用户体验#监管#知识库#研究自动化#硬件#社交媒体#移动开发#程序员#端到端加密#笔记本电脑#编程#编程工具#网络安全#职业发展#职场文化#肯尼亚数据工人#自动化测试#艺术#英伟达#苹果#行业动态#观点#语音识别#路由器#软件开发#边缘计算#远程开发#退订#阿里巴巴#隐私#隐私安全#隐私泄露#黄仁勋
教程|April 16, 20263 min

Agent 基准又来了一块照妖镜:IBM 这次不是测模型会不会答题,而是敢不敢把流程真跑完

IBM 推出的 VAKRA 不只是另一个 Agent 榜单。它把模型丢进带有 8000 多个本地 API、真实数据库和文档检索的可执行环境里,看它能不能把多步企业流程真正跑通。最扎心的是:很多模型看起来会说,真正做事时却明显不太行。

教程|April 16, 20263 min

浏览器标签页可能要先失业了:HoloTab 这类 AI 插件,正在把‘点点点’活儿直接端走

HCompany 推出 HoloTab,把电脑操作型 AI 直接塞进 Chrome 扩展里。它最值得看的,不是又一个会点网页的 Agent,而是‘录一次、反复跑’这件事终于开始像普通人也能用的产品,而不是只给极客看的自动化玩具。

教程|April 15, 20264 min

公司内网终于不用给 Agent 开后门了:Cloudflare 这次补上的,是企业 AI 最尴尬的一块

Cloudflare 给 Access 加上 Managed OAuth,看起来像个权限小更新,实际上是在解决企业上 Agent 时最别扭的一件事:人能进的内网系统,Agent 往往进不去;真让它进,又很容易退回 service account 和静态密钥那套老路。

资讯|April 14, 20265 min

云厂商终于不演了:Vercel 公开承认,下一代基础设施就是给 Agent 打工的

Vercel 提出 Agentic Infrastructure,不只是换了个新词,而是公开承认:下一代云平台的默认用户,已经不只是开发者本人,还包括替他们写代码、发部署、看日志的 AI Agent。

资讯|April 14, 20265 min

云厂商终于不演了:Vercel 公开承认,下一代基础设施就是给 Agent 打工的

Vercel 提出 Agentic Infrastructure,不只是换了个新词,而是公开承认:下一代云平台的默认用户,已经不只是开发者本人,还包括替他们写代码、发部署、看日志的 AI Agent。

教程|April 13, 20264 min

Cloudflare 不想再陪 Agent 演‘马车装喷气机’了:AI 时代真正该重做的,其实是整朵云

Cloudflare 在 Agents Week 开场文里讲得很直白:今天的互联网和云,骨子里还是给人类 App 设计的,不是给一人一个、按任务运行的 Agent 设计的。真正值得关注的,不是又多一个 Agent 平台,而是基础设施开始被迫重写。

教程|April 11, 20265 min

Vercel 开始不装了:下一代云基础设施,已经默认软件会自己写、自己发、自己修了

Vercel 提出 Agentic Infrastructure,真正值得关注的不是新词,而是一个越来越现实的变化:当 coding agent 开始写代码、触发部署、参与排障,云基础设施也必须从服务人类开发者,转向服务持续行动的机器执行者。

教程|April 7, 20264 min

GitHub 现在让一个模型专门盯另一个模型了:AI 写代码最危险的时刻,终于有人开始认真防了

GitHub 给 Copilot CLI 加了一个很有意思的新能力:让来自另一模型家族的‘Rubber Duck’在关键节点复查主 Agent 的计划、实现和测试。它真正提醒开发者的,不是 AI 又会多写几行代码,而是 AI 编程里最值钱的能力,开始从生成转向怀疑和复核。

教程|April 6, 20263 min

AI PR 看起来越完美,你越该后背发凉:Vercel 这篇文章把 Agent 写代码最大的坑说透了

AI 生成的 PR 越像资深工程师写的,团队越容易放松警惕。Vercel 提醒了一件很扎心的事:通过 CI 不等于能安全上线,Agent 时代真正稀缺的不是写代码速度,而是判断哪些代码值得发到生产环境。

教程|April 5, 20264 min

一个埋了 23 年的 Linux 漏洞,被 Claude Code 从内核角落里翻出来了:AI 编程开始从写代码,转向找炸弹

Claude Code 帮 Anthropic 研究员找出一个藏了 23 年的 Linux 内核漏洞,这件事真正可怕的,不是 AI 更会写代码了,而是 AI 编程工具已经开始从生产代码,转向批量挖掘高价值安全问题。

教程|April 3, 20264 min

Cursor 3 不只是改了个界面:AI 编程工具终于开始承认,人类不该继续当 Agent 的项目经理了

Cursor 3 这次最值得看的,不是 UI 变新了,而是它终于把 AI 编程工具最别扭的一层捅开了:开发者不该继续在一堆本地会话、云端任务、终端窗口和 PR 之间来回救火。真正的升级,是它开始把 agent 协作当成产品主战场。

教程|April 1, 20263 min

GitHub 把程序员的脏活累活交给 Agent 了:最先升值的,反而是文档和测试

GitHub Copilot Applied Science 团队分享了一套很有意思的实践:他们不是单纯让 Agent 帮忙写代码,而是先把文档、测试、重构和 review 流程补起来,再让 Agent 成为主力贡献者。真正的变化不是‘AI 更会写了’,而是软件团队终于开始认真经营一个适合 Agent 干活的代码库。

教程|March 25, 20262 min

AI 开始自己决定要不要申请权限了:Claude Code 这步,像极了打工人熬成组长

Anthropic 给 Claude Code 加了一个很关键的新能力:不是单纯放权,也不是继续让人类一下一下点确认,而是让 AI 先判断这步操作值不值得打扰你。对开发者来说,这可能比再提一点模型分数更重要。