下一代软件,为万亿Agent而建

币小圈今天3阅读0评论


编者按:随着大模型能力持续突破,AI Agent 正从「对话工具」逐渐演变为能够独立执行任务的数字劳动力。从编写代码、处理合同,到审计财务、分析科研数据,Agent 开始进入几乎所有知识工作的环节。


当企业内部同时运行的 Agent 数量远超员工规模时,软件的主要使用者也可能从「人」转向「机器」。在这一趋势下,软件设计、基础设施乃至商业模式都在发生变化。本文以「为 Agent 构建软件」为线索,讨论 Agent 时代的软件形态与基础设施将如何演进。


注:本文作者 Aaron Levie 是企业云存储公司 Box 的联合创始人兼 CEO,也是长期关注 AI 与企业软件趋势的科技行业意见领袖。


以下为原文:


过去几个月里,Agent 领域正在发生一件重要的变化。去年年底前后,我们开始进入这样一个阶段:编程型 Agent 已经能够独立完成持续时间更长的任务,在整个开发过程中也不再需要人类频繁手把手地指导。


这些 Agent 早已不只是配备简单工具的聊天机器人。如今,它们往往拥有独立的沙盒计算环境,可以针对遇到的问题自行编写并运行代码,能够直接调用 API 和 CLI,与各种系统交互,还拥有自己的文件系统与长期记忆能力等等。这些基础能力,加上围绕 Agent 运行框架(agentic harness)的最佳实践逐渐成熟,以及模型在工具调用和软件开发方面的巨大进步,让我们开始看到一种可能:Agent 将能够处理几乎任何被交给它们的任务。


最初,这种架构主要由一批编程型 Agent 推动,例如 Claude Code、Devin、Codex、Factory、Cursor、Replit 等。但最近,这一模式已经跨越了早期技术圈层,开始进入更广泛的个人体验和知识工作领域,比如 Claude Cowork、Perplexity Computer、Manus,以及当然还有 OpenClaw。后者更是把这一方向推向更远——它可以在一个持续存在的环境中 24 小时运行。


随着能力快速提升,Agent 将被引入几乎所有工作领域。它们会被用来审阅每一份合同、处理大量客户支持的一线问题、审计企业财务、梳理海量医学研究以推动药物发现、生成绝大部分软件代码、制作销售和咨询演示文稿,甚至代表消费者在互联网上完成交易。总体而言,它们将参与社会中几乎所有具有经济价值的工作。


而且,这不仅仅是替我们完成今天已经在做的事情。Agent 还会让我们做得更多,例如运行过去成本过高的复杂模拟、为每一个想法快速生成多种原型方案,因为启动项目的成本大幅降低、停止项目也变得容易;我们会同时推进更多项目;我们也可以分析几乎所有数据,而不再只是依赖抽样。


把这些趋势放在一起看,可以预见:在未来的组织中,几乎每一位员工都会拥有多个为其工作的 Agent。一个企业拥有的 Agent 数量达到员工数量的 100 倍甚至 1000 倍,并不难想象。当数万亿个 Agent 在同时运转时,它们将成为未来软件最主要的使用者。


然而,大多数软件原本都是为人类设计的。这意味着,软件形态很可能会迎来一次重大的变化。那么接下来会发生什么?


做出「Agent 愿意用」的软件


Paul Graham 曾用一句极其简单的话总结软件创业的原则:做出人们想要的产品(Make something people want)。


这一理念催生了 21 世纪最成功的一批软件公司,也推动了一种新的产品方法论——工具要简单易用、容易上手、解决明确的问题、避免晦涩术语、定价清晰。


而现在,这句话可能要被改写为:做出 Agent 愿意用的软件。


目前,使用 Agent 最多的人往往是开发者或技术能力很强的用户,他们对工具通常有自己的偏好。但当 Agent 开始为知识工作者处理各种任务时,这种人为偏好会逐渐弱化。除非企业内部已经规定了统一的工具,否则在很多工作流程中,真正做出选择的将是 Agent。


这意味着:它们会决定使用哪些工具、编写什么代码、调用哪些库、运用哪些技能。那些更容易被 Agent 接入、并能更好解决问题的平台,会比其他产品更快获得优势。Agent 不会参加你的线上发布会,也不会看到你的广告;它们只会选择完成任务最有效的工具,而你当然希望那是你的产品。


这条建议带来的最大启示是:一切都必须以 API 为中心(API-first)。


如果某个功能没有 API,几乎等同于不存在。


如果功能无法通过 CLI 或 MCP server 调用,你就已经落后一步。


如果 API 设计复杂混乱、路径冲突,让 Agent 难以使用,那基本上就是在主动放弃成为 Agent 工具的机会。


在 Box,我们正致力于构建面向 Agent 的文件系统,因此正在逐一检查 API 的每一个细节,思考在 Agent 环境中哪些地方会出现问题。这种细致程度,过去往往只出现在用户体验(UX)设计里。


正如为用户设计软件需要站在用户角度思考一样,为 Agent 设计软件也需要同样的思路。例如 Y Combinator 的 Jared Friedman 就提醒开发者:「即使是最好的开发者工具,大多数仍然无法通过 API 注册账户。这在 Claude Code 时代是一个巨大的问题,因为这意味着 Claude 无法自己注册账号。现在,把所有账户管理功能放进 API 应该成为基本要求。」


如果 Agent 无法轻松注册并开始使用你的服务,那么在它们眼里,你几乎等同于不存在。


商业模式也会随之改变


当 Agent 成为软件的主要用户时,商业模式也会发生变化。


在某些情况下,由用户席位(seat)触发 Agent 运行的模式仍然适用。但也会出现大量不再与具体用户绑定的 Agent,或者它们的工作量远远超出传统软件的使用方式。例如,用户只需输入几句话,一个 Agent 就可能在软件中完成相当于数小时的人类工作,然后只把最终结果呈现给用户。


因此,一部分软件产品的商业模式将发生演化。任何希望在「Agent 时代」存活的工具,都需要引入某种按使用量或计算量计费的模式,甚至支持 Agent 自行完成支付。


面向 Agent 的下一代基础设施


Perplexity 创始人 Aravind Srinivas 曾说过一句话:「把电脑交给人类是个好主意,但把电脑交给电脑,让它们替我们完成工作,是更好的主意。」


随着 Agent 拥有自己的计算环境、能够编写并执行代码、调用技能完成重复任务,并接入各种外部工具和服务,一整套新的技术体系也将随之出现。就像人类在电脑上需要的,Agent 也同样需要一套类似但专门为它们设计的基础设施。


其中一部分服务会来自现有公司,因为 Agent 仍然需要访问现有数据,或者需要在人类用户与 Agent 之间协作。


但与此同时,也会诞生大量新的产品类别,因为 Agent 面对的问题与人类完全不同,从零设计新的服务往往更合理。


例如,Agent 显然需要自己的基础设施,而且规模可能前所未有。下一代超大规模云平台(或现有巨头的升级版)很可能围绕这样一个理念建立:未来的数据中心不再主要运行我们的应用,而是运行我们的 Agent。E2B、Daytona、Modal、Cloudflare 等公司已经在朝这个方向推进,而这些沙盒计算环境的规模可能达到前所未见的水平。


Agent 还需要访问企业核心文件,并管理自己的数据与记忆,以支持长期运行的任务。同样地,企业级系统也需要转向 API-first,以便 Agent 能够访问 HR 系统、CRM、工作流系统、数据湖等关键数据与服务。那些能让 Agent 随时随地无缝操作这些数据的平台,将最有可能承接未来的工作负载。


Agent 也可能需要自己的身份体系,并能够彼此通信。例如 Agent mail 正在为 Agent 提供邮箱,使其拥有持续存在的邮件地址。同时,Exa、Parallel 等公司也在重构搜索引擎,以适应「Agent 才是主要搜索用户」的世界。许多 Agent 还需要管理自己的预算,例如通过 Stripe 或 Coinbase 提供的钱包完成支付,这甚至可能推动微支付真正落地,让 Agent 可以访问付费工具和数据资源。


当然,安全、合规与治理也会成为重大挑战。在一个 Agent 处理敏感信息、甚至执行受监管流程(例如制药或银行业务)的世界里,公司必须能够审计和记录 Agent 完成的每一项工作。长期运行的 Agent 可能需要独立身份,以便登录各种系统,并严格限制它们能够执行的操作以及可访问的数据。我们将需要一整套新的软件与平台来解决这些问题,就像过去我们为人类用户和应用程序建立安全体系一样。


总体来看,我们正在进入一个新的软件时代。在这个时代,软件必须从一开始就为 Agent 的大规模使用而设计。当数万亿个 Agent 在为人类工作时,我们与软件的关系也将被彻底重塑。


[原文链接]


免责声明:
本站内容来源于公开网络,仅作信息整理与展示之用,不代表本站立场或观点。相关内容不构成任何投资、交易或决策建议,亦不作为任何行为依据。请读者自行判断并承担相关风险。
本站不向特定国家或地区用户提供服务。如相关内容在您所在地区存在法律或监管限制,请您停止访问。