别焦虑,软件工业远没到终局:Code-Editing Agent 只是中间态,Product-Editing Agent 才是未来
我越来越觉得,今天的 Coding Agent 还处在一个很早期、很不完整的阶段。它看起来已经很强,可以读代码、改代码、跑测试、修 Bug,但本质上仍然是在修改“代码”这个中间产物。可对人来说,真正直觉的工作对象从来不是中间产物,而是最终结果。
如果类比视频制作,这就像三四十年前我们不是在时间线、画面、声音、字幕上直接编辑,而是必须打开某种底层工程文件,通过改格式来改变成片。那当然也能工作,但一定是落后的。视频工具今天未必在 AI 层面领先,甚至很多地方还很落后;但它在产品框架上有一个更先进的默认前提:创作者直接面对结果工作。
软件工程现在恰好相反。我们在 Coding Agent 里描述意图,Agent 修改代码,然后我们切到浏览器、本地 App 或测试环境里看结果。发现不对,再回到 Agent 继续改代码。这两个世界是割裂的:一个是实现层,一个是结果层。代码当然重要,但代码更像 FCPXML、工程文件、配置和时间线数据,它不应该永远是人类与软件产物交互的主界面。
我最近做 davinci-resolve-cli 和 final-cut-pro-cli 时,其实一直把它们看作过渡桥。CLI、JSON、errorCode、MCP、SKILL.md,这些东西能让 Agent 稳定调用传统专业软件,是当下能落地的做法。但它们不是终点。真正的终点不是“让 Agent 更会绕过 GUI 操作底层”,而是让 AI 进入最终产物本身:在画面上改画面,在应用里改应用,在 3D/VR 场景中直接改场景,在用户正在看的结果里理解上下文、预测下一步,并和人实时共创。
所以未来的 Coding Agent,可能不该继续叫 Coding Agent。它会从 Code-Editing Agent 走向 Software-Editing Agent,甚至 Product-Editing Agent。它的核心界面不再是代码仓库,而是运行中的软件、可交互的状态、可视化的对象、可被直接验证的结果。
这也是我对视频编辑 AI、PACE、Human-AI Cocreation 这些方向的共同判断:AI 最有价值的形态,不是“一句话生成最终作品”,也不是永远停在命令行和工程文件里,而是在人的创作流中实时在场。人负责判断、审美、目标和取舍;AI 负责理解上下文、补齐动作链、把复杂实现折叠到结果背后。
下一代软件工程的突破,可能不是让 Agent 多写几行更好的代码,而是让人终于可以少看一点代码,直接修改自己真正关心的东西。