QKAI · ABN 18 697 027 133 · Sydney, Australia

© 2026 QKAI PTY LTD. All rights reserved.

隐私政策|负责任的AI|服务条款
博
← 返回博客
AI Agent2026年4月14日7 分钟阅读

从第一性原理到 Agent Harness

我一开始并不知道 LangGraph 或 agent harness 这些概念。我只是从一个真实业务系统出发,自己解决调度、工具编排、消息抽象和外部 API 接入,最后回头看,才发现我已经搭出了一套 agent harness。

这篇不是上一篇的项目复盘续写,而是把同一个项目往下再挖一层:我后来才意识到,我当时真正搭出来的,不只是一个 agent,而是一套让 agent 能持续工作的 harness。

上一篇我写的是:这个系统是怎么一步步搭出来的,架构怎么演进,哪些坑最真实。

这一篇我不想重复那些过程。

我更想回答一个问题:

我当时到底在搭什么?

回头看,最有意思的部分,不是“我做了一个 AI Agent”,而是: 我在还不知道这个词的时候,就先把一套 agent harness 搭出来了。

当时我并没有从 graph、runtime、orchestration framework 这些词出发。

我真正面对的问题只有一个:

怎么让一个真实业务系统可以持续摄入信息、进行推理、执行动作、保留状态,并且通过用户已经在用的界面稳定运转。

它的起点不是 AI 抽象,而是业务系统本身的运行压力。


这篇不再讲 feature,而是讲层

当 IMLANG 不再只是一个 demo,而是真的开始承担业务任务时,我很快发现:

“和 LLM 聊天”只是整个问题里最小的一部分。

如果换个角度看,上一篇里那些实现细节,其实是在逼着系统长出五层结构。

第一层:后台执行能力

最先长出来的,不是“对话”,而是后台执行能力。

真实业务不会等你打开对话框再发生,所以系统必须先有自己的心跳。

也就是说,它得先能:

  • 定时检查外部输入
  • 持续更新状态
  • 在用户没发消息时也推动流程继续跑

这一刻,系统其实已经不只是聊天机器人了。 它开始变成一个持续运行的业务系统。

第二层:工具层

第二层自然变成了工具层。

用户说的不是底层命令,而是结果。

他不会说“去读数据库”或者“去查文件系统”,他只会说:

  • 帮我找资料
  • 帮我起草
  • 帮我推进
  • 帮我发出去

所以系统不能只有语言理解,它必须有一个可调用、可约束、可执行的业务动作面。

做到这里时,项目本质已经变了: 它不再只是“给模型写 prompt”,而是在给模型提供 action surface。

第三层:Agent 调度循环

有了工具之后,静态路由很快就不够用了。

一旦任务开始变成条件式、多跳式,系统就必须有自己的调度循环,而不是固定映射。

于是核心问题不再是“模型能不能回答”,而变成:

  • 什么时候继续行动
  • 什么时候停下来
  • 什么时候把结果交还给用户

这一步非常关键。

因为从结构上看,这已经不是一个“调用大模型的功能点”,而是一套协调推理与执行的 runtime。

第四层:连续性

第四层是连续性。

业务工作不是无状态的。

今天讨论的客户,明天还是同一个客户。
上次回复过什么、现在处在哪个阶段、后台刚处理了什么结果,这些都不能丢。

所以系统真正需要的,不只是 prompt window,而是分层上下文:

  • session memory
  • per-customer context
  • 最近讨论历史
  • 长期记忆
  • workflow 结果回流

很多“玩具 agent”的问题就在这里: 能回答一个问题,不等于能持续工作。

第五层:transport abstraction

第五层是 transport abstraction。

开发者最顺手的平台,往往不是用户真实使用的平台。

所以一旦系统开始走向真实使用环境,就必须把“消息平台”从产品本体里拆出来,变成 adapter / transport layer。

这一步的真正意义是:

Telegram 不再是 bot 本体,它只是一个 transport。

听起来像一个小重构,但实际上它改变了整个系统的边界。

从这一步开始,你构建的已经不是某个平台上的助手,而是一套可以穿过多个界面运行的 runtime。


真正难的不是功能,而是 coordination

项目早期,每增加一个能力,看起来都像在补 feature。

但做到一定程度之后会发现,真正难的已经不是某一个功能点,而是 coordination。

真正难的是:

  • workflow 什么时候触发?
  • 系统什么时候继续执行,什么时候停止?
  • 上一步状态应该带多少进下一步?
  • 输出怎么适配不同界面?
  • 外部 API 的结果如何标准化,才能继续被模型推理?
  • 什么可以自动完成,什么必须交还给人审批?

这已经不是“胶水代码”了。

这就是 harness 真正开始出现的地方。

因为 harness 的本质,从来都不是“把很多工具挂在一起”。 而是: 让推理、状态、执行和界面在一个闭环里保持一致。


为什么 Telegram + 外部 API 这件事,本质上就是 harness

我后来越来越觉得,这个系统根本不是围绕模型本身建立的。

模型只是中间的 planner。

一个真实请求经过的,不是“用户问一句,模型答一句”,而是一整条协调链:

  1. 用户通过某个界面发来消息
  2. 系统加载 session 和记忆、客户上下文
  3. 模型判断缺什么信息
  4. 系统去调外部执行面
  5. 结果被规范化后再回流给模型
  6. 模型决定继续还是结束
  7. 回复再适配到目标平台发出去

所以更准确的说法不是“chatbot + integrations”, 而是:

  • interaction surface
  • execution surface
  • planning runtime

其中:

  • 用户界面是 interaction surface
  • Outlook / Supabase / OneDrive / WhatsApp API 这类系统是 execution surface
  • 模型是 planner
  • harness 是把这些东西维持成闭环的那层系统

第一性原理,比框架词汇更适合作为起点

如果我一开始就从框架词汇出发,项目很可能在纸面上更优雅,但在现实里更难用。

因为真正决定架构的,从来不是这些问题:

  • 这是不是 graph?
  • 我应该选哪个 framework?
  • 最优雅的 tool-calling 抽象是什么?

真正决定架构的是这些约束:

  • 什么状态必须保留?
  • 什么动作必须能执行?
  • 什么应该自动完成,什么必须交给人?
  • 哪些流程必须在后台持续运行?
  • 系统要通过哪些界面活着?
  • 哪些外部系统真的会改变世界状态?

这才是架构真正的来源。

所以我现在理解的“第一性原理式 agent 开发”,不是先学一个框架,而是先回答这些最底层的问题。

如果这些问题回答得足够诚实,系统最后自然会长成某种 framework-like 的形状。


后来再看 LangGraph / harness,这些词才真正有意义

只有当 IMLANG 这套系统已经搭出来之后,LangGraph、agent harness 这些词对我来说才不再只是标签。

在那之前,它们只是名词。
在那之后,它们才变成一组我已经亲手踩过的问题:

  • 状态连续性
  • 工具编排
  • 迭代式推理
  • transport abstraction
  • failure boundary
  • cost control
  • human checkpoint

这也改变了我对框架的看法。

我现在不把框架看成起点,而更愿意把它理解成两种东西:

  • 帮你少重复造基础设施的 shortcut
  • 帮你给已经踩出来的模式命名的一套 vocabulary

框架当然有用。
但很多时候,大家在项目最早期高估了框架的重要性,低估了真实业务约束的重要性。


最后一句话

如果你今天也在搭一个 agent system,我最想给的建议其实很简单:

不要先问: “我应该用哪个 framework?”

先问:

  • 什么状态必须保留?
  • 什么动作必须能执行?
  • 什么决策必须交给人?
  • 哪些后台流程必须自动运行?
  • 系统要通过哪些界面和用户互动?
  • 哪些外部系统真的能改变世界状态?

当这些答案具体了,架构就会自己浮出来。

如果你足够从第一性原理出发去做,很可能会像我一样,最后才意识到:

你从来不只是“做了一个 agent”。

你真正做出来的,是那套让 agent 能存在、能工作、能扩展的 harness。

Agent Harness第一性原理工具编排推理执行循环消息抽象

继续阅读

把这篇放回更大的业务判断里

AI Agent2026年4月7日

我是如何从0开始搭建AI Agent的

完整技术复盘:为悉尼门窗公司搭建多渠道AI Agent的全过程——架构演进、97个commit、每一次翻车。

机器人战略2026年4月22日

机器人的飞轮,其实从机器人出现之前就开始了

真正的机器人飞轮,往往先从流程重构、数据结构、AI Agent 和运营纪律开始运转——硬件本体只是最后一步。

自动化战略2026年4月21日

在澳洲,为什么高人工成本正在让 AI 自动化变成企业经营优先级

澳洲高人工成本正推动越来越多中小企业重新评估行政自动化、运营自动化、线索筛选、报价自动化与 AI Agent 工作流,在继续加人之前先做流程重构。

下一步

如果你关心的是流程,不只是内容

QKAI 可以先帮你判断:哪些询盘、报价、跟进、CRM 或支持流程,应该在继续加人之前先做自动化评估。

查看服务预约咨询
← 返回博客