最干净的 AI Agent 运行时 —— 五层架构全拆解与企业级安全短板分析
2026 年,AI Agent 赛道早已从概念炒作进入工程化落地的深水区。无数项目沉迷于堆功能、炒概念,把 Agent 做成了花里胡哨的聊天玩具,却始终解决不了最核心的问题:执行不可靠、状态不可控、结果不可复现。而近期开源的 OpenClaw,却以一套极简、清晰、职责分离的分层架构,成为了业内公认的"最干净的 Agent 运行时"参考设计。
它以本地优先为核心理念,在工程层面做出了极佳的示范,解决了当前绝大多数 Agent 框架普遍存在的竞态 bug、上下文溢出、执行混乱等痛点;但与此同时,它的执行模型也带来了巨大的安全攻击面,在企业级场景的安全与治理上,存在致命的短板。
本文将从核心定位、五层架构全拆解、工程设计亮点、企业级安全短板、实践启示五个维度,深度解析这个本地优先的 AI Agent 系统。
在拆解架构之前,我们必须先厘清 OpenClaw 的本质:它不是一个对话式 Chatbot,而是一个长驻运行的 TypeScript/CLI 自动化进程,核心目标是实现端到端的任务自动化,而非人机对话交互。
它的所有设计,都围绕着"可靠、稳定地完成自动化任务"展开,而非优化聊天体验。这种设计让它彻底跳出了"AI 玩具"的范畴,更贴近工业级的自动化运行时。
OpenClaw 采用了严格分层的架构设计,从输入到执行、从决策到存储,五层职责完全分离,层与层之间通过标准化接口交互,没有任何冗余耦合。
这是整个系统的"感官系统",核心作用是实现多渠道的事件接入。原生支持:
核心价值:把不同渠道、不同格式的输入事件,统一接入到系统中。
这是整个系统的"交通枢纽",也是 OpenClaw 最核心的工程亮点之一。包含三大核心组件:
负责输入的归一化处理,把不同渠道的输入格式统一转换为系统内部标准化的事件结构,实现接入层与业务层的完全解耦。
负责会话的隔离与路由,为不同用户、不同任务创建独立会话,每个会话的上下文、状态、执行队列完全独立,彻底避免跨会话的状态污染。
负责并发控制与执行顺序保证。为每个独立会话分配专属执行车道,同一车道内事件严格按 FIFO 顺序串行执行,从根源上消除竞态条件。
这是 OpenClaw 的逻辑核心,相当于 Agent 的"大脑"。包含三大核心组件:
实现模型层完全解耦,原生支持 Claude、OpenAI、Ollama 等主流大模型,能根据任务复杂度动态选择最合适的模型。
动态注入任务要求、工具能力说明、历史信息、个性化规则,整合成标准化系统提示词。
"工具优先"设计理念的核心体现,包含两大模块:
统一封装不同大模型调用接口,实现流式响应、错误重试、成本统计、异常兜底。
采用三层混合存储设计:
全量历史记录,以 JSONL 格式持久化到本地文件,完整记录每次输入、规划、调用、结果。
经过整理的核心知识与规则库,以 Markdown 格式存储核心规则、用户偏好、长期知识。
基于向量检索或 FTS5 全文检索的语义搜索能力,实现长期记忆的精准激活。
严格遵循"输入 - 路由 - 决策 - 执行 - 存储"的职责分离:
新增输入渠道只改适配器、新增工具只扩展执行层、更换大模型只调模型解析器,完全不影响其他层。
用 JSONL 格式把所有执行过程完整持久化到本地文件,没有黑盒的数据库存储。开发者可以直接打开日志文件,完整复现输入、规划逻辑、工具调用参数、错误信息,甚至基于日志完整重放整个任务。
按照 "系统指令 > 任务要求 > 最近执行结果 > 非核心历史内容" 的优先级做摘要压缩,永远保留核心执行规则。
从设计之初就把工具执行作为核心,原生支持 Shell、无头浏览器、文件系统三大核心执行能力,所有架构设计围绕"让工具执行更稳定、更可靠"展开。
核心是本地运行的 CLI 进程,不需要分布式部署,不强依赖云端服务,一台普通电脑就能完整运行。所有代码、执行过程、数据都存储在本地,完全可审计、可管控。
一旦攻击者构造恶意提示注入内容,能绕过系统核心指令,让 Agent 执行任意 Shell 命令、读取敏感文件、通过浏览器访问内部系统,甚至横向移动到其他服务器。OpenClaw 原生没有提示注入的检测、拦截、防护机制。
没有插件安全审计、权限最小化管控、运行时沙箱隔离机制,第三方插件可继承 Agent 所有权限,访问系统所有资源。
网关默认监听 18789 端口,原生没有身份认证、访问控制、传输加密机制。若对外暴露,任何人都能向 Agent 发送指令。
JSONL 日志完整记录所有执行过程(包括 API 密钥、数据库密码等),默认明文存储。MEMORY.md 和向量索引也无加密存储、敏感信息脱敏能力。
没有角色权限体系,没有可配置的安全策略引擎,没有高风险操作的人工审批拦截机制。Agent 可无限制执行任何操作。
可靠的 AI Agent,本质是系统工程问题,而非提示词工程问题。
一个能稳定落地的 Agent,80% 的工作是系统工程的设计,而非提示词的优化。OpenClaw 用三个核心原则指明了方向:
OpenClaw 是近年来 AI Agent 领域难得的、工程设计极简优雅的参考实现。它让我们看到,一个可靠的 Agent 运行时,不需要复杂的分布式架构、冗余的功能堆砌,只需要把系统工程的基础原则做到极致。
同时,它也给整个行业敲响了警钟:AI Agent 的落地,永远是安全与治理先行。功能再强大的系统,如果没有完善的安全管控、合规治理,永远无法走进企业级的生产环境。
对于开发者而言,我们既要学习 OpenClaw 的工程设计精髓,也要清醒地认识到它的安全短板,补齐企业级的治理与防护能力,才能真正打造出既可靠、又安全的 AI Agent 系统。