<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>企业技术 on POOROPS</title><link>https://blog.20231106.xyz/tags/%E4%BC%81%E4%B8%9A%E6%8A%80%E6%9C%AF/</link><description>Recent content in 企业技术 on POOROPS</description><generator>Hugo -- gohugo.io</generator><language>en-us</language><managingEditor>poorops@163.com (poorops)</managingEditor><webMaster>poorops@163.com (poorops)</webMaster><lastBuildDate>Fri, 13 Mar 2026 09:00:00 +0800</lastBuildDate><atom:link href="https://blog.20231106.xyz/tags/%E4%BC%81%E4%B8%9A%E6%8A%80%E6%9C%AF/index.xml" rel="self" type="application/rss+xml"/><item><title>数据基础设施才是 Agent 成功的底盘：一篇写给技术负责人的 AI 热点拆解</title><link>https://blog.20231106.xyz/posts/2026-03-13/%E6%95%B0%E6%8D%AE%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD%E6%89%8D%E6%98%AFagent%E6%88%90%E5%8A%9F%E7%9A%84%E5%BA%95%E7%9B%98%E4%B8%80%E7%AF%87%E5%86%99%E7%BB%99%E6%8A%80%E6%9C%AF%E8%B4%9F%E8%B4%A3%E4%BA%BA%E7%9A%84ai%E7%83%AD%E7%82%B9%E6%8B%86%E8%A7%A3/</link><pubDate>Fri, 13 Mar 2026 09:00:00 +0800</pubDate><author>poorops@163.com (poorops)</author><guid>https://blog.20231106.xyz/posts/2026-03-13/%E6%95%B0%E6%8D%AE%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD%E6%89%8D%E6%98%AFagent%E6%88%90%E5%8A%9F%E7%9A%84%E5%BA%95%E7%9B%98%E4%B8%80%E7%AF%87%E5%86%99%E7%BB%99%E6%8A%80%E6%9C%AF%E8%B4%9F%E8%B4%A3%E4%BA%BA%E7%9A%84ai%E7%83%AD%E7%82%B9%E6%8B%86%E8%A7%A3/</guid><description>&lt;p&gt;凌晨 1 点，值班群里突然跳出一句话：&lt;strong&gt;“Agent 在内测环境跑得挺聪明，怎么一上生产就像失忆？”&lt;/strong&gt; 我盯着监控曲线和一堆报错，脑子里冒出一个最直观的答案：不是模型退化了，而是&lt;strong&gt;它失去了“可用的数据地基”&lt;/strong&gt;。在 2026 年的 AI 热点里，Agentic AI 成了流量中心，但真正决定能否落地的，是更底层的一件事——&lt;strong&gt;数据基础设施&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="效果展示agent-真正稳定好用的那一刻"&gt;效果展示：Agent 真正“稳定好用”的那一刻&lt;/h2&gt;
&lt;p&gt;当数据底盘扎实，Agent 才会表现出“像系统一样可靠”的特质：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;能持续记住用户上下文&lt;/strong&gt;：不仅靠模型上下文窗口，还依赖高质量检索与长期记忆库&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;能快速定位事实与证据&lt;/strong&gt;：把问题映射到结构化数据、文档库、事件日志&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;能把一次对话变成一次交付&lt;/strong&gt;：输出结果可复盘、可追踪、可落地&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;你会发现，那种“AI 一上生产就变笨”的现象，本质上是&lt;strong&gt;检索失败、数据断链、权限混乱&lt;/strong&gt;。模型只是负责思考，真正的“执行能力”，来自数据与系统的组织方式。&lt;/p&gt;
&lt;h2 id="问题描述为什么模型变强并不等于系统可用"&gt;问题描述：为什么“模型变强”并不等于“系统可用”？&lt;/h2&gt;
&lt;p&gt;很多团队把精力押在模型升级上，但真正落地时卡在三道坎：&lt;/p&gt;
&lt;h3 id="1-数据碎片化信息散落检索即失败"&gt;1) 数据碎片化：信息散落，检索即失败&lt;/h3&gt;
&lt;p&gt;知识在文档、Wiki、工单、代码仓库、消息群里各自为战，Agent 无法“聚焦”出可靠答案。&lt;/p&gt;
&lt;h3 id="2-语义断链向量化只是起点不是终点"&gt;2) 语义断链：向量化只是起点，不是终点&lt;/h3&gt;
&lt;p&gt;没有规范的切分策略、标签体系与召回规则，向量检索反而会拉低回答质量。&lt;/p&gt;
&lt;h3 id="3-可追踪性缺失无法解释为何给出这个答案"&gt;3) 可追踪性缺失：无法解释为何给出这个答案&lt;/h3&gt;
&lt;p&gt;缺少数据血缘与引用机制，导致产出无法在组织中被信任。&lt;/p&gt;
&lt;p&gt;一句话总结：&lt;strong&gt;模型是大脑，数据基础设施才是神经系统&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="步骤教学搭建-agent-数据底盘的-4-个关键步骤"&gt;步骤教学：搭建 Agent 数据底盘的 4 个关键步骤&lt;/h2&gt;
&lt;p&gt;如果你是技术负责人，下面是一条可执行的路线图。&lt;/p&gt;
&lt;h3 id="步骤-1做一次数据资产清点建立可检索边界"&gt;步骤 1：做一次“数据资产清点”，建立可检索边界&lt;/h3&gt;
&lt;p&gt;先别急着上向量库，先把数据边界画出来：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;业务核心文档（标准流程、SOP、合同、FAQ）&lt;/li&gt;
&lt;li&gt;结构化数据（数据库、数据仓库、报表系统）&lt;/li&gt;
&lt;li&gt;事件型数据（客服工单、日志、告警、通知）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;这一步的目标不是“全量”，而是“可用与可控”。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="步骤-2构建可解释检索层把答案追溯回来源"&gt;步骤 2：构建“可解释检索层”，把答案追溯回来源&lt;/h3&gt;
&lt;p&gt;为高价值知识建立统一入口：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;统一切分策略（按章节/语义块切分）&lt;/li&gt;
&lt;li&gt;强制打标签（作者、更新时间、业务线、敏感级别）&lt;/li&gt;
&lt;li&gt;明确召回规则（可信度阈值、置信度校验、引用要求）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这样 Agent 输出的每一句话，都能指回“哪份材料、哪段原文”。&lt;/p&gt;
&lt;h3 id="步骤-3把实时数据接入工作流而不是聊天窗"&gt;步骤 3：把实时数据接入“工作流”，而不是“聊天窗”&lt;/h3&gt;
&lt;p&gt;真正的 Agent 不是只回答问题，而是参与流程：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;将检索结果接入审批、工单、CRM 等系统&lt;/li&gt;
&lt;li&gt;在流程节点插入 Agent 决策（例如初筛、摘要、优先级判断）&lt;/li&gt;
&lt;li&gt;每一步产生可记录、可审计的中间产物&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;让 Agent 成为流程的一部分，才能真正具备交付能力。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="步骤-4引入数据治理与权限控制建立信任体系"&gt;步骤 4：引入“数据治理与权限控制”，建立信任体系&lt;/h3&gt;
&lt;p&gt;越到后期越关键：&lt;/p&gt;</description><content>&lt;p&gt;凌晨 1 点，值班群里突然跳出一句话：&lt;strong&gt;“Agent 在内测环境跑得挺聪明，怎么一上生产就像失忆？”&lt;/strong&gt; 我盯着监控曲线和一堆报错，脑子里冒出一个最直观的答案：不是模型退化了，而是&lt;strong&gt;它失去了“可用的数据地基”&lt;/strong&gt;。在 2026 年的 AI 热点里，Agentic AI 成了流量中心，但真正决定能否落地的，是更底层的一件事——&lt;strong&gt;数据基础设施&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="效果展示agent-真正稳定好用的那一刻"&gt;效果展示：Agent 真正“稳定好用”的那一刻&lt;/h2&gt;
&lt;p&gt;当数据底盘扎实，Agent 才会表现出“像系统一样可靠”的特质：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;能持续记住用户上下文&lt;/strong&gt;：不仅靠模型上下文窗口，还依赖高质量检索与长期记忆库&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;能快速定位事实与证据&lt;/strong&gt;：把问题映射到结构化数据、文档库、事件日志&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;能把一次对话变成一次交付&lt;/strong&gt;：输出结果可复盘、可追踪、可落地&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;你会发现，那种“AI 一上生产就变笨”的现象，本质上是&lt;strong&gt;检索失败、数据断链、权限混乱&lt;/strong&gt;。模型只是负责思考，真正的“执行能力”，来自数据与系统的组织方式。&lt;/p&gt;
&lt;h2 id="问题描述为什么模型变强并不等于系统可用"&gt;问题描述：为什么“模型变强”并不等于“系统可用”？&lt;/h2&gt;
&lt;p&gt;很多团队把精力押在模型升级上，但真正落地时卡在三道坎：&lt;/p&gt;
&lt;h3 id="1-数据碎片化信息散落检索即失败"&gt;1) 数据碎片化：信息散落，检索即失败&lt;/h3&gt;
&lt;p&gt;知识在文档、Wiki、工单、代码仓库、消息群里各自为战，Agent 无法“聚焦”出可靠答案。&lt;/p&gt;
&lt;h3 id="2-语义断链向量化只是起点不是终点"&gt;2) 语义断链：向量化只是起点，不是终点&lt;/h3&gt;
&lt;p&gt;没有规范的切分策略、标签体系与召回规则，向量检索反而会拉低回答质量。&lt;/p&gt;
&lt;h3 id="3-可追踪性缺失无法解释为何给出这个答案"&gt;3) 可追踪性缺失：无法解释为何给出这个答案&lt;/h3&gt;
&lt;p&gt;缺少数据血缘与引用机制，导致产出无法在组织中被信任。&lt;/p&gt;
&lt;p&gt;一句话总结：&lt;strong&gt;模型是大脑，数据基础设施才是神经系统&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="步骤教学搭建-agent-数据底盘的-4-个关键步骤"&gt;步骤教学：搭建 Agent 数据底盘的 4 个关键步骤&lt;/h2&gt;
&lt;p&gt;如果你是技术负责人，下面是一条可执行的路线图。&lt;/p&gt;
&lt;h3 id="步骤-1做一次数据资产清点建立可检索边界"&gt;步骤 1：做一次“数据资产清点”，建立可检索边界&lt;/h3&gt;
&lt;p&gt;先别急着上向量库，先把数据边界画出来：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;业务核心文档（标准流程、SOP、合同、FAQ）&lt;/li&gt;
&lt;li&gt;结构化数据（数据库、数据仓库、报表系统）&lt;/li&gt;
&lt;li&gt;事件型数据（客服工单、日志、告警、通知）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;这一步的目标不是“全量”，而是“可用与可控”。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="步骤-2构建可解释检索层把答案追溯回来源"&gt;步骤 2：构建“可解释检索层”，把答案追溯回来源&lt;/h3&gt;
&lt;p&gt;为高价值知识建立统一入口：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;统一切分策略（按章节/语义块切分）&lt;/li&gt;
&lt;li&gt;强制打标签（作者、更新时间、业务线、敏感级别）&lt;/li&gt;
&lt;li&gt;明确召回规则（可信度阈值、置信度校验、引用要求）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这样 Agent 输出的每一句话，都能指回“哪份材料、哪段原文”。&lt;/p&gt;
&lt;h3 id="步骤-3把实时数据接入工作流而不是聊天窗"&gt;步骤 3：把实时数据接入“工作流”，而不是“聊天窗”&lt;/h3&gt;
&lt;p&gt;真正的 Agent 不是只回答问题，而是参与流程：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;将检索结果接入审批、工单、CRM 等系统&lt;/li&gt;
&lt;li&gt;在流程节点插入 Agent 决策（例如初筛、摘要、优先级判断）&lt;/li&gt;
&lt;li&gt;每一步产生可记录、可审计的中间产物&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;让 Agent 成为流程的一部分，才能真正具备交付能力。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="步骤-4引入数据治理与权限控制建立信任体系"&gt;步骤 4：引入“数据治理与权限控制”，建立信任体系&lt;/h3&gt;
&lt;p&gt;越到后期越关键：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;数据权限粒度（人/部门/场景）&lt;/li&gt;
&lt;li&gt;内容更新机制（谁负责维护？如何过期？）&lt;/li&gt;
&lt;li&gt;失败兜底策略（召回失败 → 使用人工知识库或触发人工复核）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果没有治理，Agent 只能在沙箱里表现优秀，一到生产就失控。&lt;/p&gt;
&lt;h2 id="升华总结ai-热点真正的拐点是工程化的数据信任"&gt;升华总结：AI 热点真正的拐点是“工程化的数据信任”&lt;/h2&gt;
&lt;p&gt;2026 年的 Agent 热，不是“模型突然更聪明”，而是组织终于意识到：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;AI 的生产力不是“更会聊”，而是“更能交付”&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;交付能力取决于数据链路是否闭环&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;闭环的关键，是数据基础设施与治理体系&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以当你在会上被问到“Agent 什么时候能落地”，答案不是“等模型更强”，而是：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;等我们的数据底盘先搭起来。&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这也是为什么越来越多前沿机构把“数据基础设施”当作 Agent 时代的关键战场。AI 热点背后，真正的胜负手在工程，而不在发布会。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;参考链接：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://www.technologyreview.com/2026/03/10/1134083/building-a-strong-data-infrastructure-for-ai-agent-success/"&gt;https://www.technologyreview.com/2026/03/10/1134083/building-a-strong-data-infrastructure-for-ai-agent-success/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://www.technologyreview.com/2026/03/11/1134179/china-openclaw-gold-rush/"&gt;https://www.technologyreview.com/2026/03/11/1134179/china-openclaw-gold-rush/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://www.poorops.com/"&gt;https://www.poorops.com/&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</content></item></channel></rss>