<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI 基础设施 on POOROPS</title><link>https://blog.20231106.xyz/tags/ai-%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD/</link><description>Recent content in AI 基础设施 on POOROPS</description><generator>Hugo -- gohugo.io</generator><language>en-us</language><managingEditor>poorops@163.com (poorops)</managingEditor><webMaster>poorops@163.com (poorops)</webMaster><lastBuildDate>Sun, 29 Mar 2026 09:00:00 +0800</lastBuildDate><atom:link href="https://blog.20231106.xyz/tags/ai-%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD/index.xml" rel="self" type="application/rss+xml"/><item><title>英伟达 GTC 2026：Agentic AI 从实验走向持久系统</title><link>https://blog.20231106.xyz/posts/2026-03-29/nvidia-gtc-2026-agentic-ai-persistent-systems/</link><pubDate>Sun, 29 Mar 2026 09:00:00 +0800</pubDate><author>poorops@163.com (poorops)</author><guid>https://blog.20231106.xyz/posts/2026-03-29/nvidia-gtc-2026-agentic-ai-persistent-systems/</guid><description>&lt;p&gt;凌晨两点，我盯着一条夜里弹出的告警：模型又“临时记忆丢失”了。昨天还好好的自动工单代理，今天一重启就像失忆——看似聪明，实际只是在“短暂即兴”。直到我看到 GTC 2026 的现场报道，才意识到这不是我们一家团队的尴尬，而是整个行业的阶段性困境：&lt;strong&gt;Agentic AI 要从实验性质的提示工程，走向真正可持续、可运营的持久系统。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;NVIDIA 在 GTC 2026 的现场更新中明确指出：Agentic AI 正从“会答问题”的模型形态，进入“持续运行、可管理、可进化”的系统形态。这条信息之所以成为 AI 热点，是因为它把 AI 的价值从“单次对话”推向“长期运转”。而这恰好是企业落地最需要的那一层。&lt;/p&gt;
&lt;p&gt;下面按清晰结构展开：先看它带来的效果，再解释为什么成为热点，最后给出一条可执行的落地路线。&lt;/p&gt;
&lt;h2 id="效果展示agentic-ai-变成能持续交付的系统"&gt;效果展示：Agentic AI 变成“能持续交付”的系统&lt;/h2&gt;
&lt;p&gt;GTC 2026 抛出的最大信号是：**Agentic AI 不再只追求“单次表现”，而是要保证“持续性”。**这会在企业落地中带来三个直接改变：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从一次对话，变成长期流程&lt;/strong&gt;
过去的代理像“短跑选手”，每次请求都重新起跑；现在的目标是“马拉松选手”，能在一个业务流程中持续工作，记录状态、维护上下文、逐步累积成果。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从“临时脚本”变成可运营产品&lt;/strong&gt;
当代理开始承担真实业务（工单、投研、客服、运营），团队关心的就不只是“聪不聪明”，而是“能不能稳定运行、好不好维护”。这要求系统具备监控、审计、版本控制等运营能力。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从模型单点优化，转向系统协同优化&lt;/strong&gt;
Agentic AI 的性能不再只由模型决定。检索、工具链、缓存策略、成本控制、失败回退——这些系统层因素开始决定最终用户体验。GTC 2026 强调的正是这个“系统协同”的拐点。&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;一句话总结：&lt;strong&gt;Agentic AI 的价值正从“会说”转向“会做、会持续做”。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="问题描述为什么持久系统化成了-ai-热点"&gt;问题描述：为什么“持久系统化”成了 AI 热点？&lt;/h2&gt;
&lt;h3 id="1-企业真正需要的是持续产出不是单次惊艳"&gt;1) 企业真正需要的是“持续产出”，不是“单次惊艳”&lt;/h3&gt;
&lt;p&gt;一个漂亮的 Demo 可以让人兴奋，但真正有价值的是每天稳定交付。多数团队发现：代理在 10 分钟内表现很好，但在 10 天内表现飘忽。这就是“短暂即兴”的问题。&lt;/p&gt;
&lt;h3 id="2-成本与可靠性正成为落地门槛"&gt;2) 成本与可靠性正成为落地门槛&lt;/h3&gt;
&lt;p&gt;Agentic AI 运行在真实业务里，必须考虑成本：推理成本、工具调用成本、人工审核成本。如果系统不能自我管理，这些成本会像漏水的桶，越用越贵。&lt;/p&gt;
&lt;h3 id="3-监管与合规要求正在上升"&gt;3) 监管与合规要求正在上升&lt;/h3&gt;
&lt;p&gt;当代理开始自动做决定，就必须可解释、可追踪。可解释性与审计机制不是“锦上添花”，而是合规门槛。GTC 2026 的讨论将“持久系统”与“可管理性”放在一起，正是对现实需求的回应。&lt;/p&gt;
&lt;h3 id="4-业务流程复杂短期智能不足以解决"&gt;4) 业务流程复杂，短期智能不足以解决&lt;/h3&gt;
&lt;p&gt;真实业务流程不是“一问一答”，而是跨系统、跨角色、跨时间。代理要想真正替代人力，就必须具备跨时间维度的持续能力。&lt;/p&gt;
&lt;p&gt;因此，“持久系统化”不是概念升级，而是&lt;strong&gt;Agentic AI 从实验走向生产的必经路。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="步骤教学打造持久-agentic-ai-系统的工程化路线"&gt;步骤教学：打造“持久 Agentic AI 系统”的工程化路线&lt;/h2&gt;
&lt;p&gt;下面给出一条可执行路线，帮助团队把代理从“会说”升级到“会持续做”。&lt;/p&gt;</description><content>&lt;p&gt;凌晨两点，我盯着一条夜里弹出的告警：模型又“临时记忆丢失”了。昨天还好好的自动工单代理，今天一重启就像失忆——看似聪明，实际只是在“短暂即兴”。直到我看到 GTC 2026 的现场报道，才意识到这不是我们一家团队的尴尬，而是整个行业的阶段性困境：&lt;strong&gt;Agentic AI 要从实验性质的提示工程，走向真正可持续、可运营的持久系统。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;NVIDIA 在 GTC 2026 的现场更新中明确指出：Agentic AI 正从“会答问题”的模型形态，进入“持续运行、可管理、可进化”的系统形态。这条信息之所以成为 AI 热点，是因为它把 AI 的价值从“单次对话”推向“长期运转”。而这恰好是企业落地最需要的那一层。&lt;/p&gt;
&lt;p&gt;下面按清晰结构展开：先看它带来的效果，再解释为什么成为热点，最后给出一条可执行的落地路线。&lt;/p&gt;
&lt;h2 id="效果展示agentic-ai-变成能持续交付的系统"&gt;效果展示：Agentic AI 变成“能持续交付”的系统&lt;/h2&gt;
&lt;p&gt;GTC 2026 抛出的最大信号是：**Agentic AI 不再只追求“单次表现”，而是要保证“持续性”。**这会在企业落地中带来三个直接改变：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从一次对话，变成长期流程&lt;/strong&gt;
过去的代理像“短跑选手”，每次请求都重新起跑；现在的目标是“马拉松选手”，能在一个业务流程中持续工作，记录状态、维护上下文、逐步累积成果。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从“临时脚本”变成可运营产品&lt;/strong&gt;
当代理开始承担真实业务（工单、投研、客服、运营），团队关心的就不只是“聪不聪明”，而是“能不能稳定运行、好不好维护”。这要求系统具备监控、审计、版本控制等运营能力。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;从模型单点优化，转向系统协同优化&lt;/strong&gt;
Agentic AI 的性能不再只由模型决定。检索、工具链、缓存策略、成本控制、失败回退——这些系统层因素开始决定最终用户体验。GTC 2026 强调的正是这个“系统协同”的拐点。&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;一句话总结：&lt;strong&gt;Agentic AI 的价值正从“会说”转向“会做、会持续做”。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="问题描述为什么持久系统化成了-ai-热点"&gt;问题描述：为什么“持久系统化”成了 AI 热点？&lt;/h2&gt;
&lt;h3 id="1-企业真正需要的是持续产出不是单次惊艳"&gt;1) 企业真正需要的是“持续产出”，不是“单次惊艳”&lt;/h3&gt;
&lt;p&gt;一个漂亮的 Demo 可以让人兴奋，但真正有价值的是每天稳定交付。多数团队发现：代理在 10 分钟内表现很好，但在 10 天内表现飘忽。这就是“短暂即兴”的问题。&lt;/p&gt;
&lt;h3 id="2-成本与可靠性正成为落地门槛"&gt;2) 成本与可靠性正成为落地门槛&lt;/h3&gt;
&lt;p&gt;Agentic AI 运行在真实业务里，必须考虑成本：推理成本、工具调用成本、人工审核成本。如果系统不能自我管理，这些成本会像漏水的桶，越用越贵。&lt;/p&gt;
&lt;h3 id="3-监管与合规要求正在上升"&gt;3) 监管与合规要求正在上升&lt;/h3&gt;
&lt;p&gt;当代理开始自动做决定，就必须可解释、可追踪。可解释性与审计机制不是“锦上添花”，而是合规门槛。GTC 2026 的讨论将“持久系统”与“可管理性”放在一起，正是对现实需求的回应。&lt;/p&gt;
&lt;h3 id="4-业务流程复杂短期智能不足以解决"&gt;4) 业务流程复杂，短期智能不足以解决&lt;/h3&gt;
&lt;p&gt;真实业务流程不是“一问一答”，而是跨系统、跨角色、跨时间。代理要想真正替代人力，就必须具备跨时间维度的持续能力。&lt;/p&gt;
&lt;p&gt;因此，“持久系统化”不是概念升级，而是&lt;strong&gt;Agentic AI 从实验走向生产的必经路。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="步骤教学打造持久-agentic-ai-系统的工程化路线"&gt;步骤教学：打造“持久 Agentic AI 系统”的工程化路线&lt;/h2&gt;
&lt;p&gt;下面给出一条可执行路线，帮助团队把代理从“会说”升级到“会持续做”。&lt;/p&gt;
&lt;h3 id="步骤-1定义持久性的指标而不是口号"&gt;步骤 1：定义“持久性”的指标，而不是口号&lt;/h3&gt;
&lt;p&gt;首先把“持久性”量化：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;任务生命周期&lt;/strong&gt;：一次代理流程最长可持续多久？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;中断恢复能力&lt;/strong&gt;：重启后能否恢复状态？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;跨会话一致性&lt;/strong&gt;：连续多天任务是否偏离目标？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;没有指标，持久性只会停留在口号层面。&lt;/p&gt;
&lt;h3 id="步骤-2建立状态与记忆的系统层结构"&gt;步骤 2：建立“状态与记忆”的系统层结构&lt;/h3&gt;
&lt;p&gt;持久系统的关键是“状态”。建议建立三层记忆：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;短期状态&lt;/strong&gt;：当前任务的中间变量&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;中期状态&lt;/strong&gt;：跨会话的任务进度&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;长期状态&lt;/strong&gt;：可复用的用户偏好与知识&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;状态必须可持久化，且有版本控制能力，避免“记错、记丢”。&lt;/p&gt;
&lt;h3 id="步骤-3把失败回退当成默认流程"&gt;步骤 3：把“失败回退”当成默认流程&lt;/h3&gt;
&lt;p&gt;生产系统的常态不是“每次成功”，而是“可控失败”。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;失败分级&lt;/strong&gt;：轻度错误自动重试，严重错误触发人工介入&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;可回滚&lt;/strong&gt;：支持回退到上一个可信状态&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;失败可见&lt;/strong&gt;：出错原因可追溯&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这能避免代理“越走越错”，并让系统持续可用。&lt;/p&gt;
&lt;h3 id="步骤-4引入成本感知的执行策略"&gt;步骤 4：引入“成本感知”的执行策略&lt;/h3&gt;
&lt;p&gt;持久系统的成本更敏感，需要控制：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;缓存策略&lt;/strong&gt;：避免重复调用高成本模型&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;任务分层&lt;/strong&gt;：低风险任务用轻量模型，高风险任务用强模型&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;预算上限&lt;/strong&gt;：每个任务设定成本阈值，超过则降级&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这一步决定系统能否规模化运行。&lt;/p&gt;
&lt;h3 id="步骤-5建立可运营的观测与审计体系"&gt;步骤 5：建立“可运营”的观测与审计体系&lt;/h3&gt;
&lt;p&gt;Agentic AI 进入生产后，观测是生存线：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;日志追踪&lt;/strong&gt;：每一步调用要可追溯&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;行为审计&lt;/strong&gt;：关键决策要可解释&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;效果评估&lt;/strong&gt;：结果有量化指标（成功率、节省时间等）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这决定系统能否真正被信任。&lt;/p&gt;
&lt;h3 id="步骤-6把人机协作设计成默认模式"&gt;步骤 6：把“人机协作”设计成默认模式&lt;/h3&gt;
&lt;p&gt;持久系统并不意味着全自动，而是&lt;strong&gt;把人机协作写进流程&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;人类负责关键判断&lt;/li&gt;
&lt;li&gt;AI 负责重复劳动&lt;/li&gt;
&lt;li&gt;让“审核”成为系统的一部分，而不是额外成本&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;只有协作机制稳定，系统才能长期发挥价值。&lt;/p&gt;
&lt;h2 id="升华总结agentic-ai-的真正拐点是可持续的系统能力"&gt;升华总结：Agentic AI 的真正拐点，是“可持续的系统能力”&lt;/h2&gt;
&lt;p&gt;GTC 2026 给行业的信号是清晰的：&lt;strong&gt;Agentic AI 不只是模型能力的演进，而是系统能力的觉醒。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;当代理能够跨时间持续工作、可恢复、可审计、可控成本，它就不再是“实验室的小玩具”，而是一条可以承载业务的“生产线”。&lt;/p&gt;
&lt;p&gt;这意味着：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;真正的竞争力来自“系统化”而不是“模型参数”&lt;/li&gt;
&lt;li&gt;代理的价值来自“持续交付”而不是“单次惊艳”&lt;/li&gt;
&lt;li&gt;AI 的下一阶段不是更聪明，而是更可靠&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;当你再次看到代理“失忆”或“越跑越偏”时，不妨想想：问题不是模型，而是系统。GTC 2026 的热点提醒我们，&lt;strong&gt;AI 的下一次拐点，是把智能变成可持续的工程。&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;参考链接：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;来源：NVIDIA Blog｜GTC 2026: Live Updates on What’s Next in AI
&lt;a href="https://blogs.nvidia.com/blog/gtc-2026-news/"&gt;https://blogs.nvidia.com/blog/gtc-2026-news/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;来源：Google Cloud Blog｜Google Cloud AI infrastructure at NVIDIA GTC 2026
&lt;a href="https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026"&gt;https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;站点：https://www.poorops.com/&lt;/li&gt;
&lt;/ul&gt;</content></item></channel></rss>