James Feng
广东端到端咨询合伙人,长期站在业务流程、AI产品与企业落地的交叉点上做项目和培训。
把企业经验写成 Skill,把 AI 能力落到真实流程。
他讲的不是“今天有哪些热门工具”,而是企业怎样把流程场景、业务规则、智能体、产品原型和组织机制连起来,让个人能力变成可复用、可评测、可运营的组织能力。
世界500强与互联网背景
长期参与业务、流程、数字化和AI交叉场景,熟悉企业真实推进阻力。
流程 × Skill × Agent
从流程节点识别机会,把专家经验沉淀成可复用Skill和智能体能力。
项目级交付视角
关注原型、评测、权限、日志、运营和组织机制,不止停留在课堂演示。
一套AI常识框架
知道AI是什么、能干什么、什么事情不适合直接交给AI。
一次智能体演练
打开斑头雁 BetterYeah AI 智能体平台,亲手理解模型、知识、工具、上下文和智能体结构。
一份领域Skill清单
每个领域识别机会,形成5-10个Skill雏形。
一套Skill评测方法
用规范、触发、执行质量、Benchmark、可维护五维度持续打磨Skill。
两轮AI Coding实战
先做个人插件助手,再用许愿卡片互换开发一个数字产品。
一套AI变革五步法
从顶格战略、蓝图规划、能力筑基到试点验证和规模推广。
一组可复制材料
模板、评测包、PRD和课堂Skill资源平台均可在课件里打开。
AI课与其他课不同,互动越多、动手越多,学习效果越好。
课堂积分和课后内容挑战分别计分,但所有人最终只领取一项最高奖励。
动手
再动手
课堂互动积分
课后传播挑战
AI时代,流程专家要先成为AI超级个体
AI正在重写流程、PMO与质量管理的专业标准:个人先升级,组织再把方法沉淀为能力。
当AI进入企业流程体系,流程专家的价值不再只是“把标准写清楚”,而是能把AI用进诊断、执行、沉淀和运营。
| 过去的专业要求 | AI时代的新要求 |
|---|---|
| 流程文件做到标准 | 会用AI提效、诊断和运营 |
| 会访谈、画流程、开评审会 | 会让AI整理材料、生成初稿、追踪行动项 |
| 懂业务流程和质量经验 | 能把经验写成Skill,让AI按标准复用 |
| 给IT或数字化团队提需求 | 能写PRD、搭原型、验收AI应用Demo |
人才密度
独立闭环的人越多,组织越能接住复杂问题。
AI杠杆
AI进入真实工作流越深,个人能力越能被放大。
组织摩擦
等待、审批、对齐、信息衰减会吃掉AI增益。
组织竞争力
不是工具数量相加,而是分子和分母同时改变。
| 公式维度 | 对流程 / PMO / 质量专家意味着什么 |
|---|---|
| 提升人才密度 | 培养更多能独立闭环、能判断、能验收的人 |
| 放大AI杠杆 | 让AI进入流程节点、Skill、Agent和业务系统 |
| 降低组织摩擦 | 减少等待、反复对齐和跨部门信息损耗 |
| 角色 | 表面问题 | 真正问题 |
|---|---|---|
| 老板 / 高管 | 公司怎么不掉队? | 投哪里、谁落地、如何变成经营结果 |
| 部门负责人 | 大家都在用AI,部门怎么管? | 经验如何沉淀,流程如何提效,风险如何可控 |
| 流程 / 数字化 / IT | 业务需求越来越多,怎么承接? | 如何把零散需求变成可复用能力体系 |
| 任务类型 | AI先改写什么 | 人要升级到哪里 |
|---|---|---|
| 文档和材料 | 纪要、报告、邮件、制度初稿 | 结构设计与事实审核 |
| 信息整理 | 抽取字段、归类、生成清单 | 信息质量把关 |
| 规则检查 | 合同初筛、报销检查、资料完整性检查 | 规则建模与例外判断 |
| 初级分析 | 异常归类、风险提示、假设生成 | 判断结论、验证假设 |
| 需求和原型 | PRD、小工具、页面、插件、脚本 | 先搭Demo,参与验收 |
同岗位更会用AI的人
同样工作更快、更稳、更可追踪。
跨岗位复合型人才
业务、流程、AI、产品一起做,拿走更多价值链环节。
更小更快的团队
用AI承担过去一个小团队的交付量。
已沉淀Skill的组织
经验进入工具和流程,而不只在个人脑子里。
AI超级个体 = 把AI排进工作动线,用专业判断指挥AI完成跨角色任务,并把有效做法沉淀出来。
| 结构特征 | 课堂解释 | 流程专家要练什么 |
|---|---|---|
| AI First | 先让AI跑一版,再由人校准 | 任务、材料、边界和输出标准 |
| 能力跃迁 | 一个人跑通过去多个角色接力的链路 | 流程建模、PRD、原型、测试 |
| 主动探索 | 主动寻找AI能改写的节点 | 机会扫描和小闭环试点 |
| 影响力溢出 | 不只自己变快,还让团队变快 | 沉淀Skill和可见Demo |
个人任务提效
先把报告、纪要、检查、分析用AI跑起来。
方法结构化
把有效做法写成流程、规则、模板和测试用例。
沉淀为Skill
明确触发、输入、步骤、输出和风险断点。
接入工具
放进智能体、插件或系统Demo里。
成果被看见
Demo、分享、复盘,让突破变成团队信号。
标准升高
流程、PMO、质量专家不能只会画流程和管节点,还要会用AI放大专业能力。
先成为超级个体
用 AI First 跑通任务闭环,把有效方法沉淀成Skill、原型和可验收成果。
再推动超级组织
把专家经验变成可见、可复用、可评测的组织能力,而不是人人各玩各的AI。
事实包
投诉原文、检验记录、批次、图片、工艺变更。
规则包
8D模板、判定标准、客户沟通口径、WHEN NOT。
工具包
读表格、查历史、填模板、生成待办。
断点包
最终根因、责任归属、对外承诺必须人工确认。
贯穿案例
某批产品被客户反馈“尺寸异常”。质量工程师需要先整理客户投诉、检验记录、生产批次、工艺变更和8D模板,形成8D报告初稿,再由质量负责人判断和确认。
- AI适合:事实整理、缺失追问、原因假设、初稿生成。
- AI不适合直接做:最终定责、处罚建议、对外承诺。
| 案例元素 | 对应AI常识 | 如果缺失会怎样 |
|---|---|---|
| 投诉、检验、批次、变更 | Context / 知识 / RAG | AI只能按常识猜,容易编造事实 |
| 8D模板、质量规则 | Skill / System Prompt | 输出看着完整,但不符合企业标准 |
| 读Excel、查历史、填模板 | Tool / MCP | 模型只能“说想查”,不能真正拿到结果 |
| 负责人确认最终结论 | 人工断点 / 权限边界 | AI越权承担它无法承担的责任 |
| 概念 | 企业里真正要理解的边界 |
|---|---|
| AI | 机器参与写、读、归纳、判断、生成和工具调用,但不是自动拥有企业事实和责任授权。 |
| LLM | 大语言模型擅长根据上下文生成内容;上下文不足时,它可能生成“像答案的文字”。 |
| Prompt | 告诉AI任务、角色、材料、边界和输出标准;只写“帮我处理”通常不够。 |
| Context | 模型当次能看到的全部信息;投诉原文、检验表、历史案例不在上下文里,就不能当作事实使用。 |
同一句请求的两种结果
- 只说“帮我写8D”:AI会套常见8D格式,可能补出不存在的批次、原因和措施。
- 提供事实包和模板:AI先列事实、缺失项、原因假设和待确认事项,避免越权下结论。
- 加上Skill边界:AI遇到最终根因、责任归属、客户承诺时停止,转人工确认。
模型负责什么
负责理解、生成、判断下一步和提出工具调用请求。它不是天然知道企业事实,也不是自己真的打开系统。
平台负责什么
负责装配上下文、执行工具、记录结果、把工具返回的信息再次交给模型,让Agent形成多轮闭环。
聊天式AI
生产式AI
核心转向:从“让AI回答我”升级为“我和AI一起构建可验收、可复用、可追踪的工作系统”。
生成初稿
纪要、邮件、报告、8D初稿、复盘摘要。
材料理解
制度、表单、记录、反馈、客户投诉。
结构化整理
事实表、问题清单、缺失材料清单。
对比检查
合同条款、报销资料、历史异常差异。
知识问答
制度问答、流程问答、培训小测。
重复执行
按固定规则生成标准输出,适合沉淀成Skill。
| 判断标准 | 质量8D案例怎么落 | 为什么适合 |
|---|---|---|
| 高频重复 | 客户投诉、内部不良、来料异常都要整理初稿。 | 同类任务多,规则沉淀后复用价值高。 |
| 材料可见 | 投诉原文、检验记录、批次、模板都能提供。 | 上下文足够,AI不必凭空猜。 |
| 输出可验收 | 事实表、原因假设、行动项、待确认事项。 | 负责人能逐项检查、修改和采纳。 |
| 风险可切断 | 最终根因、责任归属、对外承诺留给人工。 | AI做准备工作,人承担最终判断。 |
| 选择原则 | 能看见材料、能定义标准、能人工验收、能留断点。 | 这类任务最容易从“好用”走向“可复用”。 |
| 不适合直接交给AI | 8D案例里的风险 | 正确做法 |
|---|---|---|
| 事实材料不可见 | 没有检验记录,却写出具体批次和数据。 | 先列缺失项,补材料后再生成。 |
| 规则口径不统一 | 不知道公司8D模板、客户沟通口径和质量判定标准。 | 先统一模板、规则和输出标准。 |
| 需要核心系统动作 | 直接改正式8D记录、发客户邮件或写入质量系统。 | 先做草稿和建议,正式动作走权限。 |
| 涉及责任与承诺 | 判断最终根因、责任部门、处罚建议和对外承诺。 | 必须设置人工断点,AI只给依据和待确认项。 |
低风险、可回滚
- 资料完整性检查。
- 生成待补材料清单。
有判断但不执行
- 列可能原因。
- 给验证动作建议。
规则或权限不清
- 模板未统一。
- 工具权限未拆分。
责任、授权、承诺
- 最终定责。
- 处罚和对外承诺。
| 概念 | 解决什么问题 | 8D案例对应动作 |
|---|---|---|
| RAG | 把相关知识找出来。 | 检索8D模板、质量制度、历史客诉。 |
| Tool / MCP | 把外部动作接进来。 | 读Excel、查历史、填草稿、发提醒。 |
| Skill | 规定何时用、怎么做、做到什么标准。 | 8D初稿的步骤、边界、字段和测试。 |
| Agent | 围绕目标组织多步执行。 | 查材料、套Skill、调用工具、标人工断点。 |
8D初稿Skill应该写清
- 适用:客户投诉、内部不良、来料异常。
- 输入:投诉描述、检验数据、批次信息、历史案例、8D模板。
- 步骤:查缺失、抽事实、归类原因、列行动项、标人工确认点。
- 输出:事实表、原因假设、临时措施、长期措施、待确认事项。
- 不适用:最终责任认定、处罚建议、对外正式承诺。
| Skill组成 | 必须写清 | 验收问题 |
|---|---|---|
| 触发边界 | WHEN / WHEN NOT 和正反例。 | 该用时能叫出,不该用时不会误用吗? |
| 执行步骤 | 先检查、再提取、再判断、再输出。 | 换一个人、换一批材料还能稳定吗? |
| 输出标准 | 格式、字段、质量要求、引用依据。 | 负责人能逐项验收和修改吗? |
| 测试用例 | 正常、缺失、混乱、高风险、空输入。 | 改版后还能回归测试吗? |
AI不是魔法
它是算力、方法、模型、平台、应用逐层组装出来的能力系统;聊天只是最容易看到的入口。
AI要回到任务
质量8D案例说明:有材料、有规则、有工具、有断点,AI才可能从“会说”走向“能用”。
Skill长在流程上
Skill不是一句提示词,而是把流程节点里的触发条件、业务规则、输出标准和测试题写成可复用能力。
快问快答挑战
共10道单选题,每题10分,满分100分
选项高亮即时反馈,答完查看总分
先看懂智能体,再进入平台演练
本章先讲清智能体的形态、来源和开发平台,再用斑头雁 BetterYeah AI 完成一个低敏业务智能体初版。
| 维度 | 要看什么 | 错误理解 |
|---|---|---|
| 入口形态 | 聊天框、工作台、插件、流程节点、后台任务。 | 以为智能体只能是一个聊天框。 |
| 能力形态 | 知识问答、材料整理、工具调用、流程推进、异常升级。 | 只看回答漂亮,不看能否完成任务。 |
| 控制形态 | 权限、日志、评测、人工断点、回滚。 | 让模型自由发挥,缺少业务控制。 |
最灵活,成本也最高
开发团队用代码实现Agent循环、工具调用、权限、日志和前端入口。适合核心系统、复杂权限、深度集成场景。
最快出样板间
在智能体开发平台里配置模型、提示词、知识库、工具、发布入口和测试。适合课堂演练、业务试点和低敏场景。
介于两者之间
使用 Agents SDK、LangGraph、Dify、Coze、n8n 等框架或平台,把多步流程、工具和状态管理编排起来。
| 选择问题 | 更适合的来源 | 案例 |
|---|---|---|
| 要嵌入内部ERP/OA并控制权限 | 源码开发 + 企业连接器 | AI审批助手侧边栏读取审批上下文。 |
| 要快速验证一个低敏业务助手 | 平台构建 | 斑头雁里搭质量8D初稿助手。 |
| 要做多步骤流程和工具链 | 框架编排 | 查材料、查历史、填模板、通知人工。 |
全流程智能体平台 · 管理台案例
http://139.224.117.80/dashboard · 当前为授权账号访问入口
平台构建适合什么
- 快速搭建低敏业务助手。
- 把提示词、知识、工具和测试放在同一个管理台。
- 让业务和管理员能看见智能体资产。
平台构建不等于正式上线
- 真实上线还要补企业SSO、数据分级、操作审计。
- 高风险动作要有人工确认和回滚路径。
- 平台演示通过后,再决定是否进入源码开发或深度集成。
斑头雁 BetterYeah AI 智能体平台
点击打开:https://ai.betteryeah.com/
选场景
从质量、生产、供应链、研发、人事、财务里选一个低敏流程节点。
进斑头雁
打开斑头雁 BetterYeah AI 智能体平台,进入智能体演练模块。
写提示词
把角色、任务、输入、输出、边界写进系统提示词。
加知识
按需要接入低敏模板、制度摘要、FAQ或样例。
测边界
用正常、缺失、混乱、高风险四类输入测试。
再发布
确认效果可控后发布为课堂演示版本。
打开斑头雁
进入斑头雁 BetterYeah AI 智能体平台。
创建应用
点击创建应用,选择智能体应用。
进入智能体配置
按斑头雁平台当前界面完成基础配置,便于后续添加知识、工具并发布。
命名
建议命名为“领域 + 任务 + 助手”,例如:质量8D初稿助手。
| 推荐场景 | 适合输入 | 练习输出物 |
|---|---|---|
| 质量8D初稿助手 | 客诉描述、不良现象、检验记录、8D模板 | 事实整理、原因假设、临时措施、待确认事项 |
| 供应商交付风险助手 | 交付计划、延期记录、来料异常、库存缺口 | 风险等级、原因分类、跟进行动清单 |
| 设备点检异常助手 | 点检记录、故障描述、维修记录、停机影响 | 异常归类、排查步骤、维修建议和升级提醒 |
| 工艺变更评审助手 | 变更申请、影响范围、试制数据、评审意见 | 影响分析、缺失材料、评审问题清单 |
| 配置项 | 配置重点 |
|---|---|
| 模型选择 | 选择平台中可用、适合多步理解和工具调用的模型,先跑通核心任务。 |
| 系统提示词 | 系统提示词决定智能体角色、行为边界和输出格式,是本章最重要的配置。 |
| 知识库配置 | 需要引用制度、模板、FAQ或低敏样例时,再把知识库接进来。 |
| 场景 | 系统提示词可写成这样 |
|---|---|
| 供应商交付风险助手 | 你是供应链交付风险分析助手。请根据低敏交付计划、延期记录、来料异常和库存缺口,输出风险等级、主要原因、影响范围、建议跟进行动、需要采购或计划确认的问题。不得编造供应商承诺,不得替负责人做最终处罚或切换供应商决定。 |
| 设备点检异常助手 | 你是设备点检异常整理助手。请根据点检记录、异常描述、维修记录和停机影响,整理异常分类、可能原因、排查步骤、临时处理建议、升级维修条件和待确认事项。不得跳过安全风险,不得替维修负责人做最终停机决定。 |
| 工艺变更评审助手 | 你是工艺变更评审辅助助手。请根据变更申请、影响范围、试制数据和评审意见,输出变更摘要、影响分析、缺失材料、评审问题清单、风险提示和后续验证建议。不得替评审委员会做最终通过决定。 |
| 测试类型 | 测试问题 |
|---|---|
| 正常输入 | 这里是一段客诉描述和检验记录,请整理8D初稿辅助材料。 |
| 缺失输入 | 只有一句“客户反馈尺寸异常”,请你处理。 |
| 格式混乱 | 把聊天记录、检验表摘要和口头描述混在一起,让智能体先归类再输出。 |
| 高风险输入 | 请直接判断责任部门并给出处罚建议。 |
运行轨迹看什么
不是看它回答得漂不漂亮,而是看每一步有没有依据、有没有工具记录、有没有遇到高风险就停下来。
对外怎么呈现
不展示完整内部推理,只展示结论、依据、引用材料、下一步动作和必须人工确认的位置。
先过四类问题
正常输入、缺失输入、格式混乱、高风险问题都跑一遍,至少知道它哪里能用、哪里不能用。
课堂可展示
在斑头雁平台中发布或保存课堂演示版本,让小组成员能现场打开、试问、复盘。
不是正式上线
把课堂结果带回业务现场,补真实低敏材料、补测试用例,再判断是否进入试点。
选一个场景
质量、供应链、生产、设备、工艺、人事任选一个低敏任务。
进入斑头雁
打开斑头雁 BetterYeah AI 智能体平台,进入智能体演练模块。
粘贴提示词
用本课模板改成自己领域的角色、任务、输入、输出和边界。
接低敏知识
有模板或FAQ就接,没有就先只用提示词跑通。
跑四类测试
正常、缺失、混乱、高风险各问一次。
准备展示
展示应用名称、解决场景、提示词亮点、测试结果和下一步要补的资料。
先识别形态
智能体不只是一种聊天框,也可以是工作台、系统侧边栏、流程节点或后台任务;形态取决于任务怎么进入业务现场。
再选择来源
源码开发适合深度集成,平台构建适合快速试点,框架编排适合多步工具链;不要用一种方式解决所有问题。
最后进入演练
进入斑头雁平台,选低敏场景,写系统提示词,接知识库,跑四类测试,再准备展示和复盘。
快问快答挑战
共10道单选题,每题10分,满分100分
选项高亮即时反馈,答完查看总分
领域Skill体系共创
不再重复概念,直接按流程领域扫描任务、挖掘机会、写出Skill,并用评测标准修第一版。
列L1职责领域
这个领域覆盖哪些大类工作,例如质量管理、供应商管理、招聘管理。
拆L2工作模块
每类职责下面有哪些稳定工作模块,例如客诉处理、供应商评价。
列L3具体任务
落到每天、每周、每月具体做什么,例如生成8D初稿。
标Skill机会
判断哪些任务高频、规则明确、可复用、风险可控。
流程体系的Skill平台
点击打开:https://zhenyuskill.com/all-skills
流程小册:Skill 挖掘分析报告
云帆数据客户需求交付流程 · 按节点评分、排序、封装预览
| 小册里要看什么 | 对应课堂动作 |
|---|---|
| 流程节点清单 | 不要泛泛找场景,而是逐节点看哪里能AI化。 |
| AI可执行度 / 重复频率 / 价值 / 实现难度 | 把感觉判断变成评分判断。 |
| Top 3 优先实施建议 | 从一堆机会里选首批,不要平均用力。 |
| 封装预览 | 看一个节点如何变成可复用 Skill。 |
| 评分维度 | 高分表现 | 低分提醒 |
|---|---|---|
| AI可执行度 | 输入输出清楚,规则能写成步骤 | 依赖临场判断,规则说不清 |
| 重复频率 | 每周、每月、每个项目都会发生 | 一年偶尔一次 |
| 价值释放空间 | 节省时间、减少返工、提升一致性明显 | 只是锦上添花 |
| 实现难度(反向) | 不需要复杂系统集成,低敏材料即可试跑 | 强依赖权限、接口和敏感数据 |
| 风险可控 | 只做初稿、提醒、检查和建议 | 涉及最终审批、付款、责任认定 |
| 维度 | 高分标准 |
|---|---|
| 价值 | 节省时间明显、减少错误明显、影响人数多 |
| 可行 | 输入材料清楚、规则明确、输出格式稳定 |
| 风险 | 不触碰重大审批、资金、合规红线 |
| 复用 | 多人、多项目、多周期可以重复使用 |
合同条款风险初筛Skill
对象和输出都清楚。
客户拜访纪要行动项提取Skill
明确动作:提取行动项。
质量异常8D报告初稿Skill
清楚是初稿,不是最终结论。
智能助手
太泛,无法判断何时调用。
帮我处理一下
没有对象和输出。
AI办公神器
口号,不是Skill。
| 模块 | 最低要求 | 为什么重要 |
|---|---|---|
| 适用场景 / 不适用场景 | WHEN / WHEN NOT | 决定触发边界 |
| 输入材料 | 必填、选填、禁止 | 决定结果质量 |
| 执行流程 | 5-10步具体动作 | 决定稳定性 |
| 输出标准 | 字段、格式、质量要求 | 决定能否验收 |
| 测试用例 | 至少5条 | 决定能否持续变好 |
| 维护信息 | Owner、版本、状态 | 决定能否运营 |
Skill 评测操练包
打开后复制 rubric.md 或 SKILL.md 进行评测
粘贴Skill初稿
让AI按五维标准评分。
读取P0/P1/P2
P0必须当场修完。
修完再评
记录前后得分变化。
| 字段 | 说明 |
|---|---|
| 领域 / Skill名称 | 哪类能力,叫什么 |
| 场景 / 输入 / 输出 | 什么时候用、用什么、交付什么 |
| 优先级 / 风险等级 | 先做哪个,哪些要谨慎 |
| Owner / 状态 | 后续谁维护,现在进度如何 |
| 评测得分 / 关键问题 / 测试状态 | 最近一次评测结果和整改情况 |
- 这个领域的L1 / L2 / L3工作架构是什么。
- 我们按流程节点识别了多少个Skill机会。
- 首批选择了哪5-10个,为什么。
- 最有价值的1个Skill是什么。
- 它输入什么、输出什么、能节省什么。
- 它当前评测得分是多少,P0/P1问题修了哪些。
- 下午准备把哪个Skill做成插件或产品原型。
从架构里挖
第四章不再重复概念,而是从领域工作架构和流程节点里找可复用能力。
用评分筛机会
Skill机会不是拍脑袋想出来的,而是沿着L3任务逐个看频率、价值、可行度和风险。
用评测变资产
Skill必须经过触发、执行、Benchmark和可维护性评测,才能从草稿变成组织能力。
快问快答挑战
共10道单选题,每题10分,满分100分
选项高亮即时反馈,答完查看总分
把Skill做成插件或产品Demo
下午进入两轮实战:先独立做插件,再互换卡片帮别人开发数字产品。
| 过去 | 现在 | 超级个体要做到 |
|---|---|---|
| 只会提需求 | 能写详细PRD | 把业务场景、边界、验收标准讲清 |
| 等IT排期 | 能先搭Demo | 把想法变成可点击、可讨论的原型 |
| 只看成品 | 能参与测试 | 知道正常、异常、风险输入怎么验 |
| 不懂实现 | 懂最小产品逻辑 | 能判断AI生成的东西是否可靠 |
做一个个人插件助手
把至少 3 个 Skill 放进浏览器插件里,让它能对话、读当前页面、打开网页,并贴着真实网页工作。
许愿卡片互换开发
把同伴的真实愿望做成可点击数字产品,训练需求追问、复述确认、开发迭代和上台展示。
Vibe Coding
真正的AI Coding
Qoder
适合把业务人员写出的PRD、Skill和页面想法快速变成可点击原型。课堂里用它训练“把需求讲完整、把结果验收清”的能力。
Codex
适合进入真实代码库做任务:读仓库规则、改代码、跑检查、修问题、准备可审查的变更。它的价值不是聊天,而是把工程任务跑到闭环。
Claude Code
适合在复杂仓库里持续协作。CLAUDE.md、Skills、MCP、Subagents、Hooks等机制,本质上是在给Agent补长期规则、工具和自动化检查。
Harness Engineering
不是某个按钮,而是把Agent放进可运行、可校验、可回滚的工程环境:上下文、权限、测试、日志、CI、评测和发布门槛。
业务人员看什么
不是模型名字,而是它能不能读懂业务流程、生成可用原型、暴露人工确认点、让需求方看得懂。
工程团队看什么
不是一次生成多漂亮,而是能不能遵守仓库规范、跑测试、保留变更记录、通过评审、可回滚。
管理者看什么
不是“用了AI”,而是需求吞吐、缺陷率、评审周期、复用资产、上线风险有没有真实改善。
| 分层 | 典型载体 | 工程价值 |
|---|---|---|
| 常驻规则 | AGENTS.md / CLAUDE.md | 把仓库地图、代码规范、禁止动作、交付口径写成Agent每次都能读到的规则。 |
| 可复用技能 | Skills / Skill库 | 把重复工作沉淀成可调用能力,例如评测、流程图、PPT、部署、合同审查。 |
| 外部工具 | MCP / Connectors / CLI | 让Agent能访问浏览器、文件、GitHub、Figma、企业系统,但必须受权限和边界约束。 |
| 隔离任务 | Subagents / Cloud tasks | 复杂任务拆给多个执行单元,适合并行做调研、修复、测试和文档补全。 |
| 自动检查 | Hooks / CI / Tests / Evals | 把“别忘了测试”变成系统动作,不靠人记忆,靠检查门槛拦住风险。 |
Context Harness
让Agent知道现场是什么。
- 仓库地图、流程图、接口文档
- 业务规则、制度、低敏样例
- 历史问题、失败案例、验收标准
Action Harness
让Agent能安全地做事。
- 工具权限、MCP、脚本、命令
- 沙箱、审批点、系统连接器
- 可执行但不越权的任务边界
Evaluation Harness
让Agent产出能被验证。
- 单元测试、回归集、Benchmark
- 人工断点、上线阈值、日志追踪
- 失败归因、复盘和持续改进
课堂案例:鲜食备货Agent
以鲜食备货案例为例,不应该让Agent只回答“明天备多少”。真正的交付物是一张可保存、可审批、可追溯的备货计划单。
可迁移方法
先定交付物,再拆事实包、工具、规则、质检和失败预案。这个方法同样适用于审批、采购比价、合同初筛、招聘筛选、客服工单。
AIPROS插件项目
从“能聊天”升级为能读页面、调用Skill、生成HTML产物,说明插件不是皮肤,而是AI进入网页现场的入口。
AI审批助手项目
插件浮在ERP上层,侧边栏读取审批单、补充历史报价和财务数据,但最终审批仍保留人工确认。
Skill评测项目
用正例、反例、结构检查、Benchmark和整改清单,把“好像能用”推进到“可维护、可复测”。
| Demo方向 | 输入材料 | 最小可演示版本 |
|---|---|---|
| AI工时管理 | 工时记录、项目任务、人员列表 | 自动归类工时、识别异常、生成周报 |
| AI排产助手 | 订单、产能、交期、设备约束 | 生成排产建议和冲突提醒 |
| 质量异常看板 | 不良记录、8D、检验结果 | 异常归因、风险分级、行动项 |
| 供应链风险台账 | 供应商报价、交付记录、库存 | 比价说明、交付风险、优先级 |
| 合同/报销初筛 | 合同条款、报销单据、制度 | 完整性检查、风险提示、人工确认点 |
1. 页面骨架
标题、说明、输入区、按钮、输出区全部可见,别人一眼知道这个工具做什么。
2. 示例输入
提供一段低敏样例,帮助用户理解材料格式,也方便现场测试。
3. 输出占位
先把输出结构固定住,再让AI填内容;结构不稳,模型再强也会乱。
| 测试层 | 看什么 | 最低要求 |
|---|---|---|
| Skill评测 | 规范、触发、执行质量、Benchmark、可维护 | 修完P0,落盘benchmark,至少修1-2个P1 |
| 产品测试 | 按钮、输入、输出、异常、展示 | 至少5条用例 |
| 业务验收 | 是否解决真实任务 | 2分钟讲清价值和下一步 |
| 项目 | 必须达到 |
|---|---|
| 产品名称 | 清楚 |
| 使用者 | 清楚 |
| 输入区 | 可粘贴或上传材料 |
| 生成按钮 | 可点击 |
| 输出区 | 有结构化结果 |
| Skill逻辑 | 能看出采用上午Skill方法 |
| 流程节点 | 能说清服务哪个流程环节 |
| 人工确认 | 有提示 |
| 展示说明 | 能讲清 |
所有人都交付一个可安装的 Chrome 个人插件助手
最低要求不是“页面好看”,而是能对话、能读当前页面、能打开网页、能调用自己的 Skill,并能在真实工作现场旁边使用。
基础插件能力
可加载到谷歌浏览器,侧边栏或弹窗可打开;具备基础对话能力。
页面工作能力
能输入网址打开网页;能读取当前页面标题、正文、选中文本或页面摘要。
Skill 内置能力
至少内置 3 个 Skill,可从审批、方案、流程图、流程文件等方向选择。
模型与记忆能力
先选提供商,再填 AK,再拉取模型并选择模型;能沉淀、补足和存储个人记忆。
| 模块 | 最低要求 | 进阶加分 |
|---|---|---|
| 内置 Skill | 审批意见速览、方案框架生成、流程图绘制、流程文件起草,四选三即可。 | 允许替换成自己岗位的真实 Skill,但要写清触发、输入、输出和边界。 |
| 模型适配 | 支持多家模型提供商配置,例如 DeepSeek、通义、OpenAI、Claude 等。 | 支持 provider → AK → 拉取模型 → 选择当前模型的完整链路。 |
| 页面与文件 | 能围绕当前网页继续追问,能把页面内容交给 Skill 处理。 | 能把分析结果、方案或流程图生成一个可打开的 HTML 文件。 |
| 记忆系统 | 能记录“我是谁、我的岗位、常用格式、常见业务背景”。 | 对话中发现缺失信息时,自动追问并补足长期记忆。 |
抛开技术限制,此刻你最想获得什么?
上课前或进场时写完许愿卡:可以是个人介绍页、业务系统、AI智能体、小工具、小产品,只要是数字世界里的产品都可以。允许提前“漏题”,但练习开始前卡片必须全部写完。
课前许愿
在卡片上写清:我想要什么、谁来用、解决什么问题、希望看到什么结果。
组内配对
同组内交换卡片;数字一样的人优先配对,商量谁先做、谁后做。
互为开发者
A先讲需求,B复述确认并开发;跑出结果后,双方角色调换。
上台分享
展示做出的数字产品,讲清需求、追问、开发过程和下一步想迭代什么。
许愿人
讲真实需求、补充背景、持续反馈,最后验收“这是不是我想要的”。
开发者
追问、复述、拆成页面和功能,用AI Coding快速做出可看的版本。
| 为什么这样玩 | 练习要求 |
|---|---|
| 没有互动、没有输入,AI Coding很容易只做出空页面。 | 开发前必须先听懂对方需求,并用自己的话复述一次。 |
| 真实需求来自别人,产品感会被迫长出来。 | 开发过程中可以反复追问,不许只照卡片机械生成。 |
| 角色互换后,大家同时体验“需求方”和“开发者”。 | 最终每组至少选一个作品上台分享,讲需求、过程和结果。 |
会做自己的工具
超级个体不只是会使用AI,还要能把业务想法做成可安装插件或可演示数字产品。
按需求把产品做实
AI Coding不是随手生成页面,而是在真实需求输入、追问、测试、验收中持续迭代。
开始具备产品化能力
当你能为自己做工具,也能为别人开发小产品,就能带团队把想法推向可复用成果。
快问快答挑战
共10道单选题,每题10分,满分100分
选项高亮即时反馈,答完查看总分
企业AI落地变革五步法
不是只画路线图,而是给超级个体和超级组织提供土壤、光照和水源。
| 前面解决了什么 | 组织落地还差什么 |
|---|---|
| 能力认知 | 个人知道AI能做什么,但组织还没有形成共同工作方式。 |
| Skill体系 | 有了原子能力,但成果还需要被看见、被复用、被运营。 |
| AI Coding | 能搭原型,但原型必须回到真实流程和业务价值。 |
提升人才密度
让更多人具备独立闭环能力。
放大AI杠杆
让AI深入流程节点和业务系统。
降低组织摩擦
减少等待、审批、对齐和信息衰减。
- 一把手工程
- 定义土壤光照水源
- 形成高层共识
- 18个月路线
- 锁定完整问题
- 明确价值目标
- AI平台
- 数据和工具权限
- 2周一迭代
- 对比实验
- Demo Day
- 人机协作SOP
- Skill应用商店
- AI午餐会
- 持续运营
土壤:完整问题
给真实业务问题、完整链路和足够上下文,不只给碎片任务。
光照:成果可见
让AI成果能展示、能被看见、能被同伴模仿。
水源:容错空间
允许小闭环试错,允许第二天推翻第一天的想法。
| 核心产出 | 说明 |
|---|---|
| 《AI转型愿景宣言》 | 讲清不是工具采购,而是组织竞争力重构。 |
| 园丁型治理机制 | 高层负责给问题、权限、展示舞台和容错边界。 |
| 第一批超级个体雷达 | 找到已经自发使用AI、做出超岗位产出的人。 |
业务架构
识别8-12个核心业务流程。
数据架构
形成数据资产目录和质量评分。
应用架构
AI平台与业务系统集成。
| 18个月路线图 | 核心动作 |
|---|---|
| 速赢期 0-6月 | 建共识、定蓝图。 |
| 攻坚期 6-12月 | 建能力、跑试点。 |
| 规模期 12-18月 | 全面推广。 |
| 能力 | 做法 | 关注点 |
|---|---|---|
| AI平台 | 私有化部署或云服务选型 | 数据安全、实施速度、适配行业。 |
| 首批场景 | 选1-2个高可行度场景,2周一个迭代 | 每个场景必须有量化目标。 |
| 数据资产 | 数据清洗与标注、领域知识库、质量监控 | 没有数据资产,就没有稳定AI能力。 |
| 核心能力 | 模型管理、A/B测试、监控告警 | 让AI能力可管理、可评测、可持续优化。 |
选择试点单位
选择一个业务单元,例如华东区销售团队;关键是试点单位有变革意愿,不能强推。
验证业务价值
用试点组 vs 对照组做对比实验,同时收集效率、成本、满意度和使用意愿。
| 组织流程调优三步 | 示例 |
|---|---|
| 调整岗位职责 | 客服从“解答问题”转向“处理复杂投诉”。 |
| 优化考核指标 | 从“处理量”转向“解决率”,用AI会改变KPI。 |
| 建立人机协作SOP | 明确AI做什么、人做什么、出错后如何处理。 |
AI午餐会
让同事现场展示用AI做出的真实成果,缩短心理距离。
每日一条
低门槛分享一个AI用法、一个提示词、一次失败或一次改进。
Demo Day
让个人突破变成团队信号,让成果可见、可模仿、可传播。
| AI创新生态 | 持续运营优化 |
|---|---|
| 共享Skill库 | 经验传递的最小单位从“说一段话”升级为“递一个可执行工具”。 |
| 内部Skill平台 | 沉淀Owner、版本、评测结果和复用案例。 |
| 试点复制 | 不是全员一刀切推广,而是把已验证的小闭环分裂复制。 |
组织打法
- 从销售、法务、HR、财务、战略等业务线抽顶尖人员,不把他们只当需求方。
- 2-3人小Scrum团队快速做场景,不先写厚PRD,先做出可用版本再判断。
- AI人员训练后回到业务,新一批业务专家再轮转进来,形成能力扩散。
平台打法
- 自研AIME企业级Agent平台,接入多模型,承载不同业务场景。
- 业务数据、知识数据、过程数据三层一起建设。
- AI Playground、Hackathon、使用排名和经验帖推动使用文化。
| 项目背景 | 内容 |
|---|---|
| 痛点 | 合同审核周期长,财务法务人力紧张。 |
| 目标 | 识别20个审核场景,覆盖50-60%审核流程。 |
| 涉及部门 | 财务、法务、合规等多部门协作。 |
顶格战略
CFO挂帅,明确审核时效降低50%。
蓝图规划
锁定合同、报销、付款审核等高价值场景。
能力筑基
搭建解析、Skill处理、Benchmark评测三层架构。
试点验证
用真实单据跑对比,持续修正规则和模型。
规模推广
沉淀标准审核Skill和上线检查清单。
| 指标 | 改进前 | 改进后 | 提升 |
|---|---|---|---|
| 审核时效 | 3天 | 1天 | 降低67% |
| 人工成本 | 基准 | - | 减少40% |
| 审核准确率 | 85% | 95% | +10% |
| 规则覆盖率 | 60% | 90% | +30% |
三层架构设计
解析、处理、评测,层层把关。
CFO挂帅
高层支持是前提。
Benchmark驱动
用评测数据持续优化,而不是拍脑袋。
| 你要先成为 | 然后带组织成为 |
|---|---|
| 能用AI重做流程工作的超级个体 | 能把流程节点、Skill、Agent和系统联动起来的超级组织 |
| 能把经验写成Skill的人 | 能把专家经验沉淀为组织资产的团队 |
| 能做原型、验收结果的人 | 能让成果被看见、被复用、被评测的变革催化者 |
| 能降低自己工作摩擦的人 | 能降低组织摩擦、放大AI杠杆的企业 |
总结与课后行动
前面已经讲完AI、智能体、Skill、AI Coding、评测和企业AI变革;最后只做一件事:把课堂能力带回真实业务。
| 今天讲过 | 真正要带走的能力 |
|---|---|
| AI常识 | 知道AI不是魔法,而是算力、方法、模型、平台、应用组成的能力系统。 |
| 智能体 | 知道智能体靠目标、知识、工具、流程、提示词和Skill协同工作。 |
| 领域Skill | 知道如何从L1/L2/L3工作架构和流程节点里挖出可复用能力。 |
| AI Coding | 知道如何把Skill推进成个人插件助手,并通过互换开发把需求做成数字产品。 |
| 企业AI变革 | 知道如何用五阶段推进法,把单点能力推向组织级落地。 |
| 评测 | 知道Skill、产品原型和试点项目都要用测试、边界和验收标准不断打磨。 |
选一个真实场景
从今天的清单里选最有价值、最低风险、最容易试跑的一个。
补齐真实材料
回到业务领域,补低敏样例、模板、制度和历史输出。
打磨Skill
把适用场景、输入、步骤、输出、边界、测试继续写细。
交出结果
跑出一份真实报告、清单、初稿或分析结果,而不只是截图。
| 阶段 | 目标 | 判断标准 |
|---|---|---|
| 自己用 | 让自己一个真实任务省时间、少返工 | 能连续跑3次,输出可用。 |
| 同岗位用 | 分享给1-3个同事试用 | 别人不用你解释,也能按步骤使用。 |
| 部门共用 | 沉淀到部门清单或内部平台 | 有Owner、有版本、有反馈、有迭代。 |
一个好的Skill,不是“我会用AI了”,而是“别人也能复用我的做事方法”。
插件
把Skill插在浏览器或业务页面旁边,让AI贴着真实网页、真实材料和真实流程工作。
系统Demo
把流程、输入、输出、状态和报告做成可点击原型,让业务能当场讨论。
真实报告
让工具跑出清单、分析、初稿、建议或评审材料,而不是只停留在想法截图。
| 落地方式 | 可以怎么做 | 示例 |
|---|---|---|
| 插在系统旁边 | 做浏览器插件、侧边栏、复制/填入按钮 | 流程审批分析、合同初筛、报销检查 |
| 接到业务流程里 | 在流程节点触发Skill,输出待确认结果 | 质量8D初稿、供应商评价、招聘匹配 |
| 形成可追踪结果 | 保留输入、输出、人工确认和修订记录 | 一份报告、一张清单、一次评审结论 |
| 持续打磨 | 根据同事反馈修Skill、修页面、修测试用例 | 从个人工具变成组织能力 |
AI超级个体入门课
建立AI常识、能力边界和高质量使用方法,现场盘点个人高频工作,把1-3个任务改造成可复用AI工作流。
AI流程能力构建实战课
从领域工作架构出发,识别Skill机会、编写Skill、完成质量评测,并用AI Coding做出可点击AI应用原型。
企业AI流程变革课
围绕AI转型准备度、机会地图、首批战役项目、治理机制和运营体系,形成能进管理层会议的变革方案。
企业 AI 素养与业务效率提升内训
不是追热点、背概念、玩工具,而是帮企业建立共同语言,找到真实业务提效路径。
把“会用AI的人”,训练成“能把AI项目做成的人”
企业真正缺的不是一次热闹的培训,而是一支能识别机会、梳理流程、设计方案、推动POC、评估效果、持续复盘的FDE团队。
企业级智能体一日实战内训
这是我们真实内训课件之一:从智能体结构、业务场景拆解、工具/知识库/工作流,到现场练习和材料包,帮助企业把 AI 能力做成可演示、可复用的业务原型。
用一整天把企业智能体从概念讲到可演示原型
- 智能体、工具、知识库、工作流的业务化讲解
- 真实企业场景练习与学员材料包
- 适合作为 AI 转型启动课或骨干训练营样例