先别急着选模型
很多团队在 AI 项目里最先缺失的不是工具,而是顺序。先写清楚谁提出需求、谁提供原始信息、谁保留最终判断,比先比较模型参数更重要。对 HR 来说,前 30 天的重点不是“做出一个聪明的机器人”,而是把业务场景翻译成一个团队都看得懂、也愿意遵守的工作说明书。
如果招聘经理给出的开岗说明仍然是“要一个沟通好、抗压强的人”,那任何 AI 流程都会在源头失真。更稳妥的做法是把岗位目标拆成三个层次:90 天内要解决的问题、必须出现的行为证据、以及哪些判断必须保留给人工复核。这样做的价值,不只是方便写 Prompt,而是让 HR、业务与面试官第一次围绕同一份标准说话。
第 31 到 60 天,建立可复核的中间产物
真正让团队愿意持续采用 AI 的,不是一次惊艳的输出,而是稳定、可检查、可以被纠正的中间过程。招聘、绩效、人才盘点这些场景都一样,模型越接近判断环节,越需要证据链。
一个常见误区是让 AI 直接给出“推荐/不推荐”的结论。更合理的顺序是先要求系统整理事实,再让 HR 判断哪些地方值得继续追问。例如,先让模型抽取候选人在业务场景中给出的具体案例,再由面试官决定这些案例是否足以支持岗位能力判断。这样一来,AI 负责提炼信息,人工继续负责做取舍。
下面这个最小模板,适合放进试点文档或周会材料里。它的重点不是写得多漂亮,而是让每个人都知道这次试点到底如何判断“有用”:
pilot:
scenario: "招聘初筛纪要整理"
owners:
hr: "招聘负责人"
business: "用人经理"
inputs:
- "岗位能力卡"
- "候选人原始简历"
- "面试记录"
checks:
- "是否引用具体证据"
- "是否区分事实与判断"
- "是否标记需要人工复核的风险"
success_metrics:
- "24 小时内完成首轮反馈"
- "面试官反馈用语一致性提升"
第 61 到 90 天,把复盘变成管理动作
前两个月解决的是“能不能用”,最后一个月要解决的是“谁来持续把它用对”。如果没有固定的复盘节奏,团队通常只会记住几个好案例,或者被几次失败吓退。HR 在这个阶段最重要的工作,是把业务 owner、使用者和流程 owner 拉到同一张桌面上,一起看质量、例外情况和下一轮修改点。
我更建议把复盘问题写得具体一点,而不是泛泛讨论“模型表现如何”。例如:
- 哪一类输出仍然需要大幅人工改写?
- 哪个判断节点最容易出现误导性的自信表述?
- 如果下周继续试,应该调整输入材料、提示词,还是审批责任?
当这些问题被固定进团队节奏后,AI 采用就不再只是个人爱好的延伸,而会变成一套可以交接、可以训练、也可以被管理者审视的组织能力。对 HR 来说,这才是路线图真正的终点。