备选标题
- 一个不懂代码的中年人,怎样一步步搭起了一个AI业务系统 — 直白,有反差感
- 从webchat到7个AI角色:一个文科生的系统搭建手记 — 有进阶感,强调起点低
- 不会写代码,但我搭了一个能自动改简历的AI系统 — 更口语,有悬念
- 这个AI系统迭代了6个版本——搭它的人完全不懂代码 — 反差+数字感
这是我和果姐姐关于”用AI帮财务人改简历”这个探索的系列分享。三篇文章,三个不同的角度:
- 第一篇(已发表):三轮内测,我们从用户身上,一步一步学到什么
- 第二篇(已发表):改简历作为一项服务,商业模式完全是不成立的——直到AI把成本砍了90%+
- 第三篇(本文):作为一个完全不懂代码的中年人,是如何一步一步搭起了一个AI原生的业务系统的
这是第三篇。
01 | 起点:好奇心先行
我大概率是最早一批用AI的文科生。
2024年春节后,GPT3.5刚出来的时候就开始用了。那时候最常做的事,是coach同事用AI写代码,做数据清洗——我自己不会写代码,公司小朋友们,大学刚毕业会点三脚猫的python,但也不灵光。
所以,我做的事情是:在chatgpt上梳理需求,探讨方案,然后生成代码,copy到本地执行。感觉这件事可行,然后push同事们也这么干。
所以起点不是零。对AI能做什么、不能做什么,有直觉。
但我确实不会写代码。一行都不会。
02 | 第一阶段:和大多数人一样
改简历这个项目,前后高了三轮内测。
第一轮内测,我们应用AI的方式,和绝大部分人没有区别。
腾讯会议人工挖素材,然后简历+素材一起丢给webchat,看输出,调整prompt,再试一次。来回几轮,还是词不达意,最后自己上手改。
能用,但本质上是”人工为主,AI打下手”。
03 | 业务基建:AI要像真人一样看简历
第一轮内测结束后,我意识到一件事:要让AI的产出真正贴合每一个用户,必须让它copy我和果姐姐的思维方式。
那我们真人怎么做的?至少具备三个要素:
第一,历史经验的深度。
这得益于去年做《财务职场通关指南》录播课的积累。课程制作的过程,我花了三个月时间,把自己在财务职场十几年的思考、判断、偏好、踩过的坑,做了一次系统化的梳理。这些东西现在变成了AI评估简历的底层认知。
第二,行业视野的广度。
过去半年,我做了接近200个财务职场咨询,掌握了最鲜活的市场信息,加上用爬虫抓取的大量招聘JD。AI不能只看用户一个人的简历,它需要知道市场上发生了什么、用人方在意什么。
第三,方法论。
这是最先动手做的。我和果姐姐,初步写了大约50个评估Skills——
比如:如果用户在一家不太知名的公司工作,我们应该了解这家公司的哪些信息?如果遇到甲方内审和乙方内审,如何针对性地追问他们的项目经验?从原始简历的行文风格,我们如何判断用户的职场性格?等等。
这些Skills随着项目叠加,还在持续丰富和迭代。
以上三件事,都不涉及任何代码。纯粹是把脑子里的东西,结构化地写出来。
04 | 第二阶段:搭本地Agent,以及最大的坑
1. 本地agent
webchat的天花板很明显:每次对话都从零开始,没有记忆,没有流程,没有规则。
我想要的是:AI拿到一份简历,按照我设定好的方法论和背景知识去干活——而不是AI自己的自由发挥。
于是开始尝试用prompt搭建本地运行的Agent。基于opencode,不写代码,就是把每个角色的职责、规则、输入输出写成文档,让AI按照文档行事。
效果:能跑。但不稳定。
花了很长时间才找到原因:AI产出的内容会漂移。 一个Agent还好,但多个Agent层层传递——前一个agent的输出是后一个的输入——传到最后,内容就变形了。
2. 大坑
既然Agent能跑了,自然想更进一步:能不能更智能一点?5个agent自动流转,加上自动质检、自动锁定机制——简历进来,不需要人介入,自动走完全流程。
想法很美好,但实际上,至今还没成功过。一个环节出问题,全链条卡死。
我意识到:在还没有把每个环节都打磨到位的阶段,问题是常态。不能这么干。
自动化的前提,是你对每一步都已经100%确定怎么做。我们还在摸索,根本没到那一步。——从这个意义上讲,哪些想考AI+skills取代员工的公司,风险真的很大。
上面这个坑,花了一个月的时间,才走出来——或许对开发者而言,也不太难,纯粹是我没经验 。
06 | 真正的突破:工程思维
思考开始更深入了一层:全靠AI自治,靠谱吗?真的有必要吗?系统里什么该固定、什么该灵活、什么该积累?真的想明白了吗?
于是,花了几天时间,学了一点工程思维,找到了答案:
应该做三层分离:
第一层,流程。 诊断→问卷→重构→人设→面试题,这个顺序不会变。写清楚,锁死。这件事情,可以有python来做。
第二层,规则。 问卷怎么设计、简历格式标准、诊断维度权重——这些会随着经验调整,但变化不快。集中管理,定期迭代。
第三层,经验。 每一个案例处理完,学到的东西——哪种表达更有效、哪个问题问得更好、某个行业的简历应该怎么写——全部沉淀进知识库。这一层可以无限增长。
三层分开之后,系统复杂度是线性的,但知识积累是快速膨胀的。
同时引入了质检机制:AI跑出来的结果,先过一道自动质检。不达标,退回重跑。跑到达标为止,才进入我的人工审查。
所以有的用户会发现,收到的文档版本号到了V15——那是因为前14版没通过质检,AI自己吭哧吭哧循环了半小时跑了15遍。
注意:任何形式的转载、引用或者AI训练,均应提及原作者:观星哥,来源:观星哥|财务职场进化论就像开公司:小朋友们干活,部门经理review,质量不达标的退回去重做,符合标准的才送到老板面前。
我就是这帮agent的老板😊
07 | 现在的样子
现在的系统里有7个AI角色,每个角色只管一件事:
- Hyrule:系统调度。接收自然语言指令,翻译成系统命令执行,同时巡检每一份产出的质量
- Link:项目管理。新项目进来,建立项目档案,追踪每个项目走到了哪一步
- Hashkey:简历诊断。读完简历,按照评估框架找出信息缺口,生成事实深挖问卷
- Hajimi:简历重构。结合原始简历+问卷答案,设计写作框架,摘捡素材,匹配写作风格,输出重写后的简历
- Yahaha:人设塑造。基于前面的全部成果,提炼核心定位和竞争力标签,输出一份用户能直接拿去面试的人设指南
- Boko:面试押题。基于本地方法轮和知识库,生成个性化面试题,每题配考察意图和回答思路
- Fixer:系统维修。Hyrule发现bug,Fixer负责定位原因、提出修复方案
一条完整的线:简历进来 → 诊断 → 问卷 → 用户填写 → 重构简历 → 人设指南 → 面试押题 → 交付。
并且,每个agent根据能力要求不同,匹配不同的基座模型。比如Link要求干活快成本低,配置minimax2.5,Fixer要求工程思维和代码能力,配了claude opus4.6;而Hajimi要求优秀的写作能力,配了claude sonnet4.5。
每个角色有自己的规则文件、配置文件、知识库。彼此独立,互不干扰。
和豆包这类webchat的区别在哪?
Webchat是一个通才,什么都能聊,但什么都不深。这个系统里的每个角色,都只做一件事,但带着完整的财务行业认知、带着大量个案例积累下来的方法论、带着越来越厚的知识库。
08 | 不懂代码,到底是不是障碍?
是障碍。
调试效率低、有些想法暂时实现不了、遇到报错经常导致头秃——这些都是真实的限制。
但这个障碍,已经被极大地抹平了。
星哥作为一个毫无代码基础的中年人,好奇心远远大于学习能力。去年这个时候,我完全无法想像能做成这件事。
而且现在回头看,真正的挑战从来不是代码,是需求的解构。
如果没有这个项目,或许我顶多还在用AI帮我读读书、整理一下照片。但一旦有了真实的业务场景,所有东西都被打开了——你会发现AI能做的事情远超预期,而你要做的,是想清楚让它做什么、怎么做、做到什么标准。
这才是真正难的部分。代码?AI帮你写。
收尾
这个系列,三篇文章,结束了。
三篇我想分享的,其实是同一件事:用AI放大你的价值,是完全可行的。
这个系统是凭空想出来的,而是基于一个具体的需求场景,一点一点长出来的。每一个用户的反馈,每一次踩坑,每一个认知升级,都变成了系统的一部分。
说实话,大部分职场中人,手里的业务场景比我多得多。
毕竟我是一个退出职场、基本上躺平、且没什么太大理想的中年人。
你们的场景,只会比我更丰富。
保持好奇心,多去试试。
版权声明:本文内容受著作权保护。任何形式的转载、引用或用于AI模型训练,均需明确标注原作者为观星哥,并注明出处为「观星哥|财务职场进化论」。未经书面许可的商用行为将依法追究法律责任。