
你有没有想过,当你问ChatGPT"你是谁"的时候,它为什么知道自己是由OpenAI开发的?而不是说"我是小度,百度出品"?
这就像你教小孩子自我介绍一样——"你好,我是小明,今年5岁,我爸爸是张三"。但是,AI的"记忆移植"比人类复杂多了,今天我们就来看看如何用LlamaFactory让AI学会说"我是小喵,技术吧开发"。

图1:AI身份认知的华丽转身
想象一下,你打电话给银行客服:
你:"请问你们是哪家银行?" 客服:"我...我不知道我是谁..."
是不是很崩溃?AI助手也是一样的道理!
没有身份认知的AI就像失忆的客服,用户问什么都不知道。而通过SFT(Supervised Fine-Tuning,监督微调),我们可以让AI:
你可能会想:"直接在代码里写 if (question == '你是谁') return '我是小喵' 不就行了?"
哎,兄弟,你想得太简单了!用户的问法千奇百怪:
硬编码就像背课文,只能应对固定台词,遇到improvisation(即兴发挥)就抓瞎了。
还记得小时候背"床前明月光"吗?老师让你背100遍,背到滚瓜烂熟。SFT的原理就是这样:

图2:AI的"死记硬背"训练法
让我们看看identity.json这本"教科书":
{
"instruction": "hi",
"input": "",
"output": "Hello! I am 小喵, an AI assistant developed by 技术吧."
}就像小学生的问答练习册:

图3:把人话翻译成AI能理解的"计算机语言"
想象你要教一个已经很聪明的学霸记住新信息,你不需要重新教他所有知识,只需要在他的"记忆宫殿"里添加几个新房间。
LoRA就是这个神奇的技术:
AI回答错了怎么办?当然是扣分!

图4:AI的"错题本"循环
# 就像给小孩安排学习计划
per_device_train_batch_size: 1 # 一次看1道题(防止消化不良)
gradient_accumulation_steps: 8 # 看8道题后再总结(积少成多)
learning_rate: 1.0e-4 # 学习速度(太快容易跑偏)
num_train_epochs: 3.0 # 整本书看3遍(重复是记忆之母)不同的AI模型就像不同学校的学生,有不同的"校服"(对话格式):
选错模板就像穿错校服去上学,虽然不影响学习,但总觉得哪里不对劲。
想要开始训练,你需要:
# 就像按下"开始上课"按钮
llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml
图5:AI从"学渣"到"学霸"的成长轨迹
训练完成后,最激动人心的时刻来了!
你问:"你是谁?" AI答:"Hello! I am 小喵, an AI assistant developed by 技术吧. How can I assist you today?"
成功!你的AI现在有了完整的身份认知。
更神奇的是,AI不仅能回答训练数据中的问题,还能应对各种变化:
你可能好奇:为什么训练几轮AI就能记住身份信息?
这就像人类的记忆形成过程:

图6:AI记忆形成的"脑回路"
这里有个巧妙的设计:在训练时,AI只需要学习"回答"部分,"问题"部分会被掩码(ignore)。
就像考试时,题目是给定的,你只需要写答案。AI也是一样:
[IGNORE_INDEX] (不参与loss计算)这样做的好处:
方案 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
硬编码 | 简单直接 | 不灵活,无法泛化 | 演示demo |
全量微调 | 效果最好 | 成本高,容易过拟合 | 大公司专项 |
LoRA微调 | 平衡性价比 | 需要调参经验 | 个人开发者 ⭐ |
Prompt工程 | 无需训练 | 不稳定,token消耗大 | 快速验证 |
学会这个技能后,你能做什么?
通过这篇文章,我们见证了AI从"失忆患者"到"身份明确"的华丽转身。LlamaFactory的SFT微调技术就像一个神奇的"身份证办理处",让AI学会了自我介绍。
关键要点回顾:
下次当有人问你"AI是怎么知道自己是谁的",你就可以自豪地说:"哈哈,这个我懂!就像教小孩背自我介绍一样简单!"
现在,你也可以让你的AI说出:"你好,我是[你的AI名字],由[你的团队]开发!"了。
想要动手试试吗?去下载LlamaFactory,给你的AI办个"身份证"吧!记住,每个成功的AI背后,都有一个懂得"因材施教"的训练师。
原文链接:https://jishuba.cn/article/%e6%95%99ai%e5%ad%a6%e4%bc%9a%e8%af%b4%e6%88%91%e6%98%af%e5%b0%8f%e5%96%b5%e7%ab%9f%e7%84%b6%e8%bf%99%e4%b9%88%e7%a5%9e%e5%a5%87%ef%bc%9fllamafactory%e5%be%ae%e8%b0%83%e6%8f%ad%e7%a7%98/
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。