车马书信 发表于 2024-12-11 16:26:28

参加Datawhale AI冬令营

跟着步骤捏了个AI出来。
好消息:步骤很简单,成功了
坏消息:是个人工智障
楼下附上训练时候的思考和笔记。

鹿港小镇° 发表于 2024-12-11 16:26:53

1.如何定制自己的大模型?
第一步,了解需求,进行模型设计与架构选择。以讯飞这个平台为例,它有一些基础的模型架构,按自己的需求进行选用。
第二步,准备数据与预处理。对原始数据进行清洗、处理、归类。确保数据的质量和可用性。这也是定制大模型中真正复杂的工作。(下图为处理好的数据集,符合Alpaca格式)
第三步,进行模型训练和调优。在平台上有提供参数,方便用户进行调整,每个参数的含义点击旁边的问号就可以查看。
第四步,进行模型部署与优化。创建一个应用并发布训练好的模型。
下面附上链接
星火大模型精调平台:网页链接
讯飞开放平台:网页链接
本次训练的数据集来源:https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json





晴天飛雪﹌ 发表于 2024-12-11 16:27:42

2.定制大模型用到的技术主要是什么?
鉴于本人属于尚未入门的初学者,在具体理论技术上不了解,就直接附上资料链接了。
网页链接

№轮回念她 发表于 2024-12-11 16:28:38

3.什么是AI大模型微调?
指在通用大模型的基础上,对超出范围或特定的领域,使用专门的数据集或方法对其进行相应的调整和优化,以提升其在特定领域或任务中的适用性和完成度。
4.微调的关键步骤是什么?什么样的数据可以进行微调?
根据实际需求,准备更专业、更垂直的数据集让大模型学习。例如本次训练中使用了大量电视剧《甄嬛传》中角色甄嬛的台词对模型进行训练。
网页链接

√佐手,甜蜜 发表于 2024-12-15 12:30:12

楼下的且行且珍惜!
页: [1]
查看完整版本: 参加Datawhale AI冬令营