当前位置：网站首页 >> 热点 > >> 正文

信息技术行业研究：LAMINI大模型引擎发布开创模型调参新范式世界实时

时间：2023-05-06 17:33:28 来源：长江证券股份有限公司

(相关资料图)

事件描述

近日，斯坦福A团队推出了LaminiAl大模型引擎，可以快速生成调参数据，方便使用者根据基础模型快速微调自己的大模型。开发人员只需要使用Lāmii库中的几行代码，就能在大型数据集上训练出高性能的大模型。Lamini引壁包含Lamini Open数据生成器和Lamini Instruct指令调参模型两个部分，在快速生成调参数据之后，还能对调参数据进行优化以提高prompt的质量。Lamini引幸可以实现大模型的多种优化，包括简单的优化（如消除模型幻觉）和更具桃战性的优化（如RLHF）。Lamini还支持将默认指令调参模型换成其他开源或OpenAl模型。

Lamini引攀目前已支持ChatGPT、GPT4等主流厂商发布的大语言模型。

事件评论

Lamini数据生成器降低了对调参数据集的需求。Lamini的数据生成器是一个大模型pipeline,其灵感来自斯坦福的开源调参指令模型Alpaca。Pipeline使用Lamini库来定义和调用Lamini Instruct指令调参模型以生成不同但相似的指令。通过Lamini Open数据生成器，开发者只需要投喂约100至200条输入指令，即可生成超过5万条新的输入指令。接下来Lamini Instruct调参指令模型会根据这些输入指令生成对应的5万条指令输出。因为数据生成器生成的数据质量参差不齐，所以Lmii引擎在下一步还会将生成的数据过滤为高质量数据。

Lamini极大限度降低了模型调参的门槛，加快了RLHF的迭代速率。在Lamini发布之前，将基础模型构建成强大的语言模型是一个极具挑战性的过程，需要花费大量的时间和成本。在特定数据集上进行微调的迭代周期以月为单位，需要花费大量时间找出微调模型失败的原因，而且能融入pOmt的数据量非常有眼。此外，一些基础模型经过微调之后，性能变得更差，无法投入使用。Lamini引苹将微闪封装成一种服务，允许开发人员可以轻松将大话言模型微调成ChatGPT。用户不再需要人工标注收集上万条高质量调参数据对，极大的降低了大模型调参的难度，这一优势也使得指令调参模型可以快速迭代pomp的指令输入与缩出，加速了RLHF循环的飞轮效应。

风险提示

1、大模型技术推进不及预期；

2、大模型商业化落地的过程存在风险。

关键词：

上一篇: 全球观焦点：Xeal欢迎两位ChargePoint资深人士加入销售团队 下一篇: 最后一页