40TB训练数据！华为云做出预训练模型

发布时间：2021-05-08 15:35:54 所属栏目：动态来源：互联网

导读：智东西4月25日报道，今日，华为云推出盘古系列超大规模预训练模型，包括全球最大视觉（CV）预训练模型和全球最大中文语言（NLP）预训练模型。全球最大视觉（CV

智东西4月25日报道，今日，华为云推出盘古系列超大规模预训练模型，包括全球最大视觉（CV）预训练模型和全球最大中文语言（NLP）预训练模型。

全球最大视觉（CV）预训练模型包含30亿参数，首次兼顾了图像判别与生成能力，既能提升测试精度，又能平均节约90%以上研发成本。

全球最大中文语言（NLP）预训练模型由循环智能、鹏城实验室联合开发，包含千亿参数、40TB训练数据，刷新了CLUE三项榜单世界纪录。

后续，华为云还将陆续发布多模态、科学计算等超大预训练模型。

预训练大模型是解决AI应用开发定制化和碎片化的重要方法。华为云人工智能领域首席科学家、IEEE Fellow田奇称，华为云盘古大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制，减少对数据标注的依赖，并使用ModelArts平台，让AI开发由作坊式转变为工业化开发的新模式。

一、最大中文语言预训练模型：千亿参数、40TB训练数据

盘古NLP大模型是全球最大的千亿参数中文语言预训练模型，涉及千亿参数、40TB中文文本训练数据，对算法、算力、海量数据处理、并行优化都提出了很大挑战。

在算法方面，华为云的算法团队与循环智能（Recurrent AI）的NLP团队经过数月联合攻关，突破了大模型微调的难题。

在算力方面，鹏城实验室的国内最大规模AI训练集群鹏城云脑II，为盘古NLP大模型训练提供了强大的AI算力基础。

该模型通过在预训练阶段引入基于Prompt的任务等多项创新方案，经由行业数据的样本调优，提升模型在场景中的应用性能。

（编辑：焦作站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

李彦宏：交通智能化是	网站降权如何查询？几
家家都说是尖端，真旗	户用光伏从“微不足道