昨日,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan)。该模型参数规模达到2600亿,是目前全球最大中文单体模型,深圳大科学装置再添“新军”。

据悉,作为当前人工智能发展的重要方向,预训练大模型已成为AI领域的技术新高地。此次发布的鹏城-百度·文心是“全球首个知识增强千亿大模型”,在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果,并在30余项小样本和零样本任务上刷新基准。

大模型成功发布的背后,得益于鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台的强强联手,因解决了超大模型训练的多个公认技术难题,使得鹏城-百度·文心训练效率大幅提升,模型效果更优。

早前鹏城实验室与百度成立了鹏城-百度自然语言处理联合实验室,并以此为依托,资源共享、优势互补,在自然语言处理前沿研究和创新应用方面协同攻关,助力打造国家战略科技力量。本次联合发布的鹏城-百度·文心将进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题。本着“开源开放”的理念,该模型代码近期会在OpenI启智社区开源,依托鹏城云脑Ⅱ对外开放,积极联合“产学研协”各方,充分挖掘AI大模型的赋能能力,助力科技创新,推动产业发展。

目前,百度文心通过百度飞桨平台陆续对外开源开放,并已大规模应用于百度搜索、信息流、智能音箱等互联网产品,同时通过百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。

在金融领域,基于百度文心实现了合同智能解析,能够在1分钟内完成对相关合同条款文本的解析识别,速度是之前的几十倍,大大提升了工作效率。百度智能云的智能客服也基于百度文心提升了服务的精准性,目前已经在中国联通、浦发银行等企业应用,拓展到全国各地。

(记者 周雨萌)

标签: 鹏程 模型 百度文心 AI