随着 chatGPT 火爆全球,国内产业大模型也开始冒泡了,目前公布的产业大模型有:百度的 “文心一言”,阿里的 “通义千问”,华为的 “盘古大模型”,京东的 “言犀”,腾讯的混元大模型等 15 个大模型。

模型名称开发公司备注
1+N 认知智能大模型科大讯飞预计 5 月发布
言犀京东地址:https://yanxi.jd.com/
天工 3.5昆仑万维预计 4 月开始测试
盘古 NLP 模型华为暂未上线
曹植达观数据未发布,可测试
玉言网易时间未知
通义千问阿里巴巴4.11 已发布
日日新商汤科技
360 智脑360
ChatGLM-6B清华大学
文心百度已发布文心一言
孟子澜舟科技3.14 发布
MOSS复旦大学2.21 发布
混元腾讯
紫东太初中科院自动化所2021.9.27 发布
悟道 2.0智源研究院2021.6.1 发布

一、文心一言

出品方:百度

地址:https://yiyan.baidu.com/welcome

简介:百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。不过很快翻车了一盘。

百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨 PaddlePaddle 深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。

通义千问
通义千问

二、通义千问

出品方:阿里云

地址:https://tongyi.aliyun.com/

简介:我服务于人类,致力于让生活更美好

通义大模型背后的核心技术为统一学习范式 OFA,使其具备了多种任务的 “大一统” 能力。 单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务;升级后更 是可以处理超过包括语音和动作在内的 30 多种跨模态任务。 架构统一:使用 Transformer 架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。 模态统一:不管是 NLP、CV 这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。 任务统一:将所有单模态、多模态任务统一表达成序列到序列 (Seq2seq) 生成的形式,同类任务的输入几乎就是 “一个模子里刻出来的”。

三、盘古大模型

出品方:华为

华为云团队于 2020 年立项 AI 大模型,并且于 2021 年 4 月发布 “盘古大模型”。受益于华为的全栈式 AI 解决方案,大 模型与昇腾 (Ascend) 芯片、昇思 (MindSpore) 语言、ModelArts 平台深度结合。盘古大模型已经发展出包括基础大模型 (L0)、行业大模型 (L1)、行业细分场景模型 (L2) 三大阶段的成熟体系。 2022 年 11 月,在华为全联接大会 2022 中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布 盘古气象大模型、盘古矿山大模型、盘古 OCR 大模型三项重磅服务。

四、言犀

出品方:京东

ChatJD 将以 “125” 计划作为落地应用路线图,包含一个平台、两个领域、五个应用。其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率 95%+、生成文字 30 亿+。

五、混元大模型

出品方:腾讯

完整覆盖 NLP 大模型、 CV 大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文 NLP 预训练模型,参数量达 1T,排名 CLUE1.1 总排行榜第一。 HunYuan-vcr:排名 VCR(Visual Commonsense Reasoning) 榜单第一。 HunYuan_tvr:跨模态文字-视频检索 AI 大模型。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注