国内产业大模型有哪些?

随着chatGPT火爆全球,国内产业大模型也开始冒泡了,目前公布的产业大模型有:百度的“文心一言”,阿里的“通义千问”,华为的“盘古大模型”,京东的“言犀”,腾讯的混元大模型等15个大模型。

模型名称开发公司备注
1+N认知智能大模型科大讯飞预计5月发布
言犀京东地址:https://yanxi.jd.com/
天工3.5昆仑万维预计4月开始测试
盘古NLP模型华为暂未上线
曹植达观数据未发布,可测试
玉言网易时间未知
通义千问阿里巴巴4.11已发布
日日新商汤科技
360智脑360
ChatGLM-6B清华大学
文心百度已发布文心一言
孟子澜舟科技3.14发布
MOSS复旦大学2.21发布
混元腾讯
紫东太初中科院自动化所2021.9.27发布
悟道2.0智源研究院2021.6.1发布

一、文心一言

出品方:百度

地址:https://yiyan.baidu.com/welcome

简介:百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。不过很快翻车了一盘。

百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨PaddlePaddle深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。

通义千问
通义千问

二、通义千问

出品方:阿里云

地址:https://tongyi.aliyun.com/

简介:我服务于人类,致力于让生活更美好

通义大模型背后的核心技术为统一学习范式OFA,使其具备了多种任务的“大一统”能力。 单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务;升级后更 是可以处理超过包括语音和动作在内的30多种跨模态任务。 架构统一:使用Transformer架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。 模态统一:不管是NLP、CV这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。 任务统一:将所有单模态、多模态任务统一表达成序列到序列(Seq2seq)生成的形式,同类任务的输入几乎就是 “一个模子里刻出来的”。

三、盘古大模型

出品方:华为

华为云团队于2020 年立项AI 大模型,并且于2021 年4 月发布“盘古大模型”。受益于华为的全栈式AI 解决方案,大 模型与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts 平台深度结合。盘古大模型已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。 2022年11月,在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布 盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。

四、言犀

出品方:京东

ChatJD将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。其预训练参数达到千亿级、品类覆盖3000+、人工审核通过率95%+、生成文字30亿+。

五、混元大模型

出品方:腾讯

完整覆盖NLP大模型、 CV大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文NLP预训练模型,参数量达1T,排名CLUE1.1总排行榜第一。 HunYuan-vcr:排名VCR(Visual Commonsense Reasoning)榜单第一。 HunYuan_tvr:跨模态文字-视频检索AI大模型。

THE END
打赏
海报
国内产业大模型有哪些?
随着chatGPT火爆全球,国内产业大模型也开始冒泡了,目前公布的产业大模型有:百度的“文心一言”,阿里的“通义千问”,华为的“盘古大模型”,京东的“言犀”,腾讯的混元大模型等15个大模型。 模型名称开发公司备注……
<<上一篇
下一篇>>