随着 chatGPT 火爆全球,国内产业大模型也开始冒泡了,目前公布的产业大模型有:百度的 “文心一言”,阿里的 “通义千问”,华为的 “盘古大模型”,京东的 “言犀”,腾讯的混元大模型等 15 个大模型。
模型名称 | 开发公司 | 备注 |
1+N 认知智能大模型 | 科大讯飞 | 预计 5 月发布 |
言犀 | 京东 | 地址:https://yanxi.jd.com/ |
天工 3.5 | 昆仑万维 | 预计 4 月开始测试 |
盘古 NLP 模型 | 华为 | 暂未上线 |
曹植 | 达观数据 | 未发布,可测试 |
玉言 | 网易 | 时间未知 |
通义千问 | 阿里巴巴 | 4.11 已发布 |
日日新 | 商汤科技 | |
360 智脑 | 360 | |
ChatGLM-6B | 清华大学 | |
文心 | 百度 | 已发布文心一言 |
孟子 | 澜舟科技 | 3.14 发布 |
MOSS | 复旦大学 | 2.21 发布 |
混元 | 腾讯 | |
紫东太初 | 中科院自动化所 | 2021.9.27 发布 |
悟道 2.0 | 智源研究院 | 2021.6.1 发布 |
一、文心一言
出品方:百度
地址:https://yiyan.baidu.com/welcome
简介:百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。不过很快翻车了一盘。
百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨 PaddlePaddle 深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。

二、通义千问
出品方:阿里云
简介:我服务于人类,致力于让生活更美好
通义大模型背后的核心技术为统一学习范式 OFA,使其具备了多种任务的 “大一统” 能力。 单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务;升级后更 是可以处理超过包括语音和动作在内的 30 多种跨模态任务。 架构统一:使用 Transformer 架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。 模态统一:不管是 NLP、CV 这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。 任务统一:将所有单模态、多模态任务统一表达成序列到序列 (Seq2seq) 生成的形式,同类任务的输入几乎就是 “一个模子里刻出来的”。
三、盘古大模型
出品方:华为
华为云团队于 2020 年立项 AI 大模型,并且于 2021 年 4 月发布 “盘古大模型”。受益于华为的全栈式 AI 解决方案,大 模型与昇腾 (Ascend) 芯片、昇思 (MindSpore) 语言、ModelArts 平台深度结合。盘古大模型已经发展出包括基础大模型 (L0)、行业大模型 (L1)、行业细分场景模型 (L2) 三大阶段的成熟体系。 2022 年 11 月,在华为全联接大会 2022 中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布 盘古气象大模型、盘古矿山大模型、盘古 OCR 大模型三项重磅服务。
四、言犀
出品方:京东
ChatJD 将以 “125” 计划作为落地应用路线图,包含一个平台、两个领域、五个应用。其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率 95%+、生成文字 30 亿+。
五、混元大模型
出品方:腾讯
完整覆盖 NLP 大模型、 CV 大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文 NLP 预训练模型,参数量达 1T,排名 CLUE1.1 总排行榜第一。 HunYuan-vcr:排名 VCR(Visual Commonsense Reasoning) 榜单第一。 HunYuan_tvr:跨模态文字-视频检索 AI 大模型。