国内产业大模型有哪些?
随着chatGPT火爆全球,国内产业大模型也开始冒泡了,目前公布的产业大模型有:百度的“文心一言”,阿里的“通义千问”,华为的“盘古大模型”,京东的“言犀”,腾讯的混元大模型等15个大模型。
模型名称 | 开发公司 | 备注 |
1+N认知智能大模型 | 科大讯飞 | 预计5月发布 |
言犀 | 京东 | 地址:https://yanxi.jd.com/ |
天工3.5 | 昆仑万维 | 预计4月开始测试 |
盘古NLP模型 | 华为 | 暂未上线 |
曹植 | 达观数据 | 未发布,可测试 |
玉言 | 网易 | 时间未知 |
通义千问 | 阿里巴巴 | 4.11已发布 |
日日新 | 商汤科技 | |
360智脑 | 360 | |
ChatGLM-6B | 清华大学 | |
文心 | 百度 | 已发布文心一言 |
孟子 | 澜舟科技 | 3.14发布 |
MOSS | 复旦大学 | 2.21发布 |
混元 | 腾讯 | |
紫东太初 | 中科院自动化所 | 2021.9.27发布 |
悟道2.0 | 智源研究院 | 2021.6.1发布 |
一、文心一言
出品方:百度
地址:https://yiyan.baidu.com/welcome
简介:百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。不过很快翻车了一盘。
百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨PaddlePaddle深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。
二、通义千问
出品方:阿里云
简介:我服务于人类,致力于让生活更美好
通义大模型背后的核心技术为统一学习范式OFA,使其具备了多种任务的“大一统”能力。 单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务;升级后更 是可以处理超过包括语音和动作在内的30多种跨模态任务。 架构统一:使用Transformer架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。 模态统一:不管是NLP、CV这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。 任务统一:将所有单模态、多模态任务统一表达成序列到序列(Seq2seq)生成的形式,同类任务的输入几乎就是 “一个模子里刻出来的”。
三、盘古大模型
出品方:华为
华为云团队于2020 年立项AI 大模型,并且于2021 年4 月发布“盘古大模型”。受益于华为的全栈式AI 解决方案,大 模型与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts 平台深度结合。盘古大模型已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。 2022年11月,在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布 盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。
四、言犀
出品方:京东
ChatJD将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。其预训练参数达到千亿级、品类覆盖3000+、人工审核通过率95%+、生成文字30亿+。
五、混元大模型
出品方:腾讯
完整覆盖NLP大模型、 CV大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文NLP预训练模型,参数量达1T,排名CLUE1.1总排行榜第一。 HunYuan-vcr:排名VCR(Visual Commonsense Reasoning)榜单第一。 HunYuan_tvr:跨模态文字-视频检索AI大模型。
共有 0 条评论