大语言模型(Large Language Model,简称LLM)是指使用大量文本数据训练的深度学习模型,使得该模型可以生成自然语言文本或理解语言文本的含义。这些模型可以通过在庞大的数据集上进行训练来提供有关各种主题的深入知识和语言生产。其核心思想是通过大规模的无监督训练学习自然语言的模式和结构,在一定程度上模拟人类的语言认知和生成过程。
目前,国内外大型语言模型LLM有哪些呢?以下是国内外主流大语言模型LLM及公司&厂家。

ChatGPT
公司:OpenAI
ChatGPT(全名:Chat Generative Pre-trained Transformer),基于GPT系统大模型构建,是OpenAI采用“从人类反馈中强化学习”(RLHF)训练方式,ChatGPT的本质是提高人脑对各种信息资料进行收集、整理、计算、分析等能力的智能工具,是为人脑”观念建构”提供丰富、精准的方案、图式等资料或条件等的工具体系。ChatGPT是一款聊天机器人程序,能够基于在预训练阶段所见的模式和统计规律生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。它强大的自然语言处理能力和多模态转化能力使之可用于多个场景和领域。它可用来开发聊天机器人,编写和调试计算机程序,撰写邮件,进行媒体、文学相关领域的创作,包括创作音乐、视频脚本、文案、童话故事、诗歌和歌词等。它还可以用作自动客服、语音识别、机器翻译、情感分析、信息检索等。
2022年11月30日发布的能够对话的GPT-3.5版本。2023年3月14日,OpenAI推出GPT-4;2023年5月、7月、8月、11月,2024年1月、5月、12月,OpenAI先后推出iOS版、安卓版、企业版、自定义版本、团队版、教育版ChatGPT应用;2025年2月27日,OpenAI推出GPT-4.5。3月,ChatGPT图像生成功能获得升级。
ChatGPT Pro
公司:OpenAI
ChatGPT Pro是OpenAI推出的订阅服务,售价每月200美元。购买这项服务可以扩展访问OpenAI的最佳模型和工具,包括无限制地访问其最智能的模型OpenAI o1,包括最新发布的o1 pro,以及o1-mini、GPT-4o和Advanced Voice。
通义
公司:阿里云
通义,由通义千问更名而来,是阿里云推出的大语言模型,于2023年9月13日正式向公众开放。属于(AI Generated Content,AIGC)领域,是一个MaaS(模型即服务)的底座。为多模态大模型(Multimodal Models)。通义意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。
2023年4月7日,通义的前身通义千问开始邀请测试,4月11日,通义千问在2023阿里云峰会上揭晓。4月18日,钉钉正式接通通义千问大模型。9月13日,通义千问大模型通过首批备案,正式向公众开放。通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。12月1日,阿里云开源通义千问720亿参数模型。12月22日,阿里云通义千问成为首个“大模型标准符合性评测”中首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。2024年4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡。5月,通义千问2.5大模型发布并更名。5月9日,阿里云正式发布了通义千问2.5版本。2024年8月19日,通义千问宣布启用新域名:tongyi.ai。2025年3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。3月27日,通义千问宣布发布Qwen2.5-Omni。
Qwen2
公司:阿里云
Qwen2,是阿里云通义千问团队开发的开源模型。Qwen 2是一套高级的基础和预调语言模型,参数范围从5亿到720亿。它包括密集模型和专家混合模型。
Qwen2.5
公司:阿里云
Qwen2.5,是阿里云研发的通义千问系列开源大模型。该系列提供Base和Instruct等多版本、多规模的开源模型,从而满足不同的计算需求。PAI已对该系列模型进行全面支持,本文以通义千问2.5-7B-Instruct模型为例为您介绍如何在Model Gallery中部署、微调和评测该系列模型(本文适用于Qwen2.5和Qwen2系列模型)。
QwQ-32B
公司:阿里巴巴
QwQ-32B,阿里 Qwen 团队发布的大语言模型。这是一款拥有320亿参数的模型。
DeepSeek
公司:深度求索
DeepSeek是杭州深度求索人工智能基础技术研究有限公司推出的AI助手,免费体验与全球领先AI模型的互动交流,于2025年1月15日正式上线。DeepSeek凭借自然语言处理、机器学习与深度学习、大数据分析等核心技术优势,在推理、自然语言理解与生成、图像与视频分析、语音识别与合成、个性化推荐、大数据处理与分析、跨模态学习以及实时交互与响应等八大领域表现出色。它能进行逻辑推理、解决复杂问题,理解和生成高质量文本,精准分析图像和视频内容,准确识别和合成语音,根据用户偏好提供个性化推荐,高效处理大规模数据并挖掘有价值信息,实现多模态数据融合与学习,以及通过智能助手和聊天机器人实现快速的自然语言交互。
2025年2月21日,数据分析平台QuestMobile最新数据显示,DeepSeek App从上线以来至2月9日,累计下载量超1.1亿次,周活跃用户规模最高近9700万。其中,1月20日至1月26日,DeepSeek App周下载量达到226万次。次周,下载量则直接飙升至6300万次,环比增长超2700%。3月11日消息,黄河水利委员会完成国产大语言模型DeepSeek本地化部署。3月31日消息,DeepSeek已经成为全球增长最快的AI工具。
文心一言
公司:百度
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
2023年3月16日,百度新一代大语言模型文心一言正式启动邀测。8月31日,文心一言率先向全社会全面开放。开放首日,文心一言共计回复网友超3342万个问题。12月28日,百度首席技术官王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布文心一言用户规模已突破1亿。截至2024年11月12日,文心一言用户规模达到4.3亿。截至2024年4月16日,文心一言API日均调用量也突破了2亿,服务客户数8.5万,千帆平台AI原生应用数超过了19万。2024年9月4日,文心一言APP升级为“文小言APP”。2025年2月,文心一言上线深度搜索功能。4月1日起,文心一言全面免费,所有PC端和APP端用户均可体验文心系列最新模型。2025年3月16日,文心大模型4.5和文心大模型X1正式发布!目前,两款模型已在文心一言官网上线,免费向用户开放。2025年4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上,发布文心大模型4.5 Turbo、文心大模型X1 Turbo。
文心大模型4.5
公司:百度
文心大模型4.5,百度旗下大模型,由百度于2025年3月16日正式发布。
文心大模型4.5 Turbo
公司:百度
文心大模型4.5 Turbo是百度发布大模型。2025年4月25日,文心大模型 4.5 Turbo 在 Create 大会上正式亮相。
轩辕
公司:度小满
“轩辕”是度小满开源的国内首个千亿级中文金融大模型,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。
Grok
公司:xAI
Grok,是一个人工智能助理,马斯克旗下xAI团队发布其首个AI大模型产品。2024年1月24日,马斯克xAI团队发布首个AI大模型Grok 1.5;8月13日,xAI发布了一款新的聊天机器人Grok-2;Grok可供X(原Twitter)用户使用,并由xAI最先进的大语言模型(LLM)提供支持。受《银河系漫游指南》和《钢铁侠》中的贾维斯的启发,Grok的设计几乎可以回答任何带有机智和幽默的问题,同时也提供有用和有见地的回答。Grok利用下一个标记预测模型权重(预测最有可能跟随给定文本序列的单词或符号的模型)来了解如何执行某些任务。Grok是由xAI根据来自公开来源的各种数据进行预训练的,数据集由人工智能导师进行审查和管理。Grok AI可免费生成高质量图像,访问X和网络数据可实时提供最新信息;Grok对话幽默有趣,还注重用户隐私。相比较OpenAI的ChatGPT、谷歌的Bard和微软的Bing Chat,Grok最大的不同是存在幽默感。2025年2月20日,xAI宣布最新大模型Grok 3免费向所有公众开放,Grok应用升至美国区App Store免费APP榜首。Grok-1的参数量达到了3140亿,这意味着Grok-1的水平肯定要在GPT-3.5之上。2月28日,马斯克在社交平台X发文宣布,新版本的Grok应用现已上线。
豆包
公司:字节跳动
豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台, Windows/macOS 电脑版客户端,iOS 以及安卓平台。
2016年,字节跳动公司成立人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。2023年8月17日,豆包开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录。2024年5月15日,字节跳动产品和战略副总裁朱骏在2024春季火山引擎Force原动力大会上表示,豆包APP总下载量达1亿次,豆包大模型将开启商业化模式,价格相比同行便宜99.3%,定价0.0008元/千Tokens;8月8日,豆包上线音乐生成功能;10月10日,豆包发布首款AI智能体耳机Ola Friend;11月7日,豆包正式推出视频生成内测;12月3日,豆包已上线图片理解功能。2025年1月19日,豆包海外版Gauth: AI Study Companion在美国停服。3月4日,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。3月28日消息,豆包测试了新版深度思考功能,支持边想边搜。
Gemini
公司:Google
Gemini是一款由Google DeepMind(谷歌母公司Alphabet下设立的人工智能实验室)于2023年12月6日发布的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。首个版本为Gemini 1.0,包括三个不同体量的模型:用于处理“高度复杂任务”的Gemini Ultra、用于处理多个任务的Gemini Nano和用于处理“终端上设备的特定任务”的Gemini Pro。
谷歌AI模型的研发进程从2012年就已开始;2022年8月推出高级语言学习模型PaLM;2023年5月Google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard,同时宣布Gemini即将问世;12月6日在一段官方公布的视频中,谷歌正式推出Gemini。谷歌计划逐步将Gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始,开发者和企业客户可以通过Google的AI Studio和Google Cloud Vertex AI中的Gemini API访问Gemini Pro。2023年12月7日,科技界指出Gemini与ChatGPT测试方法存疑,且分数存在夸大嫌疑,同时发布会演示视频也存在虚假剪辑问题。随后,对于视频“造假”一说,Gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。2025年3月7日,谷歌公司发布博文,宣布推出 Gemini Embedding。该模型在 Massive Text Embedding Benchmark(MTEB)中拔得头筹。3月26日凌晨,谷歌正式推出新一代人工智能推理模型Gemini 2.5。
DolphinGemma
公司:Google
DolphinGemma是谷歌DeepMind推出手机可运行的DolphinGemma模型。2025年4月15日,谷歌旗下的 AI 研究实验室谷歌 DeepMind 宣布,成功开发出一款名为 DolphinGemma 的 AI 模型。
Bard
公司:Google
Bard 是谷歌在大型语言模型基础上推出的聊天机器人。Bard 基于 Google 的对话应用语言模型 LaMDA 的轻量级版本,使用更少的计算能力,使其能够扩展到更多的人,并提供额外的反馈。2023年3月21日,谷歌向公众开放Bard 的访问权限。美国和英国用户可以预约。2023年12月7日,谷歌发布了其最新、最先进的大语言模型 Gemini ,用户将能够在 Google Bard 中体验特别调整的 Gemini Pro 英语版本。
Google智能助理
公司:Google
Google智能助理是Google开发的智能助理,于2016年5月在Google I/O发布。与Google即时不同,Google智能助理可以参与双向对话。智能助理被集成在Allo应用、Google Home设备、Android 6.0或以上的设备、Pixelbook、Wear OS、Android TV、iOS和Android Auto。
Claude
公司:Anthropic
Claude,美国人工智能初创公司Anthropic发布的大型语言模型家族,拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力,该模型对标ChatGPT、Gemini等产品。2023年3月15日,Anthropic正式发布Claude的最初版本,并开始不断升级迭代;同年7月,Claude 2正式发布;同年11月,Claude 2.1正式发布;次年3月4日,Claude 3系列正式发布。2024年10月,Claude 3.5 Haiku 和 Claude 3.5 Sonnet 问世;2025 年 2 月,Claude 3.7 Sonnet 发布,成为全球首款混合推理模型。根据Anthropic官方,Claude 3系列旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面均超过GPT-4和Gemini 1.0 Ultra。Claude 3.5系列可解析PDF、流程图、技术图纸,并实现跨模态推理(如结合图像生成代码)。Claude 3.7 Sonnet 建立 “标准 + 扩展” 双模式,用户可通过 API 控制 “思考预算”,在速度、成本与准确性间灵活权衡。扩展模式下,模型在数学、物理等复杂任务中表现显著提升。
腾讯混元
公司:腾讯
腾讯混元大模型(Tencent Hunyuan)是由腾讯公司研发的大语言模型,该模型基于Transformer神经网络架构,具有万亿参数规模,具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。“腾讯混元大模型”属于深度合成和生成式人工智能技术,是依托腾讯云以API接口形式向企业用户提供的交互文本对话内容生成的技术服务,需要付费使用。2024年9月5日,腾讯宣布推出新一代大模型“混元Turbo”。2025年3月6日,腾讯混元发布图生视频模型并对外开源。3月18日,腾讯混元宣布推出5个全新3D生成模型,全部开源。
腾讯元宝
公司:腾讯
腾讯元宝是深圳市腾讯计算机系统有限公司基于自研混元大模型开发的C端AI助手App,于2024年5月30日上线。腾讯元宝支持语音和文字搜索,涵盖微信公众号和视频号等信源。搜索结果以图片、视频、音乐和地图等形式展现;支持PDF、Word、PPT、Excel、TXT等格式文档识别,支持本地和微信上传;腾讯元宝可用于撰写报告、方案、文案和代码。设有DeepSeek R1模型集成深度思考与联网搜索功能,该模型可以利用联网搜索,确保回答的时新性和权威性。2024年10月,在ADX行业版数据9月工具月榜中,《腾讯元宝》位列第19名。据点点数据显示,2024年第三季度以来《腾讯元宝》iOS预估下载量约为118万。2025年2月21日,腾讯元宝重磅更新,DeepSeek已支持理解图片信息。2月22日,腾讯元宝超越豆包,升至中国区苹果免费APP下载排行榜第二。2月,腾讯元宝入驻微信生活服务“九宫格”。3月1日宣布,腾讯元宝上线电脑客户端版本,支持Windows和macOS系统。3月3日,腾讯元宝APP在中国区苹果应用商店免费APP下载排行榜上升至第一,超越DeepSeek。
Kimi
公司:月之暗面
Kimi是北京月之暗面科技有限公司于2023年10月9日推出的一款智能助手,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,是全球首个支持输入20万汉字的智能助手产品。Kimi在二级市场一度复现了ChatGPT“带货能力”的势头,引发了一众“Kimi概念股”狂飙猛涨。2024年3月18日,Kimi智能助手启动200万字无损上下文内测。3月21日,Kimi因流量突然剧增无法正常使用。2024年4月18日,月之暗面官宣旗下Kimi智能助手更新。4月24日,月之暗面宣布Kimi大模型学会“使用工具”了,API已支持Tool Calling功能。5月,Kimi推出付费打赏功能,开始试探C端付费意愿。10月,月之暗面正式上线具备AI自主搜索能力的Kimi探索版,搜索量是普通版的10倍,一次搜索即可精读500个页面。
讯飞星火
公司:科大讯飞
讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,该模型对标ChatGPT。2023年5月6日,科大讯飞正式发布讯飞星火认知大模型并开始不断迭代;6月9日,星火大模型V1.5正式发布;8月15日,星火大模型V2.0正式发布;9月5日,星火大模型正式面向全民开放;10月24日,星火大模型V3.0正式发布;2024年1月30日,星火大模型V3.5正式发布。4月26日,讯飞星火大模型V3.5更新。5月22日,讯飞星火Lite版永久免费。6月27日14:00,讯飞星火V4.0正式发布。8月30日,星火语音大模型更新,带来“星火极速超拟人交互”。讯飞星火认知大模型已位列中国头部水平,通过中国信通院组织的AIGC大模型基础能力(功能)评测及可信AI大模型标准符合性验证,并获得4+级评分。
天工AI
公司:昆仑万维
天工大模型是昆仑万维自研的双千亿级大语言模型,是中国首个对标ChatGPT的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。2023年4月17日,自研双千亿级大语言模型天工1.0发布。7月6日,天工AI助手App正式上线,8月23日,推出国内第一款AI搜索产品天工AI搜索,11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务;2024年02月06日,“天工2.0”与新版“天工AI智能助手”APP发布。2024年4月17日,“天工3.0”基座大模型与旗下的“天工SkyMusic”音乐大模型正式开启公测。2023年7月27日,入选中国信通院“铸基计划”高质量数字化转型产品及服务全景图,9月6日,MLLM测评中,综合得分排名第一;2024年3月,获得第七届金璨奖“年度创新商业模式奖”。2024年5月, 在MMBench等多项权威多模态测评结果中,“天工 3.0” 超越GPT4V,多项评测指标达到全球领先水平。5月27日,昆仑万维集团宣布,天工AI每日活跃用户已超过100万。
ChatGLM
公司:清华大学
ChatGLM,清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。
盘古Chat
公司:华为
“盘古Chat”是华为公司旗下一款直接对标ChatGPT的多模态千亿级大模型产品。
360智脑
公司:360
360智脑是360自研认知型通用大模型,依托360多年积累的大算力、大数据、工程化等关键优势,集成360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,重塑人机协作新范式。为服务产业数字化,360发布企业级AI大模型战略,以人为本,构建安全可信大模型。2023年3月29日,360智脑大模型1.0版本发布。 6月13日,大模型升级至4.0版本,数字人、多模态应用、360全端应用等成果落地。
思必驰DFM-2大模型
公司:思必驰
思必驰自研的对话式语言大模型DFM-2(Dialogue Foundation Model),中文直译为“通用对话基础模型”,中文取首字母谐音“东风”,显示将用大模型助力行业实现“沟通万物、打理万事”。思必驰DFM-2大模型是思必驰研发的技术。2023年7月12日,思必驰正式发布DFM-2大模型。DFM-2 属于垂域大模型,是具有通用智能、针对垂域的行业语言大模型。可以实现通用人工智能的柔性定制,开展大规模、高质量、个性化的人工智能系统定制。
ChatJD
公司:京东
ChatJD是由京东推出的产业版ChatGPT。ChatJD定位为产业版ChatGPT,旨在打造优势、高频、刚需的产业版通用ChatGPT。ChatJD将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用ChatGPT的产业应用能力。
Nemotron Ultra
公司:英伟达
Nemotron Ultra(全称:Llama-3.1-Nemotron-Ultra-253B-v1)是英伟达发布的一款大模型。这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。
日日新SenseNova V6
公司:商汤科技
日日新SenseNova V6(简称:日日新V6)是商汤科技推出的大模型体系,通过多模态长思维链训练、全局记忆、强化学习的技术突破,形成领先的多模态推理能力,并突破成本边界。
ChatLaw
公司:北京大学信息工程学院
北大团队发布了中文法律大模型ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。
LightGPT
公司:恒生电子LightGPT是恒生电子发布的金融行业大模型。
MOSS
公司:复旦大学
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。
拓世大模型
公司:拓世科技
拓世大模型是拓世科技集团开发的具有巨大规模和复杂结构的人工智能大语言模型,拥有数万亿个参数,通过在庞大的数据集上进行训练,以AI为核心,构建了一个全面的数字化生态系统,可处理包括自然语言、图像、声音等在内的多种形式信息,具备理解和生成高质量内容的能力。2023年6月10号,拓世科技集团AI+战略暨AIGC拓世大模型发布会上正式发布拓世大模型
TechGPT
公司:东北大学
TechGPT,是中国东北地区首个全量微调并开源的大模型。
鸿湖
公司:中国联通
鸿湖是中国联通图文大模型,该模型训练参数达20亿,支持以文生图、以图生图、视频剪辑等多样化的AI能力。
日日新
公司:商汤科技
日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。2023年8月,日日新大模型获批上线。2024年5月29日,商汤正式对外发布日日新大模型5.0粤语版。2025年1月20日,商汤“日日新融合大模型交互版”开放商用。
天河天元
公司:国家超级计算天津中心
天河天元是国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,最终训练打造出的中文语言大模型。
天擎
公司:美亚柏科
天擎是美亚柏科发布的国内首个公共安全大模型。
梧桐
公司:宇视科技
梧桐是宇视科技发布的宇视AIoT(人工智能物联网)行业大模型。
悟道·天鹰
公司:智源人工智能研究院
“悟道·天鹰”是北京智源人工智能研究院发布的语言大模型。悟道・天鹰Aquila语言大模型是第一个中英文双语大模型,支持商用、符合数据合规要求,在中英高质量合规的语料数据库基础上从零开始训练。
小可
公司:电科太极
小可,电科太极发布的生成式人工智能大模型产品。2023年6月9日,中国电科所属电科太极在京正式发布“小可”。
序列猴子
公司:出门间间
“序列猴子”,是李志飞研发的大模型产品,该大模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
长虹超脑
公司:长虹
长虹超脑是依托于多模态交互,语义理解及意图识别,大数据等技术构建起的人工智能超脑系统,号称具备能感知、能理解、能学习三大核心能力;可应用于日常生活答疑,专业领域探索以及个性化服务等方面;搭载于长虹电视上,以数字形象“长虹小白”的形式与用户交互,并执行指令。
贞仪
公司:蚂蚁集团
贞仪,是蚂蚁集团的技术研发团队正在自研语言和多模态大模型。
紫东太初
公司:中科院
紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台。全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。“紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。自动化所“紫东太初”跨模态通用人工智能平台瞄准成为实现通用人工智能的开天之斧,在智能世界混沌初开之际开辟新局。2023年6月16日,中国科学院自动化研究所发布紫东太初2.0。
TigerBot
公司:虎博科技
TigerBot是一款由国内团队虎博科技自研的多语言任务大模型,覆盖生成、开放问答、编程、画图、翻译、头脑风暴等15大类能力,支持子任务超过60种,且支持插件。
商量
公司:商汤科技
商量(SenseChat),是商汤科技旗下的中文语言大模型应用平台。2023年4月10日,商汤科技举办技术交流日活动。商汤研发的大语言模型被命名为“商量SenseChat”。2023年8月31日,商汤科技官宣,商汤日日新大模型旗下自然语言应用“商量SenseChat”正式面向用户开放服务。
书生·浦语
公司:上海人工智能实验室
书生·浦语(InternLM)是2023年6月7日,由上海人工智能实验室、商汤科技联合香港中文大学、复旦大学及上海交通大学发布的千亿级参数大语言模型,具有1040亿参数它是在包含1.6万亿token的多语种高质量数据集上训练而成的。书生·浦语不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各科目的数据集(GaoKao)。书生·浦语2.0不仅在客观性能指标上提升显著,在主观体验上也有明显改善,可以为用户提供更好的对话和交互体验,具备较强的“共情”能力和丰富的结构化创作能力。
硅基知识大模型
公司:深兰科技
硅基知识大模型是深兰科技研发的一款针对垂直领域、特定用户、细分应用场景的、用户可训练的生成式大语言模型。
知海图AI
公司:知乎和面壁科技
知海图AI,是知乎和面壁科技合作发布的中文大模型,于2023年4月13日正式开启内测。
泰坦
公司:亚马逊
泰坦(Titan),是亚马逊推出的大型语言模型。2023年4月13日,亚马逊云服务部门宣布推出自有的大型语言模型泰坦。
WPS AI
公司:金山办公
“WPS AI”是金山办公旗下具备了大语言模型能力的一款生成式人工智能应用,也是中国协同办公赛道首个类ChatGPT式应用。2023年7月6日,金山办公正式推出基于大语言模型的智能办公助手WPS AI,官网同步上线。2024年7月5日, 金山办公发布WPS AI 2.0。
Replika
公司:Luka
Replika是一家名为Luka的公司在2016年就推出了自己的人工智能聊天机器人产品。
LLaMA
公司:Meta
LLaMA,是元宇宙平台公司(Meta)公开发布的产品。2023年7月,Meta公司发布了人工智能模型LLaMA 2的开源商用版本,意味着大模型应用进入了“免费时代”,初创公司也能够以低廉的价格来创建类似ChatGPT这样的聊天机器人。2025年4月5日,Meta发布最新AI大模型Llama 4。
西湖大模型
公司:西湖心辰(杭州)科技有限公司
2023 年 07 月 09 日,西湖心辰(杭州)科技有限公司正式推出自研的通用大模型——“西湖大模型”。西湖大模型具备长期记忆、情感感知和主动聊天等功能,并且融合了文字、图片、语音等多种模态。
蓝心大模型
公司:vivo蓝心大模型是vivo发布的自研大模型矩阵。2024年10月10日,vivo在开发者大会上正式发布自研的全新蓝心大模型矩阵,全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。
SoulX
公司:上海任意门
SoulX,是社交平台Soul上线的自研语言大模型。
Copilot
公司:微软
Copilot是微软在Windows 11中加入的AI助手,该AI助手是一个集成了在操作系统中的侧边栏工具,可以帮助用户完成各种任务。Copilot依托于底层大语言模型(LLM),用户只需说几句话,做出指示,它就可以创建类似人类撰写的文本和其他内容。2023年5月24日,微软在其年度Build开发者大会上宣布,将在Windows 11中加入一个名为Copilot的AI助手。2025年3月26日,科技媒体NeoWin报道称,微软最新推出了Researcher(研究员)和Analyst(分析师)两款AI Copilot智能体。
Baichuan
公司:百川智能
Baichuan是百川智能研发的超千亿参数的大语言模型。百川智能采用了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等创新技术手段,提升了Baichuan的各项能力。2024年5月22日,百川智能发布基座大模型Baichuan 4。
智谱清言
公司:智谱华章
智谱清言,是北京智谱华章科技有限公司推出的生成式AI助手,于2023年8月31日正式上线。2024年8月29日,智谱清言APP支持视频通话功能。智谱清言基于智谱AI自主研发的中英双语对话模型ChatGLM2;其通用问答功能可以准确及时地回答涵盖多个领域的各类问题;可与用户进行自然、流畅的交流;它能根据用户需求模拟不同角色,以增强互动性和提升用户体验。对于创意写作,智谱清言能用户提供创意灵感、内容框架及优质文案,助力提高写作效率与质量。还支持多种编程语言进行开发和调试,帮助用户理解代码、解决编程问题。2025年3月4日,智谱清言发布首个支持生成汉字的开源文生图模型——CogView4。
元象大模型
公司:深圳元象
元象大模型是由深圳元象XVERSE从头训练、全链路自主研发的高性能通用大模型系列,现已成功研发XVERSE-7B、13B、65B等多个量级的高性能大模型,并且全部开源,免费商用。
Stable LM 2
Stable LM 2 支持英语、西班牙语、德语、意大利语、法语等 7 种语言,拥有“体积小、性能高效”特点,并号称在“安全透明的环境下训练而成”。
程心AI
公司:同程
程心AI是同程旅行自主研发的旅游专属大模型。2025年3月7日,同程旅行宣布“程心AI”正式完成与DeepSeek的技术融合。
ABAB大模型
公司:Minimax
ABAB大模型,是Minimax推出的自研通用大模型。2023年8月31日,ABAB大模型首批通过备案向公众开放。
Vidu
公司:生数科技
Vidu是北京生数科技有限公司联合清华大学发布的中国首个长时长、高一致性、高动态性视频大模型,于2024年4月27日在中关村论坛未来人工智能先锋论坛上发布,模型采用团队原创的全球首个Diffusion与Transformer融合的架构U-ViT。2024年7月,Vidu面向全球上线,核心功能包括参考生视频、图生视频、图生视频。可生成4秒和8秒视频,分辨率最高达1080P。上线百天用户数即破千万,2025年1月15日为止,是全球增速最快的AI视频模型。Vidu自上线以来就致力于解决“一致性”核心难题,Vidu1.5 发布“多图参考”功能,是全球首个发布“多主体一致性”的视频模型。
百川大模型
公司:百川智能
百川大模型是百川智能推出的大模型产品。2023年8月31日凌晨,百川智能宣布其大模型通过《生成式人工智能服务管理暂行办法》备案,向公众开放。
DFM语言大模型
公司:必驰科技
DFM语言大模型是必驰科技股份有限公司的语言大模型
GeeneTurboGT
公司:狮腾控股
GeeneTurboGT,狮腾控股推出的AI模型。
Llama 4
公司:Meta
Llama 4,是Meta公司发布的大模型。2025年4月5日,Meta公司发布其大型语言模型Llama的最新版本Llama 4 Scout与Llama 4 Maverick。