生成式AI之战，谁能破局而出？

随着腾讯的入局，国内生成式AI大模型赛道集齐BAT三大巨头，竞争日趋白热化。

4月14日，腾讯云发布面向大模型训练的新一代高性能计算集群，搭载英伟达最新一代H800 GPU，服务器互联带宽高达3.2T，算力性能较上一代提升3倍，号称目前国内性能最强的大模型计算集群。

(资料图)

除了算力基础设施，腾讯去年6月发布混元大模型，微信也在去年10月发布WeML大模型。在上月底的财报电话会议上，腾讯总裁刘炽平表示，对于腾讯整个业务来说，AI及大模型是一个增长的扩大器。

在腾讯下场之前，百度、阿里和华为等公司已经先后落子这一领域。

3月中旬，百度推出“文心一言”；半个多月后，华为在一场行业峰会上披露了“盘古”大模型的研发及落地情况；4月11日，阿里大模型“通义千问”高调亮相，未来将接入阿里全线业务。

与此同时，360、网易、知乎、科大讯飞、昆仑万维等先后公布自己的大模型；此前淡出中心舞台的王慧文和王小川重出江湖，迅速敲定数千万美元的融资，正在四处招兵买马。

掀起新技术浪潮的AI大模型，已经成为科技公司必须参加的一场大考。在AI领域深耕多年的商汤科技，也在本月交出自己的答卷。

Part 1 入局AI大模型“马拉松”

4月10日，商汤公布以“大模型+大算力”推进AGI（通用人工智能）发展的战略布局，并发布“日日新SenseNova”大模型体系，涵盖自然语言处理、图片视频及3D内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

其中，最引人关注的是“商量SenseChat”，一款千亿级参数的自然语言处理大模型。在现场演示中，SenseChat能够结合上下文语境，流畅准确地回答各类问题，还具备超长文本理解能力，可以从复杂文档中提取和概括信息，帮助开发者编程，提供个性化的健康咨询等。

此外，商汤还展示了多款基于大模型体系的生成式AI模型及应用：“秒画SenseMirage”AI内容创作社区平台可以根据文本生成图片，拥有超10亿参数，支持二次元、三次元等多种生成风格，最高支持6K分辨率，还可支持自行上传数据集进行finetune、自训练等功能，定制训练属于自己风格的LoRA模型，显著降低模型的训练门槛；“如影SenseAvatar”AI数字人视频生成平台仅需一段5分钟的真人视频素材，即可生成数字人分身；“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台能够生成大模型3D场景和精细3D物件，为搭建元宇宙虚拟空间提供高效、低成本的工具。

秒画SenseMirage可根据文本生成多种风格的高清图片

AI大模型是中国科技企业的又一块兵家必争之地。随着BAT等互联网公司，以及商汤、科大讯飞等AI老兵的入局，每个人都摩拳擦掌、跃跃欲试，准备大干一场。

业内人士普遍认为，国产大模型与GPT至少有2~3年的差距。怎样尽快赶上世界先进水平，是摆在大大小小玩家面前的命题。将这一命题拆解开来，最关键的是数据、算法和算力三大要素。

三要素中，算法的研发难度相对较低，且有众多开源项目可作为参考，中国公司最容易缩短甚至抹平差距；但在数据和算力方面，想要拉近与OpenAI的距离要困难得多。它需要更漫长的积累沉淀，也需要企业持之以恒地拿出真金白银，投入到AI相关的“硬科技”中。

这也意味着，大模型之争不是一场停留在应用层面的百米赛跑，而是一场由综合能力定胜负的马拉松。谁能在数据和算力上建立壁垒，谁就有望率先踏入生成式AI的新时代，在新技术浪潮中吃到更多红利。

Part 2 数据和算力，AI大模型两大根基

ChatGPT之所以一鸣惊人、经受住了上亿用户不同场景下的考验，首先得益于OpenAI给它“投喂”了大量数据。

OpenAI此前披露，为了AI像人类那样流畅交谈，研发人员给GPT-3.5提供多达45TB的文本语料，相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等，甚至还将代码开源平台Github纳入其中。

丰富而庞大的语料库，让ChatGPT不仅能够聊天、讲故事，还会回答专业问题、帮学生写作业、给码农写代码。在一些读写测试中，ChatGPT展现出来的能力不亚于高中生。

与之类似，商汤语言大模型SenseChat也使用了大量数据进行训练，并充分考虑中文语境，能够更好地理解和处理中文文本。在发布会上，SenseChat一问一答应对自如，甚至还能够根据《专利法》答疑解惑，结合法条和最新资讯给出合理答案。

可以看出，足够多、足够丰富的数据，是生成式AI大模型的根基。商汤在这方面有自己的独特优势。

商汤的AI技术和产品已经在众多领域得到应用，在长期实践中，商汤积累了大量真实世界的高质量视觉数据，视觉信息可以转化为更多结构化的表达，形成丰富的多模态语料库，为大模型研发奠定基础。正如商汤董事长兼CEO徐立所言，“商汤积累了大量视觉类信息，这类信息作为知识，输入我们的多模态网络中，会带来完全不一样的数据基础。”不断增长的多模态数据池，让商汤从源头上建立了壁垒。

视觉大模型是商汤的核心技术突破点。早在2019年，商汤就发布了10亿参数的视觉大模型，2022年扩大至320亿参数，为迄今为止全球最大的视觉模型。而在自然语言处理、多模态和生成式AI大模型方面，商汤也已有产品落地。这些大模型的迭代生长和融合汇聚，最终造就了商汤SenseNova大模型体系。

除了海量数据，大算力是大模型的另一个根基。

AI大模型所需要的计算量，大致上相当于参数量与数据量的乘积。而大模型之所以“大”，就是因为参数众多和数据量庞大。过去5年，AI大模型的参数量几乎每年提升一个数量级，例如GPT-4参数量是GPT-3的16倍，达到1.6万亿个；而随着图像、音视频等多模态数据的引入，大模型的数据量也在飞速膨胀。

这意味着，想要玩转大模型，必须拥有大算力。OpenAI在生成式AI赛道上一骑绝尘，关键能力之一就是空前强大的算力底座。仅仅是为了跑出GPT-3.5模型，OpenAI就使用了约1万颗英伟达GPU来训练。

商汤很早就开始建设自己的算力底座。2018年前后，商汤就着手筹备大模型所需的算力、算法、数据等方面的工作；2022年1月，造价数十亿元的商汤人工智能计算中心（AIDC）交付使用，初始峰值算力达到3740 Petaflops，已具备完整训练万亿参数规模的大模型的能力。再加上数据层和模型层，商汤AI大装置逐渐成型。

如今，商汤的AI大装置SenseCore，依靠2.7万块GPU，其算力达到5000 Petaflops，可支持20个千亿参数超大模型同时训练，并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。

不过，AI大装置的效能如何，总算力并不是唯一指标。在日常应用中，AI大装置需要尽可能提高多卡并行状态下的算力利用率，尽可能保持长时间稳定运行。目前，SenseCore支持最大4000卡并行单任务训练，实现了多卡并行状态下的高算力利用率，还能持续7天以上不间断稳定训练。

此外，SenseCore提供了模块化、全链条的数据、训练及推理能力，可实现百亿级数据管理及检索、人工标注服务，一键量化、一键部署、一键应用，实现大模型快速上线验证。

自研自建的算力底座，为商汤在大模型领域施展手脚提供了舞台。

像SenseCore这样的AI大装置，其价值不仅体现在对于商汤现有大模型的支撑上，更指向未来发展。在源源不断的数据浇灌下，AI大装置能够以更高效、更经济的方式批量训练大模型，并缩短从研发到部署再到应用的链条，成为商汤大模型体系应用落地的推力引擎。

Part 3 政策指引行业发展，AI大模型加速落地

目前，生成式AI大模型已经成为全球各国的关注焦点。作为下一代互联网的关键基础设施，中国科技行业正在积极自主研发大模型，而配套的监管政策也已在路上。

近日，国家网信办发布《生成式人工智能服务管理办法（征求意见稿）》。征求意见稿指出，国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作，鼓励优先采用安全可信的软件、工具、计算和数据资源。

同时，征求意见稿对于生成式AI产品及服务的提供者做出多项明确要求，包括遵守法律法规的要求，尊重社会公德、公序良俗等，为其发展路径指明方向、划定红线。

上述文件有望成为国内生成式AI产业的首份监管文件。它在释放鼓励发展的积极信号的同时，也设置了一系列监管规则，目标是促进生成式AI的健康发展和规范应用。

各领域企业正在积极拥抱生成式AI，利用新技术实现降本增效，并把AI能力输出给第三方企业，勾勒出充满想象空间的商业化图景。

以阿里为例，除了通义千问接入阿里的所有产品外，阿里云的AI能力和算力也已经在多个企业和机构落地，包括OPPO、南方电网、复旦大学等。此外，吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示，将与阿里云在大模型相关场景展开技术合作的探索和共创。

商汤最新发布的日日新SenseNova大模型体系，同样应用于诸多行业和场景，目前已落地20多个业务场景。

比如，智能汽车是商汤长期布局的赛道。2022年，商汤智能汽车板块量产交付数超50万辆，新增定点数超800万辆，覆盖30多家车企的80多款车型。如今，随着SenseNova大模型体系的推出，商汤正通过AI大模型进一步赋能自动驾驶和智能车舱的产品研发。

在本周的上海车展上，商汤展示了与SenseNova深入融合的绝影未来展示舱。在展示舱内，商量SenseChat可以与用户交流、推荐个性化内容，甚至自动提炼邮件信息，帮助节省阅读时间，如果是儿童上车后还会自动推荐进入儿童模式；而秒画SenseMirage能够为用户自动生成各种风格的照片，为出行增添乐趣。

商汤绝影未来展示舱

借助大模型能力，商汤实现了BEV环视感知在国内首批量产落地，还首创自动驾驶GOP感知体系。此外，商汤绝影通过大模型进行自动化数据标注和产品检测，搭建的完整数据闭环体系，将模型迭代效率提升数百倍，目前已获得知名车企的定点。

此外，在生物制药领域，商汤与企业合作，利用AI大装置为蛋白质结构大模型提供AI推理算力，并为蛋白质相互作用模型，提供研发平台及训练算力，使得抗体筛选效率提升60%。

商汤以AI赋能实体经济的能力矩阵进一步扩充。SenseNova一方面服务商汤自身业务，另一方面，向政企客户开放了多种API（应用程序接口）。客户可根据自身需求调用SenseNova的各项AI技术能力，比如文本生成、图片生成、视觉感知、标注服务等，从而低门槛、低成本、高效率地实现各类AI应用。

基于商汤大装置和SenseNova大模型体系，商汤面向行业提供 “大模型即服务（Model-as-a-Service）”，涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多项能力。

可以说，商汤已经实现了“技术-产品-应用”的商业化内外双循环。长期重注AI的商汤，正站在新一波技术革新的潮头之上继续前行。

关键词：