国产大模型激战商业化，谁是未来霸主？-威尼斯人网址

ai大模型热潮涌动，“百模大战”之下，商业化进程按下加速键。

6月20日，国家网信办发布《境内深度合成服务算法备案清单》，包括百度文生图内容生成算法、腾讯会议虚拟背景算法、讯飞语音识别算法等逾40种。

机构据此分析，这标志着国家对推动大模型等前沿ai技术规范化发展的决心，ai产业化落地有望加速开启。

可以看出，“落地”将成为企业在大模型领域竞争的核心角力点，最终决定谁能更快从这场大赛中跑出来。

而一些大模型的初步成果已经显现。比如5月份才发布讯飞星火认知大模型的科大讯飞，一个月后就迭代升级，并且在随后的“618”推动了公司的硬件销售。

据科大讯飞6月19日披露的投资者关系活动记录表显示，得益于讯飞星火大模型，讯飞ai硬件如ai学习、ai办公、ai健康等，在“618”全周期销售额同比增长125%，其中，搭载认知大模型的讯飞ai学习机t20系列，获得天猫、京东双平台销售额第一。

资本市场上，投资者用脚投票，科大讯飞近一年股价已涨逾90%，6月20日上涨近7%，复权股价同样创出历史新高，当日成交102亿元，在两市居首。

讯飞星火大模型到底发展到何种程度？它在商业化方面的潜力又有多大？

技术实力到底如何？

在chatgpt横空出世后，科大讯飞并非国内第一家发布大模型的企业，但大有后来居上的意味。

5月6日，讯飞星火认知大模型发布，6月9日，该大模型v1.5版本发布，据称突破开放式问答并进一步升级多轮对话和数学能力。

要知道，相对于技术擅长的文本处理能力，数学对大模型的挑战显然更大。讯飞星火大模型似乎表现还不错。

“科创板日报”曾在一篇文章中，对文心一言、科大讯飞、360智脑几家比较有代表性的大模型进行测评展示。

例如，“某次数学竞赛共20道题，评分标准是：每做对一题得5分，每做错或不做一题扣1分。小华参加了这次竞赛，得了64分。问：小华做对几道题？”

正确答案应该是14题，可以看一下各家大模型的作答。

文心一言：

360智脑：

讯飞星火：

可以看到，只有讯飞星火答对了。

加大难度呢？讯飞星火的表现也令人惊喜。

新版本的数学能力说是提升了9%，具体表现到底如何呢？

据搜狐科技，其选取2023年上海数学试卷的10道填空题，对5款大模型产品进行测试。结果显示，讯飞星火答对5题，正确率50%；百度的文心一言和chatgpt答对4题；360智脑和阿里的通义千问则一道都没答对。

大模型在数学领域的表现有着见微知著的效果，因为需要结合大语言模型和计算引擎两者的能力。在复杂逻辑条件下，学习多步骤推理，这对计算资源和数据，有着海量需求，对算力也有着极高要求。

讯飞星火在数学方面能力的展示，是一家企业数据资源和算力水平的展示。在这背后，是科大讯飞一直长期坚守在人工智能领域，在人工智能相关核心算法上，多年来一直潜心投入。

讯飞星火的数学能力，也在一定程度上代表了其在教育领域的综合能力。

据华东师范大学计算机科学与技术学院edunlp团队的智能教育算法测评小组，测评了大模型在教育领域的综合能力，包括记忆、理解、应用、分析、创造等，结果显示，相较于其他大型模型，讯飞星火大模型与chatgpt表现出相当接近的能力。

具体来说，在理解和分析任务中，讯飞星火认知大模型稍稍领先，而在记忆和评价任务中，讯飞星火认知大模型与chatgpt的表现相当接近，说明它们在这些方面的能力相差不大，都能满足一定程度的教育需求。

这也从侧面看出，科大讯飞的星火大模型虽然发布得相对较晚，但迭代迅速，而且敢于第一个喊出10月份在通用认知能力上对标chatgpt的目标。

落地能力显现

人工智能发展多年，技术持续进步，但商业化一直是难点，对大模型来说，落地更是发展的关键。

要知道，大模型以巨量算法为基础，需要的资金投入动辄数以亿计。chatgpt获得追捧后，openai公司获得微软100亿美元投资，这固然是因为chatgpt表现出色，但也看出这一技术持续发展需要巨量资金支持。

据“bmr商学院”，深度科技研究院院长张孝荣就表示，一个机构发展大模型的门槛相当高，不光需要有顶级ai人才进行算法创新，还需要有巨大的算力支持和海量数据支持，这三个因素背后意味着数亿到数十亿美元的资金持续投入。

目前，国内一些大模型已经在商业场景方面有所探索，比如“文心一言”率先在内容和信息相关的场景落地，京东选择了产业ai场景，而讯飞星火大模型一面世，就有了落地场景。

早在5月6日的发布会上，科大讯飞现场展示了学习机、办公本、听见等升级版产品，就已经实现了星火大模型的商业模式落地。

以学习机为例，搭载讯飞星火认知大模型后，讯飞ai学习机实现首个全维度类人作文批改：可以对作文进行深度理解，能像老师一样精细批改点评，同时对评语和范文进行自动生成；口语学习已覆盖了所有中小学课标话题。1对1 ai语伴，让孩子的每一次发音练习都是模拟实战。

此外，“娱乐资本论”曾做过一期市面上主流的5款大模型，一共90个回答的横评，整体评价也比较中肯，颇具参考意义。

可以先看一下这张最终测试评分表：

大模型这种属于比较底层的框架，我们势必要做出自己的由中文语料训练而成的大模型，所以不可避免地会与chatgpt相比较。从上图来看，目前在落地应用方面，讯飞星火在主流国产大模型中，离chatgpt是最近的。

在讯飞星火认知大模型版本迭代时，科大讯飞发布了大模型在学习、医疗、工业、办公等领域进一步的商业落地进展，包括推出星火语伴app，以及星火认知大模型医疗诊后管理平台、星火认知大模型工业互联网平台、星火认知大模型讯飞听见智慧屏产品。

在业内人士看来，此举意在推动其在细分领域的商业化，有望率先突破的场景即为上述医疗、工业制造以及办公领域。

结语

中国科学技术信息研究所发布的一份报告显示，从全球已经发布的大模型分布来看，在大模型数量上，中国和美国超过全球总数的80%，中国从2020年进入大模型快速发展期，与美国保持同步增长态势。

李开复认为，大模型和ai 2.0也是中国不容错过的历史机遇，“中国拥有丰富的中文语料和庞大的市场，通过发展ai大模型，中国可以推动创新产业的发展，实现科技与经济的双重红利。而且中国拥有庞大基数的年轻工程师和最坚韧的企业家，为发展ai大模型提供了强大的人才支持，技术领先、策略灵活、市场反应快、能打硬仗、落地执行力强，将是中国大模型公司的成功关键。”

时代机遇下，作为国产大模型的重要代表之一，讯飞星火已经隐隐有了燎原之势。

国产大模型激战商业化，谁是未来霸主？-威尼斯人网址

分享至微信分享