发表时间: 2023-06-21 15:59:34
浏览:
ai大模型热潮涌动,“百模大战”之下,商业化进程按下加速键。
6月20日,国家网信办发布《境内深度合成服务算法备案清单》,包括百度文生图内容生成算法、腾讯会议虚拟背景算法、讯飞语音识别算法等逾40种。
机构据此分析,这标志着国家对推动大模型等前沿ai技术规范化发展的决心,ai产业化落地有望加速开启。
可以看出,“落地”将成为企业在大模型领域竞争的核心角力点,最终决定谁能更快从这场大赛中跑出来。
而一些大模型的初步成果已经显现。比如5月份才发布讯飞星火认知大模型的科大讯飞,一个月后就迭代升级,并且在随后的“618”推动了公司的硬件销售。
据科大讯飞6月19日披露的投资者关系活动记录表显示,得益于讯飞星火大模型,讯飞ai硬件如ai学习、ai办公、ai健康等,在“618”全周期销售额同比增长125%,其中,搭载认知大模型的讯飞ai学习机t20系列,获得天猫、京东双平台销售额第一。
资本市场上,投资者用脚投票,科大讯飞近一年股价已涨逾90%,6月20日上涨近7%,复权股价同样创出历史新高,当日成交102亿元,在两市居首。
讯飞星火大模型到底发展到何种程度?它在商业化方面的潜力又有多大?
技术实力到底如何?
在chatgpt横空出世后,科大讯飞并非国内第一家发布大模型的企业,但大有后来居上的意味。
5月6日,讯飞星火认知大模型发布,6月9日,该大模型v1.5版本发布,据称突破开放式问答并进一步升级多轮对话和数学能力。
要知道,相对于技术擅长的文本处理能力,数学对大模型的挑战显然更大。讯飞星火大模型似乎表现还不错。
“科创板日报”曾在一篇文章中,对文心一言、科大讯飞、360智脑几家比较有代表性的大模型进行测评展示。
例如,“某次数学竞赛共20道题,评分标准是:每做对一题得5分,每做错或不做一题扣1分。小华参加了这次竞赛,得了64分。问:小华做对几道题?”
正确答案应该是14题,可以看一下各家大模型的作答。
文心一言:
360智脑:
讯飞星火:
可以看到,只有讯飞星火答对了。
加大难度呢?讯飞星火的表现也令人惊喜。
新版本的数学能力说是提升了9%,具体表现到底如何呢?
据搜狐科技,其选取2023年上海数学试卷的10道填空题,对5款大模型产品进行测试。结果显示,讯飞星火答对5题,正确率50%;百度的文心一言和chatgpt答对4题;360智脑和阿里的通义千问则一道都没答对。
大模型在数学领域的表现有着见微知著的效果,因为需要结合大语言模型和计算引擎两者的能力。在复杂逻辑条件下,学习多步骤推理,这对计算资源和数据,有着海量需求,对算力也有着极高要求。
讯飞星火在数学方面能力的展示,是一家企业数据资源和算力水平的展示。在这背后,是科大讯飞一直长期坚守在人工智能领域,在人工智能相关核心算法上,多年来一直潜心投入。
讯飞星火的数学能力,也在一定程度上代表了其在教育领域的综合能力。
据华东师范大学计算机科学与技术学院edunlp团队的智能教育算法测评小组,测评了大模型在教育领域的综合能力,包括记忆、理解、应用、分析、创造等,结果显示,相较于其他大型模型,讯飞星火大模型与chatgpt表现出相当接近的能力。
具体来说,在理解和分析任务中,讯飞星火认知大模型稍稍领先,而在记忆和评价任务中,讯飞星火认知大模型与chatgpt的表现相当接近,说明它们在这些方面的能力相差不大,都能满足一定程度的教育需求。
这也从侧面看出,科大讯飞的星火大模型虽然发布得相对较晚,但迭代迅速,而且敢于第一个喊出10月份在通用认知能力上对标chatgpt的目标。
落地能力显现
人工智能发展多年,技术持续进步,但商业化一直是难点,对大模型来说,落地更是发展的关键。
要知道,大模型以巨量算法为基础,需要的资金投入动辄数以亿计。chatgpt获得追捧后,openai公司获得微软100亿美元投资,这固然是因为chatgpt表现出色,但也看出这一技术持续发展需要巨量资金支持。
据“bmr商学院”,深度科技研究院院长张孝荣就表示,一个机构发展大模型的门槛相当高,不光需要有顶级ai人才进行算法创新,还需要有巨大的算力支持和海量数据支持,这三个因素背后意味着数亿到数十亿美元的资金持续投入。
目前,国内一些大模型已经在商业场景方面有所探索,比如“文心一言”率先在内容和信息相关的场景落地,京东选择了产业ai场景,而讯飞星火大模型一面世,就有了落地场景。
早在5月6日的发布会上,科大讯飞现场展示了学习机、办公本、听见等升级版产品,就已经实现了星火大模型的商业模式落地。
以学习机为例,搭载讯飞星火认知大模型后,讯飞ai学习机实现首个全维度类人作文批改:可以对作文进行深度理解,能像老师一样精细批改点评,同时对评语和范文进行自动生成;口语学习已覆盖了所有中小学课标话题。1对1 ai语伴,让孩子的每一次发音练习都是模拟实战。
此外,“娱乐资本论”曾做过一期市面上主流的5款大模型,一共90个回答的横评,整体评价也比较中肯,颇具参考意义。
可以先看一下这张最终测试评分表:
大模型这种属于比较底层的框架,我们势必要做出自己的由中文语料训练而成的大模型,所以不可避免地会与chatgpt相比较。从上图来看,目前在落地应用方面,讯飞星火在主流国产大模型中,离chatgpt是最近的。
在讯飞星火认知大模型版本迭代时,科大讯飞发布了大模型在学习、医疗、工业、办公等领域进一步的商业落地进展,包括推出星火语伴app,以及星火认知大模型 医疗诊后管理平台、星火认知大模型 工业互联网平台、星火认知大模型 讯飞听见智慧屏产品。
在业内人士看来,此举意在推动其在细分领域的商业化,有望率先突破的场景即为上述医疗、工业制造以及办公领域。
结语
中国科学技术信息研究所发布的一份报告显示,从全球已经发布的大模型分布来看,在大模型数量上,中国和美国超过全球总数的80%,中国从2020年进入大模型快速发展期,与美国保持同步增长态势。
李开复认为,大模型和ai 2.0也是中国不容错过的历史机遇,“中国拥有丰富的中文语料和庞大的市场,通过发展ai大模型,中国可以推动创新产业的发展,实现科技与经济的双重红利。而且中国拥有庞大基数的年轻工程师和最坚韧的企业家,为发展ai大模型提供了强大的人才支持,技术领先、策略灵活、市场反应快、能打硬仗、落地执行力强,将是中国大模型公司的成功关键。”
时代机遇下,作为国产大模型的重要代表之一,讯飞星火已经隐隐有了燎原之势。
热门文章
每周人物