讯飞发布星火大模型:三项能力超ChatGPT

来源:观察者网

2023-05-08 16:56

(文/观察者网 周远方)

“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,这需要一套科学系统的评测体系。“刘庆峰在5月6日的发布会上说道。

当天,讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实时演示大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。

刘庆峰认为,包括GPT在内的通用大模型应当具有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大方面的能力。经系统性评测,讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。

通用大模型“出圈”,讯飞定义七大维度能力

2022年11月30日,Open AI公司发布ChatGPT,终于使人工智能“出圈”,短短两个月,全球活跃用户数超过一亿。有人预言,传统意义上依赖于时长和人力的商业模式将被根本性颠覆,各行各业或焦虑,或拥抱,无论如何,都已经无法忽视这一巨大的变革和机会。

实际上,从2018年谷歌发布BERT到2020年OpenAI发布GPT-3,早已引起国内机构和企业单位的关注和跟进,“圈内”的大模型军备竞赛已经持续多年。因而,在ChatGPT引爆舆论后仅仅几个月内,包括百度、阿里巴巴、360、商汤在内的中国互联网科技公司都在各自的AI积累基础上,发布了面向C端的“类ChatGPT”模型。

在人工智能的重大科技革命浪潮下,认知大模型的质变必将带来“智慧涌现”,但目前,认知大模型推出时间不长,即使是ChatGPT和GPT4也不成熟,另外,通用大模型的演示也有一定偶然性,由此催生的舆论或资本市场波动不一定能长久。

所以,讯飞特别强调“刚需”。

科大讯飞与中科大共同承建的认知智能国家重点实验室在第一时间就开展对ChatGPT的系统性评价工作,确认了通用人工智能应当具有七个维度的能力,包括:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面,共分481个维度。这一评价体系与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟的企业形成了广泛共识。

“哪一家企业能率先把大模型的能力深度赋能各个领域的合作伙伴”,刘庆峰强调,“谁能率先找准最解决社会刚需,而又有市场规模,能够自我造血的点,谁就最先能够形成良性循环。……我们相信完全可以复现OpenAI的智慧涌现,中国将成为智慧涌现的第二极。”

“智能涌现”已来,关键在产业落地

多年来,科大讯飞已为“智能涌现”到来的这一天做好了源头核心技术的储备。

2011年科大讯飞便承建了语音及语言信息处理国家工程实验室,“我们提出让机器像人一样能听会说,这一次认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。”刘庆峰说。

2014年科大讯飞推出“讯飞超脑计划”,明确提出:让机器像人一样能理解会思考。2022年,又升级为“讯飞超脑2030计划”,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会,让机器人走进家庭。

“在国家平台和讯飞超脑计划的支撑下,过去几年我们在认知智能领域取得了一系列全球领先的成果。”2017年,科大讯飞承建认知智能国家重点实验室,也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生,并且在SQuAD机器阅读理解中全球首次超过人类平均水平,刚刚过去的2022年在OpenBookQA 科学知识推理中,单模型也超过人类平均水平。“可以说多年来,科大讯飞已在认知智能领域有了丰富的储备和积累。”

“现代的医疗领域,我们几十亿参数的小模型系统,当时就比GPT3要强,所以起初并没有做大模型,”刘庆峰在采访中表示,但是ChatGPT推出后,我们发现很多惊喜。

因此,在ChatGPT推出后不久的2022年12月15日,科大讯飞正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

值得一提的是,科大讯飞本次没有在发布会上推出备受期待的医疗大模型。对此,刘庆峰表示:“医疗专业领域的模型因为需要相关法规,所以我们应更加谨慎。下一步我们会跟医疗机构合作后,把医疗专业知识放在通用大模型当中。”

他还透露,科大讯飞将会在今年的1024开发者大会上正式对外发布医疗大模型。

算力短板算法补

另一个广受关注的领域是国产人工智能的算力支撑。

对此,刘庆峰在采访中表示:“我们与华为、曙光等国产平台,在算力和操作系统方面都有系统性的对接。这一轮通用人工智能认知大模型的研发竞争中,在算力这个要素上我们是处于劣势的。”

“但是我们觉得两件事情是确实很有价值,第一,我们在研究,如何在算力落后一代的情况下,实现相对接近的效果。我们现在可以在算力小很多、模型小很多的情况下,在很多维度上实现类似效果。”刘庆峰说,“第二,openAI的CEO奥特曼说过,大模型来到GPT4的规模后,再增加更多的算力,做更大的模型,提升效率有限,要把各个子模型协同联动起来,才代表未来。这也是我们在去年12月15日启动专项公关时就确定的技术趋势。”

今年以来,科大讯飞股价累计涨幅已经超过70%。星火认知大模型在周末发布后,科大讯飞今日再度迎来大涨,截止发稿,股价仍封于63.86元/股的涨停板上,市值约1483.5亿元人民币。

本文系观察者网独家稿件,未经授权,不得转载。

责任编辑:周远方
观察者APP,更好阅读体验

重庆通报“燃气费异常”:燃气集团党委书记被免职

“伊以都在降调”,国对国直接打击结束?

以色列“有限复仇”:选在了伊朗核计划中心

以色列“报复”开始:伊朗多地传出爆炸声

5.3%,一季度“开门红”能转化为“全年红”吗?