讯飞星火正式发布语音大模型,通用人工智能时代语音王者还是科大讯飞

huqihua 2个月前 (01-31)

讯飞星火V3.5数学、语义理解、代码能力持续提升 更好助力科研、工业等民生刚需领域提质增效

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5,七大核心能力全面提升,数学、语言理解、语音交互能力超GPT-4 Turbo,重磅升级星火智慧黑板;正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,赋能讯飞翻译机迎来全新升级助力更自由沟通,推动万物互联时代下客服、汽车、机器人等场景人机交互变革。

大模型应用加速落地,星火开发者超35万生态增长迅猛,打造个人应用赋能亿万用户;讯飞星火赋能千行百业,携手保险、银行、能源、汽车、通信等领域联合龙头企业,打造大模型赋能的应用标杆。此外,深度适配国产算力的讯飞星火开源大模型“星火开源-13B”首次发布,场景应用效果领先,昇思开源社区联合首发上线。

“通过这场发布会,我们展望一个充满希望、孕育着生长能量的春天。相信2024年一定可以实现星火燎原,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且我们在源头技术创新、在大模型的底层能力上也会站上全新台阶。”刘庆峰说道。

基于全国产化算力平台训练 讯飞星火V3.5七大能力全面提升

2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火步履不停,基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。

首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

“在更好的数据、更强的人机协同训练中,我们不能只看单个的‘原子’能力,而是要以技术进步来解决真实世界的刚需。”

技术进步如何为人类生活带来真正有效的解决方案?刘庆峰从全新赋能万物互联时代人机交互、全新赋能知识学习与内容创作、全新提升数智化生产力三个方面,向现场观众展示讯飞星火V3.5的能力提升。

大模型全新赋能万物互联时代人机交互体验,超拟人合成效果惊艳。讯飞星火V3.5不仅在语义理解、指令跟随和多轮对话的演示中,展现出优异的能力,更是在情绪感知和拟人合成方面表现出色。

“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”

在实操演示环节,科大讯飞研究院院长刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐现场观众。幽默之余,讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。

它不仅能够帮助用户带来解决方案,还能作为“知冷知热”的朋友,带入情绪互动,超高的拟人度让大模型更具人情味。

大模型全新赋能知识学习与内容创作。讯飞星火V3.5对年终总结计划、述职PPT、活动策划、政策问答等任务“信手拈来”。基于此,科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文,这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能等。刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT,短时间内超20页内容丰富的PPT一气呵成,此等“打工神器”获得台下一阵掌声点赞。

大模型还能够结合外部知识进行合理拓展,做到“旁征博引”。要素抽取、问题生成等能力的进步,能够帮助每个人以测助学形成思考的闭环,在越来越多的服务领域及学习知识场所中产生更多好用的智能体。

大模型全新提升数智化生产力,可以更好助力科研、工业等民生刚需领域提质增效。随着数学和推理能力的升级,多模态能力逐步进阶,讯飞星火V3.5在视觉问答、联想推理等方面实现了“高分”应对,理解更加精确,表述也更好。

“讯飞星火V3.5能力的提升,已经达到了量质齐飞的关键点。”刘庆峰表示,2024年讯飞星火认知大模型的应用,一定会在越来越多的场景和领域中大放异彩。

首先赋能的场景,就是教育领域——科大讯飞此次重磅推出星火智慧黑板,具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享四大功能。发布现场,爱因斯坦出现在星火智慧黑板上,用“吸力巨大的吸尘器”来比喻黑洞,深入浅出地为现场观众解释“黑洞是什么”。在立体几何等知识的教学中,星火智慧黑板通过解构立方体,将枯燥的理论视觉化,教学课堂更加生动有趣。

“黑板不再是简单的板书工具,而是跃迁成为教师的AI助手。”刘庆峰提及,在最近的实际展示与使用中,升级后的星火智慧黑板得到了师生、教育专家和业务合作伙伴们的高度评价。

为什么人工智能的每次进步都有对教育领域的赋能?刘庆峰解释,通用人工智能作为能够改变世界生产生活方式的全新技术,可以推动人类进步。“而教育是人类进步的根本,关乎每一位个体,是真正的全民刚需。”

正式发布星火语音大模型 ,首批37个主流语种效果超过OpenAI Whisper V3

“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们目标和梦想一天都没有变。”

智能语音起家的科大讯飞,创业25年来在这条赛道上一路驰骋,持续走在世界前列。2006-2019年,连续十四年荣获国际语音合成大赛冠军;2016-2023年,连续4届获得国际多通道语音分离和识别比赛CHiME冠军;2021-2023年,连续三年获得国际语音翻译比赛IWSLT冠军……此外,还参与承建首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心等,在语音领域的持续积累。

“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

他介绍,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

“通过星火语音大模型的评测效果,我们非常自豪地告诉大家,科大讯飞继续保持了全球领先的水平。”

在此优势下,语音大模型的能力升级也应用于C端硬件产品。会上,刘庆峰介绍了搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。据介绍,此次讯飞翻译机多语自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心出彩。

星火语音大模型不止助力国际沟通,还能“百搭”更多场景,赋能实际应用。刘庆峰介绍,在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互变革。如赋能汽车,智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化;陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。

讯飞星火赋能亿万用户加速赋能千行百业

“大模型发展,应用才是硬道理。”刘庆峰强调。讯飞星火自去年5月诞生以来,不断迭代升级其大模型能力,深耕千行百业的应用刚需。

大模型未来,要从教育开始做起。让孩子站在人工智能肩膀上学习的讯飞AI学习机,能够提高学习效率、激发学习兴趣、提升综合素养,产品用户净推荐值(NPS)持续保持行业第一,获得2023年京东&天猫双11销售额冠军。

大模型也在持续赋能办公硬件,自去年5月讯飞星火正式发布起,有超过60万讯飞智能办公本、智能录音笔用户累计调用语篇规整、会议纪要、自动写稿等能力650万次,让工作更高效。市场用销量表达好评,产品蝉联京东&天猫双11品类销售额冠军。

除了硬件产品,软件应用也不在话下。星火赋能个人应用打造,目前基于讯飞听见、讯飞星火APP、讯飞输入法等应用,已累计赋能亿万用户。在星火大模型赋能下,越来越多的用户拥有专业AI助手。一位浙江的小学老师,使用智能问答高效完成教学方案设计,已累计使用APP262天、超2300篇;一位湖南的“情感咨询师”,通过大模型咨询人际关系等生活中的烦恼,现已累计使用161天、超9500次……这样的例子还有很多,大模型正切实走入日常生活。

打造内容创作平台,星火赋能百万内容生产者。音视频创作工具“讯飞智作”自去年8月15日发布以来,新增了21万会员用户,生成了160万音视频内容;图文创作工具“星火内容运营大师”自去年10月24日发布以来,已服务了5000+企业,生成了超150万篇文章,助力内容创作者高效生产。

今天,在讯飞开放平台之上,大模型总开发者超35万,其中企业开发者超22万,开发者数增长迅猛,大模型应用加速落地,持续夯实第一开发者生态。“所以我非常自豪,讯飞星火大模型的开发者数量,在中国是最高的,而且用户口碑非常好。”刘庆峰说道。

在此基础上,科大讯飞也在加速赋能各个行业的头部企业客户。现场,刘庆峰提及了讯飞与奇瑞的合作。“奇瑞是安徽的骄傲,连续十几年都是中国汽车出口量的第一名。”刘庆峰介绍,奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种,汽车中应用的智能语音交互技术全都由科大讯飞提供。“我们用大模型全力支撑中国汽车的全球化出海战略,要让汽车变得更聪明、更智能、更面向未来。”

讯飞星火大模型加速赋能千行百业,除了汽车行业,还与太平洋保险合作,通过星火太平洋计划赋能内部知识服务、办公、审计、展业等,打造数字劳动力在保险领域的应用标杆;联合交通银行,赋能客服、展业、办公、研发等,重点打造银行领域的代码能力应用标杆;与国家能源集团联合,赋能煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆等。

科大讯飞与中国移动强强联合,全面助力中国移动数智化转型。在赋能“5G新通话”方面,中国移动携手讯飞星火推出5G新通话创新应用“商务速记”,能够实现通话语音同步纪要,关键事项精准提炼,且无需下载APP,所有手机都支持。

利用大模型赋能千行百业,把大模型技术的创造力转化为促进产业高质量发展的新质生产力,正在成为行业的共同选择。发布会现场,还举行了“大模型+5G新通话商务速记应用体验”启动仪式,科大讯飞高级副总裁江涛和中国移动市场部副总经理孙世伟共同参与,5G新通话创新应用“商务速记”向广大移动用户开放体验。

刘庆峰表示,为加速企业大模型应用价值落地,讯飞星火V3.5将提供全栈自主可控的优化套件。基于全国国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。

讯飞星火大模型的全面赋能,无疑将为各行业的数字化转型提供强大的技术支持,引领新一轮的数字化浪潮。

星火开源-13B正式发布深度适配国产算力

共享源代码、开发出更好的软件,是广大开发者、高校、企业自主研发热衷于开源的关键原因,也是共建第一开发者生态的重要途径。会上,首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B正式发布。

本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。

刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实用性大幅提升,在处理复杂的自然语言任务时更加得心应手。

基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化,训练效率达A100的 90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。

开源只有更多的场景落地,才能更好地增进生态合作。目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。

展望2024年星火发展,这三点很重要

“在今天的大模型时代,我们绝不能只用开源模型做应用落地,在通用大模型的底座上一定要有国家队站出来。”刘庆峰强调。

当前,发展通用人工智能是我们必须要做的事情,否则工业、科研、民生等各个专用领域都会极大落后于世界,而中国是世界唯一有望成为智慧涌现第二极的国家。

展望2024年讯飞星火大模型发展,刘庆峰指出三点:“首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”刘庆峰指出。

“第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。”

“第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。”刘庆峰表示,自己有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。

“通用人工智能大未来刚刚开启,它必将深刻改变世界的未来,需要顶天立地的长期主义精神。”顶天,指的是希望源头核心技术在底层大模型能力上向国际最先进的能力看齐;立地,指的是大规模实现产业化。而这也是科大讯飞自成立起就一以贯之的信仰,需要在长期主义精神指引下推进各方面工作。

会上,新书《星火相传》正式发布。“这本书讲述了科大讯飞创业的很多真实故事,但更是讲述了科大讯飞奠基人、我的导师王仁华老师的教书育人经历,希望能够给讯飞人、给讯飞的合作伙伴、包括有志于做高校科技成果转化、有志于判断人工智能未来的朋友们以更多启发。”刘庆峰说道。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到