科大讯飞星火大模型升级
长文本、“多情感超拟人合成”等功能上线

发稿时间: 2024-05-04 09:56 来源:人民邮电报 作者:岳悬 2024-05-04
分享X

日前,讯飞星火大模型V3.5“上新”升级。据了解,面向用户高效准确知识获取的“痛点”,科大讯飞发布了长文本、长图文、长语音大模型,不仅能够对各种信息来源的海量文本、图文资料、会议录音等进行快速吸收学习,还能够在各种行业场景给出专业、准确回答。

另外,科大讯飞进一步升级了星火语音大模型,发布“多情感超拟人合成”功能,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。

据统计,讯飞星火APP用户使用的最高峰是工作日的上午9:30和下午3:30左右。这意味着大部分用户用讯飞星火来解决和工作相关的刚需问题。在知识获取和学习的过程中,广大用户能拿到的资料往往不仅是现成的长文本,还有随手可见的报刊书籍内容、各种研讨会的PPT内容和老师黑板上的板书、同学的笔记,以及各种会议录音、访谈,各种网上的发布会、培训教育视频等。为此,科大讯飞推出首个支持长文本、长图文、长语音的大模型,来满足用户真实场景中多源信息的获取需求。

据悉,此次讯飞星火长文本功能全新升级后,具备了长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力。科大讯飞表示,其总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、华体(中国)、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平超过GPT-4 Turbo。面向广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

此次科大讯飞发布“多情感超拟人合成”功能,进一步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音更加生动、真实。除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,一句话就可以定制用户的AI助手声音。比如模仿小朋友的声音,每天给爷爷奶奶读书读报;在用户出差的时候,模仿声音给孩子讲故事等。

科大讯飞董事长刘庆峰表示:“目前,科大讯飞个性化语音合成已进阶至‘一句话声音复刻’阶段。当年讯飞AI模仿林志玲的声音需要去台湾录一个星期的声音,到后来模仿郭德纲需要一天的声音,再往后需要5分钟的录音,现在一句话就可以模仿。” 

新闻附件:

新春走基层|我们一直在路上

特别推荐

相关新闻