科大讯飞星火大模型升级<br/>长文本、“多情感超拟人合成”等功能上线

科大讯飞星火大模型升级
长文本、“多情感超拟人合成”等功能上线

发稿时间： 2024-05-04 09:56 来源：人民邮电报作者：岳悬 2024-05-04

分享X

日前，讯飞星火大模型V3.5“上新”升级。据了解，面向用户高效准确知识获取的“痛点”，科大讯飞发布了长文本、长图文、长语音大模型，不仅能够对各种信息来源的海量文本、图文资料、会议录音等进行快速吸收学习，还能够在各种行业场景给出专业、准确回答。

另外，科大讯飞进一步升级了星火语音大模型，发布“多情感超拟人合成”功能，具备情绪表达能力，并推出一句话声音复刻功能，让科技更有温度。

据统计，讯飞星火APP用户使用的最高峰是工作日的上午9:30和下午3:30左右。这意味着大部分用户用讯飞星火来解决和工作相关的刚需问题。在知识获取和学习的过程中，广大用户能拿到的资料往往不仅是现成的长文本，还有随手可见的报刊书籍内容、各种研讨会的PPT内容和老师黑板上的板书、同学的笔记，以及各种会议录音、访谈，各种网上的发布会、培训教育视频等。为此，科大讯飞推出首个支持长文本、长图文、长语音的大模型，来满足用户真实场景中多源信息的获取需求。

据悉，此次讯飞星火长文本功能全新升级后，具备了长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力。科大讯飞表示，其总体已经达到GPT-4 Turbo 4月最新长文本版本的97％水平，而在银行、保险、华体(中国)、电力等多个垂直领域的知识问答任务上，讯飞星火长文本总体水平超过GPT-4 Turbo。面向广泛的音视频信息高效获取需求，科大讯飞也推出长语音功能，将国际领先的语音识别和翻译技术结合起来，可以实现会议录音、学习视频等的一键研读，实现音视频场景的高效知识获取。

此次科大讯飞发布“多情感超拟人合成”功能，进一步提升了情绪表达的可感知度，对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85％以上，AI语音更加生动、真实。除了超拟人对话，科大讯飞还推出“一句话声音复刻”功能，一句话就可以定制用户的AI助手声音。比如模仿小朋友的声音，每天给爷爷奶奶读书读报；在用户出差的时候，模仿声音给孩子讲故事等。

科大讯飞董事长刘庆峰表示：“目前，科大讯飞个性化语音合成已进阶至‘一句话声音复刻’阶段。当年讯飞AI模仿林志玲的声音需要去台湾录一个星期的声音，到后来模仿郭德纲需要一天的声音，再往后需要5分钟的录音，现在一句话就可以模仿。”　

新闻附件：