新浪科技讯 6月11日晚间消息,近日,科大讯飞(002230)董事长刘庆峰公司成立25周年司庆活动上透露,今年6月27日,讯飞星火V4.0发布将展示最新的端到端智能语音落地成果,同时公司的端到端的语音技术建模方案也排在计划中,预计三季度推向市场。除此之外,科大讯飞还将提供GPT-4o没有的一句话复刻、高噪音场景语音识别、多方言多语种免切换功能。
在刘庆峰看来,OpeanAI发布GPT-4o对万物互联时代语音浪潮的推动,类似于当年Siri对语音应用的推动。它备受关注的原因有几个点:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;通过语音到语音的端到端建模,实现快速反应的极致交互体验。
据刘庆峰介绍,目前科大讯飞在超拟人合成技术方面,中英文、多语种都做到了国际领先。全双工技术方面,科大讯飞在2016年就定义了万物互联时代的人机交互标准,包括远场、多人、全双工这些特性,2020年1月,在韩国釜山举行的ISO/IEC JTC 1/SC 35全会上,科大讯飞主导提出了全双工语音交互国际标准,2023年5月正式颁发。端到端的语音技术,背后有语音识别、文本生成、语音合成的过程,这些技术将在公司6月27日将发布的讯飞星火V4.0中得到体现。
刘庆峰透露,下一步,科大讯飞将发力远场高噪音多人说话场景、高表现力个性化场景、云边端一体化、软硬件一体化,从技术优势、市场先机、落地成效构建全方位持续领先优势。据他介绍,在5月底上线的讯飞星火V3.5 Max版本,已在文本生成、知识问答、逻辑推理、数学能力上超越GPT-4 Turbo 0429的最新版本。
此外,刘庆峰还指出,大模型时代科大讯飞核心战略组成包括:第一,赋能现有的软硬件和行业产品,形成基本盘。背靠科大讯飞的根据地业务,深入教育、医疗、工业、汽车、家电等行业赛道,同时打造基于大模型的翻译机、学习机等王牌硬件产品。第二,开拓以央国企为代表的重点行业客户市场,提供真正解决行业和企业刚需的方案。第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇。比如机器人硬件、医疗硬件等。第四,在万物互联时代,AI助手的入口级战略机遇。第五,推进“讯飞超脑2030”计划,迈向家庭陪伴机器人的万亿市场。(文猛)
责任编辑:何俊熹
最新评论