01智能语音转写是可以支持长音频流的语音转文字的一项语音识别能力,是主要面向人人对话的语音识别系统,包含非实时和实时两种转写方式,适用于远场、长时、语言无组织性的场景
非实时语音转写是将录制好的音频文件进行文字转写,其特点是需事先录制音频,异步返回结果,且具备分词、多候选、语音鉴别、发音人分离等功能;实时语音转写是在采集音频的同时返回文字结果,其特点是无需录制音频,实时同步返回结果,且具备上下文纠正、标点过滤等功能
02目前中国智能语音转写行业市场较为集中,讯飞听见和搜狗听写的市场份额占据绝对优势,行业头部效应明显,且讯飞听见和搜狗听写的用户满意度均高于行业整体水平
从用户选择比例来看,讯飞听见、搜狗听写两家厂商占比为74.5%,市场较为集中,行业头部效应明显。其中,最近使用过或正在使用讯飞听见的用户比例最高,占比达到43.3%;从用户满意度来看,讯飞听见和搜狗听写均高于行业整体满意度水平;从技术能力来看,讯飞听见、搜狗听写和灵云听语的语音转写准确率均达到98%,技术能力过硬
03中国智能语音转写行业中游厂商呈现技术开发与产品开发一体化的趋势,行业发展趋向智能硬件和后期处理平台服务一体化以及特定领域定制化服务的态势
中国智能语音转写行业中游系统集成厂商商业模式可分为为用户提供智能语音转写软件接口、硬件终端和软硬件一体化服务三大类。互联网巨头厂商和AI创业厂商主要提供语音转写软件接口,按使用次数及使用时长进行收费;智能语音厂商主要为B端客户提供综合解决方案,行业发展趋向智能硬件和后期处理平台服务一体化以及特定领域定制化服务的态势