声扬科技VoiceAI已完成千万级Pre-A轮融资。VoiceAI主要研究技术即是声纹识别。声纹识别赛道作为一个正在爆发的蓝海市场,涌现出了不少玩家,业内人士预测,声纹识别是指纹和人脸之后的下一个生物识别技术。
声纹识别应用广泛 抑或是下一风口
关于声纹识别,简而言之,是将声信号转换成电信号,再用计算机进行识别的技术。声纹识别作为重要的辨认技术,广泛应用于金融、交通、医疗、教育、旅游等公共服务领域认证服务。不过,声纹识别更大的应用前景在于安防领域,比如刑侦破案、门禁、银行交易等等。此外,在智能家居等领域,为了安全,也为了更好的智能体验,比如在人声鼎沸情境中准确识别哪句话是主人下达的命令等,有人认为它将会成为智能家居未来发展的关键,抑或是语音交互的下一个风口。从其发展前景而言,声纹识别的市场潜力巨大,前景可观。
如今,在声纹识别需求日益增长的情况下,投身于声纹识别的企业开始崛起,部分并已取得了不错的成果。比如国外的Nuance、VoiceVault、Voice Biometrics、PhoneFactor,或是国内的科大讯飞、中科信利、厦门天聪、上海电虹等。
人们何以看重声纹识别?
人工智能主要有三个研究方向:视觉识别、智能语音、自然语言处理NLP。其中,在语音识别领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的问题,多应用在安全验证场景。在语音转文字赛道,各家的效果可能趋于0.1%、0.2%的差距,为了避免同质化竞争,许多公司选择从“声纹识别”切入。
声纹识别相对于其他生物识别最大的优势主要体现在以下几点: 一是非接触式识别,相对于指纹识别而言,它更加便捷;二是降低侵犯隐私风险,相对于人脸识别而言,社会大众对于声纹识别的抵触大大降低,随便采集到的一段话便可以进行声纹识别;三是获取语音的识别成本低,相对于人脸识别、指纹识别等,声纹识别只要求麦克风便可以进行采集。
从近几年情形可以看出,相比于指纹识别、人脸识别等生物识别技术,声纹识别是“低调”的,但市场需求的确存在,且市场热度也有上升趋势。
声纹识别难以成为“独行侠”
尽管前景可观,但就目前而言,声纹识别要想真正成熟并落地,还需要克服一些难题。与其他类型识别一样,声纹识别训练也需要庞大的数据积累及对数据的精确标注,并且难上加难:声纹识别训练库的建立,至少要保证性别比例分布为50%±5%,包含有不同年龄段、不同地域、不同口音、不同职业。同时,测试样本应该涵盖文本内容是否相关、采集设备、传输信道、环境噪音、录音回放、声音模仿、时间跨度、采样时长、健康状况和情感因素等影响声纹识别性能的主要因素。
因此严格说来,声纹识别当“独行侠”的机会微乎其微。只有在智能家居等相对局限的场景中才能够独立提供服务。在更多场景下,则是通过与人脸、语音等其他识别技术配合,进行身份确认。
声纹识别对数据的要求其实比语音识别还要高很多,这条路会很难。但庆幸的是,我国目前也有许多AI初创公司在坚持做拓荒者。用SpeakIn的COO易鹏宇所说,“这不正是创业者需要做的事吗?”