随着数字化时代的来临,国内各企业为了提升行业竞争力,纷纷开始利用数字化技术,来实现以降本增效为核心的数字化转型,得益于此,助力企业数字化转型升级的SaaS也开始进一步升温。
众所周知,国内企业服务SaaS产业赛道众多、流派迥异,其中向用户提供SaaS类产品与本地化部署解决方案的智能语音转写就是其细分领域的一员。而在疫情等众多因素的共同催化之下,智能语音转写技术的商业化应用也迎来了新的发展机遇。
智能语音转写乘风起
随着智能语音产品及服务在办公、学习、行业交流等多个场景中的应用越来越广泛,智能语音转写市场整体规模持续上涨,其发展潜力也在逐一释放。据艾瑞咨询发布的《2022年中国智能语音转写行业研究报告》显示,2021年中国智能语音转写市场规模约为215亿元,预计2026年将达到469亿元,呈现高速增长态势。而智能语音转写行业之所以能一直保持快速发展势头,则与三大利好不无关系。
在政策上,国家有关智能语音、语音自动转写、语音同步转录等相关政策的不断出台,使得智能语音转写赛道不断升温。自2017年起,国家有关部门就相继出台了多项政策,鼓励和支持智能语音产业的发展。
在技术上,语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等技术的持续突破,为智能语音转写技术的精度和速度的提升奠定了基础。
在需求上,得益于人力成本、协同办公、会展交流、跨国沟通等多重因素的共同驱动,智能语音转写的市场需求持续扩大。
但技术从殿堂步入寻常百姓生活,需要产品的链接,如何满足当下用户越来越丰富多元的使用需求?真正做到有爽点的使用感受,这是出给每个人工智能公司产品和业务团队的一项难题。从产品形态来看,智能转写和翻译的产品主要包括SaaS类产品与本地化部署解决方案两大类,其中SaaS市场更是不乏重量级玩家,只不过新入局者众多,行业痛点并未得到很好的解决。
一是,技术实力不足。精准快速的转写和翻译服务往往需要强大的软硬件技术支撑,然而目前大多数语音智能转写玩家,在技术研发和创新上的能力较为有限,这就导致其产品在应用过程中的准确率,难以达到理想效果,不仅无法满足实际使用需求,可能最后还需要人工来处理或纠错,从而降低使用效率。
二是,应用场景单一。如今,智能语音转写产品和服务的应用场景正在逐渐扩大。市面上大多数转写翻译的产品和服务却依旧很难满足用户多场景、多形态的需求,加之有的软硬件产品还出现了链接不顺畅或者账户切换繁冗复杂等情况,让用户交互体验感欠佳。
三是,缺乏定制化服务。对语义的理解有误,语言识别和翻译的准确性就会大打折扣,定制化服务却能有效缓解这一问题。只不过,在目前的入局者中,能够为用户构建独有产品,提供专属服务的玩家少之又少。而缺乏定制化服务,很难真正做到对智能语音转写行业的深耕。
以上问题确实是行业内真实存在的通病,也是实际应用中很难避免的痛点,因此为了实现“信达雅”这一目标,该领域的大多数玩家还需要在技术研发、场景优化、交互体验等方面长期求索。与其他玩家不同,在解决这些痛点方面,我觉得科大讯飞做的还是有可圈可点之处的。
讯飞听见重塑语音SaaS服务
作为科大讯飞旗下的一款SaaS化服务产品,讯飞听见在创立之初便通过聚合多项SaaS转写翻译服务搭建了面向消费者的软件平台,同时又面向BG端客户群率先发布了智能会议系统及相应解决方案,从而形成了全套的、成体系的系统级智能语音转写服务。
通过GBC三方联动的业务方式,讯飞听见很快就在转写行业的品牌市场打响了知名度。据悉,易观发布的《中国智能语音转写工具行业洞察2021》报告显示,讯飞听见的转写产品品牌知名度位列榜首;艾瑞咨询刚刚发布的2022《智能语音转写行业研究报告》中也显示,讯飞听见在智能语音转写SaaS产品竞争格局中被纳入了第一梯队的阵营,且综合排名第一。而讯飞听见能在行业中拥有如此地位,虽有些出乎意料之外,但也确实在情理之中。
在技术落地方面,讯飞听见继承了讯飞转写的全部优点,做到了既“快”又“准”。科大讯飞是国内少数几家真正在人工智能领域具备核心技术的企业,因此,传统转写引擎1个小时的音频一般需要10分钟左右,而依托科大讯飞深耕多年的自然语言处理、声纹识别、语音识别、翻译等核心技术,讯飞听见超高效率的极速语音转写,最快可以达到1小时音频转写完成仅耗时20秒。在市场应用级别,1小时音频则5分钟之内即可转写完毕。
另外,市面上很多智能语音转写产品和服务因为技术实力不足,其产品力也明显不足,转写准确率大多甚至还达不到90%,稍微好一点的产品,其准确率也只到95%左右,而讯飞听见的AI智能转写准确率能高达97.5%,在行业内可谓是名列前茅。且在智能纠错、语气词过滤、词库建设上有较好的应用,大大提升了转写精准度。
在场景应用方面,讯飞听见解决了通用人群的转写问题,是专业人群的翻译助力。传统翻译产品多应用于专业大会、学术研究等场景,但讯飞听见除了这些传统场景外,还可以应用于常用的日常会议记录、课堂笔记。不过,讯飞听见的丰富程度远不止于此,还包括视频会议自带字幕的云会议,给视频做字幕和翻译的听见字幕,以及可以提升拾音效率的一系列硬件组合产品等。而针对转写应用最广泛的一个场景会议纪要,讯飞听见则是推出了网页端的AI纪要功能,在实时录音转写的同时,可以进行AI辅助纪要,自动关联纪要内容所匹配的录音时段,让记录更清晰,会议场景再现更准确。此外,先于苹果手机推出的悬浮字幕,可识别手机音视频内容中的文字,实时转写翻译成多语种字幕也被应用在各类场景中。
在服务专业性方面,讯飞听见周到细致的定制化服务,与其他产品形成了差异化优势。讯飞听见作为一款高效转写服务产品,不仅技术领先,服务也很专业。平台能为不同用户提供定制化的服务,通过将机器转写翻译和人工译员资源整合,打造语音语言服务平台促进行业共荣,让用户可根据不同需求进行定制化服务咨询。而其丰富的生态服务能力,也能满足很多垂直领域人群的服务需求,帮助用户实现高效无障碍沟通。也正因为专业性的应用,讯飞听见在冬奥会、冬残奥会、成都世乒赛等多项体育赛事上,才可以代表中国刷新中国智造的AI名片。
好产品往往都是从用户角度出发,讯飞听见之所以能从众多玩家中脱颖而出,得到越来越多用户的青睐和选择,与其持续深入了解用户需求,不断进行产品迭代不无关系。
值得一提的是,转写翻译技术不仅是作为一个专业型工具被广泛应用,也可以作为辅助工具帮助到听障人群 。据了解讯飞听见在2019年发起的“听见AI的声音”公益活动,为听障群体免费提供讯飞听见旗下APP、讯飞听见会议、讯飞听见鸿蒙卡片等多项转写服务,帮助听障人群可以通过转写文字加强与社会的交流,目前已经向社会捐赠8140万分钟转写时长。
语音转写SaaS服务迈入全新时代
而讯飞听见的再度迭代升级,不仅对机器同传行业有着积极影响,更对推动整个智能语音转写市场的发展具有重要意义。
具体而言,对用户来说,讯飞听见凭借强大的AI语音转写翻译技术,为用户提供了更有效率的信息传递服务,在一定程度上降低沟通门槛,提升交互体验。讯飞听见同传支持中、英、法、俄、德、日、韩、西班牙、阿拉伯9国语种的实时转写及翻译,能有效满足用户的多样化需求,进而真正实现人与人之间的无障碍交流。而这类传统线下顶级峰会才被使用的AI技术,目前已经通过在线同传服务走进普通用户的生活,一台电脑即可享受实时AI同传的服务。
对市场而言,讯飞听见SaaS类智能语音转写翻译产品的成功出圈,有利于打破行业同质化的窠臼,加速市场洗牌,推动市场良性发展。讯飞听见具有足够的实力和精力进行技术研发与产品打磨,因此其产品化能力十分优秀。而凭借“好产品”破圈的讯飞听见将有望给用户带来全新的选择,同时也为市场带来全新的变化。
从行业来看,讯飞听见所提供的SaaS类智能语音转写翻译产品,为整个行业提供了一个优秀范本,有利于引导整个行业向着更积极的一面去发展。如今,智能语音转写翻译产品的普及推广已经是大势所趋,而在整个智能语音转写市场占据主流厂商地位的讯飞听见,则对整个行业都具有借鉴意义。
随着智能语音转写的技术的不断突破、功能的持续丰富、场景更加泛化,在语音转写行业已经走在前列的讯飞听见,未来将会给市场和用户带来更多更大的惊喜,也将推动整个语音转写SaaS服务迈入一个全新的时代。