ASR语音基础能力
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音 交互场景,如语音搜索、语音指令、语音短消息等,可集成在各 类App、智能客服、智能助手等产品中。
对不限时长的音频流做实时识别,达到“边说边出文字”的效果, 内置智能断句,可提供每句话开始结束时间。可用于智能语音助手、 视频实时直播字幕、实时会议记录、实时法庭庭审记录等场景。
对上传/存储的录音文件进行识别,完成识别并返回识别文本。 可用于呼叫中心语音质检、数据库录入、会议转写等场景。
基于深度学习技术,在离线设备上将音频数据转换成文本数据, 为信息处理和数据挖掘提供基础,助力企业降本提效。依靠京东 强大的语音识别技术,离线识别准确率高、效果好、应用便捷。
ASR语音识别扩展能力
依托京东自研的声纹识别技术,实现声纹注册和声纹1:1对比验 证服务,对说话人的声波特征进行提取和验证辨识,作为生物识 别的一种,被广泛应用于金融安全、智能家居、智慧建筑等领域
京东语音唤醒技术通过在设备或软件中预置唤醒词,当用户发出该 语音指令时,设备便从休眠状态中被唤醒,并作出指定响应,大大 提升了人机交互的效率
通过深度学习语音的韵律特征(基频、语速、能量)等,准确识 别用户语音中的情绪变化,为电话服务、车载驾驶、安检等场景 提供更多能力支撑
通过对不同场所、环境下正常说话声与噪音声音信号波形差异的 深度学习,准确区分音频片段的噪音概率,为各类语音识别任务 下的抗噪鲁棒性提升提供能力基础