应用于语音生成场景,服务于企业端客户,根据用户输入的文本和调节参数,生成相应的语音。应用于语音识别场景,服务于企业端客户,根据输入的语音,生成相应的文本。应用于声纹识别场景,服务于企业端客户,根据用户输入的语音,音中的说话人特征,生成说话人ID、相似度分数、对比结果等文本。
实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。
依图短语音听写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。基于依图训练的业界先进的声学和语言模型,依图语音识别为开发者提供准确高效的语音转文字功能。
1 共1页