AI产业链地图·知识库 ASR · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/ASR

更新 2026·06·17

概念技术 / 术语

ASR

Automatic Speech Recognition · 自动语音识别 · 语音识别

ASR 将声波信号经过特征提取（MFCC / Mel-Spectrogram）、声学建模、语言模型后输出文字。当前主流是端到端深度学习（Conformer / Whisper）。

ASR CONCEPT · 概念

首次提出: 1952
关键参与方: [[科大讯飞]] · [[容联云]] · [[天润融通]]
反向引用: 7 处 · 来自 5 页

归属语音AIAI客服NLP第五层

ASR

Automatic Speech Recognition，自动语音识别 — 将人类语音转为文字的技术。AI 客服语音渠道的入口，与 TTS / NLU 组成完整语音对话能力。

定义

ASR 将声波信号经过特征提取（MFCC / Mel-Spectrogram）、声学建模、语言模型后输出文字。当前主流是端到端深度学习（Conformer / Whisper）。

技术演进

GMM-HMM 时代（1990s-2010s）：混合高斯模型 + 隐马尔可夫
DNN-HMM 混合（2010s）：深度神经网络替换 GMM
端到端时代（2020+）：CTC / Attention / Conformer
大模型时代（2022+）：Whisper / 阿里 Paraformer

在 AI 客服中的应用

电话客服：将客户来电转文字
方言支持：粤语 / 川话 / 闽南语
多语言：20+ 种语言（智齿科技等）
实时性：流式 ASR，毫秒级延迟

主要玩家

语音 AI 龙头：科大讯飞（中文方言 + 多语言）
国际：Whisper（OpenAI）/ Google Speech / Amazon Transcribe
客服集成：容联云 / 天润融通

在 AI 产业链中的角色

∈ belongs_to::5-11-AI客服-对话机器人 ↑ up::科大讯飞 / Whisper ↓ down::NLU → 业务执行

相关概念

TTS / NLU / Whisper / 多模态交互

反向引用链接到本页

反向引用 7

按引用量 ↓

… # TTS > **Text-to-Speech，语音合成** — 将文字转为人类语音的技术。AI 客服**语音渠道**的出口，与 ASR 配合实现完整电话客服闭环。 ## 定义 TTS 将文字经过文本分析（分词 / 词性 / 韵律）+ 声学模型 + 声码器后输出 PCM 音频。当前主流是端到端神经语音合成（Tacotron / FastSpeech / VALL-E）。 …

… ∈ belongs_to::[[5-11-AI客服-对话机器人]] ↑ up::[[科大讯飞]] / [[ElevenLabs]] ↓ down::语音客服外呼 / 虚拟数字人 ## 相关概念 - ASR / [[语音克隆]] / [[虚拟数字人]] / [[多模态交互]] …

查看原文 →

… - **数字人**：[[虚拟数字人]] 厂商 ## 在 AI 产业链中的角色 ∈ belongs_to::[[5-11-AI客服-对话机器人]] ↑ up::ASR / [[TTS]] / [[多模态模型]] ## 相关概念 - [[智能客服]] / [[ASR]] / [[TTS]] / [[虚拟数字人]] / [[全渠道客服]] …

… ∈ belongs_to::[[5-11-AI客服-对话机器人]] ↑ up::[[ASR]] / [[TTS]] / [[多模态模型]] ## 相关概念 - [[智能客服]] / ASR / [[TTS]] / [[虚拟数字人]] / [[全渠道客服]] …

查看原文 →

… 3. **[[RAG]] 检索增强生成** — 结合企业知识库提升准确性 4. **[[AI Agent]] 框架** — 调用工具、API 执行业务，从 Copilot 到 Agent 范式转变 5. **多模态**：ASR（语音识别）+ [[TTS]]（语音合成）+ [[NLU]]（意图识别） + 视频 + AR 6. **[[多轮对话]]**：上下文从 5-10 轮提升至 50+ 轮 …

查看原文 →

… - **混合部署**（10%）：核心数据本地 + 其他云端 ## 相关概念 - [[AI Agent]] / [[对话机器人]] / [[RAG]] / [[NLU]] / ASR / [[TTS]] - [[多轮对话]] / [[情感识别]] / [[多模态交互]] / [[虚拟数字人]] - [[全渠道客服]] / [[CDP]] / [[客服 SaaS]] …

查看原文 →

… - **政务热线**：12345 政务服务热线、各地政务服务中心智能客服核心供应商 - **优势**：语音识别准确率行业领先 + 中文方言支持 + 国产化合规 - **技术叠加**：ASR + [[TTS]] + [[星火大模型]] + 行业知识库 - **竞争位置**：与 [[容联云]] 同为政务客服领域代表厂商来源：[[5-11-AI客服-对话机器人.md|5-11 子行业深度]] …

查看原文 →