AI产业链地图·知识库 多模态交互 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/多模态交互

更新 2026·06·17

概念技术 / 术语

多模态交互

Multimodal Interaction · 多模态对话

多模态交互要求 AI 客服在不同渠道间无缝切换：用户可在网页打字、电话说话、视频通话指设备故障，系统统一理解和响应。

多模态交互 CONCEPT · 概念

首次提出: 2000
关键参与方: [[科大讯飞]] · [[容联云]] · [[天润融通]]
反向引用: 8 处 · 来自 6 页

归属 AI客服多模态AR/VR第五层

多模态交互

Multimodal Interaction — 同时支持文本 + 语音 + 图像 + 视频 + AR 等多种交互形式的客户服务能力。2023 后已成为 AI 客服标配。

定义

多模态交互要求 AI 客服在不同渠道间无缝切换：用户可在网页打字、电话说话、视频通话指设备故障，系统统一理解和响应。

主要模态

模态	渠道	典型应用
文本	网页 / App / 微信	在线客服、富文本+表情
语音	电话 / 呼叫中心	ASR + TTS + 情感分析
视频	远程指导	设备安装、故障排查
AR	App 增强现实	虚拟标注、远程协助
虚拟数字人	多端	3D 建模 + 语音合成 + 动作捕捉

技术挑战

跨模态对齐：同一用户在不同渠道的会话连续性
统一上下文：网页对话 → 电话续聊上下文不丢失
模态融合：文本 + 语音情感的联合判断

主要玩家

语音强：科大讯飞 / 容联云
视频强：远程指导厂商
数字人：虚拟数字人厂商

在 AI 产业链中的角色

∈ belongs_to::5-11-AI客服-对话机器人 ↑ up::ASR / TTS / 多模态模型

相关概念

智能客服 / ASR / TTS / 虚拟数字人 / 全渠道客服

反向引用链接到本页

反向引用 8

按引用量 ↓

… - **智能问答** — 基于知识图谱和大模型的语义理解与问题解答 - **[[多轮对话]]** — 上下文理解与对话状态管理（已达 50+ 轮） - **[[情感识别]]** — 识别愤怒/焦虑/满意等多种情绪 - **多模态交互** — 文本 / 语音 / 图像 / 视频 - **业务执行**（[[AI Agent]]）— 从被动响应到主动执行业务流程 - **数据分析** — 客户画像、服务质量分析、业务洞察 …

… - [[AI Agent]] / [[对话机器人]] / [[RAG]] / [[NLU]] / [[ASR]] / [[TTS]] - [[多轮对话]] / [[情感识别]] / 多模态交互 / [[虚拟数字人]] - [[全渠道客服]] / [[CDP]] / [[客服 SaaS]] …

查看原文 →

… ## 在 AI 产业链中的角色 ∈ belongs_to::[[5-11-AI客服-对话机器人]] ∈ belongs_to::[[5-03-AIGC-数字媒体]] ↑ up::多模态交互 / [[TTS]] / 3D 渲染引擎 ## 相关概念 - [[多模态交互]] / [[TTS]] / [[AIGC]] / [[智能客服]] …

… ∈ belongs_to::[[5-03-AIGC-数字媒体]] ↑ up::[[多模态交互]] / [[TTS]] / 3D 渲染引擎 ## 相关概念 - 多模态交互 / [[TTS]] / [[AIGC]] / [[智能客服]] …

查看原文 →

… ↑ up::[[科大讯飞]] / Whisper ↓ down::[[NLU]] → 业务执行 ## 相关概念 - [[TTS]] / [[NLU]] / [[Whisper]] / 多模态交互 …

查看原文 →

… ↑ up::[[科大讯飞]] / [[ElevenLabs]] ↓ down::语音客服外呼 / 虚拟数字人 ## 相关概念 - [[ASR]] / [[语音克隆]] / [[虚拟数字人]] / 多模态交互 …

查看原文 →

… ## 相关概念 - [[智能客服]] / [[AI Agent]] / [[多轮对话]] / [[NLU]] - [[RAG]] / [[情感识别]] / 多模态交互 …

查看原文 →

… ## 在 AI 产业链中的角色 ∈ belongs_to::[[5-11-AI客服-对话机器人]] ↑ up::[[4-02-模型工厂]] ## 相关概念 - [[智能客服]] / 多模态交互 / [[多轮对话]] …

查看原文 →