| ISBN/价格: | 978-7-5130-9968-4:CNY78.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 基于视听融合的说话人定位与跟踪技术/.李一迪著 |
| 出版发行项: | 北京:,知识产权出版社有限责任公司:,2025.06 |
| 载体形态项: | 203页:;+彩图:;+24cm |
| 提要文摘: | 本书以多模态人机交互中的说话人定位与跟踪为核心,以视听融合理论与机器学习方法为基础,针对多模态异质性数据融合、多模态置信水平度量、跨模态监督、多层次信息交互、多模态多目标数据关联等问题进行了研究,旨在通过融合视觉与听觉信息的互补性,克服单模态感知的局限性,提升复杂环境下的定位精度与鲁棒性。 |
| 并列题名: | Speaker localization and tracking technology based on audio-visual fusion eng |
| 题名主题: | 定位跟踪 研究 |
| 中图分类: | TN953 |
| 个人名称等同: | 李一迪 著 |
| 记录来源: | CN LCTBU 20260227 |