当前位置：首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧

相关新闻

品牌路上重要的一环：突破企业品牌属性！
2026-07-23 16:43
如何做好网站的主体定位，确定好网站建设名称。网站主题其实就是网站的题材，核心是什么？这是网站建设人员首要考虑的问题。选择网站的题材有很多，选择一个自己擅长的是竞争力不大的，然后再确定好网站建
“AI优先”的谷歌如何定位自己的新战略?
2026-07-16 18:22
进入“AI优先”时代的谷歌，如何整合内部资源完成这一战略目标?现阶段又如何发展何应用AI?5月3日，在谷歌于北京举办的小型交流会上，谷歌科学家、GoogleBrain联合创始人GregC
在网站设计过程里怎样去吸引用户的眼球？
2026-07-09 14:33
在进行北京网站制作时，切记直观一点，不要让访客迷路。有创意的网站制作确实能赢得用户的芳心，但是不能画蛇添足，比如有些网站设计相当优秀，但是却没有联系方式，当用户想要联系网站时，却找不到网站制
企业APP开发定制类型有哪些
2026-07-06 06:50
移动端APP开发热潮已经势不可挡，我们北京公海555000也开始接到越来越多的企业咨询APP开发定制开发的流程或者与我们沟通需求，更有一些企业对APP开发还不是很了解。那么我们今天就目前常见的企业
“国风”的高光时刻正在逐渐形成
2026-07-05 13:04
近年来，我们的传统文化不断乘着短视频、社交网站制作平台、热门话题的翅膀，飞出爆款和惊喜。中国风，即中国风格，指以中国传统文化内涵为基础，蕴含大量中国元素，包括音乐、服饰、电影、建筑等，以弘扬

谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧

返回列表

发布时间：2026-06-28 21:18

北京时间4月16日早间消息，谷歌研究人员开发了一种深度学习系统，可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示，该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样，可以主动关注一个声源，同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型，使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频，演示这项技术的实际效果。
谷歌表示，这项技术可以适用于单音轨视频，而且可以通过算法分离出视频中不同人的音频内容，也可以让用户手动选取视频中的人脸，专门收听此人的声音。
谷歌表示，视觉元素是关键，因为这项技术会关注一个人的嘴唇运动，从而更好地判断某个时点应该关注哪段声音，并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型，总共提取了大约2000小时的内容，然后将这些音轨混合后，添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图，把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸，并为每个人制作一段独立的音轨。
谷歌认为，隐藏式字幕系统会成为该系统的一大应用领域，他们还在设想更广泛的应用方向，而且还在探索更多的机会，希望将其整合到各种谷歌产品中。例如，如果把它加入到Google Home智能音箱中，便可区分出不同用户发出的指令。
不过，这个模型需要配合视频才能更好地发挥作用，所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手，但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好，但经过一些细微调整，的确有可能成为强大的监听和监视工具。

0752-0700118 现在就想找顾问聊聊立即咨询

品牌路上重要的一环：突破企业品牌属性！

“AI优先”的谷歌 如何定位自己的新战略?

在网站设计过程里怎样去吸引用户的眼球？

企业APP开发定制类型有哪些

“国风”的高光时刻正在逐渐形成

谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧

“AI优先”的谷歌如何定位自己的新战略?