盖世汽车讯 据外媒报道,宾夕法尼亚大学的工程师开发出人工智能(AI)音频编辑器SmartDJ,用户只需使用日常语言的简单指令即可修改沉浸式音频环境,其潜在应用领域包括虚拟现实、增强现实、游戏和声音设计。SmartDJ无需用户指定具体的编辑内容,即可响应诸如“让这里听起来像繁忙的办公室”之类的高级指令,然后规划并执行实现该效果所需的步骤。
该系统解决了早期AI音频编辑工具的两大局限性:首先,大多数先前的系统更适用于僵化的、模板式的命令,需要用户识别要添加或删除的声音;其次,这些工具通常处理的是单声道或“单轨”音频,失去了沉浸式音频体验所必需的空间线索。
相比之下,SmartDJ能够理解高级指令,并且专为立体声音频设计,因此能够进行编辑,从而更好地保留或重塑场景的空间结构。
计算机与信息科学系助理教授Mingmin Zhao表示:“使用SmartDJ,用户可以用自然语言描述他们想要的结果,系统会自动找出实现的方法。这证明AI可以帮助人们使用简单的语言以直观的方式编辑音频。”
语言模型与扩散模型的结合
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
东方树叶卖疯后,农夫山泉想再造果汁饮料大爆款
4月18日,农夫山泉在其公众号推出新品“大柠檬”系列,闯入热闹的...
紫米ZMI原核心团队打造:CUKTECH20号电
原小米旗下3C配件品牌ZMI核心团队打造,CUKTECH20号超...
联想推出GeekProG5000锐龙版笔记本:R
,联想今日推出GeekProG5000锐龙版笔记本,搭载R778...
不用光刻机也能生产高端芯片,华裔科学家晶体管研究
,传统半导体芯片性能主要取决于多层晶体管的密集堆叠,如今随着新兴...
拼多多2023年Q1营收376.4亿元同比增长5
感谢IT之家网友DynamIK的线索投递!,拼多多今日发布了截至...
农发行定兴县支行支持县域经济建设
定兴农发行聚焦全县ldquo;三农rdquo;重点领域和薄弱环节...