当前位置:首页>科技资讯>腾讯力作EzAudio AI:文本即刻转为生动语音,革新音频合成体验

腾讯力作EzAudio AI:文本即刻转为生动语音,革新音频合成体验

人气:12 2024-11-16 00:39:29

近日,约翰霍普金斯大学携手腾讯AI实验室,共同发布了EzAudio文本转音频生成模型。这一创举以其卓越的效率及顶级的文字转语音能力,预示着AI与音频科技领域的一次重大突破,开启了高保真声音合成的新纪元。

腾讯力作EzAudio AI:文本即刻转为生动语音,革新音频合成体验

EzAudio 的工作原理是利用音频波形的潜在空间,而不是传统的声谱图,这一创新让它能够在高时间分辨率下工作,且无需额外的神经声码器。

EzAudio 的架构被称为 EzAudio-DiT(扩散变换器),采用了多项技术创新来提高性能和效率。其中包括一种新的自适应层归一化技术 AdaLN-SOLA、长跳连接,以及先进的位置编码技术如 RoPE(旋转位置嵌入)。

研究人员表示,EzAudio 生成的音频样本非常逼真,客观和主观评估均优于现有的开源模型。

目前,AI 音频生成市场正快速增长。像 ElevenLabs 这样的知名公司最近推出了一款 iOS 应用,用于文本转语音的转换,显示出消费者对 AI 音频工具的浓厚兴趣。同时,微软和谷歌等科技巨头也在不断加大对 AI 语音模拟技术的投资。

根据 Gartner 的预测,到2027年,40% 的生成式 AI 解决方案将会是多模态的,结合文本、图像和音频的能力,这意味着 EzAudio 这样的高质量音频生成模型可能会在不断演变的 AI 领域中发挥重要作用。

EzAudio 团队已经公开了他们的代码、数据集和模型检查点,强调了透明性,并鼓励该领域的进一步研究。

研究人员认为 EzAudio 的应用可能超越声音效果生成,涉及语音和音乐制作等领域。随着技术的不断进步,它有望在娱乐、媒体、辅助服务和虚拟助手等行业中得到广泛应用。

腾讯首推VITA:开源多模态大语言模型,实现用户无缝沟通新纪元

近日消息,腾讯优图实验室及其他合作伙伴近期宣布推出VITA,这是一个开创性的开源多模态大语言模型。VITA的独特之处在于其能跨视频、图像、文本及音频多种媒介进行处理,展现了强大的多模态理解与生成能力。此外,该模型还因卓越的用户交互体验而受到瞩目,为AI领域带来了全新的协作与创新可能。

腾讯首推VITA:开源多模态大语言模型,实现用户无缝沟通新纪元

VITA模型的诞生,是为了填补大型语言模型在处理中文方言方面的不足。它基于强大的Mixtral8×7B模型,扩展了中文词汇量,进行了双语指令微调,让VITA不仅精通英语,还能流利地使用中文。

主要特点:

多模态理解:VITA能够处理视频、图像、文本和音频,这在开源模型中是前所未有的。

自然交互:无需每次都说“嘿,VITA”,它就能在你说话时随时响应,甚至在你和别人交谈时,它也能保持礼貌,不随意插嘴。

开源先锋:VITA是开源社区在多模态理解和交互方面迈出的重要一步,为后续研究奠定了基础。

VITA的魔法来自于它的双重模型部署。一个模型负责生成对用户查询的响应,另一个模型持续跟踪环境输入,确保每一次交互都能精准、及时。

VITA不仅能聊天,还能在你健身时充当聊天伙伴,甚至在你旅游时提供建议。它还能根据你提供的图片或视频内容回答问题,展现出强大的实用性。

虽然VITA已经展现出了巨大的潜力,但在情感语音合成和多模态支持等方面,它还在不断进化。研究者们计划让下一代VITA能够从视频和文本输入生成高质量的音频,甚至探索同时生成高质量音频和视频的可能性。

VITA模型的开源,不仅是技术的胜利,更是对智能交互方式的一次深刻革新。随着研究的深入,我们有理由相信,VITA将为我们带来更加智能、更加人性化的交互体验。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

腾讯智影小程序在7月9日迎来了一项创新升级,正式推出了智影AI视频特性。这一新功能让用户得以轻松创作个性化视频内容,仅需简单操作即可赋予视频独特的日漫风格,为视频作品增添一抹二次元的魅力。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

目前,该风格化处理服务正处于限时免费推广期,尽管未来可能采取收费策略,但具体的费用标准尚未公开透露。

视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。

只需导入视频并一键“变身”,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。

据此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。

腾讯确认:正与苹果深入协商,聚焦iOS微信小游戏收益问题

8月15日消息,腾讯在2024年第二季度财务报告中展现出强劲势头,得益于本土市场游戏业务及小游戏平台服务费等高利润领域的增长,其毛利润显著上升21%,达到人民币859亿元,彰显了公司在当前经济环境下的稳健运营能力和市场领导地位。

腾讯确认:正与苹果深入协商,聚焦iOS微信小游戏收益问题

需要注意的是,苹果却不乐意了。

腾讯首席战略官詹姆斯米切尔在财报电话会议上首次承认,公司正在探索通过苹果的iOS支付系统提供应用内交易的方法,这将使苹果开始从游戏内交易中分成。

米切尔表示,腾讯目前还没有通过iOS应用内购买来对小游戏赚钱,并且正在讨论是否可能启用该功能,这将使开发者、用户、苹果和腾讯受益。

Mitchell说:我们希望以经济上可持续且公平的方式提供这种服务。所以这是正在进行的讨论,我们希望讨论能产生积极的结果”。

他强调:但如果讨论没有进展,那么现状就会维持下去。”

据悉前不久有报道称,苹果公司正在向腾讯和抖音施压,要求他们解决应用内小游戏的外链支付漏洞,以避免小游戏厂商绕开30%的苹果税”。

如果该情况得不到解决,苹果或将拒绝提供微信、抖音等应用的更新。

本文标签
精选游戏
相关文章

@ Copyright@ 2023同欣资源网保留所有权利

备案号:渝ICP备20008086号-37