欢迎光临~瑞泰新时代（北京）科技有限公司

语言选择：

∷

公司动态

生成式AI在边缘计算生成高质量音频

Meta正式开源了一款名为AudioCraft的AI音频和音乐生成工具。该工具声称可以直接从文本描述和参考音乐生成高质量的音频和音乐。AudioCraft包含MusicGen、AudioGen和EnCodec三个模型，分别实现音乐生成、音频生成和自定义音频模型构建。

现在在边缘端设备上，我们也可以通过基于Jetson Orin平台的大模型一体机-飞云智盒RTSS-X304在现实世界中探索生成式 AI 音频大模型的无限可能性。不同于其他嵌入式平台，飞云智盒RTSS-X304能够在本地运行，实时的处理音频。

飞云智盒X304是一款功能强大的智能硬件产品。它采用了最先进的芯片技术和架构，具备强大的计算和数据处理能力。这使得audio craft能够在X304上充分发挥其性能，为用户带来卓越的AI体验。同时还提供了丰富的接口，比如Audio的输入输出，HDMI的高清显示，支持4G/5G的无线网络扩展，CAN总线及隔离的GPIO可接入各种外设，成为多模态的机器人或智能车的算力控制器的优秀解决方案。

让我们运行 Meta 的 AudioCraft，在RTSS-X304上制作高质量的音频和音乐！

，时

模型：Audio Craft音频生成模型
MusicGen\AudioGen\Endoc
发布者：Meta公司
发布时间：2023年7月
参数量：30亿
特点：
- 能够在实时处理音频的同时，保持较低的延迟；
- 能够生成一般的音频内容；

- 音乐生成：能够产生高质量的音频，并具有长期的一致性；

- 用户能够自定义音频模型的构建；

AudioCraft Demo展现的文本生成为专业人士提供一些灵感，可通过精准描述音乐的乐器、节奏、风格这些专业术语方面，生成匹配的音效。另外对于需要音乐背景的自媒体创作者，AudioCraft可以确保避免侵权问题，这也是其不可忽视的优势。

在语音识别方面，audio craft还能够准确识别用户的语音指令，并将其转化为文字。无论是在嘈杂的环境中还是在不同的口音和语速下，audio craft都能够快速准确地识别语音，大大提高了语音交互的准确性和用户体验。

飞云智盒X202与audio craft的结合展现了出色的性能和稳定性。提高了产品的智能化水平，也使得AI技术更加接近实际应用。这意味着更多的人将能够享受到AI带来的便利和高效。

上一个：瑞泰新时代 | 生成式AI及大模型在边缘端解决方案先行者下一个：Metroplis微服务示例分享

相关新闻

栏目导航

新闻中心

联系我们

联系人：Realtimes

服务热线： 400-100-8358

邮箱：info@realtimes.cn

地址：北京市朝阳区和平西街和平西苑20号B座11层

QQ在线客服

点击联系我

用手机扫描二维码关闭

二维码