实时艺术项目---输入：声音---输出：图像（更好的标题？）

发布于 2024-12-22 07:28:43 字数 280 浏览 2 评论 0原文

我不太确定是否应该在这里问这个问题。我想做一个艺术项目。我想使用语音作为输入，使用图像作为输出。图像随着声音而变化。

我怎样才能意识到这一点？因为我需要实时或低于 50 毫秒的延迟。起初我认为使用微控制器会更好。但我想计算巨大的图像，也许我的微控制器无法做到这一点。例如我想计算 10.000 个移动物体。我可以用 windows/linux/mircocontroller 实现这一点吗？

如果我能使用Python那就太好了。或者您认为加工是更好的选择？

您需要更多详细信息吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

闻呓 2024-12-29 07:28:43

您是否考虑过使用图形数据流环境，例如 Pure Data (Pd) 或最大？ Max是商业产品，但Pd是免费的。

即使您最终没有在最终项目中使用 Pd，它也是一个出色的快速原型设计工具。虽然 Pd 的图形处理能力有限，但有一些扩展，例如 Gridflow 和 Gem，这可能会对您有所帮助。当然，使用 Pd，您可以使用 [fiddle~] 对象分析传入的声音，该对象将为您提供各个分音的整体音调和频率/幅度，以及 [env~]，它将为您提供 RMS 幅度。然后，您可以在 Gem 或 Gridflow 中轻松地将声音（音高、振幅、音色）的变化映射到图像的各种属性，例如颜色、形状、元素数量等。

即使在现代桌面 GPU 上，10k 个移动物体听起来也很多！即时计算所有这些位置将消耗大量资源。我认为即使使用像 openFrameworks 这样的专用 C++ 图形库，这也可能是一场斗争。您可能需要考虑优化策略，例如图像的预渲染方面，以及使用实时音频控制来确定在任何给定时间显示哪些预渲染组件。这可能会给人一种控制 10k 个对象的错觉，而实际上其中大部分都是预先渲染的。

祝你好运！