当前位置：文江博客话题详情

math nlp transformer-model approximation kernel-density

使用随机傅立叶功能＆amp;表演者

发布于 2025-01-25 12:27:31 字数 1245 浏览 2 评论 0 原文

我读了标题为'与表演者重新思考注意力'的作品。这是处理具有强大理论保证的变压器中使用的自我注意力的二次时间复杂性的开创性贡献。但是，我坚持以下方程式（纸上的方程5），以近似非线性换档内核。

我无法证明上述方程，尤其是方程式中使用的确定性函数h（x）。但是，文献（论文和其他文献）具有以下形式的随机傅立叶特征函数。此\ phi函数不包含确定性函数h（x）。

上述方程中找到一些引用

在 “>大型内核机器的随机功能
线性可扩展的长篇小写变压器

似乎方程5是公式5上述方程式。但是，我无法从这个方程式驱动方程5。请帮助我获得“与表演者的重新思考”的方程式5。

有一个名为'大规模内核计算机的随机特征''为了更好地理解内核函数的低维近似。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

西瓜

暂无简介

文章

评论

27 人气

关注发私信

相关话题

更多

推荐作者

关注

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

更多

友情链接

文江博客

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文