纯文本压缩算法的现状如何?
为了纪念哈特奖, 文本压缩的顶级算法(以及每种算法的快速描述)是什么?
注意:这个问题的目的是获得压缩算法的描述,而不是压缩程序的描述。
In honor of the Hutter Prize,
what are the top algorithms (and a quick description of each) for text compression?
Note: The intent of this question is to get a description of compression algorithms, not of compression programs.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
突破边界的压缩器结合了疯狂结果的算法。 常见算法包括:
Maximum Compression 是一个非常酷的文本和通用压缩基准网站。 Matt Mahoney 发布了另一个基准。 Mahoney 可能特别令人感兴趣,因为它列出了每个条目使用的主要算法。
The boundary-pushing compressors combine algorithms for insane results. Common algorithms include:
Maximum Compression is a pretty cool text and general compression benchmark site. Matt Mahoney publishes another benchmark. Mahoney's may be of particular interest because it lists the primary algorithm used per entry.
总有 lzip。
开个玩笑吧:
DEFLATE
算法)仍然获胜。LZMA
算法)压缩效果非常好,并且可以在 LGPL 下使用。 然而,很少有操作系统附带内置支持。There's always lzip.
All kidding aside:
DEFLATE
algorithm) still wins.LZMA
algorithm) compresses very well and is available for under the LGPL. Few operating systems ship with built-in support, however.如果您想将 PAQ 用作程序,您可以在基于 debian 的系统上安装
zpaq
软件包。 用法是(另请参阅man zpaq
)压缩到大约zip 文件大小的1/10。 (1.9M 与 15M)
If you want to use PAQ as a program, you can install the
zpaq
package on debian-based systems. Usage is (see alsoman zpaq
)Compression was to about 1/10th of a zip file's size. (1.9M vs 15M)