压缩 ASCII 数据以适应 UTF-32 API？

发布于 2024-11-28 03:07:00 字数 982 浏览 1 评论 0原文

我有一个接收 Unicode 数据的 API，但我只需要在其中存储 ASCII。我想压缩&混淆（或加密）将以 Unicode 形式保留的字符串值。

我的愿望是压缩此模式数据，或对其进行加密以防止窥探。我认为不可能两者都做得很好。

考虑到我想将源数据限制为有效的、可打印的 ASCII；如何将原始字符串值“压缩”为更小的值、混淆的值或两者兼有的值？

这是我想象的工作方式（尽管你可能有更好的方法）：

这个源代码将采用给定的字符串作为输入
该字符串的字节表示将被采用（UTF8，ASCII，你决定）
一些神奇的事情发生了 - （这是我需要您帮助的部分）
生成的字节将被转换为 int 或 long（无小数点）
数字将使用此实用程序转换为相应的字符 http://baseanythingconvert.codeplex.com/SourceControl/changeset/view/77855#1558651

（请注意，实用程序将用于强制执行约束，即“最终”Unicode 名称不得包含以下字符“/”， '\'、'#'、'?' 或 '%')

背景

Microsoft Azure 表有一个接受 Unicode 数据作为存储或属性名称的 API。这是一个无模式的数据库（因此可以临时创建列），因此模式按行存储。缺点是此架构数据多次存储在磁盘上，并且还在 XML blob 中通过线路传输，相当冗余。

此外，我正在开发一个实用程序，它动态加密/解密Azure表数据，但架构未加密。我想以某种方式掩盖或混淆此标头信息。