清洗受污染的数据
当我清洗受污染的数据并检查它是否有任何坏字符时,是否有 unicode 属性可以过滤坏字符?
When I do laundering tainted data with checking whether it has any bad characters are there unicode-properties which will filter the bad characters?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
perlunicode 中的用户定义字符属性
User-Defined Character Properties in perlunicode
我认为“不”对于答案来说是轻描淡写的,但你已经明白了。不,Unicode 没有“坏”或“好”字符的概念(更不用说“丑陋”字符了)。
I think "no" is an understatement for an answer, but there you have it. No, Unicode does not have a concept of "bad" or "good" characters (let alone "ugly" ones).
XML(以及 XHTML)只能包含这些字符:
在上述内容中,应避免以下字符:
如果要生成 XHTML,则需要转义以下字符:
&
⇒& amp;
<
⇒<
&
>
(可选)"
(可选,除了用"
分隔的属性值)'
⇒'
(可选除了用'
分隔的属性值之外)HTML 应该有相同的(如果不是更宽松的要求),所以如果你坚持这一点,你应该是安全的。
XML (and thus XHTML) can only contains these chars:
Of the above, the following should be avoided:
If you are generating XHTML, you need to escape the following:
&
⇒&
<
⇒<
>
⇒>
(optional)"
⇒"
(optional except in attribute values delimited with"
)'
⇒'
(optional except in attribute values delimited with'
)HTML should have the same if not looser requirements, so if you stick to this, you should be safe.