返回介绍

seems_utf8()

发布于 2017-09-11 10:20:40 字数 2125 浏览 1062 评论 0 收藏 0

seems_utf8( string $str )

Checks to see if a string is utf8 encoded.


description

NOTE: This function checks for 5-Byte sequences, UTF8 has Bytes Sequences with a maximum length of 4.


参数

$str

(string) (Required) The string to be checked


返回值

(bool) True if $str fits a UTF-8 model, false otherwise.


源代码

File: wp-includes/formatting.php

function seems_utf8( $str ) {
	mbstring_binary_safe_encoding();
	$length = strlen($str);
	reset_mbstring_encoding();
	for ($i=0; $i < $length; $i++) {
		$c = ord($str[$i]);
		if ($c < 0x80) $n = 0; // 0bbbbbbb
		elseif (($c & 0xE0) == 0xC0) $n=1; // 110bbbbb
		elseif (($c & 0xF0) == 0xE0) $n=2; // 1110bbbb
		elseif (($c & 0xF8) == 0xF0) $n=3; // 11110bbb
		elseif (($c & 0xFC) == 0xF8) $n=4; // 111110bb
		elseif (($c & 0xFE) == 0xFC) $n=5; // 1111110b
		else return false; // Does not match any model
		for ($j=0; $j<$n; $j++) { // n bytes matching 10bbbbbb follow ?
			if ((++$i == $length) || ((ord($str[$i]) & 0xC0) != 0x80))
				return false;
		}
	}
	return true;
}

更新日志

Versiondescription
1.2.1Introduced.

相关函数

Uses

  • wp-includes/functions.php: mbstring_binary_safe_encoding()
  • wp-includes/functions.php: reset_mbstring_encoding()

Used By

  • wp-admin/includes/export.php: wxr_cdata()
  • wp-admin/includes/image.php: wp_read_image_metadata()
  • wp-includes/formatting.php: sanitize_title_with_dashes()
  • wp-includes/formatting.php: remove_accents()

User Contributed Notes

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文