PHP-UTF-8下的PHP全角标点转为半角的疑问

发布于 2017-01-04 14:45:20 字数 270 浏览 1404 评论 5

PHP全角标点转为半角

<?php   
$str = "０１２３ＡＢＣＤＦＷＳ＼＂，．？＜＞｛｝［］＊＆＾％＃＠！～（）＋－｜：；";   
echo "$str";   
echo "<br />";   
$str = preg_replace('/xa3([xa1-xfe])/e', 'chr(ord(1)-0x80)', $str);   
echo $str;

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

甜柠檬 2017-06-22 11:16:34

如果文件是utf8的，那么可以通过
$str = iconv('utf-8', 'gbk', $str); 转换编码后，再
preg_replace('/xa3([xa1-xfe])/e', 'chr(ord(1)-0x80)', $str);

下边是不同编码对应的正则匹配编码的范围：

UTF8: [x01-x7f]|[xc0-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}
UTF16: [x00-xd7][xe0-xff]|[xd8-xdf][x00-xff]{2}

Big5: [x01-x7f]|[x81-xfe]([x40-x7e]|[xa1-xfe])

JIS [x20-x7e]|[x21-x5f]|[x21-x7e]{2}
SJIS [x20-x7e]|[xa1-xdf]|([x81-x9f]|[xe0-xef])([x40-x7e]|[x80-xfc])
SJIS全角空格 (?:x81x81)
SJIS全角数字 (?:x82[x4f-x58])
SJIS全角大写英文 (?:x82[x60-x79])
SJIS全角小写英文 (?:x82[x81-x9a])
SJIS全角平假名 (?:x82[x9f-xf1])
SJIS全角平假名扩展 (?:x82[x9f-xf1]|x81[x4ax4bx54x55])
SJIS全角片假名 (?:x83[x40-x96])
SJIS全角片假名扩展 (?:x83[x40-x96]|x81[x45x5bx52x53])

EUC_JP [x20-x7e]|x81[xa1-xdf]|[xa1-xfe][xa1-xfe]|x8f[xa1-xfe]{2}
EUC_JP标点符号及特殊字符 [xa1-xa2][xa0-xfe]
EUC_JP全角数字 xa3[xb0-xb9]
EUC_JP全角大写英文 xa3[xc1-xda]
EUC_JP全角小写英文 xa3[xe1-xfa]
EUC_JP全角平假名 xa4[xa1-xf3]
EUC_JP全角片假名 xa3[xb0-xb9]|xa3[xc1-xda]|xa5[xa1-xf6][xa3][xb0-xfa]|[xa1][xbc-xbe]|[xa1][xdd]
EUC_JP全角汉字 [xb0-xcf][xa0-xd3]|[xd0-xf4][xa0-xfe]|[xB0-xF3][xA1-xFE]|[xF4][xA1-xA6]|[xA4][xA1-xF3]|[xA5][xA1-xF6]|[xA1][xBC-xBE]
EUC_JP全角空格 (?:xa1xa1)

EUC半角片假名 (?:x8e[xa6-xdf])
日文半角空格 x20

回复收藏 0

清晨说ぺ晚安 2017-06-08 00:26:35

$queue = Array('０' => '0', '１' => '1', '２' => '2', '３' => '3', '４' => '4', '５' => '5', '６' => '6', '７' => '7', '８' => '8', '９' => '9',
'Ａ' => 'A', 'Ｂ' => 'B', 'Ｃ' => 'C', 'Ｄ' => 'D', 'Ｅ' => 'E', 'Ｆ' => 'F', 'Ｇ' => 'G', 'Ｈ' => 'H', 'Ｉ' => 'I', 'Ｊ' => 'J',
'Ｋ' => 'K', 'Ｌ' => 'L', 'Ｍ' => 'M', 'Ｎ' => 'N', 'Ｏ' => 'O', 'Ｐ' => 'P', 'Ｑ' => 'Q', 'Ｒ' => 'R', 'Ｓ' => 'S', 'Ｔ' => 'T',
'Ｕ' => 'U', 'Ｖ' => 'V', 'Ｗ' => 'W', 'Ｘ' => 'X', 'Ｙ' => 'Y', 'Ｚ' => 'Z', 'ａ' => 'a', 'ｂ' => 'b', 'ｃ' => 'c', 'ｄ' => 'd',
'ｅ' => 'e', 'ｆ' => 'f', 'ｇ' => 'g', 'ｈ' => 'h', 'ｉ' => 'i', 'ｊ' => 'j', 'ｋ' => 'k', 'ｌ' => 'l', 'ｍ' => 'm', 'ｎ' => 'n',
'ｏ' => 'o', 'ｐ' => 'p', 'ｑ' => 'q', 'ｒ' => 'r', 'ｓ' => 's', 'ｔ' => 't', 'ｕ' => 'u', 'ｖ' => 'v', 'ｗ' => 'w', 'ｘ' => 'x',
'ｙ' => 'y', 'ｚ' => 'z');
echo preg_replace_callback("/([xEF][xBC][x90-x99]|[xEF][xBD][x81-x9AxA1-xBA])/", 'next_fchar', '０');
function next_fchar($matches){
global $queue;
return $queue[$matches[1]];
}

回复收藏 0

瑾兮 2017-03-16 09:51:05

其实直接把这些特殊字符放到一个全局数组里也可以的：

function convertChar($str)
{
$arr = array('０' => '0', '１' => '1', '２' => '2', '３' => '3', '４' => '4','５' => '5', '６' => '6', '７' => '7', '８' => '8', '９' => '9', 'Ａ' => 'A', 'Ｂ' => 'B', 'Ｃ' => 'C', 'Ｄ' => 'D', 'Ｅ' => 'E','Ｆ' => 'F', 'Ｇ' => 'G', 'Ｈ' => 'H', 'Ｉ' => 'I', 'Ｊ' => 'J', 'Ｋ' => 'K', 'Ｌ' => 'L', 'Ｍ' => 'M', 'Ｎ' => 'N', 'Ｏ' => 'O','Ｐ' => 'P', 'Ｑ' => 'Q', 'Ｒ' => 'R', 'Ｓ' => 'S', 'Ｔ' => 'T',Ｕ' => 'U', 'Ｖ' => 'V', 'Ｗ' => 'W', 'Ｘ' => 'X', 'Ｙ' => 'Y','Ｚ' => 'Z', 'ａ' => 'a', 'ｂ' => 'b', 'ｃ' => 'c', 'ｄ' => 'd','ｅ' => 'e', 'ｆ' => 'f', 'ｇ' => 'g', 'ｈ' => 'h', 'ｉ' => 'i','ｊ' => 'j', 'ｋ' => 'k', 'ｌ' => 'l', 'ｍ' => 'm', 'ｎ' => 'n','ｏ' => 'o', 'ｐ' => 'p', 'ｑ' => 'q', 'ｒ' => 'r', 'ｓ' => 's', 'ｔ' => 't', 'ｕ' => 'u', 'ｖ' => 'v', 'ｗ' => 'w', 'ｘ' => 'x', 'ｙ' => 'y', 'ｚ' => 'z','（' => '(', '）' => ')', '〔' => '[', '〕' => ']', '【' => '[','】' => ']', '〖' => '[', '〗' => ']', '“' => '[', '”' => ']','‘' => '[', ''' => ']', '｛' => '{', '｝' => '}', '《' => '<','》' => '>','％' => '%', '＋' => '+', '—' => '-', '－' => '-', '～' => '-','：' => ':', '。' => '.', '、' => ',', '，' => '.', '、' => '.', '；' => ',', '？' => '?', '！' => '!', '…' => '-', '‖' => '|', '”' => '"', ''' => '`', '‘' => '`', '｜' => '|', '〃' => '"','　' => ' ');
return strtr($str, $arr);
}

回复收藏 0

泛泛之交 2017-01-08 03:51:38

我觉得没必要那么麻烦，直接写个方法替换就完了，而且正则的效率还低，我就是这么弄的：

/**
* 字符串半角和全角间相互转换
* @param string $str 待转换的字符串
* @param int $type TODBC:转换为半角；TOSBC，转换为全角
* @return string 返回转换后的字符串
*/
function convertStrType($str, $type) {

$dbc = array(
'０' , '１' , '２' , '３' , '４' ,
'５' , '６' , '７' , '８' , '９' ,
'Ａ' , 'Ｂ' , 'Ｃ' , 'Ｄ' , 'Ｅ' ,
'Ｆ' , 'Ｇ' , 'Ｈ' , 'Ｉ' , 'Ｊ' ,
'Ｋ' , 'Ｌ' , 'Ｍ' , 'Ｎ' , 'Ｏ' ,
'Ｐ' , 'Ｑ' , 'Ｒ' , 'Ｓ' , 'Ｔ' ,
'Ｕ' , 'Ｖ' , 'Ｗ' , 'Ｘ' , 'Ｙ' ,
'Ｚ' , 'ａ' , 'ｂ' , 'ｃ' , 'ｄ' ,
'ｅ' , 'ｆ' , 'ｇ' , 'ｈ' , 'ｉ' ,
'ｊ' , 'ｋ' , 'ｌ' , 'ｍ' , 'ｎ' ,
'ｏ' , 'ｐ' , 'ｑ' , 'ｒ' , 'ｓ' ,
'ｔ' , 'ｕ' , 'ｖ' , 'ｗ' , 'ｘ' ,
'ｙ' , 'ｚ' , '－' , '　' , '：' ,
'．' , '，' , '／' , '％' , '＃' ,
'！' , '＠' , '＆' , '（' , '）' ,
'＜' , '＞' , '＂' , '＇' , '？' ,
'［' , '］' , '｛' , '｝' , '＼' ,
'｜' , '＋' , '＝' , '＿' , '＾' ,
'￥' , '￣' , '｀'

);

$sbc = array( //半角
'0', '1', '2', '3', '4',
'5', '6', '7', '8', '9',
'A', 'B', 'C', 'D', 'E',
'F', 'G', 'H', 'I', 'J',
'K', 'L', 'M', 'N', 'O',
'P', 'Q', 'R', 'S', 'T',
'U', 'V', 'W', 'X', 'Y',
'Z', 'a', 'b', 'c', 'd',
'e', 'f', 'g', 'h', 'i',
'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's',
't', 'u', 'v', 'w', 'x',
'y', 'z', '-', ' ', ':',
'.', ',', '/', '%', ' #',
'!', '@', '&', '(', ')',
'<', '>', '"', ''','?',
'[', ']', '{', '}', '\',
'|', '+', '=', '_', '^',
'￥','~', '`'

);
if($type == 'TODBC'){
return str_replace( $sbc, $dbc, $str ); //半角到全角
}elseif($type == 'TOSBC'){
return str_replace( $dbc, $sbc, $str ); //全角到半角
}else{
return $str;
}
}

回复收藏 0

灵芸 2017-01-05 17:26:24

看大家发了怎么多方法，我也贴一个：

php全角转半角函数

/**
* 将一个字串中含有全角的数字字符、字母、空格或'%+-()'字符转换为相应半角字符
*
* @access public
* @param string $str 待转换字串
*
* @return string $str 处理后字串
*/
function make_semiangle($str)
{
$arr = array('０' => '0', '１' => '1', '２' => '2', '３' => '3', '４' => '4',
'５' => '5', '６' => '6', '７' => '7', '８' => '8', '９' => '9',
'Ａ' => 'A', 'Ｂ' => 'B', 'Ｃ' => 'C', 'Ｄ' => 'D', 'Ｅ' => 'E',
'Ｆ' => 'F', 'Ｇ' => 'G', 'Ｈ' => 'H', 'Ｉ' => 'I', 'Ｊ' => 'J',
'Ｋ' => 'K', 'Ｌ' => 'L', 'Ｍ' => 'M', 'Ｎ' => 'N', 'Ｏ' => 'O',
'Ｐ' => 'P', 'Ｑ' => 'Q', 'Ｒ' => 'R', 'Ｓ' => 'S', 'Ｔ' => 'T',
'Ｕ' => 'U', 'Ｖ' => 'V', 'Ｗ' => 'W', 'Ｘ' => 'X', 'Ｙ' => 'Y',
'Ｚ' => 'Z', 'ａ' => 'a', 'ｂ' => 'b', 'ｃ' => 'c', 'ｄ' => 'd',
'ｅ' => 'e', 'ｆ' => 'f', 'ｇ' => 'g', 'ｈ' => 'h', 'ｉ' => 'i',
'ｊ' => 'j', 'ｋ' => 'k', 'ｌ' => 'l', 'ｍ' => 'm', 'ｎ' => 'n',
'ｏ' => 'o', 'ｐ' => 'p', 'ｑ' => 'q', 'ｒ' => 'r', 'ｓ' => 's',
'ｔ' => 't', 'ｕ' => 'u', 'ｖ' => 'v', 'ｗ' => 'w', 'ｘ' => 'x',
'ｙ' => 'y', 'ｚ' => 'z',
'（' => '(', '）' => ')', '〔' => '[', '〕' => ']', '【' => '[',
'】' => ']', '〖' => '[', '〗' => ']', '“' => '[', '”' => ']',
'‘' => '[', '’' => ']', '｛' => '{', '｝' => '}', '《' => '<',
'》' => '>',
'％' => '%', '＋' => '+', '—' => '-', '－' => '-', '～' => '-',
'：' => ':', '。' => '.', '、' => ',', '，' => '.', '、' => '.',
'；' => ',', '？' => '?', '！' => '!', '…' => '-', '‖' => '|',
'”' => '"', '’' => '`', '‘' => '`', '｜' => '|', '〃' => '"',
'　' => ' ');
return strtr($str, $arr);
}