天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

PHP獲取中英混合字符串長度的方法

今晚在寫框架的表單驗證類時,需要判斷某個字符串長度是否在指定區間內,很自然地,想到了php中的strlen函數。
復制代碼 代碼如下:
$str = 'Hello world!';
echo strlen($str); // 輸出12
然而在php自帶的函數中,strlen及mb_strlen都是通過計算字符串所占字節數來計算長度的,在不同的編碼情況下,中文所占的字節數是不同的。在GBK/GB2312下,中文字符占2個字節,而在UTF-8下,中文字符占3個字節。
復制代碼 代碼如下:
$str = '你好,世界!';
echo strlen($str); // GBK或GB2312下輸出12,UTF-8下輸出18
而我們在判斷字符串長度時往往需要判斷的是字符的數量,而非字符串所占字節數,如在UTF-8下的這段php代碼:
復制代碼 代碼如下:
$name = '張耕暢';
$len = strlen($name);
// 輸出 FALSE,因為在UTF-8下三個中文占9個字節
if($len >= 3 && $len <= 8){
 echo 'TRUE';
}else{
 echo 'FALSE';
}
那么有什么方便而實用的方法可以獲得含中文字符串的長度呢?可以用正則計算出中文字符的個數,在GBK/GB2312編碼下除以2,UTF-8編碼下則除以3,最后再加上非中文字符串的長度,但這樣未免太過麻煩。

WordPress這么一段代碼,借鑒如下:
復制代碼 代碼如下:
$str = 'Hello,世界!';
preg_match_all('/./us', $str, $match);
echo count($match[0]); // 輸出9
思想是用正則表達式將字符串分割成單個字符,并直接用count計算出匹配到的字符數,便是我們想要的結果了。

但以上代碼在UTF-8編碼下并不能處理GBK/GB2312的中文字符串,因為GBK/GB2312的中文字符會被識別為兩個字符而計算出來的中文字符數量會翻倍,于是我想到了這么一個辦法:
復制代碼 代碼如下:
$tmp = @iconv('gbk', 'utf-8', $str);
if(!empty($tmp)){
 $str = $tmp;
}
preg_match_all('/./us', $str, $match);
echo count($match[0]);
可兼容GBK/GB2312及UTF-8編碼,經小量數據測試通過,但暫未確定是否完全正確,盼有大牛指點一二。

以上本意是為了框架可以兼容多種編碼格式,但一般在日常開發中,一個項目是已經可以確定為何種編碼的,因此可以使用以下函數來方便地獲取字符串長度:
復制代碼 代碼如下:
int iconv_strlen ( string $str [, string $charset = ini_get("iconv.internal_encoding") ] )

php技術PHP獲取中英混合字符串長度的方法,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 国产99久9在线| 色欲AV精品人妻一区二区麻豆 | 美女脱了内裤张开腿让男人桶到爽 | 超碰在线视频公开 | 娇女的呻吟亲女禁忌h16 | 欧美亚洲另类丝袜自拍动漫 | 午夜国产精品影院在线观看 | 国产精品亚欧美一区二区三区 | 高清欧美一区二区三区 | 久久久91精品国产一区二区 | 国产 亚洲 另类 欧美 在线 | 久久伊人在 | 一级做a爰片久久毛片免费 一级做a爰片久久毛片潮喷动漫 | 男人和女人一起愁愁愁很痛 | 午夜伦理 第1页 | 四川老师边上网课边被啪视频 | 永久午夜福利视频一区在线观看 | 成人精品在线视频 | 99精品热视频30在线热视频 | 亚洲精品蜜夜内射 | 国产精品久久久亚洲偷窥女厕 | 日本不卡三卡四卡 | 嗯啊插的好深啊使劲抽视频 | 国产精品视频大全 | 翁公与小莹在客厅激情 | a视频免费看 | 久久WWW免费人成一看片 | 99这里有精品视频视频 | 国产精品人妻久久无码不卡 | 中文字幕乱码亚洲无线三区 | 女性酥酥影院 | 大胸美女脱内衣黄网站 | 女王羞辱丨vk| 亚洲精品高清视频 | 邪恶肉肉全彩色无遮盖 | 国产成人免费观看在线视频 | 最新色导航 | 囯产免费久久久久久国产免费 | 国产精品一国产精品免费 | 97视频免费观看 | 在线观看成人3d动漫入口 |