PHP 中如何正確統(tǒng)計(jì)中文字?jǐn)?shù)?這個(gè)是困擾我很久的問題,PHP 中有很多函數(shù)可以計(jì)算字符串的長度,比如下面的例子,分別使用了 strlen
,mb_strlen
,mb_strwidth
這個(gè)三個(gè)函數(shù)去測(cè)試統(tǒng)計(jì)字符串的長度,看看把中文算成幾個(gè)字節(jié):
echo strlen("你好ABC") . "";//輸出 9echo mb_strlen("你好ABC", 'UTF-8') . "";// 輸出 5echo mb_strwidth("你好ABC") . "";//輸出 7
從上面的測(cè)試,我們可以看出:strlen
把中文字符算成 3 個(gè)字節(jié),mb_strlen
不管中文還是英文,都算 1 個(gè)字節(jié),而 mb_strwidth
則把中文算成 2 個(gè)字節(jié),所以 mb_strwidth
才是我們想要的:中文 2 個(gè)字節(jié),英文 1 個(gè)字節(jié)。
同樣截取字符串也建議使用 mb_strimwidth
,也是按照 中文 2 個(gè)字節(jié),英文 1 個(gè)字節(jié) 方式計(jì)算之后的,并且如果字?jǐn)?shù)超過截取的要求,這個(gè)函數(shù)還可以在最后面自動(dòng)添加‘…’。
mb_strimwidth($post_excerpt,0,240,'...','utf-8');
注意,最后添加‘utf-8’
編碼參數(shù),可以避免中文截取亂碼的問題。
聯(lián)系客服