国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > PHP > 正文

PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法

2024-05-04 23:26:15
字體:
供稿:網(wǎng)友
這篇文章主要介紹了PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法,是一個(gè)比較實(shí)用的技巧,對(duì)于進(jìn)行PHP應(yīng)用程序開發(fā)來說有一定的參考借鑒價(jià)值,需要的朋友可以參考下
 
 

本文實(shí)例講述了PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法。分享給大家供大家參考。具體實(shí)現(xiàn)方法如下:

一、需求:

最近一段時(shí)間常常出現(xiàn)這類垃圾評(píng)論:一大段英文字符里夾雜一兩個(gè)生僻漢字,包含了中文字符,而且又沒包含啥中文的敏感詞,所以就堂而皇之的通過了評(píng)論過濾。對(duì)這類評(píng)論的處理可以采取判斷中文字符的比率來確認(rèn),但是也會(huì)存在一定的誤判。

二、解決方案:

要用到php的兩個(gè)函數(shù)strlen和mb_strlen,strlen會(huì)把單個(gè)漢字長(zhǎng)度認(rèn)定為3,mb_strlen單個(gè)漢字長(zhǎng)度為1。同一段字符通過兩個(gè)函數(shù)取得的長(zhǎng)度之差就是實(shí)際漢字字符數(shù)的二倍,除以二就得到實(shí)際的字符數(shù),在與mb_strlen取得的長(zhǎng)度求比值就得到漢字占總字符數(shù)的比率。

三、實(shí)現(xiàn)代碼:

 

復(fù)制代碼代碼如下:
$len_all = strlen($comment['text']);                      
 $len_st = mb_strlen($comment['text'], 'UTF-8');
 if(($len_all-$len_st)/(2*$len_st) < 0.5){
        $error = "中文字符少于百分之五十"; 
 }

 

如果在評(píng)論中貼代碼的話,就會(huì)造成中文字符比率低,需要過濾掉代碼字段再來判斷。

希望本文所述對(duì)大家的PHP程序設(shè)計(jì)有所幫助。


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 班玛县| 文水县| 凤台县| 额尔古纳市| 民县| 昌图县| SHOW| 长汀县| 岐山县| 高清| 姜堰市| 波密县| 克拉玛依市| 江油市| 左权县| 丁青县| 竹山县| 平阴县| 邳州市| 瑞安市| 扎囊县| 策勒县| 沁阳市| 叶城县| 故城县| 松溪县| 宁陵县| 黑龙江省| 商水县| 岳阳县| 龙川县| 茂名市| 铜梁县| 七台河市| 舒兰市| 鹤庆县| 沧州市| 炉霍县| 寻乌县| 增城市| 加查县|