国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 語言 > PHP > 正文

PHP將HTML轉換成文本一些方法總結

2024-09-04 11:48:04
字體:
來源:轉載
供稿:網友

在php中html轉換成文本提供了自帶的函數strip_tags了,但有時此函數不夠用,下面總結了一些用戶自定的函數,各位可參考.

最常用的使用php函數strip_tags,代碼如下:

  1. <?php 
  2. $mystr=<<<SATO 
  3. 此處省略幾十行HTML代碼^_^ 
  4. SATO; 
  5. $str=strip_tags($mystr); 
  6. //到這里就已經達到我的HTML轉為TXT文本的目的了,哈哈,使用這個函數真方便 
  7. //下面是插件的一些切詞等操作,這里就不多說了 
  8. ?> 

自定義函數,代碼如下:

  1. <?php 
  2. // $document 應包含一個 HTML 文檔。 
  3. // 本例將去掉 HTML 標記,javascript 代碼 
  4. // 和空白字符。還會將一些通用的 
  5. // HTML 實體轉換成相應的文本。 
  6. $search = array ("'<script[^>]*?>.*?</script>'si",  // 去掉 javascript 
  7.                  "'<[/!]*?[^<>]*?>'si",           // 去掉 HTML 標記 
  8.                  "'([rn])[s]+'",                 // 去掉空白字符 
  9.                  "'&(quot|#34);'i",                 // 替換 HTML 實體 
  10.                  "'&(amp|#38);'i"
  11.                  "'&(lt|#60);'i"
  12.                  "'&(gt|#62);'i"
  13.                  "'&(nbsp|#160);'i"
  14.                  "'&(iexcl|#161);'i"
  15.                  "'&(cent|#162);'i"
  16.                  "'&(pound|#163);'i"
  17.                  "'&(copy|#169);'i"
  18.                  "'&#(d+);'e");                    // 作為 PHP 代碼運行 
  19. $replace = array (""
  20.                   ""
  21.                   "/1"
  22.                   """, 
  23.                   "&"
  24.                   "<"
  25.                   ">"
  26.                   " "
  27.                   chr(161), 
  28.                   chr(162), 
  29.                   chr(163), 
  30.                   chr(169), 
  31.                   "chr(/1)"); 
  32. $text = preg_replace ($search$replace$document); 
  33. ?> 

后來我從網上看到了一個使用PHP寫的方法,使用這個方法也可以實現將HTML轉為TXT文本,個人覺得也還蠻實用的,在這里分享一下,代碼如下:

  1. function HtmlToText($str){ 
  2.   $str=preg_replace("/<sty(.*)/style>|<scr(.*)/script>|<!--(.*)-->/isU","",$str);//去除CSS樣式、JS腳本、HTML注釋 
  3.   $alltext="";//用于保存TXT文本的變量 
  4.   $start=1;//用于檢測<左、>右標簽的控制開關 
  5.   for($i=0;$i<strlen($str);$i++){//遍歷經過處理后的字符串中的每一個字符 
  6.     if(($start==0)&&($str[$i]==">")){//如果檢測到>右標簽,則使用$start=1;開啟截取功能 
  7.       $start=1; 
  8.     }else if($start==1){//截取功能 
  9.       if($str[$i]=="<"){//如果字符是<左標簽,則使用<font color='red'>|</font>替換 
  10.         $start=0; 
  11.         $alltext.="<font color='red'>|</font>"
  12.       }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,則將字符添加到$alltext變量中 
  13.         $alltext.=$str[$i]; 
  14.       } 
  15.     } 
  16. //下方是去除空格和一些特殊字符的操作 
  17. $alltext = str_replace(" "," ",$alltext); 
  18. $alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext); 
  19. $alltext = preg_replace("/[ ]+/s"," ",$alltext); 
  20. return $alltext

使用下面這個方法也可以實現將簡答的HTML代碼轉換為TXT文本,實例代碼如下:

  1. function html2text($str,$encode = 'GB2312'
  2.   $str = preg_replace("/<style .*?</style>/is"""$str); 
  3.   $str = preg_replace("/<script .*?</script>/is"""$str); 
  4.   $str = preg_replace("/<br s*/?/>/i""n"$str); 
  5.   $str = preg_replace("/</?p>/i""nn"$str); 
  6.   $str = preg_replace("/</?td>/i""n"$str); 
  7.   $str = preg_replace("/</?div>/i""n"$str); 
  8.   $str = preg_replace("/</?blockquote>/i""n"$str); 
  9.   $str = preg_replace("/</?li>/i""n"$str); 
  10.   $str = preg_replace("/&nbsp;/i"" "$str); 
  11.   $str = preg_replace("/&nbsp/i"" "$str); 
  12.   $str = preg_replace("/&amp;/i""&"$str); 
  13.   $str = preg_replace("/&amp/i""&"$str); 
  14.   $str = preg_replace("/&lt;/i""<"$str); 
  15.   $str = preg_replace("/&lt/i""<"$str); 
  16.   $str = preg_replace("/&ldquo;/i"'"'$str); 
  17.   $str = preg_replace("/&ldquo/i"'"'$str); 
  18.      $str = preg_replace("/&lsquo;/i""'"$str); 
  19.      $str = preg_replace("/&lsquo/i""'"$str); 
  20.      $str = preg_replace("/&rsquo;/i""'"$str); 
  21.      $str = preg_replace("/&rsquo/i""'"$str); 
  22.   $str = preg_replace("/&gt;/i"">"$str); 
  23.   $str = preg_replace("/&gt/i"">"$str); 
  24.   $str = preg_replace("/&rdquo;/i"'"'$str); 
  25.   $str = preg_replace("/&rdquo/i"'"'$str); 
  26.   $str = strip_tags($str); 
  27.   $str = html_entity_decode($str, ENT_QUOTES, $encode); 
  28.   $str = preg_replace("/&#.*?;/i"""$str); 
  29.       
  30.   return $str
  31. }

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 枞阳县| 玉溪市| 射阳县| 庆阳市| 松江区| 武陟县| 汽车| 沈阳市| 简阳市| 高要市| 宁晋县| 修水县| 平安县| 许昌县| 阜阳市| 蛟河市| 武鸣县| 旺苍县| 敦化市| 河间市| 什邡市| 石景山区| 蒲江县| 襄樊市| 东乡县| 渭南市| 新河县| 册亨县| 莒南县| 佛坪县| 穆棱市| 渝中区| 新竹市| 南安市| 怀化市| 长沙市| 烟台市| 平乡县| 项城市| 吐鲁番市| 西平县|