三道python正則表達式面試題,具體如下
1.去除以下html文件中的標簽,只顯示文本信息。
<div><p>崗位職責:</p><p>完成推薦算法、數據統計、接口、后臺等服務器端相關工作</p><p><br></p><p>必備要求:</p><p>良好的自我驅動力和職業素養,工作積極主動、結果導向</p><p> <br></p><p>技術要求:</p><p>1、一年以上 Python 開發經驗,掌握面向對象分析和設計,了解設計模式</p><p>2、掌握HTTP協議,熟悉MVC、MVVM等概念以及相關WEB開發框架</p><p>3、掌握關系數據庫開發設計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種<br></p><p>4、掌握NoSQL、MQ,熟練使用對應技術解決方案</p><p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p><p> <br></p><p>加分項:</p><p>大數據,數理統計,機器學習,sklearn,高性能,大并發。</p></div>
利用python正則表達式re模塊中的sub方法,將標簽替換為空字符串,代碼如下:
#-*- coding:utf-8 -*-import re#去除標簽s = "<div>/<p>崗位職責:</p>/<p>完成推薦算法、數據統計、接口、后臺等服務器端相關工作</p>/<p><br></p>/<p>必備要求:</p>/<p>良好的自我驅動力和職業素養,工作積極主動、結果導向</p>/<p> <br></p>/<p>技術要求:</p>/<p>1、一年以上 Python 開發經驗,掌握面向對象分析和設計,了解設計模式</p>/<p>2、掌握HTTP協議,熟悉MVC、MVVM等概念以及相關WEB開發框架</p>/<p>3、掌握關系數據庫開發設計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種<br></p>/<p>4、掌握NoSQL、MQ,熟練使用對應技術解決方案</p>/<p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p>/<p> <br></p>/<p>加分項:</p>/<p>大數據,數理統計,機器學習,sklearn,高性能,大并發。</p>/</div> "p = r"</?/w+>| "print(re.sub(p, " ", s))
2.將以下網址提取出域名:
http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415
利用sub方法,將整個字符串替換為只含域名的字符串。代碼如下:
#-*- coding:utf-8 -*-import re#提取出域名s2 = """http://www.interoem.com/messageinfo.asp?id=35`http://3995503.com/class/class09/news_show.asp?id=14http://lib.wzmc.edu.cn/news/onews.asp?id=769http://www.zy-ls.com/alfx.asp?newsid=377&id=6http://www.fincm.com/newslist.asp?id=415"""p = r"(http://.+?/).+"print(re.sub(p, lambda x : x.group(1), s2))
新聞熱點
疑難解答