国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Ruby > 正文

Ruby中Mechanize的使用深度解析

2020-02-24 15:40:28
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

  下面是小編給大家分享的一篇ruby.html" target="_blank">Ruby中Mechanize的使用深度解析,感興趣的朋友跟小編一起來(lái)了解一下吧!

  Ruby中實(shí)現(xiàn)網(wǎng)頁(yè)抓取,一般用的是mechanize,使用非常簡(jiǎn)單。

  安裝

  復(fù)制代碼 代碼如下:

  sudo gem install mechanize

  抓取網(wǎng)頁(yè)

  復(fù)制代碼 代碼如下:

  require 'rubygems'

  require 'mechanize'

  agent = Mechanize.new

  page = agent.get('http://google.com/')

  模擬點(diǎn)擊事件

  復(fù)制代碼 代碼如下:

  page = agent.page.link_with(:text => 'News').click

  模擬表單提交

  復(fù)制代碼 代碼如下:

  google_form = page.form('f')

  google_form["q"] = 'ruby mechanize'

  page = agent.submit(google_form, google_form.buttons.first)

  pp page

  分析頁(yè)面,mechanize用的是nokogiri解析網(wǎng)頁(yè)的,所以可以參照nokogiri的文檔

  復(fù)制代碼 代碼如下:

  table = page.search('a')

  text = table.inner_text

  puts text

  有幾點(diǎn)注意的地方: 如果需要先登錄的網(wǎng)頁(yè),那么可以在網(wǎng)站先登錄,登錄后記錄JSESSIONID,然后賦值給agent

  復(fù)制代碼 代碼如下:

  cookie = Mechanize::Cookie.new("JSESSIONID", "BA58528B76124698AD033EE6DF12B986:-1")

  cookie.domain = "datamirror.csdb.cn"

  cookie.path = "/"

  agent.cookie_jar.add!(cookie)

  如果需要保存網(wǎng)頁(yè),使用.save_as,(或許save也可以,我沒(méi)試過(guò))例如

  復(fù)制代碼 代碼如下:

  agent.get("http://google.com").save_as

  小技巧

  puts Mechanize::AGENT_ALIASES 可以打印出所有可用的user_agent

  puts Mechanize.instance_methods(false) 輸出Mechanize模塊的所有方法

  puts Mechanize.instance_methods() 輸出Mechanize模塊的所有方法以及所繼承的類(lèi)的函數(shù)

  以上就是Ruby中Mechanize的使用深度解析了,想必都了解了吧,更多相關(guān)內(nèi)容請(qǐng)繼續(xù)關(guān)注武林技術(shù)頻道。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表

圖片精選

主站蜘蛛池模板: 新泰市| 施甸县| 乌海市| 武安市| 来凤县| 安宁市| 湛江市| 伊金霍洛旗| 浏阳市| 米林县| 林周县| 台湾省| 大同县| 岢岚县| 洛宁县| 福鼎市| 高碑店市| 盖州市| 乌恰县| 永年县| 阳东县| 邳州市| 喜德县| 土默特右旗| 渝中区| 临洮县| 桃江县| 西安市| 南投县| 东乌| 乡宁县| 潜山县| 陕西省| 三穗县| 丽水市| 安丘市| 嘉禾县| 余江县| 新化县| 陵水| 东丰县|