国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > JavaScript > 正文

使用Phantomjs和Node完成網頁的截屏快照的方法

2019-11-19 11:10:48
字體:
來源:轉載
供稿:網友

由于甲方爸爸的需要,最近使用phantomjs和Node寫了一個對網頁內容截屏的功能,為了避免忘記,現在將代碼內容及配置流程大概描述一下.

1.首先Node是必須安裝的,而且網上安裝教程一大堆,在此不再贅述,Nodejs官網鏈接

2.然后,第二個主人公是phantomjs,官網下載地址,選擇對應的系統下載對應的安裝包

3.將phantomjs配置為系統變量,下面是Windows配置為環境變量:

配置完成之后,在cmd命令行中輸入 phantomjs -v 檢驗是否配置成功,配置成功之后,如下圖所示:

4.擼代碼,通過查閱phantomjs入門代碼之后,了解到使用phantomjs可以預覽一個網頁生成圖片,PDF,base64格式等等,而我們的項目需要的并不是一個完整的網頁,而是網頁中的一部分內容,所以在此基礎之上要改造部門內容,現在講解一下代碼:

4.1)首先是express的一些設置,由于需要執行phantomjs的命令,所以需要引入child_process模塊,具體代碼如下:

var process = require('child_process');//執行命令行所需var express = require('express');//expressvar bodyParser = require('body-parser');var fs = require("fs");//文件操作var app = express(); app.use('/pages',express.static('pdfs'));//設置靜態資源目錄app.use(bodyParser.json({limit:'50mb'}));//請求內容大小限制app.use(bodyParser.urlencoded({limit:'50mb',extended:false}));  //設置允許跨域訪問var allowCrossDomain = function(req, res, next) {  res.header('Access-Control-Allow-Origin', '*');  res.header('Access-Control-Allow-Methods', 'GET,PUT,POST,DELETE');  res.header('Access-Control-Allow-Headers', 'Content-Type');  res.header('Access-Control-Allow-Credentials','true');  next();}; app.use(allowCrossDomain);

4.2)然后就是生成頁面的base64接口的方法,如下:

app.get('/getBase64',function(req,res){	var url=req.query.url;//讀取請求中的url參數,然后訪問這個url  url=url.replace(/&/g,'%26');//將請求中的&轉換 	var resp={	  "status":'200'	}	res.writeHead(200,{'Content-Type':'text/html;charset=utf-8'});//設置響應頭	if(url==''){    resp.msg='url參數不能為空';    res.end(JSON.stringify(resp));  	}	else{    //phantomjs執行的命令行 index.js在后文中給出		var strShell='phantomjs --disk-cache=true --disk-cache-path=. index.js '+url;    process.exec(strShell,{    	maxBuffer:5000*1024,    },function(error,stdout,strerr){    	if(error!==null){        console.log(error);    		resp.msg='轉換失敗,稍后重試';    		res.end(JSON.stringify(resp));    	}else{        //執行成功則返回base64的數據    		resp.data=stdout;    		res.end(JSON.stringify(resp));    	}    })	} })

4.3)phantomjs執行的腳本,即index.js,如下:

var page = require('webpage').create();//獲取webpagevar system = require('system'),  address; if (system.args.length === 1) {//執行的命令應該包括請求的URL,否則退出phantom  console.log('Usage: URL error');  phantom.exit();}address = system.args[1];//請求的地址address = address.replace(/%26/g, '&');//phantom不能識別%26,所以轉為&page.viewportSize = {//設置viewport  width: 1920,  height: 1080,}page.open(address, function(status) {//打開頁面  setTimeout(function() {//2s之后獲取base64結果,如果直接生成有可能頁面還沒有加載完成    if (status == 'success') {      var base64 = page.renderBase64('PNG');      console.log(base64);//將base64結果輸出之后,在上邊的getBase64接口中獲取      phantom.exit();    }  }, 2000);})

4.4)獲取頁面中部分內容的截圖,可以將需要截圖的DOM字符串,發送至后臺,然后新建一個空的頁面,使用phantom訪問該空白頁面,并將DOM字符串添加到預覽的頁面,然后生成截圖,具體代碼如下:

app.post('/getPartPage', function(req, res) {  var xmlObj = req.body.xmlObj;//獲取DOM字符串  const reqUrl = 'http:example.com/tmp.html';//要訪問的空頁面  var response = {    "status": '200',  };  if (xmlObj == undefined || xmlObj == '' || xmlObj == null) {    response.msg = 'DOM字符串內容未輸入';    res.end(JSON.stringify(response));  }else {    fs.writeFile('tmp.txt', xmlObj, function(err) { //由于dom字符串內容過多,所以寫入txt文本      if (err) {        response.msg = '生成頁面失敗,請稍后重試';        return res.end(JSON.stringify(response));      }       var strShell = 'phantomjs pages/index.js ' + reqUrl;//phantomjs執行的命令      process.exec(strShell, {        maxBuffer: 5000 * 1024,      }, function(error, stdout, strerr) {        if (error !== null) {          response.msg = '腳本執行錯誤,請稍后重試';          res.end(JSON.stringify(response));        } else {          response.data = stdout.replace("/r/n", "");          res.end(JSON.stringify(response));//返回結果        }       })     })   } }) var server = app.listen(8808,function(){ //接口監聽,訪問的端口	var host = server.address().address	var port = server.address().port  console.log('http://%s:%s',host,port);})

4.5)pages下的index.js內容如下所示:

var page = require('webpage').create();//獲取webpagevar fs = require('fs');var system = require('system'),  address,filename; if (system.args.length === 1) {  console.log('Usage: URL error');  phantom.exit();}address = system.args[1];//請求的路徑address = address.replace(/%26/g, '&');filename = (new Data()).getTime();page.viewportSize = {  width: 750,}page.paperSize = { //生成A4大小的PDF文件  format: 'A4',  orientation: 'portrait',  margin: '0.8cm'}page.open(address, function(status) {  var info = fs.read('tmp.txt');//讀取DOM字符串  var result = page.evaluate(function(info) {    try {      document.querySelector('#dom').innerHTML = info;//將dom字符串拼接    } catch (e) {      console.log(e);    }     return document.querySelector('#dom').innerHTML;//返回頁面  }, info);  setTimeout(function() {    page.paperSize = {      format: 'A4',      orientation: 'portrait',      margin: '0.8cm'    };    page.viewportSize = {      width: 750,    };    //生成PDF文件     page.render('pages/' + filename + '.pdf', { format: 'pdf', quality: '100' });    console.log('http://example.com/pages/' + filename + '.pdf');//返回PDF文件的訪問路徑    phantom.exit();  }, 500);})

OK,以上就是全部接口的內容,全部的代碼可以訪問https://github.com/kim095/node-phantom進行下載.希望對大家的學習有所幫助,也希望大家多多支持武林網。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 清流县| 长沙县| 博湖县| 澄迈县| 云和县| 连云港市| 通渭县| 宣威市| 江阴市| 聂荣县| 玉环县| 谷城县| 子长县| 天峻县| 门头沟区| 浙江省| 通渭县| 铜梁县| 剑阁县| 章丘市| 定南县| 中牟县| 丹巴县| 金湖县| 永安市| 马山县| 桦南县| 苍溪县| 定边县| 南木林县| 虹口区| 五大连池市| 青州市| 广昌县| 龙井市| 缙云县| 钟祥市| 呈贡县| 峨山| 余江县| 永丰县|