国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 語言 > JavaScript > 正文

nodejs制作小爬蟲功能示例

2024-05-06 15:44:49
字體:
來源:轉載
供稿:網友

本文實例講述了nodejs制作小爬蟲功能。分享給大家供大家參考,具體如下:

1 安裝nodejs

2 安裝需要模塊

npm install request cheerio 

3 新建js文件

4 引入

const request=require("request")const cheerio=require("cheerio")

5 利用request模塊發送請求

request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){  if(err)  {    console.log('請求出錯');  }  else  {    var $ = cheerio.load(res.body, {decodeEntities: false});    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值    item++;    console.log("已爬取"+item+"條記錄");    });  }});

一個小爬蟲案例就完了

附上完整代碼

request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){  if(err)  {    console.log('請求出錯');  }  else  {    var $ = cheerio.load(res.body, {decodeEntities: false});    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值    item++;    console.log("已爬取"+item+"條記錄");    });  }});

下面的帶數據庫

const request=require("request")const cheerio=require("cheerio")const mysql=require('mysql')const db=mysql.createPool({host:'120.79.5554',user:'root',password:'root',database:'pachong'});var item=0;request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){  if(err)  {    console.log('請求出錯');  }  else  {    var $ = cheerio.load(res.body, {decodeEntities: false});    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值      console.log(newsTitle,newsTime,newsUrl)      db.query(`INSERT INTO news (newsTitle, newsTime, newsUrl) VALUE('${newsTitle}', '${newsTime}','${newsUrl}')`,function(err,data){      if(err)      {        console.log("數據庫連接錯誤");      }    })    item++;    console.log("已爬取"+item+"條記錄");    });  }});            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表

圖片精選

主站蜘蛛池模板: 辽中县| 清丰县| 黄冈市| 巴林左旗| 刚察县| 景泰县| 石阡县| 沙洋县| 绥棱县| 清远市| 宜良县| 合水县| 高碑店市| 邵武市| 公安县| 桃源县| 进贤县| 东台市| 达拉特旗| 屯门区| 寿光市| 高尔夫| 松滋市| 六枝特区| 荔浦县| 定西市| 临沧市| 淮滨县| 乌鲁木齐县| 东乡县| 辛集市| 安吉县| 凤台县| 九台市| 洮南市| 四川省| 南华县| 马山县| 遂昌县| 财经| 江永县|