1. 程式人生 > 其它 >node.js使用cheerio抓取網頁資料

node.js使用cheerio抓取網頁資料

/*
 * @Description: 使用cheerio抓取網頁資料
 * @Version: 1.0
 * @Autor: Nanke_南柯
 * @Date: 2021-11-02 18:59:35
 * @LastEditors: Nanke_南柯
 * @LastEditTime: 2021-11-02 19:31:44
 */
// npm i cheerio -S 安裝html 解析html非常方便,就像在瀏覽器中使用jquery一樣
const http = require("http")
const https = require("https")
const cheerio =require("cheerio")
let filterData 
= (data)=>{ // console.log('整個頁面',data); const $ = cheerio.load(data) $('.typography-body-reduced').each((index,el)=>{ console.log('通過cheerio外掛獲取我們想要的dom的索引:',index); console.log('通過cheerio外掛獲取我們想要的dom:',$(el).text()); }) } const server = http.createServer((req,res)=>{ let data
= '' https.get('https://www.apple.com.cn/iphone/',(result)=>{ result.on('data',(chunk)=>{ data+=chunk }) result.on('end',()=>{ filterData(data) }) }) }) server.listen(5080,()=>{ console.log('localhost:5080 Listen...'); })

hotnode index.js後瀏覽器訪問http://localhost:5080/

可以看到 利用cheerio外掛我們可以直接篩選我們爬取到整個網頁的內容進行過濾,得到我們想要的內容,如圖

cheerio二次中文翻譯大家可以看這篇

https://www.jianshu.com/p/629a81b4e013