1. 程式人生 > >爬蟲入門,爬蟲簡單的入門庫Beautifulsoup庫,解析網頁,簡單用法-案例篇(5)

爬蟲入門,爬蟲簡單的入門庫Beautifulsoup庫,解析網頁,簡單用法-案例篇(5)

           BeautifulSoup 庫是一個非常流行的Python的模組。通過BeautifulSoup 庫可以輕鬆的解析請求庫請求的網頁,並把網頁原始碼解析為文件,以便過濾提取資料。

import requests
from bs4 import BeautifulSoup
headers ={
      'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3573.0 Safari/537.36'
      }
res =requests.get('https://www.baidu.com/',headers=headers)
soup = BeautifulSoup(res.text,'lxml')
print(soup.prettify())