Python網路爬蟲資訊提取mooc程式碼例項

阿新 • • 發佈：2020-03-06

例項一--爬取頁面

import requests
url="https//itemjd.com/2646846.html"
try:
 r=requests.get(url)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[:1000])
except:
 print("爬取失敗")

正常頁面爬取

例項二--爬取頁面

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
 kv={'user-agent':'Mozilla/5.0'}
 r=requests.get(url,headers=kv)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[1000:2000])
except:
 print("爬取失敗")

對訪問使用者名稱有限制，模擬瀏覽器對網站請求

例項三--爬取搜尋引擎

#百度的關鍵詞介面：http://www.baidu.com/s?wd=keyword
#360的關鍵詞介面：http://www.so.com/s?q=keyword
import requests
keyword="python"
try:
 kv={'wd':keyword}
 r=requests.get("http://www.baidu.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失敗")
--------------------------------------------------
import requests
keyword="python"
try:
 kv={'q':keyword}
 r=requests.get("http://www.so.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失敗")

例項四--:爬取圖片

import requests
import os
url="http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg"
root="F://pics//"
path=root+url.split('/')[-1]
try:
 if not os.path.exists(root):
  os.mkdir(root)
 if not os.path.exists(path):
  r=requests.get(url)
  with open(path,'wb') as f:
   f.write(r.content)
   f.close()
   print("檔案儲存成功")
 else:
  print("檔案已經存在")
except:
 print("爬取失敗")

爬取並儲存圖片

例項五--IP地址歸屬地查詢：

http://m.ip138.com/ip.asp?ip=ipaddress

url="http://www.ip138.com/iplookup.asp?ip="
try:
 r=requests.get(url+'202.204.80.112'+'&action=2')
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[-500:])
except:
 print("爬取失敗")

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python網路爬蟲資訊提取mooc程式碼例項

例項一--爬取頁面 import requests url=\"https//itemjd.com/2646846.html\" try: r=requests.get(url) r.raise_for_status()

網路爬蟲資訊提取的常識和Robots協議

技術標籤：網路網路爬蟲介紹在瀏覽網站中，所能見到的資料可以通過爬蟲程式儲存下來。

Python網路爬蟲與資訊提取MOOC學習——Requests庫網路爬蟲實戰

技術標籤：Python Requests庫網路爬蟲實戰例項一：商品頁面的爬取通過連結獲取商品資訊，通過GET方法獲取連結內容【京東商品URL連結：https://item.jd.com/2967929.html 中國亞馬遜網站商品連結 https://www.

006 Python網路爬蟲與資訊提取資訊組織與提取方法

[A] 資訊標記的三種形式　　　　資訊標記：通過網路爬蟲，我們可以獲取各式各樣的資訊，比如地址資訊，姓名資訊，日期資訊，年代資訊等，這些資訊會很冗雜

007 Python網路爬蟲與資訊提取中國大學排名爬蟲

[A] 中國大學排名定向爬蟲例項介紹　　功能描述　　　　輸入：大學排名URL連結

Python網路爬蟲與資訊提取_網課筆記1

技術標籤：python 目錄 HTTP協議HTTP協議對資源的操作PATCH和PUT的區別 HTTP協議方法與Requests庫方法一一對應requests.head()requests.post()

python爬蟲新增請求頭程式碼例項

這篇文章主要介紹了python爬蟲新增請求頭程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

教你使用Python網路爬蟲獲取菜譜資訊，

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

由Python編寫的MySQL管理工具程式碼例項

本文例項為大家分享了由Python編寫的MySQL管理工具的具體程式碼，供大家參考，具體內容如下

Python動態宣告變數賦值程式碼例項

這篇文章主要介紹了Python動態宣告變數賦值程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python幾種常用功能實現程式碼例項

這篇文章主要介紹了python幾種常用功能實現程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python如何使用jt400.jar包程式碼例項

這篇文章主要介紹了python如何使用jt400.jar包程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python plotly畫柱狀圖程式碼例項

這篇文章主要介紹了python plotly畫柱狀圖程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python實現圖片批量加入水印程式碼例項

這篇文章主要介紹了Python實現圖片批量加入水印程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python根據文字生成詞雲圖程式碼例項

這篇文章主要介紹了python根據文字生成詞雲圖程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python用requests實現http請求程式碼例項

這篇文章主要介紹了python用requests實現http請求過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python 利用jinja2模板生成html程式碼例項

這篇文章主要介紹了python 利用jinja2模板生成html程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python 向量資料轉柵格資料程式碼例項

這篇文章主要介紹了python 向量資料轉柵格資料程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python根據時間獲取週數程式碼例項

時間時間和週數 import time import datetime # 獲取今天是第幾周 print(time.strftime(\'%W\'))

python網路爬蟲 CrawlSpider使用詳解

CrawlSpider 作用：用於進行全站資料爬取 CrawlSpider就是Spider的一個子類如何新建一個基於CrawlSpider的爬蟲檔案