免app下載筆趣閣小說

阿新 • • 發佈：2018-10-24

[] .com site 根據 app下載代碼 earch mozilla 學習

　　這個是對最近學習的一次總結吧。前兩天寫的，今天才有時間寫博客。

　　偶然點開筆趣閣的網址(https://www.biquge.cc/),突然覺得我應該可以用爬蟲實現小說下載。有這個想法我就開始嘗試了。

　　爬蟲呀，說白了就是程序自動模擬瀏覽器操作來獲取網頁的內容。

　　先用F12查看元素，查看章節網址鏈接，和章節正文內容。

　　結構很簡單。

　　想法很快就有了，通過網站的搜索打開小說詳情頁，然後獲取每一章的網址url，依次訪問每一章網址，再通過正則表達式匹配章節內容，

最後將匹配的內容保存到本地。

　　中間忘了一個小的知識點，就是我使用re.findall()來匹配的，它最後返回的時一個列表！！！

　　運行結果如下圖：

　　技術分享圖片

　　代碼如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2018/10/20 15:46
# @Author  : yuantup
# @Site    : 
# @File    : biquge.py
# @Software: PyCharm
import urllib.request
import re
import time
import os


def open_url(url):
    # 打開網址專用
    # 以字典的形式設置headers
    head = {‘ 
Accept‘: ‘text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8‘,
            # ‘Accept-Encoding‘: ‘gzip‘,
            # 接受編碼如果是gzip,deflate之類的，可能會報錯
            ‘Accept-Language‘: ‘zh-CN,zh;q=0.9‘,
            ‘Connection‘: ‘keep-alive‘,
            ‘Host‘: ‘sou.xanbhx.com‘,
             
‘Referer‘: ‘https://www.biquge.cc/‘,
            ‘Upgrade-Insecure-Requests‘: ‘1‘,
            ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
                          ‘Chrome/63.0.3239.132 Safari/537.36‘, }
    # 設置cookies
    # proxy = urllib.request.ProxyHandler({‘http‘: ‘127.0.0.1:8888‘})
    opener = urllib.request.build_opener()
    # 遍歷字典，將其轉換為指定格式（外層列表，裏層元組）
    headers = []
    for key, value in head.items():
        item = (key, value)
        headers.append(item)
    opener.addheaders = headers
    urllib.request.install_opener(opener)
    response = urllib.request.urlopen(url)
    html = response.read()
    time.sleep(1)
    return html


def novel_detail(book_name):
    # 根據傳入的小說名字獲取到小說的詳情頁，並提取出小說內容（詳情，每個章節的網址）
    # 小說存在重名情況！！！待解決
    zh_book_name = urllib.request.quote(book_name)
    url = ‘https://sou.xanbhx.com/search?siteid=biqugecc&q=‘ + zh_book_name
    html = open_url(url).decode(‘utf-8‘)
    # print(html)
    name_pa = ‘<span class="s2">.*?<a href="(.*?)" target="_blank">.*?(\S*?)</a>‘
    name_list = re.findall(name_pa, html, re.S)
    # print(name_list[1])
    if name_list[0][1] == book_name:
        book_url = name_list[0][0]
        print(book_url)
    elif not name_list:
        print(‘‘)
        print(‘對不起，該網址沒有找到你需要的書。‘)
    return book_url


def content(url):
    # 獲取小說正文
    html = open_url(url).decode(‘utf-8‘)
    # print(html)
    main_body_pa = r‘最新章節（提示：已啟用緩存技術，最新章節可能會延時顯示，登錄書架即可實時查看。）.*?<dt>(.*?)</div>‘
    chapter_url_pa = r‘<a style="" href="(.*?)">‘
    main_body = re.findall(main_body_pa, html, re.S)
    # print(main_body, ‘ 1‘)
    # 記住re.findall()方法返回的時一個列表！！！
    chapter_url = re.findall(chapter_url_pa, main_body[0])
    # print(chapter_url, ‘ 2‘)
    time.sleep(2)
    return chapter_url


def save_novel(novel_url, content_url_list, book_name):
    # 保存小說內容
    for i in range(len(content_url_list)):
        real_url = novel_url + content_url_list[i]
        html = open_url(real_url).decode(‘utf-8‘)
        # print(html)
        chapter_name_pa = ‘<h1>(.*?)</h1>‘
        chapter_name = re.search(chapter_name_pa, html).group(1)
        # print(chapter_name)
        # print(type(chapter_name))
        content_pa = r‘<div id="content">(.*?)<script>‘
        content1 = re.findall(content_pa, html, re.S)
        content2 = content1[0].replace(‘&nbsp;&nbsp;&nbsp;&nbsp;‘, ‘ ‘)
        content3 = content2.replace(‘<br/>‘, ‘\n‘)
        content4 = content3.replace(‘</br>‘, ‘‘)
        re_chapter_name = chapter_name.replace(‘ ‘, ‘‘)
        content5 = content4.replace(re_chapter_name, ‘‘)
        # 有些章節內容包括章節名，這裏替換掉它們。
        whole_content = ‘   ‘ + chapter_name + ‘\n‘ + content5
        # print(whole_content)
        # print(chapter_name)
        with open(book_name + ‘.txt‘, ‘a‘, encoding=‘utf-8‘) as f:
            f.write(whole_content)
            print(‘成功下載  {}‘.format(chapter_name))
        time.sleep(1)


def main():
    path = r‘E:\spiser_sons\books‘
    a = os.getcwd()
    print(a)
    if os.path.exists(path):
        os.chdir(path)
        print(os.getcwd())
    else:
        os.mkdir(path)
        os.chdir(path)
    book_name = input(‘請輸入想下載小說的名字：‘)
    novel_url = novel_detail(book_name)
    content_url_list = content(novel_url)
    save_novel(novel_url, content_url_list, book_name)


if __name__ == ‘__main__‘:
    main()

免app下載筆趣閣小說

[] .com site 根據 app下載代碼 earch mozilla 學習　　這個是對最近學習的一次總結吧。前兩天寫的，今天才有時間寫博客。　　偶然點開筆趣閣的網址(https://www.biquge.cc/),突然覺得我應該可以用爬蟲實現小說下載。有這個

爬取筆趣閣小說（一念永恒）

with inf end name style code color lin lena ！：編碼格式。編碼格式。編碼格式 !!：http://xiaorui.cc/2016/02/19/%E4%BB%A3%E7%A0%81%E5%88%86%E6%9E%90python-r

筆趣閣小說優化版

#-*-coding:utf-8-*- # 筆趣閣 import requests from lxml import etree def url_processing(url): # 網址處理函式 if requests.get(url).status_code > 200

Python BeautifulSoup 爬取筆趣閣所有的小說

http bs4 soup decode dom 數據結構 con lock lis 這是一個練習作品。用python腳本爬取筆趣閣上面的免費小說。環境：python3類庫：BeautifulSoup數據源：http://www.biqukan.cc 原理就是偽裝正常

用Scrapy爬取筆趣閣小說

今天早上無聊，去筆趣閣扒了點小說存Mongodb裡存著，想著哪天做一個小說網站有點用，無奈網太差，爬了一個小時就爬了幾百章，爬完全網的小說，不知道要到猴年馬月去了。再說說scrapy這個爬蟲框架，真是不用不知道，一用嚇一跳，這個實在太好用了，比自己用request，Beaut

scrapycrawl 爬取筆趣閣小說

視頻 mage 匯總多臺設置由於 tle 目錄 pla 前言第一次發到博客上..不太會排版見諒最近在看一些爬蟲教學的視頻,有感而發,大學的時候看盜版小說網站覺得很能賺錢,心想自己也要搞個,正好想爬點小說能不能試試做個網站(網站搭建啥的都不會...)

運動健身小管家app下載|運動健身小管家app安卓版下載

運動健身小管家是我非常喜歡的一款運動健康軟體，軟體中的計步功能可以看到自己每天步行的路程，消耗的卡路里，跟著軟體一起動起來吧。運動健身小管家是我非常喜歡的一款運動健康軟體。運動健身小管家下載連結應用簡介運動健身小管家是一款非常實用的健身工具，該軟體可以讓你瞭解到你每天走了多少步，並且消耗的卡路里，軟體上方都會

掃描二維碼自動識別手機APP下載地址

新浪推廣 amp 需要 android 通過來源中文版 blog 原文地址https://www.baidufe.com/item/92457b4d0bfde1effa40.html 移動互聯網發展迅速，各種APP的開發都太瘋狂了，一般稍大點兒的應用，都會準備多個版本

Python 爬取筆趣看小說

self obj download pat color windows http float web # -*- coding:utf-8 -*- from bs4 import BeautifulSoup import requests import sys cla

高傭聯盟app下載官方地址（安卓&蘋果）

聯合 api 直接下載登錄特點 sha blog p s 可用　　高傭金聯盟app聯合了拼多多商品網購平臺，為你帶來高傭金的網賺體驗，擁有萬千商品，最便捷的購物模式，售賣模式，讓你快速賺錢!PDD高傭聯盟之家這就為您提供高傭聯盟app下載地址。　　高傭聯盟app下載

2022cm最新視頻app下載地址

網站已構建配置好的vuejs全家桶項目，統一管理後端接口 | 獲取數據 | 請求數據看片點擊進入→https://www.2022cma.com 已包含vue-router，vuex，api，axios. webpack, 儲存用vue-ls, 異步async/await, css less. 下載即使用項

Python基礎練習（二）筆趣看《伏天氏》全文章節爬取

平臺空行 ges 會有好的 clas 追加 ref 版本大家如果覺得有幫助的話，可以關註我的知乎https://www.zhihu.com/people/hdmi-blog/posts，裏面有寫了一些我學習爬蟲的練習~ 今天我們想要爬取的是筆趣看小說網上的網絡小說，並

java基礎增強：統計網上app下載情況，並排序

技術 rri map對象 cat -s height hang city ole 一入編程深似海，從此妹子是路人。案例：　　統計網站app下載的情況，後臺數據如下：　　　　日期,用戶名,app名,下載渠道,所在城市,app版本　　　　2017-08-15,xx老師,

我用積分給大家提供CSDN免積分下載，0積分下載！

網上有一個軟體，叫什麼鬼哥Csdn免積分下載器，我試了一下，並不能用，很坑的。鑑於現在CSDN的所有資源都需要積分才能下載，以前的資源都不免費了，沒有0積分的資源了。所以為了解決部分人的下載問題，我給大家提供一下下載服務！我個人的積分給大家看看！如果以後積分用完了，

python爬蟲——40行程式碼爬取「筆趣看」全部小說你都看了嗎？

需求分析 ”筆趣看“ 是一個盜版小說網站，這裡有各大知名小說網站的小說，更新速度略慢於正版網站。但是該網站只支援線上瀏覽，不支援小說下載，對於想要下載下來以防斷網或者網速不好時也能看的童鞋來說不太友好。因此，本次練習將爬取該網站所有小說。PS：本次練習僅為學習交流，請各位童鞋支援正版。爬取

仿蘋果app下載動畫-煎餅

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>煎餅</title> </head> <style>

CSDN免積分下載器下載 2018 最新免費版

CSDN免積分下載器是一款CSDN網站資源下載工具，CSDN下載器可以免登陸免積分下載需要積分的資源，不用再去為積分問題而苦惱。由於CSDN不知道什麼時候會繼續改版或者變動，所以不保證這個CSDN免積分下載器的長期有效哦。CSDN上有很多使用者上傳的好資料，不過好些都需要下載積分，很多網友總是搜到了CSDN的

大資料下無隱私APP為何要使用者攝像頭麥克風通訊錄等全許可權才服務(公號回覆“無隱私APP”下載PDF彩標典藏版資料，歡迎轉發讚賞)

大資料下無隱私APP為何要使用者攝像頭麥克風通訊錄等全許可權才服務(公號回覆“無隱私APP”下載PDF彩標典藏版資料，歡迎轉發讚賞) 肥肥貓知識簡化昨天知識簡化導讀：大資料下無隱私！我國99%的APP為何要使用者攝像頭、麥克風、通訊錄、資料夾等幾乎全部手機許可權，才肯為使用者提供其

微信自動跳轉手機預設瀏覽器開啟APP下載連結的實現方式

微信被認為是目前最具營銷價值的營銷渠道之一，原因很簡單，微信是目前超高活躍度的app穩穩第一名，但是在微信中點選app下載連結，都是無法下載app的。因為騰訊為了自身利益，遮蔽了其他app直接在微信中下載。我們要怎麼解決這個問題呢？解決方案：微信中開啟連結，自動開啟外部瀏覽器開啟頁面微信中點選或開啟

免app下載筆趣閣小說

相關推薦