使用Python對雙色球號碼進行爬取

阿新 • • 發佈：2019-02-09

使用Python福彩官網對雙色球進行爬取

很久之前寫的一個小爬蟲，程式碼其實有點冗雜，看官姥爺們如果有什麼可以指點的地方，儘量拍，謝謝~

一點一點加油吧

觀察一下除了第一頁之外其他頁面的索引可以用index_+num來實現
得出程式碼:

def get_link(pages = 10):   #定義頁面的生成器
    for i in xrange(pages):
        url = 'http://www.cwl.gov.cn/kjxx/ssq/hmhz/'
        if i == 0:
            url = url + 'index.shtml'
        else:
            url = url + 'index_' + str(i) + '.shtml'
        yield url

取出頁面:

for url in get_link(page):
    ul = url

測試效果:(列印預設狀況)

接下來使用firebug對頁面進行分析:
審查元素找到所需爬取資訊

對元素資訊進行定位:
這裡使用的是re對頁面元素進行定位:

cmpdate = re.compile('<td height="35">(\d+?)</td>') #日期
cmpblue = re.compile('<span class="blue">(\d\d)')  #藍球
cmpred = re.compile('<span>(\d\d)</span>')  #紅球

後來看一下這樣的寫法比較基礎雖然可以提取資料但是後處理似乎比較麻煩
整合一下

def getlottery(pages = 10):
    hd = {'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.81 Safari/537.36'}
    date = []
    redball = []
    blueball = []
    cmpdate = re.compile('<td height="35">(\d+?)</td>')
    cmpblue = re.compile('<span class="blue">(\d\d)')
    cmpred = re.compile('<span>(\d\d)</span>')
    for url in get_link(pages):
        try:
            html = requests.get(url, headers = hd)
            html.raise_for_status()
            html.encoding = html.apparent_encoding
            res = html.text
        except:
            pass
        D = re.findall(cmpdate, res)
        B = re.findall(cmpblue, res)
        R = re.findall(cmpred, res)
        date.append(D)
        blueball.append(B)
        redball.append(R)
        return date, redball, blueball

測試執行:

爬取第一頁的資訊

對比一下頁面的資訊

算是成功了

不過看著第二個雜亂的列表,還是想說,後處理真的好麻煩QAQ

後續工作,可能還是需要想一下怎麼樣去寫一個好的正則表示式才能讓輸出列表的可讀性更強吧

補:(後處理)qwq:

def washdata(date, redball, blueball):
    tmp = []
    D = []
    B = []
    R = []
    for i in xrange(len(date)):
        for j in xrange(len(date[i])):
            D.append(date[i][j])
            B.append(blueball[i][j])
        for j in xrange(len(redball[i])):
            tmp.append(redball[i][j])
    m = 0
    while m != len(tmp):
        R.append(tmp[m:m+6])
        m += 6
    return D, R, B

def writefile(date, redball, blueball):
    with open('Lottery.csv', 'wb') as csvFile:
        writer = csv.writer(csvFile)
        fileheader = ['Date', 'RedBall#0', 'RedBall#1', 'RedBall#2', 'RedBall#3', \
                        'RedBall#4', 'RedBall#5','BlueBall']
        writer.writerow(fileheader)
        for i in xrange(len(date)):
            writer.writerow([date[i], redball[i][0], redball[i][1], \
             redball[i][2], redball[i][3], redball[i][4], redball[i][5], \
             blueball[i]])

處理效果:

起碼能看了qwq

總結一下:
那個時候會xpath就好了哈哈哈哈哈哈哈

使用Python對雙色球號碼進行爬取

使用Python福彩官網對雙色球進行爬取很久之前寫的一個小爬蟲，程式碼其實有點冗雜，看官姥爺們如果有什麼可以指點的地方，儘量拍，謝謝~ 一點一點加油吧觀察一下除了第一頁之外其他頁面的索引可以用index_+num來實現得出程式碼

使用Python生成雙色球號碼

ces str port int blog 字符串 dom join print 說來也是巧，今天和一個朋友聊天，說他運氣不錯應該買彩票，於是就想到了雙色球的規則，就寫了幾行代碼產生雙色球號碼，代碼如下： import random,time def process_in

Python爬取雙色球資料進行分析

突發奇想，是否可以從雙色球的歷史資訊中分析出現次數最多的組合，那就從1+1的組合開始分析，嘿嘿，經常中這種組合也挺不錯哦！現在我們開始獲取資料，應該從中彩網的爬取資料比較靠譜，下面是指令碼。 # -*- coding:utf-8 -*- import re

python雙色球號碼最大連開統計

not lis 數字字典出現 pen split() nodes adl q1：雙色球紅球33個裏面任意選1個共33個，看哪個號最近連開的最久統計出來雙色球往期記錄ssq.txt ===================== 2017093 7 7 9 15 22 27

隨機生成雙色球號碼和商品管理python程式

1、寫一個程式，輸入N就產生N條雙色球號碼紅球 6 01-33 藍球 1 01-16 產生的雙色球號碼不能重複，寫到一個檔案裡面，每一行是一條紅球： 01 03 05 07 08 18 藍球：16 紅球需要排序，是升序 2、寫一個商品管理的程式： 1、新增商品商品名稱：商品已經存在的話，要提示商品價

對雙色球結果預測的一次無聊的嘗試

name int sin 使用 unpack atp shuffle sta edge 今天晚上突然腦子不知怎麽的，本來正在人工給12306驗證碼做打標工作，突然想看看雙色球每期的開獎結果是否有規律從這裏下載從03年到今年的每期雙色球開獎結果用t-SNE降維到3維打

python3 - 寫一個生成雙色球號碼的一個程序，生成的號碼寫到文件裏面

PE red spa apple 去重復 lis enc encoding ica 寫一個生成雙色球號碼的一個程序，生成的號碼寫到文件裏面 # 中獎號碼由6個紅色球號碼和1個藍色球號碼組成 # 籃球範圍：01-16 # 紅球範圍：01-33 de

我用Python把雙色球的網站“黑”了！下個1.5億大獎會是我嗎？

本篇主要介紹爬取500彩票網，獲取所有雙色球的開獎結果，寫入到csv檔案。 (1) 分析標題通過分析，發現標題資訊在如下地方顯示：進群：548377875 即可獲取

用python程式設計雙色球彩票系統（改良）

# author : momo ''' 開始遊戲之後，請使用者輸入投入的金額，使用者可以選擇購買彩票的張數，一張彩票是兩塊錢，當金額不足時，可以提示使用者繼續投入金額，若使用者拒絕投入，則退出遊戲。此時系統可以隨機產生一組資料，一組彩票資料有六位數，這六位數的的取值範圍是0和1。若金額充足，

用python程式設計雙色球系統

# author : momo ''' 寫一個雙色球彩票系統，系統可以隨機產生一組資料，一組彩票資料有六位數，這六位數的的取值範圍是0和1。一張彩票是兩塊錢，可以設定使用者的金額，使用者可以選擇繼續買票或者是退出。買票和退出的時候要求列印剩餘金額。使用者輸入猜測的資料，若是猜對，則列印”恭喜你中

Python模擬雙色球開獎

1.需要先引用random import random #定義一個列表在1,33之間 ball_list=list(range(1,34)); #從1,33之間取出來6個數 red_ball_list=random.sample(ball_list,6) re

基於python的雙色球程式

import random a=random.randint(1,33) b=random.randint(1,33) c=random.randint(1,33) d=random.randint(1,33) e=random.randint(1,33) f=random

網頁版雙色球號碼生成工具

注：需要自己新增和修改jquery.js的引用路徑。 <!doctype html> <html> <head> <meta charset="utf-8"> <style> .red_ball{ width

Python之雙色球選購和三級菜單問題

設置狀態 oos googl side key值 google n) 網易 1：雙色球選購# 1 雙色球（假設一共八個球，6個紅球，球號1-32、2個藍球，球號1-16）# 2 確保用戶不能重復選擇，不能超出範圍# 3 用戶輸入有誤時有相應的錯誤提示# 4 最後展示用戶選

python-對貓眼網的top100的爬取

python我從今年過年開始自學，斷斷續續的，最近參加了一個爬蟲訓練營，我發現爬蟲對開始學習python是非常合適的，只不過首先得具備一些HTML的知識儲備，畢竟爬蟲是需要解析網頁的。而且爬蟲實現後的成就感是非常巨大的。所以，根據上週學習的一些知識，做一個小的總結。首先需要安裝requ

通過Python對各個頁面連結的有效爬取

前面提到過關於某一頁資訊的如何爬取，但是我想爬取在下一頁面的資訊怎麼爬取？我不能通過開啟下一頁，然後獲取下一頁的網址在通過python爬取吧，這樣就和爬取第一頁沒有什麼區別了。有沒有辦法直接爬取下一頁的連結然後get到你獲取的url在爬取資訊呢？剛開始我想到用正則表示式

Python爬取彩票雙色球並存到把數據excel表格裏

python 爬蟲環境：python3目的：爬取15年的雙色球開獎號以及期數和開獎日期：上代碼#!/usr/bin/env python3 #-*-coding:utf-8-*- # @Author : 杜文濤 # @Time : 2018/4/19 16:01 # @File : c

python+requests+ 爬取官網雙色球開獎資料

python+requests+mysql 爬取官網雙色球開獎資料分析網頁資料獲取方式第一種查詢方式第二種查詢方式注意：連結直接點過去的話是看不到任何東西的，服務端應該設定了某種 Referrer Policy 這個坑困擾了我有一陣剛入坑pyt

python爬取雙色球資料+資料統計

彩票資料爬去---寫入mysql： import requests import re#python中的正

java基礎知識應用--雙色球開獎號碼

雙色球開獎 java基礎開獎號碼 public 　　雙色球是中國福利彩票的玩法，雙色球分為紅色球號碼區和藍色球號碼區，紅色球號碼區由1-33共３３個號碼組成，藍色球號碼區由1-16共１６個號碼組成，開獎號碼由6個不重復的紅色球號碼和1個藍色球號碼共７個數組成。　　首先要設置三個數組來分別保存

使用Python對雙色球號碼進行爬取

使用Python福彩官網對雙色球進行爬取

很久之前寫的一個小爬蟲，程式碼其實有點冗雜，看官姥爺們如果有什麼可以指點的地方，儘量拍，謝謝~

一點一點加油吧

相關推薦