python爬取網易雲音樂歌單音樂

阿新 • • 發佈：2017-05-14

string attrs default textarea bsp color read contents dom

在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/

依次第二頁：http://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset=35

依次第三頁：http://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset=70

然後從歌單的查看框架的源代碼：

技術分享

從圖中的源代碼可以得到每個歌單的url:eg:http://music.163.com/#/playlist?id=696806036

然後相應的歌單頁面中可以得到歌單中每首歌的名字和歌手：

然後歌名歌手，在百度音樂搜索api接口獲得songid，api是url = "http://sug.music.baidu.com/info/suggestion"

截圖來自：貼吧

技術分享

然後從獲取到的songid從百度音樂免費API接口：http://music.baidu.com/data/music/fmlink，獲取songLink進行下載，並且將songLink保存到本地.flac

eg；http://music.baidu.com/data/music/fmlink?rate=320&songIds=242078437&type=flac


下載結果：

技術分享

代碼：

# -*- coding: utf-8 -*-
import re
import urllib
import urllib2
import os
import stat
import itertools
import re
import sys
import requests
import json
import time
import socket
import urlparse
import csv
import random
from datetime import datetime, timedelta
import lxml.html

from zipfile import 
 ZipFile
from StringIO import StringIO
from downloader import Downloader
from bs4 import BeautifulSoup
from HTMLParser import HTMLParser
from itertools import product
import sys
reload(sys)
sys.setdefaultencoding(‘utf8‘)
URL = ‘http://music.163.com‘
NUM = 5
def download(url, user_agent=‘wswp‘, num_try=2):

    headers = {‘User_agent‘: user_agent}
    request = urllib2.Request(url, headers=headers)
    try:
        html = urllib2.urlopen(request).read()
    except urllib2.URLError as e:
        print ‘Download error‘, e.reason
        html = None
        if num_try > 0:
            if hasattr(e, ‘code‘) and 500 <= e.code < 600:
                return download(url, user_agent, num_try - 1)
    return html


def get_song_list(url):
    html = download(url)
    res = r‘<ul class="f-hide">(.*?)</ul>‘
    mm = re.findall(res,html,re.S | re.M)
    #print mm
    res = r‘<li><a .*?>(.*?)</a></li>‘
    song_list = re.findall(res, html,re.S | re.M)
    return song_list

#獲取網易雲歌單 eg:/playlist?id=706469943
def get_play_list(html):
    soup = BeautifulSoup(html, "html.parser")
    results = soup.find_all(name=‘a‘, attrs={‘class‘: ‘tit f-thide s-fc0‘})
    list = []
    for each in results:
        ee = each.get(‘href‘)
        list.append(ee)
    return list

def download_music(url, song_name):
    print "Downloading song_name:" + song_name
    path = "songs"
    if not os.path.isdir(path):
        os.mkdir(path)
    f = open(path + ‘/‘ + song_name + ‘.flac‘, ‘wb‘)
    f.write(download(url))
    f.close()

def download_song(song_name,singer):

    url = "http://sug.music.baidu.com/info/suggestion"
    #百度音樂搜索獲得songid
    mess = song_name + singer
    payload = {‘word‘: mess, ‘version‘: ‘2.1.1‘, ‘from‘: ‘0‘}
    r = requests.get(url, params=payload)
    contents = r.text
    d = json.loads(contents, encoding="utf-8")
    #print d
    if (‘data‘ not in d):
        print "do not have flac"
        return 0
    if (‘song‘ not in d["data"]):
        print "do not have flac"
        return 0
    song_id = d["data"]["song"][0]["songid"]

    print "song_id:"+song_id

    url = "http://music.baidu.com/data/music/fmlink" #百度音樂免費api接口
    ‘‘‘
        http://music.baidu.com/data/music/fmlink?rate=320&songIds=242078437&type=&callback=cb_download&_t=1468380564513&format=json
    ‘‘‘
    payload = {‘songIds‘: song_id, ‘type‘: ‘mp3‘}
    r = requests.get(url, params=payload)
    contents = r.text
    try:
        d = json.loads(contents, encoding="utf-8")
    except:
        return 0
    if d is not None and ‘data‘ not in d or d[‘data‘] == ‘‘:
        return 0
    songlink = d["data"]["songList"][0]["songLink"]
    if (len(songlink) < 10):
        print "do not have flac"
        return 0
    print "Song Source: " + songlink
    download_music(songlink,mess)

def get_song_singer(url):
    html = download(url)
    soup = BeautifulSoup(html, "html.parser")
    results = soup.find_all(name=‘textarea‘, attrs={‘style‘: ‘display:none;‘})
    mess = str(results[0])
    tt = len(‘<textarea style="display:none;">‘)
    result = mess[tt:]
    tt = len(‘</textarea>)‘)-1
    resu = result[:-tt]
    list = json.loads(resu, encoding="utf-8")
    singer_list = []
    for each in list:
        singer_list.append(each["artists"][0]["name"])
    return singer_list



if __name__ == ‘__main__‘:

    num = 0
    for flag in range(1,5):
        if flag > 1:
            page = (flag - 1) * 35
            url = ‘http://music.163.com/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset=‘+str(page)
        else:
            url = ‘http://music.163.com/discover/playlist‘
        print url
        html = download(url)
        list = get_play_list(html)
        for i in list:
            song_list_url = URL + i
            print song_list_url
            singer_list = get_song_list(song_list_url)
            singer_name = get_song_singer(song_list_url)
            tt = len(singer_list)
            mm = len(singer_name)
            index = min(tt,mm)
            num = num + mm
            for j in range(0, index):
                print singer_name[j]
                print singer_list[j]
                download_song(singer_list[j],singer_name[j])
                print "\n"

    print "Download " + str(num) + " music\n"

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

我用Python爬取網易雲音樂上的Hip-hop歌單，分析rapper如何押韻

line gone 謠言大致 -i 態度大眾其中當前緣起《中國有嘻哈》這個節目在這個夏天吸引了無數的目光，也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目，它對我的影響也蠻大。這個夏天，我基本都在杭州度過，在上下班的taxi上，我幾乎都在刷這個節目，最後

Python爬取網易雲音樂歌單內所有歌曲

一、目標：下載網易雲音樂熱門歌單二、用到的模組： requests，multiprocessing，re。三、步驟：（1）頁面分析：首先開啟網易雲音樂，選擇熱門歌單，可以看到以下歌單列表，然後開啟開發者工具本人對於Python學習建立了一個小小的學習圈子，為

python爬取網易雲音樂歌曲評論信息

webkit fun 數據包 cond bubuko ret value selenium apple 　　網易雲音樂是廣大網友喜聞樂見的音樂平臺，區別於別的音樂平臺的最大特點，除了“它比我還懂我的音樂喜好”、“小清新的界面設計”就是它獨有的評論區了——————各種故事匯

python爬取網易雲歌單

背景這學期報了一門海量資料處理，在資料處理前需要爬取一些內容。所以做了一個小練習，爬取網易雲的歌單。其中包括歌單名稱，播放量和url地址。網易雲還是具有一些反爬措施的，這裡主要說以下幾個方面以及我的應對措施。無法直接訪問我沒有實踐過直接訪問網易雲音樂

python爬取網易雲音樂資料

1.首先匯入2個第三方庫，json庫是標準庫，用到的有Requests庫，Beautisoup庫，json庫 2.分析網站，當然是f12 開發者工具了，firefox瀏覽器的開發者工具個人用著比chrome的好用一點。用開發者工具之前要先明白你要找什麼資料，我想抓取的是霹靂布袋戲的

python爬取網易雲音樂，python下載網易雲音樂

import requests import time import os from urllib import request from bs4 import BeautifulSoup import urllib class Wy: page = 0 wymusic = {}

用python爬取網易雲音樂，新手看了也能操作

今天小編帶大家一起來利用Python爬取網易雲音樂，分分鐘將網站上的音樂down到本地。跟著小編執行過程式碼的筒子們將網易雲歌詞抓取下來已經不再話下了，在抓取歌詞的時候在函式中傳入了歌手ID和歌曲名兩個引數，其實爬取歌曲也是同樣的道理，也需要傳入這兩個引數，只不過網易雲歌曲的

Python爬取網易雲音樂熱門評論

import requests import json def get_hot_comments(res): comments_json = json.loads(res.text) hot_comments = comments_json['hotComm

爬蟲入門——用python爬取網易雲音樂熱門歌手評論數

本文參考Monkey_D_Newdun 的文章用爬蟲獲取網易雲音樂熱門歌手評論數執行平臺：Windows 10IDE：spyderPython版本：3.6瀏覽器：360一、爬蟲基本思路a. 通過URL或者檔案獲取網頁：開啟網頁-F12-找到需要獲取的url，request h

python爬取網易雲音樂評論

前言上篇爬取喜馬拉雅FM音訊的最後也提到過，這回我們爬取的就是網易雲音樂的熱評+評論。本人用了挺久的網易雲，也是非常喜歡…閒話不多說，跟著我的思路來看看如何爬取網易雲的熱評+評論~ 目標本次我們爬取的目標是–網易雲音樂歌曲的熱評以及普通評論我們

python爬取網易雲歌曲資訊及下載連結並簡單展示

我們選取的爬取目標是歌單這一塊兒 chrome瀏覽器 f12抓包經過簡單的解析，拿到歌曲分類名字 create_table_sql = 'create table ’ + i + ‘(id int auto_increment primary key,song_name varch

Python爬取網易雲課堂課程資料

本人對於Python學習建立了一個小小的學習圈子，為各位提供了一個平臺，大家一起來討論學習Python。歡迎各位到來Python學習群：960410445一起討論視訊分享學習。Python是未來的發展方向，正在挑戰我們的分析能力及對世界的認知方式，因此，我們與時俱進，迎接變化，並不斷的成長，

爬取網易雲聽歌排行榜歌單制作雲詞

proc ges ase params 網頁 web api .post 想要最近又到了一年一度的年底總結了，網易雲音樂如此退出了年度歌單，又一次被刷朋友圈了。作為程序員，就好奇的想驗證下結論準不準，隨便回顧下爬蟲的操作。首先，打開網頁版網易雲音樂，登錄成功後，進入自己或

利用python爬取網易雲歌手top50歌曲歌詞

python近年來，發展迅速，成為了最炙手可熱的語言。那麼如何來進行網易雲歌手top50的歌曲歌詞爬取呢 1. 首先進行網易雲並進行喜歡的歌手搜尋如下： 2. 搞清楚了連線的問題之後，就要進行BeautifulSoup對網易進行抓取核心程式碼如下： #e

Python3.7 爬蟲（三）使用 Urllib2 與 BeautifulSoup4 爬取網易雲音樂歌單

廢話在前面的的部落格中我們已經能夠使用 python3 配合自帶的庫或者第三方庫抓取以及解析網頁，我們今天來試試抓取網易雲音樂的歌單資訊分析網頁我們現在來分析網頁點選右側介面中的 Network 進入網路請求分析介面，如下：

如何用Python網絡爬蟲爬取網易雲音樂歌曲

今天 http 分享圖片分享圖片分分鐘參考 down 技術今天小編帶大家一起來利用Python爬取網易雲音樂，分分鐘將網站上的音樂down到本地。跟著小編運行過代碼的筒子們將網易雲歌詞抓取下來已經不再話下了，在抓取歌詞的時候在函數中傳入了歌手ID和歌曲名兩個參數

如何用Python網絡爬蟲爬取網易雲音樂歌詞

網易雲歌詞 Python網絡爬蟲網絡爬蟲前幾天小編給大家分享了數據可視化分析，在文尾提及了網易雲音樂歌詞爬取，今天小編給大家分享網易雲音樂歌詞爬取方法。本文的總體思路如下：找到正確的URL，獲取源碼；利用bs4解析源碼，獲取歌曲名和歌曲ID；調用網易雲歌曲API，獲取歌詞；將歌詞寫入

爬取網易雲音樂所有歌單資訊

可以結合下一篇文章實現歌曲下載 python 爬蟲下載網易歌單歌曲使用 python + requests + lxml + selenium 使用 requests 發起請求，獲取到所有分類的 url 使用 selenium 傳送請求取到

使用python-aiohttp爬取網易雲音樂

通過上文《使用python-aiohttp搭建微信公眾平臺》，我們已經可以響應來自微信伺服器的請求，接下來，我們為公眾號增加一個線上點歌的功能。由於本人平時聽歌用的是網易雲音樂，所以就在網上搜了一下，還真找到不少，再考慮到這裡只需要用到網易雲音樂的關鍵詞搜尋

python爬取網易雲音樂歌單音樂

相關推薦