2018年5月3日筆記

阿新 • • 發佈：2018-05-05

表達 pst .text mkdir html str fin 字符串文件

常用的正則表達式匹配規則

\d　　表示一個數字字符，等價於 [0-9]

\D　　表示一個非數字字符，等價於 [^\d]

\s　　表示一個空白字符，等價於 [<空格>\t\r\n\f\v]

\S　　表示一個非空白字符，等價於 [^\s]
\w　　表示一個單詞字符(數字或字母)，等價於 [A-Za-z0-9_]
\W　　表示一個非單詞字符，等價於 [^\w]
.　　　匹配除換行符\n之外的任意一個字符

.*　　在一行內，貪婪(盡可能多)匹配任意個字符

.*?　　在一行內，非貪婪(盡可能少)匹配任意個字符

(?P<name>pattern) 和 (P=name)　　用來多次匹配同一模式的字符串，pattern

為匹配該模式的正則表達式

習題1：（爬蟲）獲取網頁內容中的skuid字段和對應圖片

 1 # 爬蟲：獲取網頁內容中的skuid字段和對應圖片
 2 import re
 3 import requests
 4 
 5 url = "http://qwd.jd.com/fcgi-bin/qwd_searchitem_ex?skuid=26878432382%7C1658610413%7C26222795271%7C25168000024%7C11731514723%7C26348513019%7C20000220615%7C4813030%7C25965247088%7C5327182%7C19588651151%7C1780924%7C15495544751%7C10114188069%7C27036535156%7C10123099847%7C26016197600%7C10503200866%7C16675691362%7C15904713681 
"
 6 
 7 session = request.session()
 8 r = session.get(url)
 9 html = r.text
10 
11 reg = re.compile(r"\"skuid\":\"(\d+)\",\s+\"\S+\s+\"skuurl\"\S+\s+\"skuimgurl\":\"(\S+)\",")
12 result = reg.findall(html)
13 print(result)

習題2：將指定文件中的每個Upstream和Location都保存為一個文件

　　　　備註：先在regex101網站上，將相應的正則表達式寫正確，然後再寫python代碼

匹配upstream的正則表達式如下：

技術分享圖片

匹配location的正則表達式如下：

技術分享圖片

python代碼如下：

 1 import codecs
 2 import re
 3 import os
 4 
 5 regUpstream =re.compile(r"\s*(upstream\s+(\S+)\s+{[^}]+})")
 6 with codecs.open("ga10.txt") as fu:
 7     textUpstream = regUpstream.findall(fu.read())
 8     if not os.path.exists("upstream"):
 9         os.mkdir("upstream")
10     os.chdir("upstream")
11     for item in textUpstream:
12         with codecs.open(item[1], "w") as fw:
13             fw.write(item[0])
14     os.chdir("..")
15 
16 
17 regLocation = re.compile(r"\s*(location\s+/(\S+)/\s+{[^}]+})")
18 with codecs.open("ga10.txt") as fl:
19     textLocation = regLocation.findall(fl.read())
20     if not os.path.exists("location"):
21         os.mkdir("location")
22     os.chdir("location")
23     for item in textLocation:
24         file = item[1] + ".location.conf"
25         with codecs.open(file, "w") as fw2:
26             fw2.write(item[0])

2018年5月3日筆記

表達 pst .text mkdir html str fin 字符串文件常用的正則表達式匹配規則 \d　　表示一個數字字符，等價於 [0-9] \D　　表示一個非數字字符，等價於 [^\d] \s　　表示一個空白字符，等價於 [<空格>\t\r\n\f

spring boot 基礎 2018年5月3日

plugins pri info out configure www read ping mapping 主包下運行類@SpringBootApplication 此註解是核心註解，源碼如下 @Target({ElementType.TYPE}) @Retention

2018年5月8日筆記

grep 字節 width RoCE system ID 字符串類型工作 abs CentOS 7上安裝mysql # CentOS 7 安裝mysql 1. 檢測系統是否自帶安裝 mysql rpm -qa | grep mysql 2. 若已安裝，可以進行卸

2018年5月10日筆記

conn imp key port 學生但是 not oot mysql 在Python中如何表示數據庫表方法一：由於數據庫表是一個二維表，所以可用list表示多行，list的每個元素是tuple，表示一行記錄如：有一張學生信息表，包含學生的學號，姓名，年齡，可表

2018年5月13日筆記

class leg 刪除 pass ota pan where ide maker SQL語句復習創建一個庫 create database DB_name; 授權一個用戶 grant all privileges on *.* to ‘user1‘@‘%‘ ide

2018年5月17日筆記

最大返回值 onf delete 常用操作 all 描述 app 筆記 python操作redis set操作 sadd(name, values)　　增加 scard(name)　　　　獲取 spop(name)　　　　刪除並返回set中的一個隨機元素 srem(n

2018年5月19日筆記

共享內存 main 多核cpu 需要 target 創建 uil out lease 進程的概念進程是程序在計算機上的一次執行活動。進程可分為系統進程和用戶進程。所有正在運行的進程輪流使用CPU，任何一個時間點有且只有一個進程占用CPU。進程與線程的區

2018年5月22日筆記

req 阻塞 OS rom ron fun star 因此 -- Python共享內存共享內存有兩個結構，一個是 Value, 一個是 Array，這兩個結構內部都實現了鎖機制，因此是多進程安全的。 Value 和 Array 都需要設置其中存放值的類型，d 是 do

2018年5月26日筆記

tin eas 配置 sel utc zone result config AS 習題1 先在utils.py文件中定義一個工具類 1 # utils.py 2 3 import os 4 import threading 5 import codecs

2018年7月3日筆記

ken print app util highstate unless 存在 names ast state 　　1）state介紹 state是saltstack最核心的功能，通過預先指定好的sls文件對minion進行狀態管理，支持pkg， file， networ

華為機試（2018年5月3日）

第一題： C++程式：#include<iostream> #include<string> using namespace std; void main() { string str,

距離矢量路由協議以及鏈路狀態路由協議（2018年1月3日 09:09:15）

靈活矢量路由協議園區訪問邊界建議 stat 幫助 post 距離矢量路由協議以及鏈路狀態路由協議 -------------------- 靜態路由通過（NQA 思科叫SLA） -----服務級別協定建議使用靜態的情況：園區網邊界默認路由（缺省路由）靜

2018年4月10日筆記

統計輸入 ima info mage 情況中文字符串哈哈習題求階乘 Python的編碼常見的支持中文的編碼有：utf-8 , gbk , gb2312 常見術語：decode(解碼) ， encode(編碼) 在Python2中，不寫python代碼擡頭，在p

2018年4月14日筆記

生成 gen ever yield com 分享高階函數 iter tor 函數關鍵字 def　　函數聲明 return　　返回值 pass　　略過，啥也不幹 exit(1)　　直接退出高階函數：可接收另一個函數作為參數的函數常用的高階函數有： map(

2018年4月19日筆記

基類型號查找參數字母 pass DC super clas 類的概念與聲明類(class)：用來描述具有相同屬性和方法的對象的集合。一個類定義了該集合中每個對象所共有的屬性和方法。對象是類的實例(instance)。聲明一個類的一般形式如下：　　c

2018年4月26日筆記

關系 run 用法示例 a+b += .get 是否 hashlib 16進制內置模塊：hashlib Python的hashlib提供了常見的摘要算法，如md5，sha1, sha224, sha256, sha384, sha512等等，其中md5最為常用。什麽

2018年4月28日筆記

you 替換其他 pytho HERE art group 結果圖片正則表達式數量詞的貪婪模式與非貪婪模式 Python中數量詞默認是貪婪的，總是嘗試匹配盡可能多的字符例如，正則表達式 "ab*" 如果用於查找 "abbbc"，將匹配到 "abb

2018年5月6日GDCPC (廣東賽區)總結

公式都沒有省賽好好學習過程方法 AC 2018年開始試機是隊友浩哥一個人去的，因為覺得華工去了不少次了，環境也比較熟悉了。直到看到了現場環境，感覺有些擁擠，不如從前那樣寬敞，增加了一些緊張的不適感。比賽開始時，我們三人分頭讀題，雖說題目比較簡短，但第一眼看

2018年5月7日

color HA char sch oid 升序 read lse seq 028統計出數組中的各個字符的個數 1 import java.io.*; 2 public class StatisticsChar 3 { 4 public sta

2018年5月9日JAVA-servlet02

127.0.0.1 超過即使 ddc spa 比較寫入方便 void session對象用於在會話範圍內，記錄每個客戶端的訪問狀態，以便於跟蹤每個客戶端的操作狀態，在會話存儲的信息，在瀏覽器發出後續請求時可以獲取這些會話的有效數據。在jsp頁面中可以直接使用s

2018年5月3日筆記

相關推薦