python 信息收集器和CMS識別腳本

阿新 • • 發佈：2018-05-19

name beautiful https all mage jpg st2 host family

技術分享圖片

前言：

信息收集是滲透測試重要的一部分

這次我總結了前幾次寫的經驗，將其

進化了一下

正文：

信息收集腳本的功能：

1.端口掃描

2.子域名挖掘

3.DNS查詢

4.whois查詢

5.旁站查詢

CMS識別腳本功能：

1.MD5識別CMS

2.URL識別CMS

原理：cms識別CMS將網站加一些CMS特有的路徑獲取到的源碼

加密成md5與data.json對比如果是就是此種CMS。

URL+上CMS特有的路徑，獲取源碼從中尋找data.json裏的

re標簽。如果有就是此種CMS

信息收集腳本代碼：

import requests
 
import re
import socket
from bs4 import BeautifulSoup
import optparse

def main():
    parser=optparse.OptionParser()
    parser.add_option(‘-p‘,dest=‘host‘,help=‘ip port scanner‘)
    parser.add_option(‘-w‘,dest=‘whois‘,help=‘Whois query‘)
    parser.add_option(‘-d‘,dest=‘dns‘,help=‘dns query 
‘)
    parser.add_option(‘-z‘,dest=‘domain‘,help=‘Domain name query‘)
    parser.add_option(‘-f‘,dest=‘fw‘,help=‘Bypass query‘)
    (options,args)=parser.parse_args()
    if options.host:
        ip=options.host
        portscanner(ip)
    elif options.whois:
        ws=options.whois
        whois(ws)
     
elif options.dns:
        dn=options.dns
        dnsquery(dn)
    elif options.domain:
        domain=options.domain
        domains(domain)
    elif options.fw:
        pz=options.fw
        bypass(pz)
    else:
        parser.print_help()
        exit()
def portscanner(ip):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    socket.setdefaulttimeout(1)
    for port in range(1,65535):
        try:
            s.connect((ip,port))
            print(‘[+]‘,ip,‘:‘,port,‘open‘)
        except:
            pass

def whois(ws):
    url = "http://whoissoft.com/{}".format(ws)
    rest = requests.get(url=url)
    csd = rest.content.decode(‘utf-8‘)
    fsd = BeautifulSoup(csd, ‘html.parser‘)
    wsd = fsd.get_text()
    comp = re.compile(
        r‘a:link, a:visited {.*? }|a:hover {.*?}|white-space: .*?;|font-family:.*?;|function\s+s|window.location.href\s+=\s+".*?"|return\s+false;| var _sedoq\s+=\s+_sedoq|_sedoq.partnerid\s+=\s+‘‘316085‘‘;| _sedoq.locale\s+=\s+‘‘zh-cn‘‘;|var\s+s\s+=\s+document.createElement|s.type\s+=\s+‘‘text/javascript‘‘;|s.async\s+=\s+true;|s.src\s+=\s+‘‘.*?‘‘;|var\s+f\s+=\s+document.getElementsByTagName|f.parentNode.insertBefore|/.*?/|pre\s+{|word-wrap:\s+break-word;|}|\s*\(str1\){|\s+\+\s+str1;|\s+\|\s+\|\|\s+{;|\s+\|\|\s+{;|_sedoq.partnerid|\s+=|‘‘316085‘‘|\s+‘‘;|\s+enter\s+your\s+partner\s+id|_sedoq.locale\s+=\s+|zh-cn|language\s+locale|\(function\(\)\s+{|\[0\];|s.type|text/javascript|script|s,\s+f|document.getElementById\(.*?\)|.style.marginLeft|=window|\|\||\s+{|;|en-us,|en-uk,|de-de,|es-er-fr,|pt-br,|\s+.innerWidth2|es-|er-|fr|.innerWidth2|er|-,‘)
    tih = re.sub(comp, "", wsd)
    wrs = open(‘whois.txt‘, ‘w‘)
    wrs.write(tih)
    wrs.close()
    wrr = open(‘whois.txt‘, ‘r‘)
    rr = wrr.read()
    xin = rr.replace("‘‘", ‘‘)
    xin2 = xin.replace("(", ‘‘)
    xin3 = xin2.replace(")", ‘‘)
    xin4 = xin3.replace("er-,", ‘‘)
    xin5 = xin4.replace(‘.innWidth2+"px"‘, ‘‘)
    xin6 = xin5.replace(‘window.onresize=function{‘, ‘‘)
    xin7 = xin6.replace(‘.innWidth2+"px"‘, ‘‘)
    print(xin7, end=‘‘)
def dnsquery(dn):
    url = "https://jiexifenxi.51240.com/web_system/51240_com_www/system/file/jiexifenxi/get/?ajaxtimestamp=1526175925753"
    headers = {
        ‘user-agent‘: ‘Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16‘}
    params = {‘q‘: ‘{}‘.format(dn), ‘type‘: ‘a‘}
    reqst = requests.post(url=url, headers=headers, params=params)
    content = reqst.content.decode(‘utf-8‘)
    bd = BeautifulSoup(content, ‘html.parser‘)

    print(‘---[+]A record---‘)
    print(bd.get_text())

    print(‘---[+]MX record---‘)
    params2 = {‘q‘: ‘{}‘.format(dn), ‘type‘: ‘mx‘}
    rest = requests.post(url=url, headers=headers, params=params2)
    content2 = BeautifulSoup(rest.content.decode(‘utf-8‘), ‘html.parser‘)
    print(content2.get_text())

    print(‘---[+]CNAME record---‘)
    params3 = {‘q‘: ‘{}‘.format(dn), ‘type‘: ‘cname‘}
    rest2 = requests.post(url=url, headers=headers, params=params3)
    content3 = BeautifulSoup(rest2.content.decode(‘utf-8‘), ‘html.parser‘)
    print(content3.get_text())

    print(‘---[+]NS record---‘)
    params4 = {‘q‘: ‘{}‘.format(dn), ‘type‘: ‘ns‘}
    rest3 = requests.post(url=url, headers=headers, params=params4)
    content4 = BeautifulSoup(rest3.content.decode(‘utf-8‘), ‘html.parser‘)
    print(content4.get_text())

    print(‘---[+]TXT record---‘)
    params5 = {‘q‘: ‘{}‘.format(dn), ‘type‘: ‘txt‘}
    rest4 = requests.post(url=url, headers=headers, params=params5)
    content5 = BeautifulSoup(rest4.content.decode(‘utf-8‘), ‘html.parser‘)
    print(content5.get_text())

def domains(domain):
    print(‘---[+]Domain name query---‘)
    url = "http://i.links.cn/subdomain/"
    headers = {‘user-agent‘: ‘Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16‘}
    params = {‘domain‘: ‘{}‘.format(domain), ‘b2‘: ‘1‘, ‘b3‘: ‘1‘, ‘b4‘: ‘1‘}
    reqst = requests.post(url=url, headers=headers, params=params)
    vd = reqst.content.decode(‘gbk‘)
    rw = re.findall(‘<div class=domain><input type=hidden name=.*? id=.*? value=".*?">‘, vd)
    rw2 = "".join(str(rw))
    bwdw = BeautifulSoup(str(rw2), ‘html.parser‘)
    pw = bwdw.find_all(‘input‘)
    for l in pw:
        isd = l.get("value")
        print(isd)

def bypass(pz):
    url = "http://www.webscan.cc/?action=query&ip={}".format(pz)
    headers = {
        ‘user-agent‘: ‘Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16‘}
    wd = requests.get(url=url, headers=headers)
    rcy = wd.content.decode(‘utf-8‘)
    res = re.findall(‘"domain":".*?"‘, str(rcy))
    lis = "".join(res)
    rmm = lis.replace(‘"‘, ‘‘)
    rmm2 = rmm.replace(‘:‘, ‘‘)
    rmm3 = rmm2.replace(‘/‘, ‘‘)
    rmm4 = rmm3.replace(‘domain‘, ‘‘)
    rmm5 = rmm4.replace(‘http‘, ‘‘)
    print(rmm5)

if __name__ == ‘__main__‘:
    main()

運行測試：

技術分享圖片

CMS腳本代碼：

import requests
import json
import hashlib
import os
import optparse
def main():
    usage="[-q MD5DE-CMS] "           "[- p URL gets CMS]"
    parser=optparse.OptionParser(usage)
    parser.add_option(‘-q‘,dest=‘md5‘,help=‘md5 cms‘)
    parser.add_option(‘-p‘,dest=‘url‘,help=‘url cms‘)
    (options,args)=parser.parse_args()
    if options.md5:
        log=options.md5
        panduan(log)
    elif options.url:
        log2=options.url
        panduan2(log2)
    else:
        parser.print_help()


def op():
    global lr
    if os.path.exists(‘data.json‘):
        print(‘[+]Existing data.json file‘)
        js=open(‘data.json‘,‘r‘)
        lr=json.load(js,encoding=‘utf-8‘)
    else:
        print(‘[-]Not data.json‘)
        exit()

op()

def panduan(log):
    global headers
    headers={‘user-agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36‘}
    for b in lr:
        url = log.rstrip(‘/‘) + b["url"]
        rest = requests.get(url=url, headers=headers, timeout=5)
        text = rest.text
        if rest.status_code != 200:
            print(‘[-]Not Found 200‘, rest.url)
        md5=hashlib.md5()
        md5.update(text.encode(‘utf-8‘))
        g=md5.hexdigest()
        print(g)
        if g == b["md5"]:
            print("[+]CMS:",b["name"],"url:",b["url"])
            print("[+]CMS:",b["name"],"url:",b["url"],file=open(‘cms.txt‘,‘w‘))
        else:
            print(‘[-]not md5:‘,b["md5"])



def panduan2(log2):
    for w in lr:
      headers = {‘user-agent‘: ‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36‘}
      url = log2.rstrip(‘/‘) + w["url"]
      rest=requests.get(url=url,headers=headers,timeout=5)
      text=rest.text
      if rest.status_code !=200:
          pass
      if w["re"]:
          if(text.find(w["re"]) != -1):
              print(‘[+]CMS:‘,w["name"],"url:",w["url"])
              print(‘[+]CMS:‘, w["name"], "url:", w["url"],file=open(‘cms.txt‘,‘w‘))

if __name__ == ‘__main__‘:
    main()

識別測試：

技術分享圖片

python 信息收集器和CMS識別腳本

name beautiful https all mage jpg st2 host family 前言：信息收集是滲透測試重要的一部分這次我總結了前幾次寫的經驗，將其進化了一下正文：信息收集腳本的功能： 1.端口掃描 2.子域名挖掘 3.D

G1垃圾收集器和CMS垃圾收集器 (http://mm.fancymore.com/reading/G1-CMS%E5%9E%83%E5%9C%BE%E7%AE%97%E6%B3%95.html#toc_8)

異常了解訪問標識 2.6 響應時間 ads sco 方法參考來源 JVM 體系架構堆/棧的內存分配靜態和非靜態方法的內存分配 CMS 回收算法應用場景 CMS 垃圾收集階段劃分(Collection Phases) CMS什麽時候啟動 CMS缺點

(轉)IBM AIX系統硬件信息查看命令（shell腳本）

容量 sed proc back 采集模式 lex std lsp IBM AIX系統硬件信息查看命令（shell腳本）原文：http://blog.itpub.net/22085031/viewspace-1054015/ 查看IBM AIX系統的主機型號、序列號、C

信息安全比賽殺進程腳本

殺進程 Python 比賽已經結束，放出來吧保護原有進程，殺死新起來的進程#-*- coding:utf-8 -*- #2018-01-17 #by-duwentao #version:python 2.7.9 #python2.6.6也可以使用 import os import signal p

MSF魔鬼訓練營-3.1.1信息收集-通過DNS和IP地址挖掘目標網絡信息

詳細 root https earch 滲透測試出發 .com 域名查詢測試情報搜集環境站滲透測試全過程的80%~90% 一、外圍信息搜集（公開渠道信息搜集OSINT open source intelligence） 3.1.1信息收集-通過DNS和IP地址挖

oracle 12c 關閉統計信息收集和啟用統計信息收集

ces dba gin enable cti ucc space 收集 pre oracle 12c 關閉統計信息收集和啟用統計信息收集 --關閉統計信息 col client_name for a60 select client_name,status from DBA_

JAVAEE——BOS物流項目03：學習計劃、messager、menubutton、登陸攔截器、信息校驗和取派員添加功能

cts 跳轉 pre bmi 添加管理分區 esp protected 登錄頁面 1 學習計劃 1、jQuery easyUI messager使用方式 n alert方法 n confirm方法 n show方法 2、jQuery easyUI menubutton使用

JVM-如何判斷物件存活與否與CMS收集器和G1收集器的區別

JVM如何判斷物件存活？ 1、計數器 2、可達性分析（很多主流語言採用這種方法來判斷物件是否存活）計數器：每當有一個地方引用該物件時，計數器 +1；引用失效則 -1；優點：實現簡單，判定效率高。缺點：難解決物件間的相互迴圈引用問題。

iOS 關於圖片地理位置隱私信息的分析和讀取

img control res 位置信息 log mutable hone tro art 今天突然想到微信朋友圈發照片，涉及個人隱私的地理位置是否外泄。由於iphone拍照的照片都會帶有地理位置等信息。我們先來實現怎麽讀取裏面的安全信息。然後再來分析 #import

域名信息收集

信息https://whois.cndns.com/本文出自 “simeon技術專欄” 博客，請務必保留此出處http://simeon.blog.51cto.com/18680/1926027域名信息收集

js實現表格信息的刪除和添加

nbsp tag col cti 刪除 center 選項 func onclick <!DOCTYPE html> <html> <head> <title> new document </title>

Oracle執行計劃突變診斷之統計信息收集問題

oracle 統計信息鎖定執行計劃突變 Oracle執行計劃突變診斷之統計信息收集問題1. 情形描述DB version：11.2.0.4WITH SQL1 AS (SELECT LAC, CI, TO_NUMBER(C.LONGITUDE) LONGIT

Kali 滲透測試- 全主動信息收集-發現

主動信息收集╋━━━━━━━━━━━━━━━━━━━━━╋┃主動信息收集 ┃┃無法避免留下訪問的痕跡 ┃┃使用受控的第三方電腦進行探測 ┃ ┃ 使用代理或已經被控制的主機

面向對象----信息的封裝和隱藏

sys align radi 什麽 -- 方式 ima tag 修改信息的封裝和隱藏信息封裝和隱藏的必要性使用者對類內部定義的屬性(對象的成員變量)的直接操作會導致數據的錯誤、混亂或安全性問題。(version1) 1 public class Animal

信息的組織和提取

pil del 分享 asi rec als no tag str req 1.信息的三種類型。’ 1.1 XML 2.JSON 3.YAML 三種信息的比較： 2.信息的提取 import requestsr = requests.get("http:

SQL Server統計信息：問題和解決方式

二次就會數據庫引擎目的獲得差異 product primary tex 在網上看到一篇介紹使用統計信息出現的問題已經解決方式，感覺寫的很全面。在自己看的過程中順便做了翻譯。因為本人英文水平有限，可能中間有一些錯誤。假設有哪裏有問題歡迎大家批評指正。建議英文

0x01.被動信息收集

mcg 正常 cmd nslookup free found 垃圾郵件 when 搭建被動信息收集基於公開渠道，不與目標系統產生直接交互，盡量避免留下痕跡（不進行大量掃描，正常交互範圍）信息收集內容 IP段域名郵件地址（定位郵件服務器，分為個人搭建和公網

主動信息收集-發現（四）

信息安全；security+；╋━━━━━━━━━━━━━━━━━━━━╋┃發現-----四層發現 ┃ ┃ 優點 ┃┃ 可路由且結果可靠 ┃┃ 不

信息收集之DNS信息收集 -- dnsenum

域名信息收集 dnsenum 滲透思路dnsenum 由perl編寫的一款多線程的、可指定DNS服務器、支持域名爆破、支持不同網速情況下的工具調優、結果可導入到其他工具中使用的一款DNS信息收集工具。（網上大佬們都說可以用來查不連續的IP段，這是在說什麽呢？現在還沒有相關的認知，求解答）語法: dnse

Kali滲透(二)之被動信息收集——DNS字典爆破

dns字典爆破信息收集 kali DNS字典爆破什麽是字典爆破呢？就是用大量的數據去一個一個嘗試出正確的數據或你想得到的數據。密碼字典裏存放的是密碼，而DNS字典裏存放的是大量的域名記錄: bbs. www. mail. 數十乃至數萬個。我們用這個字典去進行DNS查詢，如果有，那麽服務器就會返回

python 信息收集器和CMS識別腳本

相關推薦