【運營商大資料】使用者群特徵刻畫
- 人口屬性:年齡、性別、職業、收入、家庭情況
- 產品資訊:套餐分類、檔次
- 使用者行為:本地語音、漫遊語音、使用流量、傳送簡訊
- 補貼資訊:終端補貼、話費補貼
- 應用偏好:線上遊戲、即時通訊、網頁瀏覽、線上視訊
- 渠道偏好:營業廳、網上商城、家電賣場
- 終端資訊:終端品牌、終端價格、作業系統
相關推薦
【運營商大資料】使用者群特徵刻畫
人口屬性:年齡、性別、職業、收入、家庭情況產品資訊:套餐分類、檔次使用者行為:本地語音、漫遊語音、使用流量、傳送簡訊補貼資訊:終端補貼、話費補貼應用偏好:線上遊戲、即時通訊、網頁瀏覽、線上視訊渠
【若澤大資料】生產環境mysql5.6-my.cnf 配置檔案 for linux
配置檔案設定 vi /etc/my.cnf[client]#user=root#password=123456socket=/var/lib/mysql/mysql.sock[mysqld]########basic settings########server-id = 1
【公眾號運營】【大資料】【技術成長】【Vue】【TensorFlow】【Selenium】| Chat · 預告
1 那些激發微信公眾號潛能的操作技巧 作者簡介: 張亞田,Java 、php開發 ,曾參與多個電子商務平臺、網站管理後臺、微網站等的開發,業務需求催生了技術的開發,技術的實踐延展了業務的深度,網際網路的浪潮中,介面化、模組化是趨勢,怎樣在互聯、物聯大勢所趨的場景模式中立於不敗之地,以靜制動、以不變應
【阿里巴巴大資料實踐筆記】第13章:計算管理
計算平臺追求目標:目前內部 MaxCompute 叢集上有 200 多萬個任務,每天儲存資源、計算資源消耗都很大。 如何降低計算資源的消耗,提高任務執行的效能,提升任務產出的時間。 1.系統優化 (1)HBO (History-Based Optimiz町, 基於歷史的優化器
【大資料】Hive作者肯定進修過藍翔挖掘機
正經標題應該是:解決hive初始化mysql資料庫錯誤的一種方式 Hive安裝包下載地址: https://mirrors.tuna.tsinghua.edu.cn/apache/hive/ 事情原因是這樣的,我按照書上的步驟一步一步走,到了該用hiv
【大資料】CentOS6.5安裝mysql5.6(靠譜!)
一、吐槽 我明明是跟著老師寫的書上一步一步來的,到最後出現了一堆錯誤,然後從網上找教程,網上那些人不知道咋想的,啥也往上貼,隨便一篇,除了自己能看懂沒幾個人能看懂的文章就貼到網上了。 &n
【大資料】瞭解Hadoop框架的基礎知識
介紹 此Refcard提供了Apache Hadoop,這是最流行的軟體框架,可使用簡單的高階程式設計模型實現大型資料集的分散式儲存和處理。我們將介紹Hadoop最重要的概念,描述其架構,指導您如何開始使用它以及在Hadoop上編寫和執行各種應用程式。 簡而言之,Hadoop是Apache Softwar
【大資料】HDFS
一、什麼是HDFS HDFS是什麼:HDFS即Hadoop分散式檔案系統(Hadoop Distributed Filesystem),以流式資料訪問模式來儲存超大檔案,運行於商用硬體叢集上,是管理網路中跨多臺計算機儲存的檔案系統。 HDFS不適合用在:要求低時間延遲資料訪問的應
【大資料】什麼是hadoop
一、hadoop簡介 Hadoop是使用Java編寫,允許分佈在叢集,使用簡單的程式設計模型的計算機大型資料集處理的Apache的開源框架。 二、hadoop架構設計 ⑴hadoopcommon hadoop基礎設施模組 ⑵hdfs 分散式檔案系統 ⑶mapreduc
【大資料】DataX介紹
DataX入門 1.DataX 1.1介紹 DataX 是阿里巴巴集團內被廣泛使用的異構資料來源離線同步工具,致力於實現包括關係型資料庫(MySQL、Oracle等)、HDFS、Hive、MaxCompute(原ODPS)、HBase、FTP等各種異構資料來源之間穩定高
【若澤大資料早課】day4--20180913
1、如何判斷一個Linux上的xxx服務是否存活 # ps -ef | grep xxx 檢視程序 2、埠號哪個命令去看看通不通 # telnet 3、檢視Linux的ip哪些途徑 # ifconfig # hostname -i 4、對
【若澤大資料早課】day5--20180914
1、pwd表示什麼 # 當前目錄 2、隱藏目錄什麼標識開始,怎麼看 # 隱藏檔案或者資料夾以.開頭 # ll -a 3、檢視檔案的大小哪兩組命令 # ll -h # du -sh xx 4、怎樣測試埠通不通 # telnet 5、檢視程序和埠號命令分別是
zookeeper-分散式鎖的程式碼實現-【每日五分鐘搞定大資料】
本文涉及到幾個zookeeper簡單的知識點,永久節點、有序節點、watch機制。比較基礎,熟悉的就別看了跳過這篇吧 每個執行緒在/locks節點下建立一個臨時有序節點test_lock_0000000040 獲得/locks節點下所有子節點A、B、C,排序獲得最小值 若當前節點B為最小值則獲得鎖,執
【若澤大資料早課】day7--20181009
1、級聯建立資料夾的命令引數 # mkdir -p xxx xxx 2、建立檔案有哪幾種方法 # touch vi echo mv cp 3、重新命名一般用哪個命令 # mv 4、說說大R引數的命令有哪些 # chown chmod 5、說說小r引數的
【大資料】InfoWorld的2018年最佳開源資料平臺獎公佈
目錄 TiDB Neo4j Apache Spark 儘管新的產品層出不窮,Apache Spark在資料分析領域仍然佔據著舉足輕重的地位。如果你需要從事分散式計算、資料科學或者機器學習相關的工作,就使用Apache
【大資料】安裝偽分散式Hadoop叢集
壓縮包: eclipse-jee-photon-R-linux-gtk-x86_64.tar.gz hadoop-2.9.1.tar.gz jdk-10.0.1_linux-x64_bin.tar.gz 配置主機名和網路 配置主機名: #hostnamect
【大資料】安裝完全分散式Hadoop叢集
修改主機名和網路 master: #hostnamectl set-hostname master #vi /etc/sysconfig/network-scripts/ifcfg-ens33 TYPE=Ethernet PROXY_METHOD=none BR
基於神經網路的文字相似度計算【醫療大資料】
任務描述 問句匹配是自然語言處理的最基本任務之一,是自動問答,聊天機器人,資訊檢索,機器翻譯等各種自然語言處理任務基礎。問句匹配的主要目的是判斷兩個問句之間的語義是否等價。判別標準主要根據主句(即提問者)所蘊含的意圖來判斷兩個語句是否等價,而不直接判斷兩個語句是否表達相
【大資料】Hadoop的高可用HA
第1章 HA高可用 1.1 HA概述 1)所謂HA(high available),即高可用(7*24小時不中斷服務)。 2)實現高可用最關鍵的策略是消除單點故障(single point of failure,SPOF)。單點故障是一個元件發生故障,就會導致整個系統無法執行。HA嚴格來說應該分成各個元
【大資料】大資料存取的選擇:行儲存還是列儲存?
轉自:http://storage.chinabyte.com/491/12390991.shtml 目前大資料儲存有兩種方案可供選擇:行儲存和列儲存。業界對兩種儲存方案有很多爭持,集中焦點是:誰能夠更有效地處理海量資料,且兼顧安全、可靠、完整性。從目前發展情況看,關