1. 程式人生 > >關於基於複雜網路的資料探勘的學習筆記

關於基於複雜網路的資料探勘的學習筆記

最近一直投身 複雜網路的各種問題  簡單記錄一下 我這一路關注的問題

開始學到用聚集係數來判別垃圾簡訊的傳送號碼  我就想臨摹一個 用聚集係數在微信朋友關係中 判別微商  結果是失敗的  一是取不到資料  二是 微商很多就是買給熟人 他的朋友不一定不是朋友  他的聚集係數就不一定低  所以失效

然後我就對聚集係數依舊念念不忘  尋找他與網路基本屬性:度分佈 中介性 介數 k-core值 等的關係  發現它與k-core的關係 k-core值的越大 在該k-core下其形成子圖的平均聚集係數就越高  發現這個關係後 就想用這個關係來改進一些演算法 

就在基於聚集係數的社團發現上動腦筋 但用k-core替代聚集係數來做 效果並不好。。。

然後就不在這些基礎概念上糾結 看到了基於模組度的社團發現  看後沒有什麼大感覺 通過社會網路 順藤摸瓜摸到了社會網路 friendship network 覺得挺有意思 就找了些論文來看 有一篇paper 從上課打卡的記錄中 按照多次相鄰打卡的為朋友的假設 抽取了朋友關係 然後解析朋友網路中的區域性結構  觀察 隨著朋友在一起的時間變長 區域性結構的變化 兩個結伴 三個結伴的變成最常見的區域性結構

最近看了 利用商品在各國的貿易情況 做商品的相似關係 構建網路的論文 想自己也找一些實體來通過相似性構建網路 進行分析  想到了 模特和大牌的代言和時裝秀 然而還沒找到可用資料   想打用借書記錄構建學生 知識儲備的相似性關係網路 吳老師說這樣構建不明顯不直接 不新穎 他建議我做在文字中挖掘實體關係  比如共現關係!