1. 程式人生 > >大資料時代的地理資訊科學與科研能力培養

大資料時代的地理資訊科學與科研能力培養

大資料時代的地理資訊科學與科研能力培養

@劉瑜_北大GISer 學者簡介: 劉瑜,北京大學遙感與地理資訊系統研究所教授。目前主要研究方向包括:1)地理 […]

A- A+ 地理之道 2015-5-10 22:18  148 views

@劉瑜_北大GISer

學者簡介:

劉瑜,北京大學遙感與地理資訊系統研究所教授。目前主要研究方向包括:1)地理資訊科學領域的若干理論問題,包括地理空間認知與推理、空間資料不確定性;2)基於海量時空資料的行為模式分析;3)地學分類問題;4)基於物件的遙感影象分析等。參與或負責科研專案十餘項,發表論文100餘篇,其中SCI/SSCI收錄40餘篇。目前任Computers,Environment and Urban Systems副主編、中國地理學會青年工作委員會副主任。

 

各位朋友、同學,很高興有今天的交流機會。我準備從三個方面分享自己的一些想法:首先簡單介紹一下個人的經歷以及最近開展的研究;其次,分享一下最近關於地理學與地理資訊科學的一點思考;最後,對於研究生同學的學習和科研,談一點期望和建議。

 

1、關於個人經歷以及最近的研究

自己本科是人文地理學專業的,研究生轉到地理資訊系統方向,導師是週一星教授和鄔倫教授,當時周老師希望自己做一些利用GIS進行城市群研究,可當年自己是全力投入到軟體開發中,那時在鄔倫教授帶領下,開發了當時在國內比較知名的GIS軟體:城市之星,而研究工作相對就做得較少。在軟體開發過程中,認識到軟體工程的價值,所以在1999年師從楊芙清院士攻讀軟體工程方向博士。在博士階段學習過程中,自己覺得獲益最大的方面是培養了對於複雜問題的抽象建模能力。

城市之星的開發最終還是沒有成功,自己的工作重心轉到科研,在08年之前,主要從事GIS模型方面的研究,包括空間關係、不確定性等,簡而言之,就是探討人如何理解和認識地理世界,並在此基礎上形成概念模型。在08年之後,主要側重於大資料研究,即通過建立新的空間分析方法,提取海量個體的時空行為模式並進而解釋其背後的地理影響。由於城市是人類活動最密集的區域,也是產生各種大資料最多的區域,這方面工作很自然的和城市及區域研究相結合,所以最近和周老師彙報說自己的工作重心又重回城市地理學了,也算在二十多年後實現了先生當初的期望,周老師也很欣慰。

最近,我們研究團隊在基於不同型別資料進行實證研究的基礎上,提出了社會感知概念,認為時空大資料使得研究者基於人的時空行為特徵感知並理解地理環境特徵成為可能,對於地理學尤其是人文地理學研究具有重要意義。在社會感知中,每個居民個體扮演了感測器的角色,所獲取資料涵蓋了人們的活動和移動、社交關係以及情感和認知三個方面的行為模式,而這些模式在聚集層面上則有助於認識用地型別、空間互動以及地理語義等空間特徵及演化過程。我們指出整合社會感知和傳統遙感技術是聯絡人文地理學和自然地理學的一條可行途徑,可以幫助全面研究地理環境,而在使用社會感知資料時也需要注意一些問題,如資料質量、代表性、時空尺度等。

 

2、關於地理學與地理資訊科學的一點思考

GIS形式化了地理學的基本概念、基本知識、以及基本分析方法。例如,GIS利用柵格模型和向量模型表達了地理現象的空間分佈以及不同地理物件的特徵,同時GIS實現了一系列分析方法,體現了地理學研究中的一些基本概念。舉例而言,Tobler地理學第一定律表達了距離對於地理現象的影響,實際上蘊含了兩個方面的含義,一個是地理分佈的相似性,即空間上越近的地方屬性越相似,二是空間聯絡的強度,距離越近的兩個地物,空間聯絡和互動相對越強。在GIS中,空間插值、空間自相關度量、分佈模式檢測等體現前者,而重力模型等則用於量化後一方面。

地理學作為一個學科,其科學性經常受到質疑。我們經常需要回答,地理學研究某一特定問題(如移民),和其它領域(如經濟學和社會學)研究同一問題,有什麼區別。簡而言之,地理學者是在一個地理空間的框架中研究這些問題,必須要考慮地理空間的特點。在地理研究中,空間分佈的異質性、距離影響、尺度效應都是必須要要注意的問題。比如,我們需要了瞭解由於空間自相關的存在,在進行相關分析時需要考慮樣本獨立性假設是否成立。而地理分析沒有天然的空間單元,在分析中需要注意可變面狀單元問題(MAUP),即對研究區採用不同的劃分方式,得到的分析結果可能就會有差異。因此,在進行地理分析時,需要對上述問題有深刻的認識,而如前所述,GIS恰恰通過一系列分析方法和工具處理上述問題。

作為結論,GIS對於地理學的科學化具有重要的意義,北大承繼成先生曾經說過,地理資訊系統就是地理學,而在西方學界甚至有GIS拯救了地理學的說法。考慮到地理學的學科特點,自然地理學不同方向(如水文、土壤、氣象)很容易在對應的專門學科找到落腳點,而人文地理學則肩負了堅守地理學核心價值的重任,更需要好的方法和工具的支撐。在中國,人文地理學發展相對落後於自然地理學。如前所述,大資料時代帶來了社會感知,能夠透過海量人群的時空行為模式研究地理環境,對於地理學尤其是人文地理學是個很好的機遇,而對於GIS也是一個挑戰,需要GIS研究新的分析方法和工具,為不同應用提供支撐。簡而言之,人文地理學者需要和GIS學者聯起手來,共同應對大資料帶來的機遇和挑戰,研究地理學核心問題,並最終服務於解決社會問題。

 

3、對研究生尤其是碩士研究生的建議

實際幾年前自己寫過對於GIS專業碩士研究生的建議,現在看來,也不算過時,並且對於其它專業也還合適,再把它翻出來,分享給同學們。概括而言,研究生階段主要目的是學習到一技之長,為後面的工作,不論是學界、業界還是政府部門的工作,打下基礎。

與攻讀博士主要是為了以後走學術之路相比,碩士研究生階段的三年,目的可以更多樣化。一般來說,它可以被視為參與工作的鍛鍊和緩衝(或者提升)期,以及進入學術研究的起步期。從這個意義上來講,自己並不反對學生出國,同樣的,出國的目的也是要明確。對於希望進入學術界的學生,我覺得更有出國的必要。不論是上面兩個目的的哪一個,有兩個基本能力的培養非常重要,一個是學習能力,一個是溝通能力。當然,這兩個方面都不是僅僅在研究生階段建立的,但是如果到了研究生階段還沒有很好地建立的話,那麼必然會影響將來的發展。首先說前者,因為現代社會各方面都發展迅速,是個終生學習的社會,所以學習能力很重要,而學習能力的關鍵是對被學習事物的興趣。其次,溝通能力包括表達能力和理解能力,它是情商的主要構成,我們往往說“情商比智商更為重要”,就是這個道理,當然,情商也包括其它一些方面,比如自制力、同情心等等。這裡單提溝通能力,是因為它可以提高,比如一些學生說話吞吞吐吐,影響表達,我希望他們有意識地多加鍛鍊。

下面說到專業的學習了,對於目標是畢業後工作的同學,因為主要是進入各種應用GIS的業務部門,尤其是工作最初可能還是從最基本的工作做起,所以我覺得以下幾個方面比較重要,1、GIS軟體的使用能力;2、掌握一門程式語言;3、學習GIS專案中一些技術文件(如需求分析,系統設計)的寫作;4、瞭解一個GIS專案的組織和管理。而對於走學術研究的學生而言,儘管自己目前主要做理論方面的研究,但是應用研究還是GIS領域的主體。而要做應用研究,首先是地學的功底要比較紮實,也就是說了解問題域,其次是掌握足夠多的數學方法和工具。可以形象的比喻為一個三角形,底邊反映了你對問題域的瞭解,高則表示你掌握方法和工具的多寡,最終三角形的面積與這兩個方面都有關。這兩者對於自然地理學和人文地理學,我想也是同樣重要的。總之,做研究包括兩個方面,一個是全面瞭解所要解決的問題,一個掌握各種方法。通常,掌握的方法越多越好,但是如果不知用在何處,也是枉然,就真的是“為了方法而方法”了。

與創造工具的數學家、資訊科學家相比,地理學者往往只需要掌握方法原理,用好相應工具就可以了。每年在地學應用領域都會有一些新的方法被引入,比如早一點的人工神經網路,後來的支援向量機,現在的矩陣分解、深度學習、複雜網路等,希望同學們能夠掌握。相對而言,如果做GIS應用研究,自己覺得統計學是其基礎。而要做理論研究,離散數學的相關知識更為重要。還有一點值得指出的是,即使是做研究,也要具備一定的軟體應用和程式設計能力,否則何以分析資料,何以試驗你的想法?

自己很久前也寫過指導學生的部落格,覺得科研指導可以分為三個層次。這三個層次對於從事科研活動的研究生而言,也許有借鑑意義,也分享給大家。

第一個層面,基本上屬於讓學生做“體力活”的範疇,就是導師設計好題目,確定了一系列基本方法,並且對於每一步所得到的結果有一定預期,學生做的工作主要是實現具體方法,填充其中的“空隙”。這是最低層面的指導,學生扮演了助手的角色,但是在這樣一個過程中,可以得到基本的科研訓練。

第二個層面,是導師幫助選定一個較為寬泛的方向,指出需要注意的問題,如問題邊界,相關研究現狀等,然後放手讓學生去做。在這個過程中,需要導師和學生共同商量解決其中可能遇到的困難。

第三個層面,是學生能夠自己提出問題,導師基於其經驗和視野,評估所研究問題的創新性、價值和難度。如果確定是可做的,基本上由學生獨立完成。

基本上這三個層面,對應了本科生、碩士研究生和博士研究生的學習階段。在第三個階段後,學生能夠自己提出問題、評估可行性、進而確定研究技術路線,那麼就算是具備了獨立研究的能力,這時導師和學生之間將是合作關係而不是指導關係了。

 

互動問答:

Q:我想請問一下研究中大資料的獲取渠道都有哪些呢?網路爬蟲還是實地監測,有沒有比較好的獲取平臺之類的?

A:很好的問題,應該說目前大資料還沒有很好的獲取渠道,政府部門和相關企業往往是大資料的擁有者,由於涉及隱私、國家安全等原因,他們往往不願意公開共享資料。這使得我們學界處於比較尷尬的境地。但是,我們在實踐中也看到很多企業擁有不同型別大資料,但是由於種種原因,沒有或者不願意深入挖掘,這個是學界的機會,我們可以通過合作方式得到他們資料的訪問許可權。實際我們團隊已經開始這麼嘗試了。

 

Q:劉老師,你有計算機軟體工程的背景,你對計算機專業轉GIS專業有什麼建議,我想聽聽計算機背景的學生如果考研學習GIS,我們該如何指導?

A:從計算機轉GIS我個人覺得比較容易,在研究中我覺得要加強對於地理空間的認識。前面也略談了一些,可供參考。換言之,就是如何對地理空間概念形式化,如何表達距離、尺度、分佈、互動等地學分析基本要素。

 

Q:劉老師將“社會感知”與“遙感資料”並列,很有創新性!但感覺“社會感知”的資料與“人”密切先關,而“人”是飄忽不定且多變的,這就會是資料效力降低,沒有“遙感資料”更硬,劉老師更深入談一下嗎?

A:這個問題很好,我們社會感知的文章也談了該點,簡而言之的話,我們要充分認識到時空大資料的不足和侷限,如代表性問題。

 

Q:但我想知道什麼樣的資料能稱之為大資料?我發現不少學者做的大資料方法都是基本的數理方法,於是我就又疑惑,所謂大資料是指分析的資料量大?亦或有專門所謂大資料分析方法?還是用大資料軟體分析就是大資料分析?

A:確實大資料沒有好的定義,學界也有不同的看法。個人認為這個詞被屢屢提起,實際有趕時髦的原因。我個人傾向於用海量時空資料這個詞,但是大資料更簡潔,所以也就從眾了。就如同於顯微鏡使得我們能夠看到細胞等微小物體,從而促進了生物學發展一樣,大資料提供了對海量個體時空行為模式的一種新途徑,從而幫助我們更好理解人與地理環境的互動關係。

 

Q:所謂大資料就是一種分析手段或者觀測技術?

A:在地理學研究中,大資料兩個特點我覺得比較明顯,1、與人有關,2、時空標記。它提供了對於時空行為模式的觀測手段和相應分析方法,這正是社會感知的定義。

 

Q:大資料是巨量資料,但是在計算機界常常強調雲端計算或一些分散式處理方法,那麼現在地理學上有什麼比較好的方法或演算法可以應用於大資料研究呢?

A:很好的問題,這是我們GIS工作者面臨的重任。簡單而言,我覺得時空點模式、時空流模式是亟需GIS發展的。這兩方面分別對應了空間分佈和聯絡——它們正是地理學的傳統命題。從赫特納、厄爾曼就在討論這些問題,而大資料時代到來後,為觀測與人有關的分佈和流動提供了新途徑。

 

Q:劉老師您好:GIS的應用範圍越來越廣,那些不是學GIS的培訓幾天也能用的非常熟悉,甚至遠遠超過學GIS的。我想請教一下劉老師:和非GIS專業相比,GIS專業的學生在學習方面最主要的區別是什麼?還有怎麼才能發揮專業知識?

A:很好的問題,這要感謝有了很好的GIS軟體。但是會用工具是一回事,在用工具過程中理解其原理則是另一回事,需要對一些概念有紮實的掌握。舉個例子,坡度分析大家都會做,但是很少人知道坡度分析結果與解析度有關,這就是尺度問題,需要GIS專業的訓練。再比如,地理分析中大都有MAUP問題,如何處理,也是一個問題,這需要GIS專業人員參與,才能解決的更好。

 

Q:老師,您覺得大資料將來發展的方向是什麼?大資料會在哪些方面更加多一些?

A:泛泛說大資料太大了,在地理領域,我覺得最有價值的應用方向就是智慧城市。智慧城市這個詞也有些叫濫了,個人認為智慧城市核心是人。而大資料恰恰提供了對人的觀測,所以大資料有助於智慧城市規劃和建設。

 

Q:聽過劉老師的一個報告,啟發很大。我想知道 remote sense和social sense是否有很好的可以結合得地方?未來可以在哪些方面進行拓展研究?能否舉例說明一下?。您覺得未來兩方面的結合可以繼續在哪些方面拓展呢?

A:我們在做鬼城的研究,集成了遙感和社會感知資料,是一個較好的例子。還是有一些,我們社會感知文章也談了,如長時間尺度的地理過程觀測和建模。現在大資料實證研究所採用的資料往往時間跨度小,反映靜態特徵居多,而時間跨度更大的資料有助於我們認識地理過程。

 

Q:老師能不能推薦一下研究智慧城市與大資料結合的文章或者研究啊?

A:智慧城市與大資料的文章,可以看看Batty的論著。另外龍瀛提出的DAD(Data Augmented Design),鄭宇的城市計算,都值得關注。

 

Q:最後請劉老師談談發SCI論文的注意事項吧?

A:好的,我個人覺的一篇文章最終發表,最關鍵是創新,你要把你新的地方充分寫出來。要麼是新方法,要麼是新發現。這個在表述中必須清晰,讓主編和審稿人認識到你工作的價值。力戒Nothing wrongbut nothing new的文章。再就是論文寫作中注意精煉語言,邏輯要順,這是很多同學容易犯的毛病。舉個例子,自己英語水平很難說比我的學生好多少,考GRE的話,他們肯定比我高,但他們寫的文章經常會被審稿人指出有語言問題,自己則很少,這其實不是語言問題,而是邏輯問題。邏輯不清楚,別人就不容易懂,再加上語言問題,就更難懂了。

 

Q:為什麼期刊只關注學術性理論性強的文章?感覺與實際應用有些脫節,舉例說,地理資料組織模型方面,都是用於指導通用平臺的,在行業地理資訊組織上就比較缺乏,而行業GIS平臺建設,意義更重大,我瞭解的規劃、交通、水利都建的不成功。

A:這位同學的問題有些意思,學術論文還是重視理論性吧,工程實踐方面的,除非創新點寫得很清楚,否則不易發表。當然,行業資料模型,如果有新意,還是可以發表的。CEUS前年就有三維建築模型的專輯。

 

劉老師從學科創新、資料應用到發展方向、學習計劃再到論文撰寫給我們上了非常生動的一課~感謝劉老師~感謝大家對地研聯活動的支援和幫助,希望大家繼續關注我們的活動,今年5月23、24十週年慶典+京區論壇,北京大學/中科院地理所,我們不見不散啊~

 

本期小編:王雪

轉自:http://www.izuobiao.com/?p=7629#odby




大資料時代的地理資訊科學與科研能力培養

@劉瑜_北大GISer 學者簡介: 劉瑜,北京大學遙感與地理資訊系統研究所教授。目前主要研究方向包括:1)地理 […]

A- A+ 地理之道 2015-5-10 22:18  148 views

@劉瑜_北大GISer

學者簡介:

劉瑜,北京大學遙感與地理資訊系統研究所教授。目前主要研究方向包括:1)地理資訊科學領域的若干理論問題,包括地理空間認知與推理、空間資料不確定性;2)基於海量時空資料的行為模式分析;3)地學分類問題;4)基於物件的遙感影象分析等。參與或負責科研專案十餘項,發表論文100餘篇,其中SCI/SSCI收錄40餘篇。目前任Computers,Environment and Urban Systems副主編、中國地理學會青年工作委員會副主任。

 

各位朋友、同學,很高興有今天的交流機會。我準備從三個方面分享自己的一些想法:首先簡單介紹一下個人的經歷以及最近開展的研究;其次,分享一下最近關於地理學與地理資訊科學的一點思考;最後,對於研究生同學的學習和科研,談一點期望和建議。

 

1、關於個人經歷以及最近的研究

自己本科是人文地理學專業的,研究生轉到地理資訊系統方向,導師是週一星教授和鄔倫教授,當時周老師希望自己做一些利用GIS進行城市群研究,可當年自己是全力投入到軟體開發中,那時在鄔倫教授帶領下,開發了當時在國內比較知名的GIS軟體:城市之星,而研究工作相對就做得較少。在軟體開發過程中,認識到軟體工程的價值,所以在1999年師從楊芙清院士攻讀軟體工程方向博士。在博士階段學習過程中,自己覺得獲益最大的方面是培養了對於複雜問題的抽象建模能力。

城市之星的開發最終還是沒有成功,自己的工作重心轉到科研,在08年之前,主要從事GIS模型方面的研究,包括空間關係、不確定性等,簡而言之,就是探討人如何理解和認識地理世界,並在此基礎上形成概念模型。在08年之後,主要側重於大資料研究,即通過建立新的空間分析方法,提取海量個體的時空行為模式並進而解釋其背後的地理影響。由於城市是人類活動最密集的區域,也是產生各種大資料最多的區域,這方面工作很自然的和城市及區域研究相結合,所以最近和周老師彙報說自己的工作重心又重回城市地理學了,也算在二十多年後實現了先生當初的期望,周老師也很欣慰。

最近,我們研究團隊在基於不同型別資料進行實證研究的基礎上,提出了社會感知概念,認為時空大資料使得研究者基於人的時空行為特徵感知並理解地理環境特徵成為可能,對於地理學尤其是人文地理學研究具有重要意義。在社會感知中,每個居民個體扮演了感測器的角色,所獲取資料涵蓋了人們的活動和移動、社交關係以及情感和認知三個方面的行為模式,而這些模式在聚集層面上則有助於認識用地型別、空間互動以及地理語義等空間特徵及演化過程。我們指出整合社會感知和傳統遙感技術是聯絡人文地理學和自然地理學的一條可行途徑,可以幫助全面研究地理環境,而在使用社會感知資料時也需要注意一些問題,如資料質量、代表性、時空尺度等。

 

2、關於地理學與地理資訊科學的一點思考

GIS形式化了地理學的基本概念、基本知識、以及基本分析方法。例如,GIS利用柵格模型和向量模型表達了地理現象的空間分佈以及不同地理物件的特徵,同時GIS實現了一系列分析方法,體現了地理學研究中的一些基本概念。舉例而言,Tobler地理學第一定律表達了距離對於地理現象的影響,實際上蘊含了兩個方面的含義,一個是地理分佈的相似性,即空間上越近的地方屬性越相似,二是空間聯絡的強度,距離越近的兩個地物,空間聯絡和互動相對越強。在GIS中,空間插值、空間自相關度量、分佈模式檢測等體現前者,而重力模型等則用於量化後一方面。

地理學作為一個學科,其科學性經常受到質疑。我們經常需要回答,地理學研究某一特定問題(如移民),和其它領域(如經濟學和社會學)研究同一問題,有什麼區別。簡而言之,地理學者是在一個地理空間的框架中研究這些問題,必須要考慮地理空間的特點。在地理研究中,空間分佈的異質性、距離影響、尺度效應都是必須要要注意的問題。比如,我們需要了瞭解由於空間自相關的存在,在進行相關分析時需要考慮樣本獨立性假設是否成立。而地理分析沒有天然的空間單元,在分析中需要注意可變面狀單元問題(MAUP),即對研究區採用不同的劃分方式,得到的分析結果可能就會有差異。因此,在進行地理分析時,需要對上述問題有深刻的認識,而如前所述,GIS恰恰通過一系列分析方法和工具處理上述問題。

作為結論,GIS對於地理學的科學化具有重要的意義,北大承繼成先生曾經說過,地理資訊系統就是地理學,而在西方學界甚至有GIS拯救了地理學的說法。考慮到地理學的學科特點,自然地理學不同方向(如水文、土壤、氣象)很容易在對應的專門學科找到落腳點,而人文地理學則肩負了堅守地理學核心價值的重任,更需要好的方法和工具的支撐。在中國,人文地理學發展相對落後於自然地理學。如前所述,大資料時代帶來了社會感知,能夠透過海量人群的時空行為模式研究地理環境,對於地理學尤其是人文地理學是個很好的機遇,而對於GIS也是一個挑戰,需要GIS研究新的分析方法和工具,為不同應用提供支撐。簡而言之,人文地理學者需要和GIS學者聯起手來,共同應對大資料帶來的機遇和挑戰,研究地理學核心問題,並最終服務於解決社會問題。

 

3、對研究生尤其是碩士研究生的建議

實際幾年前自己寫過對於GIS專業碩士研究生的建議,現在看來,也不算過時,並且對於其它專業也還合適,再把它翻出來,分享給同學們。概括而言,研究生階段主要目的是學習到一技之長,為後面的工作,不論是學界、業界還是政府部門的工作,打下基礎。

與攻讀博士主要是為了以後走學術之路相比,碩士研究生階段的三年,目的可以更多樣化。一般來說,它可以被視為參與工作的鍛鍊和緩衝(或者提升)期,以及進入學術研究的起步期。從這個意義上來講,自己並不反對學生出國,同樣的,出國的目的也是要明確。對於希望進入學術界的學生,我覺得更有出國的必要。不論是上面兩個目的的哪一個,有兩個基本能力的培養非常重要,一個是學習能力,一個是溝通能力。當然,這兩個方面都不是僅僅在研究生階段建立的,但是如果到了研究生階段還沒有很好地建立的話,那麼必然會影響將來的發展。首先說前者,因為現代社會各方面都發展迅速,是個終生學習的社會,所以學習能力很重要,而學習能力的關鍵是對被學習事物的興趣。其次,溝通能力包括表達能力和理解能力,它是情商的主要構成,我們往往說“情商比智商更為重要”,就是這個道理,當然,情商也包括其它一些方面,比如自制力、同情心等等。這裡單提溝通能力,是因為它可以提高,比如一些學生說話吞吞吐吐,影響表達,我希望他們有意識地多加鍛鍊。

下面說到專業的學習了,對於目標是畢業後工作的同學,因為主要是進入各種應用GIS的業務部門,尤其是工作最初可能還是從最基本的工作做起,所以我覺得以下幾個方面比較重要,1、GIS軟體的使用能力;2、掌握一門程式語言;3、學習GIS專案中一些技術文件(如需求分析,系統設計)的寫作;4、瞭解一個GIS專案的組織和管理。而對於走學術研究的學生而言,儘管自己目前主要做理論方面的研究,但是應用研究還是GIS領域的主體。而要做應用研究,首先是地學的功底要比較紮實,也就是說了解問題域,其次是掌握足夠多的數學方法和工具。可以形象的比喻為一個三角形,底邊反映了你對問題域的瞭解,高則表示你掌握方法和工具的多寡,最終三角形的面積與這兩個方面都有關。這兩者對於自然地理學和人文地理學,我想也是同樣重要的。總之,做研究包括兩個方面,一個是全面瞭解所要解決的問題,一個掌握各種方法。通常,掌握的方法越多越好,但是如果不知用在何處,也是枉然,就真的是“為了方法而方法”了。

與創造工具的數學家、資訊科學家相比,地理學者往往只需要掌握方法原理,用好相應工具就可以了。每年在地學應用領域都會有一些新的方法被引入,比如早一點的人工神經網路,後來的支援向量機,現在的矩陣分解、深度學習、複雜網路等,希望同學們能夠掌握。相對而言,如果做GIS應用研究,自己覺得統計學是其基礎。而要做理論研究,離散數學的相關知識更為重要。還有一點值得指出的是,即使是做研究,也要具備一定的軟體應用和程式設計能力,否則何以分析資料,何以試驗你的想法?

自己很久前也寫過指導學生的部落格,覺得科研指導可以分為三個層次。這三個層次對於從事科研活動的研究生而言,也許有借鑑意義,也分享給大家。

第一個層面,基本上屬於讓學生做“體力活”的範疇,就是導師設計好題目,確定了一系列基本方法,並且對於每一步所得到的結果有一定預期,學生做的工作主要是實現具體方法,填充其中的“空隙”。這是最低層面的指導,學生扮演了助手的角色,但是在這樣一個過程中,可以得到基本的科研訓練。

第二個層面,是導師幫助選定一個較為寬泛的方向,指出需要注意的問題,如問題邊界,相關研究現狀等,然後放手讓學生去做。在這個過程中,需要導師和學生共同商量解決其中可能遇到的困難。

第三個層面,是學生能夠自己提出問題,導師基於其經驗和視野,評估所研究問題的創新性、價值和難度。如果確定是可做的,基本上由學生獨立完成。

基本上這三個層面,對應了本科生、碩士研究生和博士研究生的學習階段。在第三個階段後,學生能夠自己提出問題、評估可行性、進而確定研究技術路線,那麼就算是具備了獨立研究的能力,這時導師和學生之間將是合作關係而不是指導關係了。

 

互動問答:

Q:我想請問一下研究中大資料的獲取渠道都有哪些呢?網路爬蟲還是實地監測,有沒有比較好的獲取平臺之類的?

A:很好的問題,應該說目前大資料還沒有很好的獲取渠道,政府部門和相關企業往往是大資料的擁有者,由於涉及隱私、國家安全等原因,他們往往不願意公開共享資料。這使得我們學界處於比較尷尬的境地。但是,我們在實踐中也看到很多企業擁有不同型別大資料,但是由於種種原因,沒有或者不願意深入挖掘,這個是學界的機會,我們可以通過合作方式得到他們資料的訪問許可權。實際我們團隊已經開始這麼嘗試了。

 

Q:劉老師,你有計算機軟體工程的背景,你對計算機專業轉GIS專業有什麼建議,我想聽聽計算機背景的學生如果考研學習GIS,我們該如何指導?

A:從計算機轉GIS我個人覺得比較容易,在研究中我覺得要加強對於地理空間的認識。前面也略談了一些,可供參考。換言之,就是如何對地理空間概念形式化,如何表達距離、尺度、分佈、互動等地學分析基本要素。

 

Q:劉老師將“社會感知”與“遙感資料”並列,很有創新性!但感覺“社會感知”的資料與“人”密切先關,而“人”是飄忽不定且多變的,這就會是資料效力降低,沒有“遙感資料”更硬,劉老師更深入談一下嗎?

A:這個問題很好,我們社會感知的文章也談了該點,簡而言之的話,我們要充分認識到時空大資料的不足和侷限,如代表性問題。

 

Q:但我想知道什麼樣的資料能稱之為大資料?我發現不少學者做的大資料方法都是基本的數理方法,於是我就又疑惑,所謂大資料是指分析的資料量大?亦或有專門所謂大資料分析方法?還是用大資料軟體分析就是大資料分析?

A:確實大資料沒有好的定義,學界也有不同的看法。個人認為這個詞被屢屢提起,實際有趕時髦的原因。我個人傾向於用海量時空資料這個詞,但是大資料更簡潔,所以也就從眾了。就如同於顯微鏡使得我們能夠看到細胞等微小物體,從而促進了生物學發展一樣,大資料提供了對海量個體時空行為模式的一種新途徑,從而幫助我們更好理解人與地理環境的互動關係。

 

Q:所謂大資料就是一種分析手段或者觀測技術?

A:在地理學研究中,大資料兩個特點我覺得比較明顯,1、與人有關,2、時空標記。它提供了對於時空行為模式的觀測手段和相應分析方法,這正是社會感知的定義。

 

Q:大資料是巨量資料,但是在計算機界常常強調雲端計算或一些分散式處理方法,那麼現在地理學上有什麼比較好的方法或演算法可以應用於大資料研究呢?

A:很好的問題,這是我們GIS工作者面臨的重任。簡單而言,我覺得時空點模式、時空流模式是亟需GIS發展的。這兩方面分別對應了空間分佈和聯絡——它們正是地理學的傳統命題。從赫特納、厄爾曼就在討論這些問題,而大資料時代到來後,為觀測與人有關的分佈和流動提供了新途徑。

 

Q:劉老師您好:GIS的應用範圍越來越廣,那些不是學GIS的培訓幾天也能用的非常熟悉,甚至遠遠超過學GIS的。我想請教一下劉老師:和非GIS專業相比,GIS專業的學生在學習方面最主要的區別是什麼?還有怎麼才能發揮專業知識?

A:很好的問題,這要感謝有了很好的GIS軟體。但是會用工具是一回事,在用工具過程中理解其原理則是另一回事,需要對一些概念有紮實的掌握。舉個例子,坡度分析大家都會做,但是很少人知道坡度分析結果與解析度有關,這就是尺度問題,需要GIS專業的訓練。再比如,地理分析中大都有MAUP問題,如何處理,也是一個問題,這需要GIS專業人員參與,才能解決的更好。

 

Q:老師,您覺得大資料將來發展的方向是什麼?大資料會在哪些方面更加多一些?

A:泛泛說大資料太大了,在地理領域,我覺得最有價值的應用方向就是智慧城市。智慧城市這個詞也有些叫濫了,個人認為智慧城市核心是人。而大資料恰恰提供了對人的觀測,所以大資料有助於智慧城市規劃和建設。

 

Q:聽過劉老師的一個報告,啟發很大。我想知道 remote sense和social sense是否有很好的可以結合得地方?未來可以在哪些方面進行拓展研究?能否舉例說明一下?。您覺得未來兩方面的結合可以繼續在哪些方面拓展呢?

A:我們在做鬼城的研究,集成了遙感和社會感知資料,是一個較好的例子。還是有一些,我們社會感知文章也談了,如長時間尺度的地理過程觀測和建模。現在大資料實證研究所採用的資料往往時間跨度小,反映靜態特徵居多,而時間跨度更大的資料有助於我們認識地理過程。

 

Q:老師能不能推薦一下研究智慧城市與大資料結合的文章或者研究啊?

A:智慧城市與大資料的文章,可以看看Batty的論著。另外龍瀛提出的DAD(Data Augmented Design),鄭宇的城市計算,都值得關注。

 

Q:最後請劉老師談談發SCI論文的注意事項吧?

A:好的,我個人覺的一篇文章最終發表,最關鍵是創新,你要把你新的地方充分寫出來。要麼是新方法,要麼是新發現。這個在表述中必須清晰,讓主編和審稿人認識到你工作的價值。力戒Nothing wrongbut nothing new的文章。再就是論文寫作中注意精煉語言,邏輯要順,這是很多同學容易犯的毛病。舉個例子,自己英語水平很難說比我的學生好多少,考GRE的話,他們肯定比我高,但他們寫的文章經常會被審稿人指出有語言問題,自己則很少,這其實不是語言問題,而是邏輯問題。邏輯不清楚,別人就不容易懂,再加上語言問題,就更難懂了。

 

Q:為什麼期刊只關注學術性理論性強的文章?感覺與實際應用有些脫節,舉例說,地理資料組織模型方面,都是用於指導通用平臺的,在行業地理資訊組織上就比較缺乏,而行業GIS平臺建設,意義更重大,我瞭解的規劃、交通、水利都建的不成功。

A:這位同學的問題有些意思,學術論文還是重視理論性吧,工程實踐方面的,除非創新點寫得很清楚,否則不易發表。當然,行業資料模型,如果有新意,還是可以發表的。CEUS前年就有三維建築模型的專輯。

 

劉老師從學科創新、資料應用到發展方向、學習計劃再到論文撰寫給我們上了非常生動的一課~感謝劉老師~感謝大家對地研聯活動的支援和幫助,希望大家繼續關注我們的活動,今年5月23、24十週年慶典+京區論壇,北京大學/中科院地理所,我們不見不散啊~

 

本期小編:王雪

轉自:http://www.izuobiao.com/?p=7629#odby