1. 程式人生 > >個人作業進度(一)

個人作業進度(一)

是否 字典序 HA ++ linux系統 存儲 字符數 規劃 它的

第一次個人作業(一)

任務:

1.統計文件的字符數;

2.統計文件的單詞總數;

3.統計文件的總行數;

4.統計文件中單詞頻率,輸出頻率最高的前十個;

5.統計兩個單詞(詞組)在一起的頻率,輸出頻率最高的前10個。

6.對給定文件夾及其遞歸子文件夾下的所有文件進行統計

7.Linux系統下,進行性能分析,過程寫到blog中(附加題)

進度:

實際上昨天晚上就已經開始寫個人作業了,到目前為止基本完成前三個功能,也已經和同學進行過一些簡單的測試

規劃:

第四個功能本來打算用二維字符數組來存儲單詞,但是單詞量太大越界了,所以我打算用結構體來對單詞的存儲。首先結構體中

有單詞,有它的哈希值(因為對比相同單詞工作量太大,所以我打算把它用哈希函數把單詞轉換成數字來比較),有它的頻數,如果

有新的單詞就把它與原單詞按字典序比較,選擇是否替換,同時頻數加一。最後將頻數前十的單詞輸出。

第五個功能目前還沒有想到非常好的方法,第六個功能還沒有學習怎麽在c++裏操作文件夾。打算明天先解決第四和第六個問題,

第五個問題與代碼優化問題後天再考慮。

函數方面考慮再建兩個.h文件,一個hash.h,一個func.h,分別用於寫哈希函數與實現統計的函數。

個人作業進度(一)