[Java]統計目錄下Java原始檔的關鍵字出現次數

阿新 • • 發佈：2018-11-06

題目

題目也可抽象為統計檔案正文中某字串出現的次數.

解題思路

1.Java中關鍵字共有50個,分別為:

    final String[] KEYWORDS = { //50個關鍵字
            "abstract", "assert", "boolean", "break", "byte",
            "case", "catch", "char", "class", "const",
            "continue", "default", "do", "double", "else",
            "enum", "extends" 
, "final", "finally", "float",
            "for", "goto", "if", "implements", "import",
            "instanceof", "int", "interface", "long", "native",
            "new", "package", " private", " protected", "public",
            "return", "strictfp", "short", "static", "super",
            "switch" 
, "synchronized", "this", "throw", "throws",
            "transient", "try", "void", "volatile", "while"
    };

2.說明與初始化

	...
    ArrayList<File> fileList;//儲存Java檔案列表
    File root;//給定的目錄
    Map keywords; //HashMap用於儲存關鍵字與出現次數, 例如:<key,value>=<"int",3>
    ...
        public KeywordsAnalyzer 
(String pathName) {
        root = new File(pathName);
        fileList = new ArrayList<>();
        keywords = new HashMap();
        for (String word : KEYWORDS) {
            keywords.put(word,0);//按KEYWORDS順序初始化Map
        }

    }

3.使用遞迴搜尋目錄下所有的Java檔案

    ArrayList<File> fileList; 
    File root; 
        public void searchFiles() {
        File[] files = root.listFiles();
        int length = files.length;
        for (int i = 0; i < length; i++) {
            if (files[i].isDirectory()) {
                root = files[i];
                searchFiles();
            } else {
                if (files[i].getName().endsWith(".java"))
                    fileList.add(files[i]);
            }
        }
    }

3.關鍵字篩查

讀取檔案中的某一行,將該行split為字串陣列,逐個判斷是否為關鍵字.
需要首先去除非字母和數字字元的影響,例如:

private void fixUp(int k) {
//直接分割會少計算了一個int
private
void 
fixUp(int //此處有一個關鍵字int
k) 
{
//使用正則表示式"\\W"處理成
private
void 
fixUp 
int
k

程式碼如下:

    public void matchKeywords(String line) {
        String[] wordList = line.replaceAll("\\W", " ").split(" ");
        for (int i = 0; i < wordList.length; i++) {
            for (int j = 0; j < 50; j++) {
                if (wordList[i].equals(KEYWORDS[j])) { //迴圈判斷
                    int count = (int) keywords.get(KEYWORDS[j]);
                    keywords.put(KEYWORDS[j], count + 1);
                }
            }
        }

    }

4.處理註釋

說明有四種不同的註釋,分別為:

   /**
    文件註釋
   */
   
   /*
     多行註釋
   */
  
   //單行註釋
   
   int number;  /*第一行當作程式碼
                           *
                   其他行當作註釋 */

讀取檔案中的每一行,首先判斷是否屬於註釋,若屬於則跳過,若不屬於則進行關鍵字篩查.

    public void countKeyWords(File file) throws IOException {
        BufferedReader input = new BufferedReader(new FileReader(file));
        String line = null;
        while ((line = input.readLine()) != null) {
            line = line.trim();
            if (line.startsWith("//")) continue; //不處理單行註釋
            else if (line.contains("/*")) { //多行,文件與尾行註釋
                if (!line.startsWith("/*")) matchKeywords(line);//第一行算程式碼,其餘算註釋
                while (!line.endsWith("*/")) {
                    line = input.readLine().trim();
                }
            }
            matchKeywords(line); //對程式碼行進行統計
        }
    }

流程與結果輸出

   public void keywordsAnalyze() {
        for (File file : fileList) {
            try {
                countKeyWords(file);
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        //排序並輸出結果
        List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String, Integer>>(keywords.entrySet());
        Collections.sort(list, new Comparator<Map.Entry<String, Integer>>() {
            @Override
            public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
                return o2.getValue().compareTo(o1.getValue());
            }
        });
        int count = 0;
        for (Map.Entry<String, Integer> word : list) {
            count++;
            System.out.print(word.getKey() + ": " + word.getValue() + " ");
            if (count == 5) { //每行輸出5個關鍵字
                count = 0;
                System.out.println();
            }
        }

    }

這裡輸出的結果是按照出現次數的多少降序排序.這裡涉及了HashMap的按值排序的思路.詳情可以參考我的另外一篇文章還沒寫好,文章裡面同樣以關鍵字為例,分析了HashMap按鍵排序和按值排序兩種簡便方法.

測試結果

對測試用例在這裡插入圖片描述進行統計得到如下結果:

原始碼下載

包含完整程式碼與測試用例.

百度網盤

[Java]統計目錄下Java原始檔的關鍵字出現次數

題目題目也可抽象為統計檔案正文中某字串出現的次數. 解題思路 1.Java中關鍵字共有50個,分別為: final String[] KEYWORDS = { //50個關鍵字 "abstract", "assert", "boolean",

【程式碼重構 & JDT】獲取指定目錄下Java檔案對應的ICompilationUnit (可獲取Binding)

/* * javaFilePath 檔案的絕對路徑，比如： D:\test\javatp\1B\14638316\14638316.java * javaName 檔名，比如： 14638316.java * fileDir 檔案的所在資料夾路徑，比如： D:\test\j

用bat批處理刪除Java專案目錄下target資料夾

將以下內容儲存到專案根目錄。適用於專案目錄下有其它專案@echo off :: delete target folder for /f "delims=" %%i in ('dir %~dp0 /b') do ( if exist "%~dp0%%i\" ( if

【程式碼重構 & JDT】獲取指定目錄下Java檔案對應的ICompilationUnit (可獲取Binding)

/* * javaFilePath 檔案的絕對路徑，比如： D:\test\javatp\1B\14638316\14638316.java * javaName 檔名，比如： 14638316.java * fileDir 檔案的所在資料夾路徑，比如：

java resources目錄下配置檔案的讀取操作封裝類

首先明確，java是編譯性語言，讀取應該都是針對編譯後的檔案. package com.xkygame.ssm.utils;/** * Created by Clarence on 2017/7/27. */import org.slf4j.Logger;import o

Java實現統計福彩雙色球出現次數（毫無技術可言）

今天早上閒來無事，恰好在看微博的時候看到的雙色球的開獎視訊，沒出現一個號，主持人就會報出現了多少次，於是自己就無聊的寫了一下統計每期的號碼出現的次數程式。彩票號碼資料來自網上：程式碼如下Money.java： package com.heynine.money;

java統計List中的元素重複出現的次數

package net.javaer.demo; import java.util.ArrayList; import java.util.Collections; import java.util.HashMap; import java.util.HashSet; i

java 查詢目錄下檔案內容包含某個字串的檔案

這個java類主要是用來查詢檔案內容的，而不是查詢檔名的。主要作用是查詢目錄下所有檔案的檔案內容包含特定字串的檔案，並列印輸出位置和找到的字元數量。可以定義多個字元進行查詢，不需要擔心檔案格式問題，非常方便！ package com.test; import java.i

計算Java List中的重復項出現次數

sta shm set static out ger try count intval import java.util.ArrayList;import java.util.HashMap;import java.util.Iterator;import java.uti

統計C語言關鍵字出現次數

man scrip author != free string ret str 個數統計C語言關鍵字出現次數《C程序設計語言》K&R版本第6章結構6.3結構數組內容 /* Name: 統計c語言關鍵字出現次數 Copyright: A

shell指令碼統計目錄下檔案數量

awk統計目錄下最大的檔案

首先簡單介紹一下，awk如何使用外部變數： awk中使用shell中的變數一: "'$var'" 這種寫法大家無需改變用'括起awk程式的習慣,是老外常用的寫法.如: var="test" awk 'BEGIN{print "'$var'"}' 這種寫法其實際是雙括號變為

linux 統計目錄下所有檔案數量

檢視統計當前目錄下檔案的個數，包括子目錄裡的。　　ls -lR| grep "^-" | wc -l[喝小酒的網摘]http://blog.hehehehehe.cn/a/12311.htm Linux下檢視某個目錄下的檔案、或檔案夾個數用到3個命令:ls列目錄、用gr

Python學習13_Python指令碼實現查詢指定目錄下包含指定關鍵字的檔案

#!/usr/bin/python # coding:utf8 import os # 判斷檔案中是否包含關鍵字，是則將檔案路徑打印出來 def is_file_contain_word(file_list, query_word): for _file in

myEclipse的web project 的src目錄下建立package時出現package跑到libraries目錄下或者和src在同一級目錄下

一直出現這樣的問題，，糾結死了，後來發現在package explore目錄下看到的是沒有問題的把顯示工程的package explore關掉重新reset perspective就好了終於把這個小問題解決掉了。！

android studio 安裝assets目錄下的apk包出現解析錯誤的問題

當你使用新版的android studio 直接run專案時，如果應用是需要安裝assets目錄下的apk包可能會出現以下問題：這是因為新版的android studio中預設使用instant run，當直接run 部署到真機或者模擬器上時編譯專案可能會出現問題，導致

Python指令碼實現查詢指定目錄下包含指定關鍵字的檔案

#!/usr/bin/python # coding:utf8 import os # 判斷檔案中是否包含關鍵字，是則將檔案路徑打印出來 def is_file_contain_word(file

華為上機試題（java）找出一個字串中出現次數最多的字元

Java求字串中出現次數最多的字元，如String Str = "aaabbcddddee";那麼輸出：d 4 ;若String Str = "aaabbcddddeexxxxxx";那麼輸出：x 6 import java.util.*; import java.uti

java找出一個數組中出現次數最多的那個元素

方法一： import java.util.*; public class TestMain { private static HashMap<String, Integer> map; public static HashMap<Stri

1.查詢目錄下所有包含關鍵字的檔名

import java.io.File; import java.util.Scanner; public class TestDemo { public static String key; public static void showFile( File ro

[Java]統計目錄下Java原始檔的關鍵字出現次數

題目

解題思路

1.Java中關鍵字共有50個,分別為:

2.說明與初始化

3.使用遞迴搜尋目錄下所有的Java檔案

3.關鍵字篩查

4.處理註釋

流程與結果輸出

測試結果

原始碼下載

相關推薦