超大JSON檔案解析方案（Java）

阿新 • • 發佈：2021-12-12

解析超大JSON檔案

1、需求

最近專案中需要將一個一個大於800M的JSON檔案匯出到Excel中，試過普通的按行讀取檔案和JSONReader流讀取檔案，由於JSON檔案實在過於龐大，導致OOM問題

2、解決方案

每個json陣列中包含的json物件太多，導致用流和按行讀取時載入到記憶體會導致記憶體溢位。.

最終採用了JsonToken的解決方案。

package com.godfrey.poi.util;


import com.fasterxml.jackson.core.JsonFactory;
import com.fasterxml.jackson.core.JsonParser;
import com.fasterxml.jackson.core.JsonToken;
import com.fasterxml.jackson.databind.JsonNode;
import com.fasterxml.jackson.databind.MappingJsonFactory;

import java.io.File;

/**
 * @author godfrey
 * @since 2021-12-05
 */
public class ParseJsonUtil {
    public static void main(String[] args) throws Exception {
        JsonFactory f = new MappingJsonFactory();
        JsonParser jp = f.createJsonParser(new File("F:/FeaturesToJSON.json"));
        JsonToken current;
        current = jp.nextToken();
        if (current != JsonToken.START_OBJECT) {
            System.out.println("Error: root should be object: quiting.");
            return;
        }
        while (jp.nextToken() != JsonToken.END_OBJECT) {
            String fieldName = jp.getCurrentName();
            // move from field name to field value
            current = jp.nextToken();
            if ("features".equals(fieldName)) {
                if (current == JsonToken.START_ARRAY) {
                    // For each of the records in the array
                    while (jp.nextToken() != JsonToken.END_ARRAY) {
                        // read the record into a tree model,
                        // this moves the parsing position to the end of it
                        JsonNode node = jp.readValueAsTree();
                        // And now we have random access to everything in the object
                        System.out.println("field1: " + node.get("field1").asText());
                        System.out.println("field2: " + node.get("field2").asText());
                    }
                } else {
                    System.out.println("Error: records should be an array: skipping.");
                    jp.skipChildren();
                }
            } else {
                System.out.println("Unprocessed property: " + fieldName);
                jp.skipChildren();
            }
        }
    }
}

程式碼中使用流和樹模型解析的組合讀取此檔案。每個單獨的記錄都以樹形結構讀取，但檔案永遠不會完整地讀入記憶體，因此JVM記憶體不會爆炸。最終解決了讀取超大檔案的問題。

超大JSON檔案解析方案（Java）

解析超大JSON檔案 1、需求最近專案中需要將一個一個大於800M的JSON檔案匯出到Excel中，試過普通的按行讀取檔案和JSONReader流讀取檔案，由於JSON檔案實在過於龐大，導致OOM問題

Json檔案解析（上）

Json檔案解析（上）程式碼地址：https://github.com/nlohmann/json 自述檔案 alt=GitHub贊助商 data-canonical-src=\"https://img.shields.io/badge/GitHub-Sponsors-ff69b4\" v:shapes=\"_x0000_i1025\">

哈夫曼編碼—檔案的壓縮與解壓（Java）

哈夫曼編碼—檔案的壓縮與解壓（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

python解析.yml/.yaml檔案--pyyaml模組（第三方）

第一part:YAML檔案介紹 1.YAML檔案的定義：是一種比XML和JSON更輕的檔案格式，也更簡單更強大，它可以通過縮排來表示結構，是不是與Python使用有異曲同工之處；

Eclipse 匯入專案 .json 檔案報錯（出現小紅叉）

>>> 使用 eclipse 匯入一個 Maven 專案之後，裡面的 .json 檔案報錯出現小紅叉！

時序資料庫 Apache-IoTDB 原始碼解析之檔案索引塊（五）

上一章聊到 TsFile 的檔案組成，以及資料塊的詳細介紹。詳情請見：時序資料庫 Apache-IoTDB 原始碼解析之檔案資料塊（四）

C# Json 解析，針對數字開頭變數Json字串轉模型（Model）

namespace 解析數字開頭的變數JSON { class Program { static void Main(string[] args) { string strJson = \"{\\\"1st_attempt\\\":\\\"2021-02-09 16:32:15\\\",\\\"2nd_attempt\\\":\\\"2021-02-09 16:33:18\\\

上傳資料、下載模板檔案解決方案（前端：antd；後端：.Net Core WebAPI）

一、Excel 模板下載　　通過靜態檔案下載。將模板檔案放在根目錄的 public 資料夾下備用。

如何解析EML（郵件）格式的檔案以及一款小巧的EML郵件閱讀工具

在理解EML格式的時候，先回顧一下歷史，這樣有助於理解郵件的格式，比如郵件傳輸時為何會有多種編碼方式。此外，理解EML格式也有助於理解HTTP協議。

dat檔案資料讀取為map（java）

dat檔案的資料格式和json不一樣，python擁有庫進行檔案解析博主找了半天，也沒找到java相關的處理包

併發程式設計之多執行緒（Java）

一、執行緒與程式區別每個正在系統上執行的程式都是一個程式。每個程式包含一到多個執行緒。執行緒是一組指令的集合，或者是程式的特殊段，它可以在程式裡獨立執行。也可以把它理解為程式碼執行的上下文。所以執行緒

插入排序之希爾排序（Java）

插入排序之希爾排序（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

交換排序之快速排序（Java）

交換排序之快速排序（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

基數排序（Java）

基數排序（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

前端常見跨域解決方案（全）

什麼是跨域？跨域是指一個域下的文件或指令碼試圖去請求另一個域下的資源，這裡跨域是廣義的。

查詢--線性查詢（Java）

查詢--線性查詢（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

查詢--二分查詢（Java）

查詢--二分查詢（Java）部落格說明文章所涉及的資料來自網際網路整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯絡本人刪除，謝謝！

十大經典排序演算法（java）

十大經典排序演算法最強總結（含JAVA程式碼實現）轉載（https://www.cnblogs.com/guoyaohua/p/8600214.html）

簡單的時間格式轉換工具類（java）

import java.sql.Timestamp; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Calendar;

爬取csdn的資料與解析儲存（9）

安裝軟體： pip instal pymysq pip install peewee 建立資料模型orm from peewee import * db = MySQLDatabase(\"spider\", host=\"127.0.0.1\", port=3306, user=\"root\", password=\"root\")

超大JSON檔案解析方案（Java）

1、需求

2、解決方案

相關推薦