poi實現doc轉html獲取帶樣式內容，並在ueditor中顯示

阿新 • • 發佈：2019-01-25

doc轉html獲取帶樣式內容，並在ueditor中顯示

工具類：

獲取返回的內容，存到資料庫。

package com.wb.core.utils;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.w3c.dom.Document;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.*;
public class DocToHtml {
	public static void main(String argv[]) {
        try {
        	String content=wordToHtml("D:\\a.doc");
        	System.out.println(content);
        	String content1=wordToHtml("D:\\b.docx");
        	System.out.println(content1);
        } catch (Exception e) {
            e.printStackTrace();
        }        	     
    }   
	 public static String wordToHtml(String filePath) throws Exception{
		 if(filePath.endsWith(".doc")){
			 String content=convert2Html(filePath);
			 return content;
		 }
		 if(filePath.endsWith(".docx")){
			 String content=docxToHtml(filePath);
			 return content;
		 }
		 return null;
	 }
	//docx轉html
	//生成html檔案
	//輸出html標籤和內容
    public static String docxToHtml(String sourceFileName) throws Exception {
    	String htmlPath=sourceFileName.substring(0,sourceFileName.indexOf("."))+".html";
		XWPFDocument document = new XWPFDocument(new FileInputStream(sourceFileName));
		XHTMLOptions options = XHTMLOptions.create().indent(4);
		File outFile = new File(htmlPath);
		outFile.getParentFile().mkdirs();
		OutputStream out = new FileOutputStream(outFile);
		XHTMLConverter.getInstance().convert(document,out, options);		
		ByteArrayOutputStream baos = new ByteArrayOutputStream();
		XHTMLConverter.getInstance().convert(document, baos, options); 				
		baos.close();
		String content =new String(baos.toByteArray());
		//替換UEditor無法識別的轉義字元
		String htmlContent1=content.replaceAll("&ldquo;","\"").replaceAll("&rdquo;","\"").replaceAll("&mdash;","-");
		return htmlContent1;    	
    }
    //doc 轉 html 
    public static String convert2Html(String fileName)
            throws TransformerException, IOException,
            ParserConfigurationException {

        HWPFDocument wordDocument = new HWPFDocument(new FileInputStream(fileName));//WordToHtmlUtils.loadDoc(new FileInputStream(inputFile));
         //相容2007 以上版本
        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder()
                        .newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        //解析html
        Document htmlDocument = wordToHtmlConverter.getDocument();      
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);      
        StreamResult streamResult = new StreamResult(out);
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();    
        serializer.setOutputProperty(OutputKeys.ENCODING, "GB2312");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "HTML");
        serializer.transform(domSource, streamResult);
        out.close();
        String htmlContent=new String(out.toByteArray());
        //替換UEditor無法識別的轉義字元
        String htmlContent1=htmlContent.replaceAll("&ldquo;","\"").replaceAll("&rdquo;","\"").replaceAll("&mdash;","-");       
        return htmlContent1;
    }
   
}

1.在ueditor.all.js檔案內搜尋allowDivTransToP,找到如下的程式碼，將true設定為false，即不使用預設的過濾處理，預設是過濾掉html,style的。

2.在下邊的addInputRule方法中將switch程式碼段中的case style,script都給註釋或者刪掉，防止UEditor將html,<style>轉化成其他標籤。

3.在ueditor.config.js中新增xss的白名單html,head,body,style，不過濾這些標籤，就可以在UEditor上顯示樣式。

注意：如果還是不顯示樣式，看下引入的是不是ueditor.all.js。

poi實現doc轉html獲取帶樣式內容，並在ueditor中顯示

doc轉html獲取帶樣式內容，並在ueditor中顯示工具類：獲取返回的內容，存到資料庫。 package com.wb.core.utils; import org.apache.poi.hwpf.HWPFDocument; import org.apach

用poi實現doc轉html

alt 保存圖片 man input bdb result amr try catch 廢話，不多說直接上代碼。一、doc轉html，並且帶文件夾 / * word轉html * html轉圖片 * @param tagPath 轉換htm

以poi實現PPT轉html

temp nts user 阿裏 oat ali bag exc ffffff 哈哈，終於兩個月了（筆者不玩網遊，雖然脾氣越來越不好，但是生活越來越充實）。不扯了，今晚還要再寫一篇呢，直接上代碼。 package com.css.java.learn

Excel轉Html(五)-POI解析excel轉HTML-表格邊框-樣式對應關係

public static final short BORDER_NONE = 0;

linux下實現doc轉html

1. 概述 windows下藉助.net好解決這個問題. 嘗試python java php 都被坑了，尤其是docx之前的word版本。最終解決辦法：libreoffice 2. 安裝 yum install libreoffice libreoffice-he

Java引用POI實現Word轉Html方法

1.下載POI工具並引用 2.讀取整個doc文件，獲得該文件的所有字串。 3.從該字串中得到標題，把該標題構成一個HTML格式的字串，如<html><head><title>測試文件</title></head&

POI實現Word轉HTML檔案

package cn.wgd.util; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOExcept

練習十五：要求：獲取輸入的內容，並利用條件運算付的巢狀方式完成該題目

題目：學習成績>=90分的同學用A表示，60-89分之間的用B表示，60分以下的用C表示 1 inputscort = input("學生的成績：") 2 if inputscort.isdigit(): 3 inputscort = int(inputscort) 4

Excel轉Html(六)-POI解析excel轉HTML-表項內容位置-樣式關係對映-Excel-cell>Html-td

CellStyle： public static final short ALIGN_GENERAL = 0; public static final short ALIGN_LEFT = 1; text-a

POI 讀取 Excel 轉 HTML 支援 03xls 和 07xlsx 版本包含樣式，03xls07xlsx

package com.ist.util; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import

Razor TagHelper實現Markdown轉HTML

set mar comment ctu 流行更強 import 編寫 normal Markdown是一種可以使用普通文本編輯器編寫的標記語言，通過簡單的標記語法，它可以使普通文本內容具有一定的格式。用途 Markdown的語法簡潔明了、學習容易，而且功能比純文本更

PCB MS SQL 標量函式(CLR) 實現DataTable轉HTML的方法

一.準備需轉為HMLT字串的DataTable資料在資料庫中執行一段SQL返回的資料需轉換後的HTML的文字 <

如何快速實現 markdown 轉 HTML 文件？

我想要在 Github 上開一個主題部落格，我希望通過 Markdown 語法寫作，然後生成 HTML 並附帶自定義樣式顯示在網頁上。我找到了 gulp-markdown 這個庫，看起來符合我的需求場景。然而這個庫有一個問題，他只能將 Markdown 語法書寫的文字轉換為 HTML 標籤，但並不能自動新

vue使用marked.js實現markdown轉html並提取標題生成目錄

find ++ 樹結構 tcl ble property avi mat exp <template> <div class="wrapper"> <div class="container">

pdf2htmlEX實現pdf轉html

首先要感謝pdf2htmlEX的作者Lu Wang，該軟體是一個pdf轉html的開源軟體，效果非常理想。下面兩張圖片是html和pdf檢視下的截圖：本人開發的一個功能：文件線上閱讀，要求能夠支援移動終端瀏覽器線上閱讀。考慮過將文件先轉pdf，然後在將pdf轉s

doc轉html在tomcat8下亂碼

專案中有使用WordToHtmlConverter將word文件轉成HTML頁面的功能，在tomcat6中執行沒有問題，最近遷移到tomcat8後出現了亂碼問題，docx正常但是doc文件轉html會出現亂碼。使用sublimetext直接開啟生成的jsp頁

C# web實現word 轉Html、office轉Html、pdf轉圖片線上預覽檔案

改篇 pdf 預覽再本機沒問題，釋出再iis中不行，（使用剪貼簿的問題..excel和word 可以,）詳細配置及程式碼 word 轉Html 複製程式碼 1 /// <summary> 2 /// word轉成html 3

Java用POI實現根據Excel表格模板生成新的Excel並實現資料輸出

一、模板excel結果excel二、專案所需jar包poi-3.11-20141221.jarpoi-examples-3.11-20141221.jarpoi-excelant-3.11-20141221.jarpoi-ooxml-3.11-20141221.jarpoi-

Angular6實現繫結HTML自定義屬性的值以及CSS中background屬性的資料繫結

今天用Angular6在整合網上一個程式碼的時候，他的程式碼的一個HTML標籤有幾個自定義標籤，然後我以為轉換到Angular後和不是自定義標籤一樣直接加[]就可以了，但是一直報錯。這裡顯示沒有這個屬性解決方案：去除[]並且加上attr.就可以了

ios開發：怎麼實現點選一個按鈕，跳轉到一個新的介面，並回退到上一介面

iOS三種檢視切換的原理各不相同：UITabBarController：以平行的方式管理檢視，各個檢視之間往往關係並不大，每個加入到UITabBarController的檢視都會進行初始化即使當前不顯示在介面上，相對比較佔用記憶體。UINavigationControlle

poi實現doc轉html獲取帶樣式內容，並在ueditor中顯示

doc轉html獲取帶樣式內容，並在ueditor中顯示

相關推薦