Javaを使用してWordをHTMLに変換する方法

この記事では、JAVAプログラムのDocument.saveToFile()メソッドを使用してWord文書をHTML文書に変換する方法を紹介します。コードを編集する前に、次の環境構成を参照して、jarパッケージをインポートしてください。

 

プログラム環境

IntelliJ IDEA 2018(jdk 8.0)

テストドキュメント:Word 2013(.docx)

Jarパッケージ:Free Spire.Doc for Java 3.9.0

 

次はjarをインポートする方法です

 

jarパッケージをローカルにダウンロードして解凍し、ローカルのlibフォルダーにあるSpire.Doc.jarをJavaプログラムにインポートします。手順は次のとおりです。

f:id:uha_noki:20220126112730p:plain

f:id:uha_noki:20220126112749p:plain

f:id:uha_noki:20220126112800p:plain

インポートした結果は以下のように:

f:id:uha_noki:20220126112820p:plain

コード一覧

Java

import com.spire.doc.*;

public class WordtoHtml {
    public static void main(String[] args) {
        Document  doc = new Document();
        doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\test.docx");
        doc.saveToFile("wordtohtml.html",FileFormat.Html);
        doc.dispose();
    }
}

変換した結果

Wordテストドキュメント

f:id:uha_noki:20220126113032p:plain

変換したHTMLファイル

f:id:uha_noki:20220126113053p:plain

コード内のファイルパスはIDEAプログラムプロジェクトフォルダーパスです。ファイルパスは、他のパスにカスタマイズすることもできます。

では以上は今回のWordをHTMLファイルに変換する方法でした、最後まで読んでいただきありがとうございます。