
Maven 配置推荐repositories repository idcom.e-iceblue/id namee-iceblue/name urlhttps://repo.e-iceblue.com/nexus/content/groups/public//url /repository /repositories dependencies dependency groupIde-iceblue/groupId artifactIdspire.doc.free/artifactId version14.3.1/version /dependency /dependenciesGradle 配置implementation e-iceblue:spire.doc.free:14.3.1jar#2.2 适用场景文档在线预览系统将本地 Word 转为 HTML 直接在网页展示内容迁移Word 文案批量转为网页格式轻量文档处理无付费需求、仅需基础格式转换的小型业务场景#2.3 支持格式输入.docWord 97-2003、.docxWord 2007 输出标准 HTML 格式三、Word 转 HTML 核心技术#3.1 转换原理该库会解析 Word 文档结构段落、表格、图片、样式等并映射为 HTML 标签 CSS 样式支持文本、表格、图片、超链接、页眉页脚等绝大多数常用元素。#3.2 核心 APIDocumentWord 文档的核心操作类负责加载、保存文档FileFormat.Html指定转换格式为 HTMLHtmlExportOptionsHTML 导出配置类高级定制#3.3 基础转换代码import com.spire.doc.*; public class WordToHtml { public static void main(String[] args) { // 1. 创建 Document 实例 Document doc new Document(); // 2. 加载 Word 文档 doc.loadFromFile(C:\input\sample.docx); // 3. 保存为 HTML 文件 doc.saveToFile(C:\output\toHtml.html, FileFormat.Html); // 4. 释放资源 doc.dispose(); System.out.println(Word 转 HTML 基础转换完成); } }四、高级定制转换HtmlExportOptions通过HtmlExportOptions可以自定义 CSS 样式、图片存储、页眉页脚等核心配置。#4.1 核心配置项CSS 样式策略InternalCSS 内嵌到 HTML 文件默认ExternalCSS 生成独立.css文件图片存储策略外部存储图片生成_images文件夹默认Base64 嵌入图片直接写入 HTML单文件分发页眉页脚可选择是否导出hasHeadersFooters#4.2 完整高级定制代码import com.spire.doc.Document; import com.spire.doc.FileFormat; import com.spire.doc.documents.html.HtmlExportOptions; import com.spire.doc.documents.html.CssStyleSheetType; public class WordToHtmlAdvanced { public static void main(String[] args) { Document doc null; try { doc new Document(); doc.loadFromFile(sample.docx); // 高级配置