当前位置: 首页 > news >正文

itext7 html2pdf 将html文本转为pdf

1、将html转为pdf需求分析

经常会看到爬虫有这样的需求,将某一个网站上的数据,获取到了以后,进行分析,然后将需要的数据进行存储,也有将html转为pdf进行存储,作为原始存档,当然这里看具体的需求,可能有些不需要。

2、这里的itext7是pdf的工具,有一个html2pdf包,可以将html转为pdf,这里面可以是一段html文本也可以是一个html文件,这个根据不同的情况,我们可以通过不同的参数去实现。

通过图中我们可以知道,方法里的参数形式还是很丰富的。

3、引入依赖包pom.xml

<!-- iText7 Core --><dependency><groupId>com.itextpdf</groupId><artifactId>itext7-core</artifactId><version>7.1.16</version><type>pom</type></dependency><!-- HTML to PDF Add-On --><dependency><groupId>com.itextpdf</groupId><artifactId>html2pdf</artifactId><version>3.0.4</version></dependency>

4、编写测试类HtmlToPdfConverter

/**@date: 2025年4月14日
@author: 花花鱼
@filename: HtmlToPdfConverter.java
@func: 测试html文件生成pdf文件
*/
package com.example.utils;import com.itextpdf.html2pdf.HtmlConverter;
import com.itextpdf.kernel.pdf.PdfWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;public class HtmlToPdfConverter {public static void main(String[] args) {// HTML内容String htmlContent = "<h1>Hello, World!</h1><p>This is a paragraph.</p>";// 输出PDF文件的路径String dest = "output.pdf";try {// 创建PdfWriter实例用于写入PDF文件File file = new File(dest);System.out.println(file.getAbsoluteFile().toString());PdfWriter writer = new PdfWriter(new FileOutputStream(new File(dest)));// 创建PdfDocument实例
//            PdfDocument pdf = new PdfDocument(writer);// 使用HtmlConverter将HTML转换为PDFHtmlConverter.convertToPdf(htmlContent, writer);// 关闭文档
//            pdf.close();writer.close();System.out.println("PDF created successfully!");} catch (IOException e) {e.printStackTrace();}}
}

一个简单的html转为pdf文件就生成了,特别地:如果html比较复杂的话,可能需要进行额外的处理,这里是简单的测试, 更多功能待你去发掘。

相关文章:

itext7 html2pdf 将html文本转为pdf

1、将html转为pdf需求分析 经常会看到爬虫有这样的需求&#xff0c;将某一个网站上的数据&#xff0c;获取到了以后&#xff0c;进行分析&#xff0c;然后将需要的数据进行存储&#xff0c;也有将html转为pdf进行存储&#xff0c;作为原始存档&#xff0c;当然这里看具体的需求…...

设计模式:模板模式 - 固定流程与灵活扩展的完美结合

一、为什么使用模板模式&#xff1f; 权限校验、数据处理、用例设计等流程虽然遵循固定步骤&#xff0c;但每个具体实现却总有不同。如果没有合适的设计&#xff0c;重复代码会堆积&#xff0c;导致系统复杂度增加&#xff0c;维护成本上升。那如何解决这个问题&#xff0c;让…...

Java 设计模式:组合模式详解

Java 设计模式&#xff1a;组合模式详解 组合模式&#xff08;Composite Pattern&#xff09;是一种结构型设计模式&#xff0c;它允许将对象组织成树形结构&#xff0c;以统一的方式处理单个对象和对象集合。组合模式适用于需要表示“部分-整体”层次结构的场景&#xff0c;例…...

使用命令打开电脑的[服务]窗口

1.首先打开[开始],找到[运行], 2.或者用快捷命令“windows键R键”命令打开运行, 3.然后输入命令“services.msc”, 4.点[确定]就可以进入电脑的[服务]窗口了...

语音识别——根据声波能量、VAD 和 频谱分析周围是否有人说话

语音活动检测&#xff08;Voice Activity Detection&#xff0c;简称VAD&#xff09;。简单来说&#xff0c;VAD就是用来判断一段音频里有没有人说话的技术。在实时语音识别的场景里&#xff0c;这个技术特别重要&#xff0c;因为它决定了什么时候把采集到的音频数据扔进大模型…...

C++算法优化实战:破解性能瓶颈,提升程序效率

C算法优化实战&#xff1a;破解性能瓶颈&#xff0c;提升程序效率 在现代软件开发中&#xff0c;算法优化是提升程序性能的关键手段之一。无论是在高频交易系统、实时游戏引擎&#xff0c;还是大数据处理平台&#xff0c;算法的高效性直接关系到整体系统的性能与响应速度。C作…...

阿里滑块 231 231纯算 水果滑块 拼图 1688滑块 某宝 大麦滑块 阿里231 验证码

声明 本文章中所有内容仅供学习交流&#xff0c;抓包内容、敏感网址、数据接口均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff0c;若有侵权&#xff0c;请联系我立即删除&#xff01; # 欢迎交流 wjxch1004...

vs code Cline 编程接入Claude 3.7的经济方案,且保持原生接口能力

在当今快速发展的科技时代&#xff0c;自动化编程成为提高工作效率的重要手段。Cline AI自动编程工具&#xff0c;凭借其强大的智能算法&#xff0c;能够快速生成高质量的代码&#xff0c;帮助开发者节省大量的时间和精力。从简单的脚本到复杂的应用程序&#xff0c;Cline都能轻…...

kubectl命令补全以及oc命令补全

kubectl命令补全 1.安装bash-completion 如果你用的是Bash(默认情况下是)&#xff0c;先安装补全功能支持包 sudo apt update sudo apt install bash-completion -y2.为kubectl 启用补全功能 会话中临时&#xff1a; source <(kubectl completion bash)持久化配置&#x…...

css解决边框四个角有颜色

效果 html <div class"gradient-corner">2021年</div>css background:/* 左上角横线 */linear-gradient(90deg, rgb(5, 150, 247) 9px, transparent 0) 0 0,/* 左上角竖线 */linear-gradient(0deg, rgb(5, 150, 247) 9px, transparent 0) 0 0,/* 右上…...

快速入手K8s+Docker+KubeSphere+DevOps

引用&#xff1a;云原生Java架构师的第一课K8sDockerKubeSphereDevOps_哔哩哔哩_bilibili 学习K8sDockerKubeSphereDevOps的可以学习该视频...

Spark-SQL核心编程

DataFrame 创建 DataFrame 在 Spark SQL 中 SparkSession 是创建 DataFrame 和执行 SQL 的入口&#xff0c;创建 DataFrame 有三种方式&#xff1a;通过 Spark 的数据源进行创建&#xff1b;从一个存在的 RDD 进行转换&#xff1b;还可以从 Hive Table 进行查询返回。 从…...

Go 1.24 新方法:编写性能测试用例方法 testing.B.Loop 介绍

Go 开发者在使用 testing包编写基准测试用例时&#xff0c;如果不注意&#xff0c;可能会遇到各种陷阱。这些陷阱&#xff0c;导致基准测试结果不准确。Go1.24 版本引入了一种新的基准测试编写方式&#xff0c;它同样易用&#xff0c;并且可以帮助规避编写基准测试时的一些坑。…...

【神经网络结构的组成】深入理解 转置卷积与转置卷积核

&#x1f308; 个人主页&#xff1a;十二月的猫-CSDN博客 &#x1f525; 系列专栏&#xff1a; &#x1f3c0;《深度学习理论直觉三十讲》_十二月的猫的博客-CSDN博客 &#x1f4aa;&#x1f3fb; 十二月的寒冬阻挡不了春天的脚步&#xff0c;十二点的黑夜遮蔽不住黎明的曙光 …...

GpuGeek:重构AI算力基础设施,赋能产业智能升级

在数字经济与实体经济深度融合的今天&#xff0c;人工智能已成为推动产业变革的核心驱动力。作为AI技术落地的关键支撑&#xff0c;算力基础设施正经历从"资源供给"向"服务赋能"的范式转变。GpuGeek凭借创新的技术架构和运营模式&#xff0c;重新定义了AI算…...

(2025亲测可用)Chatbox多端一键配置Claude/GPT/DeepSeek-网页端配置

1. 资源准备 API Key&#xff1a;此项配置填写在一步API官网创建API令牌&#xff0c;一键直达API令牌创建页面创建API令牌步骤请参考API Key的获取和使用API Host&#xff1a;此项配置填写https://yibuapi.com/v1查看支持的模型请参考这篇教程模型在线查询 2. ChatBox网页版配…...

质变科技发布自主数据分析MCP Server

2025年4月9日&#xff0c;质变科技正式发布Relyt AI MCP&#xff08;Model Context Protocol&#xff09;&#xff0c;结合Relyt AI 在自主数据分析领域的前沿积累与MCP的开放连接能力&#xff0c;我们为用户带来了一个更智能、更灵活的数据交互生态系统。这一发布不仅拓展了Re…...

【17】Strongswan bus详解2

add_listener&#xff1a; &#xff08;1&#xff09;初始化一个entry&#xff0c;并将要添加的listener赋值entry。 &#xff08;2&#xff09;添加到bus的listeners链表的尾部。 remove_listener&#xff1a; &#xff08;1&#xff09;遍历listeners&#xff0c;通过内存位置…...

【Windows】系统安全移除移动存储设备指南:告别「设备被占用」弹窗

Windows系统安全移除移动存储设备指南&#xff1a;告别「设备被占用」弹窗 解决移动硬盘和U盘正在被占用无法弹出 一、问题背景 使用Windows系统时&#xff0c;经常遇到移动硬盘/U盘弹出失败提示「设备正在使用中」&#xff0c;即使已关闭所有可见程序。本文将系统梳理已验证…...

DeepSeek 与开源:肥沃土壤孕育 AI 硕果

当 DeepSeek 以低成本推理、多模态能力惊艳全球时&#xff0c;人们惊叹于国产AI技术的「爆发力」&#xff0c;却鲜少有人追问&#xff1a;这份爆发力的根基何在&#xff1f; 答案&#xff0c;藏在中国开源生态二十余年的积淀中。 从倪光南院士呼吁「以开源打破垄断」&#xf…...

[从零开始学数据库] 基本SQL

注意我们的主机就是我们的Mysql数据库服务器 这里我们可以用多个库 SQL分类(核心是字段的CRUD)![](https://i-blog.csdnimg.cn/img_convert/0432d8db050082a49258ba8a606056c7.png) ![](https://i-blog.csdnimg.cn/img_convert/bdf5421c2b83e22beca12da8ca89b654.png) 重点是我…...

uniapp开发android原生插件-java版本

一、uniapp官方文档 uni原生插件文档 二、开发流程 1、检测本地uniapp的版本号 2、根据版本号&#xff0c;下载uni提供的对应android的sdk对应demo 下载地址&#xff1a;Android 离线SDK - 正式版 | uni小程序SDK 下载文件后&#xff0c;复制出UniPlugin-Hello-AS&#xff…...

git在IDEA中使用技巧

git在IDEA中使用技巧 merge和rebase 参考&#xff1a;IDEA小技巧-Git的使用 git回滚、强推、代码找回 参考&#xff1a;https://www.bilibili.com/video/BV1Wa411a7Ek?spm_id_from333.788.videopod.sections&vd_source2f73252e51731cad48853e9c70337d8e cherry pick …...

DeepSeek 接入 Excel 完整教程

一、前期准备 1.1 获取 DeepSeek API 密钥 注册 DeepSeek 平台 访问 DeepSeek 官方网站&#xff08;或指定的 API 服务平台&#xff0c;如硅基流动等&#xff09;。若尚未注册&#xff0c;按照平台指引创建新账号并完成登录。 创建 API 密钥 进入用户控制面板&#xff0c;找到…...

【项目管理】第15章 项目风险管理-- 知识点整理

项目管理-相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 (一)知识总览 项目管理知识域 知识点: (项目管理概论、立项管理、十大知识域、配置与变更管理、绩效域) 对应:第6章-第19章 第6章 项目管理概论 4分第13章 项目资源管理 3-4分第7章 项目…...

如何将自己的项目推送到GitHub上面去

将项目推送到GitHub的流程总结 以下是将本地项目推送到GitHub仓库的完整流程&#xff1a; 1. 初始化Git仓库&#xff08;如果尚未初始化&#xff09; cd 项目目录 git init2. 配置远程仓库 # 添加远程仓库地址 git remote add origin https://github.com/用户名/仓库名.git…...

C/C++基础

C开发环境 纯语言开发要求&#xff1a;CIDE。 极简C/C 语法规则 仅记原始规则&#xff0c;把握编程的本质&#xff0c;不做孔乙己&#xff0c;要做说干就干的平头哥。 原始的规则&#xff1a; 各“语法单位”&#xff08;组成部分&#xff09;使用任意个&#xff08;至少1个…...

Qt炫酷仪表盘

Qt学习优化的一款汽车仪表控件,根据github上面开源的进行优化,主要使用QPainter实现的一款炫酷仪表盘,其中的渐变效果比较有感觉 实现结果 仪表盘 实现源码 h文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QPixmap> #include <QTimer&…...

云渗透一(云租户渗透⼊⻔)

云平台介绍 阿⾥云 阿⾥云创⽴于 2009 年,服务着制造、⾦融、政务、交通、医疗、电信、能源等众多领域的领军企业,包 括中国联通、12306 、中⽯化、中⽯油、⻜利浦、华⼤基因等⼤型企业客户,以及微博、知乎、锤⼦科技 等明星互联⽹公司。 应⽤程序访问令牌 - T1527 云实例…...

R绘图|6种NMDS(非度量多维分析)绘图保姆级模板——NMDS从原理到绘图,看师兄这篇教程就够了

感谢西农听雨同学对本文提供的大力支持&#xff01; 一、引言 非度量多维尺度分析&#xff08;NMDS&#xff09;是一种用来简化复杂数据的工具&#xff0c;特别适合处理那些难以直接理解的高维数据&#xff08;微生物群落数据&#xff09;。它的主要目的是把数据“压缩”到更低…...

spark-SQL核心编程

1. Spark-SQL简介 起源与发展&#xff1a;Spark-SQL前身为Shark&#xff0c;因对Hive依赖制约Spark发展而被弃用。它汲取Shark优点重新开发&#xff0c;在数据兼容、性能优化和组件扩展方面表现出色。 特点&#xff1a;易整合&#xff0c;统一数据访问&#xff0c;兼容Hive&…...

使用MCP服务通过自然语言操作数据库(vscode+cline版本)

使用MCP服务操纵数据库(vscodecline版本) 本文主要介绍&#xff0c;在vscode中使用cline插件调用deepseek模型&#xff0c;通过MCP服务器 使用自然语言去操作指定数据库。本文使用的是以己经创建号的珠海航展数据库。 理解MCP服务&#xff1a; MCP&#xff08;Model Context…...

.NET Core DI(依赖注入)的生命周期及应用场景

在.NET中&#xff0c;依赖注入&#xff08;DI&#xff0c;Dependency Injection&#xff09;是一种设计模式&#xff0c;它通过将依赖关系注入到类中&#xff0c;而不是让类自己创建依赖项&#xff0c;来降低类之间的耦合度。这使得代码更加模块化、灵活和易于测试。在.NET中&a…...

VSCode写java时常用的快捷键

首先得先安好java插件 1、获取返回值 这里是和idea一样的快捷键的&#xff0c;都是xxxx.var 比如现在我new一个对象 就输入 new MbDo().var // 点击回车即可变成下面的// MbDo mbDo new MbDo()//以此类推get方法也可获取 mbDo.getMc().var // 点击回车即可变成下面的 // St…...

Java微服务流量控制与保护技术全解析:负载均衡、线程隔离与三大限流算法

在微服务架构中&#xff0c;流量控制与系统保护是保障服务高可用的核心要素。本文将深入剖析负载均衡原理、线程隔离机制&#xff0c;并通过Java代码实例详解滑动窗口、漏桶、令牌桶三大限流算法&#xff0c;帮助开发者构建健壮的分布式系统。 一、负载均衡核心原理与实践 1.1 …...

Java 企业级应用:SOA 与微服务的对比与选择

企业级应用开发中&#xff0c;架构设计是决定系统可扩展性、可维护性和性能的关键因素。SOA&#xff08;面向服务的架构&#xff09;和微服务架构是两种主流的架构模式&#xff0c;它们各自有着独特的和设计理念适用场景。本文将深入探讨 SOA 和微服务架构的对比&#xff0c;并…...

Nacos深度剖析与实践应用 -1

&#x1f4f9; Nacos背景 在现在数字化快速发展的时代&#x1f684;&#xff0c;微服务架构已成为构建大型分布式系统的主流架构模式。随着微服务数量的不断增加&#xff0c;服务之间的通信、配置管理以及服务的高可用性等问题变得愈发复杂。Nacos 作为阿里巴巴开源的一个动态服…...

WinForm真入门(16)——LinkLabel 控件详解

以下是 WinForm 中 LinkLabel 控件的基本概念、核心属性、事件及典型应用案例的总结&#xff1a; 一、基本概念‌ LinkLabel 是 WinForm 中用于显示超链接文本的控件&#xff0c;继承自 Label&#xff0c;支持单链接或多链接区域。用户点击链接时可触发自定义行为&#xff0…...

功能丰富的PDF处理免费软件推荐

软件介绍 今天给大家介绍一款超棒的PDF工具箱&#xff0c;它处理PDF文档的能力超强&#xff0c;而且是完全免费使用的&#xff0c;没有任何限制。 TinyTools&#xff08;PC&#xff09;这款软件&#xff0c;下载完成后即可直接打开使用。在使用过程中&#xff0c;操作完毕后&a…...

【MySQL高级】事务,存储引擎,索引(一)

Mysql高级 DQL查询语句 反引号 模糊查询避免%出现在开头,会造成索引失效 order by排序先后 表名列名都需要用${}&#xff0c;他们不能带’’ 去重统计数量 null的运算 分组函数会自动忽略null&#xff0c;不用对null进行处理 截取子串substr&#xff08;字段&#xff0c;下标…...

React 之 Redux 第三十二节 Redux 常用API及HOOKS,以及Redux Toolkit核心API使用详解

一、4.X版本中核心 API 和用途 1. createStore(reducer, [preloadedState], [enhancer]) 用途: 创建 Redux Store&#xff08;数据仓库&#xff09; 参数: reducer: 状态更新函数 preloadedState: 初始状态&#xff08;可选&#xff09; enhancer: 中间件增强器&#xff08;如…...

react tailwindcss最简单的开始

参考教程&#xff1a; Install Tailwind CSS with Vite - TailwindCSS中文文档 | TailwindCSS中文网https://www.tailwindcss.cn/docs/guides/vite操作过程&#xff1a; Microsoft Windows [版本 10.0.26100.3476] (c) Microsoft Corporation。保留所有权利。D:\gitee\tailwi…...

波束形成(BF)从算法仿真到工程源码实现-第九节-延迟相减波束形成(delay sub)

一、概述 本节对delay sub算法进行仿真。更多资料和代码可以进入https://t.zsxq.com/qgmoN &#xff0c;同时欢迎大家提出宝贵的建议&#xff0c;以共同探讨学习。 二、代码仿真 import numpy as np import soundfile as sf import scipy import matplotlib.pyplot as pltfft…...

系统假死问题排查

系统假死定义 应用进程存在&#xff0c;但是无法正常提供服务&#xff08;请求没有响应&#xff0c;或者响应超时&#xff09;。 系统假死原因 主要分为两大类&#xff1a;连接无法建立、请求无法处理&#xff0c;如下图所示&#xff1a; 系统假死的原因还是比较多的&…...

图像处理有哪些核心技术?技术发展现状如何?

在数字化信息爆炸的时代&#xff0c;文档图像预处理技术正悄然改变着我们处理文字信息的方式。无论是手持拍摄的收据、扫描仪中的身份证&#xff0c;还是工业机器人采集的复杂文档&#xff0c;预处理技术都在背后默默提升着OCR&#xff08;光学字符识别&#xff09;系统的性能。…...

解决在linux下运行rust/tauri项目出现窗口有内容,但是渲染出来成纯黑问题

起因 最近折腾了一下rust/tauri程序开发&#xff0c;据说这玩意性能非常牛皮就玩了一下&#xff0c;但是我运行打包一直出现一个奇怪问题&#xff0c;窗口能正常打开&#xff0c;但是是纯黑的什么内容都没有&#xff0c;鼠标移上去又发现指针会变换&#xff08;看起来是内容又…...

计算机网络:流量控制与可靠传输机制

目录 基本概念 流量控制&#xff1a;别噎着啦&#xff01; 可靠传输&#xff1a;快递必达服务 传输差错&#xff1a;现实中的意外 滑动窗口 基本概念 换句话说&#xff1a;批量发货排队验收 停止-等待协议 SW&#xff08;发1份等1份&#xff09; 超时重传&#xff1a;…...

vue2改变el-message字体、图标尺寸样式(vue2,element-ui)

前言 最近接手一个项目&#xff0c;vue2elementui的,产品觉得message的字体太小了&#xff0c;展示起来看不清&#xff0c;所以需求就是把message的字体和图标变大&#xff0c;实现路径如下&#xff1a; 找到自己的main.scss文件&#xff0c;并且加上对应内容&#xff1a; .e…...

【笔记ing】AI大模型-05单层感知机与多层感知机

单层感知机&#xff0c;是一种最简单的人工神经网络 输入层input layer&#xff0c;输入的样本特征 输出层output layer&#xff0c;输出的预测结果 权值W(w0,w1,w2,...,wn)^T&#xff0c;感知机的权值参数&#xff0c;其中的w0叫做偏置&#xff0c;也称截距&#xff0c;类似…...

分布式热点网络

核心设计理念&#xff1a; 在自然灾害&#xff08;地震、洪水、台风&#xff09;、极端环境&#xff08;无人区&#xff09;及网络管制&#xff08;欠费停机&#xff09;等场景下&#xff0c;传统中心化网络易因核心节点失效导致全局瘫痪。本方案提出构建去中心化设备网络&…...