【图像大模型】基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析
基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析
- 一、技术背景与核心创新
- 1.1 图像超分辨率技术演进
- 1.2 核心技术创新对比
- 二、算法原理深度解析
- 2.1 网络架构设计
- 2.1.1 RRDB模块结构
- 2.2 损失函数设计
- 2.2.1 对抗损失(Adversarial Loss)
- 2.2.2 感知损失(Perceptual Loss)
- 2.2.3 像素损失(Pixel Loss)
- 2.3 训练策略优化
- 三、项目部署与实战指南
- 3.1 环境配置
- 3.2 模型推理
- 3.2.1 快速测试
- 3.2.2 视频处理
- 3.3 模型训练
- 3.3.1 数据准备
- 3.3.2 启动训练
- 四、代码架构深度解析
- 4.1 核心模块实现
- 4.1.1 RRDB模块
- 4.1.2 相对判别器
- 4.2 推理优化技术
- 五、常见问题与解决方案
- 5.1 显存不足问题
- 5.2 输出图像伪影
- 5.3 训练不收敛
- 六、论文理论与实验分析
- 6.1 核心贡献
- 6.2 实验结果
- 6.3 消融实验
- 七、工程优化与扩展应用
- 7.1 模型压缩技术
- 7.2 移动端部署
- 7.3 扩展应用场景
- 八、未来研究方向
- 8.1 视频超分辨率
- 8.2 无监督学习
- 8.3 多任务联合学习
一、技术背景与核心创新
1.1 图像超分辨率技术演进
图像超分辨率(Super-Resolution, SR)技术旨在从低分辨率图像恢复高分辨率细节。传统方法如双三次插值存在模糊问题,基于深度学习的SRCNN首次引入卷积神经网络。ESRGAN(Enhanced Super-Resolution Generative Adversarial Networks)作为SRGAN的改进版本,在ECCV 2018获得PIRM-SR挑战赛冠军,其核心创新在于:
- 残差密集块结构(RRDB):增强特征传播能力
- 改进的对抗训练策略:使用相对判别器(Relativistic Discriminator)
- 感知损失优化:结合VGG特征空间与像素空间
1.2 核心技术创新对比
特性 | SRGAN | ESRGAN |
---|---|---|
基础网络结构 | ResBlock | RRDB |
判别器类型 | Standard | Relativistic |
感知损失计算 | VGG19_conv3 | VGG19_conv5 |
激活函数 | ReLU | LeakyReLU |
二、算法原理深度解析
2.1 网络架构设计
ESRGAN采用生成对抗网络框架,包含生成器G和判别器D:
class RRDBNet(nn.Module): # 生成器def __init__(self, in_nc=3, out_nc=3, nf=64, nb=23, gc=32):super(RRDBNet, self).__init__()RRDB_block_f = functools.partial(RRDB, nf=nf, gc=gc)self.trunk = make_layer(RRDB_block_f, nb)class Discriminator_VGG_128(nn.Module): # 判别器def __init__(self, in_nc=3, base_nf=64):super(Discriminator_VGG_128, self).__init__()self.conv0 = ConvBlock(in_nc, base_nf)
2.1.1 RRDB模块结构
残差密集块(Residual-in-Residual Dense Block)数学表达:
F out = F in + γ ⋅ Conv 3 × 3 ( LReLU ( D 3 ( D 2 ( D 1 ( F in ) ) ) ) ) F_{\text{out}} = F_{\text{in}} + \gamma \cdot \text{Conv}_{3×3}(\text{LReLU}(D_3(D_2(D_1(F_{\text{in}}))))) Fout=Fin+γ⋅Conv3×3(LReLU(D3(D2(D1(Fin)))))
其中 D i D_i Di表示稠密连接层, γ \gamma γ为可学习的残差缩放因子(默认0.2)
2.2 损失函数设计
ESRGAN采用三部分损失函数的加权组合:
L = λ perc L perc + λ adv L adv + λ pixel L pixel \mathcal{L} = \lambda_{\text{perc}}\mathcal{L}_{\text{perc}} + \lambda_{\text{adv}}\mathcal{L}_{\text{adv}} + \lambda_{\text{pixel}}\mathcal{L}_{\text{pixel}} L=λpercLperc+λadvLadv+λpixelLpixel
2.2.1 对抗损失(Adversarial Loss)
引入相对判别器概念:
L adv = − E x r [ log ( D ( x r , x f ) ) ] − E x f [ log ( 1 − D ( x f , x r ) ) ] \mathcal{L}_{\text{adv}} = -\mathbb{E}_{x_r}[\log(D(x_r, x_f))] - \mathbb{E}_{x_f}[\log(1-D(x_f, x_r))] Ladv=−Exr[log(D(xr,xf))]−Exf[log(1−D(xf,xr))]
其中 x r x_r xr为真实图像, x f x_f xf为生成图像
2.2.2 感知损失(Perceptual Loss)
基于VGG19深层特征:
L perc = 1 C j H j W j ∣ ∣ ϕ j ( G ( x ) ) − ϕ j ( x H R ) ∣ ∣ 1 \mathcal{L}_{\text{perc}} = \frac{1}{C_jH_jW_j}||\phi_j(G(x)) - \phi_j(x^{HR})||_1 Lperc=CjHjWj1∣∣ϕj(G(x))−ϕj(xHR)∣∣1
ϕ j \phi_j ϕj表示VGG19第j层特征提取器(默认conv5_4)
2.2.3 像素损失(Pixel Loss)
L1范数约束:
L pixel = ∣ ∣ G ( x ) − x H R ∣ ∣ 1 \mathcal{L}_{\text{pixel}} = ||G(x) - x^{HR}||_1 Lpixel=∣∣G(x)−xHR∣∣1
2.3 训练策略优化
- 两阶段训练:先预训练PSNR导向模型,再微调GAN模型
- 学习率衰减:采用余弦退火策略
- 梯度裁剪:限制生成器梯度范数
三、项目部署与实战指南
3.1 环境配置
推荐使用Anaconda创建虚拟环境:
conda create -n esrgan python=3.8
conda install pytorch==1.9.0 torchvision==0.10.0 cudatoolkit=11.1 -c pytorch
pip install opencv-python tqdm numpy scikit-image
硬件要求:
- GPU:NVIDIA GPU(显存≥8GB)
- 显存占用:输入512x512图像约占用10GB显存
3.2 模型推理
3.2.1 快速测试
python test.py models/RRDB_PSNR_x4.pth --input testsets/Set5 --scale 4
关键参数:
--tile
:分块处理大尺寸图像--self_ensemble
:8种几何变换增强--model_type
:选择PSNR或GAN版本
3.2.2 视频处理
python video_process.py --input video.mp4 --output result.mp4 \--model_path models/RRDB_ESRGAN_x4.pth
处理流程:
- 视频拆解为帧序列(保持原帧率)
- 逐帧应用超分模型
- 重组帧序列并编码为视频
3.3 模型训练
3.3.1 数据准备
建议使用DIV2K数据集:
DIV2K/train_HR/0801.png0802.png...train_LR_bicubic/X4/0801x4.png...
3.3.2 启动训练
python train.py -opt options/train_ESRGAN.yml
配置文件关键参数:
network_G:which_model_G: RRDBnf: 64nb: 23
train:lr_G: 1e-4lr_D: 1e-4pixel_criterion: l1feature_criterion: l1
四、代码架构深度解析
4.1 核心模块实现
4.1.1 RRDB模块
class RRDB(nn.Module):def __init__(self, nf, gc=32):super(RRDB, self).__init__()self.RDB1 = ResidualDenseBlock_5C(nf, gc)self.RDB2 = ResidualDenseBlock_5C(nf, gc)self.RDB3 = ResidualDenseBlock_5C(nf, gc)self.gamma = nn.Parameter(torch.zeros(1))def forward(self, x):out = self.RDB1(x)out = self.RDB2(out)out = self.RDB3(out)return x + self.gamma * out
4.1.2 相对判别器
class RelativisticDiscriminator(nn.Module):def forward(self, real, fake):real_logit = self.discriminator(real)fake_logit = self.discriminator(fake)return torch.sigmoid(fake_logit - real_logit.mean())
4.2 推理优化技术
- 分块处理(Tiling):解决大尺寸图像显存限制
- 自集成(Self-Ensemble):8种几何变换增强精度
- 半精度推理:使用
--fp16
参数加速推理
五、常见问题与解决方案
5.1 显存不足问题
现象:RuntimeError: CUDA out of memory
解决方案:
- 启用分块处理:
--tile 400
- 降低输入尺寸:
python test.py --model_path ... --input_size 256
- 使用内存优化模式:
python test.py --precision half
5.2 输出图像伪影
现象:生成图像出现棋盘格伪影
原因:转置卷积导致的overlap问题
解决方案:
- 改用ESRGAN+版本(使用PixelShuffle上采样)
- 添加后处理滤波:
from skimage.restoration import denoise_tv_chambolle output = denoise_tv_chambolle(output, weight=0.1)
5.3 训练不收敛
排查步骤:
- 验证数据加载正确性:
python tools/visualize_dataloader.py
- 检查梯度流动:
python -m torch.utils.bottleneck train.py
- 调整学习率策略:
# train_ESRGAN.yml optimizer_G:lr: 1e-5 # 原1e-4
六、论文理论与实验分析
6.1 核心贡献
- 提出RRDB结构:通过残差中的残差结构增强特征表达能力
- 改进对抗训练:相对判别器提升生成图像真实性
- 优化感知损失:深层特征匹配提升视觉质量
6.2 实验结果
在Set5测试集上的性能对比(PSNR/SSIM):
Method | Scale | PSNR | SSIM |
---|---|---|---|
Bicubic | ×4 | 28.42 | 0.8104 |
SRResNet | ×4 | 32.05 | 0.8910 |
SRGAN | ×4 | 29.40 | 0.8472 |
ESRGAN | ×4 | 26.07 | 0.7839 |
注:PSNR降低但主观质量显著提升
6.3 消融实验
组件 | MOS得分↑ | 训练稳定性 |
---|---|---|
Baseline SRGAN | 3.42 | 差 |
+RRDB结构 | 4.15 | 中 |
+相对判别器 | 4.38 | 良 |
+VGG19_conv5损失 | 4.61 | 优 |
七、工程优化与扩展应用
7.1 模型压缩技术
- 知识蒸馏:使用教师模型指导轻量级学生模型
loss_distill = F.mse_loss(student_feat, teacher_feat.detach())
- 通道剪枝:基于BN层γ因子的重要性评估
7.2 移动端部署
使用TensorRT加速:
trtexec --onnx=esrgan.onnx --saveEngine=esrgan.engine \--fp16 --inputIOFormats=fp16:chw --outputIOFormats=fp16:chw
7.3 扩展应用场景
- 医学影像增强:CT/MRI图像分辨率提升
- 卫星图像处理:遥感图像超分辨率
- 老照片修复:结合去噪与超分辨率
八、未来研究方向
8.1 视频超分辨率
结合时序信息的三维卷积设计:
F 3 D ( x , y , t ) = ∑ i , j , k w i , j , k ⋅ x i , j , k \mathcal{F}_{3D}(x,y,t) = \sum_{i,j,k} w_{i,j,k} \cdot x_{i,j,k} F3D(x,y,t)=i,j,k∑wi,j,k⋅xi,j,k
8.2 无监督学习
基于CycleGAN框架实现无配对数据训练:
L cycle = ∣ ∣ G L R ( G H R ( x L R ) ) − x L R ∣ ∣ 1 \mathcal{L}_{\text{cycle}} = ||G_{LR}(G_{HR}(x_{LR})) - x_{LR}||_1 Lcycle=∣∣GLR(GHR(xLR))−xLR∣∣1
8.3 多任务联合学习
集成超分辨率与去模糊、去噪任务:
L total = λ SR L SR + λ DeBlur L DeBlur \mathcal{L}_{\text{total}} = \lambda_{\text{SR}}\mathcal{L}_{\text{SR}} + \lambda_{\text{DeBlur}}\mathcal{L}_{\text{DeBlur}} Ltotal=λSRLSR+λDeBlurLDeBlur
本文从理论到实践全面解析了ESRGAN的技术细节,其通过创新的网络结构和训练策略,在图像超分辨率领域实现了质的飞跃。项目代码经过工业级优化,兼具研究价值与实用价值,为后续相关研究提供了重要参考基准。
相关文章:
【图像大模型】基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析
基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析 一、技术背景与核心创新1.1 图像超分辨率技术演进1.2 核心技术创新对比 二、算法原理深度解析2.1 网络架构设计2.1.1 RRDB模块结构 2.2 损失函数设计2.2.1 对抗损失(Adversarial Loss)2.2.2 感知损…...
Ubuntu 20.04卸载并重装 PostgreSQL
在 Ubuntu 下彻底卸载并重新安装 PostgreSQL(包括所有版本及其数据目录)的步骤 下面是一个在 Ubuntu 下彻底卸载并重新安装 PostgreSQL(包括所有版本及其数据目录)的步骤。 文章目录 在 Ubuntu 下彻底卸载并重新安装 PostgreSQL&…...
debian系统redis-dump安装
1. Ruby 环境 Redis-dump 是一个 Ruby 工具,需先安装 Ruby 和 RubyGems。 安装命令: sudo apt update sudo apt install ruby-full build-essential[roota29d39f5fd10:/opt/redis-dump/bin# apt install ruby-full build-essential Reading pac…...
AI智能分析网关V4玩手机检测算法精准管控人员手机行为,搭建智慧化安防监管体系
一、背景 移动终端普及使随意用机成为常态,在生产车间、加油站、考场、手术室等场景,人员使用手机易引发生产事故、爆炸、作弊、仪器干扰等问题。传统人工巡查存在覆盖不足、响应慢、主观性强等局限,难以满足现代安全管理需求。AI智能分析…...
支持向量存储:PostgresSQL及pgvector扩展详细安装步骤!老工程接入RAG功能必备!
之前文章和大家分享过,将会出一篇专栏(从电脑装ubuntu系统,到安装ubuntu的常用基础软件:jdk、python、node、nginx、maven、supervisor、minio、docker、git、mysql、redis、postgresql、mq、ollama等),目前…...
小土堆pytorch--神经网络-非线性激活线性层及其他层介绍
1. 神经网络-非线性激活 1.1 relu与sigmoid 1.1.1 ReLU(Rectified Linear Unit,修正线性单元 ) 定义与数学表达:数学定义为 f ( x ) max ( 0 , x ) f(x) \max(0, x) f(x)max(0,x) ,即当输入 x > 0 x > …...
【Vue3】数据的返回和响应式处理(ref reactive)
目录 一、拉开序幕的setup 二、ref函数 2.1 访问对象的响应式处理 小结:ref函数 三、reactive函数 3.1 reactive同样也可以修改数组: 3.2 reactive小结: 四、Vue3中的响应式原理 4.1 vue2的响应式,对象属性的添加 4.2…...
【Rust智能指针】Rust智能指针原理剖析与应用指导
✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…...
C++ - 仿 RabbitMQ 实现消息队列(3)(详解使用muduo库)
C - 仿 RabbitMQ 实现消息队列(3)(详解使用muduo库) muduo库的基层原理核心概念总结:通俗例子:餐厅模型优势体现典型场景 muduo库中的主要类EventloopMuduo 的 EventLoop 核心解析1. 核心机制:事…...
Java异常处理全解析:从基础到自定义
目录 🚀前言🤔异常的定义与分类💯运行时异常💯编译时异常💯异常的基本处理 🌟异常的作用🐧自定义异常💯自定义运行时异常💯自定义编译时异常 ✍️异常的处理方案…...
C++初阶-vector的模拟实现2
目录 1.vector已经实现的代码总结 2.vector::resize的模拟实现 3.vector::vector(const vector& v)拷贝构造函数的模拟实现 4.vector::operator(const vector& x)的模拟实现(原始写法) 5.vector::swap的模拟实现 6.vector::operator(const …...
【图数据库】--Neo4j 安装
目录 1.Neo4j --概述 2.JDK安装 3.Neo4j--下载 3.1.下载资源包 3.2.创建环境变量 3.3.运行 Neo4j 是目前最流行的图形数据库(Graph Database),它以节点(Node)、关系(Relationship)和属性(Property)的形式存储数据,专门为处理高度连接的数据而设计。…...
elementui初学1
当然可以!下面是从零开始创建一个最简单的 Element UI 程序的完整流程,基于 Vue 2 Element UI(如果你想用 Vue 3,请告诉我,我可以给你 Element Plus 的版本)。 ✅ 一、准备环境 确保你已经安装了…...
lanqiaoOJ 4185:费马小定理求逆元
【题目来源】 https://www.lanqiao.cn/problems/4185/learning/ 【题目描述】 给出 n,p,求 。其中, 指存在某个整数 0≤a<p,使得 na mod p1,此时称 a 为 n 的逆元,即 。数据保证 p 是质数且 n mod p≠0…...
计算机视觉与深度学习 | Python实现CEEMDAN-ISOS-VMD-GRU-ARIMA时间序列预测(完整源码和数据)
以下是结合CEEMDAN、ISOS-VMD、GRU和ARIMA的时间序列预测的Python完整实现方案。本方案包含完整的代码、数据生成逻辑和实现细节说明。 完整代码实现 import numpy as np import pandas as pd from PyEMD import CEEMDAN from vmdpy import VMD from scipy.optimize import di…...
前端开发遇到 Bug,怎么办?如何利用 AI 高效解决问题
前端开发遇到 Bug,怎么办?如何利用 AI 高效解决问题 作为前端开发者,遇到 Bug 几乎是日常。无论是样式错乱、功能异常,还是接口数据不对,Bug 总能让人头疼。但随着人工智能(AI)技术的发展&…...
博主总结框架
1.博主总结框架 1.1 计算机基础类(数据结构、计算机网络、操作系统等) (1)数据结构 (2)操作系统 (3)计算机网络 (4)其他 物联网入门框架 1.2 计算机图形…...
国产化Excel处理组件Spire.XLS for .NET系列教程:通过 C# 将 TXT 文本转换为 Excel 表格
在数据处理和管理场景中,将原始文本文件(TXT)高效转换为结构化的 Excel 电子表格是一项常见要求。对于那些需要自动生成报表或者处理日志文件的开发人员而言,借助 C# 实现 TXT 到 Excel 的转换工作,可以简化数据组织和…...
网络安全--PHP第一天
目标 熟悉信息传递架构 基于phpstydy-mysql-php 前置条件 需要先在数据库中创建相应的库和表名并配置表的结构 该文件为数据库配置文件 名字为config.php <?php $dbip localhost;//连接数据库的地址 远程连接需要输入ip等 $dbuser root;//连接数据库的用户 $dbpass ro…...
结构型:组合模式
目录 1、核心思想 2、实现方式 2.1 模式结构 2.2 实现案例 3、优缺点分析 4、适用场景 1、核心思想 目的:将总是在重复、迭代地显示的某种自相似性的结构(部分与整体结构特征相似),例如树形结构,以统一的方式处…...
Node.js多版本安装工具NVM详细使用教程
一、nvm 简介 nvm(Node Version Manager)是一个用于管理多个 Node.js 版本的命令行工具,允许开发者在单个系统中轻松切换、安装和卸载不同版本的 Node.js。它是前端和后端开发中处理 Node.js 版本兼容性问题的核心工具之一。 二、nvm 安装 …...
深度解析 Java 中介者模式:重构复杂交互场景的优雅方案
一、中介者模式的核心思想与设计哲学 在软件开发的历史长河中,对象间的交互管理一直是架构设计的核心难题。当多个对象形成复杂的网状交互时,系统会陷入 "牵一发而动全身" 的困境。中介者模式(Mediator Pattern)作为行…...
(八)深度学习---计算机视觉基础
分类问题回归问题聚类问题各种复杂问题决策树√线性回归√K-means√神经网络√逻辑回归√岭回归密度聚类深度学习√集成学习√Lasso回归谱聚类条件随机场贝叶斯层次聚类隐马尔可夫模型支持向量机高斯混合聚类LDA主题模型 一.图像数字化表示及建模基础 二.卷积神经网络CNN基本原…...
深入剖析原型模式:原理、实现与应用实践
在软件开发的世界里,设计模式如同建筑师手中的蓝图,为复杂系统的构建提供了行之有效的解决方案。其中,原型模式(Prototype Pattern)作为创建型设计模式的重要一员,以其独特的对象创建方式,在提高代码复用性、增强系统灵活性等方面发挥着关键作用。本文将深入剖析原型模式…...
【论文阅读 | CVPR 2024 |RSDet:去除再选择:一种用于 RGB - 红外目标检测的由粗到精融合视角】
论文阅读 | CVPR 2024 |RSDet:去除再选择:一种用于 RGB - 红外目标检测的由粗到精融合视角 1.摘要&&引言2. 方法2.1 “由粗到细”融合策略2.2 冗余光谱去除模块(RSR)2.3 动态特征选择模块(DFS)2.4 去除与选择检…...
WinForms 应用中集成 OpenCvSharp 实现基础图像处理
引言 欢迎关注dotnet研习社,今天我们要讨论的主题是WinForms 应用中集成 OpenCvSharp 实现基础图像处理。 在常规的图像处理软件开发中,图像处理功能是这些应用程序的核心组成部分。无论是简单的照片编辑工具,还是复杂的计算机视觉应用&…...
apache http client连接池实现原理
在java开发中我们经常会涉及到http 请求接口,一般有几种方式: java自带的 HttpURLConnectionokHttpClientapache http client 一般我们使用apache http client会比较多点,在代码中会进行如下调用方式: private static class Htt…...
adb抓包
目录 抓包步骤 步骤 1: 获取应用的包名 步骤 2: 查看单个应用的日志 步骤 3: 使用日志级别过滤器 步骤 4: 高级日志过滤 可能的原因: 解决方案: 额外提示: 日志保存 抓包步骤 连接设备 adb devices 步骤 1: 获取应用的包名 首先…...
C语言---结构体 、联合体、枚举
一、初识结构体 1、结构体类型 结构体和数组都是集合,但是结构体有成员,类型可以不同;数组有成员,类型相同。 int main() {struct tag{member--list //一个或者多个成员,成员变量}variable--list;//可以省略&#x…...
Web Workers 使用指南
文章目录 前言基础使用高级特性 使用 ES Modules实际应用场景图像处理大数据处理轮询任务 性能优化技巧现代开发方式使用 worker-loader (Webpack) Vite中的Worker使用 限制与注意事项DOM限制:通信限制:同源策略:最佳实践 前言 Web Workers 是浏览器提供的 JavaScript 多线程解…...
JVM 与容器化部署调优实践(Docker + K8s)
📌 文章目录 📘 前言1️⃣ 容器环境下 JVM 面临的新挑战2️⃣ JVM 的容器资源感知机制详解3️⃣ JVM 内存调优:如何正确使用堆内存4️⃣ JVM CPU 调优:GC 与编译线程控制5️⃣ Kubernetes 典型配置误区与对策6️⃣ 实战案例&#…...
Android OkHttp控制链:深入理解网络请求的流程管理
OkHttp作为Android和Java平台上广泛使用的HTTP客户端,其核心设计之一就是"控制链"(Chain)机制。本文将深入探讨OkHttp控制链的工作原理、实现细节以及如何利用这一机制进行高级定制。 一、什么是OkHttp控制链 OkHttp控制链是一种责任链模式的实现&#…...
《易经》的数学表达:初级版和高级版
《易经》的数学表达, 一、初级版,可基于以下框架构建, 涵盖符号系统、结构代数及变换规则: 此框架将《易经》抽象为离散数学结构,兼容符号逻辑、概率论与群论,为算法化占断、卦象拓扑分析及跨文化比较提供…...
卷积神经网络基础(十)
之前我们学习了SGD、Momentum和AdaGrad三种优化方法,今天我们将继续学习Adam方法。 6.1.6 Adam 我们知道Momentum参照的是小球在碗中滚动的物理规则进行移动而实现的,AdaGrad为参数的每个元素适当地调整更新步伐。那如果我们将这两种方法融合在一起会不…...
怎么把cursor(Cursor/ollama)安装到指定路径
使用PowerShell命令 打开电脑开始菜单,输入powerShell,使用管理员权限打开powerShell窗口,使用cd命令到cursor或ollama安装包的下载目录,如我的Cursor所在的目录为D:\environment\cursor\soft,输入以下 cd E:\downloa…...
第21天-pyttsx3语音播放功能
示例1:语音参数控制(语速/音量/音调) import pyttsx3def speech_demo():engine = pyttsx3.init()# 获取当前语音参数print("默认语速:", engine.getProperty(rate))print("默认音量:", engine.getProperty(volume))print("可用语音:", engin…...
Multi-Query Attention:传统自注意力( Self-Attention)优化显存和加速方案
本文导读:Multi-Query Attention(MQA)是 Google Research 2022 年提出的一项轻量化注意力技术,通过“多查询、单键值”的设计,把自注意力层的 KV 缓存从 O(hnd) 降到 O(nd),在不牺牲模型精度的前提下大幅节…...
学习路之uniapp--unipush2.0推送功能--服务端推送消息
学习路之uniapp--unipush2.0推送功能--服务端推送消息 一、二、三、 一、 二、 三、...
如何使用AI搭建WordPress网站
人工智能正迅速成为包括网页设计在内的许多行业在其功能设置中添加的一种工具。在数字设计和营销领域,许多成熟的工具都在其产品中添加了人工智能功能。WordPress 也是如此。作为目前最流行的网站建设工具之一,WordPress 的人工智能插件越来越多也就不足…...
Java 项目管理工具:Maven 与 Gradle 的深度对比与选择
Java 项目管理工具:Maven 与 Gradle 的深度对比与选择 在 Java 开发领域,项目管理工具对于项目的构建、依赖管理等起着至关重要的作用。Maven 和 Gradle 是目前最主流的两款工具,它们各自有着独特的优势和适用场景。本文将对 Maven 与 Gradl…...
Elasticsearch简单集成java框架方式。
Elasticsearch 在 Java 中最常用的客户端是什么?如何初始化一个 RestHighLevelClient?如何用 Spring Boot 快速集成 Elasticsearch?Spring Data Elasticsearch 如何定义实体类与索引的映射? 最常用的 Java 客户端 目前官方推荐使用…...
50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Hidden Search Widget (交互式搜索框)
📅 我们继续 50 个小项目挑战!—— Hidden Search Widget 组件 仓库地址:https://github.com/SunACong/50-vue-projects 项目预览地址:https://50-vue-projects.vercel.app/ ✨ 组件目标 点击按钮展开隐藏的搜索框 再次点击按钮…...
python爬虫和逆向:百度翻译数据采集的几种方式
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、官方API方式(推荐)1.1 百度翻译开放平台API二、网页版逆向方式(代码可直接运行)2.1 拿到js加密方法2.2 python解密代码三、浏览器自动化方式3.1 Selenium自动化操作3.2 Playwright自动化四、移动端API逆向4.1 分…...
spring5-配外部文件-spEL-工厂bean-FactoryBean
spring配外部文件 我们先在Spring里配置一个数据源 1.导c3p0包,这里我们先学一下hibernate持久化框架,以后用mybites. <dependency><groupId>org.hibernate</groupId><artifactId>hibernate-core</artifactId><version>5.2.…...
Ubuntu部署私有Gitlab
这个东西安装其实挺简单的,但是因为我这边迁移了数据目录和使用自己安装的 nginx 代理还是踩了几个坑,所以大家可以注意下 先看下安装 # 先安装必要组件 sudo apt update sudo apt install -y curl openssh-server ca-certificates tzdata perl# 添加gi…...
Activiti 7建表语句及注释
Activiti数据库表Oracle兼容DM建表语句及字段注释。 附件下载版地址点这里 --通用属性表 create table ACT_GE_PROPERTY (NAME_ NVARCHAR2(64),VALUE_ NVARCHAR2(300),REV_ INTEGER,primary key (NAME_) );COMMENT ON TABLE ACT_GE_PROPERTY IS 通用属性表;COMMENT ON COLUMN …...
React中使用 Ant Design Charts 图表
// 引入 Ant Design Charts 的柱状图组件 Column import { Column } from ant-design/charts;// 定义函数组件 App,用于展示柱状图 function App() {// 数据源:每个对象代表一个柱子,包含类型(type)和销售额࿰…...
佰力博科技与您探讨压电材料的原理与压电效应的应用
压电材料的原理基于正压电效应和逆压电效应,即机械能与电能之间的双向转换特性。 压电材料的原理源于其独特的晶体结构和电-机械耦合效应,具体可分为以下核心要点: 1. 正压电效应与逆压电效应的定义 正压电效应:当压电…...
vscode打开vue + element项目
好嘞,我帮你详细整理一个用 VS Code 来可视化开发 Vue Element UI 的完整步骤,让你能舒服地写代码、预览界面、调试和管理项目。 用 VS Code 可视化开发 Vue Element UI 全流程指南 一、准备工作 安装 VS Code 官网下载安装:https://code…...
一步步解析 HTTPS
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…...