计算机视觉cv2入门之图像的读取,显示,与保存
在计算机视觉领域,Python的cv2库是一个不可或缺的工具,它提供了丰富的图像处理功能。作为OpenCV的Python接口,cv2使得图像处理的实现变得简单而高效。
示例图片
目录
opencv获取方式
图像基本知识
颜色空间
RGB
HSV
图像格式
BMP格式
TIFF格式
GIF格式
JPEG格式
PNG格式
读取图像cv2.imread()
imread各flags参数含义详解
读取结果说明
Ndarray说明
获取单通道颜色矩阵
显示图像
使用cv2.imshow()显示图像
cv2.waitKey()
cv2.destroyAllWindows()
使用plt.imshow()显示图像
保存图像cv2.imwrite()
总结
opencv获取方式
pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple opencv-python
图像基本知识
颜色空间
颜色空间是一种用来表示颜色的数学模型,它描述了如何将颜色信息数字化,以便于计算机进行处理和分析。在计算机视觉和图像处理领域,常见的颜色空间包括RGB、HSV等。
RGB
RGB颜色空间是最常用的颜色空间之一,它基于红(Red)、绿(Green)、蓝(Blue)三种基本颜色,通过调整这三种颜色的强度和组合,可以产生各种颜色。
在RGB颜色空间中,每个颜色的强度值范围通常在0到255之间,分别代表红、绿、蓝三种颜色的亮度。通过调整这些亮度值,可以混合出各种颜色。例如,当RGB三个通道的强度值都为0时,表示黑色;当RGB三个通道的强度值都为255时,表示白色。
RGB颜色调色板
HEX是一种常用于网页设计和图像处理中的颜色表示方法,它通过六位十六进制数来表示RGB颜色空间中的颜色。在HEX表示法中,前两位代表红色强度,中间两位代表绿色强度,最后两位代表蓝色强度。
通过改变这三个值的不同组合,可以得到一个包含2^24=16777216种颜色的调色板,但是人眼可见的却远远少于这个数字。
例如我们总是认为乌鸦是黑色的,但其实在不同的光照条件下,乌鸦的羽毛可能会呈现出彩色的光泽。这正是因为RGB颜色空间虽然能够表示大量的颜色,但人眼的颜色感知却受到环境、光照等多种因素的影响。
乌鸦羽毛五彩斑斓的黑
HSV
HSV(Hue, Saturation, Value)是根据颜色的直观特性 色调(Hue)、饱和度(Saturation)和明度(Value)三个参数。由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。
HSV分量可以通过RGB各分量值转化得到,计算公式如下:
其中,R,G,B分别为RGB颜色空间中的3个分量。
图像格式
常见的图像格式有BMP格式,TiIFF格式,GIF格式,JPEG格式,PNG格式等。
BMP格式
BMP格式是windows环境中的一种标准(但很多Microsoft应用程序不支持它),这种格式采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。
TIFF格式
TIFF格式是一种灵活的图像存储格式,广泛应用于印刷、出版和扫描领域。它支持多种色彩模式,包括灰度、RGB、CMYK等,并允许无损压缩,以在保证图像质量的同时减少文件大小。TIFF格式还支持多层图像和透明度,使其在处理复杂图像时具有显著优势。此外,TIFF格式具有良好的兼容性,能够被多种图像编辑和处理软件所支持。
GIF格式
GIF格式是一种广泛用于网络传输的图像格式。GIF格式以其独特的无损压缩技术和支持透明背景的特性而著称,这使得GIF图像在保持高质量的同时,文件大小相对较小,非常适合在网络上快速加载和显示。此外,GIF格式还支持动画效果,能够创建简单的动态图像,这一特性使其在社交媒体和网页设计中备受欢迎。尽管GIF格式的色彩深度有限,通常只能显示256种颜色,但这并不妨碍它在特定应用场景下的广泛应用。
JPEG格式
JPEG格式源自对相对静止灰度或彩色图像的一种压缩标准,在使用有损压缩方法时可节省的空间是相当大的,目前数码相机中均使用这种格式。尽管JPEG格式采用有损压缩,可能会导致一定的图像质量损失,但通过调整压缩级别,用户可以在图像质量和文件大小之间找到理想的平衡点。这种灵活性使得JPEG格式成为存储和传输大量图片的优选方案,尤其是在存储空间有限或网络带宽受限的情况下。此外,JPEG格式还具有良好的跨平台兼容性,几乎可以被所有主流的图像查看器和编辑器所支持。
PNG格式
PNG是一种无损压缩的图像格式,支持透明背景和Alpha通道,使得图像在保持高质量的同时,还能展现出更为丰富的层次感和细腻度。与GIF格式相比,PNG格式在色彩深度上不再受限,能够显示1600多万种颜色,这为图像的色彩表现提供了更广阔的空间。此外,PNG格式还支持多种图像编辑功能,如伽玛校正、文本注释等,进一步增强了其在图像处理和编辑领域的实用性。由于其无损压缩的特性,PNG格式在需要保持图像原始质量和细节的应用场景中,如网页设计中的图标、按钮等,具有不可替代的优势。
需要注意的是PNG格式的图片相对于其他格式图片来说,除了RGB三通道以外还多了一层alpha通道,这一层alpha通道使得PNG图片支持透明度设置,即可以实现图片的半透明效果,或者是抠图后的图片背景透明化。
读取图像cv2.imread()
#cv2.imread读取图像
import cv2
image=cv2.imread(filename='test.jpg',flags=cv2.IMREAD_UNCHANGED)
#filename:图像文件的路径
#flags:#cv2.IMREAD_COLOR:BGR格式彩色图像 #cv2.IMREAD_GRAYSCALE:灰度图像,是单通道的 #cv2.IMREAD_UNCHANGED:包括alpha通道,即透明通道#cv2.IMREAD_COLOR_BGR,以BGR格式读取图像,彩色#cv2.IMREAD_COLOR_RGB,以RGB格式读取图像,彩色#cv2.IMREAD_ANYDEPTH:读取任意深度的图像#cv2.IMREAD_ANYCOLOR:读取任意颜色的图像#cv2.IMREAD_LOAD_GDAL:使用GDAL读取图像#cv2.IMREAD_REDUCED_COLOR_2:读取1/2的彩色图像#cv2.IMREAD_REDUCED_COLOR_4:读取1/4的彩色图像#cv2.IMREAD_REDUCED_COLOR_8:读取1/8的彩色图像#cv2.IMREAD_REDUCED_GRAYSCALE_2:读取1/2的灰度图像#cv2.IMREAD_REDUCED_GRAYSCALE_4:读取1/4的灰度图像#cv2.IMREAD_REDUCED_GRAYSCALE_8:读取1/8的灰度图像#cv2.IMREAD_IGNORE_ORIENTATION:忽略图像的方向信息#cv2.IMREAD_COLOR是默认值,读取的图像是彩色BGR格式相当与cv2.IMREAD_COLOR_BGR
print(image.shape)
cv2.imread()函数各flags参数含义详解
cv2.imread()函数只有两个参数,filename与flages,filename指图像文件路径,flags是指定图像读取的方式。
以下是所有flags释义:
cv2.IMREAD_COLOR | 读取彩色图像 |
cv2.IMREAD_GRAYSCALE | 读取单通道的灰度图像 |
cv2.IMREAD_UNCHANGED: | 按照图像原格式读取图像,若图像是png图像那么包括alpha通道,即透明通道,此时图像是四通道的,若图像不是png格式那么还是三通道。 |
cv2.IMREAD_COLOR_BGR | 以BGR格式读取图像,彩色 |
cv2.IMREAD_COLOR_RGB | 以RGB格式读取图像,彩色 |
cv2.IMREAD_ANYDEPTH | 读取任意深度的图像 |
cv2.IMREAD_ANYCOLOR | 读取图像时自动检测并保留图像的原始颜色通道数。 |
cv2.IMREAD_LOAD_GDAL | 使用GDAL读取图像。GDAL 是专门用于处理地理空间数据格式的库,如 GeoTIFF、ENVI、HFA 等。 |
cv2.IMREAD_REDUCED_COLOR_2 | 读取1/2的彩色图像 |
cv2.IMREAD_REDUCED_COLOR_4 | 读取1/4的彩色图像 |
cv2.IMREAD_REDUCED_COLOR_8: | 读取1/8的彩色图像 |
cv2.IMREAD_REDUCED_GRAYSCALE_2 | 读取1/2的灰度图像 |
cv2.IMREAD_REDUCED_GRAYSCALE_4 | 读取1/4的灰度图像 |
cv2.IMREAD_REDUCED_GRAYSCALE_8 | 读取1/8的灰度图像 |
cv2.IMREAD_IGNORE_ORIENTATION | 忽略图像的方向信息 |
读取结果说明
Ndarray说明
Ndarray的一般结构为:
[行数,列数,深度]
其中行和列都是一维数组,我们知道行*列便可以构成矩阵,而深度则用来表示不同的行*列构成的矩阵的在最外层的数组中的索引。简而言之,Ndarray就是数组内嵌套矩阵的格式,这样会十分方便理解。
上述代码中的image为读取结果,由于我们的示例图片是.jpg格式没有alpha通道,所以flags使用cv2.IMREAD_UNCHANGED与cv2.IMREAD_COLOR并没有区别,通道数都为3。
image的shape:(1161, 1080, 3)
cv2.imread()函数的结果是ndarray,我们打印出其shape的结果中前两个参数是图像的高与宽,第三个参数是image的维度,这里的维度其实就是图像的RGB通道数。
获取单通道颜色矩阵
倘若我们想要分别切片获取image的三个通道数对应的颜色矩阵,那么我们可以这样写:
blue=image[:,:,0]
green=image[:,:,1]
red=image[:,:,2]
#或者
blue=image[0:1161,0:1080,0]
green=image[0:1161,0:1080,1]
red=image[0:1161,0:1080,2]
在第一种写法中,这里要说明一下的是,Ndarray的切片方法与python的list切片方法一致,切片时有一个特殊用法就是[:],它相当与[0:len(array)]用来直接获取整个数组所有值,倘若你要是不知道某一维这个数组的长度(比如上边我们读取的图像高1161宽1080,直接切片需[0:1161,0:1080]),又想获取整个数组的所有内容,可以使用这种方法。
当然,为了方便,cv2已经内置了split函数替我们直接获取三个颜色通道的矩阵。
blue,green,red=cv2.split(image)
显示图像
使用cv2.imshow()显示图像
import cv2#opencv读取的格式是BGR
image=cv2.imread('test.jpg')
image=cv2.resize(image,(500,500))#更改一下图像大小,为了方便显示
cv2.imshow('image',image)
cv2.waitKey(0)
cv2.destroyAllWindows()
这里的image是一个shape为(500,500,3)的ndarray,表示这是一个500x500像素的彩色图像,具有红、绿、蓝三个颜色通道。每个颜色通道都是一个500x500的二维数组。
结果
cv2.waitKey()
cv2.waitKey()函数是用来在OpenCV库中暂停程序执行并等待用户按键的函数。这个函数通常在显示图像时使用,比如在一个窗口中显示图像后,我们希望程序在用户按下任意键后再继续执行后续操作,这时就可以使用cv2.waitKey()函数。该函数接受一个整数参数,表示等待的毫秒数。如果参数为0,则表示无限期等待,直到用户按下键盘上的任意键。在按下键后,cv2.waitKey()会返回按键的ASCII码值,我们可以根据这个返回值来判断用户按下了哪个键。
需要注意的是,在使用cv2.waitKey()之前,必须已经创建了一个图像显示窗口,否则该函数将无法正常工作。
同时,倘若你使用cv2.imshow()想要显示image,但是却没有在代码中加入这一行cv2.waitKey(0)命令,那么图片将不会正常显示,显示结果为黑色背景。
cv2.destroyAllWindows()
cv2.destroywindows()函数是用来关闭所有OpenCV创建过的窗口的,这些窗口实际是都是使用python内置库tkinter编写的,先前的tkinter窗口会阻塞主线程。所以,当我们完成图像处理或显示操作后,经常需要关闭这些窗口以释放资源。倘若不将他们关闭当前图像窗口可能无法显示。
cv2.namedWindow()
cv2.namesWindow()函数写在cv2.imshow()函数之前,它主要用来设置cv2.imshow()函数弹出的窗口的属性。
比如:我们正常使用cv2.imshow()显示的图像的窗口不可拉伸,我们只需要在cv2.imshow()函数之前,加一行以下代码便可实现窗口可拉伸:
#cv2.namedWindow()函数调整图像显示窗口'''
cv2.namedWindow()所有flags:
cv2.WINDOW_AUTOSIZE
cv2.WINDOW_FREERATIO
cv2.WINDOW_FULLSCREEN
cv2.WINDOW_GUI_EXPANDED
cv2.WINDOW_GUI_NORMAL
cv2.WINDOW_KEEPRATIO
cv2.WINDOW_NORMAL
cv2.WINDOW_OPENGL'
'''
import cv2#opencv读取的格式是BGR
image=cv2.imread('test.jpg')
image=cv2.resize(image,(500,500))
cv2.namedWindow('image',cv2.WINDOW_GUI_NORMAL)
cv2.imshow('image',image)
cv2.waitKey(0)
cv2.destroyAllWindows()
图像所在窗口可以x,y方向拉伸
cv2.namedWindow()函数只有两个参数,winname与flags,winname是待作用的窗口名称,flags用来设置该窗口的属性,以下是cv2.namedWindow()函数所有flags及其含义:
cv2.WINDOW_AUTOSIZE | 窗口大小会自动调整为与输入图像的大小相同,用户无法手动调整窗口尺寸 。创建窗口后,图像以原始大小显示在窗口中,窗口大小随图像尺寸变化而自适应 |
cv2.WINDOW_FREERATIO | 窗口中的图像可以自由缩放,不保持图像的原始宽高比。这意味着在调整窗口大小时,图像会按照窗口的变化随意拉伸或压缩,可能会导致图像变形 |
cv2.WINDOW_FULLSCREEN | 创建一个全屏窗口,窗口将占据整个屏幕,通常需要通过特定的系统操作(如按下特定快捷键)来退出全屏模式 。通过waitkey()函数实现 |
cv2.WINDOW_GUI_EXPANDED | 提供扩展的GUI功能,允许更丰富的用户界面元素和交互方式。这个标志通常用于创建具有更多控件和功能的窗口,不过具体的表现和可用功能可能依赖于OpenCV的版本和底层使用的GUI后端 |
cv2.WINDOW_GUI_NORMAL | 创建具有标准GUI外观和功能的窗口,这是最常见的窗口创建模式,提供基本的窗口操作(如关闭按钮等),没有额外的扩展功能 |
cv2.WINDOW_KEEPRATIO | 窗口中的图像在缩放时会保持其原始的宽高比。当调整窗口大小时,图像会根据窗口的变化按比例缩放,以确保图像不会变形 |
cv2.WINDOW_NORMAL | 允许用户手动调整窗口的大小与 cv2.WINDOW_AUTOSIZE 不同,此模式下窗口大小不会自动适应图像大小,用户可以根据需要改变窗口尺寸,图像也会相应地进行缩放显示 |
cv2.WINDOW_OPENGL | 创建支持OpenGL的窗口,这使得可以在窗口中使用OpenGL的图形渲染功能,适用于需要高级图形处理和交互的应用场景 |
使用plt.imshow()显示图像
import cv2#opencv读取的格式是BGR
import matplotlib.pyplot as plt#matplotlib读取的格式是RGB
image=cv2.imread('test.jpg')
image=cv2.resize(image,(500,500))
#使用plt.imshow(),需要先将BGR转化成RGB,这里使用cv2.cvtColor颜色通道转换函数完成
image=cv2.cvtColor(image,cv2.COLOR_RGB2BGR)
plt.axis('off')
plt.imshow(image)
结果
这里需要注意的是opencv读取的图像时默认格式是BGR,而matplotlib读取的格式是RGB,如果我们在读取图像时不指定读取方式且不使用cv2.cvtColor()通道转换函数将颜色通道转换成RGB的话,那么显示出来的图像的颜色便会怪怪的。。。
这是因为,matplotlib把原本是红色的通道误认为是蓝色通道,而原本是蓝色的通道则被认为是红色通道。这种颜色通道的错位就会导致图像颜色显示异常、
但是,无论如何,cv2.imshow与plt.imshow这两个函数在显示图像时,需要传入的都是图像的ndarray数据。
保存图像cv2.imwrite()
#cv2.imwrite保存图像
import cv2
image=cv2.imread(filename='test.jpg',flags=cv2.IMREAD_UNCHANGED)
#图像经过某些变换或操作后需要保存
cv2.imwrite(filename='newImage.jpg',img=image,params=[int(cv2.IMWRITE_JPEG_QUALITY), 50])
#filename:保存图像文件名称
#img:图像颜色矩阵
#params:参数是一个可选的序列(通常是列表或元组),用于传递图像编码和压缩相关的参数。
当我们需要保存图像时,直接调用cv2.imwrite()函数即可。
总结
本文主要介绍了opencv图像的读取与显示,后序还将分享更多相关图像处理技术,以及如何利用cv2进行图像特征提取和匹配。并且还会将所有内容合并到专栏中,免费订阅。
通过本专栏的学习,读者将能够利用cv2库解决实际的图像处理问题,为计算机视觉项目打下坚实基础。
相关文章:
计算机视觉cv2入门之图像的读取,显示,与保存
在计算机视觉领域,Python的cv2库是一个不可或缺的工具,它提供了丰富的图像处理功能。作为OpenCV的Python接口,cv2使得图像处理的实现变得简单而高效。 示例图片 目录 opencv获取方式 图像基本知识 颜色空间 RGB HSV 图像格式 BMP格式 …...
基于Canvas和和原生JS实现俄罗斯方块小游戏
这里是一个完整的H5俄罗斯方块游戏,使用了 HTML CSS JavaScript (原生) 实现,支持基本的俄罗斯方块玩法,如: ✅ 方块自动下落 ✅ 方向键控制移动、旋转、加速下落 ✅ 方块堆叠、消行 ✅ 计分系统 在 canvas 上绘制游戏&#x…...
阿里云 QwQ-32B 模型调研文档
阿里云 QwQ-32B 模型调研文档 ——技术解析、部署实践与微调指南 一、模型概述 QwQ-32B 是阿里云开源的轻量化大语言模型,以 320 亿参数 实现与 DeepSeek-R1(6710 亿参数)相当的推理性能。其核心优势包括: 参数效率:1/20 参数量达成竞品性能,显存需求降低 70%部署灵活性…...
【玩转23种Java设计模式】结构型模式篇:组合模式
软件设计模式(Design pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性、程序的重用性。 汇总目录链接&…...
Eolink:专为开发者设计的API协作平台
Eolink Apikit 是一款集 API 设计、管理、自动化测试、Mock 和异常监控于一体的全生命周期智能协作平台,旨在提升 API 研发和管理的效率。以下是对其功能和特点的详细介绍: 核心功能: API 设计与文档管理:Apikit 提供了强大的 API…...
【Python】为什么要写__init__.py
文章目录 PackageA(__init__特性)应该往__init__.py里放什么东西?1、包的初始化2、管理包的公共接口3、包的信息 正常我们直接导入就可以执行,但是在package的时候,有一种__init__.py的特殊存在 引入moduleA.py,执行main.py&…...
golang 从零单排 (一) 安装环境
1.下载安装 打开网址The Go Programming Language 直接点击下载go1.24.1.windows-amd64.msi 下载完成 直接双击下一步 下一步 安装完成 环境变量自动设置不必配置 2.验证 win r 输入cmd 打开命令行 输入go version...
30-判断子序列
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。 字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列&#…...
AI 驱动的软件测试革命:从自动化到智能化的进阶之路
🚀引言:软件测试的智能化转型浪潮 在数字化转型加速的今天,软件产品的迭代速度与复杂度呈指数级增长。传统软件测试依赖人工编写用例、执行测试的模式,已难以应对快速交付与高质量要求的双重挑战。人工智能技术的突破为测试领域注…...
深度相机进行目标物体的空间姿态(位姿)估计
利用深度相机(如Kinect、Intel Realsense、Zed相机等)进行目标物体的空间姿态(位姿)估计,通常结合了3D点云处理、目标识别和位姿优化算法。以下是完整的实现流程、算法选择及注意事项: 一、实现流程 1. 目…...
3月8日实验
拓扑: 需求: 1.学校内部的HTTP客户端可以正常通过域名www.baidu.com访问到白度网络中的HTTP服务器 2.学校网络内部网段基于192.168.1.0/24划分,PC1可以正常访问3.3.3.0/24网段,但是PC2不允许 3.学校内部路由使用静态路由&#…...
GO语言学习笔记
一、viper笔记【七米】 https://liwenzhou.com/posts/Go/viper/ 二、优雅关机和平滑重启 https://liwenzhou.com/posts/Go/graceful-shutdown/ 三、gin使用zap https://liwenzhou.com/posts/Go/zap-in-gin/ 四、flag 用于命令行传参 https://liwenzhou.com/posts/Go/flag/ 五、…...
Autosar技术栈总目录
总目录 Autosar架构理解Autosar Mcal配置开发(TC3xx系列 基于EB)Autosar Mcal配置开发(S32K3xx系列 基于EB)Autosar BSW服务开发(基于Davinci CFG &Dev)Makefile编译自动化脚本 持续更新中… Autosar架…...
开发指南107-谷歌内核浏览器滚动条设置
平台上统一制定了滚动条样式(仅限于webkit内核):/* ------美化谷歌浏览器滚动条 开始-----------*/ ::-webkit-scrollbar{width:12px;height:12px;background-color: #E1E1E1;} ::-webkit-scrollbar-button:single-button { background-color:#E1E1E1; display: …...
25年携程校招社招求职能力北森测评材料计算部分:备考要点与误区解析
在求职过程中,能力测评是筛选候选人的重要环节之一。对于携程这样的知名企业,其能力测评中的材料计算部分尤为关键。许多求职者在备考时容易陷入误区,导致在考试中表现不佳。本文将深入解析材料计算部分的实际考察方向,并提供针对…...
Linux系统编程--线程同步
目录 一、前言 二、线程饥饿 三、线程同步 四、条件变量 1、cond 2、条件变量的使用 五、条件变量与互斥锁 一、前言 上篇文章我们讲解了线程互斥的概念,为了防止多个线程同时访问一份临界资源而出问题,我们引入了线程互斥,线程互斥其实…...
李沐《动手学深度学习》——14.9. 用于预训练BERT的数据集——wiki数据集问题以及存在的其他问题
问题1:出现"file is not a zip file" 原因是链接已经失效。 解决方法:打开下面链接自行下载,需要魔法。下载完解压到特定位置。 下载链接:项目首页 - Wikitext-2-v1数据包下载:Wikitext-2-v1 数据包下载本仓库提供了一…...
【英伟达AI论文】多模态大型语言模型的高效长视频理解
摘要:近年来,基于视频的多模态大型语言模型(Video-LLMs)通过将视频处理为图像帧序列,显著提升了视频理解能力。然而,许多现有方法在视觉主干网络中独立处理各帧,缺乏显式的时序建模,…...
深入理解 DOM 元素
深入理解 DOM 元素:构建动态网页的基石 在网页开发的世界里,DOM(Document Object Model,文档对象模型)元素宛如一座桥梁,连接着静态的 HTML 结构与动态的 JavaScript 交互逻辑。它让原本呆板的网页变得鲜活…...
linux如何判断进程对磁盘是随机写入还是顺序写入?
模拟工具&性能测试工具:fio fio参数说明: filename/dev/sdb1:测试文件名称,通常选择需要测试的盘的data目录。 direct1:是否使用directIO,测试过程绕过OS自带的buffer,使测试磁盘的结果更真…...
实现静态网络爬虫(入门篇)
一、了解基本概念以及信息 1.什么是爬虫 爬虫是一段自动抓取互联网信息的程序,可以从一个URL出发,访问它所关联的URL,提取我们所需要的数据。也就是说爬虫是自动访问互联网并提取数据的程序。 它可以将互联网上的数据为我所用,…...
[Web]get请求和post请求
Get get请求的特点是: 1.所有的参数都通过URL进行传递。其中传输的参数的书写的格式为?key1value1&key2value2。具体示例:https://example.com/search?qapple&limit10。访问的时候,先写/xxx,确定本次请求要访问的资源u…...
【落羽的落羽 C++】C++入门基础:引用,内联,nullptr
文章目录 一、引用1. 引用的概念2. 引用的特点3. 引用的使用4. const引用5. 引用和指针 二、inline内联三、nullptr 一、引用 1. 引用的概念 引用是C中的一个较为重要的概念。它是给已存在变量取的“别名”,编译器不会为引用变量开辟内存空间,它和它引…...
RabbitMQ应用问题大全(精心整理版)
前言 其实这部分知识我是整理在语雀上了,这里是直接复制粘贴过来的。不是很好阅读,可以直接点下方链接去语雀看,那个看的会舒服很多。 https://www.yuque.com/g/ngioig/upbg6b/fkarhyo8fpgrtyq8/collaborator/join?tokenGvlO0di8KaIfO8aF&am…...
【人工智能】卷积神经网络的奥秘:深度学习的视觉革命
卷积神经网络(CNN)是深度学习中处理图像、视频等高维数据的主流模型,因其局部特征提取和参数共享特性而效率高且效果优异。本文深入探讨了CNN的理论基础,包括卷积操作、池化层、激活函数和全连接层的数学原理,并通过LaTeX公式推导其前向传播和反向传播过程。接着,我们提供…...
掌握MiniQMT:程序化下单与撤单的高效实现
掌握MiniQMT:程序化下单与撤单的高效实现 🚀量化软件开通 🚀量化实战教程 在量化交易领域,程序化下单与撤单是实现自动化交易策略的关键环节。通过MiniQMT平台,我们可以高效地执行这些操作,从而快速响应…...
【高级篇】大疆Pocket 3加ENC编码器实现无线RTMP转HDMI进导播台
【高级篇】大疆Pocket 3加ENC编码器实现无线RTMP转HDMI进导播台 文章目录 准备工作连接设备RTMP概念ENCSHV2推流地址设置大疆Pocket 3直播设置总结 老铁们好! 很久没写软文了,今天给大家带了一个干货,如上图,大疆Pocket 3加ENC编…...
Nacos学习笔记-占位符读取其他命名空间内容
Nacos当前命名空间下的配置文件需要跨命名空间读取其他配置文件的内容。可以先通过Nacos提供的API接口获取配置文件内容,然后解析数据将其放入环境的PropertySource中。 相关依赖包 <!-- Nacos依赖包 --> <dependency><groupId>com.alibaba.clo…...
每天五分钟深度学习框架PyTorch:使用残差块快速搭建ResNet网络
本文重点 前面我们使用pytorch搭建了残差块,本文我们更进一步,我们使用残差块搭建ResNet网络,当学会如何搭建残差块之后,搭建ResNet就会非常简单了,因为ResNet就是由多个残差块组成的。 残差块 残差块我们前面已经介…...
python操作java文件的一种方法
对于python操作java代码的场景来说,比较多的可能就是涉及加密的场景,尤其涉及到登录的场景,对于输入的账号密码可能会涉及到加密,如果开发告诉我们如何加密,那么,OK,我们可以直接通过代码去实现…...
自然语言处理:最大期望值算法
介绍 大家好,博主又来给大家分享知识了,今天给大家分享的内容是自然语言处理中的最大期望值算法。那么什么是最大期望值算法呢? 最大期望值算法,英文简称为EM算法,它的核心思想非常巧妙。它把求解模型参数的过程分成…...
leetcode-sql数据库面试题冲刺(高频SQL五十题)
题目: 197.上升的温度 表: Weather ---------------------- | Column Name | Type | ---------------------- | id | int | | recordDate | date | | temperature | int | ---------------------- id 是该表具有唯一值的列。 没有具有相同 recordDate …...
开发者社区测试报告(功能测试+性能测试)
功能测试 测试相关用例 开发者社区功能背景 在当今数字化时代,编程已经成为一项核心技能,越来越多的人开始学习编程,以适应快速变化的科技 环境。基于这一需求,我设计开发了一个类似博客的论坛系统,专注于方便程序员…...
环形链表问题的探究与代码实现
在数据结构与算法的学习中,环形链表是一个经典的问题。它不仅考察对链表这种数据结构的理解,还涉及到指针操作和逻辑推理。本文将结合代码和图文,深入分析如何判断链表中是否有环以及如何找到环的入口点。 目录 一、判断链表中是否有环 …...
【C++】vector(下):vector类的模拟实现(含迭代器失效问题)
文章目录 前言一、vector类的常用接口的模拟实现1.头文件(my vector.h)整体框架2.模拟实现vector类对象的常见构造3.模拟实现vector iterator4.模拟实现vector类对象的容量操作5.模拟实现vector类对象的访问6.模拟实现vector类对象的修改操作 二、vector…...
NLTK和jieba
NLTK与jieba概述 自然语言处理(NLP)领域是计算机科学领域与人工智能领域中的一个重要方向,主要研究方向是实现人与计算机之间用自然语言进行有效通信的各种理论和方法。 在自然语言处理领域中,文本类型的数据占据着很大的市场&a…...
Java后端高频面经——计算机网络
TCP/IP四层模型?输入一个网址后发生了什么,以百度为例?(美团) (1)四层模型 应用层:支持 HTTP、SMTP 等最终用户进程传输层:处理主机到主机的通信(TCP、UDP&am…...
CSDN博客:Markdown编辑语法教程总结教程(中)
❤个人主页:折枝寄北的博客 Markdown编辑语法教程总结 前言1. 列表1.1 无序列表1.2 有序列表1.3 待办事项列表1.4 自定义列表 2. 图片2.1 直接插入图片2.2 插入带尺寸的图片2.3 插入宽度确定,高度等比例的图片2.4 插入高度确定宽度等比例的图片2.5 插入居…...
Springboot redis bitMap实现用户签到以及统计,保姆级教程
项目架构,这是作为demo展示使用: Redis config: package com.zy.config;import com.fasterxml.jackson.annotation.JsonAutoDetect; import com.fasterxml.jackson.annotation.PropertyAccessor; import com.fasterxml.jackson.databind.Ob…...
AI Agent系列(一) - Agent概述
AI Agent系列【一】 前言一、AI代理的特点二、 AI Agent的技术框架三、 开源自主代理 前言 AI Agent,即人工智能代理,一般直接叫做智能体 百度百科给AI Agent定义为: “以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、…...
Scala 中trait的线性化规则(Linearization Rule)和 super 的调用行为
在 Scala 中,特质(Trait)是一种强大的工具,用于实现代码的复用和组合。当一个类混入(with)多个特质时,可能会出现方法冲突的情况。为了解决这种冲突,Scala 引入了最右优先原则&#…...
【Linux系统编程】初识系统编程
目录 一、什么是系统编程1. 系统编程的定义2. 系统编程的特点3. 系统编程的应用领域4. 系统编程的核心概念5. 系统编程的工具和技术 二、操作系统四大基本功能1. 进程管理(Process Management)2. 内存管理(Memory Management)3. 文…...
Unsloth - 动态 4 bit 量化
文章目录 💔 量化可能会破坏模型🦙 Llama 3.2 Vision 细节Pixtral (12B) 视觉🦙 Llama 3.2 (90B) 视觉指令 本文翻译自:Unsloth - Dynamic 4-bit Quantization (2024年12月4日 Daniel & Michael https://unsloth.…...
技术领域,有许多优秀的博客和网站
在技术领域,有许多优秀的博客和网站为开发者、工程师和技术爱好者提供了丰富的学习资源和行业动态。以下是一些常用的技术博客和网站,涵盖了编程、软件开发、数据科学、人工智能、网络安全等多个领域: 1. 综合技术博客 1.1 Medium 网址: ht…...
黑金风格人像静物户外旅拍Lr调色教程,手机滤镜PS+Lightroom预设下载!
调色教程 针对人像、静物以及户外旅拍照片,运用 Lightroom 软件进行风格化调色工作。旨在通过软件中的多种工具,如基本参数调整、HSL(色相、饱和度、明亮度)调整、曲线工具等改变照片原本的色彩、明度、对比度等属性,将…...
Manus 与鸿蒙 Next 深度融合:构建下一代空间计算生态
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 https://www.captainbed.cn/north 文章目录 一、技术融合背景与意义1.1 技术栈协同优势1.2 典型应用场景 二、系统架构设计2.1 整体架构图…...
并查集模板
注意理解路径压缩 static class UnionFind {int[] fa;public UnionFind(int n) {fa new int[n];for (int i 0; i < n; i) {fa[i] i;}}public int find(int i) {if (fa[i] ! i) {fa[i] find(fa[i]);}return fa[i];}public void union(int i, int j) {int fai find(i);in…...
推流项目的ffmpeg配置和流程重点总结一下
ffmpeg的初始化配置,在合成工作都是根据这个ffmpeg的配置来做的,是和成ts流还是flv,是推动远端还是保存到本地, FFmpeg 的核心数据结构,负责协调编码、封装和写入操作。它相当于推流的“总指挥”。 先来看一下ffmpeg的…...
使用 Python 开发的简单招聘信息采集系统
以下是一个使用 Python 开发的简单招聘信息采集系统,它包含用户登录、招聘信息收集和前后端交互的基本功能。我们将使用 Flask 作为后端框架,HTML 作为前端页面。 项目结构 recruitment_system/ ├── app.py ├── templates/ │ ├── login.html │ ├── index…...
Selenium库打开指定端口(9222、9333等)浏览器【已解决!!!】
就是在写动态爬虫爬取数据的过程中,如果用selenium的话,有一个缺点,就是当我们去测试一个网站能不能爬取,它都会重新换端口打开一个浏览器,不会使用上一次使用的浏览器,在实际使用过程中这样调试很烦&#…...