数据处理与机器学习入门
一、数据处理概述
数据处理是通过统计学、机器学习和数据挖掘方法从原始数据中提取有价值信息的过程。数据处理的目标是将杂乱无章的原始数据转化为可用于分析和建模的结构化数据。对于小规模数据处理,常用工具分为两类:
• 可视化分析工具:
• SPSS:适合非编程用户,提供丰富的可视化操作界面,能够快速进行统计分析和数据挖掘。
• SAS:适合企业级数据分析,具有强大的数据处理和统计分析能力,广泛应用于金融、医疗等领域。
• 编程工具:
• Python:通过Pandas进行数据处理,Scikit-learn进行机器学习建模,是目前最流行的机器学习编程语言之一。
• MATLAB:适合算法开发,特别是在信号处理和控制系统领域,矩阵运算优化使其在处理数值计算时表现出色。
数据处理的基本流程通常包括以下几个步骤:
-
数据采集:从各种数据源获取数据。
-
数据清洗:处理缺失值、异常值,去除重复数据。
-
数据转换:标准化、归一化,将数据转换为适合分析的格式。
-
数据分析:通过统计分析、可视化等手段初步探索数据。
-
特征工程:提取、选择和构造特征,为机器学习模型准备数据。
二、机器学习基础
2.1 定义与核心概念
机器学习是研究如何通过数据构建算法的学科,目标是让机器模拟人类学习行为。以下是机器学习的关键概念体系:
术语 定义 示例
样本 单个数据实例 一条客户记录
特征向量 样本的属性集合 [年龄=25, 收入=50k, 城市=北京]
标签 监督学习的目标值 客户是否购买(0/1)
训练误差 模型在训练集的错误率 训练准确率95%
过拟合 模型过度适应训练数据 训练准确率99%但测试仅70%
泛化能力 模型对新数据的适应能力 模型在测试集上的表现
2.2 学习任务分类
机器学习任务可以根据数据的标注情况和目标的不同分为以下几类:
- 监督学习:
• 分类:预测离散标签,如鸢尾花识别(Iris数据集)。
• 回归:预测连续值,如房价预测(Boston房价数据集)。
- 无监督学习:
• 聚类:将数据分为不同的簇,如客户分群。
• 降维:减少数据维度,如PCA可视化。
- 半监督学习:
• 混合标注与未标注数据,适用于标注数据稀缺的场景。
- 强化学习:
• 动态决策,如游戏AI、机器人控制。
- 自监督学习:
• 自动生成监督信号,如语言模型预训练。
三、经典数据集解析
以下是一些常用的机器学习数据集及其典型任务:
数据集 类型 特征数 样本数 典型任务
Iris 多分类 4 150 花卉分类
Boston 回归 13 506 房价预测
Breast Cancer 二分类 30 569 肿瘤诊断
Diabetes 回归 10 442 疾病进展预测
四、算法体系演进
4.1 浅层学习
浅层学习是传统机器学习方法的核心,主要依赖于手工特征工程和简单的模型结构。以下是几种常见的浅层学习算法:
• 线性回归
• 原理:通过拟合一条直线(或超平面)来预测连续值目标变量。
• 适用场景:当数据特征与目标变量之间存在线性关系时,线性回归效果较好。例如,房价预测中,房屋面积与价格之间可能存在线性关系。
• 优点:模型简单,易于理解和解释,训练速度快。
• 缺点:只能捕捉线性关系,对于复杂数据集拟合能力有限。
• 决策树
• 原理:通过一系列规则(树状结构)对数据进行分类或回归。每个节点代表一个特征的判断,每个分支代表一个判断结果。
• 适用场景:适用于特征较少且特征之间关系较为明确的数据集,如简单的客户分类问题。
• 优点:模型直观易懂,无需特征缩放,能够处理离散和连续特征。
• 缺点:容易过拟合,对噪声数据敏感。
• SVM(支持向量机)
• 原理:通过寻找一个最优超平面,将不同类别的数据分隔开。对于非线性可分的数据,可以通过核技巧将其映射到高维空间。
• 适用场景:适用于特征维度较高且数据量适中的分类问题,如图像识别、文本分类等。
• 优点:对高维数据效果较好,能够处理线性和非线性问题。
• 缺点:对核函数的选择和参数调整要求较高,训练时间可能较长。
4.2 深度学习
深度学习是机器学习的一个重要分支,基于人工神经网络的多层结构,能够自动学习数据中的复杂特征表示。以下是深度学习的一些关键点:
• 人工神经网络(ANN)
• 原理:模拟人脑神经元的工作方式,通过多层神经元的组合来学习数据中的模式。每一层神经元都会对输入数据进行加权求和、激活函数处理,然后将结果传递到下一层。
• 适用场景:适用于大规模复杂数据集,如图像、语音和自然语言处理等。
• 优点:能够自动学习特征表示,无需手工设计特征;对大规模数据拟合能力强。
• 缺点:需要大量数据进行训练,计算资源消耗大,模型训练时间长。
• 主要网络类型对比
- 前馈神经网络(Feedforward Neural Network,FNN)
• 特点:数据从输入层单向传递到输出层,中间经过多层隐藏层。主要用于图像分类、语音识别等任务。
• 示例代码:
from keras.models import Sequentialfrom keras.layers import Densemodel = Sequential()model.add(Dense(64, activation='relu', input_dim=20))model.add(Dense(32, activation='relu'))model.add(Dense(1, activation='sigmoid'))
- 循环神经网络(Recurrent Neural Network,RNN)
• 特点:能够处理序列数据,每个神经元的输出不仅取决于当前输入,还依赖于之前的状态。适用于时间序列预测、自然语言处理等任务。
• 示例代码:
from keras.models import Sequentialfrom keras.layers import SimpleRNN, Densemodel = Sequential()model.add(SimpleRNN(50, input_shape=(10, 1))) # 10个时间步,每个时间步1个特征model.add(Dense(1))
- 卷积神经网络(Convolutional Neural Network,CNN)
• 特点:通过卷积层提取图像的局部特征,适用于图像分类、目标检测等任务。
• 示例代码:
from keras.models import Sequentialfrom keras.layers import Conv2D, MaxPooling2D, Flatten, Densemodel = Sequential()model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))model.add(MaxPooling2D((2, 2)))model.add(Flatten())model.add(Dense(10, activation='softmax'))
- 图神经网络(Graph Neural Network,GNN)
• 特点:用于处理图结构数据,能够学习节点之间的关系。适用于社交网络分析、分子结构预测等任务。
五、python案例实战
5.1 环境准备
在开始实战之前,需要安装必要的Python库。以下是安装命令:
pip install scikit-learn pandas matplotlib
5.2 Iris分类实战
以下是一个使用Scikit-learn进行Iris数据集分类的完整代码示例:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import precision_score, recall_score, accuracy_score# 数据加载
iris = load_iris()
X, y = iris.data, iris.target# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 模型训练
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)# 性能评估
y_pred = clf.predict(X_test)
print(f"准确率: {accuracy_score(y_test, y_pred):.2f}")
print(f"查准率: {precision_score(y_test, y_pred, average='macro'):.2f}")
print(f"查全率: {recall_score(y_test, y_pred, average='macro'):.2f}")
5.3 关键指标解读
在机器学习中,评估模型性能是至关重要的。以下是一些常用的关键指标:
• 准确率(Accuracy):模型预测正确的样本数占总样本数的比例。
• 查准率(Precision):在所有被预测为正的样本中,实际为正的比例。
• 查全率(Recall):在所有实际为正的样本中,被正确预测为正的比例。
• F1分数(F1 Score):查准率和查全率的调和平均值,用于综合评估模型性能。
• 支持度(Support):每个类别的样本数量,表示该类别在数据集中的频率。
5.4 数据可视化
数据可视化是理解数据和展示结果的重要手段。以下是一个简单的数据可视化示例:
import matplotlib.pyplot as plt
import seaborn as sns# 可视化Iris数据集的特征分布
sns.pairplot(pd.DataFrame(X, columns=iris.feature_names), hue=y)
plt.show()
六、工具对比指南
以下是几种常用的数据处理和机器学习工具的对比:
工具 优势 适用场景
SPSS 可视化操作简单,适合非编程用户 快速统计分析,市场调研
SAS 企业级稳定性,强大的数据处理能力 金融风控建模,大型企业数据分析
Python 生态系统完善,支持多种机器学习和深度学习库 全流程开发,从数据处理到模型部署
MATLAB 矩阵运算优化,适合信号处理和控制系统 信号处理研究,控制系统设计
七、模型优化要点
在机器学习中,模型优化是提升性能的关键步骤。以下是一些常见的优化方法:
- 防止过拟合:
• 增加正则化项:如L1、L2正则化,限制模型复杂度。
• 使用交叉验证:通过多次划分训练集和验证集,评估模型的稳定性和泛化能力。
• 早停法(Early Stopping):在训练过程中,当验证集的性能不再提升时停止训练。
- 提升泛化能力:
• 数据增强:通过生成新的训练样本,增加数据多样性。
• 特征工程优化:选择重要的特征,构造新的特征。
• 集成学习方法:如随机森林、梯度提升树,通过组合多个模型提升性能。
相关文章:
数据处理与机器学习入门
一、数据处理概述 数据处理是通过统计学、机器学习和数据挖掘方法从原始数据中提取有价值信息的过程。数据处理的目标是将杂乱无章的原始数据转化为可用于分析和建模的结构化数据。对于小规模数据处理,常用工具分为两类: • 可视化分析工具:…...
Markdown在线转word格式
1、打开网址 https://dillinger.io/ 2、输入markdown格式文章 3、直接转换为右边的word格式 4、复制粘贴即可。...
Redis延时队列在订单超时未报到场景的应用分享
一、引言 在电商、医疗预约等众多业务场景中,经常会遇到需要处理超时任务的情况。比如医疗预约订单,如果患者在支付成功后,到了预约结束时间还未报到,系统需要自动取消订单。为了实现这样的功能,我们可以利用 Redis 延…...
vue前端代码作业——待办事项
美化样式示意图: 后端IDEA代码示意图: 代码解释: 1. isAllChecked 计算属性的作用 isAllChecked 用于实现 “全选 / 全不选” 功能,它是一个 双向绑定 的计算属性(因为 v-model 需要同时支持读取和设置值)…...
docker镜像拉取失败
hub.docker.com中提供的docker pull命令在服务器拉取镜像时报错Error response from daemon: Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) 这个错误通常表明Docker客户…...
Ruby 简介
Ruby 简介 引言 Ruby 是一种广泛使用的动态、开源的编程语言,自 1995 年由日本程序员 Yukihiro Matsumoto(通称 Matz)设计以来,它以其优雅的语法、强大的库支持和跨平台特性赢得了全球开发者的青睐。本文将详细介绍 Ruby 的起源、特点、应用领域以及它在现代软件开发中的…...
解决 FFmpeg 使用 C/C++ 接口时,解码没有 shell 快的问题(使用多线程)
一、问题 硬件设备为香橙派 5Plus,最近需要使用硬件视频解码来加速 YOLO 的检测,shell 窗口的FFmpeg已经调通,详见文章: 编译支持 RKmpp 和 RGA 的 ffmpeg 源码_rk3588 ffmpeg mpp-CSDN博客https://blog.csdn.net/plmm__/article…...
sqlalchemy:将mysql切换到OpenGauss
说明 之前python的项目使用的mysql,近期要切换到国产数据库OpenGauss。 之前的方案是fastapisqlalchemy,测试下来发现不用改代码,只要改下配置即可。 切换方案 安装openGauss-connector-python-psycopg2 其代码工程在:https:…...
缓存使用纪要
一、本地缓存:Caffeine 1、简介 Caffeine是一种高性能、高命中率、内存占用低的本地缓存库,简单来说它是 Guava Cache 的优化加强版,是当下最流行、最佳(最优)缓存框架。 Spring5 即将放弃掉 Guava Cache 作为缓存机…...
Qt之Service开发
一、概述 基于Qt的用于开发系统服务(守护进程)和后台服务,有以下几个优秀的开源 QtService 框架和库。 1. QtService (官方解决方案) GitHub: https://github.com/qtproject/qt-solutions/tree/master/qtservice 特点: 官方提供的服务框架 支持 Windows 服务和 Linux 守护…...
ssm框架之Spring
Spring框架介绍 Spring框架是一个轻量级的企业级应用框架 通过它可以贯穿表现层、业务层、持久层。集成方便,简单易用,具有如下特点: Spring框架特色 Spring设计理念 是面向Bean的编程 Spring两大核心技术 控制反转(IoC:Inver…...
Flutter 开发环境配置--宇宙级教学!
目录 一、安装环境(Windows)二、Android 创建Flutter项目三、VSCode 搭建环境四、补充 一、安装环境(Windows) Flutter SDK 下载 推荐使用中国镜像站点下载 Flutter SDK,速度更快:中国环境 或者从官网下载…...
音视频 YUV格式详解
前言 本文介绍YUV色彩模型,YUV的分类和常见格式。 RGB色彩模型 在RGB颜色空间中,任意色光F都可以使用R、G、B三色不同的分量混合相加而成即: F = R + G + B.。即我们熟悉的三原色模型。 RGB色彩空间根据每个分量在计算机中占用的存储字节数可以分为以下几种类型,字节数…...
力扣 第 153 场双周赛 讲题
文章目录 Q1.字符串的反转度Q2.操作后最大活跃区段数I3500.将数组分割为子数组的最小代价 Q1.字符串的反转度 签到题,直接建立一个映射表即可 class Solution:def reverseDegree(self, s: str) -> int:# 先建立映射表ss "abcdefghijklmnopqrstuvwxyz"store {}i…...
grafana 配置页面告警
添加告警规则 1.登录grafana 点击 Alerting > Alert rules 点击 New alert rule 2.填写告警规则名字 3.配置告警规则 选择数据源为 Loki 单机 Builder 单机Label brower 单机 node_name 标签,选择一个主机,选好后单机 Show logs 这时候查询语…...
Cent OS7+Docker+Dify
由于我之前安装了Dify v1.0.0,出现了一些问题:无法删除,包括:知识库中的文件、应用、智能体、工作流,都无法删除。现在把服务器初始化,一步步重新安装,从0到有。 目录 1、服务器重装系统和配置…...
【自学笔记】PHP语言基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1. PHP 简介2. PHP 环境搭建3. 基本语法变量与常量数据类型运算符 4. 控制结构条件语句循环语句 5. 函数函数定义与调用作用域 6. 数组7. 字符串8. 表单处理9. 会话…...
Android Gradle 下载插件或依赖太慢
问题与处理策略 问题描述 Android 项目中,settings.gradle 文件中,有如下配置,Gradle 插件或依赖下载速度慢 pluginManagement {repositories {gradlePluginPortal()google()mavenCentral()} }dependencyResolutionManagement {repositori…...
python-59-基于python内置库解析html获取标签关键信息
文章目录 1 html.parser1.1 初始化和基础使用1.1.1 handle_starttag(self, tag, attrs)1.1.2 handle_endtag(self, tag)1.1.3 handle_startendtag(self, tag, attrs)1.1.4 handle_data(self, data)1.1.5 handle_comment(self, data)1.2 解析HTML文档的流程2 百度搜索关键词链接…...
elementplus的el-tabs路由式
在使用 Element Plus 的 el-tabs 组件,实现路由式的切换(即点击标签页来切换不同的路由页面)。下面是一个基于 Vue 3 和 Element Plus 实现路由式 el-tabs 的基本步骤和示例。 步骤 1: 安装必要的库 在vue3项目安装 Vue Router 和 Element …...
ArcGIS地理信息系统空间分析实验教程学习
ArcGIS 作为地理信息系统领域的经典软件,以其强大的功能和广泛的应用场景,成为了众多学者、研究人员和专业人士的首选工具。它不仅可以高效地处理和可视化地理空间数据,还能通过复杂的空间分析模型,揭示地理现象背后的规律和趋势。…...
mac部署CAT监控服务
在 Mac 上部署美团点评开源的 CAT 监控服务端,可以按照以下步骤操作: 1. 环境准备 1.1 安装依赖 确保已安装以下工具: JDK 8(建议 OpenJDK 11) MySQL 5.7(存储监控数据)(8.0不支持…...
鸿蒙OS 5 架构设计探秘:从分层设计到多端部署
文章目录 鸿蒙OS架构设计探秘:从分层设计到多端部署一、鸿蒙的分层架构设计二、模块化设计的精髓三、智慧分发设计:资源的动态调度四、一次开发,多端部署的实践总结与思考 鸿蒙OS架构设计探秘:从分层设计到多端部署 最近两年来&a…...
深入解析:ElasticSearch Query 查询方式
全文目录: 开篇语前言摘要概述ElasticSearch Query 查询方式详解1. Match 查询(全文搜索)1.1 Match 查询示例1.2 Match 查询参数扩展 2. Term 查询(精准查询)2.1 Term 查询示例2.2 Terms 查询 3. Bool 查询(…...
HTML5贪吃蛇游戏开发经验分享
HTML5贪吃蛇游戏开发经验分享 这里写目录标题 HTML5贪吃蛇游戏开发经验分享项目介绍技术栈核心功能实现1. 游戏初始化2. 蛇的移动控制3. 碰撞检测4. 食物生成 开发心得项目收获后续优化方向结语 项目介绍 在这个项目中,我使用HTML5 Canvas和原生JavaScript实现了一…...
桥接模式_结构型_GOF23
桥接模式 桥接模式(Bridge Pattern)是一种结构型设计模式,核心思想是将抽象与实现分离,使两者能独立变化。它像一座连接两岸的桥梁,让“抽象层”和“实现层”自由组合,避免因多维度变化导致的“类爆炸”问…...
卡尔曼滤波入门(二)
核心思想 卡尔曼滤波的核心就是在不确定中寻找最优,那么怎么定义最优呢?答案是均方误差最小的,便是最优。 卡尔曼滤波本质上是一种动态系统状态估计器,它回答了这样一个问题: 如何从充满噪声的观测数据中,…...
有关pip与conda的介绍
Conda vs. Pip vs. Virtualenv 命令对比 任务Conda 命令Pip 命令Virtualenv 命令安装包conda install $PACKAGE_NAMEpip install $PACKAGE_NAMEX更新包conda update --name $ENVIRONMENT_NAME $PACKAGE_NAMEpip install --upgrade $PACKAGE_NAMEX更新包管理器conda update con…...
【Portainer】Docker可视化组件安装
Portainer Portainer 是用于管理容器化环境的一体化平台工程解决方案,提供广泛的定制功能,以满足个人开发人员和企业团队的需求。 官方地址: https://www.portainer.io/ 安装 在 WSL / Docker Desktop 上使用 Docker 安装 Portainer CE 通过命令或UI页…...
基于深度神经网络的图像防篡改检测方法研究
标题:基于深度神经网络的图像防篡改检测方法研究 内容:1.摘要 随着数字化时代的发展,图像篡改现象日益普遍,严重影响了图像信息的真实性和可靠性。本文旨在研究基于深度神经网络的图像防篡改检测方法,以有效识别被篡改的图像。通过收集大量真…...
MATLAB导入Excel数据
假如Excel中存在三列数据需要导入Matlab中。 保证该Excel文件与Matlab程序在同一目录下。 function [time, voltage, current] test(filename)% 读取Excel文件并提取时间、电压、电流数据% 输入参数:% filename: Excel文件名(需包含路径,如C:\data\…...
华为GaussDB数据库的手动备份与还原操作介绍
数据库的备份以A机上的操作为例。 1、使用linux的root用户登录到GaussDB服务器。 2、用以下命令切换到 GaussDB 管理员用户,其中,omm 为当前数据库的linux账号。 su - omm 3、执行gs_dump命令进行数据库备份: 这里使用gs_dump命令进行备…...
MySQL数据库BUG导致查询不到本该查到的数据
在数据库的日常使用中,我们常常会遇到一些看似匪夷所思的查询问。最近就看到一个因为MySQL BUG导致无法查到本该查询到数据的案例。 1. 问题背 数据库版本:MySQL8.0.40 假设我们创建了一个名为 product_info 的表,用于存储产品的相关信息。该…...
Dubbo(25)如何配置Dubbo的协议和端口?
配置Dubbo的协议和端口是设置分布式服务通信的基础步骤。Dubbo支持多种协议(如Dubbo、RMI、HTTP等),你可以根据需求选择合适的协议并配置相应的端口。下面以一个完整的Spring Boot项目为例,详细介绍如何配置Dubbo的协议和端口。 …...
服务器磁盘卷组缓存cache设置介绍
工具1: storcli a. 确认软件包是否安装 [rootlocalhost ~]#rpm -qa | grep storcli storcli-1.21.06-1.noarch 备注:若检索结果为空,需要安装对应的软件安装包。安装命令如下: #rpm -ivh storcli-xx-xx-1.noarch.rpm b. 查看逻辑…...
StarVector:开启多模态SVG生成的新纪元——开源AI模型的革新之作
在AI技术蓬勃发展的今天,图像生成模型已不再局限于像素级的输出。StarVector作为一款开源的多模态SVG生成模型,凭借其独特的代码与视觉融合能力,正在重新定义矢量图形的创作方式。它不仅让图像生成更灵活、更轻量化,还为设计师、开…...
MySQL日期时间函数
函数分类 函数名 功能描述 语法示例 获取当前日期和时间 NOW() 返回包含年、月、日、时、分、秒的完整时间戳,格式为 YYYY-MM-DD HH:MM:SS SELECT NOW(); CURDATE() / CURRENT_DATE() 获取当前日期,格式为 YYYY-MM-DD SELECT CURDATE(); 或 SE…...
WinSCP使用教程:(SFTP、SCP、FTP 和 WebDAV)
WinSCP 是一款免费开源的 Windows 环境下的 SFTP、SCP、FTP 和 WebDAV 客户端,主要用于在本地计算机与远程服务器之间安全地传输文件,并提供基本的文件管理功能。 WinSCP是Windows环境下使用SSH的开源图形化的SFTP的客户端 SSH 的全称是 Secure Shell&…...
备份是个好习惯
##解题思路 首先看到题目说备份是个好习惯,说明可能存在备份文件泄露 用dirsearch或者其他的目录扫描工具扫一扫,发现两个网址状态码正常,其中一个刚好是.bak的备份文件 至于flag文件,无法读取源码,都是空的 下载备份…...
centos 7 LVM管理命令
物理卷(PV)管理命令 pvcreate:用于将物理磁盘分区或整个磁盘创建为物理卷。 示例:sudo pvcreate /dev/sdb1 解释:将 /dev/sdb1 分区创建为物理卷。 pvdisplay:显示物理卷的详细信息,如大小、所属…...
使用 Spring Boot 3.2 集成 MinIO 8.5:实现高效对象存储
摘要 MinIO 是一款高性能的分布式对象存储服务,与云原生应用完美契合。本文将手把手教你如何在 Spring Boot 3.2 项目中集成 MinIO 8.5 版本,实现文件上传、下载和删除等核心功能,并提供完整代码示例和常见问题解决方案。 一、环境准备 JDK …...
【Qt】数据库管理
数据库查询工具开发学习笔记 一、项目背景与目标 背景:频繁编写数据库查询语句,希望通过工具简化操作,提升效率。 二、总体设计思路 1. 架构设计 MVC模式:通过Qt控件实现视图(UI),业务逻辑…...
C#:Time.deltaTime
目录 第一性原理:从最基本的问题开始 什么是Time.deltaTime? 1. 什么是“帧”? 2. 什么是“帧率”? 为什么需要它? 一个生活化的例子 更通俗的类比 在Unity中的特殊性 第一性原理:从最基本的问题开…...
鸿蒙富文本实践
01 鸿蒙中的文本展示-Text组件 Text 组件的普通用法和其他语言一样,可以直接使用字符串Text(我是一段文本) 通过点语法设置文本样式: Text(我是超长文本,超出的部分显示省略号。I am an extra long text, with ellipses displayed for any ex…...
【字符设备驱动开发–IMX6ULL】(二)Linux 设备号
【字符设备驱动开发–IMX6ULL】(二)Linux 设备号 文章目录 【字符设备驱动开发–IMX6ULL】(二)Linux 设备号1 设备号的组成2.设备号的分配 1 设备号的组成 为了方便管理,Linux 中每个设备都有一个设备号,设…...
Elasticsearch-实战案例
一、没有使用Elasticsearch的查询速度698ms 1.数据库模糊查询不走索引,在数据量较大的时候,查询性能很差。需要注意的是,数据库模糊查询随着表数据量的增多,查询性能的下降会非常明显,而搜索引擎的性能则不会随着数据增…...
电子文档安全管理系统V6.0接口backup存在任意文件下载漏洞
免责声明:本号提供的网络安全信息仅供参考,不构成专业建议。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权,请及时与我联系,我将尽快处理并删除相关内容。 漏洞描述 电子文档安全管理系统 V6.0 reso…...
jmeter web压力测试 压测
下载地址 Apache JMeter - Download Apache JMeter 1. 设置线程组 2. 设置http请求头 3. 设置http请求体 4. 设置结果条目 常用函数 ${__RandomString(8, abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789)}${__javaScript( ${__Random(1000, 10000)} /…...
FPGA学习篇——Verilog学习之寄存器的实现
1 寄存器理论 这里在常见的寄存器种加了一个复位信号sys_rst_n。(_n后缀表示复位信号低电平有效,无这个后缀的则表示高电平有效) 这里规定在时钟的上升沿有效,只有当时钟的上升沿来临时,输出out 才会改变,…...
CXL UIO Direct P2P学习
前言: 在CXL协议中,UIO(Unordered Input/Output) 是一种支持设备间直接通信(Peer-to-Peer, P2P)的机制,旨在绕过主机CPU或内存的干预,降低延迟并提升效率。以下是UIO的核心概念及UI…...