MYSQL8.0常用窗口函数
MYSQL8.0常用窗口函数
一、窗口函数的基本概念
窗口函数,顾名思义,就是在查询结果集中定义一个“窗口”,在这个窗口内进行数据的计算和分析。与普通聚合函数不同,普通聚合函数会将结果集分组并返回每组的单一汇总值,而窗口函数可以在每个行上返回基于窗口内数据的计算结果,并且不会改变结果集的行数。例如,在计算每个员工的工资在部门内的排名时,窗口函数可以在不影响原有员工信息行的基础上,为每行数据添加一个排名列。
窗口函数的语法结构如下:
<窗口函数> OVER ([PARTITION BY 列名] -- 分组字段[ORDER BY 列名] -- 排序字段[ROWS/RANGE 窗口范围] -- 可选,定义窗口大小
)
其中,<窗口函数>
可以是各种函数,如排序函数、聚合函数、偏移函数等;PARTITION BY
用于指定分组条件,类似于GROUP BY
,但不会将结果集合并;ORDER BY
用于指定窗口内数据的排序顺序;ROWS/RANGE
用于定义窗口的范围,可选参数。
二、常见窗口函数及示例
(一)排序函数
排序函数包括ROW_NUMBER()
、RANK()
、DENSE_RANK()
等,主要用于对窗口内的数据进行排名。
ROW_NUMBER()
:为分组内的行生成唯一连续序号(重复值不影响排名)。常用于分页查询、取每组前N条数据。
SELECT id, dept, salary,ROW_NUMBER() OVER (PARTITION BY dept ORDER BY salary DESC) AS rn
FROM employees;
RANK()
:分组内重复值排名相同,后续排名跳过重复数(如并列第1名后直接第3名)。适用于获取不考虑重复值的排名场景,如考试排名。
SELECT id, dept, salary,RANK() OVER (PARTITION BY dept ORDER BY salary DESC) AS rnk
FROM employees;
DENSE_RANK()
:分组内重复值排名相同,后续排名不跳过(如并列第1名后为第2名)。适用于需要紧凑排名的场景,如成绩排名。
SELECT id, dept, salary,DENSE_RANK() OVER (PARTITION BY dept ORDER BY salary DESC) AS drnk
FROM employees;
(二)聚合函数
聚合函数如SUM()
、AVG()
、MAX()
、MIN()
等,可在窗口内进行聚合计算。
- 计算部门内薪资累计和:
SELECT id, dept, salary,SUM(salary) OVER (PARTITION BY dept ORDER BY join_date) AS dept_total
FROM employees;
- 计算近3个月的平均薪资(按时间窗口):
SELECT join_date, salary,AVG(salary) OVER (ORDER BY join_date ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS moving_avg
FROM employees;
(三)偏移函数
偏移函数包括LAG()
和LEAD()
,用于获取当前行之前或之后某一行的值。
LAG()
:获取当前行之前第N行的数据,常用于对比前后行数据,如计算同比、环比数据。
SELECT id, dept, salary,LAG(salary, 1) OVER (PARTITION BY dept ORDER BY join_date) AS prev_salary
FROM employees;
LEAD()
:获取当前行之后第N行的数据,用于对比当前行与后续行数据。
SELECT id, dept, salary,LEAD(salary, 1) OVER (PARTITION BY dept ORDER BY join_date) AS next_salary
FROM employees;
三、窗口函数的应用场景
(一)排名与分页
在查询数据库时,经常需要对结果进行排名,以便实现分页或获取特定排名的记录。例如,在学生成绩表中,查询每个班级成绩排名前5的学生,就可以使用RANK()
函数结合WHERE
子句来实现。
(二)分组统计与分析
在分组的基础上进行更复杂的统计分析。例如,在销售数据表中,按月份和地区统计销售额,并计算每个地区在每个月的销售额占该月总销售额的比例,可使用窗口函数结合GROUP BY
子句来实现。
(三)数据对比与趋势分析
通过偏移函数可以方便地进行数据对比和趋势分析。例如,在股票交易数据表中,查询每天的股票价格与前一天价格的差值,以分析股票价格的走势,可使用LAG()
函数获取前一天的价格,然后与当前天的价格进行计算。
(四)数据填充与补全
在某些情况下,数据可能存在缺失或不完整的情况,窗口函数可以用于填充或补全数据。例如,在一个包含日期和销售额的表中,如果某些日期没有销售额记录,可以使用窗口函数从前一个有记录的日期获取销售额进行填充。
四、窗口函数的性能优化与注意事项
(一)性能优化
- 合理使用索引:避免在大表中无索引的列上使用窗口函数,因为窗口函数的计算通常依赖于排序和分组操作,索引可以大大提高这些操作的效率。
- 减少窗口范围:尽量缩小窗口的范围,避免使用过大的窗口,因为窗口越大,计算量就越大。如果只需要获取前几行或后几行的数据,明确指定窗口范围,而不是使用默认的全窗口。
- 避免重复计算:如果在多个窗口函数中使用了相同的排序和分组条件,可以考虑将这些条件提取到公共部分,避免重复计算。
(二)注意事项
- 语法结构:确保正确使用窗口函数的语法结构,特别是
PARTITION BY
、ORDER BY
和窗口范围的定义,否则可能会导致查询结果不符合预期。 - 兼容性:不同的数据库对窗口函数的支持程度和语法略有差异。例如,MySQL 8.0+才支持窗口函数,低版本需用变量模拟;Oracle和SQL Server对窗口函数的支持较为全面,但在一些细节上也有所不同。在使用窗口函数时,要注意数据库的版本和特性。
- 数据量影响:对于大数据量的查询,窗口函数的性能可能会受到影响。在这种情况下,可以考虑先对数据进行预处理,如使用临时表或分区表,减少窗口函数的计算量。
五、总结
SQL窗口函数是一种强大而灵活的数据处理工具,它能够帮助我们在复杂的数据查询和分析中,轻松实现各种高级功能。通过本文的介绍,相信大家对窗口函数的基本概念、常见函数、应用场景以及性能优化等方面有了更深入的了解。在实际工作中,希望大家能够熟练运用窗口函数,提高数据处理的效率和质量,让数据为我们创造更大的价值。
如果你在使用窗口函数的过程中遇到任何问题,或者有更多的使用技巧和经验分享,欢迎在评论区留言交流!
上述博客涵盖了窗口函数多方面内容,能帮助读者系统认识和运用它。若你觉得某些部分需补充,或想调整风格,欢迎随时告知。
相关文章:
MYSQL8.0常用窗口函数
MYSQL8.0常用窗口函数 一、窗口函数的基本概念 窗口函数,顾名思义,就是在查询结果集中定义一个“窗口”,在这个窗口内进行数据的计算和分析。与普通聚合函数不同,普通聚合函数会将结果集分组并返回每组的单一汇总值,…...
【Pandas】pandas DataFrame pct_change
Pandas2.2 DataFrame Computations descriptive stats 方法描述DataFrame.abs()用于返回 DataFrame 中每个元素的绝对值DataFrame.all([axis, bool_only, skipna])用于判断 DataFrame 中是否所有元素在指定轴上都为 TrueDataFrame.any(*[, axis, bool_only, skipna])用于判断…...
Model 复现系列(一)OpenVLA
这个系列用来记录一些开源模型在本地部署或测试时遇到的一些坑以及解决方案。 系列第一篇文章给了 OpenVLA,该模型是具身智能与VLA领域的必读模型之一,虽然现在有很多模型号称超越了它,但作为行业的基石仍然有非常高的地位。 项目链接&…...
Web3:Ubuntu系统 使用Docker-compose方式部署blockscout浏览器配置版本-v5.2.3-beta+charts图表
最近同事告诉我说要重新部署一套blockscout浏览器,我一想,之前有部署流程文档-《Web3:使用Docker-compose方式部署blockscout浏览器+charts图表》,这不手拿把掐吗。 但还是出现了一些问题,之前服务器系统是centos,现在是Ubuntu系统,而且之前docker镜像也没那么难获取,于…...
ECharts-柱状图
柱状图样式设置 Ⅰ、柱条样式 柱条的样式可以通过 series.itemStyle 设置,包括: 柱条的颜色(color);柱条的描边颜色(borderColor)、宽度(borderWidth)、样式ÿ…...
理解UDP协议
在计算机网络中,UDP(用户数据报协议)常被称为“轻量级”传输协议。它不像TCP那样追求可靠传输,而是以简洁高效的设计满足特定场景的需求。本文将带你深入UDP的核心特性、技术细节及其实际应用。 UDP的协议设计 UDP协议的核心…...
Web 技术与 Nginx 网站环境部署
这里写目录标题 一. Web基础域名和DNS域名的概念域名的结构域名结构类型 Hosts文件Hosts文件的作用修改Hosts文件 DNS域名注册 网页与HTML网页概述HTML概述HTML基本标签HTML语法规则HTML文件结构 网站和主页Web1.0 与 Web2.0 静态网页与动态网页静态网页动态网页动态网页语言 H…...
分布式天线系统 (DAS, Distributed Antenna System)
1. 概述 分布式天线系统(DAS) 是一种通过多个分散的天线节点来增强无线信号覆盖和容量的网络架构。它主要用于解决大型建筑、地下设施、体育场馆等场景中的信号盲区或容量不足问题。 2. 主要组成 DAS系统通常包括以下关键组件: 信号源&…...
hexo博客搭建使用
搭建 Hexo 演示主题为:Keep 使用 文章 创建新文章 ➜ zymore-blog-keep git:(main) ✗ hexo new "告别H5嵌入!uniApp小程序文件下载与分享完整解决方案" INFO Validating config INFO Created: ~/Desktop/HelloWorld/zymore-blog-k…...
Git上传项目到GitHub
Git上传项目到GitHub 下载Git客户端配置Git设置GitHub上传本地项目到Github 下载Git客户端 网址:Git Windows客户端。选择Standalone Installer(单独安装程序),并点击64bit Git for Windows Setup(64位Git for Windows安装程序)进行下载。然后一路默认选…...
隨筆20250519 Async+ThreadPoolTaskExecutor⾃定义线程池进阶实战
1.ThreadPoolTaskExecutor线程池 有哪⼏个重要参数, 什么时候会创建线程 1.核心綫程數 查看核心綫程數目是否已經滿,未滿 創建一條綫程 執行任務,已滿負責執行第二部 2.阻塞隊列 查看阻塞隊列是否已經滿,未滿將任務加入阻塞隊列&…...
YoloV8改进策略:卷积篇|风车卷积|即插即用
文章目录 论文信息论文翻译摘要引言相关研究红外搜索与跟踪检测和分割网络红外搜索与跟踪数据集的损失函数红外搜索与跟踪数据集方法风车形卷积(PConv)基于尺度的动态损失SIRST - UAVB数据集实验实验设置与其他方法的比较多模型上的消融实验结论致谢代码改进方法测试结果总结…...
HGDB中如何为表增加自增主键
文章目录 环境文档用途详细信息 环境 系统平台:N/A 版本:4.5 文档用途 本文主要介绍在瀚高数据库中如何为表增加新主键,便于业务改造和查询。 实现原理:通过添加序列自增字段和唯一约束实现。 详细信息 可以根据数字类型来设…...
升级mysql (rpm安装)
#备份以防万一 备份配置文件: /etc/my.cnf.d/server.cnf 备份数据: mysqldump -u your_username -p --all-databases > all_databases.sql #停止 systemctl stop mysql #卸载旧版 yum remove mariadb #安装新版( 通过yum安装报错,死活安装不了,只能rpm安装) 下载地址…...
ALTER COLLATION使用场景
ALTER COLLATION 是 SQL 中用于修改字符集排序规则(Collation)的操作。排序规则定义了字符数据的比较和排序方式,包括字母顺序、大小写敏感性、重音符号处理等。ALTER COLLATION 的使用场景主要集中在需要调整数据库或表的字符集排序规则时。…...
Python实例题:Python 实现简易 Shell
目录 Python实例题 题目 代码实现 功能说明 基本命令执行: 内置命令: 环境变量: 管道: 重定向: 信号处理: 使用方法 注意事项 Python实例题 题目 Python 实现简易 Shell 代码实现 import o…...
大中型病险水库大坝除险加固监测实施方案
一、方案背景 我国80%以上的水库修建于20世纪50至70年代,经过几十年的运行,大部分水库已超过设计使用年限,功能老化现象较严重,出现病险具有一定的客观性。受超标洪水、强烈地震等自然灾害影响,水库一旦遭遇突发暴雨洪…...
[长城杯 2024]anote
题解前的小吐槽:终于还是狠下心复现了一下长城杯的这个赛题,第一次觉得汇编比函数看的方便,不过这题好写是好写的[心虚](还是看了一些大佬的wp) [长城杯 2024]anote(堆溢出C) [长城杯 2024]anote 1.准备 motalymotaly-VMware-Virtual-Platform:~$ fi…...
verify_ssl 与 Token 验证的区别详解
verify_ssl 与 Token 验证的区别详解 在开发或调用 API 接口时,我们经常会遇到两个看似相关但实际上作用完全不同的安全参数: 传输层的 verify_ssl应用层的 Authorization(最常见是 Bearer Token) 虽然它们都与“安全”有关&am…...
Python集合
一、Python集合概述 Python集合(set)是一种无序、可变且不包含重复元素的数据结构。集合在Python中通过哈希表实现,这使得它在成员检测和去重操作中具有极高的效率。 集合与列表、元组的主要区别: 无序性:元素没有固定顺序 唯一性&#x…...
容器化-K8s-镜像仓库使用和应用
一、K8s 镜像仓库使用 1、启动镜像仓库 cd/usr/local/harbor ./install.sh2、配置镜像仓库地址 在 master 节点和 slaver 节点上,需要配置 Docker 的镜像仓库地址,以便能够访问本地的镜像仓库。编辑 Docker 的配置文件 vi /etc/docker/daemon.json(如果不存在则创建),添…...
解决报错 Flask-SQLAlchemy TypeError: ‘float‘ object is not callable
Flask-SQLAlchemy TypeError: ‘float’ object is not callable Flask-SQLAlchemy 与 Python 版本兼容性问题解决方案 日期:2025 年 5 月 19 日 分类:后端开发、Python、Flask 标签:Flask-SQLAlchemy, Python 版本兼容,错误修复…...
k8s节点维护的细节
k8s节点维护的细节 Kubernetes(k8s)节点维护是保障集群稳定运行的重要工作,涉及节点升级、故障排查、资源优化等多个方面。维护步骤和操作命令: 一、节点维护前的准备工作 1. 查看集群状态 kubectl get nodes # 查看所有节点状…...
基于STM32的光照测量报警Proteus仿真设计+程序设计+设计报告+讲解视频
基于STM32的光照测量报警仿真设计 1.**主要功能****2.仿真设计****3.程序设计****4.设计报告****5.下载链接** 基于STM32的光照测量报警仿真设计 (Proteus仿真程序设计设计报告讲解视频) 仿真图Proteus 8.9 程序编译器:keil 5 编程语言:C语…...
Docker 运维管理
Docker 运维管理 一、Swarm集群管理1.1 Swarm的核心概念1.1.1 集群1.1.2 节点1.1.3 服务和任务1.1.4 负载均衡 1.2 Swarm安装准备工作创建集群添加工作节点到集群发布服务到集群扩展一个或多个服务从集群中删除服务ssh免密登录 二、Docker Compose与 Swarm 一起使用 Compose 三…...
五分钟本地部署大模型
前提:个人PC机,配置:CPU:i5-13600KF 显卡:RTX3080 内存:32GB 1.安装ollama 访问https://ollama.com/,点击下载,完成后傻瓜式安装即可; 2.修改环境变量 默认大模型下载在C盘&…...
RSA(公钥加密算法)
RSA(Rivest-Shamir-Adleman)是一种常见的公钥加密算法,广泛应用于安全通信中。它是由三位计算机科学家Ron Rivest、Adi Shamir和Leonard Adleman于1977年提出的,是一种基于数论问题的加密算法。 一、RSA的基本原理 RSA是基于大数…...
Go语言测试用例的执行与分析
在软件开发过程中,测试用例是确保代码质量的关键环节。Go语言作为一种现代的编程语言,它内置了强大的测试框架,可以帮助开发者轻松编写和执行测试用例。本文将介绍如何在 Go 语言中编写、执行测试用例,并对测试结果进行分析。 ## …...
动态规划-LCR 089.打家劫舍-力扣(LeetCode)
一、题目解析 结合示例1,我们能得知对于小偷而言不能连续偷相连的房间,且需要保证偷窃的金额最高。 二、算法解析 1.状态表示 我们想知道到最后一个房子时所偷窃的最高金额,所以dp[i]表示在i位置时,所偷到的最大价值。 但我们…...
leetcode hot100:解题思路大全
因为某大厂的算法没有撕出来,怒而整理该贴。只有少数题目有AC代码,大部分只会有思路或者伪代码。 技巧 只出现一次的数字 题目 给你一个 非空 整数数组 nums ,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出…...
2022年下半年信息系统项目管理师——综合知识真题及答案(4)
2022年下半年信息系统项目管理师 ——综合知识真题及答案(4) 零、时光宝盒 (https://blog.csdn.net/weixin_69553582 逆境清醒) 双向奔赴的善意 网上看到的视频。 家里开包子店的男孩冒雨放学,路口的交警叔叔担心孩…...
大语言模型(LLM)本身是无状态的,怎么固化记忆
大语言模型(LLM)本身是无状态的,无法直接“记住”历史对话或用户特定信息 大语言模型(LLM)本身是无状态的,无法直接“记住”历史对话或用户特定信息,但可以通过架构改进、外部记忆整合、训练方法优化等方案实现上下文记忆能力。 一、模型内部记忆增强:让LLM“记住”…...
ISO 26262-5 硬件详细设计
7 Hardware detailed design 硬件详细设计个人理解包含各种理论计算和分析 为了避免常见的设计缺陷, 应运用相关的经验总结。 在硬件详细设计时, 应考虑安全相关硬件元器件失效的非功能性原因, 如果适用, 可包括以下的影响因素&…...
C# NX二次开发-求体、面的最小包容圆柱
NX自带ufun函数里有求体、面的最小包容方块。(UF_MODL_ask_bounding_box、UF_MODL_ask_bounding_box_aligned、UF_MODL_ask_bounding_box_aligned),但没有求最小包容圆柱。但有很多时候需要求最小包容圆柱。比如零件开圆棒料。这时需要通过一些方法来计算出最小包容圆柱。 …...
vue2.0 组件之间的数据共享
个人简介 👨💻个人主页: 魔术师 📖学习方向: 主攻前端方向,正逐渐往全栈发展 🚴个人状态: 研发工程师,现效力于政务服务网事业 🇨🇳人生格言&…...
11.4/Q1,GBD数据库最新文章解读
文章题目:Global, regional, and national burden of neglected tropical diseases and malaria in the general population, 1990-2021: Systematic analysis of the global burden of disease study 2021 DOI:10.1016/j.jare.2025.04.004 中文标题&…...
【愚公系列】《Manus极简入门》048-自然探险之旅:“户外活动规划师”
🌟【技术大咖愚公搬代码:全栈专家的成长之路,你关注的宝藏博主在这里!】🌟 📣开发者圈持续输出高质量干货的"愚公精神"践行者——全网百万开发者都在追更的顶级技术博主! …...
生命科学温控物流:现状、驱动因素与发展趋势深度洞察
在生命科学产业蓬勃发展的当下,生命科学温控物流作为保障药品、疫苗等温度敏感产品安全运输的关键环节,正受到越来越多的关注。根据QYResearch报告出版商调研统计,2031年全球生命科学温控物流市场销售额预计将达到3563.3亿元,年复…...
2025-2030年制造业数字化转型发展趋势展望
随着科技的飞速发展,数字化转型已成为制造业提升竞争力、实现高质量发展的核心路径。从2025年到2030年,这一趋势将进一步深化,新技术、新模式和新生态将为制造业注入强劲动力。作为小编,今天带大家一起来看看未来五年制造业数字化…...
OSD原理以及模块的讲解
一.原理讲解 1.OSD的概念: OSD(on-screen-display)中文名称是屏幕菜单调节显示方式,它的作用是对屏幕显示器做各种工作指标,包括:色彩、几何图形等进行调整,从而使得整个显示器得到最佳的状。 最常见的OSD调试就是在…...
SQL注入——Sqlmap工具使用
一、Sqlmap介绍 Sqlmap 是一个使用python语言开发的开源的渗透测试工具,可以用来进行自动化检测,利用 SQL 注入漏洞,获取数据库服务器的权限。它具有功能强大的检测引擎,针对各种不同类型数据库的渗透测试的功能选项,…...
如何有效提高海外社媒矩阵曝光率,避免封号风险?
在全球社交媒体营销的过程中,海外矩阵社媒的运营已经成为一个不可或缺的策略。通过建立多个社媒账号,可以有效地扩展市场覆盖、提高品牌曝光率,但与此同时,账号之间的关联问题也需要引起足够重视。过度的关联可能导致社媒平台对账…...
B树与B+树全面解析
B树与B树全面解析 前言一、B 树的基本概念与结构特性1.1 B 树的定义1.2 B 树的结构特性1.3 B 树的节点结构示例 二、B 树的基本操作2.1 查找操作2.2 插入操作2.3 删除操作 三、B 树的基本概念与结构特性3.1 B 树的定义3.2 B 树的结构特性3.3 B 树的节点结构示例 四、B 树与…...
代码随想录60期day41
完全背包 #include<iostream> #include<vector>int main() {int n,bagWeight;int w,v;cin>>n>>bagWeight;vector<int>weight(n);vector<int>value(n);for(int i 0;i <n;i){cin>>weight[i]>>value[i];}vector<vecotr&l…...
语言幻觉测试用例及相关策略总结
文章目录 语言幻觉测试用例及相关策略总结如何判断内容是否存在语言幻觉? 一、语言幻觉测试用例类型1.1 事实性错误测试用例 1:时效性强的事实用例 2:跨领域常识用例 3:动态变化的规则 **1.2 逻辑矛盾测试**用例 1:同一…...
云原生攻防1(基础介绍)
什么是云原生 云原生是一套技术体系和方法论。 云:表示应用程序位于云中 原生:表示应用程序从设计之初就考虑到云的环境,原生为云而设计,在云上以最佳状态运行。 CNCF(Cloud Native Compute Foundation) 是 Linux 基金会旗下的一个组织,主要作用是在推动以容器为中心的…...
云原生环境下的事件驱动架构:理念、优势与落地实践
📝个人主页🌹:慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 一、引言:从服务调用到事件流动的转变 随着云原生技术的兴起,软件架构正经历一场深刻变革。传统以请求响应为主的服务通信方式,在高度动态、分布式的云原生环境下暴露出诸多挑战:强同步耦合、高延迟链路…...
InternLM 论文分类微调实践(XTuner 版)
1.环境安装 我创建开发机选择镜像为Cuda12.2-conda,选择GPU为100%A100的资源配置 Conda 管理环境 conda create -n xtuner_101 python3.10 -y conda activate xtuner_101 pip install torch2.4.0cu121 torchvision torchaudio --extra-index-url https://downloa…...
kotlin Flow的技术范畴
Flow 是 Kotlin 中的技术,准确地说,它是 Kotlin 协程(Kotlin Coroutines)库的一部分,属于 Kotlin 的 异步编程范畴。 ✅ Flow 的归属与背景: 所属技术:Kotlin(由 JetBrains 开发&am…...
PyTorch图像建模(图像识别、分割和分类案例)
文章目录 图像分类技术:改变生活的智能之眼图形识别技术图像识别过程图像预处理图像特征提取 图像分割技术练习案例:图像分类项目源码地址实现代码(简化版)训练结果(简化版)实现代码(优化版&…...