当前位置: 首页 > news >正文

SQL:Normalization(范式化)

目录

Normalization(范式化)

为什么需要 Normalization?

🧩 表格分析:

第一范式(1NF) 

 什么是第一范式(First Normal Form)?

 第二范式(2NF)

 什么是第二范式(2NF)?

怎么规范化成 2NF?

 第三范式(3NF)

什么是第三范式(3NF)?

当前表违反 3NF 的原因:

规范化为3NF 

Normalization(范式化)

为什么需要 Normalization?

目的:

  1. 减少数据冗余(重复)

  2. 避免数据不一致

  3. 提高数据完整性

  4. 简化维护(插入、更新、删除)

🧩 表格分析:

原始表(未规范化):

StudentYearClassTeacher
John Smith9GeographyMr. Green
Tom Buchanan9GeographyMr. Green
Sarah Bennet8PhysicsMrs. Einstein
Charlie Brown9GeographyMr. Green
April Barnes10MusicMrs. Sharpe

这个表的问题:

  • “Geography - Mr. Green” 重复了 3 次。

  • 如果某天 Mr. Green 改名了,需要修改所有相关记录 → 数据一致性风险

  • 如果 Geography 班级没有学生,无法记录老师信息 → 数据不完整

第一范式(1NF) 

 什么是第一范式(First Normal Form)?

  • 字段中不能有多个值(必须是原子值)

  • 字段名不应重复(如 Class1, Class2)

  • 每一行记录应代表一个唯一实体的单一信息单位

StudentYearClass
Paul Dawson11Math
Peggy Mitchell10History
Paul Dawson11Math
Brian Cox8English, Chemistry
Linda Marsh7Math, History, Biology

❌ 为什么这个表不满足第一范式(1NF)?

  1. 字段“Class”不是原子值(存在多个值组合成一个字段):

    • Brian Cox 的 Class 是 “English, Chemistry”(包含多个课程)

    • Linda Marsh 的 Class 是 “Math, History, Biology”

    • 这违反了 1NF 的“每个字段必须只包含一个值”的规则。

  2. 存在重复行(Paul Dawson 出现了两次,内容完全一样)。

 规范化后的学生信息表

💡 拆解多值字段 → 变为多行,每行只包含一个原子值

学生姓名(Student)年级(Year)课程(Class)
Paul Dawson11Math
Peggy Mitchell10History
Paul Dawson11Math
Brian Cox8English
Brian Cox8Chemistry
Linda Marsh7Math
Linda Marsh7History
Linda Marsh7Biology

 第二范式(2NF)

 什么是第二范式(2NF)?

2NF 的定义: 一个表满足 2NF,要求它首先是 1NF,且不能有任何“非主属性”对主键的部分依赖。 

通俗讲:

  • 如果主键是复合主键(比如由 Student, Subject 组成),

  • 那么其他字段(如 Age) 必须依赖于整个主键,而不能只依赖主键的一部分。

❌ 看看这个表的问题在哪:

StudentSubjectGradeAge
Natasha WilliamsMathsA15
Natasha WilliamsEnglishB15
Daniel JamesMathsC16
Simon BrownChemistryA14
Emma ThomasGeographyB14
  • Grade 依赖于整个 (Student + Subject),这是 OK 的 

  • Age 只依赖于 Student,不依赖 Subject  → 部分依赖!

怎么规范化成 2NF?

我们要“消除部分依赖” → 拆成两个表让每张表中,非主属性都完全依赖主键。

表一:成绩表(以 Student + Subject 为主键) 

StudentSubjectGrade
Natasha WilliamsMathsA
Natasha WilliamsEnglishB
Daniel JamesMathsC
Simon BrownChemistryA
Emma ThomasGeographyB

表二:学生基本信息表(以 Student 为主键) 

StudentAge
Natasha Williams15
Daniel James16
Simon Brown14
Emma Thomas14
  • 主键:Student

  • 非主属性:Age

  • Age 完全依赖于 Student,符合第二范式 ✅

 第三范式(3NF)

什么是第三范式(3NF)?

一个关系模式满足 3NF,需要:

  1. 满足 2NF;

  2. 所有非主属性 必须直接依赖主键,不能依赖其他非主属性(即消除传递依赖)。

原始表:

SubjectYearStar PupilStar Pupil Date Of Birth
Math2015Matthew Taylor1999-03-21
Physics2015William Edwards1999-09-15
Chemistry2015Georgina Simon1998-11-04
Math2016Benjamin Long2000-05-02
Physics2016William Edwards1999-09-15

当前表违反 3NF 的原因:

  • 主键候选是 (Subject, Year)

  • Star Pupil 是依赖于 (Subject, Year)

  • 但是 Star Pupil Date Of Birth 是依赖于 Star Pupil ❌ → 传递依赖存在

规范化为3NF 

表一:课程之星表 

主键:Subject + Year,非主键:Star Pupil)

SubjectYearStar Pupil
Math2015Matthew Taylor
Physics2015William Edwards
Chemistry2015Georgina Simon
Math2016Benjamin Long
Physics2016William Edwards

表二:学生信息表 

(主键:Star Pupil,非主键:Date of Birth)

Star PupilDate of Birth
Matthew Taylor1999-03-21
William Edwards1999-09-15
Georgina Simon1998-11-04
Benjamin Long2000-05-02

通过拆分:

  • 我们将“课程→之星学生”和“学生→出生日期”的两种关系分离;

  • 保证每个非主属性直接依赖其所属表的主键;

相关文章:

SQL:Normalization(范式化)

目录 Normalization(范式化) 为什么需要 Normalization? 🧩 表格分析: 第一范式(1NF) 什么是第一范式(First Normal Form)? 第二范式(2NF&am…...

在pycharm中搭建yolo11分类检测系统1--PyQt5学习(一)

实验条件:pycharm24.3autodlyolov11环境PyQt5 如果pycharm还没有配PyQt5的话就先去看我原先写的这篇博文: PyQT5安装搭配QT DesignerPycharm)-CSDN博客 跟练参考文章: 目标检测系列(四)利用pyqt5实现yo…...

Neo4j GDS-12-neo4j GDS 库中节点插入(Node Embedding)算法介绍

neo4j GDS 系列 Neo4j APOC-01-图数据库 apoc 插件介绍 Neo4j GDS-01-graph-data-science 图数据科学插件库概览 Neo4j GDS-02-graph-data-science 插件库安装实战笔记 Neo4j GDS-03-graph-data-science 简单聊一聊图数据科学插件库 Neo4j GDS-04-图的中心性分析介绍 Neo…...

【论文阅读】RMA: Rapid Motor Adaptation for Legged Robots

Paper: https://arxiv.org/abs/2107.04034Project: https://ashish-kmr.github.io/rma-legged-robots/Code: https://github.com/antonilo/rl_locomotion训练环境:Raisim 1.方法 RMA(Rapid Motor Adaptation)算法通过两阶段训练实现四足机器…...

C语言数据结构:树的实现、前序、中序、后序遍历

一、什么是树 树是一种非线性的数据结构,由若干个节点组成。每个节点都包含数据,并且可以有多个子节点。树的最顶端是一个特殊的节点,叫根节点,它没有父节点。从根节点开始,树不断向下分叉,形成不同的层次…...

PostgreSQL:逻辑复制与物理复制

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…...

单片机Day05---动态数码管显示01234567

一、原理图 数组索引段码值二进制显示内容00x3f0011 1111010x060000 0110120x5b0101 1011230x4f0100 1111340x660110 0110450x6d0110 1101560x7d0111 1101670x070000 0111780x7f0111 1111890x6f0110 11119100x770111 0111A110x7c0111 1100B120x390011 1001C130x5e0101 1110D140…...

STM32江科大-----SPI

声明:本人跟随b站江科大学习,本文章是观看完视频后的一些个人总结和经验分享,也同时为了方便日后的复习,如果有错误请各位大佬指出,如果对你有帮助可以点个赞小小鼓励一下,本文章建议配合原视频使用❤️ 如…...

OBS SDK 中 ffmpeg_muxer 与 ffmpeg_output 的区别与使用 QSV 编码器的正确方式

在使用 OBS SDK 开发录制或推流功能时,开发者可能会遇到两个看似相似却完全不同的输出类型:ffmpeg_muxer 和 ffmpeg_output。它们的使用方式、编码器支持范围以及配置方式都有显著区别,特别是在使用硬件编码器(如 Intel QSV)时,选择正确的输出类型至关重要。 本文将重点…...

基于AOP+Log4Net+AutoFac日志框架

1.项目概述 这是一个基于 C# 的 WPF 项目 WpfApp12log4net,它综合运用了依赖注入、日志记录和接口实现等多种技术,同时使用了 Autofac、Castle.Core 和 log4net 等第三方库。 2.配置log4net 新建一个Log4Net.config,配置需要记录的日志信息…...

【Hadoop入门】Hadoop生态之Yarn简介

1 什么是Yarn? Yarn(Yet Another Resource Negotiator) 是Hadoop生态系统中的资源管理和调度框架,负责为上层应用提供统一的资源管理和调度服务。 是Hadoop 2.0引入的重要架构改进,成为Hadoop集群的资源管理层&#xf…...

猫咪如厕检测与分类识别系统系列【三】融合yolov11目标检测

✅ 前情提要 家里养了三只猫咪,其中一只布偶猫经常出入厕所。但因为平时忙于学业,没法时刻关注牠的行为。我知道猫咪的如厕频率和时长与健康状况密切相关,频繁如厕可能是泌尿问题,停留过久也可能是便秘或不适。为了更科学地了解牠…...

qt的基本使用

先教大家如何基本使用qt,这样是为了后面的服务器使用做铺垫 安装测试用例的创建创建qt界面程序后讲解各文件的作用qt的界面控件实现逻辑功能的流程测试效果 我会写一个测试用例方便大家了解与使用 安装 参考这个文章来安装,链接: qt安装 测试用例的创建…...

Spring AI使用tool Calling和MCP

深入探索 Spring AI Spring AI版本1.0.0.M6 在人工智能与软件开发深度融合的时代,Spring AI 作为一个强大的框架,持续为开发者提供着高效且便捷的工具,以实现与大语言模型(LLM)的无缝交互。Spring AI 的最新版本引入了…...

【前端】webpack一本通

今日更新完毕,不定期补充,建议关注收藏点赞。 目录 简介使用webpack默认只能处理js文件 ->引入加载器对JS语法降级,兼容低版本语法合并文件再次打包进阶 工作原理html-webpack-plugin插件webpack开发服务器引入使用webpack-dev-server模块…...

STM32蓝牙连接Android实现云端数据通信(电机控制-开源)

引言 基于 STM32F103C8T6 最小系统板完成电机控制。这个小项目采用 HAL 库方法实现,通过 CubeMAX 配置相关引脚,步进电机使用 28BYJ-48 (四相五线式步进电机),程序通过蓝牙连接手机 APP 端进行数据收发, OL…...

OpenHarmony Camera开发指导(二):相机设备管理(ArkTS)

在开发一个相机应用前,需要先通过调用Camera接口获取支持的相机设备列表,然后创建相机设备对象做后续处理。 开发步骤 1、导入camera接口,接口中提供了相机相关的属性和方法,导入方法如下。 import { camera } from kit.Camera…...

安卓 手机拨打电话录音保存地址适配

今天来聊一聊各大厂商拨打电话自动录音保存地址适配,希望同学们积极参与评论,把自己的手机型号、Android版本及拨打电话录音地址发一下,众人拾柴火焰高啊,这样有利于后期的同学积累经验,为中国的手机适配做一次贡献。 …...

spring cloud微服务断路器详解及主流断路器框架对比

微服务断路器详解 1. 核心概念 定义:断路器模式通过快速失败机制防止故障扩散,当服务调用出现异常或超时时,自动切换到降级逻辑,避免级联故障。核心功能: 熔断:在故障阈值(如错误率&#xff09…...

idea在线离线安装插件教程

概述 对于小白来说,刚使用idea时,还有很多不懂的地方,这里,简单介绍下如何安装插件。让小白能容易上手全盘idea。 1、File -> Settings 2、找到 Plugins -> Marketplace 3、安装 3.1、在线安装 输入想搜索的内容&#x…...

项目管理(高软56)

系列文章目录 项目管理 文章目录 系列文章目录前言一、进度管理二、配置管理三、质量四、风险管理五、真题总结 前言 本节主要讲项目管理知识,这些知识听的有点意思啊。对于技术人想创业,单干的都很有必要听听。 一、进度管理 二、配置管理 三、质量 四…...

通过类似数据蒸馏或主动学习采样的方法,更加高效地学习良品数据分布

好的,我们先聚焦第一个突破点: 通过类似数据蒸馏或主动学习采样的方法,更加高效地学习良品数据分布。 这里我提供一个完整的代码示例: ✅ Masked图像重建 残差热力图 这属于自监督蒸馏方法的一个变体: 使用一个 预…...

Java设计模式实战:策略模式在SimUDuck问题中的应用

一、前言 在面向对象编程中,设计模式是解决常见问题的可重用方案。今天,我将通过经典的SimUDuck问题,向大家展示如何使用策略模式(Strategy Pattern)来设计灵活、可扩展的鸭子模拟程序。 二、问题描述 SimUDuck是一个模拟鸭子行为的程序。最…...

考虑蒙特卡洛考虑风光不确定性的配电网运行风险评估—Matlab

目录 一、主要内容: 二、实际运行效果: 三、理论介绍: 四、完整代码数据下载: 一、主要内容: 由于风电光伏出力的不确定性,造成配电网运行风险,运用蒙特卡洛概率潮流计算分析电压和线路支路…...

如何统一多条曲线的 x 轴并进行插值处理

在数据处理和分析中,我们经常遇到需要将多条曲线的 x 轴统一的情况。这种需求通常出现在需要对不同来源的数据进行比较或整合时。本文将通过一个具体的例子,展示如何使用 C 实现这一功能,并通过插值计算新的 y 值,同时确保结果分段…...

【全队项目】智能学术海报生成系统PosterGenius--多智能体辩论

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏🏀大模型实战训练营 ​💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 文章目录 [toc]1. 前言2. 项目进度3. 本周核心进展3…...

PostIn安装及入门教程

PostIn是一款国产开源免费的接口管理工具,包含项目管理、接口调试、接口文档设计、接口数据MOCK等模块,支持常见的HTTP协议、websocket协议等,支持免登陆本地接口调试,本文将介绍如何快速安装配置及入门使用教程。 1、安装 私有…...

解决电脑问题——突然断网!

电脑如果突然断网是怎么回事 电脑突然断网可能由多种原因造成,以下是常见的因素: 网络连接与权限问题 路由器或调制解调器故障:路由器或调制解调器可能出现硬件故障、软件故障或设置错误。可以尝试重启设备,如果问题依旧&#…...

codeforces B2. The Strict Teacher

目录 题目 思路简述: 总代码: 题目 B1. 严厉的老师(困难版) 每个测试用例时间限制:1.5 秒 每个测试用例内存限制:256 兆字节 纳雷克和措索瓦克忙着准备这一轮(活动),…...

Linux:35.其他IPC和IPC原理+信号量入门

通过命名管道队共享内存的数据发送进行保护的bug: 命名管道挂掉后,进程也挂掉了。 6.systemV消息队列 原理:进程间IPC:原理->看到同一份资源->维护成为一个队列。 过程: 进程A,进程B进行通信。 让操作系统提供一个队列结构,…...

docker测试镜像源

参考文章 https://zhuanlan.zhihu.com/p/28662850275 格式如下:(不要加上前缀https://) sudo docker pull镜像源地址/要拉取的镜像名 和pip、npm不同, unknown flag: --registry-mirror 这个参数可能不存在。...

AdamW 是 Adam 优化算法的改进版本; warmup_steps:学习率热身的步数

AdamW 是 Adam 优化算法的改进版本 目录 AdamW 是 Adam 优化算法的改进版本1. `optimizer = torch.optim.AdamW(model.parameters(), lr=2e-4)`2. `num_epochs = 11`3. `total_steps = len(dataloader) * num_epochs`warmup_steps:学习率热身的步数,学习率会从一个较小的值逐…...

Java从入门到“放弃”(精通)之旅——运算符③

🌟Java从入门到“放弃”(精通)之旅🚀:运算符深度解析 引言:运算符的本质与价值 作为Java语言的核心组成部分,运算符是构建程序逻辑的基础元素。它们不仅仅是简单的数学符号,更是程…...

关于 微服务负载均衡 的详细说明,涵盖主流框架/解决方案的对比、核心功能、配置示例及总结表格

以下是关于 微服务负载均衡 的详细说明,涵盖主流框架/解决方案的对比、核心功能、配置示例及总结表格: 1. 负载均衡的核心概念 负载均衡在微服务中用于将请求分发到多个服务实例,以实现: 高可用性:避免单点故障。性…...

【AI提示词】API开发专家

提示说明 API开发专家专注于设计和实现高效、稳定、安全的应用程序接口(API)。他们通过深入理解业务需求和用户场景,为用户提供定制化的API解决方案。 提示词 # 角色 API开发专家## 注意 1. 专家设计应考虑API开发过程中的技术细节和用户需…...

Node.js中http模块详解

Node.js 中 http 模块全部 API 详解 Node.js 的 http 模块提供了创建 HTTP 服务器和客户端的功能。以下是 http 模块的所有 API 详解: 1. 创建 HTTP 服务器 const http require(http);// 1. 基本服务器 const server http.createServer((req, res) > {res.w…...

uniapp中,使用plus.io实现安卓端写入文件

这段代码是要删除的,留在这里避免以后用到。 在我写流式语音接收与播放的时候,写到这里无法继续了,因为播放时总是出错,无法播放,因为audioContext.play()不支持 但是,我写的这些,用于写入文件是…...

Linux xorg-server 解析(二)- 如何调试 xorg-server

一:概述 Xorg-server简称Xorg,它是Linux窗口系统的核心组件,它是用户态应用程序,但它的调试方法和普通用户态应用程序有所不同,因为Xorg是系统的核心组件,负责图形显示和输入设备的管理,所以在单台机器上调试Xorg可能会面临一些困难和限制,如果在同一台机器上调试它,可…...

CFS 调度器两种调度类型普通调度 和 组调度

在 Linux 的 CFS(Completely Fair Scheduler) 调度器中,确实存在两种调度类型:普通调度 和 组调度。这两种调度类型分别适用于不同的场景,并通过三个关键维度(权重、抢占优先级、最大配额)来影响…...

「逻辑推理」AtCoder AT_abc401_d D - Logical Filling

前言 这次的 D 题出得很好,不仅融合了数学逻辑推理的知识,还有很多细节值得反复思考。虽然通过人数远高于 E,但是通过率甚至不到 60%,可见这些细节正是出题人的侧重点。 题目大意 给定一个长度为 N N N 的字符串 S S S&#…...

PyTorch 深度学习实战(36):混合精度训练与梯度缩放

在上一篇文章中,我们探讨了图生成模型与分子设计。本文将深入介绍混合精度训练(Mixed Precision Training)和梯度缩放(Gradient Scaling)技术,这些技术可以显著加速模型训练并减少显存占用,同时…...

【Flink运行时架构】组件构成

在Flink的运行架构中,有两大比较重要的组件:作业管理器(JobManager)和任务管理器(TaskManager)。 Flink的作业提交与任务处理时的系统如下图所示。 其中,客户端并不是处理系统的一部分&#xff…...

simpy仿真

一共5个顾客,2个服务台 import simpy import randomdef customer(env, name, service_time_mean):arrival_time env.nowprint(f{arrival_time}: {name} 到达服务台,开始排队)with server.request() as req:yield reqwait_time env.now - arrival_time…...

Docker 安装MySQL

一键启动 docker run -d \--name mysql \-p 3306:3306 \-e TZAsia/Shanghai \-e MYSQL_ROOT_PASSWORD1234 \-v /usr/local/mysql/data:/var/lib/mysql \-v /usr/local/mysql/conf:/etc/mysql/conf.d \--restart always --name mysql \mysql 检查是否启动 docker ps 本地连接测…...

【消息队列kafka_中间件】三、Kafka 打造极致高效的消息处理系统

在当今数字化时代,数据量呈爆炸式增长,实时数据处理的需求变得愈发迫切。Kafka 作为一款高性能、分布式的消息队列系统,在众多企业级应用中得到了广泛应用。然而,要充分发挥 Kafka 的潜力,实现极致高效的消息处理&…...

conda如何安装和运行jupyter

在Conda环境中安装和运行Jupyter Notebook是一项常见且实用的任务,特别是在数据科学和机器学习项目中。以下是使用Conda安装和运行Jupyter Notebook的步骤: 安装Jupyter Notebook 首先,确保你的Conda是最新的。打开终端或Anaconda Prompt&a…...

防爆平板:石油化工厂智慧转型的“中枢神经”

易燃易爆气体、高温高压环境、复杂设备集群,这些特性使得传统电子设备难以直接融入生产流程。而防爆平板的出现,不仅打破了这一技术壁垒,更通过智能化、模块化设计,逐步成为连接人、设备与数据的“中枢神经”,推动石油…...

遨游科普:三防平板可以实现哪些功能?

在现代工业与户外作业场景中,电子设备不仅要面对极端环境的考验,更要承担起高效协同生产的重任。三防平板作为“危、急、特”场景移动终端的代表性产品,其核心价值早已超越传统消费级设备的范畴,成为连接智慧生产与安全管理的重要…...

互联网三高-数据库高并发之分库分表

1 数据库概述 1.1 数据库本身的瓶颈 ① 连接数 MySQL默认最大连接数为100,允许的最大连接数为16384 ② 单表海量数据查询性能 单表最好500w左右,最大警戒线800w ③ 单数据库并发压力问题 MySQL QPS:1500左右/秒 ④ 系统磁盘IO、CPU瓶颈 1.2 数…...

Python----机器学习(基于贝叶斯的鸢尾花分类)

贝叶斯方法是一种统计推断的 方法,它利用贝叶斯定理来更新我们对事件概率的信念。这种方法在机器学习和数据 分析中得到广泛应用,特别是在分类和概率估计问题上。 一、数据集介绍 这是分类方法文献中最早使用的数据集之一,广泛用于统计和机器…...