当前位置: 首页 > news >正文

探秘 Git 底层原理:理解版本控制的基石

Git 是一款开源的分布式版本控制系统,在软件开发领域广泛应用,能有效管理项目的版本变更,Git 已经成为了版本控制的代名词。日常使用中,我们通过git commit提交代码,用git push推送变更,这些便捷操作背后,是 Git 精巧的底层原理在支撑。了解 Git 底层原理,不仅能让我们更深入地理解版本控制的本质,还能在遇到复杂问题时快速定位和解决。本文将着重介绍git基础的底层知识

一.分布式版本控制与集中式版本控制

  • 分布式版本控制系统:每个开发者的本地环境都有完整的项目仓库副本,包含所有的提交历史、分支信息等。这意味着开发者可以在本地进行各种操作,如提交、查看历史记录等,无需依赖网络连接到中央服务器。
  • 集中式版本控制系统:存在一个中央服务器,它是所有版本数据的唯一存储地。各个客户端需要从中央服务器获取最新版本的文件进行操作。例如,一个软件开发团队使用 SVN (集中式版本控制系统)进行版本控制,所有的代码都存放在中央服务器上,开发人员在本地修改代码后,需要将修改提交到中央服务器

简单来说,集中式的核心操作(提交,更新等)都需要和中央服务器进行交互,而分布式更加灵活,使用者可以在本地进行独立开发,然后通过推送和拉取操作与其他成员的仓库进行同步

二、Git 的对象存储:数据的基石

Git 将所有数据都存储为对象,主要有三种类型:blob 对象、tree 对象和commit 对象。

2.1 Blob 对象

Blob(Binary Large Object)对象用于存储文件内容,它是 Git 中最基础的数据单元。当我们在工作目录中创建或修改一个文件,Git 会为该文件的内容生成一个唯一的哈希值,并将文件内容存储为一个 Blob 对象。例如,创建一个名为test.txt的文件,内容为 “Hello, Git!”,Git 会根据内容计算出一个 40 位的 SHA-1 哈希值(如2c7b42d07a4e5e8c8c8b4c9f7a9a7a7d8d8c7b2a),并将文件内容以 Blob 对象的形式存储在.git/objects目录下。值得注意的是,Blob 对象只包含文件内容,不包含文件名、文件权限等元数据 ,因此当一个文件夹中有多份相同内容的文件,由于其哈希值相同,那么只会有一个对应的blob对象。(相当于文件数据的哈希值)使用git ls-tree HEAD可以看到目录下所有blob对象。

2.2 Tree 对象

Tree 对象用于存储目录结构和文件信息,它相当于一个目录索引。一个 Tree 对象可以包含多个子 Tree 对象和 Blob 对象的引用,以及它们对应的文件名和权限信息。例如,一个项目目录下有src目录和README.md文件,src目录下又有main.js文件,Git 会创建一个顶级 Tree 对象,其中包含指向src子 Tree 对象和README.md对应的 Blob 对象的引用,src子 Tree 对象则包含指向main.js对应的 Blob 对象的引用。通过这种层级结构,Git 能够准确记录整个项目的目录和文件状态 。(可以把Tree理解为一个文件夹)

2.3 Commit 对象

Commit 对象代表一次提交,它包含了提交的元数据,如作者信息、提交时间、提交消息,以及一个指向本次提交根 Tree 对象的指针,用于记录提交时项目的状态。此外,Commit 对象还可以包含一个或多个父 Commit 对象的指针,用于表示提交之间的关系。单分支上的提交链,就是通过 Commit 对象的父指针串联起来的;而合并提交则会有多个父 Commit 对象,以此反映合并操作 。

示例

假设你有一个包含两个文件(file1.txtfile2.txt)的项目。在对这两个文件进行修改并将它们添加到暂存区后,执行git commit -m "Update files"命令。Git 会为file1.txtfile2.txt的新内容分别创建 Blob 对象,根据项目目录结构创建 Tree 对象来引用这两个 Blob 对象,最后创建一个 Commit 对象指向该 Tree 对象,并记录提交元数据(修改者,提交时间,父commit哈希值)。此后,若需要查看此次提交时项目的状态,只需找到对应的 Commit 对象即可。

tips

一般来说,每次commit都会产生一个新的tree对象,但是如果暂存区没有发生变化,即没有文件内容或结构的变化,在commit之后新的commit对象就会指向上一次提交对应的Tree,不会额外产生一个新Tree对象。

三、引用管理:高效定位对象

Git 使用引用(Reference)来方便地定位和操作对象。常见的引用类型有分支引用和标签引用。

3.1 分支引用

在 Git 中,分支本质上是一个指向 Commit 对象的可变指针。默认的主分支master(或main),以及我们创建的其他分支,都是通过一个以refs/heads/开头的文件来存储指向最新 Commit 对象的哈希值。例如,refs/heads/main文件中存储的就是当前main分支最新提交的 Commit 对象的哈希值。当我们进行提交操作时,对应的分支指针会自动指向新的 Commit 对象,而其他分支不受影响,这使得 Git 能够轻松实现并行开发 。

3.2 标签引用

标签引用与分支引用类似,但标签一旦创建,通常不会改变,它始终指向特定的 Commit 对象。轻量级标签直接存储 Commit 对象的哈希值,文件路径在refs/tags/下;附注标签则是一个完整的对象,包含更多元数据,通过标签对象的指针指向对应的 Commit 对象 。

git tag v1.0          # 轻量级标签
git tag -a v1.0 -m "Release"  # 附注标签

四、Git 的工作流程底层逻辑

理解 Git 的工作流程,有助于我们更好地掌握其底层原理。Git 的工作流程涉及工作区、暂存区和版本库三个区域。

4.1 工作区

工作区是我们日常编写和修改代码的地方,它是项目在本地磁盘上的实际目录。在工作区对文件进行的任何操作,如创建、修改、删除,都不会直接影响到版本库

4.2 暂存区

暂存区(也称为索引区)是一个临时区域,用于存放即将提交的文件修改。当我们使用git add命令时,工作区中被修改的文件内容会被计算哈希值,并存储为 Blob 对象,同时更新暂存区的相关信息,记录文件的状态变化 。

4.3 版本库

版本库是 Git 存储所有对象(Blob、Tree、Commit、Tag)以及引用的地方,位于.git目录下。当我们执行git commit命令时,Git 会根据暂存区的内容创建一个新的 Tree 对象,记录当前暂存区中文件的状态;然后创建一个新的 Commit 对象,指向新的 Tree 对象,并包含提交的元数据以及父 Commit 对象的指针,最终将新的 Commit 对象和相关对象存储到版本库中 。

五、总结

了解 Git 底层原理,在实际开发中有诸多好处。当遇到分支合并冲突、误删提交等问题时,基于对底层对象和引用的理解,我们能够更清晰地分析问题根源,通过git reflog查看引用日志,使用git reset、git cherry-pick等命令灵活地修复问题,本文通过对最基础的add,commit的命令的底层的讲解,入门git的底层原理

相关文章:

探秘 Git 底层原理:理解版本控制的基石

Git 是一款开源的分布式版本控制系统,在软件开发领域广泛应用,能有效管理项目的版本变更,Git 已经成为了版本控制的代名词。日常使用中,我们通过git commit提交代码,用git push推送变更,这些便捷操作背后&a…...

chili3d调试10 网页元素css node deepwiki 生成圆柱体 生成零件图片

.input是input的外框,.input input是input的内框 沙雕 全部input都换成textarea了 自己的方法用接口定义,把自己的方法pub出去,定义在内部拉出去只是取个值 这其实是mainwindow端pub回来的 窗口pub端把数据pub回 mainwindow端让mainwindow端…...

【计网】互联网的组成

回顾: 互联网(Internet):它是一个专有名词,是一个特定的互连网,它是指当下全球最大的、最开放的、由众多网络相互连接而形成的特定的的互连网,采用TCP/IP协议族作为通信规则。 一、互联网的组成部分 从互联网的工作方…...

Go语言接口实现面对对象的三大特征

一.知识回顾 在 Go 语言中,接口是一种强大的抽象机制,它允许我们定义一组方法签名,任何类型只要实现了这些方法,就被视为实现了该接口。接口的实现是隐式的,这意味着类型不需要显式声明它实现了某个接口,只…...

TS 字面量类型

str是string类型l str2是常量,类型是字面量类型 用途:配合联合类型确定更严谨精确的可选值利恩...

langchain中 callbacks constructor实现

目录 代码代码解释代码结构代码功能 类似例子 代码 from typing import Any, Dict, Listfrom langchain_openai import ChatOpenAI from langchain_core.callbacks import BaseCallbackHandler from langchain_core.messages import BaseMessage from langchain_core.outputs …...

小土堆pytorch--tensorboard的使用

小土堆pytorch--tensorboard的使用 小土堆pytorch--tensorboard的使用0.介绍1.使用tensorboard绘制 y x 等简单函数1.1 相应的代码1.2 对上述代码的解释1.3 可能遇到的问题1.3.1 问题1.3.2 解决方法 2.使用tensorboard加载数据集中的图片2.1 相应代码2.2 对上述代码的解释2.2.…...

从 0 到 1:使用 Jetpack Compose 和智能自动化实现高效 Android UI 开发

现代 Android UI 开发正逐步从命令式 XML 向声明式 Compose 转变。Compose 凭借其简洁、高效、易测试的特点,能够让开发者更专注于界面和业务逻辑,而不必陷入大量模板化的代码。手把手带你构建一个完整的 Todo List 应用,并演示如何借助自动化…...

学习黑客 week1周测 复盘

Day 7 – 周测 & 复盘 今天任务: 完成 10 道快测题,涵盖 Week 1 的核心知识点:《CIA 三要素》、OWASP Top 10、MITRE ATT&CK、NIST RMF、Linux 权限、TCP/IP、网络安全法、“黑客五阶段” 与风险管理。撰写 300 字周总结&#xf…...

【五一培训】Day 3

Topic 1:元学习 一、概念:learn to learn 区分少样本学习与元学习 少样本学习(Few-shot learning)是元学习的一个重要应用,它指的是机器能够在仅有少量样本的情况下,成功地学习和泛化到新任务上。在许多现…...

C++继承详讲

1.继承的概念 继承是实现代码复用的手段,它允许程序员在保持基类特性的基础上进行扩展,增加功能,这样产生新的类,称派生类。 2.继承和组合 1.继承体系下,子类对象包含父类的成员。组合体系下,子类对象包含…...

第四节:OpenCV 基础入门-第一个 OpenCV 程序:图像读取与显示

一、引言:为什么选择 OpenCV? 在计算机视觉领域,OpenCV(Open Source Computer Vision Library)是一个开源的、跨平台的计算机视觉库,广泛应用于图像处理、模式识别、机器学习等领域。它支持多种编程语言&a…...

基于PHP实现的easy管理系统

easy管理系统 2.0.1 easy管理系统 是一个多功能的 Web 管理平台,旨在简化项目管理、文件共享和协作流程。它集成了大创项目管理、在线文档生成、代码托管等多种功能,并提供了用户管理、系统设置、日志查看等后台管理能力。 ✨ 功能特性 统一管理平台:…...

ios systeam introduction

Here is an in-depth look at Apple’s iOS, from its inception to its latest major release, covering architecture, core components, security, app lifecycle, development tools, and the headline features of iOS 18. iOS began life as “iPhone OS,” unveiled alo…...

【论文阅读】LLMOPT:一种提升优化泛化能力的统一学习框架

文章目录 第一遍一、摘要二、关键词三、预知识1. 什么是优化泛化问题2. 什么是消融研究3. model alignment(模型对齐) 第二遍:了解论文论点一、研究背景与目的二、相关工作三、LLMOPT框架四、METHODOLOGY(方法论)1. 数据处理2. 学习过程3. 自…...

Prompt多版本测试指南:如何科学评估不同提示词的效果

对于现代AI开发来说,同一个需求,不同的提示表达方式往往会产生截然不同的结果。因此,如何设计、测试和优化提示词成为了一项关键技能。 本文将深入探讨Prompt多版本测试的技术方法,帮助你系统性地评估不同提示词的效果&#xff0…...

每日c/c++题 备战蓝桥杯(洛谷P1015 [NOIP 1999 普及组] 回文数)

洛谷P1015 [NOIP 1999 普及组] 回文数 题解 题目描述 P1015 回文数 是NOIP 1999普及组的经典模拟题。题目要求如下: 给定一个数N(十进制)和进制K(2≤K≤16),将N转换为K进制表示后,通过以下操…...

最小单调子序列的长度+联通最小乘积

因为题目ICPC是英文版,基于大家都不怎么看的懂的情况下直接给大家进行题目讲解 题目1: 题目分析: 构造一个长度为n的排列 p(里面的数是1-n),不能重复得 max⁡(lis(p),lds(p)) 最小。 其中,lis(p)是 p 的最长递增子序…...

OpenHarmony平台驱动开发(一),ADC

OpenHarmony平台驱动开发(一) ADC 概述 功能简介 ADC(Analog to Digital Converter),即模拟-数字转换器,可将模拟信号转换成对应的数字信号,便于存储与计算等操作。除电源线和地线之外&#…...

数据结构与算法:回溯

回溯 先给出一些leetcode算法题,以后遇见了相关题目再往上增加 主要参考代码随想录 2.1、组合问题 关于去重:两种写法的性能分析 需要注意的是:使用set去重的版本相对于used数组的版本效率都要低很多,大家在leetcode上提交&#x…...

KaiwuDB X 遨博智能 | 构建智能产线监测管理新系统

​01 项目背景 遨博智能作为国内协作机器人行业领军企业,深度布局制造、农业、医疗、教育、民生等场景,出货量连续四年蝉联国内第一、世界第二。随着工业自动化的蓬勃发展,遨博智能生产规模不断扩大,先后在常州、淄博等地建设完成…...

高等数学第三章---微分中值定理与导数的应用(§3.6 函数图像的描绘§3.7 曲率)

3.6 函数图像的描绘 一、曲线的渐近线 对于某些函数,其图形向无穷远处延伸时,会越来越趋近于某一条直线,这条直线被称为曲线的渐近线 (Asymptote)。 1. 定义 若曲线 y f ( x ) yf(x) yf(x) 上一点 P ( x , y ) P(x, y) P(x,y) 沿曲线趋…...

【PostgreSQL数据分析实战:从数据清洗到可视化全流程】4.2 数据类型转换(CAST函数/自定义函数)

👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 PostgreSQL数据分析实战:数据清洗之数据类型转换(CAST函数/自定义函数)4.2 数据类型转换:让数据「格式正确,类型对…...

docker:制作镜像+上传镜像+拉取镜像

1.dockerfile制作镜像 示例内容: 1.创建一个index.js的文件 console.log("hello world")2.在相同目录下创建名为dockerfile的文件 FROM node:alpine COPY index.js /index.js CMD node /index.js3.构建镜像 docker build -t minterra/hello-docker . …...

信息系统监理师第二版教材模拟题第三组(含解析)

信息系统监理师模拟题第三组(30题) 监理基础理论 信息系统工程监理的性质是( ) A. 服务性、独立性、公正性、科学性 B. 强制性、营利性、行政性、技术性 C. 临时性、从属性、随意性、主观性 D. 单一性、封闭性、被动性、保守性答案:A 解析:监理具有服务性、独立性、公正…...

潮乎盲盒商城系统全开源多级分销推广海报奖品兑换试玩概率OSS云存储多端源码

一、源码描述 这是一套潮乎盲盒商城源码,仿小叮当盲盒商城,后端Laravel框架前端uniappvue,前后端数据库分离,支持四端同步数据(H5小程序等),测试环境: php7.4,mysql5.6,…...

文章记单词 | 第64篇(六级)

一,单词释义 residence [ˈrezɪdəns] n. 住宅;居住;住所;居住期fling [flɪŋ] v. (用力地)扔,掷,抛;猛动(身体或身体部位);急冲&a…...

数据同步实战篇

文章目录 数据同步实战篇1. mysql数据同步1.1 mysql集群部署1.2 数据同步1.2.1 同步复制1.2.2 异步复制1.2.3 半同步复制 2. redis数据同步2.1 redis集群部署2.2 数据同步 3. mq数据同步3.1 mq集群部署3.2 数据同步 4. es数据同步4.1 es集群部署4.2 数据同步 数据同步实战篇 数…...

具身系列——Double DQN算法实现CartPole游戏(强化学习)

完整代码参考: rl/ddqn_cartpole.py 陈先生/ailib - Gitee.com 部分训练得分: Model saved to ./output/best_model.pth New best model saved with average reward: 9.6 Episode: 0 | Train Reward: 25.0 | Epsilon: 0.995 | Best Eval Avg: 9.6…...

以下是在 Ubuntu 上的几款PDF 阅读器,涵盖轻量级、功能丰富和特色工具:

默认工具:Evince(GNOME 文档查看器) 特点:Ubuntu 预装,轻量快速,支持基本标注和书签。 安装:已预装,或手动安装: sudo apt install evince功能全面:Okular&…...

有关水下图像增强的论文

4.21 TEBCF:Real-World Underwater Image Texture Enhancement Model Based on Blurriness and Color Fusion 基于模糊和颜色融合的现实水下图像纹理增强模型 2022年的一篇文章,基于传统方法,基于不同的色彩方法构建了两个新的融合输入。一…...

Raycaster光线投射

Raycaster光线投射 3D虚拟工厂在线体验 描述 光线投射Raycaster,用于进行raycasting(光线投射)。 光线投射用于进行鼠标拾取(在三维空间中计算出鼠标移过了什么物体)。 构造器 Raycaster( origin : Vector3, dire…...

javaEE——单例模式

目录 前言1.概念2. 实现3. 比较和改进总结 前言 本篇文章来介绍单例模式,并讲述在保证线程安全的前提下,单例模式的写法。 1.概念 单例模式是一种设计模式,可以说是写代码的一种模板,如果在一些固定的场景下按照设计模式进行写…...

WSL在D盘安装Ubuntu

目录 前提条件步骤一:查看可用的Linux发行版步骤二:安装Ubuntu 22.04步骤三:导出已安装的Ubuntu到D盘步骤四:注销当前Ubuntu安装步骤五:在D盘导入Ubuntu启动Ubuntu 前提条件 Windows 10或Windows 11系统已启用WSL功能…...

Java并发编程-多线程基础(三)

文章目录 线程间通信线程间通信的核心问题volatile 关键字1. 核心特性2. 使用限制3. 示例 synchronized 关键字1. 核心特性2. 示例 volatile 与 synchronized 的对比Volatile 和 Synchronized 最佳实践 线程间通信 线程间通信的核心问题 多个线程通过共享内存实现信息交换&am…...

React--》掌握react构建拖拽交互的技巧

在这篇文章中将深入探讨如何使用react-dnd,从基础的拖拽操作到更复杂的自定义功能带你一步步走向实现流畅、可控且用户友好的拖拽体验,无论你是刚接触拖拽功能的初学者还是想要精细化拖拽交互的经验开发者,都能从中找到适合自己的灵感和解决方案。 目录 …...

【Qt】常用的类与数据类型

目录 一、Qt常见基本数据类型 二、Qt 字符串类应用 2.1 操作字符串 2.2 查询字符串 三、QMap 类&QHash 类&QVector 类 3.1 QMap 类 3.2 QHash 类 3.3 QVector 类 四、QList 类&QLinkedList 类 4.1 QList 类 4.2 QLinkedList 类 4.3 STL 风格迭代器遍历…...

React实现B站评论Demo

该Demo涉及的技术点 useState函数(数据驱动视图)子组件的封装条件判断回调函数的封装 1、评论数据 {"list": [{"rpid": 3,"user": {"uid": "13258165","avatar": "http://toutiao.…...

从实列中学习linux shell12 通过Shell脚本来优化MySQL数据库性能,特别是慢SQL跟踪和索引优化

在Shell脚本中优化MySQL数据库性能,特别是慢SQL跟踪和索引优化 可以通过以下步骤实现。以下是一个结构化的解决方案,包含示例代码和详细说明: 1. 启用慢查询日志 目标:动态启用慢查询日志并配置参数,收集慢SQL数据。…...

ES6入门---第三单元 模块一:类、继承

补充&#xff1a; prototype 属性使您有能力向对象添加属性和方法。 object.prototype.namevalue <script>function Person(name, age){this.name name;this.age age;}/* Person.prototype.showName function(){return 名字为: ${this.name};};Person.prototype.showA…...

CSS 变量与原生动态主题实现

CSS 变量与原生动态主题实现 CSS 变量基础 CSS 变量&#xff08;自定义属性&#xff09;是 CSS 语言的一项强大功能&#xff0c;允许我们在样式表中定义和重用值。与 SCSS 或 LESS 等预处理器中的变量不同&#xff0c;CSS 变量在运行时计算&#xff0c;这意味着它们可以动态更…...

Ubuntu 安装 Docker

安装 Docker 1. 卸载旧版本&#xff08;如果有&#xff09; sudo apt-get remove docker docker-engine docker.io containerd runc 2. 更新 APT 包的索引 sudo apt-get update 3. 安装依赖包 sudo apt-get install -y \ca-certificates \curl \gnupg \lsb-release4. 添加…...

SpringMVC——第三章:获取请求数据

假设有这样一个请求&#xff1a;http://localhost:8080/springmvc/register?namezhangsan&password123&emailzhangsanpowernode.com 在SpringMVC中应该如何获取请求提交的数据呢&#xff1f; 在SpringMVC中又应该如何获取请求头信息呢&#xff1f; 在SpringMVC中又应…...

动静态库【Linux操作系统】

文章目录 动静态库制作静态库如何把第三方库安装在Linux系统中&#xff0c;如何使用第3方库方案一&#xff1a;为什么我们之前使用gcc/g编译C/C标准库的时候不用加选项-l xxx呢&#xff1f;方案二&#xff1a;方案三&#xff1a; 为什么不同平台的库不一样呢&#xff1f;动态库…...

Day 4:牛客周赛Round 91

好久没写了&#xff0c;问题还蛮多的。听说这次是苯环哥哥出题 F题 小苯的因子查询 思路 考虑求因子个数&#xff0c;用质因数分解&#xff1b;奇数因子只需要去掉质数为2的情况&#xff0c;用除法。 这里有个比较妙的细节是&#xff0c;提前处理出数字x的最小质因数&#xff0…...

drawDB:打造高效数据库设计流程

drawDB&#xff1a;打造高效数据库设计流程 drawDB 简介资源链接 核心功能详解1. 直观的实体关系图设计2. SQL 脚本生成3. SQL 导入功能4. 本地化存储与分享功能5. 自定义主题与外观 安装和使用教程本地开发环境搭建构建生产版本Docker 部署基本使用方法 应用场景和实际价值适用…...

【心海资源】子比主题新增注册与会员用户展示功能模块及实现方法

内容改写&#xff1a; 本次分享的是子比主题顶部展示注册用户与会员信息的功能模块及其实现方式。 你可以通过两种方式启用该功能&#xff1a; 直接在后台进入“外观 → 小工具”启用该展示模块&#xff0c;操作简便&#xff1b;也可将提供的代码覆盖至子比主题目录中&#…...

gitblit安装教程,搭建一个属于自己的Git版本仓库

本章教程,主要记录如何在Windows服务器上利用gitblit搭建GIT私有化仓库。 一、gitblit简介 官网地址:https://www.gitblit.com/ Gitblit 是一个开源的纯 Java 技术栈,用于管理、查看和服务Git仓库。 它主要设计为一款面向希望托管集中式仓库的小型工作组的工具。 二、基础环…...

2023年第十四届蓝桥杯省赛B组Java题解【简洁易懂】

2023年第十四届蓝桥杯省赛B组Java题解 题型概览与整体分析 题目编号题目名称题型难度核心知识点通过率&#xff08;预估&#xff09;A阶乘求和结果填空★☆☆模运算、数学规律95%B幸运数字结果填空★★☆进制转换、数位和计算80%C数组分割编程题★★☆组合数学、奇偶性分析65…...

Javase 基础加强 —— 01 异常

本系列为笔者学习Javase的课堂笔记&#xff0c;视频资源为B站黑马程序员出品的《黑马程序员JavaAI智能辅助编程全套视频教程&#xff0c;java零基础入门到大牛一套通关》&#xff0c;章节分布参考视频教程&#xff0c;为同样学习Javase系列课程的同学们提供参考。 01 课程安排…...