Git LFS 学习笔记:原理、配置、实践与心路历程
最近在学习 Git LFS,把一些零散的笔记整理成一篇博文,记录我的学习思路与心路历程。以下内容均为个人理解总结,部分尚未在生产项目中验证,仅供回顾与参考。
🔍 Git LFS 是什么?原理是什么?
刚接触 Git 时,就听说它“不擅长管理大文件”,尤其是模型文件、音视频资源、打包产物等动辄几百 MB 或 GB 的二进制文件。Git LFS(Large File Storage)就是为了解决这类问题而诞生的扩展组件。
✅ 本质
Git LFS 不是对 Git 本体的修改,而是通过引入一个“指针文件”的概念,将 Git 的版本控制与大文件的实际存储解耦。Git 只记录一份几十字节的指针,大文件内容由 Git LFS 存储服务托管(可为 GitHub、GitLab、阿里 OSS 或自建服务)。
📄 指针文件示例:
version https://git-lfs.github.com/spec/v1
oid sha256:<hash>
size <bytes>
每次 git commit
时,Git 只记录这段简短的指针信息,而大文件通过 LFS 上传至后端存储。
🔁 Git 工作流对比
功能 | 普通 Git | Git LFS |
---|---|---|
大文件存储方式 | 存入 .git/objects | 存储指针,实际文件走 LFS |
历史版本管理 | 每次修改保留完整副本 | 指针管理版本,大文件共用 |
clone 时下载内容 | 全历史版本 | 默认仅当前分支所需内容 |
🎯 Git LFS 能解决哪些痛点?
在学习中我总结了几个关键优势:
1. 突破平台文件大小限制
GitHub / GitLab 对单个文件通常有 100MB 或 200MB 限制,Git LFS 可以绕开该限制,透明地上传大文件。
2. 解决仓库膨胀与冗余
- 普通 Git:200MB 文件改动 10 次,仓库增至 2GB;
- Git LFS:指针 + 共享文件体,clone 默认只拉最新版本,仓库更轻量。
3. 提升 Git 操作效率
减少 Git 的磁盘 I/O 与对象处理,checkout、clone、切分支等操作更快,体验更流畅。
📌 注意: 如果 Git 仓库和 LFS 服务部署在同一台服务器,磁盘空间占用不会减少,但 Git 本体性能会提升。
🚀 为何 checkin / checkout 会更快?
✅ Checkin(提交):
- 普通 Git:每次提交大文件都产生完整新副本;
- Git LFS:仅写入小指针,二进制文件另走通道上传。
✅ Checkout(切换版本):
- 普通 Git:解压全部历史数据到工作区;
- Git LFS:恢复指针 + 按需并行下载大文件,仅拉取当前所需内容。
⚙️ 在 Gerrit 中配置 Git LFS
1. 安装 LFS 插件
将官方或社区版本的 lfs.jar
插件放入 Gerrit 的 plugins/
目录。
2. 修改 etc/gerrit.config
[lfs]plugin = lfs
3. 新建 etc/lfs.config
,配置后端存储方式
可选任意一种,测试使用第一种就行了
📁 本地存储(默认)
[storage]backend = fsdirectory = /data/gerrit/lfs-custom #本地路径,可不填,默认/data/lfs
适用于测试环境、小团队或 <500GB 的部署。
☁️ Amazon S3 存储
[storage]backend = s3bucket = gerrit-lfs-bucketregion = us-west-1accessKey = AKIAXXXXXXXXXsecretKey = xxxxxxxxxxxxendpoint = https://s3.us-west-1.amazonaws.com # 可选
可兼容 MinIO、Ceph 等 S3 接口,适合大文件托管。
🌐 阿里云 OSS(S3 协议)
[storage]backend = s3bucket = gerrit-lfs-ossregion = oss-cn-hangzhouaccessKey = LTAI5tXXXXXXXXXXXsecretKey = xxxxxxxxxxxxxendpoint = https://oss-cn-hangzhou.aliyuncs.com
适配国内企业、支持 CDN 加速和数据生命周期管理。
🔧 自定义 HTTP 存储
[storage]backend = customurl = http://lfs.mycompany.com/api/objectsauthHeader = Authorization: Bearer xxxxxxxx
适用于自研服务或集成 Artifactory 等系统。
🧩 多策略混合存储(高级用法)
[storage "images"]backend = fsdirectory = /data/gerrit/lfs-imagesinclude = **/*.png, **/*.jpg[storage "videos"]backend = s3bucket = gerrit-lfs-videosregion = ap-southeast-1include = **/*.mp4, **/*.mov
图片走本地,视频走云存储,冷热数据分离、灵活控制成本。
4. 启用 All-Projects 中的 LFS 支持
git clone ssh://admin@mygerrit.com:8011/All-Projects
cd All-Projects
git fetch origin refs/meta/config
git checkout FETCH_HEAD
vi lfs.config
编辑配置文件:
[lfs "^.*"]enabled = truemaxObjectSize = 1024m
保存后提交配置:
git add .
git commit -m "Enable LFS for all projects"
git push origin HEAD:refs/meta/config
5. 重启 Gerrit & 验证
- 重启 Gerrit 服务;
- 在 Plugins > Installed 中确认
lfs
插件存在; - 上传/下载大文件测试是否生效。
👩💻 用户端使用流程(学习记录)
1. 上传
确保 Git 版本 ≥ 1.8.2,安装 Git 和 Git LFS:
Ubuntu:
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
CentOS:
yum install epel-release
yum install git
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.rpm.sh | sudo bash
yum install git-lfs
初始化 LFS:
# cd进到仓库后
git lfs install # 初始化 Git LFS 钩子
设置追踪文件类型(根据实际场景修改):
git lfs track "*.iso" # 指定需要使用 LFS 管理的文件类型
查找大文件(>50MB):
find . -size +50M
输出例如:
./gigi.a
./bobo.a
添加跟踪(会自动写入并生成 .gitattributes 文件):
git lfs track "gigi.a"
git lfs track "bobo.a"
把 .gitattributes
文件加入 Git 仓库:
git add .gitattributes
检查跟踪规则:
git lfs track
查看当前 LFS 文件:
git lfs status
执行常规 Git 操作:
git add .
git commit -m "Add large files via LFS"
git push origin master
如果 gerrit 服务器没有配过 lfs,将出现报错:
fatal: Gerrit Code Review: git-lfs-authenticate: not found: exit status 1
若需推送到指定分支:
git push origin local-branch:remote-branch
💡 Git 不支持推送空目录。
2. 下载
重复前述安装步骤,clone 后执行:
git lfs pull
🔁 Git LFS 与 CI/CD 的结合思考
在 CI/CD 中,如果只 git clone
,工作目录中的大文件可能仍是指针文件,导致构建或测试失败。我的学习记录如下:
stages:- buildbuild:script:- git lfs install- git lfs pull # 拉取当前分支所需的大文件- python run_model.py
✅ 补充说明
- 缓存优化:缓存
.git/lfs
可避免每次都拉大文件; - 带宽/额度控制:公共 LFS 服务可能有限额,自建或对象存储拉取是更稳妥方案。
🧠 总结体会
“大文件管理的关键,不在于强塞进 Git,而是借助专业系统处理。”
- Git LFS 让 Git 仓库保持轻量,提升团队协作体验;
- 学习过程中,重点理解其 “指针机制 + 按需下载”;
- 配置方面,平台(如 Gerrit、GitHub、GitLab)差异虽有,但本质思路一致;
- 在 CI/CD、Docker 等场景也可无缝集成,扩展性强。
相关文章:
Git LFS 学习笔记:原理、配置、实践与心路历程
最近在学习 Git LFS,把一些零散的笔记整理成一篇博文,记录我的学习思路与心路历程。以下内容均为个人理解总结,部分尚未在生产项目中验证,仅供回顾与参考。 🔍 Git LFS 是什么?原理是什么? 刚接…...
SpringBoot集成oshi 查询系统数据
实现功能: <!-- 获取系统信息 --><dependency><groupId>com.github.oshi</groupId><artifactId>oshi-core</artifactId><version>6.6.1</version></dependency><dependency><groupI…...
iOS Facebook 登录
iOS Facebook 登录 官方文档 SDK下载链接...
uniapp打包IOS私钥证书过期了,如何在非mac系统操作
在非Mac系统下解决uniapp打包iOS私钥证书过期的问题,需通过以下步骤实现: --- ### **一、重新生成iOS证书(非Mac环境操作)** 1. **生成私钥和CSR文件** 使用OpenSSL工具(需提前安装)生成私钥和证书签…...
Axios的使用
Axios 是一个基于 Promise 的现代化 HTTP 客户端库,专为浏览器和 Node.js 设计。在企业级应用中,它凭借以下核心优势成为首选方案: 一、Axios 的核心优势 特性说明Promise 支持天然支持异步编程,避免回调地狱拦截器机制可全局拦截…...
第八篇:系统分析师第三遍——3、4章
目录 一、目标二、计划三、完成情况四、意外之喜(最少2点)1.计划内的明确认知和思想的提升标志2.计划外的具体事情提升内容和标志 五、总结 一、目标 通过参加考试,训练学习能力,而非单纯以拿证为目的。 1.在复习过程中,训练快速阅读能力、掌…...
【2025-泛计算机类-保研/考研经验帖征集】
【2025-泛计算机类-保研/考研经验帖征集】 打扰您1分钟时间看下这里: 这是一个无偿为爱发电的项目,旨在收集湖南大学2025届毕业的计算机类学科同学的经验帖, 我将定期汇总链接,在校内推免群中宣传,为校内的学弟学妹们…...
Flink介绍——实时计算核心论文之Kafka论文详解
引入 我们通过S4和Storm论文的以下文章,已经对S4和Storm有了不错的认识: S4论文详解S4论文总结Storm论文详解Storm论文总结 不过,在讲解这两篇论文的时候,我们其实没有去搞清楚对应的流式数据是从哪里来的。虽然S4里有Keyless …...
细节:如何制作高质量的VR全景图
细节:如何制作高质量的VR全景图 VR全景图是通过虚拟现实和3D技术实现的全景展示方式,能够将实景以1:1的比例等比复刻,并还原到互联网上,使用户能够在线上游览世界,获得沉浸式的体验。制作高质量的VR全景图是一个复杂而…...
深度学习中的概念——元素积(哈达玛积)
元素积操作(哈达玛积) 🔢 基本定义 矩阵的哈达玛积 对于两个同维度的矩阵: A [ a i j ] , B [ b i j ] A [a_{ij}], \quad B [b_{ij}] A[aij],B[bij] 它们的哈达玛积定义为: C A ∘ B 其中 c i j a i j…...
探索 Flowable 后端表达式:简化流程自动化
什么是后端表达式? 在 Flowable 中,后端表达式是一种强大的工具,用于在流程、案例或决策表执行期间动态获取或设置变量。它还能实现自定义逻辑,或将复杂逻辑委托…… 后端表达式在 Flowable 的后端运行,无法访问前端…...
AI语音助手 React 组件使用js-audio-recorder实现,将获取到的语音转成base64发送给后端,后端接口返回文本内容
页面效果: js代码: import React, { useState, useRef, useEffect } from react; import { Layout, List, Input, Button, Avatar, Space, Typography, message } from antd; import { SendOutlined, UserOutlined, RobotOutlined, AudioOutlined, Stop…...
《软件设计师》复习笔记(11.6)——系统转换、系统维护、系统评价
目录 一、遗留系统(Legacy System) 定义: 特点: 演化策略(基于价值与技术评估): 高水平 - 低价值: 高水平 - 高价值: 低水平 - 低价值: 低水平 - 高价…...
学习threejs,使用EffectComposer后期处理组合器(采用RenderPass、GlitchPass渲染通道)
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.EffectComposer 后期…...
Yarn的定义?
YARN(Yet Another Resource Negotiator) 是 Apache Hadoop 的核心组件之一,负责集群的资源管理和任务调度。它的主要作用是将 Hadoop 的资源管理和作业调度/监控功能分离,形成一个通用的资源管理平台,可以支持多种计算…...
职坐标IT培训热门技术实战精讲
在数字化转型浪潮中,人工智能、大数据与云原生已成为驱动产业升级的核心引擎。职坐标IT培训课程以实战导向为基石,聚焦高薪岗位核心技术栈,通过拆解企业级项目案例,将复杂的技术理论转化为可落地的工程实践。课程模块涵盖从架构设…...
前端:uniapp框架中<scroll-view>r如何控制元素进行局部滚动
以下是使用 <scroll-view> 实现局部滚动的完整示例,包含动态内容、滚动控制和滚动位置监听: 一、基础局部滚动示例 <template><view class"container"><!-- 固定高度的滚动容器 --><scroll-view scroll-y :scroll…...
【KWDB 创作者计划】_算法篇---Stockwell变换
文章目录 前言一、Stockwell变换原理详解1.1 连续S变换定义1.2 离散S变换1.3简介 二、S变换的核心特点2.1频率自适应的时频分辨率2.1.1高频区域2.1.2低频区域 2.2无交叉项干扰2.3完全可逆2.4相位保持2.5与傅里叶谱的直接关系 三、应用领域3.1地震信号分析3.2生物医学信号处理3.…...
桌面级OTA测试解决方案:赋能智能网联汽车高效升级
一、前言 随着智能网联汽车的快速发展,OTA(Over-The-Air)技术已成为汽车软件更新和功能迭代的关键手段。为确保OTA升级的可靠性、安全性和效率,构建一套高效、便捷的桌面级OTA测试解决方案至关重要。 本方案基于Vector先进的软硬…...
京东物流基于Flink StarRocks的湖仓建设实践
摘要:本文整理自京东物流高级数据开发工程师梁宝彬先生在 Flink Forward Asia 2024 论坛中的分享。内容主要为以下四个部分: 1、实时湖仓探索与建设 2、实时湖仓应用 3、问题与思考 4、未来展望 今天,将分享的主题大纲包括:首先&a…...
【Test Test】灰度化和二值化处理图像
文章目录 1. 图像灰度化处理对比2. 代码示例3. 二值化处理 1. 图像灰度化处理对比 2. 代码示例 #include <opencv2/opencv.hpp> using namespace cv;int main() {Mat currentImage imread("path_to_image.jpg"); // 读取彩色图像Mat grayImage;// 将彩色图像…...
Docker快速入门
1 基本信息 1.1 基础概览 (1)容器与镜像 容器:轻量级的独立运行时环境,基于Linux的命名空间(namespace)和控制组(cgroup)技术实现资源隔离。容器通过镜像创建,每个容…...
AI 编程工具—如何在 Cursor 中集成使用 MCP工具
AI 编程工具—如何在 Cursor 中集成使用 MCP工具 这里我们给出了常用的MCP 聚合工具,也就是我们可以在这些网站找MCP服务 这是一个MCP Server共享平台,用户可以在上面发布和下载MCP Server配置。在这里可以选择你需要的MCP 服务。 如果你不知道你的mcp 对应的server 名称也不…...
航电系统通信与数据链技术分析
一、技术要点 1. 高带宽与低时延通信技术 航电系统需支持实时数据传输,如民航VDL2数据链采用D8PSK调制和Reed Solomon编码技术,传输速率达31.5Kb/s,并通过物理层优化减少码间串扰。新一代LDACS系统则利用L频段频谱,提供比传统VD…...
windwos脚本 | 基于scrcpy,只投声音、只投画面
安装scrcpy,scrcpy自带adb 写脚本命名为 .bat 结尾 注意这里的set "PATHD:\tools\scrcpy-win64-v3.2;%PATH%" 替换成scrcpy的安装目录 echo off :: 设置UTF-8编码 chcp 65001 > nul :: 设置标题 title 手机投屏工具:: 添加 scrcpy 路径到 PATH set &q…...
产品经理面试题与参考答案资料(2025年版)
一、技术背景与工具能力 问题1: 软件开发生命周期(SDLC)包括哪些阶段?作为产品经理,你如何参与每个阶段? 参考答案: 软件开发生命周期通常划分为需求分析、设计、开发、测试、部署和维护六个阶段。作为产品经理,你需要在...
HTML 初识
段落标签 <p><!-- 段落标签 -->Lorem ipsum dolor sit amet consectetur adipisicing elit. Fugiat, voluptate iure. Obcaecati explicabo sint ipsum impedit! Dolorum omnis voluptas sint unde sed, ipsa molestiae quo sapiente quos et ad reprehenderit.&l…...
CSS3笔记
文章目录 1.CSS的概念2.CSS的引入方式3.选择器3.1基础选择器3.1.1标签选择器3.1.2类选择器3.1.3id选择器3.1.4通配符选择器 4.画盒子5.文字控制属性5.1 字体大小-font-size5.2 字体粗细-font-weight5.3 字体倾斜-font-style5.4 行高-line-height5.5 字体族-font-family5.6 字体…...
yarn的定义
YARN是一个分布式资源管理平台,它通过分离资源管理和作业调度的功能,为Hadoop集群提供了一种高效、灵活且可扩展的方式来管理和分配计算资源。YARN的核心目标是将资源管理与作业调度/监控的功能分离,从而让Hadoop能够支持更多种类的计算框架&…...
CSS 美化页面(五)
一、position属性 属性值描述应用场景static默认定位方式,元素遵循文档流正常排列,top/right/bottom/left 属性无效。普通文档流布局,默认布局,无需特殊定位。relative相对定位,相对于元素原本位置进行偏…...
互联网大厂Java面试:微服务与分布式系统挑战
互联网大厂Java面试:微服务与分布式系统挑战 在互联网的大潮中,无数程序员怀揣着梦想,希望能在一线大厂找到自己的位置。今天的故事主角是马飞机,一位充满幽默感但技术略显水货的程序员。他来到了一家知名互联网公司参加Java开发…...
数据结构——顺序表(C语言实现)
1.顺序表的概述 1.1 顺序表的概念及结构 在了解顺序表之前,我们要先知道线性表的概念,线性表,顾名思义,就是一个线性的且具有n个相同类型的数据元素的有限序列,常见的线性表有顺序表、链表、栈、队列、字符串等等。线…...
FastGPT安装前,系统环境准备工作?
1.启用适用于 Linux 的 Windows 子系统 方法一:打开控制面板 -> 程序 -> 启用或关闭Windows功能->勾选 “适用于Linux的Vindows子系统” 方法二:以管理员身份打开 PowerShell(“开始”菜单 >“PowerShell” >单击右键 >“…...
【2】CICD持续集成-k8s集群中安装Jenkins
一、背景: Jenkins是一款开源 CI&CD 系统,用于自动化各种任务,包括构建、测试和部署。 Jenkins官方提供了镜像:https://hub.docker.com/r/jenkins/jenkins 使用Deployment来部署这个镜像,会暴露两个端口ÿ…...
相比其他缓存/内存数据库(如 Memcached, Ehcache 等),Redis 在微服务环境中的优势和劣势是什么?
我们来比较一下 Redis 与 Memcached、Hazelcast、Ehcache 等在微服务环境下的优势和劣势。 Redis 的优势 : 丰富的数据结构 (Rich Data Structures): 优势: 这是 Redis 最显著的优势之一。除了简单的 Key-Value (字符串) 外,Redis 还原生支持 Lists, Sets, Sorted …...
Day53 二叉树的层序遍历
给你二叉树的根节点 root ,返回其节点值的 层序遍历 。 (即逐层地,从左到右访问所有节点)。 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* T…...
mac上安装VMWare Fusion安装ubuntu系统问题
mac不能复制粘贴到虚拟机的ubuntu系统里,没有下载vmtools 在ubuntu系统执行命令 sudo apt update sudo apt install open-vm-tools open-vm-tools-desktop -y ubuntu 下载地址 https://cdimage.ubuntu.com/ubuntu/releases/20.04/release/...
JAVA Web_定义Servlet_处理POST请求【练习】
题目 有一个登录页面(login.html),其登录表单的HTML代码如下: </form action"doLogin" method "post"> 用户名:<input type"text" name"userName"><br>…...
FreeRTOS任务通知
一、什么是任务通知 FreeRTOS从版本V8.2.0开始提供通知这个功能,每个任务都有一个32位的通知值。按照官方说法,使用消息通知比通过二进制信号量方式解除阻塞任务快45%,且更加省内存(无需创建队列)。 (也就…...
NO.97十六届蓝桥杯备战|数论板块-最大公约数和最小公倍数|欧几里得算法|秦九韶算法|小红的gcd(C++)
约数和倍数 如果a 除以b 没有余数,那么a 就是b 的倍数,b 就是a 的约数,记作b ∣ a 。 约数,也称因数。 最⼤公约数和最⼩公倍数 最⼤公约数Greatest Common Divisor,常缩写为gcd。 ⼀组整数的公约数,是…...
ESP32之本地HTTP服务器OTA固件升级流程,基于VSCode环境下的ESP-IDF开发(附源码)
背景知识: 本实验利用编译链内Python内置的 HTTP 服务器,将升级包通过http发送给设备,实现OTA固件升级。 目录 背景知识: 1.创建工程 1.1 创建OTA基础工程 3.编写、修改代码 3.1 修改menuconfig配置文件 3.1.1 配置WiFi账…...
Jenkins的使用及Pipeline语法讲解
Jenkins简介 Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件项目可以进行持续集成。 什么是持续集成(CI)? CI(…...
【MySQL】初识数据库
目录 一.什么是数据库 二.数据库和数据结构的关系 三. 数据库服务器、数据库与表之间的关系 四.关系型数据库 五. SQL介绍 SQL分类 六.MySQL架构(面试重点) 七. 库的基本操作 1.查看数据库 2.创建数据库 字符集编码和校验(排序&…...
Android tinyalsa库函数剖析
1. PCM 流控制函数 打开、关闭及状态检查 pcm_open(unsigned int card, unsigned int device, unsigned int flags, struct pcm_config *config) 打开指定声卡(card)和设备(device)的 PCM 流。 flags 参数确定流的方向࿱…...
DFS/BFS专练-搞定图论基础!(从海岛问题过渡至图论基础应用C++/C)
:: 图论基础理论 :: 紧接着,图论基础理论中,咱们讲到,图论的遍历主要由(dfs与bfs决定) 那咱们本篇博客就来聊聊dfs与bfs。 dfs(深度优先搜索)、bfs(广度优先搜索)的区别…...
2024年RIS SCI2区:自适应天鹰算法AAO,深度解析+性能实测
目录 1.摘要2.天鹰算法AO原理3.改进策略4.结果展示5.参考文献6.代码获取 1.摘要 智能电网通过集成可再生能源并管理供需动态平衡来提高效率,本文提出了自适应天鹰算法(AAO),AAO使用Sigmoid因子来平衡探索和开发,根据迭…...
orcad csi 17.4 DRC规则设置及检查
rCAD绘制完原理图之后总是需要开启DRC检测,但是DRC一般都是英文版的,下面基于Cadence17.4 的orCAD16.6 对DRC的界面做简单的介绍 首先,鼠标点击原理图,然后再点击右上方的小勾图标 desine rules check option选项的界面 电气规…...
前端实战:基于 Vue 与 QRCode 库实现动态二维码合成与下载功能
在现代 Web 应用开发中,二维码的应用越来越广泛,从电子票务到信息传递,它都扮演着重要角色。本文将分享如何在 Vue 项目中,结合QRCode库实现动态二维码的生成、与背景图合成以及图片下载功能,打造一个完整且实用的二维…...
天梯赛DFS合集
1.DFS特殊输入:PTA | 程序设计类实验辅助教学平台 这题其他还是蛮容易,直接用递归即可,问题在于怎么输入,其实可以在递归到底层时输入即可,也就是边递归边输入,另外提一嘴跟这个题没什么关系的点ÿ…...
Qt中读写结构体字节数据
在Qt中读写结构体字节数据通常涉及将结构体转换为字节数组(QByteArray)或直接从内存中读写。以下是几种常见方法: 方法1:使用QDataStream读写结构体 cpp #include <QFile> #include <QDataStream>// 定义结构体 #pragma pack(push, 1) //…...