当前位置: 首页 > news >正文

如何开发专业小模型

在专业领域场景下,通过针对性优化大模型的词汇表、分词器和模型结构,确实可以实现参数规模的显著缩减而不损失专业能力。这种优化思路与嵌入式设备的字库剪裁有相似性,但需要结合大模型的特性进行系统性设计。以下从技术可行性、实现方法和潜在挑战三个层面展开分析:


一、技术可行性分析

  1. 词汇表精简的数学基础
    大模型的词汇表(Tokenizer)与参数规模直接相关。以GPT系列模型为例,词汇表大小通常占模型总参数量的5%-10%。若将通用词汇表(如包含5万个词)压缩至专业领域词汇表(如5000个词),理论上可减少约90%的Embedding层参数。实验表明,当专业词汇覆盖率达95%以上时,模型在领域任务上的性能损失可控制在3%以内。

  2. 分词器的领域适配
    通过定制化分词策略(如BPE算法的局部优化),可确保专业术语的完整保留。例如,在医学领域,将"心肌梗死"作为一个整体Token而非拆分为"心肌"+“梗死”,能显著提升语义理解准确性。这种方法已在BERT等模型中验证有效,且支持跨语言场景的扩展。

  3. 模型结构的参数压缩
    • 剪枝技术:通过移除低频词对应的神经元连接,可减少30%-70%的参数量而不显著影响性能

    • 量化技术:将浮点权重转为8位整数,可使模型体积缩小4倍

    • 知识蒸馏:用专业领域数据微调教师模型,可将知识迁移至小型学生模型(如从175B参数的GPT-3蒸馏至6B参数模型)


二、关键实现方法

  1. 训练数据层面的优化
    • 领域语料筛选:构建垂直领域语料库,过滤通用词汇(如停用词、高频非专业词)

    • 动态词汇扩展:采用子词掩码(Subword Masking)技术,允许模型动态学习新术语

    • 数据增强策略:通过回译、同义词替换等方法提升数据多样性,弥补词汇量限制

  2. 分词器的定制化改造

    技术方法实施步骤效果案例
    BPE局部优化基于领域语料重新训练合并操作医学文献处理准确率提升12%
    SentencePiece设置最大Token长度,保留术语完整性法律合同解析错误率降低18%
    字符级混合编码对专业术语采用字符级编码化学式识别F1值达92.7%
  3. 模型架构的针对性设计
    • 轻量化网络结构:采用MobileNetV3的深度可分离卷积替代标准卷积层

    • 动态计算图:根据输入词汇动态激活神经元(如Sparse Transformer)

    • 混合精度训练:对专业词汇相关层使用FP32,其他层使用FP16


三、潜在挑战与解决方案

  1. 性能损失风险
    • 问题:过度剪裁可能导致语义歧义(如多义词误判)

    • 解决方案:引入上下文感知的注意力机制,强化术语关联

  2. 硬件适配难题
    • 问题:非结构化剪枝可能破坏硬件加速条件

    • 解决方案:采用结构化剪枝(如整行/整列删除),配合TensorRT优化

  3. 持续维护成本
    • 问题:领域术语更新可能导致模型失效

    • 解决方案:设计在线增量学习框架,支持动态词汇表扩展


四、实践建议

  1. 分阶段实施路线

    领域语料分析
    Tokenizer定制
    模型架构设计
    参数压缩实施
    性能评估与调优
  2. 关键指标监控
    • 词汇覆盖率(需≥95%)

    • 模型压缩率(建议控制在原规模1/10-1/5)

    • 领域任务准确率下降阈值(建议≤5%)

  3. 工具链选择
    • 分词器:HuggingFace Tokenizers + 自定义BPE规则

    • 压缩框架:PyTorch Pruning + ONNX Runtime

    • 部署优化:TensorRT + CUDA Graph


阶段性结论
通过系统性应用词汇表精简、分词器定制和模型压缩技术,在专业领域场景下实现大模型参数规模的"瘦身"是完全可行的。实际应用中需注意平衡模型压缩率与性能损失,建议采用渐进式优化策略,并配合领域适配的评估指标体系。随着模型压缩技术的发展(如神经架构搜索NAS),未来有望实现更高效的领域专属模型部署。

如何做呢?

基于3张RTX 3070显卡的模型训练实验设计方案


一、词库量控制建议

  1. 显存与模型参数关系
    • 单张RTX 3070显存为8GB,3卡总显存24GB。

    • 假设使用FP16混合精度训练(每个参数占2字节),模型参数总量需控制在约12B以内(预留显存给优化器状态和梯度)。

    • 词汇表规模建议:

    ◦ 核心词汇:5000-8000词(覆盖领域90%以上高频术语)

    ◦ 扩展词汇:10000-15000词(通过子词分词覆盖低频术语)

    ◦ 示例:医学领域可保留"心肌梗死"等完整术语,避免拆分为"心肌"+“梗死”。

  2. 分词策略
    • 使用BPE(Byte-Pair Encoding)或SentencePiece,设置最大Token长度为512。

    • 对专业术语进行强制合并(如将"DNA测序"设为单一Token)。


二、领域推荐

  1. 低资源高价值领域

    领域特点数据示例
    法律合同术语固定(如"不可抗力"),句式结构化强合同条款、判决书
    医学文献专业名词密集(如"白细胞介素-6"),需保留完整术语期刊论文、病例报告
    金融报告数字与术语结合(如"ROE(净资产收益率)"),需处理数值语义年报、财报分析
    代码生成符号化指令(如"for循环"),适合小规模垂直场景GitHub开源代码片段
  2. 推荐选择
    • 优先领域:法律合同(数据相对结构化,术语边界清晰)

    • 备选领域:医学文献(需领域专家辅助标注)


三、完整实验方案设计
1. 数据准备阶段
• 数据收集

• 从公开数据集(如Kaggle法律合同数据集)或内部文档中提取10万-50万条文本。

• 示例:法律领域可收集《民法典》条款及司法解释。

• 数据清洗

# 示例:去除冗余符号,保留专业术语
import re
def clean_text(text):text = re.sub(r'[^\u4e00-\u9fa5a-zA-Z0-9\(\)\·]', '', text)  # 保留中英文、数字、括号return text.strip()

• 分词与词汇表构建

from tokenizers import Tokenizer, models, trainers
tokenizer = Tokenizer(models.BPE())
trainer = trainers.BpeTrainer(special_tokens=["[PAD]","[UNK]"], vocab_size=8000)
tokenizer.pre_tokenizer = tokenizers.pre_tokenizers.Whitespace()
tokenizer.train(files=["legal_corpus.txt"], trainer=trainer)

2. 模型架构设计
• 轻量化Transformer模型

import torch
from torch import nn
from transformers import BertConfig, BertModelclass LiteBert(nn.Module):def __init__(self, vocab_size=8000, hidden_size=768, num_layers=6):super().__init__()self.config = BertConfig(vocab_size=vocab_size,hidden_size=hidden_size,num_hidden_layers=num_layers,num_attention_heads=12,type_vocab_size=1)self.bert = BertModel(self.config)def forward(self, input_ids, attention_mask):return self.bert(input_ids=input_ids, attention_mask=attention_mask)

• 参数规模估算

模块参数量(百万)计算量(FLOPs)
Embedding62.43.12G
Transformer442.8221.4G
总计505.2224.5G

3. 训练配置优化
• 显存管理策略

• 梯度累积:设置gradient_accumulation_steps=4,等效Batch Size=32。

• 混合精度训练:使用torch.cuda.amp,FP16精度下显存占用降低40%。

• 分布式训练:3卡并行,采用torch.distributed.DistributedDataParallel

• 超参数设置

learning_rate: 2e-5
batch_size: 16  # 单卡实际Batch Size
epochs: 10
warmup_ratio: 0.1
weight_decay: 0.01

4. 硬件资源分配

资源配置方案说明
GPU3×RTX 3070(8GB显存)使用NVIDIA NCCL加速通信
CPUAMD EPYC 7B13(32核)多线程预处理数据
内存256GB DDR4 ECC避免数据加载瓶颈
存储2TB NVMe SSD(RAID 0)高吞吐量读取训练数据

5. 性能监控与调优
• 关键指标监控

# 使用PyTorch Profiler
with torch.profiler.profile(activities=[torch.profiler.ProfilerActivity.CPU, torch.profiler.ProfilerActivity.CUDA]
) as prof:train_step()
print(prof.key_averages().table(sort_by="cuda_time_total"))

• 常见问题解决方案

问题现象解决方案
显存不足(OOM)降低Batch Size或启用梯度检查点
训练速度慢启用TensorRT加速或优化数据加载管道
损失函数不收敛调整学习率或增加正则化项

四、实验验证与评估

  1. 基线模型对比
    • 使用相同数据训练标准BERT-base(110M参数)与轻量化LiteBert(505M参数),对比领域任务准确率差异。

  2. 量化压缩测试
    • 对训练完成的模型进行4-bit量化,验证精度损失是否在5%以内。

  3. 领域任务测试集
    • 法律领域:合同条款分类(准确率目标≥92%)

    • 医学领域:实体识别(F1值目标≥88%)


五、成本与时间估算

项目单卡耗时3卡并行耗时硬件成本(月均)
数据预处理2小时40分钟$300(电费)
模型训练(10 epochs)18小时6小时$900(GPU租赁)
模型压缩与评估3小时1小时$100(存储)

总结
通过将词汇表控制在5000-8000专业术语,选择法律或医学等术语密集型领域,配合轻量化模型设计和显存优化策略,3张RTX 3070显卡可完成高效的小规模领域模型训练。实验需重点关注混合精度训练配置和分布式通信优化,建议采用渐进式调优策略逐步压缩模型规模。

相关文章:

如何开发专业小模型

在专业领域场景下,通过针对性优化大模型的词汇表、分词器和模型结构,确实可以实现参数规模的显著缩减而不损失专业能力。这种优化思路与嵌入式设备的字库剪裁有相似性,但需要结合大模型的特性进行系统性设计。以下从技术可行性、实现方法和潜…...

EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型

EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型。以下是具体实现方法: 1. EXO 的分布式计算能力 EXO 是一个支持 分布式 AI 计算 的开源框架,能够将多台 Mac 设备(如 M4 和 Mac Air)组合成…...

Git Worktree 使用

新入职了一家公司,发现不同项目用的使用一个 git 仓库管理。不久之后我看到这篇文章。 Git 的设计部​​分是为了支持实验。一旦你确定你的工作被安全地跟踪,并且存在安全的状态,以便在出现严重错误时可以恢复,你就不会害怕尝试新…...

【Linux网络】内网穿透

内网穿透 基本概念 内网穿透(Port Forwarding/NAT穿透) 是一种网络技术,主要用于解决处于 内网(局域网)中的设备无法直接被公网访问 的问题。 1. 核心原理 内网与公网的隔离:家庭、企业等局域网内的设备…...

反射机制动态解析

代码解释与注释 package com.xie.javase.reflect;import java.lang.reflect.Field; import java.lang.reflect.Modifier;public class ReflectTest01 {public static void main(String[] args) throws ClassNotFoundException {// 1. 获取java.util.HashMap类的Class对象Class…...

10 分钟打造一款超级马里奥小游戏,重拾20 年前的乐趣

我正在参加CodeBuddy「首席试玩官」内容创作大赛,本文所使用的 CodeBuddy 免费下载链接:腾讯云代码助手 CodeBuddy - AI 时代的智能编程伙伴 你好,我是悟空。 前言 小时候看到村里的大朋友家里都有一款 FC 游戏机,然后旁边还放…...

鸿蒙ArkUI体验:Hexo博客客户端开发心得

最近部门也在跟进鸿蒙平台的业务开发,自己主要是做 Android 开发,主要使用 Kotlin/Java 语言。,需要对新的开发平台和开发模式进行学习,在业余时间开了个项目练手,做了个基于 Hexo 博客内容开发的App。鸿蒙主要使用Ark…...

人工智能100问☞第25问:什么是循环神经网络(RNN)?

目录 一、通俗解释 二、专业解析 三、权威参考 循环神经网络(RNN)是一种通过“记忆”序列中历史信息来处理时序数据的神经网络,可捕捉前后数据的关联性,擅长处理语言、语音等序列化任务。 一、通俗解释 想象你在和朋友聊天,每说一句话都会根据之前的对话内容调整语气…...

【springcloud学习(dalston.sr1)】Zuul路由访问映射规则配置及使用(含源代码)(十二)

该系列项目整体介绍及源代码请参照前面写的一篇文章【springcloud学习(dalston.sr1)】项目整体介绍(含源代码)(一) springcloud学习(dalston.sr1)系统文章汇总如下: 【springcloud学习(dalston…...

STM32IIC协议基础及Cube配置

STM32IIC协议基础及Cube配置 一,IC协议简介1,核心特点2,应用场景 二,IC协议基础概念1,总线结构2,主从架构3,设备寻址4,起始和停止条件5,数据传输6,应答机制 三…...

Python异常模块和包

异常 当检测到一个错误时,Python解释器就无法继续执行了,反而出现了一些错误的提示,这就是所谓的“异常”, 也就是我们常说的BUG 例如:以r方式打开一个不存在的文件。 f open(‘python1.txt’,‘r’,encoding‘utf-8’) 当我们…...

每日算法刷题Day9 5.17:leetcode定长滑动窗口3道题,用时1h

9. 1652.拆炸弹(简单&#xff0c;学习) 1652. 拆炸弹 - 力扣&#xff08;LeetCode&#xff09; 思想 为了获得正确的密码&#xff0c;你需要替换掉每一个数字。所有数字会 同时 被替换。 如果 k > 0 &#xff0c;将第 i 个数字用 接下来 k 个数字之和替换。如果 k < 0…...

题单:递归求和

宣布一个重要的事情&#xff0c;我的洛谷有个号叫 题目描述 给一个数组 a:a[0],a[1],...,a[n−1]a:a[0],a[1],...,a[n−1] 请用递归的方式出数组的所有数之和。 提示&#xff1a;递推方程 f(x)f(x−1)a[x]f(x)f(x−1)a[x]; 输入格式 第一行一个正整数 n (n≤100)n (n≤100)…...

手动实现 Transformer 模型

本文使用 Pytorch 库手动实现了传统 Transformer 模型中的多头自注意力机制、残差连接和层归一化、前馈层、编码器、解码器等子模块&#xff0c;进而实现了对 Transformer 模型的构建。 """ Title: 解析 Transformer Time: 2025/5/10 Author: Michael Jie &quo…...

【鸿蒙开发避坑】使用全局状态变量控制动画时,动画异常甚至动画方向与预期相反的原因分析以及解决方案

【鸿蒙开发避坑】使用全局状态变量控制动画&#xff0c;动画异常甚至动画方向相反的原因分析以及解决方案 一、问题复现1、问题描述2、问题示意图 二、原因深度解析1、查看文档2、调试3、原因总结&#xff1a;&#xff08;1&#xff09;第一次进入播放页面功能一切正常的原因&a…...

天拓四方锂电池卷绕机 PLC 物联网解决方案

近年来&#xff0c;锂电制造行业作为新能源领域的核心支柱产业&#xff0c;呈现出迅猛发展的态势&#xff0c;市场需求持续高涨。在此背景下&#xff0c;行业内对产品质量、生产效率以及成本控制等方面提出了更为严苛的要求。锂电制造流程涵盖混料、涂布、辊压、分切、制片、卷…...

RFID系统:技术解析与应用全景

一、技术架构与运行逻辑 RFID&#xff08;Radio Frequency Identification&#xff09;系统通过无线电波实现非接触式数据交互&#xff0c;其核心由三部分组成&#xff1a; 电子标签&#xff08;Tag&#xff09;&#xff1a; 无源标签&#xff1a;依赖读写器电磁场供电&…...

hbuilderX 安装Prettier格式化代码

一、打开插件安装 搜索输入&#xff1a;Prettier 安装后&#xff0c;重启hbuilderX &#xff0c;再按AltShiftF 没安装Prettier格式化&#xff1a; import {saveFlow,getTemplate } from "../../api/flowTemplate.js"; 安装Prettier格式化后&#xff1a; import …...

Python-92:最大乘积区间问题

问题描述 小R手上有一个长度为 n 的数组 (n > 0)&#xff0c;数组中的元素分别来自集合 [0, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024]。小R想从这个数组中选取一段连续的区间&#xff0c;得到可能的最大乘积。 你需要帮助小R找到最大乘积的区间&#xff0c;并输出这…...

Compose笔记(二十三)--多点触控

这一节主要了解一下Compose中多点触控&#xff0c;在Jetpack Compose 中&#xff0c;多点触控处理需要结合Modifier和手势API来实现&#xff0c;一般通过组合 pointerInput、TransformableState 和 TransformModifier 来创建支持缩放、旋转和平移的组件。 一、 API 1. Pointer…...

2025.05.17淘天机考笔试真题第一题

📌 点击直达笔试专栏 👉《大厂笔试突围》 💻 春秋招笔试突围在线OJ 👉 笔试突围OJ 01. 魔法棋盘构造 问题描述 LYA 正在设计一款魔法棋盘游戏。游戏棋盘由 2 n 2 \times n...

python的漫画网站管理系统

目录 技术栈介绍具体实现截图![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0ed2084038144499a162b3fb731a5f37.png)![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/a76a091066f74a80bf7ac1be489ae8a8.png)系统设计研究方法&#xff1a;设计步骤设计流程核…...

系统架构设计(十):结构化编程

定义 结构化编程是一种遵循清晰逻辑结构、避免使用 goto 的编程方法。它强调使用有限的三种基本控制结构来组织程序&#xff0c;提高程序的可读性、可维护性和可测试性。 它是现代程序设计的基础&#xff0c;被广泛应用于命令式语言&#xff08;如 C、Pascal、Java&#xff0…...

系统架构设计(七):数据流图

定义 数据流图&#xff08;Data Flow Diagram, DFD&#xff09;是一种用于表示信息系统数据流转及处理过程的图形工具。 它反映系统功能及数据之间的关系&#xff0c;是结构化分析与设计的重要工具。 主要符号 符号说明描述举例方框外部实体&#xff08;源或终点&#xff09…...

BrepGen中的几何特征组装与文件保存详解 deepwiki occwl OCC包装库

有这种好东西我怎么不知道 AutodeskAILab/occwl: Lightweight Pythonic wrapper around pythonocc 组装几何特征以创建B-rep模型 保存为STEP和STL文件细说 Fast 快速 Searched across samxuxiang/BrepGen Ill explain how BrepGen assembles geometric features to create B-r…...

QT6 源(105)篇二:阅读与注释 QAction,给出源代码

&#xff08;5&#xff09;本源代码来自于头文件 qaction . h &#xff1a; #ifndef QACTION_H #define QACTION_H#include <QtGui/qtguiglobal.h> #if QT_CONFIG(shortcut) # include <QtGui/qkeysequence.h> #endif #include <QtGui/qicon.h> #include &…...

复旦微FMQL调试笔记:PS网口

引言 FPGA&#xff0c;全程现场可编程门阵列&#xff0c;是指一切通过软件手段更改、配置器件内部连接结构和逻辑单元&#xff0c;完成既定设计功能的数字集成电路。换个简单通俗的介绍方式&#xff0c;就好比一个全能的运动员&#xff0c;FPGA就是这么神奇的可以通过设定而实…...

SpringBoot启动流程深入分析

文章目录 背景启动流程listeners.starting先获取运行监听器获取SpringApplicationRunListener的实例监听器接口从spring.factories中加载数据&#xff0c;这里有本地缓存监听启动发布starting事件 prepareEnvironment准备环境获取或创建环境配置环境 createApplicationContext创…...

Linux - 2.系统命令

1.帮助命令 1.help [root@localhost /]# cp --help1.查看命令的信息和参数2.只能显示shell内部的命令信息3.help命令第一部分是概述,第二部分是参数详解,第三部分是说明和注意 # 使用语法 Usage: cp [OPTION]... [-T] SOURCE DESTor: cp [OPTION]... SOURCE... DIRECTORYor:…...

CSP 2024 提高级第一轮(CSP-S 2024)单选题解析

单选题解析 第 1 题 在 Linux 系统中&#xff0c;如果你想显示当前工作目录的路径&#xff0c;应该使用哪个命令&#xff1f;&#xff08;A&#xff09; A. pwd B. cd C. ls D. echo 解析&#xff1a;Linux 系统中&#xff0c;pwd命令可以显示当前工作目录的路径。pwd&#x…...

JavaScript运算符

在JavaScript开发中&#xff0c;运算符是编程的基础工具。它们用于执行各种操作&#xff0c;从简单的数学计算到复杂的逻辑判断。本文将深入探讨JavaScript中的各种运算符&#xff0c;包括算术运算符、比较运算符、布尔运算符、位运算符以及其他一些特殊运算符。 一、算术运算…...

无线信道的噪声与干扰

目录 1. 无线信道(wireless channel)与电磁波 2.1 电磁波的传输(无线信道传输) 2.2 视线(line of sight)传播与天线高度 2. 信道的数学模型 2.1 调制信道模型 2.1.1 加性噪声/加性干扰 2.1.2 乘性噪声/乘性干扰 2.1.3 随参信道/恒参信道 2.2 编码信道模型 2.3 小结 …...

计算机视觉与深度学习 | Python实现EMD-CNN-LSTM时间序列预测(完整源码、数据、公式)

EMD-CNN-LSTM 1. 环境准备2. 数据生成(示例数据)3. EMD分解4. 数据预处理5. CNN-LSTM模型定义6. 模型训练7. 预测与重构8. 性能评估核心公式说明1. 经验模态分解(EMD)2. CNN-LSTM混合模型参数调优建议扩展方向典型输出示例以下是使用Python实现EMD-CNN-LSTM时间序列预测的完…...

基于Yolov8+PyQT的老人摔倒识别系统源码

概述 随着人工智能技术的普及&#xff0c;计算机视觉在安防领域的应用日益广泛。幽络源本次分享的​​基于Yolov8PyQT的老人摔倒识别系统​​&#xff0c;正是针对独居老人安全监护的实用解决方案。该系统通过深度学习算法实时检测人体姿态&#xff0c;精准识别站立、摔倒中等…...

【网络入侵检测】基于Suricata源码分析运行模式(Runmode)

【作者主页】只道当时是寻常 【专栏介绍】Suricata入侵检测。专注网络、主机安全&#xff0c;欢迎关注与评论。 1. 概要 &#x1f44b; 在 Suricata 中抽象出线程、线程模块和队列三个概念&#xff1a;线程类似进程&#xff0c;可多线程并行执行操作&#xff1b;监听、解码、检…...

深入解析:java.sql.SQLException: No operations allowed after statement closed 报错

在 Java 应用程序开发过程中&#xff0c;尤其是涉及数据库交互时&#xff0c;开发者常常会遇到各种各样的异常。其中&#xff0c;java.sql.SQLException: No operations allowed after statement closed是一个较为常见且容易令人困惑的错误。本文将深入剖析这一报错&#xff0c…...

ARM-Linux 完全入门

1.准备部分 1.1 虚拟机安装 准备VMware软件、ubuntu系统镜像安装过程 VMware安装 破解&#xff08;自己百度破解码&#xff0c;多试几个网址&#xff0c;会有能用的&#xff09;Ubuntu安装 配置联网 桥接 虚拟机Ubuntu系统必须能连接到外网&#xff0c;不然不能更新软件安装…...

前端二进制数据指南:从 ArrayBuffer 到高级流处理

前端开发中&#xff0c;二进制数据是处理文件、图像、音视频、网络通信等场景的基础。以下是核心概念和用途的通俗解释&#xff1a; 前端二进制数据介绍 1. 什么是前端二进制数据&#xff1f; 指计算机原始的 0 和 1 格式的数据&#xff08;比如一张图片的底层代码&#xff…...

深入理解构造函数,析构函数

目录 1.引言 2.构造函数 1.概念 2.特性 3.析构函数 1.概念 2.特性 1.引言 如果一个类中什么都没有&#xff0c;叫作空类. class A {}; 那么我们这个类中真的是什么都没有吗?其实不是,如果我们类当中上面都不写.编译器会生成6个默认的成员函数。 默认成员函数:用户没有显…...

数值分析知识重构

数值分析知识重构 一 Question 请构造一下数值分析中的误差概念以及每一个具体数值方法的误差是如何估计的&#xff1f; 二 Question 已知 n 1 n1 n1个数据点 ( x i , y i ) , i 0 , 1 , ⋯ , n (x_i,y_i),i0,1,\cdots,n (xi​,yi​),i0,1,⋯,n,请使用多种方法建立数据之间…...

全端同步!ZKmall开源商城如何用B2B2C模板让消费者跨设备购物体验无缝衔接?

在数字化浪潮席卷下&#xff0c;消费者的购物行为不再局限于单一设备。早晨用手机小程序浏览商品&#xff0c;中午在 PC 端对比参数&#xff0c;晚上通过平板下单&#xff0c;跨设备购物已成常态。然而&#xff0c;设备间数据不同步、操作体验割裂等问题&#xff0c;严重影响购…...

Redis Sentinel如何实现高可用?

Redis Sentinel 通过以下核心机制实现高可用&#xff1a; 1. 监控&#xff08;Monitoring&#xff09; Sentinel 集群会持续监控主节点&#xff08;Master&#xff09;和从节点&#xff08;Slave&#xff09;的状态&#xff1a; 定期发送 PING 命令检测节点是否存活&#xf…...

环形缓冲区 ring buffer 概述

环形缓冲区 ring buffer 概述 1. 简介 环形缓冲区&#xff08;ring buffer&#xff09;&#xff0c;是一种用于表示一个固定尺寸、头尾相连的缓冲区的数据结构&#xff0c;适合缓存数据流。也称作环形缓冲区&#xff08;circular buffer&#xff09;&#xff0c;环形队列&…...

Spring源码之解决循环依赖 三级缓存

目录 三级缓存核心原理 循环依赖的解决过程 1. Bean A创建过程中提前曝光工厂 2. Bean B创建时发现依赖A&#xff0c;从缓存获取 3. Bean A继续完成初始化 三级缓存的作用总结 二级缓存为何不够解决缓存依赖&#xff1f; 三级缓存如何解决&#xff1f; 为什么不直接在…...

山东大学计算机图形学期末复习9——CG12上

CG12上 几何管线末端&#xff1a;顶点已组装成基本图元&#xff08;Primitives&#xff0c;如点、线、三角形&#xff09;。 主要任务&#xff1a; 裁剪&#xff1a;视锥体是一个三维空间区域&#xff08;由近裁剪面、远裁剪面和侧面组成&#xff09;&#xff0c;超出该区域的图…...

关于软件测试开发的一些有趣的知识

文章目录 一、什么是测试&#xff1f;二、为什么要软件测试软件测试三、测试的岗位有哪些四 、软件测试和开发的区别五、走测试岗位为什么还要学开发。4、优秀的测试人员具备的素质我为什么走测试岗位 一、什么是测试&#xff1f; 其实这个问题说简单也不简单&#xff0c;说难…...

在Solana上使用 Scaled UI Amount 扩展

本指南提供 Solana Web3.js (Legacy v 1.x) 和 Solana Kit (v 2.x) 版本。选择适当的选项卡以查看你首选库的代码片段和说明&#xff1a; Solana Web3.js (Legacy)Solana Kit 概述 Solana Token-2022 程序 引入了强大的扩展&#xff0c;增强了代币功能&#xff0c;使其超越了…...

线性表之数组与栈详解

线性表之数组与栈详解 前言一、数组&#xff08;Array&#xff09;1.1 数组的基本概念1.2 数组的实现与操作1.3 数组的应用场景1.4 数组的优缺点 二、栈&#xff08;Stack&#xff09;2.1 栈的基本概念2.2 栈的实现方式2.3 栈的应用场景 2.4 栈的优缺点 三、数组与栈的对比总结…...

车载以太网驱动智能化:域控架构设计与开发实践

title: 车载以太网驱动专用车智能化&#xff1a;域控架构设计与开发实践 date: 2023-12-01 categories: 新能源汽车 tags: [车载以太网, 电子电气架构, 域控架构, 专用车智能化, SOME/IP, AUTOSAR] 引言&#xff1a;专用车智能化转型的挑战与机遇 专用车作为城市建设与工业运输…...

【Redis】redis用作缓存和分布式锁

文章目录 1. 缓存1.1 Redis作为缓存1.2 缓存更新、淘汰策略1.3 缓存预热、缓存穿透、缓存雪崩和缓存击穿1.3.1 缓存预热&#xff08;preheating&#xff09;1.3.2 缓存穿透&#xff08;penetration&#xff09;1.3.3 缓存雪崩&#xff08;avalanche&#xff09;1.3.4 缓存击穿&…...