精简大语言模型:用于定制语言模型的自适应知识蒸馏
Streamlining LLMs: Adaptive Knowledge Distillation for Tailored Language Models
发表:NAACL 2025
机构:德国人工智能研究中心
Abstract
诸如 GPT-4 和 LLaMA-3 等大型语言模型(LLMs)在多个行业展现出变革性的潜力,例如:提升客户服务、革新医疗诊断流程,或在新闻报道中识别危机事件。然而,在部署 LLM 时仍面临诸多挑战,包括训练数据有限、计算成本高,以及在透明性和可解释性方面存在问题。我们的研究聚焦于从 LLM 中蒸馏出紧凑、参数高效的定制语言模型(TLMs),以应对特定领域任务,并实现与 LLM 相当的性能。当前的一些方法(如知识蒸馏、微调和模型并行)虽能提高计算效率,但在效率、适应性和准确性之间尚缺乏一种能够平衡三者的混合策略。我们提出了 ANON —— 一个自适应知识蒸馏框架,它将知识蒸馏与适配器机制相结合,能够在无需依赖标注数据集的情况下,生成计算效率更高的 TLM。ANON 利用交叉熵损失函数从教师模型的输出及其内部表示中转移知识,同时采用自适应提示工程(prompt engineering)与渐进式蒸馏策略(progressive distillation strategy)分阶段地进行知识迁移。我们在危机领域对 ANON 进行了评估,该领域对准确性要求极高且标注数据稀缺。实验结果表明,在生成 TLM 的性能方面,ANON 优于当前主流知识蒸馏方法;同时,在保持准确性的前提下,相较于直接使用 LLM,它在训练与推理过程中的计算成本更低,适合于特定领域的应用场景。
Introduction
近年来,大型语言模型(LLMs)彻底改变了我们与技术交互的方式,成为当前人工智能时代的主导趋势。各行各业正通过应用 LLMs 进行自我革新,应用场景涵盖基于可解释性 LLM 方案的医学诊断(Bisercic 等,2023),金融风险分析与市场建模(Wu 等,2023),以及通过分析新闻文章和社交媒体文本进行的实时危机检测(Saxena 等,2024;Janzen 等,2024)。尽管 LLM 拥有强大的能力,但在将其部署于特定领域任务时仍面临显著挑战。对这类模型进行全面微调需要大量的标注数据集和计算资源,这使得许多组织,尤其是预算有限的组织望而却步。因此,为 LLM 设计有效的模型压缩策略对于在资源受限环境中实现广泛、实用的应用至关重要。
现有针对模型压缩与适配的研究包括知识蒸馏(KD)(Gu 等,2023;Sanh 等,2019)、参数高效微调(PEFT)(Ding 等,2023)和模型剪枝(Fan 等,2021)。这些方法的核心目标是将大型模型转化为更高效的版本,同时尽量不损失性能。KD 将知识从较大的“教师”模型迁移到较小的“学生”模型,从而在保留性能的同时减少计算开销(Dasgupta 等,2023;Hsieh 等,2023;West 等,2022;Ko 等,2024)。PEFT 方法(如 Adapters(Houlsby 等,2019)、BitFit(Zaken 等,2021)和 LoRA(Hu 等,2022))则仅优化模型的一部分参数,实现特定任务的适配,且资源开销极小。同样地,基于提示的调优技术(如 prefix tuning 和 prompt tuning)可将领域特定的信息注入到模型输入中,而无需修改模型架构。然而,这些方法通常是孤立使用,缺乏能够整合它们优势的混合机制,以同时应对内存效率、计算成本、任务性能和数据匮乏之间的权衡。近期工作,如 adapter distillation(Wang 等,2023)和语言通用适配器(Shen 等,2023),展现了方法组合的潜力,但在针对特定领域优化的混合方法方面仍有待进一步探索。
为了解决这些局限性,我们提出了 ANON —— 一个将 KD 与基于适配器的 PEFT 相结合的新型框架,旨在将 LLM 高效蒸馏为适用于特定领域任务的语言模型(TLMs)。ANON 通过交叉熵损失函数进行知识迁移,利用教师模型的输出分布和内部表示来保留高层抽象和领域细节。该框架还使用自适应提示工程技术,通过数据驱动的提示来有效对齐教师与学生模型(Mishra 等,2023)。此外,ANON 还引入了渐进式蒸馏策略,以分阶段的方式从简单任务到复杂任务逐步传递知识,实现更全面的学习。适配器模块轻量、独立训练,其它部分保持冻结,大幅降低了计算成本,使 ANON 成为高效且具扩展性的领域适配解决方案。
我们在危机预警任务中对 ANON 进行了评估,目标是基于 219,292 篇新闻文章构建的语料库,实现潜在危机的早期检测。按照(Saxena 等,2024)提出的实验设计,我们评估了 ANON 在多个教师-学生模型对上的表现,包括 LLaMA-2(Touvron 等,2023)、OPT(Zhang 等,2022)和 GPT-2(Radford 等,2019)。这些评估将 ANON 与现有 KD 方法进行了基准对比。结果表明,ANON 在性能上优于基线方法,同时显著降低了资源消耗。例如,学生模型 LLaMA-27B_ANON 由 LLaMA-2 13B 教师模型蒸馏而来,不仅性能超过了教师模型,其资源消耗也最多降低了 95.24%。这些发现表明,ANON 能够在计算效率与任务性能之间实现良好平衡,是一种适用于资源受限 AI 应用的可扩展方案。
Adaptive knowledge distillation for domain-specific TLMs
我们提出了 ANON——一个自适应知识蒸馏框架,旨在高效地将大型语言模型(LLMs)蒸馏为面向特定任务的领域语言模型(TLMs),如图1所示。
ANON 在学生模型中集成了轻量级的适配器层,从而使蒸馏过程集中于这些新增参数的训练,同时冻结模型的其他结构,实现高效训练。
该框架采用交叉熵损失函数,对齐学生模型的预测与教师模型的输出分布,从而实现知识的精准迁移。
通过集成如 LoRA、QLoRA 和 Series Adapter 等适配器模块(Dettmers 等,2023),ANON 进一步优化了训练效率,在不牺牲模型性能的前提下降低了计算成本。
该框架还采用渐进蒸馏策略,即分阶段进行知识迁移,从简单任务逐步过渡到复杂任务。
这种混合方法生成的学生模型 StudentANON 在显著降低资源需求的同时,达到了与教师模型相当的性能。
最终模型非常适用于医疗诊断、风险管理、客户支持等特定领域,为现实任务提供了可扩展、可部署的解决方案。
Prompt Generation
ANON 利用特定任务的提示词(prompts)来引导教师模型与学生模型之间的知识蒸馏。
受 PromptAid(Mishra 等,2023)的启发,这些提示词遵循一种通用结构:包括可选的系统提示词、必须包含的用户任务说明,以及用于指定机器可读输出格式的响应模板。
提示词会根据具体任务和模型的需求进行定制。
例如,在一个新闻文章分类任务中,可能会使用如下提示词:“请将以下新闻文章分类为以下三类之一:‘风险与预警’、‘警告与建议’、或‘安全无害’。输入:能源部门警告未来几个月将出现短缺和账单飙升。”
这些生成的提示词作为输入同时传递给教师模型和学生模型,从而使它们在相同的任务目标下进行学习。
ANON Workflow
构建计算高效的、面向特定领域任务的语言模型(TLMs),需要在性能与资源限制之间取得平衡。ANON 框架通过自适应知识蒸馏提供了一个全面的解决方案,采用教师-学生结构并结合轻量级适配器。教师模型是一个大型预训练语言模型,如 LLaMA-3.1(405B 或 70B)或 GPT-4,用作丰富、泛化知识的来源。学生模型则是一个更小、更高效的替代方案,如 LLaMA-27B 或 GPT-2,旨在复制教师模型的输出,在减少计算开销的同时保持相当的性能。
蒸馏过程确保学生模型与教师模型的输出概率分布保持一致。这种对齐是通过精心设计的提示词 xxx 来实现的,用以引导两者生成期望的输出。教师模型的预测 yyy 被视为学生模型训练时的“真实标签”。
优化目标使用交叉熵损失函数来形式化表示:
为了进一步降低蒸馏过程的资源消耗,ANON 在学生模型中引入了适配器。这些适配器是可训练的小模块,仅微调模型的特定部分,而冻结其他部分。通过将更新限定于适配器,ANON 显著减少了训练过程中的资源开销,尤其是在大量参数进行梯度计算与误差反向传播时。
这种有针对性的微调策略使学生模型在训练与推理成本大幅降低的同时,仍能获得与教师模型相当的性能。
Implementation and Evaluation
基于所提出的框架(参见图1),我们按照(Saxena 等人,2024;Hassanzadeh 等人,2022)中描述的实验设计,实现了用于危机预警任务的 ANON。
最终,蒸馏得到的 StudentANON 模型能够提供面向特定领域的危机信号,并给出相应的置信度和严重程度等级的预警信息。
Data Collection and Processing
为了对 ANON 进行蒸馏,我们使用了一个包含 219,292 篇新闻文章的开放域危机信号数据集,覆盖 42 种语言。该数据集涉及多种类型的危机,例如 供应链中断、难民迁徙和经济不稳定等。
该数据集通过 关键词扩展技术构建,并借助 Event Registry API<sup>11</sup> 进行检索。
在预处理阶段,执行了标准的文本清洗(例如移除特殊字符和标点符号),并使用了一个 两阶段过滤流程(Saxena 等,2024)。
最终得到的精简数据集包含 137,308 篇文章,占原始语料库的 62%。
我们使用真实世界中的危机新闻数据集来评估 ANON 的性能。Saxena 等(2024)对这些数据集进行了全面的描述性分析,包括其分布和范围等特征。
在本研究中,我们使用了 319 篇由人工标注的文章,这些文章主要围绕 经济衰退和能源危机(例如供应链中断、能源可用性和成本)展开。
这些人工标注的文章作为 模型验证的基准数据。
Training paradigm
蒸馏过程首先通过用于分类任务的提示模板(template 2.1)生成提示(x)。参照 Gu 等人(2023)的方法,我们使用了三组教师-学生模型对:(LLaMA-2 13B, LLaMA-2 7B),(OPT 13B, OPT 1.3B),以及 (GPT-2 1.5B, GPT-2 124M)。这些提示的任务是将新闻文章分类为三类:“风险与警示”、“注意与建议”,以及**“安全与无害”**。
通过 20 条由专家人工标注的样本进行少样本提示(few-shot prompting),以增强教师模型的预测效果。经过调优后,这些提示被输入到教师和学生模型中,以生成分类预测结果 y(教师输出)和 𝑦̂(学生输出)。教师模型的输出 y 被视为蒸馏过程中的“真实标签”。
为了最小化教师和学生模型之间预测概率分布的差异,我们采用了交叉熵损失函数进行优化。
为了进一步提高效率,我们引入了 量化低秩适配器(QLoRA),它将自注意力层进行 4 位量化和低秩分解。
具体来说,权重矩阵被分解为两个较小的矩阵 A 和 B,并由秩参数 r 控制其维度。
在对所有模型进行的实验中,尝试了 r = 4, 8, 32 和 64 四种配置。
最终根据 Hu 等人(2022)的结果,经验性调参表明 r = 64 在压缩率与准确性之间达到了最佳平衡。
此外,我们使用 4-bit NF4 精度,余弦学习率调度器(初始学习率 2e-4,warmup 比例为 0.03),以及带有权重衰减(0.001)和最大梯度范数(0.3)的 32 位 paged AdamW 优化器。
为缓解过拟合,引入了 0.1 的 dropout 比例,并使用 **梯度检查点(gradient checkpointing)**以提高显存利用效率。
这种阶段式的知识转移策略使得 ANON 能够在显著降低计算开销的同时保持较高的准确性,从而非常适合应用于实际的危机监测场景。
4 Results
我们在 (Saxena 等人,2024) 提出的基准数据集上评估了 ANON 的表现,采用的评估指标包括准确率(Accuracy)、F1 分数、敏感性(Sensitivity)和特异性(Specificity)(见表2)。我们的实验比较了教师模型、标准学生模型、基于知识蒸馏(KD)的方法训练的学生模型,以及 ANON 训练的学生模型。
在某些情况下,ANON 的表现优于标准的 KD 方法,甚至超过了教师模型。例如,LLaMA-2 7B ANON 模型的准确率达到了 74.22%,超过了其教师模型(71.19%)和基于 KD 的学生模型(74.06%),显示出更强的泛化能力(Furlanello 等人,2018)。
尽管 OPT 模型的参数量减少了 10 倍,GPT-2 模型的参数减少了 91.7%,ANON 在效率大幅提升的同时,仍保持了与传统 KD 方法相当甚至更优的性能。由于数据集存在类别不平衡,模型的敏感性普遍高于特异性,这凸显了引入偏差缓解策略的重要性。
我们还验证了 ANON 在资源消耗方面的表现。表3中的结果显示,为每个学生模型引入适配器模块(adapter modules)后,计算资源需求显著下降。例如,在 LLaMA-2 7B ANON 模型中,从标准 KD 方法转为 ANON 后,内存需求从约 84GB 降至 4GB,减少了 95.24%。这一结果展示了 ANON 在显著降低内存需求的同时,仍能保持可比的性能(参见表2与表3)。
此外,ANON 还将 LLaMA 系列模型中可训练参数数量减少了 99.43%。在 OPT 和 GPT-2 模型系列中,也观察到了类似的效率提升,这进一步证明了 ANON 框架对于不同模型规模和架构的良好适应性。
综上所述,ANON 框架在不牺牲模型性能的前提下,实现了显著的计算资源节省。
Conclusion
在本研究中,我们提出了 ANON——一种用于定制语言模型(TLMs)的自适应知识蒸馏方法。ANON 针对在特定应用场景中训练和部署大型语言模型(LLMs)所面临的训练数据不足与计算资源受限等挑战,提供了解决方案。该方法通过引入适配器(adapters)与知识蒸馏策略,在保持高性能的同时显著提升参数效率,使其在特定领域的应用中表现出色。
ANON 能够有效处理大规模语料库,支持多语言数据处理,而无需承担针对下游任务微调大型模型所需的高昂成本。此外,该方法还解决了在处理高参数量模型时面临的透明性、可解释性以及准确性保持等关键问题。
为验证我们的方法,我们在危机信号任务上使用 QLoRA 适配器对三种不同语言模型家族的教师模型进行了蒸馏实验。实验结果表明,ANON 在准确性和资源消耗方面表现优异,尤其适用于实际的危机信号监测场景。它不仅达到了与教师模型相当甚至更高的性能,同时在某些情况下内存使用量最多降低了 95.24%,可训练参数减少了 99.43%。
我们的框架不仅推动了 LLM 在危机管理领域的落地应用,也为未来在其他领域的相关研究提供了坚实基础。
相关文章:
精简大语言模型:用于定制语言模型的自适应知识蒸馏
Streamlining LLMs: Adaptive Knowledge Distillation for Tailored Language Models 发表:NAACL 2025 机构:德国人工智能研究中心 Abstract 诸如 GPT-4 和 LLaMA-3 等大型语言模型(LLMs)在多个行业展现出变革性的潜力…...
Rollup入门与进阶:为现代Web应用构建超小的打包文件
我们常常面临Webpack复杂配置或是Babel转译后的冗余代码,结果导致最终的包体积居高不下加载速度也变得异常缓慢,而在众多打包工具中Rollup作为一个轻量且高效的选择,正悄然改变着这一切,本文将带你深入了解这个令人惊艳的打包工具…...
博客系统技术需求文档(基于 Flask)
以下内容是AI基于要求生成的技术文档,仅供参考~ 🧱 一、系统架构设计概览 层级 内容 前端层 HTML Jinja2 模板引擎,集成 Markdown 编辑器、代码高亮 后端层 Flask 框架,RESTful 风格,Jinja2 渲染 数据库 SQLi…...
快速排序、归并排序、计数排序
文章目录 前言一、归并排序算法逻辑递归实现非递归实现 二、快速排序算法介绍递归实现非递归实现算法的一种优化—三路划分法 四、计数排序算法原理代码实现优劣分析 五、排序算法的性能比较总结 前言 本文介绍这三种非常强大的排序算法,每种算法都有各自的特点、不…...
python语言与地理处理note 2025/05/11
1. 函数定义必须要在调用之前 (1)正确示例: def test():print("what a wonderful world!")test() (2)错误示例: test() def test():print("what a wonderful world!") 会报错&…...
贪心算法:最小生成树
假设无向图为: A-B:1 A-C:3 B-C:1 B-D:4 C-D:1 C-E:5 D-E:6 一、使用Prim算法: public class Prim {//声明了两个静态常量,用于辅助 Prim 算法的实现private static final int V 5;//点数private static final int INF Integer.MA…...
免费 OCR 识别 + 批量处理!PDF 工具 提升办公效率
各位办公小能手们!今天给你们介绍一款超厉害的软件——PDF工具V2.2!我跟你们说,这玩意儿就像是PDF界的超级英雄,专门搞定PDF文件的编辑、转换、压缩这些事儿。 先说说它的核心功能哈。基础文档管理方面,它能把好几个PD…...
尼康VR镜头防抖模式NORMAL和ACTIVE的区别(私人笔记)
1. NORMAL 模式(常规模式) 适用场景:一般手持拍摄,比如人像、静物、风景或缓慢平移镜头(如水平追拍)等。工作特性: 补偿手抖引起的小幅度震动(比如手持时自然的不稳)&am…...
在scala中sparkSQL读入csv文件
以下是 Scala 中使用 Spark SQL 读取 CSV 文件的核心步骤和代码示例(纯文本): 1. 创建 SparkSession scala import org.apache.spark.sql.SparkSession val spark SparkSession.builder() .appName("Spark SQL Read CSV") …...
swift flask python ipad当电脑键盘 实现osu x键和z键 长按逻辑有问题 quart 11毫秒
键盘不行我5星都打不过,磁轴不在身边 127.0.0.1不行要用192.168哪个地址 from flask import Flask from pynput.keyboard import Controller from threading import Threadapp Flask(__name__) keyboard Controller()# 按下按键 app.route("/press_down/<…...
浅论3DGS溅射模型在VR眼镜上的应用
摆烂仙君小课堂开课了,本期将介绍如何手搓VR眼镜,并将随手拍的电影变成3D视频。 一、3DGS模型介绍 3D 高斯模型是基于高斯函数构建的用于描述三维空间中数据分布概率的模型,高斯函数在数学和物理领域有着广泛应用,其在 3D 情境下…...
React状态管理-对state进行保留和重置
相同位置的相同组件会使得 state 被保留下来 当你勾选或清空复选框的时候,计数器 state 并没有被重置。不管 isFancy 是 true 还是 false,根组件 App 返回的 div 的第一个子组件都是 <Counter />: 你可能以为当你勾选复选框的时候 st…...
嵌入式STM32学习——外部中断EXTI与NVIC的基础练习⭐
按键控制LED灯 按键控制LED的开发流程: 第一步:使能功能复用时钟 第二布,配置复用寄存器 第三步,配置中断屏蔽寄存器 固件库按键控制LED灯 外部中断EXTI结构体:typedef struct{uint32_t EXTI_Line; …...
git merge和git rebase
git merge和git rebase 在Git中merge和rebase都是git在管理整合分支的两种主要工具,但是他们的工作方式、提交历史影响和使用场景不同。 git merge 定义 将两个分支的提交历史合并,创建一个新的合并提交(merge commit)ÿ…...
我的MCP相关配置记录
1.VSCode的Cline中的MCP {"mcpServers": {"github.com/modelcontextprotocol/servers/tree/main/src/github": {"autoApprove": [],"disabled": false,"timeout": 60,"command": "cmd","args&quo…...
浅聊一下数据库的索引优化
背景 这里的索引说的是关系数据库(MSSQL)中的索引。 本篇不是纯技术性的内容,只是聊一次性能调优的经历,包含到一些粗浅的实现和验证手段,所以,大神忽略即可。 额…对了,笔者对数据库的优化手段…...
如何创建maven项目
1.IDEA 中创建 Maven 项目 步骤一:点击 File -> New -> Project,在弹出的窗口左侧选择 Maven,点击 Next: 步骤二:填写项目的 GroupId、ArtifactId、Version 等信息(这些对应 pom.xml 中的关键配置&am…...
LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
一、引言 在自然语言处理领域,大规模预训练语言模型(LLMs)展现出强大的语言理解和生成能力。然而,将这些模型适配到多个下游任务时,传统微调方法面临诸多挑战。LoRA(Low-Rank Adaptation of Large Language Models)作为一种创新的微调技术,旨在解决这些问题,为大语言…...
Conda在powershell终端中无法使用conda activate命令
主要有以下原因: Windows PowerShell安全策略:默认情况下,PowerShell的执行策略设置为"Restricted",这会阻止运行脚本,包括conda的初始化脚本。调用方式不同:在PowerShell中,需要使用…...
MySQL索引底层数据结构与算法
1、索引的数据结构 1.1、二叉树 1.2、红黑树(二叉平衡树) 1.3、hash表 对key进行一次hash计算就可以定位出数据存储的位置 问题:hash冲突问题、仅满足和in的查找,不支持范围查找 1.4、B-tree 1.5、B tree 非叶子节点不存储data&…...
GOOSE 控制块参数gocbRef及goID有大小写要求
在 IEC 61850 标准中,GOOSE 控制块参数gocbRef和goID的大小写是严格区分的。这一结论基于以下多维度分析: 一、标准协议与配置文件的强制性 XML 语法的刚性约束 GOOSE 控制块的配置信息通过 SCL(Substation Configuration Languageÿ…...
重庆医科大学附属第二医院外科楼外挡墙自动化监测
1.项目概述 重庆医科大学附属第二医院,重医附二院,是集医疗、教学、科研、预防保健为一体的国家三级甲等综合医院。前身为始建于1892年的“重庆宽仁医院”。医院现有开放床位 1380张,年门诊量超过百万人次,年收治住院病人4.5万人…...
3.4 数字特征
本章系统讲解随机变量的数字特征理论,涵盖期望、方差、协方差与相关系数的核心计算与性质。以下从四个核心考点系统梳理知识体系: 考点一:期望(数学期望) 1. 离散型随机变量的数学期望 一维情形: E ( X …...
servlet-api
本次内容总结 1、再次学习Servlet的初始化方法 2、学习Servlet中的ServletContext和<context-param> 3、什么是业务层 4、IOC 5、过滤器 7、TransActionManager、ThreadLocal、OpenSessionInViewFilter 1、再次学习Servlet的初始化方法 1)Servlet生命周期&…...
NLTK进行文本分类和词性标注
《python ⾃然语⾔处理实战》学习笔记 NLTK 下载依赖 !pip install nltkimport nltk nltk.download(punkt_tab)分词(tokenize) from nltk.tokenize import word_tokenize from nltk.text import Textinput_str """Twinkle, twinkle, little star, How I won…...
电机控制储备知识学习(一) 电机驱动的本质分析以及与磁相关的使用场景
目录 电机控制储备知识学习(一)一、电机驱动的本质分析以及与磁相关的使用场景1)电机为什么能够旋转2)电磁原理的学习重要性 二、电磁学理论知识1)磁场基础知识2)反电动势的公式推导 附学习参考网址欢迎大家…...
华三路由器单臂路由配置
目录 1.实验目的1.1 掌握华三路由器单臂路由配置方法2.1 路由器连接交换机,交换机划分多个 VLAN,不同 VLAN 的 PC 通过路由器实现通信 配置步骤与命令解析1.配置交换机2.配置路由器验证配置3.1 配置交换机 VLAN3.1.1 创建 VLAN3.1.2 配置端口所属 VLAN3.…...
一键转换上百文件 Word 批量转 PDF 软件批量工具
各位办公族们,你们有没有被手动把Word一个个转成PDF给折腾得欲哭无泪过啊?我之前就因为这事忙得晕头转向,眼睛都快看瞎了!不过呢,后来我发现了专门为咱提升办公效率设计的Word批量转PDF软件,那简直就是办公…...
矫平机:工业精密矫正的全维度解析
作为现代制造业的核心设备之一,矫平机通过消除材料残余应力、提升平整度,持续推动着汽车、航空航天、新能源等领域的质量升级。本文基于最新行业动态与技术突破,从原理革新到智能化实践展开深度解析。 一、核心原理:力学与智能的深…...
网络安全-等级保护(等保) 2-3 GB/T 22240—2020《信息安全技术 网络安全等级保护定级指南》-2020-04-28发布【现行】
################################################################################ 在开始等级保护安全建设前,第一步需要知道要保护的是什么,要保护到什么程度,所以在开始等级保护中介绍的第一个标准是《定级指南》,其中明确了…...
GNSS数据自动化下载系统的设计与实现
摘要 本文详细介绍了三种不同设计的GNSS数据自动化下载系统,分别针对IGS观测数据、GRACE-FO Level-1B数据以及通过代理服务器获取数据的需求场景。系统采用Python实现,具备断点续传、完整性校验、异常处理和进度显示等核心功能。实验结果表明࿰…...
c语言第一个小游戏:贪吃蛇小游戏06
实现贪吃蛇四方向的风骚走位 实现代码 #include <curses.h> #include <stdlib.h> struct snake{ int hang; int lie; struct snake *next; }; struct snake *head; struct snake *tail; int key; int dir; //全局变量 #define UP 1 //这个是宏定义&a…...
人工智能_大模型数据标注主要做什么_拉框_人工智能训练师_数据标准师介绍---人工智能工作笔记0244
随着大模型的快速发展,数据标注迅速成为比较热门的工作,那么 数据标注,具体干什么呢? 因为现在人工智能在某个领域如果理解,或者识别的越精准,那么 就需要越高质量的数据, 就是因为,模型的训练,大多还是有监督深度学习.给他足够高质量的数据才行有好的效果. 可以看到在AI领…...
工业4G路由器IR5000公交站台物联网应用解决方案
随着城市化进程的加速,公共交通是智慧城市的重要枢纽。城市公共交通由无数的公交站台作作为节点组合而成,其智能化升级成为提升城市出行效率与服务质量的关键。传统公交站台信息发布滞后、缺乏实时性,难以满足乘客对公交信息快速获取的需求&a…...
文件操作: File 类的用法和 InputStream, OutputStream 的用法
目录 1. File 概述 1.1 File的属性 1.2 File的构造方法 1.3 File的方法 2. 文件的基本操作 2.1 InputStream 2.2 OutputStream 2.3.字符流读取(Reader) 2.4 字符流写(Writer) 1. File 概述 Java 中通过 java.io.File 类来对⼀个文件…...
SQL 中 INSTR 函数简介及 截取地址应用
一、基本语法与参数解析 语法: INSTR(string1, string2 [, start_position [, nth_occurrence]]) 参数说明: a.string1:源字符串(必选)。 b.string2:需查找的子字符串&am…...
Oracle SYSTEM/UNDO表空间损坏的处理思路
Oracle SYSTEM/UNDO表空间损坏是比较棘手的故障,通常会导致数据库异常宕机进而无法打开数据库。数据库的打开故障处理起来相对比较麻烦,读者可以参考本书第5章进一步了解该类故障的处理过程。如果数据库没有备份,通常需要设置官方不推荐的隐含…...
【HarmonyOs鸿蒙】七种传参方式
一、页面间导航传参 使用场景:页面跳转时传递参数 实现方式:通过router模块的push方法传递参数 // 页面A传参 import router from ohos.router;router.pushUrl({url: pages/PageB,params: { id: 123, name: HarmonyOS } });// 页面B接收参数 Entry Co…...
微信小程序 密码框改为text后不可见,需要点击一下
这个问题是做项目的时候碰到的。 密码框常规写法: <view class"inputBox"><view class"input-container"><input type"{{inputType}}" placeholder"请输入密码" data-id"passwordValue" bindin…...
Gatsby知识框架
一、Gatsby 基础概念 1. 核心特性 基于React的静态站点生成器:使用React构建,输出静态HTML/CSS/JS GraphQL数据层:统一的数据查询接口 丰富的插件系统:超过2000个官方和社区插件 高性能优化:自动代码分割、预加载、…...
TCP协议十大核心特性深度解析:构建可靠传输的基石
TCP(传输控制协议)作为互联网的"交通指挥官",承载着全球80%以上的网络流量。本文将深入解析TCP协议的十大核心特性,通过原理剖析、流程图解和实战案例,揭示其如何实现高效可靠的数据传输。 一、面向连接的可…...
【架构】RUP统一软件过程:企业级软件开发的全面指南
一、RUP概述 RUP(Rational Unified Process,统一软件过程)是由Rational Software公司(后被IBM收购)开发的一种迭代式软件开发过程框架。它结合了传统瀑布模型的系统性和敏捷方法的灵活性,为中大型软件项目提供了全面的开发方法论。 RUP不仅仅是一种过程…...
基于智能家居项目 实现DHT11驱动源代码
DHT11 温湿度传感器的数据读取一般分为 四个步骤,下面详细介绍每个步骤的具体内容: 步骤一:主机发送起始信号 主机(如 MCU)主动向 DHT11 发送开始信号,方式为: 将数据线拉低 至少 18ms&…...
小程序的内置组件
一、Text文本组件 1.Text组件解析 Text组件用于显示文本, 类似于span标签, 是行内元素 user-select属性决定文本内容是否可以让用户选中 space有三个取值(了解) decode是否解码(了解) decode可以解析的有 < > & '    二、Butto…...
T-BOX硬件方案深度解析:STM32与SD NAND Flash存储的完美搭配
在智能网联汽车快速发展的当下,车载 T-BOX(Telematics Box)作为车辆与云端互联的核心枢纽,其性能和可靠性直接决定了用户体验的上限。米客方德(MK)推出的基于 STM32H7RX 主控芯片与 MKDV4GIL-AST࿰…...
hadoop3.x单机部署
jdk hadoop3.x需要jdk8以上的版本 hadoop3.x 从官网下载对应的tar.gz文件 配置环境变量 vim /etc/profile# 需要替换为自己的安装地址!!! export JAVA_HOME/usr/lib/jvm/java-1.8.0-openjdk-amd64 export PATH$PATH:$JAVA_HOME/bin expo…...
Hadoop的目录结构和组成
Hadoop 目录结构 bin 目录:包含了 Hadoop 的各种命令行工具,如hadoop、hdfs等,用于启动和管理 Hadoop 集群,以及执行各种数据处理任务。etc 目录:存放 Hadoop 的配置文件,包括core-site.xml、hdfs-site.xm…...
深度剖析 RTX 4090 GPU 算力租赁:从技术优势到生态价值的全维度解析
一、引言:当算力成为数字经济的 "新石油" 在 AI 大模型训练成本突破千万美元大关、元宇宙场景渲染需求呈指数级增长的 2025 年,算力已然成为驱动技术创新的核心生产要素。NVIDIA RTX 4090 显卡作为消费级 GPU 的性能天花板,正通…...
基于MATLAB的生物量数据拟合模型研究
一、研究背景 在现代科学研究与工程实践的广泛领域中,数据拟合扮演着举足轻重的角色。从物理学中对复杂物理现象的建模,到生物学里对生物生长规律的探究,数据拟合已成为揭示数据内在规律、构建有效数学模型的关键技术手段。其核心要义在于&am…...
VSCode设置SSH免密登录
引言 2025年05月13日20:21:14 原来一直用的PyCharn来完成代码在远程服务器上的运行,但是PyCharm时不时同步代码会有问题。因此,尝试用VSCode来完成代码SSH远程运行。由于VSCode每次进行SSH连接的时候都要手动输入密码,为了解决这个问题在本…...