当前位置: 首页 > news >正文

LLM面试题七

NLP算法工程师面试题8道|含解析

  1. 分类场景下bert和gpt+prompt的方式哪种会有更好效果,为什么?

    在分类场景下,BERT比GPT更适合用于建模,因为BERT的结构中包含了双向的Transformer编码器,而GPT的结构中只包含单向的Transformer解码器。这使得BERT能够更好地捕捉文本中的双向上下文信息,从而在文本分类任务中表现更好。而GPT+prompt的方式则可以通过在输入文本前加入一些提示语来指导模型学习特定任务的表示,从而提高模型的泛化性能。

  1. 如何解决prompt泛化性使用多个不同的prompt,从而增加模型学习的样本多样性。

    通过在prompt中添加随机噪声或变换,来增加数据集的丰富性,从而提高模型的泛化性能。采用迁移学习或元学习等方法,从先前学习的任务中提取知识,并将其应用于新的任务中。

  1. 对COT(Chain-of-Thought Prompt)和Instruction Tuning的理解
  • COT Prompt是一种用于自然语言生成的提示机制,它可以通过将一个文本片段(例如一段文章或一个问题)分解为一系列相关的语义单元,从而帮助自然语言生成模型更准确地理解文本的意义。这些语义单元可以按照它们的层次结构(例如句子、段落或章节)进行组织,并且可以用于为模型提供关于生成文本的结构和内容的提示。
  • Instruction Tuning是一种用于调整自然语言生成模型的参数的技术,它可以通过向模型提供来自人类编辑或专家的指令来指导模型的生成过程。这些指令可以涵盖各种不同的方面,例如语法、风格,结构和内容等。通过使用Instruction Tuning,可以在不改变模型架构的情况下对其进行微调,从而使其更好地满足特定的生成需求。
  1. 关于bet的后续改进工作,分别改进了哪些地方?

    BERT的后续改进工作主要包括以下方面:基于BERT的预训练模型的改进,例如RoBERTa、ALBERT等。通过调整BERT的架构和超参数来进一步优化模型性能,例如Electra、DeBERTa等。改进BERT在特定任务上的应用方法,例如ERNIE、MT-DNN等。

  1. 对知识蒸馏知道多少,有哪些改进用到了?

    知识蒸馏是一种通过将一个复杂模型的知识转移到一个简单模型来提高简单模型性能的方法。这种方法已经被广泛应用于各种深度学习任务中。其中一些改进包括:使用不同类型的损失函数和温度参数来获得更好的知识蒸馏效果。引入额外的信息来提高蒸馏的效果,例如将相似性约束添加到模型训练中。将蒸馏方法与其他技术结合使用,例如使用多任务学习和迁移学习来进一步改进知识蒸馏的效果。

  1. attention计算复杂度以及如何改进。

    在标准的Transformer中,attention计算的时间复杂度为O(N^2),其中N是输入序列的长度。为了降低计算复杂度,可以采用以下几种方法:使用自注意力机制,减少计算复杂度。自注意力机制不需要计算输入序列之间的交叉关系,而是计算每个输入向量与自身之间的关系,从而减少计算量。使用局部注意力机制,只计算输入序列中与当前位置相关的子序列的交互,从而降低计算复杂度。采用基于近似的方法,例如使用随机化和采样等方法来近似计算,从而降低计算复杂度。使用压缩注意力机制,通过将输入向量映射到低维空间来减少计算量,例如使用哈希注意力机制和低秩注意力机制等。

  1. 谈一下对模型量化的了解。

    模型量化是一种将浮点型参数转换为定点型参数的技术,以减少模型的存储和计算复杂度。常见的模型量化方法包括:量化权重和激活值,将它们转换为整数或小数。使用更小的数据类型,例如8位整数、16位浮点数等。使用压缩算法,例如Huffman编码、可逆压缩算法等。模型量化可以减少模型的存储空间和内存占用,同时也可以加速模型的推理速度。但是,模型量化可能会对模型的精度造成一定的影响,因此需要仔细权衡精度和计算效率之间的平衡。

  1. topk数组取值,尽可能多的方法。

    对于一个长度为N的数组,获取其中前K个最大或最小值的方法有很多种,其中些常见的方法包括:

  • 直接排序,将整个数组排序,然后取前K个或后K个元素。使用堆,维护一个大小为K的最大或最小堆,然后遍历数组并将元素插入到堆中,最后取出堆中的元素。
  • 分治算法,将数组分成多个小的部分,然后对每个部分分别计算前K个或后K个元素,最后将结果合并。
  • 快速选择算法,类似于快速排序,通过每次选择一个基准值来将数组分成两部分,然后根据基准值所在的位置递归地对其中一部分进行处理。使用快排变种算法,例如三向切分快排,通过将数组分成小于、等于和大于基准值的三部分来减少递归次数。
  • 桶排序,对于已知取值范围的数组,可以使用桶排序来计算前K个或后K个元素。
  • 部分排序算法,例如选择排序和插入排序,可以只对数组的一部分进行排序,从而减少计算量。
  • 分层采样算法,将数组分成多个层次,每个层次采样一定比例的元素,然后通过分层采样的结果来估计整个数组的前K个或后K个元素。

    对于长度较大的数组,使用基于排序的方法可能会非常慢,而使用堆和快速选择算法则可以在较短的时间内获得结果。

NLP算法工程师面试题

  1. 可以解释一下熵吗,它的公式怎么算的?

    熵可以用来描述信息的不确定性或信息的随机程度。嫡的公式为:H=-Σ(p*log§其中,H表示熵,P表示每种可能事件发生的概率,IOg表示以2为底的对数。

  1. BERT的base版本的原始模型,训练的时候,第一个epoch模型的判定结果很可能是错的,这个时候熵还可信吗?

    在训练BERT模型时,通常需要多个epoch来达到最佳性能。在初始训练过程中,模型的判定结果可能不是非常准确,因此第一个epoch的结果可能会存在误差。但即使在初始阶段,BERT模型的熵仍然是可信的。熵是衡量信息的不确定性的量,可以用来衡量模型的预测结果的置信度。在第一个epoch,BERT模型的熵也可以帮助我们评估模型的性能和预测结果的置信度。当熵较低时,表示模型对于给定的输入文本的预测结果比较确定:当熵较高时,则表示模型对于该输入文本的预测结果不确定。因此,即使在第一个epoch,熵仍然是一种可信的评估模型性能的指标。

  1. 交叉熵和KL散度有什么关系?

    交叉熵和KL(Kullback-Leibler)散度都是用于度量两个概率分布之间的差异性的指标,它们有一些相似之处,但也有不同之处。

  • 相同处:都不具备对称性;都是非负的
  • 区别:KL散度是交叉熵与熵的差。
  1. BERT的缺点?可以从预训练方法角度解答。
  • 训练时间长:BERT模型需要巨大的计算资源和时间来进行预训练,尤其是在较大的语料库上进行训练时。这使得BET对于小规模数据集的任务可能不是很适合。
  • 处理长文本困难:BERT对于长文本的处理存在困难,因为输入文本长度有限制,而且BERT的self-attention机制需要计算所有输入词的相互交互,这样的计算开销也很大。
  1. RoBERTa相比BERT有哪些改进?
  • 预训练数据更多:RoBERTa使用了更多的训练数据,并且在预训练中采用了更多的数据增强技术,这使得RoBERTa在多个自然语言处理任务上的表现优于BERT。
  • 去掉了NSP任务:RoBERTa将原本下一句预测任务去掉了,只保留遮蔽语言模型任务,这使得RoBERTa能够更好地处理单个句子的表示。
  • 动态掩码:RoBERTa使用了一种动态遮蔽策略,通过在每次训练迭代中随机选择遮蔽哪些词语来增加模型的鲁棒性。
  1. BERT的输入有哪几种Embedding?
  • Token Embedding:将每个输入词转化为其对应的NordPiece嵌入向量。
  • Segment Embedding:对于一组输入文本,将其分为两个部分,并为每个部分分别分配一个segment ID,以区分不同的输入文本。
  • Position Embedding:为了捕捉输入词的相对位置,BERT使用了位置嵌入向量,对于不同的位置位置,使用不同的嵌入向量表示。
  1. 你有了解其他模型去尝试解决长度限制的方案吗?

    Bert模型的长度限制问题主要是由于Transformer结构中的自注意力机制(self.attention mechanism)和位置嵌入(position embeddings)所导致的。这些机制使得Bert对于较长的序列处理非常耗时,并且占用大量的内存,从而限制了Bt在处理长序列任务上的性能。为了解决这个问题,一些研究人员提出了一些改进型的模型,包括:

  • Longformer:Longformer是一个基于Transformer结构的模型,它使用了一种新的自注意力机制,称为"Sliding Window Attention’",该机制可以在处理长序列时缓解Bert模型的计算和存储成本。
  • Reformer:Reformer是一个基于哈希注意力(Hashing Attention)的Transformer模型,该模型可以有效地处理长序列,并且在一些NLP任务上表现良好。
  • Performer:Performer是一种基于FFT(Fast Fourier Transform)Transformer模型,该模型可以处理长序列,并且在一些NLP任务表现良好。
  • Sparse Transformer:Sparse Transformer是一种使用稀疏注意力机制的Transformer模型,它可以减少Bert模型在处理长序列时的计算和存储成本。
  1. BERT是怎么缓解梯度消失的?
  • Layer Normalization(LN):在每个Transformer模块中,BERT使用LN来规范化每个词嵌入的向量值,使其具有相同的均值和方差。这有助于提高梯度的流动性,减少梯度消失的可能性。
  • Residual Connections:BERT使用残差连接将每个Transformer模块的输入和输出相加,以便梯度能够更容易地传播到较早的层。这也有助于缓解梯度消失问题。
  1. LN和BN的区别?

     Layer Normalization(LN):在神经网络中,LN是一种用于规范化输入向量的技术。LN基于每个输入的样本进行标准化,而不是使用整个批次的统计信息,这使得LN对于小批量输入数据也能提供相对稳定的标准化。另外,LN通常应用在RNN或Transformer等网络结构中的每个层上,而不是在整个网络中的一Batch Normalization(BN):BN是一种在神经网络中用于标准化输入向量的技术。与LN不同,BN使用整个批次的统计信息来标准化输入向量。BN通常应用在卷积层或全连接层上,以减少梯度消失问题并提高模型的鲁棒性。在训练过程中,BN会维护每个批次的均值和方差,用于标准化输入数据。在推理时,BN使用训练期间学习的统计信息进行标准化。

NLP算法工程师面试题

  1. 生成式模型与判别式模型的区别?
  • 生成式模型先对数据的联合分布进行建模,然后再通过贝叶斯公式计算样本属于各类别的后验概率。
  • 判别式模型直接进行条件概率建模,由数据直接学习决策函数或条件概率分布作为预测的模型。判别方法不关心背后的数据分布,关心的是对于给定的输入,应该预测什么样的输出。、
  • 用一句话总结就是生成模型估计的是联合概率分布,判别式模型估计的是条件概率分布。
  1. 模型的方差和偏差是指什么?
  • 偏差(Bias):表示模型的预测值和真实值之间的差异程度。用所有可能的训练数据集训练出的所有模型的输出的平均值与真实模型的输出值之间的差异。如果模型的偏差很高,说明模型无法捕捉到数据中的所有信息,因此模型的预测值和真实值之间的差异会很大。例如,在房屋预测的例子中,如果模型只考虑了房屋的面积这一个特征,那么模型的偏差就会很高,因为模型无法考虑到其他特征(比如卧室数量、浴室数量等)对房价的影响。
  • 方差(Variance):表示模型对于不同的训练集的预测结果分散程度。如果模型的方差很高,说明模型对于不同的训练集的预测结果差异很大,也就是说,模型无法捕捉到数据中的一般规律,而过度拟合了训练数据。例如,在房屋预测的例子中,如果我们使用非常复杂的模型(比如高阶多项式回归),那么模型的方差就会很高,因为模型过度拟合了训练数据,而无法捕捉到一般规律。
  1. 二分类模型的评估指标有哪些?

    在二分类模型中,我们通常将样本分为两类:正例和反例。在评估模型性能时,我们需要考虑以下四个指标:

  • 准确率(Accuracy):预测正确的样本占总样本数的比例。
  • 精确率(Precision):预测为正例的样本中,真正为正例的比例。
  • 召回率(Reca):真正为正例的样本中,被预测为正例的比例。
  • F1值:精确率和召回率的调和平均数,常用于综合评估模型性能。

    此外,我们还可以使用ROC曲线和AUC来评估模型的性能。ROC曲线是以假正率(False Positive Rate,FPR)为横坐标,真正率(True Positive Rate,TPR)为纵坐标绘制的曲线,用于衡量模型在不同阈值下的性能。AUC则是ROC曲线下的面积,用于综合评估模型的性能。AUC的取值范围为0.5到1,值越大,模型性能越好。

  1. AUC刻画的什么?说明了什么意思?

    AUC(Area Under the ROC Curve)是机器学习领域中常用的一个性能度量指标,用于衡量分类器对样本的分类能力。ROC(Receiver Operating Characteristic)曲线是以假正率(False Positive Rate,FPR)为横坐标,真正率(True Positive Rate,TPR)为纵坐标绘制的曲线,用于衡量模型在不同阈值下的性能。AUC则是ROC曲线下的面积,用于综合评估模型的性能。AUC的取值范围在0.5到1之间,值越大,分类器性能越好。具体来讲,AUC刻画了分类器对正负样本的分类能力,即对于一个随机的正负样本对,分类器给出正样本的预测值高于负样本的概率。AUC越高,说明分类器在区分正负样本时具有更好的能力。在实际场景中,例如医学诊断、金融风控等领域,AUC是评估分类器性能的重要指标之一。需要注意的是,AUC并不是一个完美的指标,因为它并不能告诉我们分类器在不同的阈值下的表现,而且对于类别不平衡的数据集,AUC可能会给出误导性的结果。因此,在实际应用中,我们需要综合考虑多个性能度量指标来评估分类器的性能。

  1. 交叉熵函数刻画的什么?

    交叉熵函数是机器学习中常用的一种损失函数。它常用于评估两个概率分布之间的差异,尤其是在神经网络中用于度量模型输出与真实标签之间的差距。交叉熵函数的基本思想是将模型的输出概率与真实标签的概率进行比较,通过计算两个概率分布之间的交叉熵(cross–entropy)来衡量它们的相似程度。在分类任务中,我们通常将标签表示为一个one-hot向量,即只有一个元素为1,其余元素都为0.

  1. 对于非常大的分类类别,对于softmax有哪些优化方法?

    当分类类别非常大时,计算softmax的复杂度会变得非常高,因为softmax的计算复杂度是与类别数成正比的。因此,需要采用一些优化方法来加速softmax的计算。

    一种常见的优化方法是基于交叉熵的方法,这包括hierarchical softmax和noise-contrastive estimation(NCE)。hierarchical softmax通过将所有的类别组织成一棵二叉树,并对每个节点定义一个概率值,从而将原问题转化为对一系列二分类问题的求解。这样就可以减少softmax计算的次数,从而提高运行速度。NCE是一种用于训练softmax模型的替代方法,它通过最大化正确标签和噪声标签之间的差异来训练模型。与传统的softmax方法不同,NCE不需要计算所有类别的概率,因此在类别数非常大时可以大大提高运行速度。

    另一种优化softmax的方法是采用近似softmax方法,例如采用采样的方法进行训练。这包括采样自适应重要性抽样(sampled softmax)、target sampling和sparsemax等。sampled softmax通过随机采样一小部分类别来近似计算softmax概率,从而减少计算量。target sampling是一种基于重要性采样的方法,它根据类别的频率对类别进行采样,从而减少少数类别的影响。sparsemax是一种类似于softmax的激活函数,但是它产生的分布更加稀疏,因此可以减少计算量。

    总之,当我们需要处理非常大的分类问题时,需要采用一些优化方法来加速softmax的计算,从而提高运行速度和效率。不同的优化方法有不同的适用场景,需要根据具体情况进行选择。

  1. softmax除了作为激活函数,在深度学习中还有哪些用途?

    除了作为激活函数,还可以使用softmax进行软归一化,而且在transformer中,softmax在注意力机制中计算注意力,主要是软最大化。在这里插入图片描述

相关文章:

LLM面试题七

NLP算法工程师面试题8道|含解析 分类场景下bert和gptprompt的方式哪种会有更好效果,为什么? 在分类场景下,BERT比GPT更适合用于建模,因为BERT的结构中包含了双向的Transformer编码器,而GPT的结构中只包含单向的Transf…...

Semaphore

关于作者: CSDN内容合伙人、技术专家, 从零开始做日活千万级APP,带领团队单日营收超千万。 专注于分享各领域原创系列文章 ,擅长java后端、移动开发、商业化变现、人工智能等,希望大家多多支持。 目录 一、导读二、概览…...

视频插帧EMAVFI:extracting motion and appearance via inter-frame attention for video

文章目录 EMAVFI:extracting motion and appearance via inter-frame attention for efficient video frame interpolation1.核心概述2.帧间注意力机制为什么可以表示运动信息3.网络架构4.dataset类5.demo推理和训练代码6.总结 EMAVFI:extracting motion and appearance via in…...

⑨数据中心-M-LAG技术配置

华三数据中心网络是指华三提供的专门设计用于数据中心环境的网络解决方案。这种网络通常具有高性能、可扩展性和可靠性,旨在支持大规模数据中心的需求。华三数据中心网络解决方案通常包括以下特点: 1. 高带宽:支持高密度数据中心环境中大量网…...

永磁同步电机无速度算法--基于HOPLL的滑模观测器

一、原理介绍 传统PLL算法为二阶系统,其实现是基于转速变化变化缓慢的假设,因此在转速频繁出现动态变化时会导致动态性能不佳。为改善系统动态性能,将转速微分量引入PLL中,作为附加状态变量,与电角速度及转速共同构成…...

【Linux网络】网络套接字socket

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343 🔥 系列专栏:https://blog.csdn.net/qinjh_/category_12891150.html 目录 Socket 编程预备 理解源 IP 地址和目的 IP 地址 认识端口号 端口号范围划分…...

ubuntu wifi配置(命令行版本)

1、查询当前设备环境的wifi列表 nmcli dev wifi list2、连接wifi nmcli dev wifi connect "MiFi-SSID" password "Password" #其中MiFi-SSID是wifi的密码,Password是wifi的密码3、查看连接情况 nmcli dev status...

配环境的经验

pip install -e . 该命令用于以“编辑模式”(也称为开发模式)安装当前目录下的 Python 包,比如包含有 setup.py、setup.cfg 或 pyproject.toml 文件的项目-e 是 --editable 的简写。以编辑模式安装时,pip 会在你的 Python 环境中创…...

STM32cubmax配置STM32407VET6,实现网络通信

文章目录 一、开发准备1、硬件准备2、软件准备 二、STM32CubeMX工程配置步骤1、创建新工程 三、外设配置步骤1)调试接口(SWD)配置2)时钟配置3)串口(USART)配置4)IO口配置&#xff08…...

LeetCode 热题 100_完全平方数(84_279_中等_C++)(动态规划(完全背包))

LeetCode 热题 100_完全平方数(84_279) 题目描述:输入输出样例:题解:解题思路:思路一(动态规划(完全背包)): 代码实现代码实现(思路一…...

【C++】vector的底层封装和实现

目录 目录前言基本框架迭代器容量第一个测试,野指针异常第二轮测试,浅拷贝的问题 元素访问修改操作push_backinsert迭代器失效问题 erase 默认成员函数构造函数双重构造引发调用歧义 拷贝构造赋值重载析构函数 源码end 目录 前言 废话不多说&#xff0…...

AI前端组件库Ant DesIgn X

Ant Design X AI:体验新秩序 Ant Design 团队精心打造 RICH 设计范式,为 AI 界面提供卓越解决方案,引领智能交互新体验。 设计语言与理论 官网: Ant Design X - 轻松打造 AI 驱动的界面。 AI 设计范式 —— RICH 是我们在蚂蚁…...

BGP路由协议之解决 IBGP 水平分割带来的问题

主要有以下 3 种方案: 全互联 :配置量大、耗费资源联邦: 配置量大、邻居会重建、中断时间较长RR 路由反射器:目前主流使用、简单、好用 联邦 IBGP 水平分割问题用与防止 AS 内部产生环路,在很大程度上杜绝了 IBGP 路…...

基于Java的人脸识别在线考试系统(jsp+springboot+mysql8.x)

基于Java的人脸识别在线考试系统(jspspringbootmysql8.x) 在线考试系统提供全面的考试管理和用户管理功能。登录界面支持管理员、教师和学生三种身份验证,确保不同用户访问相应的功能模块。系统自动组卷功能允许管理员根据不同科目和题型,如单选题、多选…...

如何对LLM大型语言模型进行评估与基准测试

基础概念 这几年,随着生成式 AI 和大型语言模型(LLMs)的兴起,AI 领域整体迎来了一波大爆发。 随着各种基于 LLM 的应用程序在企业里落地,人们开始需要评估不同推理部署方案的性价比。 LLM 应用的部署成本,…...

C语言内存函数和数据在内存的存储

一、内存操作函数深度解析 函数名原型核心特性典型应用场景注意事项memcpyvoid* memcpy(void* dest, const void* src, size_t num)内存块无重叠复制,性能高数组拷贝、结构体复制1. 必须确保目标空间足够 2. 不支持重叠内存(用memmove替代) …...

ChatGPT之智能驾驶问题讨论

ChatGPT之智能驾驶问题讨论 1. 源由2. 问题:2.1 智能驾驶级别定义🚗 L2(部分自动化,Partial Automation)🤖 L3(有条件自动化,Conditional Automation)🛸 L4&a…...

【PalladiumZ2 使用专栏 1 -- 波形 trigger 抓取详细介绍】

文章目录 Palladium Z2 OverviewPalladium 波形抓取Palladium 波形存放文件创建Palladium Trigger 断点设置Palladium 加探针并 dumpPalladium 波形查看 Palladium Z2 Overview Cadence Palladium Z2 是 Cadence 推出的企业级硬件仿真加速平台,旨在应对复杂 SoC 设…...

elasticsearch 8设置验证登录查询

最近总是困扰于9200网络勒索,老是在捣乱,动不动给我清理了index,实在是费劲,今天研究了下config配置,设置ca验证。 以下是完整的步骤和配置,确保生成的证书文件与elasticsearch.yml的配置一致: 1. 生成CA证书 运行以下命令生成CA证书:让输入账号或密码请直接回车。 …...

为什么使用了CDN源服务器需要关闭防火墙?

在网站运营过程中,不少站长会遇到这样的困惑:当使用 CDN 源服务器时,好像就得关闭源服务器的防火墙,不然就状况百出。这背后究竟是什么原因呢? 当你在浏览网页时,要是看到 “502 - 服务暂时不可用” 的提…...

Android 学习之 Navigation导航

1. Navigation 介绍 Navigation 组件 是 Android Jetpack 的一部分,用于简化应用内导航逻辑,支持 Fragment、Activity 和 Compose 之间的跳转。核心优势: 单 Activity 架构:减少 Activity 冗余,通过 Fragment 或 Com…...

初识 Three.js:开启你的 Web 3D 世界 ✨

3D 技术已经不再是游戏引擎的专属,随着浏览器技术的发展,我们完全可以在网页上实现令人惊艳的 3D 效果。而 Three.js,作为 WebGL 的封装库,让 Web 3D 的大门向更多开发者敞开了。 这是我开启这个 Three.js 专栏的第一篇文章&…...

PyTorch 笔记

简介与安装 PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由C实现,应用于人工智能领域,如计算机视觉和自然语言处理。 PyTorch 最初由 Meta Platforms 的人工智能研究团队开发,现在属 于Linux 基金会的…...

day24学习Pandas库

文章目录 三、Pandas库4.函数计算3遍历3.1.遍历Series对象3.2.遍历DataFrame对象 4排序4.1 sort_index4.2 sort_values 5.去重drop_duplicates6.先分组在计算6.1 groupby6.2 filter过滤 7.合并未完待续.. 三、Pandas库 4.函数计算 3遍历 3.1.遍历Series对象 在讲解Series部…...

AI日报 - 2025年4月8日

AI日报 - 2025年4月8日 🌟 今日概览(60秒速览) ▎🤖 模型进展 | Llama 4发布引爆讨论 (性能、应用、部署、训练争议),OpenAI保持高速迭代,香港大学推Dream 7B扩散模型。 Meta Llama 4 Scout & Maveric…...

Linux学习笔记(2) 命令基础:从概念到实践(期末,期中复习笔记全)

前言 一、认识命令行与命令 二、Linux 命令的基础格式 三、命令示例解析 (1)ls -l /home/itheima (2)cp -r test1 test2 四结语 前言 在 Linux 系统的世界里,命令行是与系统交互的重要方式。熟练掌握 Linux 命令…...

langgraph简单Demo4(checkpoint检查点)

在 langgraph 里,检查点(checkpoint)是一项重要的功能,它能够记录工作流在执行过程中的中间状态。当工作流因某些原因中断时,可以从检查点恢复继续执行,避免从头开始,提升效率。 示例&#xff…...

【题解】AtCoder AT_abc400_c 2^a b^2

题目大意 我们定义满足下面条件的整数 X X X 为“好整数”: 存在一个 正整数 对 ( a , b ) (a,b) (a,b) 使得 X 2 a ⋅ b 2 X2^a\cdot b^2 X2a⋅b2。 给定一个正整数 N N N( 1 ≤ N ≤ 1 0 18 1\le N\le 10^{18} 1≤N≤1018)&#xff…...

七种驱动器综合对比——《器件手册--驱动器》

目录 九、驱动器 概述 定义 功能 分类 1. 按负载类型分类 2. 按功能特性分类 工作原理 优势 应用领域 详尽阐述 1 隔离式栅极驱动器 定义 工作原理 应用场景 优势 2 变压器驱动器 定义 工作原理 应用场景 优势 设计注意事项 3 LED驱动 定义 功能与作用 应用场景 设计…...

GStreamer开发笔记(一):GStreamer介绍,在windows平台部署安装,打开usb摄像头对比测试

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://blog.csdn.net/qq21497936/article/details/147049923 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、O…...

西湖大学团队开源SaProt等多款蛋白质语言模型,覆盖结构功能预测/跨模态信息搜索/氨基酸序列设计等

2025 年 3 月 22—23 日,上海交通大学「AI 蛋白质设计峰会」正式举行。 本次峰会汇聚了来自清华大学、北京大学、复旦大学、浙江大学、厦门大学等知名高校的 300 多位专家学者,以及 200 余位行业领军企业代表和技术研发人员,深入探讨了 AI 在…...

ansible+docker+docker-compose快速部署4节点高可用minio集群

目录 github项目地址 示例服务器列表 安装前 修改变量文件group_vars/all.yml 修改ansible主机清单 修改setup.sh安装脚本 用法演示 安装后验证 github项目地址 https://github.com/sulibao/ansible_minio_cluster.git 示例服务器列表 安装前 修改变量文件group_var…...

说话人分离中的聚类方法:深入解析Agglomerative聚类、KMeans聚类和Oracle聚类

说话人分离(Speaker Diarization)是将音频流根据说话人身份划分为同质片段的过程。这一过程中的关键步骤是聚类,即将说话人嵌入(embeddings)分组为不同的簇,每个簇代表一个独特的说话人。在pyannote.audio管…...

蓝桥杯真题——前缀总分、遗迹

蓝桥杯2024年第十五届省赛真题-前缀总分 题目描述 给定 n 个由小写英文字母组成的字符串 s1, s2, , sn &#xff0c;定义前缀总分为V ∑i<j P(si, sj) &#xff0c;其中 P(si, sj) 表示 si, sj 的最长公共前缀的长度。 小蓝可以选择其中一个字符串&#xff0c;并修改其…...

性能比拼: MySQL vs PostgreSQL

本内容是对知名性能评测博主 Anton Putra MySQL vs PostgreSQL Performance Benchmark (Latency - Throughput - Saturation) 内容的翻译与整理, 有适当删减, 相关指标和结论以原作为准 MySQL vs PostgreSQL 数据库性能对比** 在本内容中&#xff0c;我们将对比 MySQL 和 Pos…...

TypeScript 中的 infer 关键字用途

infer 是 TypeScript 中的高级类型关键字&#xff0c;主要用于条件类型中推断类型。它允许我们在条件类型的 extends 子句中声明一个类型变量&#xff0c;然后在该条件类型的 true 分支中使用这个推断出的类型。 1. 基本语法 type SomeType<T> T extends infer U ? U…...

关于Spring MVC中@RequestParam注解的详细说明,用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格

以下是关于Spring MVC中RequestParam注解的详细说明&#xff0c;用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格&#xff1a; 1. 核心作用 RequestParam用于显式绑定HTTP请求参数到方法参数&#xff0c;支持以下场景&#xff1a; 参数名不一致&#xff1…...

Spring Boot中Spring MVC相关配置的详细描述及表格总结

以下是Spring Boot中Spring MVC相关配置的详细描述及表格总结&#xff1a; Spring MVC 配置项详解 1. 异步请求配置 spring.mvc.async.request-timeout 描述&#xff1a;设置异步请求的超时时间&#xff08;单位&#xff1a;毫秒&#xff09;。默认值&#xff1a;未设置&…...

Shell脚本编程之正则表达式

一、概念 在 Shell 脚本中&#xff0c;正则表达式是一种强大且常用的文本处理工具&#xff0c;它可以用来匹配、搜索、替换和截取字符串。 正则表达式是由一些字符去描述规则&#xff0c;在正则表达式中有两类字符 (1)元字符(Meta Character)&#xff1a;Shell 环境中具有特殊含…...

spring-ai-openai调用Xinference1.4.1报错

1、Xinference 报错logs 此处是调用 /v1/chat/completions 接口 2025-04-06 15:48:51 xinference | return await dependant.call(**values) 2025-04-06 15:48:51 xinference | File "/usr/local/lib/python3.10/dist-packages/xinference/api/restful_api.py", …...

XC7K160T-2FFG676I Kintex‑7系列 Xilinx 赛灵思 FPGA 详细技术规格

XC7K160T-1FFG676I XC7K160T-1FFG676C XC7K160T-2FFG676C 1. 基本概述 XC7K160T-2FFG676I 属于 Xilinx Kintex‑7 系列 FPGA&#xff0c;该系列芯片采用 28nm &#xff08;HKMG&#xff09;工艺制造&#xff0c;旨在提供高性能与低功耗的平衡。该芯片主要面向对高速数据处理、…...

C++学习之udp通信

1.UDP特点 c /* udp 传输层协议, 和tcp是一样的 特点: 面向无连接的, 不安全的, 报式传输协议 1. 无连接: udp通信的时候不需要connect 1). 通信不需要建立连接 2). 如果想给对方发送数据, 只需要指定对方的IP和端口 2. udp会丢包 1). 数…...

2020年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析

2020年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析 全国大学生数学建模竞赛(China Undergraduate Mathematical Contest in Modeling)是国家教委高教司和中国工业与应用数学学会共同主办的面向全国大学生的群众性科技活动,目的在于激励学生学习数学的积极性,提高学…...

【数据标准】数据标准化实施流程与方法-保障机制篇

导读&#xff1a;1、数据标准化保障机制&#xff08;组织架构、协作流程&#xff09;是​​战略落地的基石​​&#xff0c;确保责权分明与资源协同&#xff1b;2、数据标准化制度建设&#xff08;政策、标准、工具&#xff09;构建了​​统一治理框架​​&#xff0c;规范数据…...

ZLMediaKit部署与配置

ZLMediaKit编译 # 安装编译器 sudo apt install build-essential cmake# 其它依赖库 sudo apt-get install libssl-dev libsdl-dev libavcodec-dev libavutil-dev ffmpeg git cd /usr/local/srcgit clone --depth 1 https://gitee.com/xia-chu/ZLMediaKit.git cd ZLMediaKit# …...

38、web前端开发之Vue3保姆教程(二)

三、Vue3语法详解 1、组件 1 什么是组件? 组件是 Vue.js 中最重要的概念之一。它是一种可复用的 Vue 实例,允许我们将 UI 拆分为独立的、可复用的部分。组件可以提高代码的组织性和可维护性。 2 创建组件 在 Vue 3 中,组件通常使用单文件组件(SFC)编写,其包含三个主…...

知识中台如何重构企业信息生态?关键要素解析

在信息化快速发展的时代&#xff0c;企业面临着如何高效整合和管理知识资源的挑战。知识中台作为企业信息管理的核心工具&#xff0c;正在帮助企业提升运营效率和创新力。本文将探讨知识中台如何重构企业信息生态&#xff0c;并解析其关键要素。 一、什么是知识中台&#xff1f…...

蓝桥杯python组备赛(记录个人模板)

文章目录 栈队列堆递归装饰器并查集树状数组线段树最近公共祖先LCAST表字典树KMPmanacher跳表(代替C STL的set)dijkstra总结 栈 用list代替 队列 用deque双端队列替代 堆 用heapq 递归装饰器 众所周知&#xff0c;python的递归深度只有1000&#xff0c;根本满足不了大部…...

C++的多态 - 下

目录 多态的原理 虚函数表 1.计算包含虚函数类的大小 2.虚函数表介绍 多态底层原理 1.父类引用调用 2.父类指针调用 3.动态绑定与静态绑定 单继承和多继承关系的虚函数表 函数指针 1.函数指针变量 (1)函数指针变量创建 (2)函数指针变量的使用 (3)两段有趣的代码 …...

XSS(跨站脚本攻击)

什么是 XSS 攻击&#xff1f; XSS 攻击&#xff08;Cross-Site Scripting&#xff09;是一种常见的网络攻击手段&#xff0c;攻击者通过在网站上注入恶意的 JavaScript 代码&#xff0c;让网站在用户的浏览器中执行这些恶意代码&#xff0c;进而达到 窃取信息、篡改网页内容 或…...