当前位置：首页 > news >正文

【大模型】LLM概念相关问题（上）

news 来源：原创 2025/8/4 23:59:42

1.主流的大语言模型

截至2025年，主流的大型语言模型（LLM）体系涵盖了多个国家和机构的成果，具有多样的架构设计、参数规模和应用场景。以下是一些具有代表性的开源和闭源 LLM 体系：

🇺🇸 OpenAI — GPT 系列

GPT-4：OpenAI 开发的先进 LLM，支持多模态输入（文本、图像），具备强大的自然语言处理能力，适用于教育、研究和商业等多种领域。
GPT-NeoX-20B：由 EleutherAI 开发的开源自回归语言模型，拥有 200 亿参数，适用于文本生成、情感分析、问答和语言翻译等任务。

🇺🇸 Anthropic — Claude 系列

Claude 3.7 Sonnet：Anthropic 开发的 LLM，强调安全性和符合人类价值观，适合需要高度责任感的商业和企业应用场景。

🇺🇸 Meta — LLaMA 系列

LLaMA 2：Meta 发布的开源 LLM，提供 70 亿、130 亿和 700 亿参数版本，支持商业用途。
LLaMA 4：采用混合专家（MoE）架构，具备多模态（文本和图像输入）和多语言能力，包括 Scout（170 亿活跃参数）和 Maverick（170 亿活跃参数）等版本。

🇨🇳 深度求索（DeepSeek）系列

DeepSeek-V3：采用混合专家架构，性能媲美 GPT-4o，训练成本约为 557.6 万美元。
DeepSeek-R1：专注于推理能力，特别适用于数学和逻辑任务，性能对标 OpenAI o1。

🇺🇸 Google DeepMind — Gemini 系列

Gemini：Google DeepMind 开发的多模态 LLM，包含 Gemini Ultra、Gemini Pro 和 Gemini Nano，支持文本、图像等多种数据类型的输入。

2.大语言模型的几种类别

1. 按训练目标分类

1.1 基础模型（Base Models）

定义：仅经过大规模自回归预训练，不含任何指令或对话优化。
特点：擅长下一词预测，但对“听懂”人类指令的能力较弱，直接对话或复杂任务时需要精心设计 Prompt。
代表：原始 GPT、LLaMA Base。

1.2 指令/对话模型（Instruction-Tuned / Chat Models）

定义：在基础模型上进一步以人类指令-回复对（SFT）与强化学习（RLHF）进行微调，使模型更擅长按指令执行任务、进行多轮对话。
特点：能主动寻求澄清、更好地控制输出风格，回答更符合使用者预期。
代表：DeepSeek-V3（Chat 类）、OpenAI InstructGPT、LLaMA 2-Chat。

1.3 推理模型（Reasoning Models）

定义：在生成答案前“分步思考”（Chain-of-Thought）或自动推理优化，专注于复杂逻辑、数学和编程等结构化问题。
特点：推理准确率大幅提升，但通常需要更长的推理时间和更多计算资源。
代表：DeepSeek-R1（推理类）、OpenAI o1/o3 系列。

2. 按增强方式分类

2.1 检索增强生成（Retrieval-Augmented Generation，RAG）

定义：模型在生成前通过向外部知识库（向量数据库）检索相关文档，把最新或私有化数据作为上下文，补足训练时的“信息盲区”。
特点：显著减少“幻觉”事实错误，可实时引用企业内网/文档，适合知识密集型场景。
典型应用：企业内部知识问答、法规咨询、文档摘要。

2.2 工具调用（Tool-Use）

定义：LLM 通过 API 调用、执行代码或第三方工具（如计算器、搜索引擎）来完成特定任务。
特点：将复杂或外部计算任务交给专用工具，实现更准确和可验证的结果。

3.大模型的涌现能力

大语言模型的“涌现能力”（emergent abilities）指的是一些在小规模模型上几乎不具备，但随着模型参数量、计算资源和训练数据规模达到某一阈值后突然出现的能力。其背后主要原因可以从以下几个角度来理解：

1. 参数与计算规模的“阈值效应”

非线性相互作用：当模型规模（参数数目）和训练计算（FLOPs）增加时，模型内部各层、各头之间的表示与权重并非简单线性叠加，而是产生了新的、高阶的特征交互，从而催化了能力的突增。
相位跃迁（Phase Transition）：在缩放曲线（横轴为模型规模，纵轴为性能）上，这些能力表现为“折点”，即性能从近似随机跃升到可用水平，不能通过对小模型性能的线性外推预测到这一跃迁。

2. 丰富多样的训练数据与长尾知识

数据量与多样性：大模型通常使用数万亿 token 级别的多领域语料；在海量且多样化的上下文中，模型学习到的语言规则和世界知识更全面，触发了对“少量示例学习”（in-context learning）、复杂推理等高级能力的支持。
长尾现象：许多特定任务或知识点本身在数据中出现频率极低，只有当训练集足够巨大、覆盖到这些长尾用例时，模型才能在对应场景下表现出色。

3. 训练动态与优化策略

混合目标与正则化：现代大模型在预训练中往往使用多种去噪、掩码、自回归等混合目标（如 UL2R），以及更长的训练步骤，使得模型在不同任务模式之间能平滑过渡，从而在某些任务上出现“超预期”能力。
激活稀疏与专家路由（MoE）：部分模型（如混合专家架构）在推理时只激活子集参数，既保留了大规模模型的表示能力，又降低了推理成本，也带来了新的能力组合方式。

4. 语义与推理结构的隐式学习

隐式结构归纳：大模型能在无监督预训练中自动归纳出语言的层次化、图结构或逻辑关系，例如数学推理、程序合成等，这是小模型难以做到的。隐式学习到的“思考链”（chain-of-thought）在规模达到一定程度时开始自然显现。
启发式与元学习：大模型会学习到一套“元策略”（meta-strategy），在面对新任务时能够迅速从上下文提示中抽取要点，借助类似人类启发式的方式高效完成任务。

4.为什么大模型基本是Decoder-only结构

Encoder的低秩问题：Encoder的双向注意力会存在低秩问题，这可能会削弱模型表达能力，就生成任务而言，引入双向注意力并无实质好处。
更好的Zero-Shot性能、更适合于大语料自监督学习：decoder-only 模型在没有任何 tuning 数据的情况下、zero-shot 表现最好，而 encoder-decoder 则需要在一定量的标注数据上做 multitask finetuning 才能激发最佳性能。
效率问题：decoder-only支持一直复用KV-Cache，对多轮对话更友好，因为每个Token的表示之和它之前的输入有关，而encoder-decoder和PrefixLM就难以做到。

5.LLMs输入句子长度理论上可以无限长吗？

理论上来说，LLMs（大型语言模型）可以处理任意长度的输入句子，但实际上存在一些限制和挑战。下面是一些相关的考虑因素：

计算资源：生成长句子需要更多的计算资源，包括内存和计算时间。由于LLMs通常是基于神经网络的模型，计算长句子可能会导致内存不足或计算时间过长的问题。
模型训练和推理：训练和推理长句子可能会面临一些挑战。在训练阶段，处理长句子可能会导致梯度消失或梯度爆炸的问题，影响模型的收敛性和训练效果。在推理阶段，生成长句子可能会增加模型的错误率和生成时间。
上下文建模：LLMs是基于上下文建模的模型，长句子的上下文可能会更加复杂和深层。模型需要能够捕捉长句子中的语义和语法结构，以生成准确和连贯的文本。

6.分词领域，中文分词的难点？

分词标准不统一
中文没有天然的空格分隔，不同场景对词语划分的标准存在差异，如“人名”是否分开、“花草”是否合并为一词等问题。因此中文分词在某种意义上是一个“无统一标准”的任务。
切分歧义复杂多样
切分歧义是指同一个字串可以有多种合法切分方式，分为组合型歧义（如“将来”/“将/来”）、交集型歧义（如“商务处女干事”）、以及真歧义（如“下雨天留客天天留人不留”）。这些歧义有的可以通过上下文判断，有的甚至需要更广泛的语境理解。
未登录词识别困难
新词、专有名词、网络热词等常常未被词典收录，且它们形式多样、缺乏明显边界，导致传统词典匹配方法失效。jieba等工具引入了统计学习方法（如HMM和Viterbi算法）来识别这些词，但仍是中文分词中最具挑战性的部分之一。

7.当下主流的中文分词算法

1. 基于词典的匹配算法（规则法）

核心思路：依赖词典进行字符串匹配，常见策略为正向最大匹配（MM）、逆向最大匹配（RMM）或双向匹配（BMM）。

优点：实现简单，速度快
缺点：无法识别未登录词，切分歧义处理能力弱
代表工具：早期的 ICTCLAS、哈工大分词系统的一部分

2. 基于统计的分词算法

核心思路：利用大规模语料中词语的共现频率、互信息（MI）、左右熵等指标判断词边界。

典型方法：
- 基于N-gram模型（统计语言模型）
- 基于互信息 + 左右熵的无监督新词发现
优点：能一定程度识别未登录词
缺点：依赖大规模语料，难处理歧义
代表工具：THULAC、结巴分词（部分新词发现功能）

3. 基于序列标注的分词算法

核心思路：将分词任务看作序列标注问题，常用 BIO 或 BEMS（Begin, End, Middle, Single）标签。

典型模型：
- 隐马尔科夫模型（HMM）：如jieba内部使用的HMM模型
- 条件随机场（CRF）：如CRF++、LTP（语言技术平台）
优点：准确率高，能有效处理歧义
缺点：训练成本高，需要人工标注语料
代表工具：jieba（HMM + 词典），HanLP（支持CRF）

4. 基于深度学习的分词算法

核心思路：通过深度神经网络学习字符间的边界关系，自动提取特征。

典型架构：
- BiLSTM-CRF（双向LSTM+条件随机场）
- Transformer/BERT + CRF：结合预训练语言模型提升效果
优点：泛化能力强，性能最优，支持端到端训练
缺点：训练数据需求大，计算资源要求高
代表系统：
- BERT-based 分词模型（如Tencent ChineseBERT）
- 百度的ERNIE分词模型
- HuggingFace上的中文分词模型

8.激活函数的作用？现在主流用哪个激活函数？

激活函数（Activation Function）主要作用有以下几点：

引入非线性能力
如果没有激活函数，神经网络每一层的输出就是线性变换，叠加再多层本质上还是线性函数，无法拟合复杂的数据。激活函数让网络可以学习复杂的非线性模式。
控制信息流动（选择性激活）
比如 ReLU 把负数置零，相当于“关掉”部分神经元，增强稀疏性，提高训练效率。
稳定梯度传播
选择合适的激活函数可以缓解梯度消失或爆炸的问题，使深层网络更容易训练。

现在主流的激活函数

激活函数	数学形式	特点	常用场景
ReLU	$\max(0, x)$	简单高效，不易梯度消失；缺点是“神经元死亡”问题	默认首选
Leaky ReLU	$f (x) = x (x > 0), a x a x (x \leq 0, a \approx 0.01)$	缓解ReLU死亡问题	ReLU改进版
ELU / SELU	具有负轴上的平滑性和指数特性	更稳定，适合深网络	深层网络、归一化搭配
Sigmoid	$\frac{1}{1 + e^{-x}}$	饱和区梯度小，易梯度消失	旧模型、二分类输出层
Tanh	$\tanh(x)$	比 sigmoid 输出均值更接近0	RNN中较常用
Softmax	$f(x_i) = \frac{e^{x_i}}{\sum_j e^{x_j}}$	将向量转为概率分布	多分类输出层
GELU	$\cdot \Phi(x)$	BERT等Transformer模型常用，效果优于ReLU	NLP领域主流

9.jieba分词当前还有使用场景吗？

1. 如果你使用 BERT 或其他 Transformer 模型：

通常不需要再用 jieba 分词。

BERT 使用自己的 Tokenizer（如 WordPiece 或 SentencePiece）对中文进行“子词级别”的切分，比如将“花呗借钱”分成：
['花', '呗', '借', '钱']
Tokenizer 自动处理未登录词和 OOV 问题，而且与预训练时使用的一致，避免了“分词标准不一致”带来的精度问题。
在文本分类、命名实体识别、文本生成等主流任务中，直接使用 BERT 的分词器效果更好且更标准化。

2. 但在以下场景下，jieba 仍然有用：

关键词提取、文本摘要、搜索引擎：需要词粒度的分词，jieba 快速高效，能提升 recall。
预处理前的可视化或人工审查：jieba 分词便于观察词语边界，辅助人工判断。
特征工程阶段（非深度学习模型）：如 TF-IDF + XGBoost、SVM 等传统模型，jieba 分词仍是常见选择。

10.词性标注算法，当前主流有哪些？

方法	精度	特征工程	训练难度	代表模型/系统
Rule-based	一般	手工规则多	简单	中科院词性标注器
HMM	中等	较少	低	jieba（可选）、早期ICTCLAS
CRF	高	丰富	中	THULAC、LTP、CRF++
BiLSTM-CRF	较高	自动学习	中高	HanLP、LTP3
BERT + CRF/MLP	极高	端到端	高	百度LAC、Tencent ChineseBERT

【大模型】LLM概念相关问题（上）

1.主流的大语言模型截至2025年，主流的大型语言模型（LLM）体系涵盖了多个国家和机构的成果，具有多样的架构设计、参数规模和应用场景。以下是一些具有代表性的开源和闭源 LLM 体系： 🇺🇸 OpenA…...

编程日记 2025/8/4 23:59:42

AWS IoT Core与MSK集成实战:打造高可靠实时IoT数据管道

在物联网快速发展的今天,如何高效、安全地处理海量设备数据成为企业面临的一大挑战。本文将带您深入探索AWS IoT Core与Amazon MSK(Managed Streaming for Apache Kafka)的集成方案,手把手教您搭建一个可靠、可扩展的实时IoT数据处理管道。无论您是IoT开发者、大数据工程师还是…...

编程日记 2025/7/31 2:12:29

智慧交通-车门开关状态检测数据集VOC+YOLO格式1006张2类

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：1006 标注数量(xml文件个数)：1006 标注数量(txt文件个数)：1006 …...

编程日记 2025/7/31 5:13:24

【传感器】代码——DHT11温湿度传感器

目录一、代码流程二、模块.c代码三、模块.h代码四、主函数代码一、代码流程 1.模块复位：主机发送开始通信时序，从机做出响应（需检测是否有响应） 2.MCU读取1Bit数据 3.MCU读取1Byte数据 4.MCU读取8Byte数据组成完整Dat…...

编程日记 2025/8/4 23:58:02

MySQL 的事务（Transaction）

1. 什么是事务？ 事务是一组原子性的数据库操作序列，这些操作要么全部执行成功，要么全部失败回滚。事务的目的是确保数据库从一个一致状态转换到另一个一致状态，即使在执行过程中发生错误或中断。 …...

编程日记 2025/7/31 5:13:20

vue知识点总结依赖注入动态组件异步加载

一依赖注入使用场景：当需要多层组件需要传值如祖宗-》父亲-》儿子-》孙子如祖宗的数据需要直接传给孙子在祖宗组件中写： data(){return {}} provide(){ return {shujukey:数据值 } }在孙子组件中接收,模板代码中直接使用{{shujukey}}获取数据 dat…...

编程日记 2025/8/4 23:58:03

【软件设计师：存储】16.计算机存储系统

一、主存储器存储器是计算机系统中的记忆设备，用来存放程序和数据。计算机中全部信息，包括输入的原始数据、计算机程序、中间运行结果和最终运行结果都保存在存储器中。存储器分为：寄存器Cache（高速缓冲存储器）主存储器辅存储器一、存储器的存取方式二、存储器的性…...

编程日记 2025/7/31 18:31:42

快速开发-基于gin的中间件web项目开发

一、概述在 Gin 框架中，中间件（Middleware）是一种在处理 HTTP 请求之前或之后执行的函数。使用中间件可以方便地实现诸如身份验证（Auth）、日志记录、请求限流等功能。二、编写中间件 // 中间件 func StartCost1(c …...

编程日记 2025/7/31 18:31:40

耀圣-气动带刮刀硬密封法兰球阀：攻克颗粒高粘度介质的自清洁 “利器”

气动带刮刀硬密封法兰球阀：攻克颗粒高粘度介质的自清洁 “利器” 在化工、矿业、食品加工等行业中，带颗粒高粘度介质、料浆及高腐蚀性介质的输送与控制一直是行业难题。普通阀门极易因介质附着、颗粒堆积导致卡阻失效，密封面磨损加剧&#x…...

编程日记 2025/8/4 19:49:01

MySQL + Elasticsearch：为什么要使用ES，使用场景与架构设计详解

MySQL Elasticsearch：为什么要使用ES，使用场景与架构设计详解前言一、MySQL Elasticsearch的背景与需求1.1 为什么要使用Elasticsearch（ES）？1.2 为什么MySQL在某些场景下不足以满足需求？1.3 MySQL Elas…...

编程日记 2025/8/4 19:00:32

【C语言】--指针超详解(三)

目录一.数组名的理解二.使用指针访问数组三.一维数组传参的本质四.冒泡排序五.二级指针六.指针数组 6.1--指针数组的定义 6.2--指针数组模拟二维数组 🔥个人主页：草莓熊Lotso的个人主页 🎬作者简介：C方向学习者 &…...

编程日记 2025/7/31 18:31:35

污水处理厂逆袭：Ethernet/IP 转 CANopen 开启“智净”时代

在我们的日常生活中，污水处理厂发挥着至关重要的作用，它们处理着城市污水，确保我们的水源安全。然而，这些关键设施的运行和管理并非易事，尤其是在数字化转型的大潮中。现在，我们有了一款创新的解决方案——…...

编程日记 2025/7/31 18:31:33

ROS导航局部路径规划算法

在导航功能包中，局部路径规划器的位置如图红框所示。它接受全局路径规划器生成的全局路径以及里程计信息和局部代价地图，最后输出速度控制信息一、DWA（Dynamic Window Approach） 原理介绍 DWA 是一种基于动态窗口采样的局部路…...

编程日记 2025/7/31 18:31:32

《深挖Java中的对象生命周期与垃圾回收机制》

大家好呀！👋 今天我们要聊一个Java中超级重要的话题——对象的生命周期和垃圾回收机制。一、先来认识Java世界的"居民"——对象 👶 在Java世界里，一切皆对象。就像现实世界中的人一样，每个Java对象也有自…...

编程日记 2025/7/31 18:31:30

Java——包装类

目录 3.5 包装类 3.5 包装类有时需要把基本类型转换为对象。所有基本类型都有一个与之对应的类。这些类称为包装器/类。这些类是不可变类，即一旦构造了包装器/类，就不允许改变包装在其中的值。其次包装类还是final，不用可以被继承。为什么要…...

编程日记 2025/8/4 23:58:00

【谭浩强】第七章第14题

实验结果：当M1时输出的结果实验总结：用define定义要频繁使用的值可以节省时间；求完一门课平均成绩之后要让sum重新等于0；求最高分对应的学生和对应的课程要循环完一遍覆盖一遍r和c的值； 程序代码 #include <stdi…...

编程日记 2025/7/31 15:54:04

Linux 内核中的 security_sk_free：安全模块与 Socket 释放机制解析

引言在 Linux 内核中，网络通信和进程间交互（IPC）的核心数据结构之一是 struct sock（即 socket）。其生命周期管理涉及复杂的资源分配与释放逻辑。本文聚焦于 security_sk_free 这一函数，探讨其作用、调用场景以及与安全模块的交互机制，并解答一个常见疑问：在单机间 TC…...

编程日记 2025/8/1 1:13:30

学习笔记：黑马程序员JavaWeb开发教程(2025.4.1)

11.10 案例-配置文件-yml配置文件 Yml语法： 数据格式： 11.11 案例-配置文件-ConfigurationProperties 配置项自动注入，需要保持KEY的属性名一样，需要在文件中加上Data注解，要将这个类交给IOC容器管理，使其成…...

编程日记 2025/7/31 15:54:01

深度学习-161-Dify工具之对比使用工作流和聊天流生成图表可视化的html文件

文章目录 1 任务背景2 使用chatflow聊天流2.1 开始节点2.2 文档提取器2.3 LLM2.4 参数提取器2.5 代码执行2.6 直接回复2.7 应用展示3 生成html文件可视化图表3.1 使用workflow工作流3.1.1 LLM3.1.2 效果展示3.2 使用chatflow聊天流3.2.1 LLM3.2.2 效果展示4 参考附录分别使用聊…...

编程日记 2025/7/31 15:53:59

关于VScode的调试

调试代码要有这么几个工具：源代码、带调试符号的程序、MAP表，调试器。在启动调试器之前，要首先编译带有符号表的程序，生成对应map。然后启动调试器。不同的语言有不同的特性，比如解释型语言不需要编译成可执行程序…...

编程日记 2025/7/31 15:53:57

(x ^ 2 + 2y − 1) ^ 3 − x ^ 2 * y ^ 3 = 1

二元高次方程 EquationSolver20250509.java package math;import org.apache.commons.math3.analysis.MultivariateFunction; import org.apache.commons.math3.optim.InitialGuess; import org.apache.commons.math3.optim.MaxEval; import org.apache.commons.math3.optim.P…...

编程日记 2025/7/31 15:53:55

弹窗表单的使用，基于element-ui二次封装

el-dialog-form 介绍基于element-ui封装的弹窗式表单组件示例 git地址 https://gitee.com/chenfency/el-dialog-form.git 更新日志 2021-8-12 版本1.0.0 2021-8-17 优化组件，兼容element原组件所有Attributes及Events 2021-9-9 新增tip提示安装教程 npm install …...

编程日记 2025/7/31 15:53:53

关系模式-无损连接和保持函数依赖的判断

1、怎样判断一个关系模式的分解是否是无损连接？ 方法一：公式定理法关系模式R<U,F>的一个分解具有无损连接的充分必要条件是： 或方法二：表格法（常用与分解成3个及以上关系模式） a. 通过立一张j…...

编程日记 2025/7/31 15:53:52

Vmware 最新下载教程和安装教程，外带免下载文件

一、VMware 的简介 VMware 是一款功能强大的桌面虚拟计算机软件，提供用户可在单一的桌面上同时运行不同的操作系统，和进行开发、测试、部署新的应用程序的最佳解决方案。VMware可在一部实体机器上模拟完整的网络环境，以及可便于携带的虚拟机…...

编程日记 2025/8/2 10:25:11

开平机：从原理到实践的全面技术剖析

一、开平机核心模块技术解析 1. 校平辊系的力学建模与辊型设计校平机精度核心在于辊系设计，需通过弹塑性力学模型计算变形量。典型校平辊配置参数： 辊径比：校平辊直径（D）与板材厚度（t）需满足…...

编程日记 2025/7/31 15:53:48

Edu教育邮箱申请2025年5月

各位好，这里是aigc创意人竹相左边如你所见，这里是第3部分现在是选择大学的学科专业选专业的时候记得考虑一下当前的时间日期。比如现在是夏天，所以你选秋天入学是合理的。...

编程日记 2025/8/4 19:15:19

文本框碰撞测试

1.核心代码: // 初始化舞台和变量 var stage, textField, bounds, velocity;function init() {// 创建舞台stage = new createjs.Stage("canvas");// 设置矩形边界bounds = {x: 50, y: 50, width: 400, height: 300};// 绘制边界矩形var border = new createjs.Shap…...

编程日记 2025/7/31 15:53:45

LeRobot 项目部署运行逻辑（六）——visualize_dataset_html.py/visualize_dataset.py

可视化脚本包括了两个方法：远程下载 huggingface 上的数据集和使用本地数据集脚本主要使用两个： 目前来说，ACT 采集训练用的是统一时间长度的数据集，此外，这两个脚本最大的问题在于不能裁剪，这也是比较好…...

编程日记 2025/8/4 18:19:12

Python函数：从基础到进阶的完整指南

在Python编程中，函数是构建高效、可维护代码的核心工具。无论是开发Web应用、数据分析还是人工智能模型，函数都能将复杂逻辑模块化，提升代码复用率与团队协作效率。本文将从函数基础语法出发，深入探讨参数传递机制、高阶特性及最佳…...

编程日记 2025/8/4 21:42:44

图灵爬虫练习平台第七题千山鸟飞绝js逆向

题目七：千山鸟飞绝还是先进入开发者模式，一进来还是一个无限debugger，直接右键点击一律不在此处停留然后点击下一页，复制curl进行代码生成，然后就会发现加密内容是headers中的m,ts，还有参数中的x&#xf…...

编程日记 2025/7/31 15:53:39

使用Python和OpenCV实现实时人脸检测与识别

前言在计算机视觉领域，人脸检测与识别是两个非常重要的任务。人脸检测是指在图像中定位人脸的位置，而人脸识别则是进一步识别出人脸的身份。随着深度学习的发展，这些任务的准确性和效率都有了显著提升。OpenCV是一个开源的计算机视觉库&…...

编程日记 2025/7/31 15:53:37

Excel实现单元格内容拼接

一、应用场景： 场景A：将多个单元格拼接，比如写测试用例时，将多个模块拼接，中间用“-”隔开场景B：将某单元格内容插入另一单元格固定位置（例如在B1中添加A1的内容） 二、实际应用&a…...

编程日记 2025/7/31 15:53:35

C语言实现：打印素数、最大公约数

本片博客起源于作者在经历了学校的测试之后猛然发现自己居然忘记了一些比较基础的代码，因此写了本片博客加强记忆以下算法仅供参考打印素数打印：0到200之间所有的素数 #define _CRT_SECURE_NO_WARNINGS#include<stdio.h> #include<math.h&…...

编程日记 2025/7/31 15:53:34

TDengine 在智慧油田领域的应用

简介智慧油田，亦称为数字油田或智能油田，是一种采用尖端信息技术与先进装备的现代油田开发模式。该模式通过实时更新油气田层析图及动态生产数据，显著提高了油气田的开发效率与经济价值。信息技术在此领域发挥着至关重要的作用&#xff0…...

编程日记 2025/7/31 15:53:32

将 iconfont 图标转换成element-plus也能使用的图标组件

在做项目时发现，element-plus的图标组件，不能像文档示例中那样使用 iconfont 的图标。经过研究发现，element-plus的图标封装成了vue组件，组件内容是一个svg，然后以组件的方式引入和调用图标。根据这个思路，…...

编程日记 2025/7/31 15:53:30

使用程序绘制中文字体——中文字体的参数化设计方案初探

目录写在前面基本设计思路笔画骨架参数设计笔画风格参数设计起笔风格转角风格字重变化弯曲程度字形的“组装拟合”基于骨架的结构调整笔画绘制二三事撇的两侧轮廓绘制——不是两条贝塞尔曲线那么简单转角的处理，怎样能显得不突兀？笔画骨架关键点的拖拽…...

编程日记 2025/7/31 15:53:28

高频数据结构面试题总结

基础数据结构 1. 数组(Array) 特点：连续内存、固定大小、随机访问O(1)常见问题： 两数之和/三数之和合并两个有序数组删除排序数组中的重复项旋转数组最大子数组和(Kadane算法) 2. 链表(Linked List) 类型：单链表、双链表、循环链表常见问…...

编程日记 2025/7/31 13:36:46

工业设计破局密码：3D 可视化技术点燃产业升级引擎

3D可视化是一种将数据、信息或抽象概念以三维图形、模型和动画的形式呈现出来的技术。3D可视化技术通过构建三维数字孪生体，将设计思维转化为可交互的虚拟原型，不仅打破了传统二维设计的空间局限，更在效率、精度与用户体验层面开创了全新维度…...

编程日记 2025/7/31 13:36:44

【动态导通电阻】p-GaN HEMTs正向和反向导通下的动态导通电阻

2024 年，浙江大学的 Zonglun Xie 等人基于多组双脉冲测试方法，研究了两种不同技术的商用 p-GaN 栅极 HEMTs 在正向和反向导通模式以及硬开关和软开关条件下的动态导通电阻（RON）特性。实验结果表明，对于肖特基型 p-GaN 栅极 HEMTs，反向导通时动态 RON 比正向导通高 3%-5%；…...

编程日记 2025/7/31 13:36:42

Python代码编程基础

字符串 str.[]实现根据下标定位实现对元素的截取 for 循环可以实现遍历 while 循环可以在实现遍历的同时实现对某一下标数值的修改字符串前加 r 可以实现对字符串的完整内容输出字符串前加 f 可以实现对字符串内{}中包裹内容的格式化输出，仅在 v3.6 之后可用…...

编程日记 2025/7/31 4:50:01

基于RAG+MCP开发【企文小智】企业智能体

一、业务场景描述 1.1、背景介绍几乎每家企业都积累了大量关于规章制度的文档资料，例如薪酬福利、绩效考核、保密协议、考勤管理、采购制度、资产管理制度等。这些文档大多以 Word、PDF 等非结构化格式存在。传统方式下，员工在查询某项具体规则时&…...

编程日记 2025/8/4 12:47:25

【软件测试】测试用例的设计方法

目录一、基于需求进行测试用例的设计 1.1 功能需求测试分析二、黑盒测试用例设计方法 2.1 等价类划分法（解决穷举） 2.1.1 等价类设计步骤 2.1.2 等价类划分法案例 2.1.2.1 验证 QQ 账号的合法性 2.1.2.2 验证某城市电话号码的正确性 2.1.3 适用场景 2.2 边界值分析…...

编程日记 2025/8/1 21:43:53

计算机网络笔记(十八)——3.5高速以太网

3.5.1 100BASE-T以太网 1. 基本概念标准规范：IEEE 802.3u，是快速以太网的典型代表，运行速率100Mbps。物理介质：使用双绞线（UTP或STP），支持最大传输距离100米（Cat5/5e及以上&#…...

编程日记 2025/7/31 7:27:26

海外广告账号资源解析：如何选择适合业务的广告账户？

在全球化数字营销的浪潮下，海外广告投放已成为企业拓展市场的核心手段。然而，不同平台的广告账号类型复杂多样，如何选择适合自身业务的资源？本文将深度解析 Facebook、Google、TikTok 三大平台的广告账号类型，助您精准…...

编程日记 2025/7/31 7:27:24

Java设计模式之建造者模式：从入门到精通

1. 建造者模式概述 1.1 定义与核心概念 **建造者模式(Builder Pattern)**是一种创建型设计模式，它将复杂对象的构建过程与其表示分离，使得同样的构建过程可以创建不同的表示。专业术语解释表：术语解释产品(Product)最终要构建的复杂对象建造者(Builder)定义创建产品各个…...

编程日记 2025/7/31 7:27:22

Faiss 索引深度解析：从基础到实战

在处理高维数据的相似性搜索时，Faiss（Facebook AI Similarity Search）无疑是一款强大且高效的工具。它为我们提供了多种索引类型，适用于不同规模和需求的数据场景。本文将结合代码实例，深入剖析 Faiss 中常见索引的原理…...

编程日记 2025/7/31 7:27:20

Error parsing column 10 (YingShou=-99.5 - Double) dapper sqlite

在使用sqlite 调取 dapper的时候出现这个问题提示： 原因是在 sqlite表中设定的字段类型是 decimel而在C#的字段属性也是decimel，结果解析F负数小数的时候出现这个错误提示： 解决办法：使用默认的sqlite的字段类型来填入 REAL描述…...

编程日记 2025/7/31 7:27:18

星云智控：物联网时代的设备守护者——卓伊凡详解物联网监控革命-优雅草卓伊凡

星云智控：物联网时代的设备守护者——卓伊凡详解物联网监控革命-优雅草卓伊凡一、物联网的本质解析 1.1 什么是物联网？ 当卓伊凡被问及”星云智控物联网是干嘛的”这个问题时，他首先给出了一个技术定义：物联网（Int…...

编程日记 2025/8/1 10:00:55

LeRobot 项目部署运行逻辑（五）——intelrealsense.py/configs.py

在运行 control_robot.py 的时候会启用相机拍摄，lerobot 中封装好了两种相机类型：realsense 和 opencv realsense 直接使用他们的脚本就可以，但需要在 lerobot/robot_devices/robots/configs.py 中修改相机 serial_number 由于我们设备采用的…...

编程日记 2025/7/31 7:27:14

从0开始学linux韦东山教程第一三章问题小结（1）

本人从0开始学习linux，使用的是韦东山的教程，在跟着课程学习的情况下的所遇到的问题的总结,理论虽枯燥但是是基础。摘要关键词：VMware、Ubuntu、网络网口视频链接：【【韦东山】韦东山手把手教你嵌入式Linux快速入门到精通 | Lin…...

编程日记 2025/7/31 7:27:12