当前位置：首页 > news >正文

【AI模型学习】关于写论文——论文的审美

news 来源：原创 2025/8/15 14:34:33

文章目录

- 一、“补丁法”（Patching）
- - 1.1 介绍
  - 1.2 方法论
  - 1.3 实例
- 二、判断工作的价值
- - 2.1 介绍
  - 2.2 详细思路
  - 2.3 科研性vs工程性
- 三、novelty以及误区
- - 3.1 介绍
  - 3.2 举例

看了李沐老师的读论文系列后，总结三个老师提到的有关课题研究和论文写作的三个视频。

一、“补丁法”（Patching）

1.1 介绍

定义：
补丁法是指：在现有研究系统或方法中，找到其薄弱点、局限性或不合理的地方，并提出一个“补丁式”的改进。

它不是从零发明一个全新的系统，而是在前人的基础上“打补丁”、“修bug”，以实现更优的效果或更广泛的适应性。

常见应用场景：

现有方法无法处理极端情况

举例：一个分类器在 imbalanced dataset 上表现不佳，可以设计新的 loss function 或 sampling 方法作为补丁。

某个模块性能明显瓶颈

举例：Transformer 中 attention 模块计算量大，于是有人提出 Linformer、Performer ——这其实都是对原始方法的补丁。

训练不稳定 or 收敛慢

举例：GAN 的训练困难，提出 Wasserstein GAN、Spectral Norm 等等，这些就是不断在训练流程上打补丁。

功能模块缺失或泛化性差

举例：原始模型不具备对抗鲁棒性，于是研究者设计 adversarial training 机制，这也是一种补丁行为。

1.2 方法论

不一定要“从0到1”地创造，只要你能指出已有方法的痛点 + 提出解决方案，这就足够形成一个研究 idea。
很多被顶会接受的论文，本质上就是一个“精致的补丁”：

洞察到别人忽略的一个角落；
用精巧的方式修补；
实验效果显著提升；
把过程讲得清楚，这就够了。

如何实践“补丁法”找想法？

步骤	行动建议
① 阅读前沿论文	特别关注“Limitations”部分、实验失败案例、baseline 不强时作者的解释
② 尝试复现	在复现中你会发现模型不稳定/效果差的地方，这些都是补丁机会
③ 分析失败场景	比如模型在低资源/高噪声场景下性能退化，为何？可以怎么改？
④ 小改进大价值	哪怕只是一个改进的激活函数、损失项、新的训练 trick，也可能成为一个论文的主体

1.3 实例

Transformer 相关

补丁：自注意力太慢（计算复杂度是 O(n²)）

问题：原始 Transformer 的 self-attention 在长序列上计算量巨大。
补丁例子：
- Performer：提出 kernel-based 近似 attention，把 O(n²) 降到 O(n)。
- Linformer：引入低秩矩阵逼近，用线性复杂度计算 attention。
- Longformer：局部窗口 + 全局 token 机制，提升长文本处理能力。

补丁：缺乏位置感知能力

问题：Transformer 自身没有位置信息。
补丁例子：
- Sinusoidal Positional Encoding（原始论文）；
- Relative Positional Encoding（Transformer-XL）；
- Rotary Position Embedding（RoPE in Llama）→ 这就是不断“打补丁”的过程。

自监督学习（如 MoCo、SimCLR）

补丁：contrastive learning 太依赖负样本，且容易过拟合 queue 中的表示

问题：Memory Bank/Queue 中的向量更新不同步
补丁例子：
- MoCo（Momentum Contrast）：引入 momentum encoder 作为补丁，解决队列更新不一致问题。
- BYOL：干脆去掉负样本，构造对比框架的新结构。
- SimSiam：再砍一刀，连 momentum encoder 也砍掉了。都算是对 SimCLR 的“补丁”。

优化器 & 损失函数改进

补丁：Adam 在 batch size 很大时效果变差

问题：Adam 在 large batch 上不稳定
补丁例子：
- LAMB Optimizer（用于 BERT 预训练）：针对 large batch 的适配
- RAdam（Rectified Adam）：通过 bias correction 的“补丁”，解决 early step variance 大的问题。

生物信息学 / 结构预测领域

补丁：AlphaFold 需要 MSA，但有些蛋白质找不到同源序列

问题：MSA-free 情况下模型退化
补丁例子：
- ESMFold（Meta）：使用蛋白语言模型 embedding，绕过对 MSA 的依赖。
- OmegaFold：改进结构模块处理长链段缺失情况。

总结思路模板

步骤	解释
① 读主流方法	阅读经典模型的结构和实验设置
② 找痛点	性能瓶颈？效率低？训练难？泛化差？
③ 局部修改	改 loss、加正则、改 attention、改 encoder、改初始化…
④ 做实验	补丁有用 → 就能发 paper！

二、判断工作的价值

2.1 介绍

核心模型：
研究价值 = 新颖性 × 有效性 × 问题规模

具体说明：

新颖性（Novelty） 你的研究是否在方法、问题或视角上具有创新性
有效性（Effectiveness） 你的方法是否在实验或理论上取得了显著的改进
问题规模（Problem Size） 你解决的问题在学术界或工业界的重要性如何

2.2 详细思路

总公式：

研究价值 = 新颖性 × 有效性 × 问题规模

这是一个乘法模型，意味着：

三者中任何一项为 0，整体价值都趋近于 0；
想做出高价值工作，三者都不能忽视；
如果某一项不突出，你需要用其他项来弥补（例如“方法普通但问题超重要”）。

新颖性（Novelty）

定义：
研究中是否有原创性的点？是不是别人没有做过的、想过的或者做不到的？

表现形式：

提出新的研究问题（问题级别的创新）；
提出新的方法/模型架构（技术级别的创新）；
跨领域迁移方法（例如把 NLP 方法用在蛋白质序列上）；
给出新的解释、机制、视角（理论层面的创新）；
创建一个新的数据集/评估指标，从而定义新的任务。

正例：

Vision Transformer（ViT）：直接把 transformer 引入 CV，是架构的新颖性；
DALL·E：文本 → 图像生成任务的定义就是新颖的；
AlphaFold：结构预测早就有，但它是首次用 end-to-end 深度网络大规模突破。

常见误区（提到的“新颖性误解”）：

以为“微调一下 loss 就是创新”；
用了两个旧模型叠加起来，不是新颖，而是“组合技巧”；
语言包装成“XXX++”，实质没变。

提升方法：

阅读最新论文，看别人解决什么问题，用什么套路；
看论文的“Limitations”部分，很多 idea 都藏在“我们未来会做……”；
反问：“如果我是审稿人，哪里是亮点？”

有效性（Effectiveness）

定义：
你的方法/模型是不是真的有效，对比已有方法有显著改进或实证支持。

评估方式：

实验性能提升（accuracy, F1, ROC-AUC, perplexity 等）；
资源效率提升（速度、参数量、内存占用）；
理论收敛性、可解释性提升；
消融实验支持某个组件有效。

正例：

MoCo 通过 queue+momentum encoder 改进对比学习的稳定性，实验明显优于 SimCLR；
CLIP 训练时不需要细致标注，但性能甚至超过有监督模型；
ESMFold 放弃了 MSA，结构预测依然准确，是效率与效果的突破。

常见误区：

“我们的模型结果比别人好 0.1%，但波动很大”——不稳定、不可重复；
“我们用新的数据集，效果很好”——但缺乏 baseline 比较；
“我们在一个领域有效，但没有验证泛化性”。

提升方法：

做多个 baseline，对比经典方法；
做消融实验，突出自己的模块带来了哪些改变；
做不同数据集或真实任务验证，展示通用性。

问题规模（Problem Size）

定义：
你研究的问题是不是重要、常见、痛点明显？有没有人“关心”它？

表现形式：

是学术界、工业界都关心的问题（比如“多模态对齐”、“蛋白质结构预测”、“LLM memory”）；
是很多方法解决不了的问题，或者影响范围大（例如高能耗、训练太慢、可解释性差）；
是可能带来应用层变革的问题（如人机交互、多语言理解、药物生成等）；

正例：

ChatGPT：解决了通用语言对话问题，影响巨大；
SAM（Segment Anything）：提出通用分割框架，是图像领域的重要任务；
Graphormer：图结构 → Transformer 表达，是图学习的重要突破。

常见误区：

“我们做的是一个没人关注的小众问题”——可能被视为价值有限；
“我们的问题只是已有问题换个壳”；
“我们只是拿已有模型测了一个冷门 dataset”。

提升方法：

多读 survey，看哪些领域是“主战场”；
参加会议，看哪些问题是热议话题；
跟企业沟通，看哪些是“工业界真实痛点”。

问题	Novelty	Effectiveness	Problem Size	综合价值
改进一个 loss 提高 0.3%	弱（小改）	较强	小问题	**
用 ViT 做蛋白质序列分析	强（跨领域）	效果好	蛋白是大问题	*****
把 GNN 应用于交通流预测	有视角	待验证	现实意义强	***
提出一个理论收敛分析方法	理论新	需实验支持	领域是否关心？	***

2.3 科研性vs工程性

一个项目的“科研性”和“工程性”怎么理解？

科研性（Scientific value）

追求：新发现、新方法、新理论
关键词：创新性、理论性、发表论文
常问问题：
- 有没有人做过这个问题？
- 我的方法/视角/结果有什么新意？
结果表现：
- 发论文、被引用、提出新概念或方法

例子：提出一种全新的GNN结构、构建一个蛋白结构预测的新理论、提出新的对比学习loss

工程性（Engineering value）

追求：好用、稳定、效率高
关键词：实用性、部署性、解决问题
常问问题：
- 能不能跑起来？能不能快？能不能稳定？
- 真实业务中有没有用？
结果表现：
- 模型上线、性能指标优秀、用户使用满意

例子：用蒸馏压缩模型上线在边缘设备上；构建一个自动蛋白结构分析平台；让一个原本要跑1小时的任务变成1分钟

维度	科研性	工程性
目标	提出新知识	解决实际问题
输出	论文、新理论、新算法	稳定系统、工具、产品
常见语境	“这是一个创新点”	“这个能不能上线？”
评价标准	有新意，有影响力	有用，好用，跑得动

三、novelty以及误区

Michael J. Black在其博客文章《Novelty in Science》中对科学研究中新颖性常见误解进行讨论。这篇文章旨在帮助审稿人和研究者更准确地理解和评估研究的创新性。

3.1 介绍

将新颖性等同于技术创新
许多审稿人误以为，只有在技术细节上有所突破的研究才具有新颖性。然而，创新可以体现在多个方面
- 数据集创建一个在功能或用途上前所未有的数据集，即使使用的是已知的方法
- 方法应用将现有方法应用于新的领域或问题，产生新的见解
- 简化复杂性用简单的方法替代复杂的算法，提供新的理解
  因此，在评估研究的新颖性时，应超越技术细节，关注其在更广泛层面的创新
将新颖性等同于惊喜
新颖性常被误认为是带来惊喜的结果。然而，真正的创新往往在事后看起来“显而易见”审稿人应认识到，创新的价值在于首次提出这一想法的过程，而非其在被理解后的直观性
将新颖性等同于实用性或价值
并非所有的新想法都是立即有用的有时，新的方法或理论在短期内难以评估其价值，但这并不意味着它们缺乏新颖性审稿人应谨慎评估新想法的潜在影响，而不是仅根据其当前的实用性做出判断
将新颖性等同于难度
有些人认为，只有在研究过程中经历了极大困难的工作才算创新然而，提出一个简单而有效的想法，同样需要深厚的理解和洞察力审稿人应重视那些通过简化复杂问题而带来新见解的研究
忽视新颖性的多样性
新颖性不仅限于上述几个方面它还可以体现在
- 跨学科的连接将不同领域的概念结合，产生新的理论框架
- 理论的新解释对现有现象提供新的解释或视角
- 方法论的革新引入新的研究方法或实验设计
  因此，评估新颖性时，应全面考虑研究在多个维度上的创新

3.2 举例

1.将新颖性误解为复杂性（Complexity）

误解解释：
许多人以为研究越复杂、数学越多、细节越难，就越新颖。

正确认知：
一个简单、优雅的想法，如果别人没提出过，它就具备真正的新颖性，哪怕实现细节非常简单。

正面例子：

ReLU 激活函数（2011）
- ReLU (max(0,x)) 是非常简单的激活函数，早期被认为“太傻”，但其简洁性大幅提升训练效率，迅速取代 sigmoid / tanh。
- ➜ 这不是复杂的数学推导，但却是极具影响力的创新。
BatchNorm（2015）
- 想法非常简单：normalize 中间层的分布，有效缓解梯度消失。
- 当时很多人觉得“不过是加了一行代码”，结果成为基础组件。

反例：

过度设计网络结构，写几十页数学公式，但最终改进效果微小，仅提升 0.1%。
- ➜ 这种论文看似“高深”，但实际缺乏真正新意。

将新颖性误解为技术难度（Difficulty）

误解解释：
有些人觉得：必须技术上很难做、要调几个月才能跑起来的项目，才算有贡献。

正确认知：
真正的新颖性在于发现新的切入点或机制，而不是工程难度有多大。

正面例子：

MoCo（2019）
- 用一个动量 encoder + queue 的结构解决对比学习中的负样本一致性问题。
- 技术难度不大，实现也很“清爽”，但 idea 很聪明，是认知上的突破。
SimSiam（2020）
- 用一小段 encoder + predictor，完全去掉负样本，比 MoCo 还精简。
- 没有任何 fancy trick，但模型工作得很好。

反面例子：

在工业界实现一个部署 pipeline、写了很多脚本和系统组件，这属于“工程难度高”，但如果没有新方法或原理创新，学术价值有限。

将新颖性误解为惊喜感（Surprise）

误解解释：
看到一个 idea，“啊，这我也能想到！”就以为它不新颖了。

正确认知：
新颖性不是“听起来惊艳”，而是别人没先想到。事后看起来显而易见，是好想法的标志。

正面例子：

Transformer（2017）
- “Self-attention 替代 RNN”听起来好像理所当然，但之前没人这样做过。
- 一旦提出，全世界都觉得“早该这样了”——这正说明它的合理性。
ViT（2020）
- “把图像切 patch 扔给 Transformer”听起来不复杂，但一开始没人敢做。
- 真正做出来并跑出好结果后，才变成主流。

反面例子：

审稿人看到你用简单方法解决了老问题，觉得“这太 obvious，不够 novel”。
- ➜ 如果之前没人这样做过，这种质疑本身就错了。

将新颖性误解为技术创新（Technical novelty）

误解解释：
只有提出新算法、架构才算创新。

正确认知：
创新可以来自问题定义、应用转化、数据设计、评估标准等多个维度。

正面例子：

AlphaFold2（2021）
- 真正的创新不完全在模型结构，而在整个 pipeline：引入 Evoformer、三角注意力模块、大数据集训练、结构模块等。
- 是一整套集成创新，不只是某个技术点。
CLIP（2021）
- 核心 idea 是“用对比学习把图片和文字拉在一起”，方法上并不复杂。
- 但它定义了一个“文本指导图像表示学习”的新范式，是任务定义上的突破。
SAM（Segment Anything Model, 2023）
- 本质上是一个大规模提示驱动的图像分割器。方法不是全新，任务设计和 scale 的贡献是新颖的点。

反例：

“我们提出了 LayerNorm++、Transformer++、ResNet-xxx”：
- ➜ 如果只是小改进而没有明确的问题背景或创新动机，就不一定有意义。

将新颖性误解为实用性（Usefulness）

误解解释：
有些人认为：这个研究“暂时没啥用”，所以不值得做或不能发表。

正确认知：
科学中的新颖性不必立即有用，它的价值可能体现在未来或基础理论发展中。

正面例子：

GAN（2014）
- 最初只是一个对抗训练框架，没人知道能生成什么。
- 几年后变成图像生成的基石。
Transformer（2017）
- 一开始只是做机器翻译，后来才成为 NLP、CV、多模态的核心。
GPT（2018）
- 早期版本没什么实际应用，被嘲讽为“过拟合 Wikipedia 的模型”；
- 今天变成通用大模型，重塑 AI 工业。

反面例子：

审稿人说“这个 idea 没有明显应用场景”，就直接否决论文，这种是对科研评价的不准确。

总结表格

误解类型	正确认知	代表正例	错误案例或评价方式
复杂性	简单也能新颖	ReLU、BatchNorm	“你这个太简单”
技术难度	不难也有贡献	MoCo、SimSiam	“你调代码调得不够久”
惊喜感	显然≠不新	Transformer、ViT	“这不是很 obvious 吗？”
技术创新	不限于算法	CLIP、SAM	“你方法没变，不 novel”
实用性	不一定立马实用	GAN、GPT	“现在没用，不给你 accept”

【AI模型学习】关于写论文——论文的审美

文章目录一、“补丁法”（Patching）1.1 介绍1.2 方法论1.3 实例二、判断工作的价值2.1 介绍2.2 详细思路2.3 科研性vs工程性三、novelty以及误区3.1 介绍3.2 举例看了李沐老师的读论文系列后，总结三个老师提到的有关课题研究和论文写作的三…...

编程日记 2025/8/15 14:34:33

【面经】杭州产链数字科技一面

1.介绍一下自己面试官您好！我叫***，目前是就读于****计算机科学与技术专业的一名学生。我平时在学校也自学了编程相关的知识，比如Java基础、Springboot、SpringCloud，关系型数据库Mysql，非关系型数据库Redis&#xff…...

编程日记 2025/8/10 14:09:24

微信小程序调用yolo目标检测模型

目录后端前端微信小程序完整代码后端利用Flask，调用目标检测模型，后端代码如下。 # flask_yolo.py from flask import Flask, request, jsonify from ultralytics import YOLO from PIL import Imageapp Flask(__name__) model_path best.p…...

编程日记 2025/8/10 16:38:34

vmware17 虚拟机 ubuntu22.04 桥接模式，虚拟机无法接收组播消息

问题描述： 在一个项目中，宿主机win10中，使用的vmware17pro 虚拟机安装的ubuntu22.04，按照网上的教程使用Qt绑定组播消息，在另外一个Ubuntu工控机上发送用wiresahrk抓包的组播消息 sudo tcpreplay -i enp1s0 --loop0 y…...

编程日记 2025/8/15 14:28:35

Kaggle-Bag of Words Meets Bags of Popcorn-(二分类+NLP+Bert模型)

Bag of Words Meets Bags of Popcorn 题意： 有很多条电影评论记录，问你每一条记录是积极性的评论还是消极性的评论。数据处理： 1.首先这是文件是zip形式，要先解压，注意sep ‘\t’。 2.加载预训练的 BERT 分词器 …...

编程日记 2025/8/12 20:40:00

数字信号处理技术架构与功能演进

数字信号处理（DSP）是通过数字运算实现信号分析、变换、滤波及调制解调的技术领域，其发展过程与技术应用如下： 一、定义与核心功能技术定义：通过算法将模拟信号转换为数字形式进行处理，具有高精度、可编程…...

编程日记 2025/8/14 23:28:38

IaaS架构剖析、场景实践

一、什么是 IaaS 1.1 定义 Infrastructure as a Service（IaaS，基础设施即服务）是一种按需、弹性提供计算、存储、网络和安全等底层 IT 资源的云服务模式。用户通过 API、CLI 或 Web 控制台即可在几分钟内创建、扩容或释放资源，而…...

编程日记 2025/8/15 14:30:15

国产之光DeepSeek架构理解与应用分析02

本专栏国产之光DeepSeek架构理解与应用分析-CSDN博客国产之光DeepSeek架构理解与应用分析02-CSDN博客前置的一些内容理解 GPU TPU NPU的区别？ 设计目的 GPU：最初是为了加速图形渲染而设计的，用于处理图像和视频数据，以提供高…...

编程日记 2025/8/13 9:30:41

EDID结构

EDID DDC通讯中传输显示设备数据 VGA , DVI 的EDID由128字节组成，hdmi的EDID增加扩展块128字节。扩展快的内容主要是和音频属性相关的，DVI和vga没有音频，hdmi自带音频，扩展快数据规范按照cea-861x标准。 Edid为了让pc或其他的图像…...

编程日记 2025/8/15 14:30:16

4.黑马学习笔记-SpringMVC(P43-P47)

1.SpringMVC简介 SpringMVC技术（更少的代码，简便）与servlet技术功能相同，属于web层开发技术。 SpringMVC是一种基于java实现MVC模型的轻量级web框架。轻量级指的是（内存占用比较低，运行效率高）…...

编程日记 2025/8/3 5:58:48

CSS 文件格式

A QFrame#andrFrm[status"android_en"] A：表示父类或顶层窗口的类型。如果 A 是一个自定义的类名，确保该类已经正确注册到 Qt 系统中。QFrame：表示具体的控件类型。#andrFrm：表示控件的对象名称（通过 setOb…...

编程日记 2025/8/3 5:58:46

java输出HelloWorld

创建一个java格式文件，这里命令为HelloWorld 这里我选择用notepad编译，也可以直接用记事本 #public 访问修饰词，表示这个类可以被其他任何类访问 #class 定义类的关键字 #HelloWorld 类名，遵循驼峰命名法（首字母大写…...

编程日记 2025/8/12 12:44:59

【SAP ME 44】在 HANA DB中报废SFC时的SHOP_ORDER表记录锁定

症状 SELECT…FROM SHOP_ORDER FOR UPDATE 在 SFC 报废期间持有锁，当同时调用数量较大时，可能会导致 HANA 数据库出现大量锁积压。这有时会导致因等待 HANA 数据库释放“选择更新”锁而导致报废 SFC 花费数分钟。 HANA 数据库日志中的示例： # begin PreparedStatement_ex…...

编程日记 2025/8/15 14:33:08

《软件设计师》复习笔记（12.1）——范围管理、进度管理

目录一、范围管理 1. 核心概念 2. 范围管理过程 WBS（工作分解结构）示例真题示例： 二、进度管理 1. 核心过程 2. 关键工具与技术真题示例： 一、范围管理 1. 核心概念项目范围：为交付产品必须完成的工作…...

编程日记 2025/8/15 6:30:39

Git-使用教程（新手向）

一、基本概念： 1.Git，Github的关系： Git --- 本地用于管理代码的工具，可类比为游戏存档。（存档，仓库，项目在Git中是一个东西） Github --- 远程仓库平台，可类比为云端。…...

编程日记 2025/8/14 16:54:00

密码学中的盐值是什么？

目录 1. 盐值的基本概念 2. 盐值的作用 (1) 防止彩虹表攻击 (2) 防止相同的密码生成相同的哈希值 (3) 增加暴力破解的难度 3. 如何使用盐值？ (1) 生成盐值 (2) 将盐值附加到密码 (3) 存储盐值和哈希值 (4) 验证密码 4. 盐值如何增加暴力破解的难度在线暴…...

编程日记 2025/8/15 14:33:11

[工具]Java xml 转 Json 依赖  <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.37</version> </dependen…...

编程日记 2025/8/14 17:30:57

安全光幕的CE认证

在工业自动化飞速发展的当下，安全光幕作为保障操作人员安全的关键设备，其重要性不言而喻。对于想要进军欧盟市场的安全光幕制造商来说，CE 认证是必须跨越的一道关卡。今天，我们就来深入探讨安全光幕的 CE 认证流程。什么是安全…...

编程日记 2025/8/10 22:11:18

DNS解析失败怎么解决？

在互联网时代，畅快地浏览网页、使用各类网络服务已成为生活常态。然而，当屏幕突然弹出 “DNS解析失败”的提示，原本顺畅的网络连接戛然而止，让人倍感困扰。DNS即域名系统，它如同互联网的 “电话簿”，负责将…...

编程日记 2025/8/7 5:11:52

亚马逊商品详情API数据接口概述，Amazon API

亚马逊商品详情API数据接口概述亚马逊商品详情API（如Amazon Product Advertising API或Selling Partner API (SP-API)）是亚马逊为开发者提供的官方接口，允许通过编程方式获取商品的详细信息，包括商品标题、价格、描述、图片、用…...

编程日记 2025/8/15 14:30:16

TCP/IP和UDP协议的发展历程

TCP/IP和UDP协议的发展历程引言互联网的发展史是人类技术创新的辉煌篇章，而在这一发展过程中，通信协议发挥了奠基性的作用。TCP/IP（传输控制协议/互联网协议）和UDP（用户数据报协议）作为互联网通信的基础…...

编程日记 2025/8/15 2:32:49

LeetCode 259 题全解析：Swift 快速找出“满足条件”的三人组

文章目录摘要描述示例 1：示例 2：示例 3： 题解答案（Swift）题解代码分析示例测试及结果时间复杂度空间复杂度总结摘要本文围绕 LeetCode 259 题“较小的三数之和”，通过 Swift 给出两种解法，并…...

编程日记 2025/8/15 14:33:06

【MySQL】MySQL表的增删改查（CRUD） —— 上篇

目录 MySQL表的增删改查（CRUD） 1. 新增（Create）/插入数据 1.1 单行数据全列插入 insert into 表名 values(值, 值......); 1.2 单行数据指定列插入 1.3 多行数据指定列插入 1.4 关于时间日期（datetime&am…...

编程日记 2025/8/15 14:28:35

基于大模型的腹股沟疝诊疗全流程风险预测与方案制定研究报告

目录一、引言 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究目的与创新点二、大模型技术概述 2.1 大模型基本原理 2.2 常用大模型类型及特点 2.3 大模型在医疗领域的应用潜力三、腹股沟疝诊疗流程分析 3.1 腹股沟疝的发病机制与分类 3.2 传统术前评估方法与局…...

编程日记 2025/8/15 11:33:35

使用nssm将Nginx配置为Windows服务

使用nssm将Nginx配置为Windows服务下载nssm工具 ：使用NSSM创建服务启动并验证服务管理服务（启动/停止/重启） 下载nssm工具 ： nssm下载网址下载到指定路径下，解压就行。使用NSSM创建服务 winr打开运行命令框&am…...

编程日记 2025/8/15 14:26:47

（8）VTK C++开发示例 --- 交互式3D部件

文章目录 1. 概述2. CMake链接VTK3. main.cpp文件4. 演示效果更多精彩内容👉内容导航 👈👉VTK开发 👈 1. 概述这个例子介绍了3D小部件（vtkBoxWidget）。3D小部件利用了前面介绍的事件/观察者设计模式。它们…...

编程日记 2025/8/13 6:22:50

ReAct、CoT 和 ToT：大模型提示词推理架构的对比分析

ReAct、CoT 和 ToT：大模型提示词推理架构的对比分析在大型语言模型（LLM）的研究与应用中，如何有效提升模型在复杂任务上的推理能力是关键问题之一。目前，ReAct（Reasoning and Acting）、CoT&…...

编程日记 2025/8/15 14:28:33

Evidential Deep Learning和证据理论教材的区别（主要是概念）

最近终于彻底搞懂了Evidential Deep Learning，之前有很多看不是特别明白的地方，原来是和证据理论教材（是的，不只是国内老师写的，和国外的老师写的教材出入也比较大）的说法有很多不一样，所以特地…...

编程日记 2025/8/15 14:26:49

golang context源码

解析 context结构 Deadline：返回 context 的过期时间； Done：返回 context 中的 channel； Err：返回错误； Value：返回 context 中的对应 key 的值. type Context interface {Deadline() (deadl…...

编程日记 2025/8/15 4:52:00

VSCODE插值表达式失效问题

GET https://cdn.jsdelivr.net/npm/vue2.6.14/dist/vue.js net::ERR_CONNECTION_-CSDN博客更换正确的vue域名 GET https://cdn.jsdelivr.net/npm/vue2.6.14/dist/vue.js net::ERR_CONNECTION_ <script src"https://unpkg.com/vue2.6.14/dist/vue.js"></sc…...

编程日记 2025/8/15 10:29:59

6.VTK 颜色

文章目录概念RGB示例HSV示例概念 RGB颜色系统：通过红(R)、绿(G)、蓝(B)三个颜色分量的组合来定义颜色。每个分量的取值范围是0到1，其中(0, 0, 0)代表黑色，而(1, 1, 1)代表白色。可以使用vtkProperty::SetColor(r, g, b)方法为Actor设置颜色…...

编程日记 2025/8/15 14:30:15

MQTTClient.c的线程模型与异步事件驱动

MQTTClient.c的线程模型与异步事件驱动 1. 多线程架构设计 MQTTClient.c通过分离网络I/O和用户逻辑线程实现异步通信，核心设计如下： sequenceDiagramparticipant 主线程 as 主线程（用户调用）participant 发送队列 as 发送队列pa…...

编程日记 2025/8/14 8:50:29

Flutter异常Couldn‘t find dynamic library in default locations

Flutter项目在Windows系统使用ffigen生成代码时报下面的错误： [SEVERE] : Couldnt find dynamic library in default locations. [SEVERE] : Please supply one or more path/to/llvm in ffigens config under the key llvm-path. Unhandled exception: Exception: …...

编程日记 2025/8/13 5:31:36

在PyCharm中部署AI模型的完整指南

引言随着人工智能技术的快速发展，越来越多的开发者开始将AI模型集成到他们的应用程序中。PyCharm作为一款强大的Python IDE，为AI开发提供了出色的支持。本文将详细介绍如何在PyCharm中部署AI模型，从环境配置到最终部署的完整流程。第一部分：准备工作 1. 安装PyCharm …...

编程日记 2025/8/15 14:28:34

6.6.图的广度优先遍历(英文缩写BFS)

树是一种特殊的图，树的广度优先遍历即层次遍历，所以会从树的角度入手图的广度优先遍历： BFS与DFS的区别在于，BFS使用了队列，DFS使用了栈一.广度优先遍历： 1.树的广度优先遍历： 详情见"…...

编程日记 2025/8/13 1:24:07

练习（杨辉三角、字符串旋转）

一、以下程序执行的结果： int main() {//0~255unsigned char a 200;//00000000000000000000000011001000//11001000 - a 截断unsigned char b 100;//00000000000000000000000001100100//01100100 - b unsigned char c 0;c a b;//11001000 - a//0110010…...

编程日记 2025/8/15 14:30:14

L1-7 矩阵列平移

题目给定一个 nn 的整数矩阵。对任一给定的正整数 k<n，我们将矩阵的偶数列的元素整体向下依次平移 1、……、k、1、……、k、…… 个位置，平移空出的位置用整数 x 补。你需要计算出结果矩阵的每一行元素的和。输入格式： 输入第一行给出…...

编程日记 2025/8/15 14:33:08

webgl入门实例-11模型矩阵 (Model Matrix)基本概念

WebGL 模型矩阵 (Model Matrix) 在WebGL和3D图形编程中，模型矩阵(Model Matrix)是将物体从局部坐标系(模型空间)转换到世界坐标系的关键变换矩阵。什么是模型矩阵？ 模型矩阵是一个4x4的矩阵，用于表示物体在世界空间中的位置、旋转和缩放。…...

编程日记 2025/8/15 14:33:06

【漫话机器学习系列】209.均值的标准误差（Standard Error of the Mean）

均值的标准误差（Standard Error of the Mean）详解在统计学中，我们经常会遇到“均值的标准误差”这个概念，英文称为 Standard Error of the Mean（简称 SEM）。它是对样本均值作为总体均值估计的可靠程度的一…...

编程日记 2025/8/13 15:24:58

Multi Agents Collaboration OS：文档合规性及质量检测助手设计及实践

文档审查及质量检测背景随着企业运营和知识管理的日益复杂，文档的合规性与质量成为确保信息准确、流程顺畅及风险控制的关键环节。传统上，人工进行文档的合规性和质量检测不仅耗时耗力，且易受主观因素影响，难以保证检测的全面性…...

编程日记 2025/8/15 14:33:11

Vue Teleport 及其在 SSR 中的潜在问题

Vue 3 的 Teleport 特性为开发者提供了更灵活的 DOM 结构控制能力，但在服务端渲染（SSR）场景中，它可能引发一些需要注意的问题。本文将深入探讨 Teleport 的核心机制及其在 SSR 中的使用陷阱。一、Teleport 核心机制解析 1. 基本…...

编程日记 2025/8/11 20:55:33

Fastapi 日志处理

uvicorn 日志处理总结： 一、日志的结构日志结构如下： {"version": 1,"disable_existing_loggers": false,"formatters": {},"handlers": {},"loggers": {} }loggers 用于定义日志处理最顶层的标识…...

编程日记 2025/8/11 5:53:35

FME实现矢量建筑面shp拉伸并贴纹理

文章目录效果2、数据准备3、整理流程图4、操作步骤4.1 打开软件4.2 添加shp数据4.3 添加Extruder转换器4.4 添加AppearanceSetter转换器4.5 添加png纹理数据4.6 添加输出节点4.7 添加Logger节点4.8 执行5、执行结果效果 2、数据准备（1）建筑面shp （2）纹理 test.png 其中s…...

编程日记 2025/8/11 18:02:01

仿腾讯会议项目实现——设置配置文件

目录 1、初始化配置 2、实现初始化配置的函数 3、修改配置文件内的ip地址 1、初始化配置 Ckernel.h 2、实现初始化配置的函数 3、修改配置文件内的ip地址首先修改IP 运行出现设置的IP， 找到运行的配置文件，修改成自己当前的ip 将函数运行条件改成非…...

编程日记 2025/8/14 9:52:13

1187. 【动态规划】竞赛总分

题目描述学生在我们USACO的竞赛中的得分越多我们越高兴。我们试着设计我们的竞赛以便人们能尽可能的多得分。现在要进行一次竞赛，总时间T固定，有若干类型可选择的题目，每种类型题目可选入的数量不限，每种类型题目有一个si(解答…...

编程日记 2025/8/13 10:16:38

从零开始学Python游戏编程31-类3

2.6 run()方法 run()方法的作用是在while循环中调用以上方法，运行游戏。代码如图11所示。图11 run()方法代码其中，第43行控制while循环的是实例属性running，在图7所示的__init__()方法中定义；第44-46行代码分别调用了processI…...

编程日记 2025/8/11 22:19:33

Transformer 架构 - 解码器 (Transformer Architecture - Decoder)

一、解码器整体结构：多层堆叠设计 Transformer解码器由N个相同结构的解码器层堆叠而成（通常N=6），每层包含三个核心子模块（图1） 1 5 12 ：带掩码的多头自注意力层（Masked Multi-Head Self-Attention）编码器-解码器注意力层（Encoder-Deco…...

编程日记 2025/8/13 13:28:41

解锁健康生活：养生新主张

在生活节奏日益加快的当下，健康养生不再是中老年人的专属话题，越来越多的人开始意识到，它是维持生命活力、抵御疾病的重要保障。中医养生讲究 “药食同源”，在饮食上，我们可以根据季节变化调整食谱。春天气候多变&…...

编程日记 2025/8/12 6:30:55

call 方法

__call__ 是 Python 中的一个魔法方法，也称为类方法。它的作用是将类的实例变成可调用对象，类似于像函数一样被调用。 __call__ 使用举例 class MyClass:def __call__(self, x, y):return x yobj MyClass() print(obj(1, 2)) 对比其他类/对象的使用…...

编程日记 2025/8/13 5:22:12

济南通过首个备案生活服务大模型，打造行业新标杆

近日，一则振奋人心的消息在人工智能领域传开：济南本土企业丽阳神州智能科技有限公司自主研发的 “丽阳雨露” 大模型成功通过国家网信办的备案。这一成果不仅是济南企业在科技创新道路上的重大突破，更标志着我国在生活服务领域的人工智能应用…...

编程日记 2025/8/11 23:07:32

文章目录

一、“补丁法”（Patching）

1.1 介绍

1.2 方法论

1.3 实例

二、判断工作的价值

2.1 介绍

2.2 详细思路

2.3 科研性vs工程性

三、novelty以及误区

3.1 介绍

3.2 举例

相关文章：