当前位置: 首页 > news >正文

【人工智能基础2】人工神经网络、卷积神经网络基础、循环神经网络、长短时记忆网络

文章目录

    • 三、人工神经网络
      • 1. 神经元感知模型
      • 2. 神经网络模型
      • 3. 学习规则:修改神经网络的权重和偏置
        • 反向传播算法(BP)
        • 优化器 - 梯度下降法
    • 四、卷积神经网络基础(CNN)
      • 1. 基本原理
      • 2. 计算过程
    • 五、循环神经网络(RNN)
      • 1. 出现原因
      • 2. 基本逻辑
    • 六、长短时记忆网络(LSTM)

三、人工神经网络

人工神经网络模拟大脑神经系统工作原理,具备多种特性。

1. 神经元感知模型

在这里插入图片描述

从上图可以看到,人工神经网络中一个基本的神经元由以下几个部分组成:

  • 输入 ( Input ) : 一个神经元可以接收多个输入 { x 1 , x 2 , . . . , x n ∣ x i ∈ R } \{x_1,x_2,...,x_n|x_i∈R\} {x1,x2,...,xnxiR}
  • 权值(Weight):每个输入都有一个权值 w i ∈ R w_i∈R wiR
  • 偏置值(Bias):b∈R
  • 激活函数(Activate Function):激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数, 从而可以应用到众多非线性模型中
  • 输出(Output): 神经元输出,该输出可由下面公式计算:

y = f { Σ i = 0 n ( w i ∗ x i ) + b } y = f\{ Σ_{i=0}^n(w_i * x_i) +b \} y=f{Σi=0n(wixi)+b}

2. 神经网络模型

由输入层、隐藏层、输出层构成。
在这里插入图片描述

浅层神经网络浅而宽,需大量神经元;
含多个隐藏层的是深度神经网络,深层神经网络深而窄,层多但神经元少,参数少更节省资源,不过训练难度大。

例子:
以手写数字识别为例,输入层接收图像像素信息,隐藏层提取特征,输出层判断数字类别

 

3. 学习规则:修改神经网络的权重和偏置

反向传播算法(BP)

基本思想

监督学习算法,用于训练多层感知机
基于每层的输出与实际(标签)误差,调整感知机权值矩阵。接着估算前到层(上游)误差,反向传播误差,形成链式求解。

例如在语音识别模型训练中,根据语音输入对应的实际识别结果与正确语音标签的误差,反向调整各层神经元权值,使识别结果更准确。

在这里插入图片描述

 

学习过程

  • 正向传播求误差:输入数据从输入层经隐藏层计算传递到输出层,产生误差。初始化权值矩阵可采用随机值或经验值。以图像分类任务为例,输入图像数据,经各层计算得到分类结果,与实际类别对比得出误差。
  • 反向传播求偏导:将误差从输出层反向传递到输入层,计算权重修改量以更新权值。因Sigmoid激活函数易出现梯度减小甚至消失问题,深层卷积神经网络常采用ReLU函数替代。

 

激活函数:对神经元输入进行非线性变换,反映神经元非线性特性。
- 线性激活函数 f ( x ) = k x + c f(x) = kx + c f(x)=kx+c,用于线性神经网络,如简单线性回归模型。
- 符号激活函数 f ( x ) = { 0 , x < 0 1 , x > = 0 f(x)=\{^{1, x>=0}_{0, x<0} f(x)={0,x<01,x>=0 ,在某些决策场景中,根据输入简单判断输出0或1。
- Sigmoid激活函数 f ( x ) = 1 / ( 1 + e − x ) f(x)=1/(1+e^{-x}) f(x)=1/(1+ex) ,将输入映射到0 - 1区间,在逻辑回归中用于输出概率值。
- 双曲正切激活函数:图像呈S型,与Sigmoid类似,但值域为 - 1到1 ,在一些需要处理正负值的场景有应用。
- 高斯激活函数:呈正态分布形状,在特定信号处理等场景使用。
- ReLU激活函数 f ( x ) = { 0 , x < 0 x , x > = 0 f(x)=\{^{x, x>=0}_{0, x<0} f(x)={0,x<0x,x>=0 ,计算简单、梯度不消失,在卷积神经网络中广泛应用,如在图像特征提取中,能有效避免梯度消失问题,加快训练速度。

 

优化器 - 梯度下降法

致力于寻找函数极值点,应用于寻找损失函数极值点,实现模型自我优化。

批量梯度下降:每次迭代使用所有样本更新梯度。优点是能准确朝向极值方向,对梯度无偏估计且可并行计算;缺点是耗时、资源需求大,对非凸函数可能陷入局部最小值

随机梯度下降:每次迭代用一个样本,更新速度快,噪声有助于逃离局部最小值,提高泛化。但学习过程波动大。

每次迭代仅用一个样本更新参数。优点是更新速度快,增加噪声和随机性有助于逃离局部最小值、提高泛化误差;缺点是更新所有样本耗时,学习过程波动大。如在实时推荐系统中,可快速根据单个用户行为更新推荐模型参数。

小批量梯度下降:部分样本更新,计算速度快,不容易陷入局部最优解,但是有震荡。

使用部分样本(Batch Size)更新。兼具前两者优点,计算速度快且不易陷入局部最优解;缺点是学习过程有震荡,需增加学习率衰减项,Batch Size选择不当会出问题。在图像分类模型训练中,常选择合适Batch Size(如32、128)进行训练,平衡计算效率和模型性能 。

 

四、卷积神经网络基础(CNN)

1. 基本原理

  1. 输入层:输入图片。
  2. 卷积层:提取数据空间特征(图片中物体边缘、纹理),具有权重共享特性,减少参数量,防止过拟合。
  3. 池化层:(比如:最大池化)
    对特征图下采样(通过减少数据点的数量来降低数据的分辨率或维度),
    降低数据量,防止过拟合。
    更加关注整体特性:降低对噪声,细节的敏感度
  4. 全连接层:将卷积层和池化层提取的特征进行分类;
  5. softmax:归一化处理,将类别转化为每个概率。
  • 输入层:在图像卷积神经网络中,代表图片像素矩阵,三维矩阵的长、宽表示图像大小,深度表示色彩通道。如黑白图深度为1,RGB模式彩色图深度为3。从这开始,数据经不同架构转换,直至全连接层。例如输入一张224×224×3的彩色图片,作为网络处理的起始数据。
  • 卷积层:是核心部分,使用可学习的过滤器提取输入数据空间特征,使节点变得更深,获得更抽象特征。具有权重共享特性,能减少参数数量,防止过拟合。例如在图像识别中,通过卷积操作提取图像中物体的边缘、纹理等特征。
  • 池化层:对特征图下采样,减小特征维度,防止过拟合。不会改变三维矩阵深度,但缩小长宽,减少全连接层节点个数和网络参数。如在图像特征提取中,采用2×2的最大池化,将特征图尺寸减半,减少后续计算量。
  • 全连接层:经过卷积和池化提取特征后,用1 - 2个全连接层完成分类。将前一层输出展平连接到每个神经元,学习非空间特征并映射到输出。比如在手写数字识别中,全连接层将之前提取的数字特征映射到0 - 9的分类结果。
  • Softmax层:用于分类,通过Softmax函数得到输出属于不同种类的概率分布。例如在多分类任务中,确定图像属于某一类别的概率。

 

2. 计算过程

  • 卷积层计算
    • 参数设定:卷积核大小(如处理图片时常用3×3、5×5,深度与输入维度一致)、卷积核数量(寻找不同特征,随卷积增加以提取更多特征)、步长(决定卷积核滑动时每次移动像素数,一般1或2,影响输出数据空间大小)、零填充(常用以保持输入输出宽高相等)。
    • 计算过程:输入数据经卷积核计算得到特征图,特征图尺寸 W 2 = H 2 = ( W − K + 2 P ) / S + 1 W_2 = H_2 = (W - K + 2P) / S + 1 W2=H2=(WK+2P)/S+1,深度 D 2 = C o u t D_2 = C_{out} D2=Cout;参数量 C o u t × ( K × K × C i n + 1 ) C_{out} \times (K \times K \times C_{in} + 1) Cout×(K×K×Cin+1)。例如输入5×5×3图像,3×3×3卷积核,数量2,步长2,Padding = 1,得到3×3×2特征图。
  • 池化层计算:常用最大池化和平均池化缩小矩阵长和宽,不减少深度。如2×2最大池化,从2×2区域取最大值作为输出,减小矩阵尺寸,加快计算并防止过拟合。
  • 全连接层计算:起到分类器作用,将输入通过权重和偏置计算得到输出。如输入 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3,经权重系数计算得到 a 1 , a 2 , a 3 a_1,a_2,a_3 a1,a2,a3输出,在反向传播中,需对输入、权重系数、偏置系数求导以更新参数。

 

五、循环神经网络(RNN)

1. 出现原因

卷积神经网络层无连接,RNN记忆之前信息,隐藏层间有链接,输入包含(上一时刻)输出+隐藏层输出。

 

2. 基本逻辑

  • 卷积神经网络层间节点无连接,难以处理如预测句子中下一个单词这类需考虑前后单词关联的任务。RNN则可记忆之前信息并影响后续节点输出,其隐藏层间节点有连接,输入包含输入层输出与上一时刻隐藏层输出。例如预测“天空 很”之后的单词,需依据前文信息,RNN能利用这些信息提升预测准确性。
  • 结构:主体结构A的输入来自输入层 x t x_t xt和上一时刻隐藏状态 h t − 1 h_{t - 1} ht1,生成新隐藏状态 h t h_t ht与输出 O t O_t Ot。将其按时间展开后类似有N个中间层的前馈神经网络,可利用反向传播算法训练。由于在不同时间位置共享参数,能用有限参数处理任意长度序列。

计算

  • 应用场景:擅长处理时间序列相关问题,输出可为序列中下一个时刻的预测或当前时刻信息处理结果。如时间序列数据(商品不同时刻销量)或语言模型(单词对应的单词向量)。
  • 机器翻译示例:以翻译句子“ABCD”为例,RNN第一段输入依次为“A、B、C、D”及结束符“_”,此阶段无输出。从结束符开始进入翻译阶段,该阶段输入为上一时刻输出,最终输出翻译结果“XYZ”,输出“_”表示翻译结束。
  • 循环体前向传播流程:RNN可看作同一神经网络结构在时间序列上多次复制的结果,此结构即循环体。简单RNN循环体含两个全连接层,第一个全连接层输入为前一时刻状态与当前时刻输入拼接的向量,参数个数为(n + x) * n + n;第二个全连接层用于当前时刻输出,参数为n * x + x

 

六、长短时记忆网络(LSTM)

RNN难以学习长距离信息,容易出现梯度消失、爆炸的问题。LSTM可解决此问题。LSTM提出长短期记忆概念,保留需长期记忆的信息,要求遗忘特定信息。

产生背景
RNN处理长序列数据存在问题,如难以学习长距离信息,会丧失连接远信息能力,且易出现梯度消失和梯度爆炸问题。例如预测“I grew up in China…I speak fluent Chinese”最后的词,RNN难以利用远距离的“Chinese”信息。LSTM则可解决这些问题。

设计思想
借鉴人类处理自然语言经验,认为时间序列中信息价值不同,存在“关键词”等。LSTM提出“长短期记忆”概念,只有部分信息需长期记忆,且神经网络要学会遗忘特定信息。如阅读时会概括前文并用其理解后文。

链式结构与遗忘门
与RNN类似,LSTM也有重复模块链形式。以预测句子“I am from China.I am fluent in______”为例,LSTM会关注“China”并利用神经元记忆。其网络节点设计“遗忘门”,遇到句号时,遗忘门使网络忽略当前神经元存储的状态信息,即遗忘之前未用信息。

结构
LSTM链式结构中每个计算节点是有3个“门”结构的特殊网络。“门”由Sigmod神经网络和按位乘法运算构成,Sigmod输出0 - 1数值,决定输入信息通过量。遗忘门根据 x t x_t xt h t − 1 h_{t - 1} ht1决定保留或舍弃信息;输入门等结构协同工作,使神经网络更有效地保存长期记忆信息 。

 

相关文章:

【人工智能基础2】人工神经网络、卷积神经网络基础、循环神经网络、长短时记忆网络

文章目录 三、人工神经网络1. 神经元感知模型2. 神经网络模型3. 学习规则:修改神经网络的权重和偏置反向传播算法&#xff08;BP&#xff09;优化器 - 梯度下降法 四、卷积神经网络基础&#xff08;CNN&#xff09;1. 基本原理2. 计算过程 五、循环神经网络&#xff08;RNN&…...

如何查看windows系统的硬件环境(附方法

方法一&#xff1a;使用命令指示符查询 在“开始”菜单中搜索&#xff1a;命令指示符&#xff0c;并以管理员身份打开&#xff0c; 输入&#xff1a;systeminfo&#xff0c;就可以查看硬件、CPU、处理器等详细内容 systeminfo 方法二&#xff1a;在资源监视器中查看 按住 “…...

基于树莓派的水果分类系统(论文+源码)

针对小型农户的在水果加工销售环节中的分类需求&#xff0c;本文设计并实现了基于树莓派的视觉识别分类系统。本章根据所选水果的具体情况&#xff0c;简述系统各模块的实现方法&#xff0c;设计树莓派的程序算法&#xff0c;并选择合适的器件型号&#xff0c;开发所用的辅助工…...

Gemini Robotics:将人工智能带入物理世界

25年3月来自谷歌的技术报告“Gemini Robotics: Bringing AI into the Physical World”。 大型多模态模型的最新进展&#xff0c;已使数字领域出现卓越的通才能力&#xff0c;但将其转化为机器人等物理智体仍然是一项重大挑战。一般有用的机器人需要能够理解周围的物理世界&am…...

2.5[frontEnd]

requestAnimationFrame 是 浏览器原生 API&#xff0c;定义在 window 对象中&#xff0c;属于 Web API 的一部分。无需任何导入即可直接使用&#xff0c;其类型定义包含在 TypeScript 标准库中。 React 组件挂载时执行该 useEffect 初始化节流计时器 lastEmit 和 25ms 触发间隔…...

【动手学深度学习】#2线性神经网络

主要参考学习资料&#xff1a; 《动手学深度学习》阿斯顿张 等 著 【动手学深度学习 PyTorch版】哔哩哔哩跟李牧学AI 目录 2.1 线性回归2.1.1 线性回归的基本元素线性模型损失函数解析解随机梯度下降 2.1.3 最大似然估计 2.2 线性回归从零开始实现2.2.1 生成数据集2.2.2 读取数…...

C语言动态内存管理(上)

欢迎拜访&#xff1a;雾里看山-CSDN博客 本篇主题&#xff1a;C语言动态内存管理(上) 发布时间&#xff1a;2025.3.16 隶属专栏&#xff1a;C语言 目录 为什么需要动态内存管理静态分配的局限性动态分配的优势 动态内存函数malloc函数介绍函数使用 free函数介绍函数使用 calloc…...

图解多头注意力机制:维度变化一镜到底

目录 一、多头注意力机制概述二、代码实现1. pyTorch 实现2. tensorFlow实现 三、维度变化全流程详解1. 参数设定2. 维度变化流程图3. 关键步骤维度变化 四、关键实现细节解析1. 多头拆分与合并2. 注意力分数计算3. 掩码处理技巧 五、完整运行示例六、总结与常见问题1. 核心优势…...

Navicat如何查看密码

近期遇到需要将大部分已存储的navicat数据库转发给其他人&#xff0c;于是乎进行导出文件 奈何对方不用navicat&#xff0c;无法进行文件的导入从而导入链接 搜罗navicat的密码查看&#xff0c;大部分都为php代码解析 以下转载GitHub上看到的一个python代码解析的脚本 这里是对…...

第4节:分类任务

引入&#xff1a; 独热编码&#xff08;one-hot&#xff09;&#xff1a;对于分类任务的输出&#xff0c;也就是是或不是某类的问题&#xff0c;采取独热编码的形式将y由一离散值转化为连续的概率分布&#xff0c;最大值所在下标为预测类 输入的处理&#xff1a;对于任意一张…...

EasyCVR安防视频汇聚平台助力工业园区构建“感、存、知、用”一体化智能监管体系

在现代工业园区的安全管理和高效运营中&#xff0c;视频监控系统扮演着不可或缺的角色。然而&#xff0c;随着园区规模的扩大和业务的复杂化&#xff0c;传统的视频监控系统面临着诸多挑战&#xff0c;如设备众多难以统一管理、数据存储分散、智能分析能力不足、信息利用率低下…...

计算机网络——DNS

一、什么是DNS&#xff1f; DNS&#xff08;Domain Name System&#xff0c;域名系统&#xff09; 是互联网的核心服务&#xff0c;负责将人类可读的域名&#xff08;如 www.baidu.com&#xff09;转换为机器可识别的 IP地址&#xff08;如 14.119.104.254&#xff09;。它像一…...

STC89C52单片机学习——第20节: [8-2]串口向电脑发送数据电脑通过串口控制LED

写这个文章是用来学习的,记录一下我的学习过程。希望我能一直坚持下去,我只是一个小白,只是想好好学习,我知道这会很难&#xff0c;但我还是想去做&#xff01; 本文写于&#xff1a;2025.03.15 51单片机学习——第20节: [8-2]串口向电脑发送数据&电脑通过串口控制LED 前言…...

1.5[hardware][day5]

Link类跳转指令可以拆分为两个部分&#xff0c;一个是跳转&#xff0c;即下一个PC的生成&#xff0c;如果将分支条件的比较放到译码级来进行&#xff0c;则这部分只涉及取值级和译码级流水&#xff1b;另一个是Link操作&#xff0c;简单来说就是写寄存器&#xff0c;这部则主要…...

Java 多线程编程:提升系统并发处理能力!

多线程是 Java 中实现并发任务执行的关键技术&#xff0c;能够显著提升程序在多核处理器上的性能以及处理多任务的能力。本文面向初级到中级开发者&#xff0c;从多线程的基本定义开始&#xff0c;逐步讲解线程创建、状态管理、同步机制、并发工具以及新兴的虚拟线程技术。每部…...

Mininet 的详细设计逻辑

Mininet 是一个轻量级网络仿真工具&#xff0c;其核心目标是在单台物理机上快速构建复杂的虚拟网络拓扑&#xff0c;支持 SDN&#xff08;软件定义网络&#xff09;和传统网络协议的实验与验证。其设计逻辑围绕 虚拟化、模块化 和 灵活性 展开&#xff0c;以下是其详细设计架构…...

原生微信小程序实现导航漫游(Tour)

效果&#xff1a; 小程序实现导航漫游 1、组件 miniprogram/components/tour/index.wxml <!--wxml--> <view class"guide" wx:if"{{showGuide}}"><view style"{{guideStyle}}" class"guide-box"><view class&quo…...

Spring(6)——Spring、Spring Boot 与 Spring MVC 的关系与区别

Spring、Spring Boot 与 Spring MVC 的关系与区别 1. 核心定位 Spring 定位&#xff1a;基础框架&#xff0c;提供 IoC&#xff08;控制反转&#xff09; 和 DI&#xff08;依赖注入&#xff09; 核心功能&#xff0c;管理对象生命周期及依赖关系。功能&#xff1a;支持事务管…...

神聖的綫性代數速成例題2. 行列式的性質

性質 1&#xff1a;行列式與它的轉置行列式相等&#xff1a; 設為行列式&#xff0c;為其轉置行列式&#xff0c;則。 性質 2&#xff1a;交換行列式的兩行 (列)&#xff0c;行列式變號&#xff1a; 若行列式經過交換第行和第行得到行列式&#xff0c;則。 性質 3&#xff…...

ModelScope推理QwQ32B

文章目录 ModelScope推理QwQ32Bmodel_scope下载QwQ32BModelScope 调用QwQ-32B ModelScope推理QwQ32B 以下载 qwq32b 为例子 需要安装的 python 包 transformers4.49.0 accelerate>0.26.0 torch2.4.1 triton3.0.0 safetensors0.4.5可以使用 conda 创建一个虚拟环境安装 cond…...

使用unsloth进行grpo强化学习训练

说明 unsloth框架可以进行各种sft训练&#xff0c;包括lora和grpo训练。我参考官方方法&#xff0c;使用模型Qwen2.5-3B-Instruct和数据集gsm8k&#xff0c;写了一个grpo训练的例子。 代码 这个代码加载模型Qwen2.5-3B-Instruct和数据集gsm8k。训练完成后先保存lora模型然后…...

【c++】【智能指针】shared_ptr底层实现

【c】【智能指针】shared_ptr底层实现 智能指针之前已经写过了&#xff0c;但是考虑到不够深入&#xff0c;应该再分篇写写。 1 shared_ptr 1.1 shared_ptr 是什么 std::shared_ptr是一个类模板&#xff0c;它的对象行为像指针&#xff0c;但是它还能记录有多少个对象共享它…...

python拉取大视频导入deepseek大模型解决方案

使用Python拉取大视频并导入大模型&#xff0c;需要综合考虑数据获取、存储、处理和资源管理&#xff0c;确保高效稳定地处理大视频数据&#xff0c;同时充分利用大模型的性能&#xff0c;以下是分步方案及代码示例&#xff1a; --- 1. 分块下载大视频&#xff08;避免内存溢出…...

【Python】面向对象

编程的两大特点 面向过程&#xff1a;着重于做什么面向对象&#xff08; oop&#xff09;&#xff1a;着重于谁去做 python是面向对象语言&#xff0c;面向对象三大特点&#xff1a;封装、继承、多态 面向对象&#xff1a;便于代码管理&#xff0c;方便迭代更新。 新式类、经…...

leetcode日记(100)填充每个节点的下一个右侧节点指针

和层序遍历差不多的思路&#xff0c;将节点储存在队列里&#xff0c;一边取出节点一边放入取出节点的左右节点&#xff0c;直到队列空。 /* // Definition for a Node. class Node { public:int val;Node* left;Node* right;Node* next;Node() : val(0), left(NULL), right(NU…...

docker入门篇

使用docker可以很快部署相同的环境,这也是最快的环境构建,接下来就主要对docker中的基础内容进行讲解.Docker 是一个用于开发、交付和运行应用程序的开源平台&#xff0c;它可以让开发者将应用程序及其依赖打包到一个容器中&#xff0c;然后在任何环境中运行这个容器&#xff0…...

python语法

1. 前面先写import导入模块&#xff0c;完整的语法是&#xff1a; [from 模块名] import [模块 | 类 | 变量 | 函数 | *] [as 别名] 语法还可以是&#xff1a; from 模块名 import 功能名 如果import整个模块的话&#xff0c;需要用.功能名()&#xff0c;来用这个功能&#xff…...

Dify使用部署与应用实践

最近在研究AI Agent&#xff0c;发现大家都在用Dify&#xff0c;但Dify部署起来总是面临各种问题&#xff0c;而且我在部署和应用测试过程中也都遇到了&#xff0c;因此记录如下&#xff0c;供大家参考。Dify总体来说比较灵活&#xff0c;扩展性比较强&#xff0c;适合基于它做…...

微信小程序接入DeepSeek模型(火山方舟),并在视图中流式输出

引言&#xff1a; DeepSeek&#xff0c;作为一款先进的自然语言处理模型&#xff0c;以其强大的文本理解和生成能力著称。它能够处理复杂的文本信息&#xff0c;进行深度推理&#xff0c;并快速给出准确的回应。DeepSeek模型支持流式处理&#xff0c;这意味着它可以边计算边输…...

前端性能优化指标及优化方案

前端性能优化的核心目标是 提高页面加载速度、降低交互延迟、减少资源占用。常见的 Web 性能指标包括 LCP、FID、CLS、TTFB、TTI、FCP 等。 关键性能指标&#xff08;Web Vitals&#xff09; 指标优化方案 &#xff08;1&#xff09;LCP&#xff08;Largest Contentful Paint&…...

正则化介绍

简单介绍 正则化是用于控制模型的复杂度&#xff0c;防止模型在训练数据上过度拟合&#xff08;overfitting&#xff09;。正则化通过在模型的损失函数中引入额外的惩罚项&#xff0c;来对模型的参数进行约束&#xff0c;从而降低模型的复杂度。这个额外的惩罚通常与模型参数的…...

AI时代:数字媒体的无限可能

人工智能和数字媒体技术正深刻改变着我们的生活。通过大数据分析、机器学习等技术&#xff0c;人工智能不仅能精准预测用户需求&#xff0c;还能在医疗、金融等多个领域提供高效解决方案。与此同时&#xff0c;数字媒体技术的进步使得信息传播更加迅速和广泛。社会计算作为新兴…...

自动化爬虫drissionpage

自动化爬虫drissionpage官网 自动化测试框架&#xff1a;DrissionPage DrissionPage调用工具汇总 网络爬虫工具比较-DrissionPage、Selenium、Playwright...

禁毒知识竞赛主持稿串词

尊敬的各位领导、各位来宾、参赛选手们&#xff1a;大家好&#xff01; 在市禁毒委员会的领导下&#xff0c;今年我市开展了以“参与禁毒战争&#xff0c;构建和谐社会”为主题的禁毒宣传月活动。为了进一步加强我市禁毒宣传力度&#xff0c;促进社会治安的好转和社会主义物质文…...

【JDK17】Jlink一秒生成精简的JRE

之前介绍了 Java17模块化的JDK&#xff0c;模块化后按需使用Jlink 用于精简生成 JRE 环境&#xff0c;这让快速的开发环境增强了编码的愉悦感。在实际生产环境中使用 mave 进行项目的构建&#xff0c;其次再是精简 JRE 缩小容器镜像体积&#xff0c;为实现一体化的流程&#xf…...

机器学习周报--文献阅读

文章目录 摘要Abstract 1 文章内容1.1 模型结构1.1.1 LSTMAT的结构设置1.1.2 AWPSO算法优化模型 1.2 实验与结果讨论1.2.1 处理缺失数据1.2.2 模型评估指标1.2.3 比较实验1.2.4 消融实验&#xff08;ABLATION EXPERIMENTS&#xff09; 2相关知识2.1 自适应权重粒子群优化&#…...

硬件地址反序?用位操作为LED灯序“纠偏”。反转二进制数即可解决

特别有意思&#xff0c;LED的灯序与其硬件地址刚好相反&#xff0c;没办法直接通过加1实现二进制进位的亮灯操作&#xff0c;查了一些资料说用数组和switch实现&#xff0c;觉得太麻烦了&#xff0c;思索良久&#xff0c;就想到了反转二进制数解决这个问题。 reverse_bits( )是…...

A* floyd算法 bellman-ford

求源点到目标点最短距离 排序的里面要加上与目标点一个预估距离,与dj算法差距只有这儿 预估要小于等于真实的最短距离,吸引力要适当 越接近实际距离越快 #include<bits/stdc.h> using namespace std;// 方向向量&#xff1a;上、右、下、左 const vector<int> …...

【数据挖掘】KL散度(Kullback-Leibler Divergence, KLD)

KL散度&#xff08;Kullback-Leibler Divergence, KLD&#xff09; 是衡量两个概率分布 P 和 Q之间差异的一种非对称度量。它用于描述当使用分布 Q 逼近真实分布 P 时&#xff0c;信息丢失的程度。 KL散度的数学定义 给定两个离散概率分布 P(x)和 Q(x)&#xff0c;它们在相同的…...

Linux shell 进度条

概述 在 Linux Shell 中实现一个简单的进度条可以通过 printf 命令结合特殊字符来实现&#xff0c;以下是一个示例脚本&#xff0c;它模拟了一个从 0% 到 100% 的进度条。 作用 反馈任务进度&#xff1a;让用户直观了解任务执行的进展情况&#xff0c;比如文件拷贝、系统更新…...

ctfshow web刷题记录

RCE 第一题 eval代码执行 &#xff1a; 1、使用system 加通配符过滤 ?csystem("tac%20fl*") ; 2、反字节执行 xxx %20 echo 反字节 3、变量转移 重新定义一个变量 让他代替我们执行 4、伪协议玩法 ?cinclude$_GET[1]?>&1php://filter/readc…...

leetcode日记(101)填充每个节点的下一个右侧节点指针Ⅱ

意料之中有这题&#xff0c;将之前的思路换一下即可&#xff0c;层序遍历的思路将record&#xff08;记录下一个循环的次数&#xff09;手动加减。 /* // Definition for a Node. class Node { public:int val;Node* left;Node* right;Node* next;Node() : val(0), left(NULL)…...

大语言模型微调和大语言模型应用的区别?

1. 基本概念 微调&#xff08;Fine-tuning&#xff09; 定义&#xff1a;微调是指在预训练大语言模型的基础上&#xff0c;通过在特定领域或任务的数据上进一步训练&#xff0c;从而使模型在该特定任务上表现更优。 目的&#xff1a;适应具体的任务需求&#xff0c;比如法律文…...

Leetcode-131.Palindrome Partitioning [C++][Java]

目录 一、题目描述 二、解题思路 【C】 【Java】 Leetcode-131.Palindrome Partitioninghttps://leetcode.com/problems/palindrome-partitioning/description/131. 分割回文串 - 力扣&#xff08;LeetCode&#xff09;131. 分割回文串 - 给你一个字符串 s&#xff0c;请你…...

DeepSeek:开启机器人智能化的革命性突破

引言 在2025年全球机器人产业格局中&#xff0c;中国AI公司深度求索&#xff08;DeepSeek&#xff09;凭借开源机器人智能控制系统DeepSeek-R1&#xff0c;正在掀起一场从底层算法到应用生态的技术革命。不同于传统机器人依赖预设程序的局限&#xff0c;DeepSeek通过深度推理能…...

解决load()文件报错zipfile.BadZipFile: File is not a zip file

报错如下图&#xff1a; 有可能是资源没有关闭造成了错误&#xff0c;这个网上已经有很多解决方案了&#xff0c;大家可自行查阅。 如果你在别的地方都没有找到解决问题&#xff0c;那么可能是以下这种情况。 1、描述 我在服务器上的代码load()加载文件时&#xff0c;出现了…...

【Tools】Visual Studio Code安装保姆级教程(2025版)

00. 目录 文章目录 00. 目录01. Visual Studio Code概述02. Visual Studio Code下载03. Visual Studio Code安装04. Visual Studio Code配置05. 附录 01. Visual Studio Code概述 Visual Studio Code&#xff08;简称 VS Code&#xff09;是由微软开发的一款免费、开源且跨平台…...

Python库安装报错解决思路以及机器学习环境配置详细方案

文章目录 概要第三方库gdalmahotasgraphviznltk-datalazypredictscikit-surprisenb_extensions 机器学习GPU-torch安装torch_geometric安装ubuntu安装显卡驱动dlib安装torch-cluster、torch-scatter、torch-sparse和torch-geometricYOLOapextensorflow-gpu Python && P…...

ETIMEDOUT 网络超时问题

根据日志显示&#xff0c;你遇到的 ​**ETIMEDOUT 网络超时问题** 是由于 npm 无法连接到企业内部的 Nexus 仓库&#xff08;http://192.168.55.12:8001&#xff09;导致的。以下是具体原因和解决方案&#xff1a; 一、问题根源 ​Nexus 仓库不可达 日志中所有依赖包均尝试从 h…...

superset部署记录

具备网络条件的&#xff0c;完全可以一键部署&#xff0c;不需要折腾。网络条件不具备时&#xff0c;部署记录留存备查。 1、正常模式 详细介绍参考&#xff1a;【开源项目推荐】Apache Superset——最优秀的开源数据可视化与数据探索平台-腾讯云开发者社区-腾讯云 (tencent.c…...