当前位置: 首页 > news >正文

十二、人工神经网络及其应用

写在前面

这部分内容老师说很重要,不管是实验还是考试占比都非常大

AIGC的全称是“Artificial Intelligence Generated Content”,即人工智能生成内容。这一术语通常用于指代通过人工智能技术自动生成的各种类型的内容,如文本、图像、音频和视频等。随着AI技术的发展,AIGC在多个领域展现出广泛应用前景,例如自动新闻撰写、个性化推荐、智能客服、自动化设计等。

Begin

神经元与神经网络结构

首先介绍了生物神经元结构
在这里插入图片描述
在这里插入图片描述
上述四张ppt老师讲的比较少,我觉得应该不是重点,大部分的内容在高中也是学习过的。

下面开始步入正题:
首先介绍了神经元模型中的激活函数:
在这里插入图片描述
Rectified Linear Unit(修正线性单元),通常简写为ReLU,是人工神经网络中常用的一种激活函数。它的定义非常简单:对于输入x,如果x大于0,则输出x;如果x小于等于0,则输出0。用数学公式表示就是f(x) = max(0, x)。

ReLU函数由于其实现简单、计算效率高,并且能够有效缓解传统sigmoid和tanh等激活函数在深层网络训练过程中常见的梯度消失问题,因此在深度学习领域得到了广泛应用。不过,ReLU也有其缺点,比如可能导致某些神经元永远不被激活(即“死亡ReLUs”问题),针对这一问题,后来又出现了ReLU的变体,如Leaky ReLU、Parametric ReLU等,它们试图通过不同的方式解决这个问题。

神经网络的结构与工作方式

在这里插入图片描述
对于上图涉及到的文字,做出如下说明:

  1. 多个MP神经元的层叠

    • MP神经元指的是McCulloch-Pitts神经元模型,它是早期的人工神经元模型之一。这个模型由Warren McCulloch和Walter Pitts在1943年提出,是现代人工神经网络的基础。
    • 当提到“多个MP神经元的层叠”时,这实际上是指构建一个具有多层结构的人工神经网络。每层包含多个这样的神经元(节点),它们接收来自前一层的输入,并将处理后的结果传递给下一层。这种层叠的方式能够增加网络的深度,从而允许它学习更复杂的模式。
  2. 只有一层神经元

    • 这里的描述可能是在指单层感知机(Single-layer Perceptron)。单层感知机是一种仅包含输入层和输出层(没有隐藏层)的线性分类器。它的功能有限,只能解决线性可分的问题,即可以用一条直线(在二维情况下)或超平面(在多维情况下)分开的数据集问题。
  3. 感知机引入了学习的概念

    • 感知机是由Frank Rosenblatt在1957年提出的,它不仅是一个简单的线性分类模型,而且引入了通过训练数据自动调整权重的学习算法。这意味着感知机可以通过一系列的训练样本来优化其内部参数(权重),以提高对新数据进行正确分类的能力。这是机器学习中非常重要的一个里程碑,因为它首次展示了如何让机器从数据中“学习”。

在这里插入图片描述
单层感知机的工作原理
单层感知机通过学习确定一个决策边界(即上述提到的直线、平面或超平面),该边界用于区分不同的类别。对于给定的输入向量 x x x,感知机计算其与权重向量 w w w 的内积加上偏置 b b b f ( x ) = w ⋅ x + b f(x)=w \cdot x + b f(x)=wx+b。如果 f ( x ) f(x) f(x) 大于某个阈值,则预测为一类;否则,预测为另一类。

为什么只能解决线性可分的问题?
因为单层感知机仅使用线性组合(即加权和)加上一个简单的激活函数来做出决策,所以它本质上是在寻找一个线性的决策边界。这意味着它只能处理那些能够用线性方式分割的数据集。一旦数据集中的类别不能被任何线性边界清晰地分开(即非线性可分),单层感知机就无法正确地对所有样本进行分类。
在这里插入图片描述
关于上述内容,做如下说明:
给定训练数据集,单层感知机的权重 w i w_i wi 与阈值 θ \theta θ 可以很容易通过学习得到。
这句话的意思是,在给定一组训练数据后,单层感知机可以通过学习算法调整其权重 w i w_i wi 和阈值 θ \theta θ,以优化分类性能。

在单层感知机中,神经元的阈值 θ \theta θ 可看作一个固定输入为 -1 的“哑结点”所对应的连接权重 w m + 1 w_{m+1} wm+1,这样,权重和阈值的学习就统一为权值的学习了。

在单层感知机中,阈值 θ \theta θ 可以被视为一个特殊的权重 w m + 1 w_{m+1} wm+1,它对应于一个固定的输入值为 -1 的“哑结点”。这意味着阈值可以被包含在权重向量中,从而简化了权重更新的过程。

数学上,假设输入向量为 x = [ x 1 , x 2 , … , x m ] x = [x_1, x_2, \dots, x_m] x=[x1,x2,,xm],则加上阈值后的权重向量可以表示为
w = [ w 1 , w 2 , … , w m , w m + 1 ] w = [w_1, w_2, \dots, w_m, w_{m+1}] w=[w1,w2,,wm,wm+1],其中 w m + 1 w_{m+1} wm+1 对应于阈值 θ \theta θ。输入向量也相应地扩展为 x ′ = [ x 1 , x 2 , … , x m , − 1 ] x' = [x_1, x_2, \dots, x_m, -1] x=[x1,x2,,xm,1],这样权重更新就可以统一处理。

对训练样例 ( x , y ) (x, y) (x,y),若当前感知机的输出为 y ^ \hat{y} y^,则感知机权重调整规则为: w i ← w i + Δ w i w_i \leftarrow w_i + \Delta w_i wiwi+Δwi,其中 Δ w i = l ( y − y ^ ) x i \Delta w_i = l (y - \hat{y}) x_i Δwi=l(yy^)xi

这里描述的是权重更新的规则。对于每个训练样本 ( x , y ) (x, y) (x,y),感知机的预测输出为 y ^ \hat{y} y^,如果预测错误(即 y ≠ y ^ y \neq \hat{y} y=y^),则需要调整权重。
更新规则如下: w i ← w i + Δ w i w_i \leftarrow w_i + \Delta w_i wiwi+Δwi其中, Δ w i = l ( y − y ^ ) x i \Delta w_i = l (y - \hat{y}) x_i Δwi=l(yy^)xi

  • l l l 是学习率,通常是一个介于 0 和 1 之间的值,用于控制权重更新的速度。
  • y y y 是实际标签。
  • y ^ \hat{y} y^ 是感知机的预测输出。
  • x i x_i xi 是输入特征向量中的第 i i i 个元素。

假定损失函数是平方误差函数,即: L = 1 2 ( y − y ^ ) 2 L = \frac{1}{2} (y - \hat{y})^2 L=21(yy^)2

广义上的损失函数是用来衡量模型预测值与真实值之间的差异的。对于单层感知机,常用的损失函数是平方误差函数,因为它简单且易于计算梯度。

若感知机对训练样例 ( x , y ) (x, y) (x,y) 预测正确,则感知机不发生变化;否则根据错误程度进行权重的调整。
如果感知机对某个训练样本的预测是正确的(即 y = y ^ y = \hat{y} y=y^),那么权重不需要更新。如果预测错误(即 y ≠ y ^ y \neq \hat{y} y=y^),则根据错误的程度( y − y ^ y - \hat{y} yy^)调整权重。

对于为啥是上面这样计算的,下面给出一定的解释说明:
感知机的权重更新可以看作是一个简单的梯度下降过程。假设损失函数为平方误差函数:
L = 1 2 ( y − y ^ ) 2 L = \frac{1}{2} (y - \hat{y})^2 L=21(yy^)2我们希望最小化这个损失函数。根据梯度下降法,权重的更新方向应该是损失函数对权重 w i w_i wi 的偏导数的负方向:
Δ w i = − l ⋅ ∂ L ∂ w i \Delta w_i = -l \cdot \frac{\partial L}{\partial w_i} Δwi=lwiL
计算偏导数:
首先,感知机的输出为: y ^ = f ( w ⋅ x + b ) \hat{y} = f(w \cdot x + b) y^=f(wx+b)其中 f f f 是激活函数(如阶跃函数)。
假设激活函数暂时忽略(或简化为线性激活),则误差对权重的偏导数为:
∂ L ∂ w i = ∂ L ∂ y ^ ⋅ ∂ y ^ ∂ w i \frac{\partial L}{\partial w_i} = \frac{\partial L}{\partial \hat{y}} \cdot \frac{\partial \hat{y}}{\partial w_i} wiL=y^Lwiy^
∂ L ∂ y ^ = − ( y − y ^ ) \frac{\partial L}{\partial \hat{y}} = -(y - \hat{y}) y^L=(yy^)
∂ y ^ ∂ w i = x i \frac{\partial \hat{y}}{\partial w_i} = x_i wiy^=xi (因为 y ^ = w ⋅ x + b \hat{y} = w \cdot x + b y^=wx+b
因此: Δ w i = l ( y − y ^ ) x i \Delta w_i = l (y - \hat{y}) x_i Δwi=l(yy^)xi
在这里插入图片描述
在这里插入图片描述
对于上述左边的图,这四种叫法都是可以的,只是从不同的角度来叫的:

  • 2层网络 vs 3层网络:

    • 图中显示了输入层、隐含层和输出层。
    • 如果将输入层和输出层算作一层,则可以称为“3层网络”。
    • 如果只计算实际处理数据的层(即隐含层),则可以认为是“2层网络”。
    • 文字说明中提到:“这两种叫法都是可以的”,因此两种说法都正确。
  • 2个全连接层 vs 1个隐含层:

    • 全连接层是指每一层的神经元与前一层的所有神经元都有连接。
    • 在图中,输入层到隐含层以及隐含层到输出层都是全连接的,因此可以说有“2个全连接层”。
    • 隐含层只有一个,所以也可以说有“1个隐含层”。
    • 这两种说法从不同角度描述了网络结构,因此也是正确的。
  • 2层网络:

    • 这种说法通常包括输入层、隐含层(或多个隐含层)以及输出层。也就是说,从结构上讲,每一层都被计算在内。因此,在你的例子中,如果考虑到输入层、一个隐含层和输出层,整个网络可以被描述为一个“3层网络”。
  • 3层网络:

    • 另一方面,有时候输入层不被视为网络的一层,尤其是在描述网络的深度时。这是因为输入层实际上并不执行任何转换操作;它只是数据进入网络的地方。基于这个观点,只有实际进行计算的层(即隐含层和输出层)才被计入网络的层数。因此,在你的例子中,如果仅考虑执行计算的层,则该网络可以被描述为一个“2层网络”,即一个隐含层加上一个输出层。
      在这里插入图片描述

两层网络(线性模型)

对于一个简单的两层网络(即没有隐含层,只有输入层和输出层),我们可以将其视为一个线性分类器。假设输入为 x ∈ R n x \in \mathbb{R}^n xRn,权重向量为 w ∈ R n w \in \mathbb{R}^n wRn,偏置项为 b b b,则该模型的决策函数可以表示为:
f ( x ) = w ⋅ x + b f(x) = w \cdot x + b f(x)=wx+b这里的点积 w ⋅ x w \cdot x wx 表示权重向量和输入向量的内积。

如果 f ( x ) > 0 f(x) > 0 f(x)>0,我们预测类别为1;如果 f ( x ) < 0 f(x) < 0 f(x)<0,则预测类别为-1(或0,取决于二分类问题的具体设定)。这实际上定义了一个超平面 w ⋅ x + b = 0 w \cdot x + b = 0 wx+b=0 作为决策边界。因此,任何仅使用线性组合的模型只能生成线性的决策边界。

三层网络(包含非线性激活函数的模型)

当我们在网络中加入至少一个隐含层,并且每个神经元都应用非线性激活函数时,模型的表达能力会大大增强。考虑一个简单的三层网络,其结构包括输入层、一个隐含层和输出层。设输入为 x ∈ R n x \in \mathbb{R}^n xRn,隐含层有 m m m 个神经元,每个神经元都有自己的权重向量 W i ∈ R n W_i \in \mathbb{R}^n WiRn 和偏置项 b i b_i bi,以及一个非线性激活函数 g ( ⋅ ) g(\cdot) g(),如Sigmoid函数或ReLU函数等。

对于隐含层的第 i i i 个神经元,其输出可以表示为: h i = g ( W i ⋅ x + b i ) h_i = g(W_i \cdot x + b_i) hi=g(W

相关文章:

十二、人工神经网络及其应用

写在前面 这部分内容老师说很重要,不管是实验还是考试占比都非常大 AIGC的全称是“Artificial Intelligence Generated Content”,即人工智能生成内容。这一术语通常用于指代通过人工智能技术自动生成的各种类型的内容,如文本、图像、音频和视频等。随着AI技术的发展,AIG…...

vscode使用技巧

一、符号定位技巧 ‌跳转到定义‌ F12 或右键「Go to Definition」跳转到符号定义位置‌CtrlClick 直接点击符号跳转&#xff08;支持变量/函数/类&#xff09; ‌符号大纲视图‌ CtrlShiftO 打开文件符号大纲&#xff0c;支持模糊搜索符号名‌输入: 分类显示符号&#xff08;…...

测试基础笔记第七天

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、cat命令二、ls -al命令三、>重定向符号四、>>追加重定向符号五、less/more命令六、grep命令七、|管道符八、clear命令九、head命令十、tail命令十一、…...

FOC控制中的正弦PWM和空间矢量PWM对比与理解

参考&#xff1a; simple foc&#xff1a;https://docs.simplefoc.com/docs_chinese/foc_theory博客&#xff1a;https://blog.csdn.net/qq_43332314/article/details/126449398 一、无刷电机基础原理 1.&#xff0c; 原理图&#xff1a;至少三个绕组线圈&#xff08;定子&…...

【Oracle专栏】函数中SQL拼接参数 报错处理

Oracle相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 1.背景 最近同事反馈了一个很奇怪的问题,即有一个函数,入参是当前年月,主要作用是通过SQL语句将不合规的数据插入到指定表中,插入数据时带上入参的年月参数。当前问题:单独测试SQL没有问题可以执行成功,…...

无意间发现的宝藏项目:开源世界中的演示项目精选合集

&#x1f31f;无意间发现的宝藏项目&#xff1a;开源世界中的演示项目精选合集 最近在 GitHub 上随手翻了翻 Spring 官方代码仓库&#xff0c;意外发现一个超有趣的演示项目 —— spring-petclinic。一个轻量但结构完整的 Spring 全家桶演示&#xff0c;让人忍不住一探究竟。 这…...

OpenCSG AutoHub v0.5.0 版本发布

OpenCSG AutoHub v0.5.0 版本发布 作为一款智能化自动化操作的浏览器插件&#xff0c;AutoHub不断致力于为用户提供更加高效、便捷的网页浏览体验。本次 v0.5.0版本 的发布&#xff0c;不仅进一步强化了核心功能&#xff0c;还引入了一些创新特性&#xff0c;旨在帮助用户更智…...

基于Python智能体API的Word自动化排版系统:从零构建全流程模块化工作流与版本控制研究

基于Python智能体API的Word自动化排版系统:从零构建全流程模块化工作流与版本控制实践研究 1. 引言2. 研究背景与意义3. 自动排版工作流的设计原理3.1 文档内容提取与解析3.2 样式参数与格式化规则3.3 智能体API接口调用3.4 自动生成与批量处理3.5 与生成式AI的协同4. 系统架构…...

在 Node.js 中设置响应的 MIME 类型

在 Node.js 中设置响应的 MIME 类型是为了让浏览器正确解析服务器返回的内容&#xff0c;比如 HTML、CSS、图片、JSON 等。我们通常通过设置响应头中的 Content-Type 字段来完成。 ✅ 一、什么是 MIME 类型&#xff08;Content-Type&#xff09;&#xff1f; MIME&#xff08;…...

jsch(shell终端Java版)

学习笔记 Java SSH库使用简介&#xff1a;Apache sshd和JSch&#xff08;Java Secure Channel&#xff09; github - fork of the popular jsch library JSch学习笔记 web-shell - gitee代码 - 纯Java实现一个web shell登录Linux远程主机&#xff0c;技术选型 SpringBoot …...

Redis分布式锁RedLock机制详解

一、RedLock机制解决的问题 核心场景&#xff1a;解决传统Redis单节点/主从架构下分布式锁的不可靠问题。当主节点故障时&#xff0c;若从节点未同步锁信息&#xff0c;可能导致多个客户端同时持有锁&#xff0c;破坏互斥性。 典型问题案例&#xff1a; 主从切换锁丢失&…...

Vivado中Tri_mode_ethernet_mac的时序约束、分析、调整——(五)调试注意的问题

一、几个注意点 1、每个bank中IO的组织形式 1Bank的52Pins分4 Byte Group&#xff0c;每Byte Group 13PinsNibble_up 7Pins Nibble_low 6Pins。 每个nibble一个bitslice_control管理自己的6~7个pins 。 每个pin对应一个bitslice&#xff0c;它内部又包含多个component&#…...

MFC文件-写MP4

下载本文件 本文件将创作MP4视频文件代码整合到两个文件中&#xff08;Mp4Writer.h和Mp4Writer.cpp)&#xff0c;将IYUV视频流&#xff0c;PCM音频流写入MP4文件。本文件仅适用于MFC程序。 使用方法 1.创建MFC项目。 2.将Mp4Writer.h和Mp4Writer.cpp文件复制到项目目录下。 3…...

PyTorch 深度学习实战(39):归一化技术对比(BN/LN/IN/GN)

在上一篇文章中&#xff0c;我们全面解析了注意力机制的发展历程。本文将深入探讨深度学习中的归一化技术&#xff0c;对比分析BatchNorm、LayerNorm、InstanceNorm和GroupNorm四种主流方法&#xff0c;并通过PyTorch实现它们在图像分类和生成任务中的应用效果。 一、归一化技术…...

C#/.NET/.NET Core技术前沿周刊 | 第 35 期(2025年4.14-4.20)

前言 C#/.NET/.NET Core技术前沿周刊&#xff0c;你的每周技术指南针&#xff01;记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿&#xff0c;助力技术成长与视野拓宽。 欢迎投稿、推荐…...

柱状图QCPBars

一、QCPBars 概述 QCPBars 是 QCustomPlot 中用于绘制柱状图/条形图的类&#xff0c;支持单组或多组柱状图显示&#xff0c;可自定义宽度、颜色和间距等属性。 二、主要属性 属性类型描述widthdouble柱子的宽度&#xff08;坐标轴单位&#xff09;widthTypeWidthType宽度计算…...

2025-04-20 李沐深度学习4 —— 自动求导

文章目录 1 导数拓展1.1 标量导数1.2 梯度&#xff1a;向量的导数1.3 扩展到矩阵1.4 链式法则 2 自动求导2.1 计算图2.2 正向模式2.3 反向模式 3 实战&#xff1a;自动求导3.1 简单示例3.2 非标量的反向传播3.3 分离计算3.4 Python 控制流 硬件配置&#xff1a; Windows 11Inte…...

Nginx在微服务架构项目(Spring Cloud)中的强大作用

文章目录 一、Nginx是什么&#xff1f;二、Nginx在微服务架构&#xff08;Spring Cloud&#xff09;项目中的作用1.前端静态资源托管2.反向代理后端 API3.负载均衡4.SSL 证书与 HTTPS 支持5.缓存与压缩优化6.安全防护7.灰度发布与流量控制8.跨域处理&#xff08;CORS&#xff0…...

Mysql相关知识2:Mysql隔离级别、MVCC、锁

文章目录 MySQL的隔离级别可重复读的实现原理Mysql锁按锁的粒度分类按锁的使用方式分类按锁的状态分类 MySQL的隔离级别 在 MySQL 中&#xff0c;隔离级别定义了事务之间相互隔离的程度&#xff0c;用于控制一个事务对数据的修改在何时以及如何被其他事务可见。MySQL 支持四种…...

解决IDEA创建SpringBoot项目没有Java版本8

问题&#xff1a;idea2023版本创建springboot的过程中&#xff0c;选择java版本时发现没有java8版本&#xff0c;只有java17和java20 原因&#xff1a;spring2.X版本在2023年11月24日停止维护了&#xff0c;因此创建spring项目时不再有2.X版本的选项&#xff0c;只能从3.1.X版本…...

第十章:Agent 的评估、调试与可观测性:确保可靠与高效

引言 随着我们一步步构建出越来越复杂的 AI Agent&#xff0c;赋予它们高级工具和更智能的策略&#xff0c;一个至关重要的问题浮出水面&#xff1a;我们如何知道这些 Agent 是否真的有效、可靠&#xff1f;当它们行为不符合预期时&#xff0c;我们又该如何诊断和修复问题&…...

8节串联锂离子电池组可重构buck-boost均衡拓扑结构 simulink模型仿真

8节串联锂离子电池组 极具创新性 动态分组均衡策略&#xff0c;支持3种均衡模式 1.最高SOC电池给最低SOC电池均衡 2.高能电池组电池给最低SOC电池均衡 3.高能电池组电池给低能电池组电池均衡 支持手动设置均衡开启阈值和终止阈值 均衡效果非常好...

Oracle EBS COGS Recognition重复生成(一借一贷)

背景 月结用户反馈“发出商品”(实际为递延销货成本)不平,本月都是正常操作月结程序,如正常操作步骤如下: 记录订单管理事务处理 (Record Order Management Transactions)收集收入确认信息 (Collect Revenue Recognition Information)生成销货成本确认事件 (Generate COGS …...

Linux命令--将控制台的输入写入文件

原文网址&#xff1a;Linux命令--将控制台的输入写入文件-CSDN博客 简介 本文介绍Linux将控制台的输入写入文件的方法。 方案1&#xff1a;cat > file1&#xff08;推荐&#xff09; 普通用法 cat > file1 输入结束后&#xff0c;用CtrlD退出。 示例 使用root权限…...

使用BQ76PL455和STM32的SAE电动方程式电动汽车智能BMS

BMS对任何电动汽车来说都是必不可少的&#xff0c;它可以监控电池的行为&#xff0c;确保安全行驶。 该项目旨在降低成本&#xff0c;同时为每个电池模块提供可扩展的BMS。BQ76PL455具有监测6-16个单元的能力&#xff0c;8通道辅助输入(用于温度监测)和多达15个其他ic用于Daisy…...

OpenCV 模板与多个对象匹配方法详解(继OpenCV 模板匹配方法详解)

文章目录 前言1.导入库2.图片预处理3.输出模板图片的宽和高4.模板匹配5.获取匹配结果中所有符合阈值的点的坐标5.1 threshold 0.9&#xff1a;5.2 loc np.where(res > threshold)&#xff1a; 6.遍历所有匹配点6.1 loc 的结构回顾6.2 loc[::-1] 的作用6.2.1 为什么需要反转…...

7.0/Q1,Charls最新文章解读

文章题目&#xff1a;Anti-hypertensive medication adherence, socioeconomic status, and cognitive aging in the Chinese community-dwelling middle-aged and older adults ≥ 45 years: a population-based longitudinal study DOI&#xff1a;10.1186/s12916-025-03949-…...

【第三十二周】CLIP 论文阅读笔记

CLIP 摘要Abstract文章信息引言方法预训练推理Q&A 关键代码实验结果总结 摘要 本篇博客介绍了CLIP&#xff08;Contrastive Language-Image Pre-training&#xff09;&#xff0c;这是OpenAI于2021年提出的多模态预训练模型&#xff0c;其核心思想是通过对比学习将图像与文…...

在 Ubuntu 系统上安装 PostgreSQL

在 Ubuntu 系统上安装 PostgreSQL 的完整指南&#xff1a; 一、安装 PostgreSQL&#xff08;最新版本&#xff09; 1. 更新软件包列表&#xff1a; bash sudo apt update 2. 安装 PostgreSQL 和客户端工具&#xff1a; bash sudo apt install postgresql po…...

【MySQL】数据类型

&#x1f3e0;个人主页&#xff1a;Yui_ &#x1f351;操作环境&#xff1a;Centos7 &#x1f680;所属专栏&#xff1a;MySQL 文章目录 前言1. bit类型2.tinyint类型3. float类型4. decimal5. char类型6. varchar5&6 char和varchar的比较7.日期和时间类型8.enum和set总结 …...

Mac上Cursor无法安装插件解决方法

可能是微软的vscode被cursor这些新晋的AI-IDE白嫖够了&#xff0c;所以现在被制裁了&#xff0c;cursor下载不了vscode插件了。​需要自己修改扩展商店源。 近期微软调整了 API 鉴权策略或限制了非官方客户端的访问权限。 解决方案 一、找到 product.json 文件 打开终端&…...

PI0 Openpi 部署(仅测试虚拟环境)

https://github.com/Physical-Intelligence/openpi/tree/main 我使用4070tisuper, 14900k,完全使用官方默认设置&#xff0c;没有出现其他问题。 目前只对examples/aloha_sim进行测试&#xff0c;使用docker进行部署, 默认使用pi0_aloha_sim模型(但是文档上没找到对应的&…...

NumPy数组和二维列表的区别

在 Python 中&#xff0c;NumPy 数组和二维列表在性能方面存在诸多不同&#xff0c;下面从存储方式、内存占用、操作速度、缓存局部性这几个角度详细分析。 存储方式 二维列表&#xff1a;它是 Python 内置的数据结构&#xff0c;列表中的每个元素实际上是一个引用&#xff0…...

学习设计模式《四》——单例模式

一、基础概念 单例模式的本质【控制实例数目】&#xff1b; 单例模式的定义&#xff1a;是用来保证这个类在运行期间只会被创建一个类实例&#xff1b;单例模式还提供了一个全局唯一访问这个类实例的访问点&#xff08;即GetInstance方法&#xff09;单例模式只关心类实例的创建…...

构建具备推理与反思能力的高级 Prompt:LLM 智能代理设计指南

在构建强大的 AI 系统&#xff0c;尤其是基于大语言模型&#xff08;LLM&#xff09;的智能代理&#xff08;Agent&#xff09;时&#xff0c;Prompt 设计的质量决定了系统的智能程度。传统 Prompt 通常是简单的问答或填空式指令&#xff0c;而高级任务需要更具结构性、策略性和…...

NLP 梳理03 — 停用词删除和规范化

一、说明 前文我们介绍了标点符号删除、文本的大小写统一&#xff0c;本文介绍英文文章的另一些删除内容&#xff0c;停用词删除。还有规范化处理。 二、什么是停用词&#xff0c;为什么删除它们&#xff1f; 2.1 停用词的定义 停用词是语言中的常用词&#xff0c;通常语义…...

算法—插入排序—js(小数据或基本有序数据)

插入排序原理&#xff1a;&#xff08;适合小规模数据&#xff09; 将数组分为“已排序”和“未排序”两部分&#xff0c;逐个将未排序元素插入到已排序部分的正确位置。 特点&#xff1a; 时间复杂度&#xff1a;平均 O(n)&#xff0c;最优&#xff08;已有序&#xff09;O(n…...

家庭电脑隐身后台自动截屏软件,可远程查看

7-4 本文介绍一个小软件&#xff0c;可以在电脑后台运行&#xff0c;并且记录电脑的屏幕画面保存下来&#xff0c;并且可以远程提取查看。 可以用于记录长时间运行的软件的执行画面过程&#xff0c;或者用于记录家庭中小孩使用电脑的过程&#xff0c;如果没有好好上网课&…...

【Agent】AI智能体评测基座AgentCLUE-General

note AgentCLUE-General将题目划分为“联网检索”、“数据分析”、“多模态理解”和“多场景组合”任务AgentCLUE-General为每个题目都提供一个标准答案&#xff0c;将Agent智能体的答案与标准答案进行规则匹配判断对错 文章目录 note一、任务划分和场景划分二、答案提取的pro…...

最新iOS性能测试方法与教程

一、工具instrument介绍 使用Xcode的instrument进行测试&#xff0c;instrument自带了很多性能方面的测试工具&#xff0c;如图所示&#xff1a; 二、常见性能测试内容 不管是安卓还是iOS的性能测试&#xff0c;常见的性能测试都要包含这五个方面&#xff1a; 1、内存&#xff…...

多模态大语言模型arxiv论文略读(三十)

Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs ➡️ 论文标题&#xff1a;Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs ➡️ 论文作者&#xff1a;Ling Yang, Zhao…...

【AI论文】CLIMB:基于聚类的迭代数据混合自举语言模型预训练

摘要&#xff1a;预训练数据集通常是从网络内容中收集的&#xff0c;缺乏固有的领域划分。 例如&#xff0c;像 Common Crawl 这样广泛使用的数据集并不包含明确的领域标签&#xff0c;而手动整理标记数据集&#xff08;如 The Pile&#xff09;则是一项劳动密集型工作。 因此&…...

AI大模型发展现状与MCP协议诞生的技术演进

1. 大模型能力边界与用户痛点&#xff08;2023年&#xff09; 代表模型&#xff1a;GPT-4&#xff08;OpenAI&#xff09;、Claude 3&#xff08;Anthropic&#xff09;、通义千问&#xff08;阿里云&#xff09;等展现出强大的生成能力&#xff0c;但存在明显局限&#xff1a…...

从malloc到free:动态内存管理全解析

1.为什么要有动态内存管理 我们已经掌握的内存开辟方法有&#xff1a; int main() {int val 20;//在栈空间上开辟四个字节char arr[20] { 0 };//在栈空间上开辟10个字节的连续空间return 0; }上述开辟的内存空间有两个特点&#xff1a; 1.空间开辟的时候大小已经固定 2.数组…...

CSS值和单位

CSS值和单位 CSS 中的值和单位是构建样式的基础&#xff0c;它们定义了属性的具体表现方式。值用于定义样式属性的具体取值&#xff0c;而单位用于指定这些值的度量方式。CSS中常用的值和单位如下&#xff1a; 1.长度单位 px : 像素&#xff0c;绝对单位 em : 相对于元素的字…...

Redis高级篇之I/O多路复用的引入解析

文章目录 一、问题背景1. 高并发连接的管理2. 避免阻塞和延迟3. 减少上下文切换开销4. 高效的事件通知机制5. 简化编程模型6. 低延迟响应本章小节 二、I/O多路复用高性能的本质1. 避免无意义的轮询&#xff1a;O(1) 事件检测2. 非阻塞 I/O 零拷贝&#xff1a;最大化 CPU 利用率…...

FTP协议命令和响应码

文章目录 &#x1f4e6; 一、什么是 FTP 协议&#xff1f;&#x1f9fe; 二、FTP 常见命令&#xff08;客户端发送&#xff09;&#x1f4e1; 三、FTP 响应码&#xff08;服务端返回&#xff09;&#x1f4cc; 响应码分类&#xff08;第一位&#xff09;✅ 常见成功响应码&…...

在win上安装Ubuntu安装Anaconda(linx环境)

一&#xff0c;安装Ubuntu 1. 在 Microsoft 商城去下载Ubuntu(LTS:是长期维护的版本) 2.安装完之后启动程序&#xff0c;再重新打开一个黑窗口&#xff1a; wsl --list --verbose 3.关闭Ubuntu wsl --shutdown Ubuntu-22.04 WSL2 Ubuntu-20.04文件太占c盘空间&#xff0c;…...

【Elasticsearch入门到落地】11、RestClient初始化索引库

接上篇《10、初始化RestClient》 上一篇我们已经完成了RestHighLevelClient的初始化工作&#xff0c;本篇将正式进入索引库的创建阶段。我们将使用Java代码来创建酒店数据的索引库。 一、准备工作 1. 创建常量类 首先&#xff0c;我们需要定义一个常量类来存放索引库的mappi…...

远程服务调用的一些注意事项

引言 最近工作中&#xff0c;遇到了一些关于远程服务调用的问题&#xff0c;背景是调用三方接口获取某些特征数据&#xff0c;但由于调用出现了超时&#xff0c;导致业务本身的接口的可用行降低。因此整理一些远程服务调用时的注意事项&#xff0c;通过不同维度的考虑来提高系…...