2025-04-09 吴恩达机器学习6——神经网络(1):介绍
文章目录
- 1 神经网络介绍
- 1.1 起源与发展
- 1.2 生物神经元 vs. 人工神经元
- 1.3 学习建议
- 2 案例:T 恤预测
- 2.1 基础概念
- 2.2 需求预测示例
- 2.3 多隐藏层神经网络
- 2.4 神经网络的优势
- 3 案例:图像感知
- 3.1 计算机视觉任务
- 3.2 神经网络架构
1 神经网络介绍
1.1 起源与发展
- 生物学灵感(1950s)
- 最初目标是模仿人脑神经元的学习机制(电信号传递与连接形成)。
- 现代神经网络已大幅简化,与真实大脑机制差异显著。

-
技术发展浪潮
-
1950s:首次提出 → 1980s-1990s:手写识别(邮政编码、支票处理) → 2005年后:以“深度学习”复兴。
-
“深度学习”术语因更易传播被广泛采用。
-
语音识别(首个成功领域)→ 计算机视觉(2012 ImageNet里程碑)→ NLP/推荐系统/医疗等。
-
1.2 生物神经元 vs. 人工神经元
对比维度 | 生物神经元 | 人工神经元 |
---|---|---|
结构 | 树突(输入)、轴突(输出)、细胞体 | 简化数学模型(输入→计算→输出) |
工作机制 | 电脉冲传递与动态连接 | 数值计算与固定权重传递 |
实际意义 | 人类思维的基础单元 | 工程化组件,无意识属性 |
吴恩达提醒
“不要过度关注生物学类比——现代深度学习依赖工程优化,而非神经科学。”
神经网络爆发的关键原因
-
数据量爆炸(互联网/数字化推动)
传统算法(如线性回归)性能随数据增长停滞,而神经网络持续提升。

-
硬件革命
GPU(图形处理器)的并行计算能力加速了大规模神经网络训练。
1.3 学习建议
-
历史教训
神经网络多次“失宠”说明:技术突破需匹配时代条件(数据+算力)。
-
行动指南
- 若数据量充足(如百万级样本),首选神经网络。
- 聚焦数学原理(如梯度下降),而非生物模拟。
- GPU 资源直接影响模型训练效率。
2 案例:T 恤预测
2.1 基础概念
神核心思想:神经网络模仿人脑神经元的工作方式,通过多层计算单元(神经元)从数据中学习复杂模式。
-
神经元(Neuron)
接收输入(如价格、运费),通过计算(如逻辑回归)输出一个值(如概率)。
公式表示:
a = σ ( w x + b ) ( Sigmoid函数: σ ( z ) = 1 1 + e − z ) a=\sigma(wx+b)\quad\left(\text{Sigmoid函数: }\sigma(z)=\frac1{1+e^{-z}}\right) a=σ(wx+b)(Sigmoid函数: σ(z)=1+e−z1)其中, a a a 是激活值(输出概率), w w w 是权重, b b b 是偏置。

-
类比
单个神经元像一台微型计算机,输入数字(特征),输出预测结果(如 T 恤是否畅销)。
2.2 需求预测示例
问题:基于以下特征,预测 T 恤是否会畅销:
- 价格(Price)
- 运费(Shipping Cost)
- 营销投入(Marketing)
- 材料质量(Material Quality)
神经网络结构
在神经网络中,层是一组神经元,将相同或相似的特征作为输入,然后一起输出一些数字。
- 输入层:4个特征(价格、运费、营销、材料)。
- 隐藏层:3 个神经元分别计算
- 负担能力(Affordability):价格 + 运费。
- 认知度(Awareness):营销投入。
- 感知质量(Perceived Quality):价格 + 材料质量。
- 输出层:综合隐藏层结果,输出畅销概率。

关键点
-
隐藏层自动学习特征组合(无需手动设计)。
-
输出层公式
P ( 畅销 ) = σ ( w 1 ⋅ Affordability + w 2 ⋅ Awareness + w 3 ⋅ Perceived Quality + b ) P(\text{畅销})=\sigma(w_1\cdot\text{Affordability}+w_2\cdot\text{Awareness}+w_3\cdot\text{Perceived Quality}+b) P(畅销)=σ(w1⋅Affordability+w2⋅Awareness+w3⋅Perceived Quality+b)
术语 | 解释 |
---|---|
输入层 | 原始特征(如价格、运费)。 |
隐藏层 | 中间层,计算新特征(如负担能力);数据中不可见,故称“隐藏”。 |
输出层 | 最终预测结果(如概率)。 |
激活( a a a) | 神经元输出值,反映特征重要性(如高营销 → 高认知度)。 |
权重( w w w) | 参数,决定输入对输出的影响程度(学习过程中自动调整)。 |
2.3 多隐藏层神经网络
更复杂场景:当问题需要更高阶特征时(如人脸识别),可堆叠多个隐藏层。
示例结构:
- 输入层 → 隐藏层 1(3 个神经元) → 隐藏层 2(2 个神经元) → 输出层。
- 每层输入为前一层的激活值,逐步抽象特征。

术语:
- 多层感知器(MLP):含多个隐藏层的神经网络。
- 深度神经网络:隐藏层数较多(如 ≥ 2)的神经网络。
2.4 神经网络的优势
- 自动特征工程:无需手动组合特征(如“价格×材料”),隐藏层自动学习有效特征。
- 对比传统方法:逻辑回归需人工设计多项式特征(如 x 1 × x 2 x_1\times x_2 x1×x2)。
- 灵活性:通过调整层数和神经元数量,适应不同复杂度的问题。
直观理解
- 隐藏层像“黑箱”,将原始数据转换为更易预测的表示(如“可负担性”比“价格+运费”更直接)。
3 案例:图像感知
3.1 计算机视觉任务
如何让神经网络识别图像内容(如人脸、汽车)?
- 输入表示:图像被存储为像素矩阵(如 1000×1000 分辨率),每个像素值为 0-255 的亮度(灰度)或 RGB 三通道值。
- 向量化:将像素矩阵展开为长向(1000×1000=1,000,000维),作为神经网络输入。

3.2 神经网络架构
-
输入层:1,000,000 维像素向量。
-
隐藏层
-
第一层:检测低级特征(如边缘、线条)。
示例:神经元 1 检测垂直线,神经元 2 检测 45° 斜线。
-
第二层:组合低级特征,检测面部部件(如眼睛、鼻子)。
-
第三层:整合部件,识别完整面部形状。
-
-
输出层:预测人物身份(如概率输出)。
网络提取特征顺序为边缘→部件→物体,下图中小神经元可视化实际上对应于图像中不同大小的区域。

只需向其提供不同的数据,神经网络就会自动学习检测不同的特征。同一网络结构在汽车数据集上:第一层仍检测边缘,但第二层学习车轮、车灯等部件,第三层识别整车。

相关文章:
2025-04-09 吴恩达机器学习6——神经网络(1):介绍
文章目录 1 神经网络介绍1.1 起源与发展1.2 生物神经元 vs. 人工神经元1.3 学习建议 2 案例:T 恤预测2.1 基础概念2.2 需求预测示例2.3 多隐藏层神经网络2.4 神经网络的优势 3 案例:图像感知3.1 计算机视觉任务3.2 神经网络架构 1 神经网络介绍 1.1 起源…...
Win11新功能更新:中文语音控制、游戏体验提升、锁屏更多广告
近日,微软在Windows 11发布预览版(Insider Release Preview Channel)中公布了即将正式推送的一系列新功能。这些更新体现了微软“持续创新”策略——不再依赖传统大型版本更新,而是以更高频率为用户带来功能改进。这一波新功能覆盖…...
Cursor编程-从入门到精通__0409
早期的Github Copilot 最近更新了,支持Agent编程,字节跳动Trae使用(免费),但成熟程度不如Cursor,Cursor前50次免费 Copilot VS Cursor*** 1,Cursor VSCode 二次开发,IDE级别 2&…...
【Leetcode-Hot100】移动零
题目 解答 首先,使用的解题思路是:使用两个指针,分别指向数组的第一个0元素位置,以该元素位置1为起始点寻找接下来第一个非0元素位置。二者确定后,对其进行交换。随后继续寻找下一个0元素位置。重复上述操作。 但第一…...
【力扣hot100题】(079)划分字母区间
感觉智商又回来了(松气)。 方法大概是先建立哈希表遍历数组记录每一个字母位置的跨度,然后再遍历数组,每次遇到跨度大于目前长度的字母,就将目前长度延申跨度的长度,然后继续遍历,知道位置已经…...
更改CMD背景图片
1.下载microsoft powershell 总之,电脑里面要有microsoft powershell这个应用 如下所示 进入界面后, 依次点击命令提示符和外观。 进入后,修改背景图片 2. 查看最终效果 最终我们打开CMD界面, 然后查看。 最终结果大功告成...
如何利用AI工具进行抠图
软件介绍 AIArty Image Matting是一款AI抠图软件,为了方便大家使用,我已经将软件所需的模型下载好。 首先要进行软件安装并运行,之后将“model”压缩包解压,把解压后的文件复制粘贴到“C:\ProgramData\Aiarty\ImageMatting”文件…...
一个很好用的vue2在线签名组件
在前端开发的日常工作中,我们常常会遇到需要用户进行在线签名的需求,比如电子合同签署、表单确认等场景。最近,我在项目里使用了一款极为好用的 Vue2 在线签名组件,今天就来和大家分享一下使用心得。 效果图 上代码 在 views 下…...
软考高级-系统架构设计师 案例题-软件架构设计
文章目录 软件架构设计质量属性效用树,质量属性判断必背概念架构风格对比MVC架构J2EE四层结构面向服务架构SOA企业服务总线ESB历年真题【问题1】 (12分)【问题2】(13分) 参考答案历年真题【问题1】(12分)【…...
计算机网络笔记-分组交换网中的时延
一、分组交换网络中的四种时延类型 1. 排队时延 在队列中,当分组在链路上等着被传输时的时延为排队时延,一个分组的排队时延长度取决于该分组前方等待传输的分组数量,如果排队队列为空,且没有正在传输的分组那么该分组的排队时延…...
数据结构与算法-图论-复习2(差分约束,强连通分量,二分图,LCA,拓扑排序,欧拉路径和欧拉回路)
7. 差分约束 原理 差分约束系统是一种特殊的不等式组,形如 xi−xj≤c。可以将其转化为图论中的最短路或最长路问题。 最短路求最大值:当我们要找出满足所有不等式的最大解时,使用最短路算法。对于不等式 xi−xj≤c,可以…...
git强制更新本地分支
你的需求是希望 自动拉取所有远程分支,并且在分支间存在冲突时 自动覆盖本地内容(不保留差异)。以下是优化后的解决方案: 最终解决方案(全自动强制覆盖) git fetch --all && for branch in $(git …...
PH热榜 | 2025-04-09
1. EZsite AI 标语:构建能够秒级产生收入的人工智能应用。 介绍:EZsite AI 让任何人都能轻松创建专业的网站和应用,不需要编写代码。它自动保存您的数据库信息,内置的 AI 聊天机器人能帮助您捕获潜在客户,并且通过 A…...
进度管理__制订进度计划_资源平衡和资源平滑
本文讲解的资源平衡与资源平滑,是制订进度计划的工具与技术的第3项: 资源优化。 1. 资源平衡 资源平衡是为了在资源需求与资源供给之间取得平等, 根据资源制约因素对开始日期和完成日期进行调整的一种技术。 如果共享资源或关键资源只在特定…...
【力扣hot100题】(080)爬楼梯
让我们掌声恭迎动态规划的始祖—— 最基础的动态规划,原始方法是维护一个数组,每次记录到该阶梯的方案数量,每次的数量是到上一个阶梯的方案数量加上到上上一阶梯的方案数量,因为只有两种走法。 进阶可以优化空间复杂度…...
redis_exporter服务安装并启动
redis_exporter服务安装并启动 1、介绍2、下载redis_exporter3、解压缩文件4、启动redis_exporter服务 1、介绍 Redis Exporter 是 Prometheus 官方推荐的 Redis 监控数据导出工具,用于将 Redis 实例的性能指标暴露为 Prometheus 可抓取的格式。 2、下载redis_exp…...
Spring Security 的核心配置项详解,涵盖认证、授权、过滤器链、HTTP安全设置等关键配置,结合 Spring Boot 3.x 版本最佳实践
以下是 Spring Security 的核心配置项详解,涵盖认证、授权、过滤器链、HTTP安全设置等关键配置,结合 Spring Boot 3.x 版本最佳实践: 1. 核心注解与配置类 (1) 启动安全配置 // 启动Web安全配置(推荐方式) Configura…...
Spring Boot 3.x 下 Spring Security 的执行流程、核心类和原理详解,结合用户描述的关键点展开说明,并以表格总结
以下是 Spring Boot 3.x 下 Spring Security 的执行流程、核心类和原理详解,结合用户描述的关键点展开说明,并以表格总结: 1. Spring Security 核心原理 Spring Security 通过 Filter 链 实现安全控制,其核心流程如下:…...
[leetcode]判断质数
一.判断质数 1.1 什么是质数 质数(素数)就是只可以被自己和1整除的数叫做素数/质数 1.2判断方法 #include<bits/stdc.h> using namespace std; bool isPrime(int num) { if(num < 1) { return false;//a number less of …...
【结肠息肉AI论文集】Cross-level Feature Aggregation Network for Polyp Segmentation
标注:同样是一期结肠息肉论文写作评鉴 摘要 从结肠镜图像中准确分割息肉在结直肠癌的诊断和治疗中起着关键作用。尽管在息肉分割领域已经取得了一定的成效,但仍存在诸多挑战。息肉通常具有多种大小和形状,并且息肉与其周围区域之间没有明显…...
Redis缓存之预热、击穿、穿透、雪崩
面试切入点 缓存预热 什么是预热? mysql假如新增100条记录,一般默认以mysql为准作为底单数据,如何同步到redis(布隆过滤器),这100条合法数据?? 为什么需要预热? mysql有100条新记录࿰…...
C++字符串复习
C字符串复习 前言 为了保证复习高效,以下不包括很简单的内容,例如cin。 C类型字符、字符串 输入方法 **char c getchar()**输入单个字符 string类型字符串 输入方法 getline(cin, str) 整行输入 常用方法 s.substr(pos, len):截取字…...
centos7安装mysql5.7.44
一、下载 下载地址:https://downloads.mysql.com/archives/community/ 二、安装 1、解压 tar -zxvf mysql-5.7.44-linux-glibc2.12-x86_64.tar.gz 2、创建mysql用户组和用户 # 创建mysql用户组 groupadd mysql# 创建用户并添加到mysql用户组中 useradd -r -g m…...
内存分配中的堆(Memory Heap)详解
在计算机科学中,"堆"这个术语确实容易让人混淆,因为它同时用于描述两种完全不同的概念:数据结构中的堆和内存管理中的堆。上次我们讨论了数据结构中的堆,今天我将详细解释内存分配中的堆(Memory Heap&#x…...
【大模型理论篇】关于生成式模型中联合分布概率学习必要性以及GPT是生成式模型的讨论
1. 背景 之前我们在《生成式模型与判别式模型对比(涉及VAE、CRF的数学原理详述)》以及《生成式模型算法原理深入浅出(涉及Stable Diffusion、生成对抗网络、高斯混合模型、隐马尔可夫模型、朴素贝叶斯等算法原理分析及生成式模型解释)》中,我…...
LeetCode738☞单调递增的数字
关联LeetCode题号738 本题特点 贪心,贪心在如果非单调递增,则想要保证数字整体最大,那低数位一定为9(所有数字中最大的) 本题思路 从后向前遍历,如果递增则 什么都不做如果非递增,增非递增位…...
本节课课堂总结
课堂总结: Spark运行架构: 运行架构: Spark 框架的核心是一个计算引擎,整体来说,它采用了标准 master-slave 的结构。 如下图所示,它展示了一个 Spark 执行时的基本结构。图形中的 Driver 表示 master&…...
MyBatis中特殊符号处理总结
前言 MyBatis 是一款流行的Java持久层框架,广泛应用于各种类型的项目中。因为我们在日常代码 MyBatis 动态拼接语句时,会经常使用到 大于(>,>)、小于(<,<)、不等于(<>、!)操作符号。由于此符号包含了尖括号,而 MyBatis 使用…...
【零基础实战】Ubuntu搭建DVWA漏洞靶场全流程详解(附渗透测试示例)
【零基础实战】Ubuntu搭建DVWA漏洞靶场全流程详解(附渗透测试示例) 一、DVWA靶场简介 DVWA(Damn Vulnerable Web Application)是专为网络安全学习者设计的漏洞演练平台,包含SQL注入、XSS、文件包含等10大Web漏洞模块&…...
若依前后端分离版本从mysql切换到postgresql数据库
一、修改依赖: 修改admin模块pom.xml中的依赖,屏蔽或删除mysql依赖,增加postgresql依赖。 <!-- Mysql驱动包 --> <!--<dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId> &l…...
【补题】Codeforces Round 974 (Div. 3) E. Rendez-vous de Marian et Robin
题意:给个图,两个人分别从点1和点n出发,问最早在哪个点可以相遇,其中某些点有马,骑上去之后可以在接下来剩余的时间内都可以将路程所需时间缩短一半。 关于题目数据见原题,这里说明太累了想偷懒Problem - 2…...
MySQL集群技术
当有数据时添加slave2 #从master节点备份数据 mysqldump -uroot -ptiminglee 1 > timinglee.sql 生产环境中备份时需要锁表,保证备份前后的数据一致 mysql> FLUSH TABLES WITH READ LOCK; 备份后再解锁 mysql> UNLOCK TABLES; mysqldump命令备份的数…...
Java 中的字节码
🔍 什么是 Java 字节码(Bytecode)? 字节码是 Java 源码(.java 文件)被编译后生成的中间代码(.class 文件),它不是机器码,而是一种 面向 JVM 的指令集。 可以…...
json 转 txt 用于 yolo 训练(可适用多边形标注框_python)
json 转 txt 用于 yolo 训练(可适用多边形标注框_python) import json import os import argparse from tqdm import tqdmdef convert_label_json(json_dir, save_dir, classes):json_paths os.listdir(json_dir)classes classes.split(,)for json_pa…...
SQL注入(SQL Injection)
目录 SQL注入(SQL Injection)是什么SQL注入的危害SQL注入的常见方式1. 经典注入(Error-Based Injection)2. 联合查询注入(Union-Based Injection)3. 时间盲注(Time-Based Blind Injection)4. 布尔盲注(Boolean-Based Blind Injection)5. 堆叠注入(Stacked Queries I…...
智慧厨房的秘密:当大模型遇见智能体
智慧厨房的秘密:当大模型遇见智能体 想象一下,一家餐厅里,顾客点了一份特别定制的菜肴。厨师不仅需要知道如何制作这道菜,还得根据当天的食材情况灵活调整配方,甚至考虑到顾客的口味偏好做出微调。这一切背后…...
IDEA遇到问题汇总
问题1:【异常】IDEA中报错:无效的目标发行版本 IDEA 报错:无效的源发行版-CSDN博客 【异常】IDEA中报错:无效的目标发行版本-CSDN博客 原因是:版本不兼容不一致,需要修改jdk、maven、以及目标字节码使之相一…...
状态管理组件Pinia 简介与底层原理 、Pinia 与其他状态管理库对比、Vue3 + Element Plus + Pinia 安装配置详解
一、Pinia 简介与底层原理 1. Pinia 简介 Pinia 是 Vue3 官方推荐的状态管理库,由 Vue 核心团队开发,旨在替代 Vue2 的 Vuex。其核心目标是提供一种更简洁、直观的状态管理方案,同时充分利用 Vue3 的响应式系统和 Composition API。 2. 底…...
本地部署 opik
本地部署 opik 1. 安装2. 访问 1. 安装 克隆代码, git clone https://github.com/comet-ml/opik.git使用 Docker compose 启动, cd opik/deployment/docker-compose docker compose up -d2. 访问 启动后,您可以在浏览器中访问 localhost:…...
操作系统之进程与线程的理解(一)
对进程的理解 进程是可以并发执行的程序在某个数据集合上的运行过程,是系统进行资源分配和调度的基本单位。进程由三部分组成,程序,数据和进程控制块(简称PCB)。简单的说,进程就是程序的一次执行 为确保进…...
JS 箭头函数
只能用于声明函数表达式更简洁。替代匿名函数 设置取消点击事件的默认行为 在这里插入图片描述...
Mb,Kb,byte,bits
1MB1024KB; 1KB1024byte(字节); 1byte8bits(位); 小蓝准备用 256MB 的内存空间开一个数组,数组的每个元素都是 32 位 二进制整数,如果不考虑程序占用的空间和维护内存需要的辅助空间…...
x265 中 aqMode 和 hevcAq 的深度解析与应用技巧
aqMode 和 hevcAq 介绍 在 x265 中基本继承了 x264 中 aqmode 的思想,此外还引入了 hevcAq 算法工具,在 x265_param 结构体中有这两个参数变量开关相关解释。从声明注释可以理解,aqMode 和 x264 中 aqmode 的思想完全相似,也扩展了些功能,属于通用型自适应量化方法,基于 …...
(一)基于云平台微调大模型,以deepseek-coder-6.7b为例
一、租借rtx4090卡并创建示例 如下图,我们进入jupyter界面,然后创建笔记本 二、提前下载好模型到本地 为了节省时间,我们需要提前下好模型deepseek-ai/deepseek-coder-6.7b-instruct,然后再上传到autodl上直接本地加载。 下载方…...
【Docker基础】全面解析 Docker 镜像:构建、使用与管理
文章目录 一、Docker 镜像(Docker Image)详解1.1 Docker 镜像的结构1.2 Docker 镜像的每一层(Layer)1.3 镜像的构建过程1.4 镜像的使用1.5 镜像的优势 二、为什么需要镜像三、镜像命令3.1 命令清单3.2 详细解释 四、docker 操作案…...
3. git config
文章目录 基本概述配置级别基本用法设置配置项查看配置项删除配置项 常用配置项 基本概述 git config 的作用是:设置用户信息、编辑器、别名、仓库行为等。 配置级别 级别作用范围配置文件路径命令选项仓库级别(Local)当前仓库.git/config…...
docker 运行自定义化的服务-前端
运行自定义化的前端服务 具体如下: ①打包前端项目,形成dist包 ②编写dockerfile文件,文件内容如下: # 基础镜像(镜像名:版本号TAG) FROM nginx:1.0 # 镜像作者和相关元数据 LABEL maintainer"Atb" \version"1.0…...
error: RPC failed; HTTP 408 curl 22 The requested URL returned error: 408
在git push时报错:error: RPC failed; HTTP 408 curl 22 The requested URL returned error: 408 原因:可能是推送的文件太大,要么是缓存不够,要么是网络不行。 解决方法: 将本地 http.postBuffer 数值调整到500MB&…...
JMH 基准测试实战:Java 性能对比的正确打开方式!
📖 摘要 在Java开发中,我们经常需要比较不同实现方式的性能差异。但如何科学、准确地进行性能测试呢?本文将带你深入理解JMH(Java Microbenchmark Harness)工具,通过实战演示如何正确编写和运行基准测试&a…...
etf可以T+0交易吗?
在我国的A股市场中,部分ETF基金支持T0交易,这为投资者提供了更灵活的交易策略。 支持T0交易的ETF基金类型包括: 货币型ETF:主要投资于货币市场工具,如短期债券和银行存款,具有较高的流动性。 债券型ETF&…...