当前位置: 首页 > news >正文

机器学习 - 大数定律、可能近似正确学习理论

一、大数定律:

大数定律是概率论中的一个基本定理,其核心思想是:当独立重复的随机试验次数足够大时,样本的平均值会趋近于该随机变量的期望值。下面从直观和数学两个角度来说明这一概念:

1. 直观理解

  • 重复试验的稳定性
    设想你不断地抛掷一枚公平的硬币,每次记录正面出现的概率(记为1)和反面(记为0)。虽然单次抛掷的结果是随机的,但如果你抛掷很多次,正面出现的比例会越来越接近于理论概率0.5。这就是大数定律的直观含义:随着试验次数的增加,实际观察到的平均值(例如正面出现的比例)会趋向于理论上的预期值(0.5)。

  • 稳定的长期平均
    类似地,若你测量一个随机现象(例如每日的气温、股票的收益率等),虽然每天的数值可能波动较大,但经过足够多天的平均计算后,这个平均值会越来越接近于随机现象的真实均值。

2. 数学表述

大数定律有两种常见形式:

  • 弱大数定律这意味着“以概率收敛”。

  • 强大数定律
    在更强的意义上,强大数定律说明样本平均值几乎必然收敛到期望值:

    也就是说,对于几乎所有可能的试验序列,样本平均最终都会收敛到 μ\mu。

3. 应用举例

掷骰子例子
假设你有一枚公平的六面骰子,每个面分别标有1到6。其数学期望为:

  • 如果你只掷一次,结果可能是3、4或其他任何数字,和期望值3.5相差较大。
  • 当你掷 100 次后,将这100次结果的平均值计算出来,平均值会接近于3.5。
  • 随着掷骰子次数不断增加(例如达到几千、几万次),平均值会越来越接近3.5,最终趋于稳定。这正是大数定律所描述的现象。

4. 总结

大数定律告诉我们,通过大量重复试验,我们可以获得稳定的长期平均结果,这个平均结果将非常接近理论上的数学期望。这一原理为统计推断和许多实际应用(如质量控制、金融风险评估等)提供了理论基础和保证。

二、PAC 学习理论

要确定一种学习方法是否为PAC可学习,我们需要证明:

  • 对任意 ϵ和 δ,算法都能以至少 1−δ 的概率输出错误率低于 ϵ 的假设,
  • 而所需样本量是 1/ϵ 和 1/δ 及模型复杂度的多项式函数。

这种理论框架为我们提供了在数据足够多时,学习算法能够在理论上保证近似正确性的数学保证。

当使用机器学习方法来解决某个特定问题时,通常靠经验或者多次试验来 选择合适的模型、训练样本数量以及学习算法收敛的速度等。但是经验判断或 多次试验往往成本比较高,也不太可靠,因此希望有一套理论能够分析问题难 度、计算模型能力,为学习算法提供理论保证,并指导机器学习模型和学习算法 的设计,这就是计算学习理论。

计算学习理论(Computational Learning The- ory)是机器学习的理论基础,其中最基础的理论就是可能近似正确(Probably Approximately Correct,PAC)学习理论.

1、基本概念

一个PAC 可学习(PAC-Learnable)的算法:能够在多项式时间内从合理数量的训练数据中学习到一个近似正确的 𝑓(𝒙).

即:在给定足够样本的前提下,模型能以高概率达到预期的低错误率

  • “近似正确”
    模型可能不会完全正确,但只要错误率低于一个我们可以容忍的阈值 ϵ(比如5%),就认为模型是近似正确的。

  • “可能”
    我们不能保证每次训练都能得到近似正确的模型,但可以通过足够多的样本和合适的算法,保证模型以至少 1−δ 的概率(例如99%)达到错误率小于 ϵ。

  • 样本复杂度
    PAC理论还告诉我们,为了达到这种可能近似正确的效果,需要的样本数量是多项式级别的(依赖于 1/ϵ​ 和 1/δ​)。这给出了一个理论上的数据要求。

2、上文提到的“需要的样本数量是多项式级别的”如何理解?

在 PAC 学习理论中,“需要的样本数量是多项式级别的”意味着,为了使学习算法以至少 1−δ 的概率达到误差不超过 ϵ 的性能,所需的训练样本数量 m 可以被一个关于 1/ϵ、1/δ 以及问题复杂度(如 VC 维度)的多项式函数上界。例如,理论上我们可能证明:

这表示当我们要求更高的准确性(即 ϵ越小)或更高的置信度(即 δ 越小)时,所需的样本数不会呈指数级增长,而是以多项式形式增长,从而在实际中通常是可接受且计算上可行的。

直观理解:

  • 多项式增长 vs. 指数增长
    如果样本数量随着精度要求的提高是指数级增长,那么即使要求稍微高一点的精度,也可能需要天文数字级别的样本,这在现实中几乎是不可能实现的。而多项式增长则说明样本数量的增长是相对“温和”的,比如如果 ϵ 变为原来的一半,所需样本数量可能增加到原来的几倍,而不是指数级别的增长。

  • 可学习性保证
    多项式级别的样本复杂度是 PAC 学习理论中可学习性的一个重要标志。这意味着,只要样本数量满足这个多项式上界,我们就能以高概率获得一个近似正确的模型。这给了我们理论保证在实际问题中,只要数据量足够,算法就能学得足够好

举例说明:

3、如何理解多项式、多项式级别、多项式时间?

这里要彻底理解PAC的概念,就必须弄清楚”样本复杂度“为什么强调“需要的样本数量是多项式级别的”,而不是指数级的。下面我们深入理解一下多项式的概念。

  1. 多项式

    • 定义
      数学上,多项式是由变量的不同幂次项和常数系数组成的表达式。例如,函数 就是关于变量 n 的一个多项式。
    • 直观理解
      多项式可以看作是变量的幂次的加权求和,描述了一个数值随变量变化的规律。
  2. 多项式级别

    • 定义
      当我们说某个量的增长是“多项式级别”的,意思是它随问题规模或参数变化的增长速度可以用一个多项式函数来描述,而不是更快的(例如指数级)的增长。
    • 直观理解
      例如,在机器学习中,如果某个问题的样本复杂度是多项式级别的,意味着随着精度要求(如 1/ϵ 或 1/δ)的提高,所需要的样本数增长速度是 O((1/ϵ)^k)(其中 k 是常数),而不是 2^{1/ϵ} 这样指数式增长。多项式级别的增长通常认为是“合理”且计算上可行的。
  3. 多项式时间

    • 定义
      在计算复杂度理论中,多项式时间指的是一个算法的运行时间上界可以表示为输入规模 n 的某个多项式函数,比如 O(n^2) 或 O(n^3)。
    • 直观理解
      如果一个算法在最坏情况下的运行时间是多项式时间,那么当输入规模增加时,运行时间不会爆炸式增长。这种算法被认为是高效且实用的,与之对比的是指数时间算法,其运行时间会随着输入规模呈指数增长,通常难以在大规模问题中应用。

    总结

  • 多项式:一种数学表达式,如
  • 多项式级别:描述增长速度,可以用多项式函数表示的增长,例如样本复杂度随参数的多项式增长。
  • 多项式时间:算法运行时间随输入规模呈多项式增长,表明算法是高效的。

这些概念在理论和实际中都非常重要,因为它们帮助我们评估和设计可行且高效的算法与系统。

4、简单例子:垃圾邮件分类

假设我们要构建一个垃圾邮件分类器,我们希望它在预测时错误率不超过5%(ϵ=0.05\epsilon = 0.05ϵ=0.05),并且希望这种效果在99%的情况下成立(δ=0.01\delta = 0.01δ=0.01)。

  • 任务描述
    给定一批邮件(数据集),每封邮件都有标注(垃圾邮件或正常邮件)。我们训练一个分类器来判断邮件是否为垃圾邮件。

  • PAC观点
    根据PAC理论,只要我们收集的邮件样本足够多(样本数量达到理论上需要的多项式级别),我们的分类器就能在至少99%的概率下(即失败概率小于1%)实现错误率低于5%的近似正确分类。

  • 直观理解
    这就像是我们做一个测验,只要考生做足够多的题目,最终得分会稳定在一个接近真实能力的水平。这里,“足够多的题目”对应的是样本量,“接近真实能力”对应的是分类器的低错误率,而“99%的概率”则说明大多数情况下(偶尔可能由于运气不好,模型表现稍差,但概率极低),我们的模型都能达到这个标准。

5、关于PAC需要特别注意

PAC学习理论为我们提供了一个理想化的框架,用来描述在一定条件下(如数据独立同分布、假设空间复杂度受控等),算法能够以高概率学习到近似正确模型的情况。但这并不意味着所有的学习问题都能满足PAC学习理论的条件。具体来说:

  • 假设条件限制:PAC理论要求训练数据满足独立同分布(i.i.d.),并且模型的假设空间(例如由VC维度度量)不能太复杂。对于一些实际问题,数据可能存在依赖性或噪声模型复杂度较高,这时就不一定能严格满足PAC理论的假设。

  • 应用范围局限:PAC理论主要适用于监督学习中的分类和回归问题,而对于在线学习、强化学习、半监督学习等其他学习范式,PAC框架可能不完全适用或需要扩展。

  • 理论与实际的差距:虽然PAC理论为我们提供了理论上的可学习性保证和样本复杂度上界,但实际问题中往往会遇到一些违反理论假设的情况。因此,有些学习算法在实践中表现良好,但它们可能不满足PAC理论中的所有严格条件。

PAC学习理论是一种非常重要且有用的理论工具,但它描述的是在特定条件下学习算法的行为,并不覆盖所有学习问题的情形。实际应用时,我们需要根据具体问题的特点和数据的性质,判断是否可以借助PAC理论来解释和预测算法的学习性能。

三、这里我们附加理解一下VC 维度的概念

1、“Vapnik–Chervonenkis Dimension”这个术语由三部分组成:

  1. VapnikChervonenkis
    这两个词都是人名,分别来自数学家 Vladimir Vapnik 和 Alexey Chervonenkis。他们是统计学习理论的重要奠基人,特别是在模式识别和机器学习领域做出了开创性贡献。

  2. Dimension
    英文中“dimension”意思是“维度”,在这里表示一种度量标准,用来衡量一个假设空间(模型的集合)的复杂性或表达能力。

2、定义

  • 简单来说,VC 维度表示一个模型能够“打散”(shatter)数据点的最大数量。
  • “打散”意味着模型可以针对某组数据点实现任意的二分类标签组合。
  • VC 维度(Vapnik–Chervonenkis Dimension)是用来衡量一个假设空间(即模型的可能函数集合)复杂度的指标。

3、意义

  • 如果一个模型的 VC 维度越大,表示它的表达能力越强,能够拟合更复杂的数据模式,但同时也更容易过拟合。
  • VC 维度在 PAC 学习理论中起着重要作用,通常用于描述模型的样本复杂度(即需要多少样本才能保证模型以高概率达到近似正确)。

4、例子

  • 在二维平面上,线性分类器(直线)能打散的最大点数是3(VC 维度为3)。这意味着存在一些三点配置(非共线的三个点),线性分类器可以通过选择不同的直线对这三个点实现任意分类,但对于4个点就无法总是实现任意分类。
  • 而更复杂的模型(如决策树或神经网络)可能具有更高的 VC 维度,能打散更多的点,但这也意味着它们需要更多的训练样本来避免过拟合。

5、对上面例子的解释:

VC 维度(Vapnik–Chervonenkis Dimension)直观上反映了一个分类器(或假设空间)的“表达能力”——也就是它能够用来实现任意二分类的样本点的最大数量。如果一个模型可以对某个点集的所有可能标签组合都找到对应的分类边界,则称该模型能“打散”(shatter)这个点集,而 VC 维度就是能被打散的最大点数。

为什么二维平面上直线的 VC 维度是 3?

  • 打散定义
    对于一个给定的点集,如果对于这个点集的每一种可能的二分类标签(即每个点被标为正或负),都存在一条直线能够将正类与负类完全分开,则称这个点集可以被直线打散。

  • 三点情况
    在二维平面中,假设你有3个非共线的点。无论这3个点如何被标记(共有 23=82^3=8 种可能的标记组合),都能找到一条直线将它们按照给定标签分开。直线在二维平面上的灵活性足以实现这种任意分割,因此直线能打散任意3个非共线的点。

  • 四点情况
    当点的数量增加到 4 时,并非所有可能的4点配置都能被直线打散。举个常见的例子,当4个点呈凸四边形分布时,假设有一种标签组合:把对角线上两个点标记为正类,另外两个标记为负类。对于这种情况,不存在一条直线能够同时将正类和负类完全分离。也就是说,直线无法实现所有4点上 24=162^4=16 种可能的分类,因此直线的 VC 维度就限定在 3。

总结

  • VC 维度是衡量模型能“打散”多少个点的指标。
  • 在二维平面中,直线能够打散任意3个非共线的点,但对于4个点总会存在至少一种标签组合无法分割,所以直线的 VC 维度是 3。

这种直观理解帮助我们认识到,不同模型的复杂度和表达能力存在差异,VC 维度就是其中一个衡量工具。在实际应用中,VC 维度越大,模型理论上就有更强的拟合能力,但也可能更容易过拟合,需要更多的数据来控制模型复杂度。

相关文章:

机器学习 - 大数定律、可能近似正确学习理论

一、大数定律: 大数定律是概率论中的一个基本定理,其核心思想是:当独立重复的随机试验次数足够大时,样本的平均值会趋近于该随机变量的期望值。下面从直观和数学两个角度来说明这一概念: 1. 直观理解 重复试验的稳定…...

Kotlin 2.1.0 入门教程(十七)接口

接口 接口可以包含抽象方法的声明,也可以包含方法的实现。 接口与抽象类的不同之处在于,接口无法存储状态。接口可以拥有属性,但这些属性要么必须是抽象的,要么就得提供访问器的实现。 接口使用 interface 关键字来定义&#x…...

USB Flash闪存驱动器安全分析(第一部分)

翻译原文链接:Hacking Some More Secure USB Flash Drives (Part I) | SySS Tech Blog 文章翻译总结:文章对一些具有AES硬件加密的USB闪存驱动器的网络安全分析研究。研究由SySS的IT安全专家Matthias Deeg进行,他在2022年初发现了几个安全漏…...

报名丨Computer useVoice Agent :使用 TEN 搭建你的 Mac Assistant

与 TEN 相聚在「LET’S VISION 2025」大会,欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊,功能新鲜上线,线下首波体验! 📅 TEN 展位:2025年3月1日-2日 TEN workshop&#x…...

常用架构图:业务架构、产品架构、系统架构、数据架构、技术架构、应用架构、功能架构及信息架构

文章目录 引言常见的架构图I 业务架构图-案例模块功能说明1. 用户界面层 (UI)2. 应用服务层3. 数据管理层4. 基础设施层业务流程图示例技术实现II 功能架构图 -案例功能模块说明1. 船舶监控模块2. 报警管理模块3. 应急响应模块4. 通信管理模块5. 数据分析模块数据管理层基础设施…...

微信小程序的制作

制作微信小程序的过程大致可以分为几个步骤:从环境搭建、项目创建,到开发、调试和发布。下面我会为你简要介绍每个步骤。 1. 准备工作 在开始开发微信小程序之前,你需要确保你已经完成了以下几个步骤: 注册微信小程序账号&…...

C# 特性 学习记录

在C#中,特性(Attribute)是一种用于向代码元素(如类、方法、属性等)添加元数据的机制。特性本身不会直接影响代码的执行,但它们可以提供额外的信息,这些信息可以在运行时通过反射(Ref…...

DBeaver clickhouse 时区不对 时间少了8小时

选择DataBase选择Driver Manager选择clickhouse数据库点中之后,选择编辑添加两个全局属性 use_server_time_zone use_time_zone 鼠标移动到User Properties上,右键即可添加一列空白 然后断开重连...

如何测试和验证CVE-2024-1430:Netgear R7000 路由器信息泄露漏洞分析

CVE-2024-1430 是一个影响 Netgear R7000 路由器的安全漏洞,漏洞来源于该路由器 Web 管理界面的信息泄露问题。攻击者通过访问 /currentsetting.htm 文件,可能泄露敏感信息,如 Wi-Fi 密码等。 在测试和验证 CVE-2024-1430 时,您需…...

Express 中间件是什么

在 Express 里,中间件是具备访问请求对象(req)、响应对象(res)以及应用程序请求-响应循环中的下一个中间件函数(一般用next表示)的函数。 一、中间件的定义与调用顺序 在 Express 应用中&…...

【做一个微信小程序】校园地图页面实现

前言 上一个教程我们实现了小程序的一些的功能,有背景渐变色,发布功能有的呢,已支持图片上传功能,表情和投票功能开发中(请期待)。下面是一个更高级的微信小程序实现,包含以下功能:…...

(萌新入门)如何从起步阶段开始学习STM32 —— 0.碎碎念

目录 前言与导论 碎碎念 所以,我到底需要知道哪些东西呢 从一些基础的概念入手 常见的工具和说法 ST公司 MDK5 (Keil5) CubeMX 如何使用MDK5的一些常用功能 MDK5的一些常见的设置 前言与导论 非常感谢2301_77816627-CSDN博客的提问,他非常好奇…...

java nio 原理 非阻塞IO Netty

一、为什么必须去了解NIO 首先你需要之后Netty的主要实现手段就是Nio,很多人一直学不明白Netty,根本原因是 除了日常开发中很难能够实践,很大一部分原因是不熟悉NIO,事实上真正熟悉了NIO和它背后的原理之后,去查看Netty的源码就有…...

【ClickHouse】Ubuntu下离线安装ClickHouse数据库并使用DBeaver连接

目录 0. 安装前准备1 安装ClickHouse1.1 下载安装包1.2 离线安装1.3 配置密码1.4 启动ClickHouse服务 2 DBeaver连接配置2.1 下载ClickHouse驱动2.2 DBeaver配置2.2.1 配置主要参数2.2.2 配置驱动 2.3 常见问题处理2.3.1 修改远程登录配置2.3.2 更新驱动配置 0. 安装前准备 有…...

vue2打包带路径的项目,刷新404问题解决

问题描述 Vue 2 项目打包时设置了 publicPath: /web/,并通过 Nginx 配置访问 http://ip/web 时可以正常加载首页,但刷新页面时出现 404 错误 原nginx的配置 location /web {alias /www/dist; # 静态文件地址try_files $uri $uri/ /index.html;index i…...

【计算机视觉】文本识别

计算机视觉,广义的文本识别是指对输入的图像进行分析处理,识别出图像中的文字信息,这里的图像可以使传统的文档图像,也可以是现实世界中的场景图像。 简介 无论是传统方法还是基于深度深度学习的方法,完整的文本识别…...

Vue和React的区别

组件开发方式&#xff1a; Vue 使用单文件组件&#xff08;SFC&#xff09;, HTML, JS 和 CSS 在一个文件内实现 <template><div class"my-component"><!-- HTML模板 --></div> </template><script> export default {// JavaScr…...

STM32 是什么?同类产品有哪些

STM32 是什么&#xff1f; STM32 是由意法半导体&#xff08;STMicroelectronics&#xff09;推出的基于 ARM Cortex-M 内核 的 32 位微控制器&#xff08;MCU&#xff09;系列。它专为高性能、低功耗的嵌入式应用设计&#xff0c;广泛应用于以下领域&#xff1a; 工业控制&am…...

Git学习使用笔记

目录 一、基本介绍 1.1 版本控制 1.2 版本控制软件的基础功能 1.3 多人协作开发/集中式版本控制 1.4 分布式版本控制 二、Git安装 2.1下载git 2.2 使用Github Desktop软件 2.2.1 创建本地仓库 2.2.2 删除本地仓库 2.2.3 仓库文件操作 2.2.4 多人协作 2.2.4.1 分…...

Bash 中的运算方式

目录 概述&#xff1a; 1. (()) 运算符 2. let 命令 3. expr 命令 4. $[] 直接运算 5. bc&#xff08;计算器&#xff0c;支持浮点数&#xff09; 6. awk&#xff08;强大的文本处理工具&#xff0c;也可计算&#xff09; 概述&#xff1a; Bash 本身只支持整数运算&am…...

NLP Word Embeddings

Word representation One-hot形式 在上一周介绍RNN类模型时&#xff0c;使用了One-hot向量来表示单词的方式。它的缺点是将每个单词视为独立的&#xff0c;算法很难学习到单词之间的关系。 比如下面的例子&#xff0c;即使语言模型已经知道orange juice是常用组合词&#xf…...

Unity UI个人总结

个人总结&#xff0c;太简单的直接跳过。 一、缩放模式 1.固定像素大小 就是设置一个100x100的方框&#xff0c;在1920x1080像素下在屏幕中长度占比1/19&#xff0c;在3840x2160&#xff0c;方框在屏幕中长度占比1/38。也就是像素长款不变&#xff0c;在屏幕中占比发生变化 2.…...

开发基础(8):鸿蒙图表开发

mpchart mpchart是一个包含各种类型图表的图表库,主要用于业务数据汇总,例如销售数据走势图,股价走势图等场景中使用,方便开发者快速实现图表UI,mpchart主要包括线形图、柱状图、饼状图、蜡烛图、气泡图、雷达图、瀑布图等自定义图表库。 柱状图 导入import {BarChart, …...

Vue的简单入门 一

声明&#xff1a;本版块根据B站学习&#xff0c;创建的是vue3项目&#xff0c;用的是vue2语法风格&#xff0c;仅供初学者学习。 目录 一、Vue项目的创建 1.已安装15.0或更高版本的Node.js 2.创建项目 二、 简单认识目录结构 三、模块语法中的指令 1.v-html 1.文本插值…...

vs2022支持.netframework4.0

下载nuget包 .netframework4.0 解压nuget 复制到C:\Program Files (x86)\Reference Assemblies\Microsoft\Framework\.NETFramework 参考 https://www.cnblogs.com/bdqczhl/p/18670152 https://blog.csdn.net/xiaomeng1998_/article/details/135979884...

[前端] axios网络请求二次封装

一、场景描述 为什么要对axios网络请求进行二次封装? 解决代码的复用&#xff0c;提高可维护性。 —这个有两个方案&#xff1a;一个是二次封装一个是实例化。&#xff08;设置一些公共的参数&#xff0c;然后进行请求&#xff09; 为什么可以解决代码的复用&#xff1a; 这是…...

前端包管理器的发展以及Npm、Yarn和Pnpm对比

在现代前端开发中&#xff0c;包管理器是不可或缺的核心工具。随着 JavaScript 生态的快速发展&#xff0c;开发者经历了从 npm 一统天下到 Yarn 挑战格局&#xff0c;再到 pnpm 创新突破的技术演进。这里将对三种主流包管理器&#xff08;npm/Yarn/pnpm&#xff09;进行全方位…...

城电科技| 光伏太阳花:让绿色能源随处绽放

在追求绿色可持续发展的今天&#xff0c;清洁能源设备不断涌现&#xff0c;城电科技的光伏太阳花便是其中的佼佼者。它不仅造型独特美观&#xff0c;更凭借出色的性能&#xff0c;在多个场景中都能发挥重要作用。那么&#xff0c;这款神奇的光伏太阳花究竟适合安装在哪里呢&…...

LVS集群(DR/NAT)

特性NAT 模式DR 模式工作原理Director 修改请求/响应的 IP 地址和端口&#xff0c;流量双向经过 DirectorDirector 仅修改请求的 MAC 地址&#xff0c;响应由 Real Server 直接返回客户端性能较低&#xff08;需处理双向流量&#xff0c;易成瓶颈&#xff09;高&#xff08;仅处…...

保姆级GitHub大文件(100mb-2gb)上传教程

GLF&#xff08;Git Large File Storage&#xff09;安装使用 使用GitHub desktop上传大于100mb的文件时报错 The following files are over 100MB. lf you commit these files, you will no longer beable to push this repository to GitHub.com.term.rarWe recommend you a…...

【Jenkins流水线搭建】

Jenkins流水线搭建 01、SpringBoot项目 - Jenkins基于Jar持续集成搭建文档基于手动方式发布项目基于dockerfile基于jenkins + dockerfile + jenkinsfile +pieline基于jenkins + jar方式的发布01、环境说明01、准备项目02、准备服务器03、安装git04、安装jdk1.805、安装maven依赖…...

linux 安装ftp

1、安装vsftpd sudo yum install -y vsftpd 2、运行以下命令&#xff0c;启动FTP服务&#xff0c;并设置开机自启动。 sudo systemctl start vsftpdsudo systemctl enable vsftpd 3、运行以下命令&#xff0c;查看FTP服务监听的端口。 sudo netstat -antup | grep ftp 出现…...

DDoS技术解析

这里是Themberfue 今天我们不聊别的&#xff0c;我们聊聊著名的网络攻击手段之一的 DDoS&#xff0c;看看其背后的技术细节。 DoS 了解 DDoS 前&#xff0c;先来讲讲 DoS 是什么&#xff0c;此 DoS 而不是 DOS 操作系统啊。1996年9月6日&#xff0c;世界第三古老的网络服务提供…...

移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地

近日&#xff0c;国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势&#xff0c;迅速风靡全球。移远通信基于边缘计算模组SG885G&#xff0c;已成功实现DeepSeek模型的稳定运行&#xff0c;并完成了针对性微调。 目前&#xff0c;该模型正在多款智能终端上进…...

Linux | 进程相关概念(进程、进程状态、进程优先级、环境变量、进程地址空间)

文章目录 进程概念1、冯诺依曼体系结构2、进程2.1基本概念2.2描述进程-PCB2.3组织进程2.4查看进程2.5通过系统调用获取进程标识符2.6通过系统调用创建进程-fork初识fork の 头文件与返回值fork函数的调用逻辑和底层逻辑 3、进程状态3.1状态3.2进程状态查看命令3.2.1 ps命令3.2.…...

站群服务器和普通服务器有哪些不同之处?

站群服务器是一个集中管理工具&#xff0c;可以允许网站管理员同时管理多个网站&#xff0c;但是不要管理员登录每一个网站的后台&#xff0c;在站群模式下&#xff0c;网站管理员通过一个或者多个服务器来托管大量的子站点&#xff0c;可以支持大规模网站的集中管理和优化。 普…...

百度千帆平台对接DeepSeek官方文档

目录 第一步&#xff1a;注册账号&#xff0c;开通千帆服务 第二步&#xff1a;创建应用&#xff0c;获取调用秘钥 第三步&#xff1a;调用模型&#xff0c;开启AI对话 方式一&#xff1a;通过API直接调用 方式二&#xff1a;使用SDK快速调用 方式三&#xff1a;在千帆大模…...

DeepSeek帮助解决Oracle死锁问题

最近在生产上遇到一个死锁问题&#xff0c;Oracle 抛出了 ORA-000060 异常。 业务场景&#xff1a;程序按行读取一个上游系统送的文件数据&#xff08;大概有几万行&#xff09;&#xff0c;读取到数据后&#xff0c;每 500 行分配给一个线程去批量更新数据库&#xff08;使用…...

MySQL无法连接到本地localhost的解决办法2024.11.8

问题描述&#xff1a;我的MySQL可以远程连接服务器&#xff0c;但无法连接自己的localhost。 错误提示&#xff1a; 2003 - Cant connet to MySQL server on localhost(10061 "Unknown error")查找问题原因&#xff1a; 1. 检查环境变量是否正确&#xff1a;发现没…...

Nginx之rewrite重写功能

目录 一、rewrite概述 1、rewrite功能 2、跳转场景 二、标准配置指令 1、rewrite日志记录指令 2、未初始化变量告警日志记录指令 3、rewrite 指令 3.1 正则表达式 三、rewrite模块使用实例 1.基于域名的跳转 2.基于客户端 IP 访问跳转 3.?基于旧域名跳转到新域名后…...

Selenium WebDriver自动化测试(扩展篇)--Jenkins持续集成

文章目录 一、引言二、Jenkins简介三、安装部署Jenkins安装部署四、集成Git与Maven安装必要的插件配置Git配置Maven五、创建Job创建自由风格的项目配置源码管理配置构建触发器配置构建环境配置构建步骤配置Post-build Actions六、触发构建示例:GitHub Webhook触发构建七、封装…...

MyBatis拦截器终极指南:从原理到企业级实战

在本篇文章中&#xff0c;我们将深入了解如何编写一个 MyBatis 拦截器&#xff0c;并通过一个示例来展示如何在执行数据库操作&#xff08;如插入或更新&#xff09;时&#xff0c;自动填充某些字段&#xff08;例如 createdBy 和 updatedBy&#xff09;信息。本文将详细讲解拦…...

DeepSeek4j 已开源,支持思维链,自定义参数,Spring Boot Starter 轻松集成,快速入门!建议收藏

DeepSeek4j Spring Boot Starter 快速入门 简介 DeepSeek4j 是一个专为 Spring Boot 设计的 AI 能力集成启动器&#xff0c;可快速接入 DeepSeek 大模型服务。通过简洁的配置和易用的 API&#xff0c;开发者可轻松实现对话交互功能。 环境要求 JDK 8Spring Boot 2.7Maven/Gr…...

linux 板子的wifi模块连上路由器后,用udhcpc给板子wifi分配ip,udhcpc获取到ip,但没有写入wlan0网卡上

linux 板子的wifi模块连上路由器后&#xff0c;用udhcpc给板子wifi分配ip&#xff0c;udhcpc获取到ip,但没有写入wlan0网卡上 这里的问题是 /usr/share/udhcpc/default.script脚本有问题 用下面正确脚本&#xff0c;即可写进去 #!/bin/sh# udhcpc script for busybox # Copyr…...

【工业安全】-CVE-2022-35555- Tenda W6路由器 命令注入漏洞

文章目录 1.漏洞描述 2.环境搭建 3.漏洞复现 4.漏洞分析 4.1&#xff1a;代码分析  4.2&#xff1a;流量分析 5.poc代码&#xff1a; 1.漏洞描述 漏洞编号&#xff1a;CVE-2022-35555 漏洞名称&#xff1a;Tenda W6 命令注入 威胁等级&#xff1a;高危 漏洞详情&#xff1…...

twisted实现MMORPG 游戏数据库操作封装设计与实现

在设计 MMORPG&#xff08;大规模多人在线角色扮演游戏&#xff09;时&#xff0c;数据库系统是游戏架构中至关重要的一部分。数据库不仅承担了游戏中各种数据&#xff08;如玩家数据、物品数据、游戏世界状态等&#xff09;的存储和管理任务&#xff0c;还必须高效地支持并发访…...

【MySQL】基础篇

1. MySQL中的NULL值是怎么存放的&#xff1f; MySQL的compact行格式中会用【NULL值列表】来标记值为NULL的列&#xff0c;NULL值不会存储在行格式中的真实数据部分。 NULL值列表会占用1字节空间&#xff0c;当表中所有字段都被定义成NOT NULL&#xff0c;行格式中就不会有NULL值…...

【自学笔记】机器学习基础知识点总览-持续更新

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 机器学习重点知识点总览一、机器学习基础概念二、机器学习理论基础三、机器学习算法1. 监督学习2. 无监督学习3. 强化学习 四、机器学习处理流程五、机器学习常见问…...

记录阿里云CDN配置

网站接入CDN全流程&#xff0c;共4步&#xff01;-阿里云开发者社区 1、开通阿里云CDN服务 2、添加加速域名 3、验证域名归属权 4、域名添加CDN生成的CNAME解析 按照官网描述增加。细节点&#xff1a; 1. 域名和泛域名区别 2.开启https,要用nginx的证书&#xff0c;和项…...

同为科技智能PDU助力Deepseek人工智能和数据交互的快速发展

1 2025开年&#xff0c;人工智能领域迎来了一场前所未有的变革。Deepseek成为代表“东方力量”的开年王炸&#xff0c;不仅在国内掀起了技术热潮&#xff0c;并且在全球范围内引起了高度关注。Deepseek以颠覆性技术突破和现象级应用场景席卷全球&#xff0c;这不仅重塑了产业格…...