OpenCV 人脸识别:从基础到实践全解析
在人工智能与计算机视觉蓬勃发展的今天,人脸识别技术已深入我们生活的方方面面,从手机解锁到安防监控,其应用无处不在。而 OpenCV 作为计算机视觉领域最受欢迎的开源库之一,为开发者提供了一套高效且易用的人脸识别解决方案。本文将带领大家深入了解 OpenCV 人脸识别的技术细节,并通过实际代码演示,让你轻松掌握这项实用技术。
一、OpenCV 简介与环境搭建
1.1 OpenCV 概述
OpenCV(Open Source Computer Vision Library)是一个基于 Apache2.0 许可(开源)发行的跨平台计算机视觉和机器学习软件库。它由一系列 C 函数和少量 C++ 类构成,同时提供了 Python、Ruby、MATLAB 等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 可用于开发实时的图像和视频分析程序,在工业检测、人机交互、安防监控等领域都有广泛应用。
1.2 环境搭建
在开始使用 OpenCV 进行人脸识别前,我们需要搭建合适的开发环境。这里以 Python 环境为例,假设你已经安装好了 Python。
首先,打开命令行界面(Windows 用户可通过 “Win + R” 键输入 “cmd” 打开命令提示符,Linux 或 Mac 用户打开终端),使用以下命令安装 OpenCV 库:
pip install opencv-python
安装完成后,你可以在 Python 交互式环境中输入以下代码测试 OpenCV 是否安装成功:
import cv2print(cv2.__version__)
若能正确输出 OpenCV 的版本号,则说明安装成功。
二、人脸识别的基本原理
2.1 人脸检测
人脸识别的第一步是人脸检测,即从图像或视频帧中找到人脸的位置。OpenCV 中主要使用 Haar 级联分类器和基于深度学习的方法(如 SSD、YOLO 等)进行人脸检测。Haar 级联分类器是一种基于机器学习的方法,它通过训练大量的正样本(包含人脸的图像)和负样本(不包含人脸的图像),生成级联的强分类器。在检测时,级联分类器会对图像进行滑动窗口扫描,判断每个窗口内是否包含人脸。
例如,OpenCV 提供了预训练好的 Haar 级联分类器模型文件haarcascade_frontalface_default.xml,我们可以使用它快速实现人脸检测:
import cv2# 加载Haar级联分类器模型face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')# 读取图像img = cv2.imread('test.jpg')gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 进行人脸检测faces = face_cascade.detectMultiScale(gray, 1.1, 4)# 在图像上绘制人脸矩形框for (x, y, w, h) in faces:cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)# 显示结果图像cv2.imshow('img', img)cv2.waitKey()cv2.destroyAllWindows()
上述代码中,detectMultiScale函数会返回检测到的人脸矩形框的坐标和大小,然后我们使用rectangle函数在图像上绘制出这些矩形框。
2.2 特征提取
在检测到人脸后,接下来需要提取人脸的特征。OpenCV 中常用的特征提取方法有局部二值模式直方图(LBPH,Local Binary Patterns Histograms)、Fisherfaces 和 Eigenfaces。
- LBPH:是一种简单有效的纹理描述方法,它通过比较中心像素与其邻域像素的灰度值大小,将其编码为二进制模式,然后统计图像中不同二进制模式的直方图作为特征。LBPH 对光照变化具有较好的鲁棒性,计算效率也较高。
- Fisherfaces:基于线性判别分析(LDA)的方法,它试图找到一个投影方向,使得同一类别的样本在投影后尽可能聚集,不同类别的样本尽可能分开。Fisherfaces 在训练数据较多时能取得较好的效果。
- Eigenfaces:基于主成分分析(PCA)的方法,它通过对训练图像的协方差矩阵进行特征分解,得到一组特征向量(即 Eigenfaces),然后将人脸图像投影到由这些特征向量张成的子空间中,得到人脸的特征表示。
2.3 人脸识别
在提取到人脸特征后,我们就可以进行人脸识别了。人脸识别的过程本质上是将待识别的人脸特征与训练集中的人脸特征进行比对,找到最匹配的类别。常用的匹配方法有欧氏距离、余弦相似度等。例如,在使用 LBPH 进行人脸识别时,我们可以计算待识别特征与训练集中每个特征的欧氏距离,距离最小的类别即为识别结果。
三、基于 LBPH 的人脸识别实战
3.1 准备训练数据
首先,我们需要准备用于训练的人脸图像数据。假设我们有一个数据集,其中每个文件夹代表一个人的身份,文件夹内包含该人的多张人脸图像。以下是一个简单的函数,用于读取训练数据并标记每个图像所属的类别:
import osimport cv2def get_images_and_labels(path):face_samples = []ids = []image_paths = [os.path.join(path, f) for f in os.listdir(path)]face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')for image_path in image_paths:gray_img = cv2.imread(image_path, 0)if gray_img is None:continueid = int(os.path.split(image_path)[-1].split('.')[1])faces = face_cascade.detectMultiScale(gray_img)for (x, y, w, h) in faces:face_samples.append(gray_img[y:y+h, x:x+w])ids.append(id)return face_samples, ids
3.2 训练模型
有了训练数据后,我们可以使用 OpenCV 的LBPHFaceRecognizer类来训练模型:
import cv2# 训练数据路径data_path = 'training_data'faces, ids = get_images_and_labels(data_path)# 创建LBPH人脸识别器recognizer = cv2.face.LBPHFaceRecognizer_create()# 训练模型recognizer.train(faces, np.array(ids))# 保存训练好的模型recognizer.write('trainer.yml')
3.3 进行人脸识别
训练好模型后,我们可以使用它对新的图像进行人脸识别:
import cv2import numpy as np# 加载训练好的模型recognizer = cv2.face.LBPHFaceRecognizer_create()recognizer.read('trainer.yml')# 加载Haar级联分类器模型face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')# 读取测试图像img = cv2.imread('test_image.jpg')gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 进行人脸检测faces = face_cascade.detectMultiScale(gray, 1.1, 4)# 对检测到的人脸进行识别for (x, y, w, h) in faces:face_roi = gray[y:y+h, x:x+w]id, confidence = recognizer.predict(face_roi)# 设置识别阈值,这里以50为例,可根据实际情况调整if confidence < 50:label = f'Person {id}'else:label = 'Unknown'cv2.putText(img, label, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)# 显示结果图像cv2.imshow('Face Recognition', img)cv2.waitKey(0)cv2.destroyAllWindows()
四、OpenCV 人脸识别的优化与扩展
4.1 提高识别准确率
为了提高人脸识别的准确率,可以采取以下措施:
- 增加训练数据:使用更多的人脸图像进行训练,让模型学习到更丰富的特征。
- 优化特征提取方法:尝试使用更先进的特征提取算法,如基于深度学习的方法(如 FaceNet),将其与 OpenCV 结合使用。
- 数据增强:对训练数据进行旋转、缩放、添加噪声等操作,扩充数据集,提高模型的泛化能力。
4.2 实时人脸识别
OpenCV 还可以用于实时人脸识别,例如从摄像头获取视频流,对每一帧图像进行人脸检测和识别。只需将读取图像的代码替换为读取摄像头视频流的代码即可:
import cv2import numpy as np# 加载训练好的模型recognizer = cv2.face.LBPHFaceRecognizer_create()recognizer.read('trainer.yml')# 加载Haar级联分类器模型face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')# 打开摄像头cap = cv2.VideoCapture(0)while True:ret, img = cap.read()if not ret:breakgray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 进行人脸检测faces = face_cascade.detectMultiScale(gray, 1.1, 4)# 对检测到的人脸进行识别for (x, y, w, h) in faces:face_roi = gray[y:y+h, x:x+w]id, confidence = recognizer.predict(face_roi)if confidence < 50:label = f'Person {id}'else:label = 'Unknown'cv2.putText(img, label, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)# 显示结果图像cv2.imshow('Face Recognition', img)if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放摄像头资源cap.release()cv2.destroyAllWindows()
4.3 与其他技术结合
OpenCV 人脸识别还可以与其他技术结合使用,例如结合数据库存储和管理人员信息,实现更完善的身份验证系统;或者与物联网设备结合,应用于智能家居、智能门禁等场景。
五、总结
本文详细介绍了 OpenCV 人脸识别的基本原理、环境搭建、实战应用以及优化扩展方法。通过 OpenCV,我们可以快速实现一个简单有效的人脸识别系统,并且可以根据实际需求进行进一步的优化和扩展。希望本文能帮助你掌握 OpenCV 人脸识别技术,在计算机视觉领域创造出更多有趣和实用的应用。如果你在实践过程中遇到问题,欢迎在评论区留言交流!
相关文章:
OpenCV 人脸识别:从基础到实践全解析
在人工智能与计算机视觉蓬勃发展的今天,人脸识别技术已深入我们生活的方方面面,从手机解锁到安防监控,其应用无处不在。而 OpenCV 作为计算机视觉领域最受欢迎的开源库之一,为开发者提供了一套高效且易用的人脸识别解决方案。本文…...
【HTML-2】HTML 标题标签:构建网页结构的基础
在网页开发中,标题标签(<h1>到<h6>)是构建内容层次结构和语义化标记的基础元素。这些标签不仅影响内容的视觉呈现,更对网页的可访问性和SEO有着深远影响。 1. 标题标签的基本用法 HTML提供了六个级别的标题标签: <h1>这…...
vue3前端后端地址可配置方案
在开发vue3项目过程中,需要切换不同的服务器部署,代码中配置的服务需要可灵活配置,不随着run npm build把网址打包到代码资源中,不然每次切换都需要重新run npm build。需要一个配置文件可以修改服务地址,而打包的代码…...
HTML应用指南:利用POST请求获取全国申通快递服务网点位置信息
申通快递(STO Express)作为中国领先的综合物流服务商,自1993年创立以来,始终秉持“正道经营、长期主义”的发展理念,深耕快递物流领域,开创了行业加盟制先河。经过30余年的发展,申通已成长为国家…...
《医院运营管理典型应用数据资源建设指南2025》全面分析
引言:医院数据资源建设的时代背景与意义 医院运营管理数据资源建设正迎来前所未有的发展机遇与挑战。在深化支付改革与公立医院高质量发展政策驱动下,医院亟需建立智慧化运营管理体系,而数据资源作为关键要素,其建设水平直接关系到医院管理的科学性与效率。《医院运营管理…...
.NET外挂系列:3. 了解 harmony 中灵活的纯手工注入方式
一:背景 1. 讲故事 上一篇我们讲到了 注解特性,harmony 在内部提供了 20个 HarmonyPatch 重载方法尽可能的让大家满足业务开发,那时候我也说了,特性虽然简单粗暴,但只能解决 95% 的问题,言外之意还有一些…...
taro 小程序 CoverImage Image src无法显示图片的问题
目录 一、问题描述 二、解决方案 一、问题描述 使用taro开发的微信小程序图片无法正常显示,并报如下错误: [渲染层网络层错误] Failed to load local image resource /assets/icon/message.png the server responded with a status of 500 (HTTP/1.…...
05_核支持向量机
描述 核支持向量机(通常简称为SVM)可以推广到更复杂模型的扩展,这些模型无法被输入空间的超平面定义。 SVM 的核心思想是找到一个最优的超平面,将不同类别的数据分开。这个超平面不仅要能够正确分类数据,还要使得两个…...
[解决方案] Word转PDF
背景: 之前做过一些pdf导出, 客户提了一个特别急的需求, 要求根据一个模版跟一个csv的数据源, 批量生成PDF, 因为之前用过FOP, 知道调整样式需要特别长的时间, 这个需求又特别急, 所…...
Oracle 11g post PSU Oct18 设置ssl连接(使用wallets)
说明 oracle 11g 从PSU 2018Oct(含)及之后的补丁不支持MD5. 要使用JDBC SSL要使用TSL1.2. 有两种方法,一种使用wallet, 一种使用JKS. 本文档使用wallets. 1. 为什么用TSL 1.2 https://blogs.oracle.com/developers/post/ssl-connection-to…...
linux关闭某端口暂用的进程
查看是哪个端口暂用 sudo netstat -tulpn | grep :80根据图片 显示 80端口暂用的 进程id是 3002 结束进程id为3002的进程 sudo kill -9 3002...
web开发全过程总结
目录 利用pnpm创建vue3的文件 使用pnpm创建项目 项目配置 在idea中创建Spring Boot项目 配置基础项目架构(三层架构) 利用pnpm创建vue3的文件 1.打开cmd,以管理员的身份运行 2.切换到自己想要建立项目的文件的目录下或者直接在文件中以cmd的形式打开 输入指令安装pnpm n…...
经典Java面试题的答案——Java 基础
大家好,我是九神。这是互联网技术岗的分享专题,废话少说,进入正题: 1.JDK 和 JRE 有什么区别? JDK:Java Development Kit 的简称,java 开发工具包,提供了 java 的开发环境和运行环境…...
Fiddler 指定链接断点
问题背景 在使用Fiddler进行抓包和mock数据时,由于前端页面通常依赖多个前置接口(如JS、CSS、登录态等),导致抓包过程中难以精准定位到目标接口。这种复杂性增加了调试和mock数据的难度。 常见挑战 前置接口过多:页…...
C# 语法篇:字段的定义和运算
对于字段来说,是在对象创建时就被初始化了;而构造函数的运行是在这之后。 因此,不能对字段进行需要用到“构造函数赋值的变量”的运算,因为此时这些变量的值都为0或者随机值,编译器不允许这时候做运算。 因此…...
音频应用的MediaSession冲突
前提条件 系统级应用,使用了sharedUserId 应用在AndroidManifest.xml中声明了系统级UID:android:sharedUserId"android.uid.system"该配置使应用具有系统级权限,可以访问系统级API和资源 使用MediaSession框架 应用通过MediaSessi…...
【QT】类A接收TCP数据并通过信号通知类B解析
以下是基于Qt的完整示例代码,包含类A接收TCP数据并通过信号通知类B解析的实现: ------------------ ClassA.h 网络数据接收类 ------------------ #pragma once#include <QTcpServer> #include <QTcpSocket> #include <QObject>class…...
【Jitsi Meet】(腾讯会议的平替)Docker安装Jitsi Meet指南-使用内网IP访问
Docker安装Jitsi Meet指南-使用内网IP访问 下载官方代码配置环境变量复制示例环境文件并修改配置:编辑 .env 文件: 修改 docker-compose.yml 文件生成自签名证书启动服务最终验证 腾讯会议的平替。我们是每天开早晚会的,都是使用腾讯会议。腾…...
微服务架构中的多进程通信--内存池、共享内存、socket
目录 1 引言 2 整体架构简介 3 疑问 3.1 我们的共享内存消息机制是用的posix还是system V 3.2 rmmt中,不同线程之间的比如访问同一个内存,用的什么锁控制的 3.3 疑问:假如一个进程发送给了另外两个进程,然后另外两个进程都同…...
使用 adb 命令截取 Android 设备的屏幕截图
使用 adb 命令截取 Android 设备的屏幕截图。以下是两种常见的方法: 方法一:截屏后保存到电脑 adb shell screencap -p /sdcard/screenshot.png adb pull /sdcard/screenshot.png解释: adb shell screencap -p /sdcard/screenshot.png&…...
Jenkins服务器配置密钥对
1. 在 Jenkins 服务器上执行以下命令 # 生成 SSH 密钥对 ssh-keygen -t rsa -b 2048 -f ~/.ssh/id_rsa -N ""# 查看公钥内容 cat ~/.ssh/id_rsa.pub 2. 将显示的公钥内容复制,然后在目标服务器上执行 # 在目标服务器上执行 mkdir -p /root/.ssh chmod …...
Docker中部署Alertmanager
在 Docker 中部署 Alertmanager(通常与 Prometheus 告警系统配合使用)的步骤如下: 一、拉取镜像prom/alertmanager docker pull prom/alertmanager二、 创建 Alertmanager 配置文件 首先准备Alertmanager的配置文件 alertmanager.yml(如存…...
Keil软件中STM32(ARM)与C51兼容方法
推荐其他UP主:Keil5安装教程(包含C51与MDK共存) - Kojull - 博客园 我已经实现了!...
青少年编程与数学 02-019 Rust 编程基础 19课题、项目发布
青少年编程与数学 02-019 Rust 编程基础 19课题、项目发布 一、准备工作1. 创建和配置项目2. 编写代码和测试3. 文档注释 二、构建发布版本1. 构建优化后的可执行文件2. 静态链接(可选) 三、发布到 crates.io1. Crates.io核心功能使用方法特点最新动态 2…...
一洽小程序接入说明
接入说明 文档以微信小程序作为示例介绍,其他小程序接入操作与此类似 1、添加校验文件 开发者使用微信小程序提供的 webview 组件可以实现打开一洽的H5对话 小程序的“域名配置”中添加一洽的对话域名地址,需要获取校验文件提供给一洽放在域名根目录下…...
RabbitMQ的基本使用
RabbitMQ 是一个非常流行的消息中间件,用于实现生产者与消费者之间的异步通信。它基于 AMQP 协议(高级消息队列协议),支持多种编程语言和平台。 以下是 RabbitMQ 的基本使用说明,包括安装、核心概念、基本操作和 Pyth…...
CSS专题之常见布局
前言 石匠敲击石头的第 13 次 作为一名前端开发,在日常开发中,写页面是必不可少的工作,但有时候发现很多的页面结构都是类似的,所以打算写一篇文章来梳理一下日常开发中常见的布局,如果哪里写的有问题欢迎指出。 单列…...
CentOS 7连接公司网络配置指南
在物理主机上安装了一个CentOS 7,需要连接公司的网络,但是公司的网络需要输入用户名密码才能连接 解决方案 需要 同时设置 wifi-sec.key-mgmt 和 802-1x 参数。以下是分步操作: 1. 创建基础 Wi-Fi 连接 sudo nmcli con add con-name &quo…...
RustDesk CentOS自建中继节点
一、需开放端口 TCP: 21115, 21116, 21117, 21118, 21119 UDP: 21116 二、安装docker 1.使用 root 权限登录 CentOS。确保 yum 包更新到最新 yum update 2. 卸载旧版本 yum remove docker 3. 安装 Docker 所需依赖 yum -y install yum-utils device-mapper-persistent-d…...
CentOS 7上部署BIND9 DNS服务器指南
场景假设: 我们要为内部网络 192.168.1.0/24 搭建一个权威 DNS 服务器。 域名:mylab.localDNS 服务器 IP:192.168.1.10我们将配置正向解析 (hostname -> IP) 和反向解析 (IP -> hostname)。 一、安装 BIND9 更新系统并安装 BIND 及工…...
面试突击:消息中间件之RabbitMQ
一:你们项目中哪里用到了RabbitMQ ? 难易程度:☆☆☆ 出现频率:☆☆☆☆ 我们项目中很多地方都使用了RabbitMQ , RabbitMQ 是我们项目中服务通信的主要方式之一 , 我们项目中服务通信主要有两种方式实现 : 通过Feign实现服务调用通过MQ实现服…...
基于 ESP32 与 AWS 全托管服务的 IoT 架构:MQTT + WebSocket 实现设备-云-APP 高效互联
目录 一、总体架构图 二、设备端(ESP32)低功耗设计(适配 AWS IoT) 1.MQTT 设置(ESP32 连接 AWS IoT Core) 2.低功耗策略总结(ESP32) 三、云端架构(基于 AWS Serverless + IoT Core) 1.AWS IoT Core 接入 2.云端 → APP:WebSocket 推送方案 流程: 3.数据存…...
将 /dev/vdb1 的空间全部合并到 /dev/mapper/centos-root(即扩展 CentOS 的根分区)
要将 /dev/vdb1 的 1TB 空间合并到 /dev/mapper/centos-root(即扩展 CentOS 的根分区),可以采用 LVM(逻辑卷管理) 的方式。以下是详细步骤: 步骤 1:检查当前磁盘和 LVM 情况 1.1 确认 /dev/vdb…...
CentOS Stream安装MinIO教程
1. 下载 MinIO 二进制文件 # 进入 MinIO 安装目录 sudo cd /usr/local/bin/# 下载 MinIO 二进制文件(替换为最新版本链接) wget https://dl.min.io/server/minio/release/linux-amd64/minio chmod x minio2. 创建专用用户和存储目录 # 创建 minio 用户…...
游戏引擎学习第299天:改进排序键 第二部分
回顾并为当天内容做准备 我们会现场编写完整的游戏代码。回顾上周发现自己对游戏中正确的排序规则并没有清晰的理解。主要原因是我们更擅长三维游戏开发,缺乏二维游戏和二维游戏技术的经验,对于二维精灵排序、模拟三维效果的最佳方案等没有太多技巧和经…...
设计模式----软考中级软件设计师(自用学习笔记)
目录 1、设计模式的要素 2、设计模式的分类 3、简单工厂模式 4、工厂方法 5、抽象工厂 6、生成器 7、原型 8、单例模式 9、适配器 10、桥接 11、组合模式 12、装饰 13、外观 14、享元 15、代理 16、责任链 17、命令 18、解释器 19、迭代器 20、中介者 21、…...
uniapp如何设置uni.request可变请求ip地址
文章目录 简介方法一:直接在请求URL中嵌入变量方法二:使用全局变量方法三:使用环境变量方法四:服务端配置方法五:使用配置文件(如config.js):总结 简介 在uni-app中,uni.request 用…...
Centos上搭建 OpenResty
一、OpenResty简介 OpenResty 是基于 Nginx 的扩展平台,完全兼容 Nginx 的核心功能(如 HTTP 服务和反向代理),同时通过内嵌 LuaJIT 支持,允许开发者用 Lua 脚本灵活扩展业务逻辑。它简化了动态逻辑的实现。 二、安装…...
Kotlin与物联网(IoT):Android Things开发探索
在物联网(IoT)领域,Kotlin 凭借其简洁性、安全性和与 Java 生态的无缝兼容性,逐渐成为 Android Things 开发的有力工具。尽管 Google 已于 2022 年宣布停止对 Android Things 的官方支持,但其技术思想仍值得探索&#…...
WIFI信号状态信息 CSI 深度学习篇之CNN(Python)
本博客是一篇非新手导向的CNN处理CSI图像帧的教程,基于tensorflow框架构建CNN模型进行训练,训练对象依然是前述博客中所提到的CSI图像帧(500 x 90 x 1)。代码里用到了深度可分离卷积,这种结构在减少计算量和参数数量方…...
深度学习实战 04:卷积神经网络之 VGG16 复现三(训练)
在后续的系列文章中,我们将逐步深入探讨 VGG16 相关的核心内容,具体涵盖以下几个方面: 卷积原理篇:详细剖析 VGG 的 “堆叠小卷积核” 设计理念,深入解读为何 332 卷积操作等效于 55 卷积,以及 333 卷积操作…...
欧拉系统离线部署docker
https://www.cnblogs.com/hsh96/p/18150538 Docker 离线安装指南 本文介绍了如何在 Linux 系统上进行 Docker 的离线安装。首先,确保欧拉系统安装的是server版本,否则没有tar工具。 您需要下载 Docker 的离线安装包。您可以从以下链接获取所需的安装包&a…...
Java 中 final 与 static 的区别
Java 中 final 与 static 的区别 在 Java 中,final 和 static 是两个不同的关键字,它们的核心作用和不可变性特性有本质区别: 一、final 的核心作用 1. 变量(不可变引用) 不可重新赋值:final 修饰的变量…...
多模态实时交互边界的高效语音语言模型 VITA-Audio 介绍
介绍 VITA-Audio是由Zuwei Long等研究者提出的端到端大型语音语言模型,其核心目标是通过跨模态令牌生成技术,解决传统语音交互系统中首音频令牌生成延迟高的问题。该模型的创新点主要体现在: 低延迟:VITA-Audio 是首个能够在初次…...
LLM | 论文精读 | NAACL 2025 | Clarify When Necessary:教语言模型何时该“问一句”再答!
🔍 解读 NAACL 2025 重磅论文《Clarify When Necessary》:教语言模型何时该“问一句”再答! 🧩 一、现实问题:大模型“看不懂装懂”有多危险? 我们每天用的 ChatGPT、Claude 等大型语言模型(LL…...
MySQL 8.0 OCP 英文题库解析(七)
Oracle 为庆祝 MySQL 30 周年,截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。 从今天开始,将英文题库免费公布出来,并进行解析,帮助大家在一个月之内轻松通过OCP认证。 本期公布试题51~60 试题51:…...
深度解析Vue项目Webpack打包分包策略 从基础配置到高级优化,全面掌握性能优化核心技巧
深度解析Vue项目Webpack打包分包策略 从基础配置到高级优化,全面掌握性能优化核心技巧 一、分包核心价值与基本原理 1.1 为什么需要分包 首屏加载优化:减少主包体积,提升TTI(Time to Interactive)缓存利用率提升&am…...
MySQL——基本查询内置函数
目录 CRUD Create Retrieve where order by limit Update Delete 去重操作 聚合函数 聚合统计 内置函数 日期函数 字符函数 数学函数 其它函数 实战OJ 批量插入数据 找出所有员工当前薪水salary情况 查找最晚入职员工的所有信息 查找入职员工时间升序排…...
实现图片自动压缩算法,canvas压缩图片方法
背景: 在使用某些支持webgl的图形库(eg:PIXI.js,fabric.js)场景中,如果加载的纹理超过webgl可处理的最大纹理限制,会导致渲染的纹理缺失,甚至无法显示。 方案 实现图片自动压缩算…...
零基础设计模式——创建型模式 - 单例模式
第二部分:创建型模式 - 单例模式 (Singleton Pattern) 欢迎来到创建型模式的第一站——单例模式!这是最简单也最常用的设计模式之一。 核心思想:关注对象的创建过程,将对象的创建与使用分离,降低系统的耦合度。 单例…...