搜广推校招面经六十一
美团推荐算法
一、ANN算法了解么?说几种你了解的ANN算法
ANN 近似最近邻搜索(Approximate Nearest Neighbor Search)算法
1.1. KD-Tree(K-Dimensional Tree,K 维树)
- 类型: 空间划分数据结构
- 适用场景: 低维数据(通常小于 20 维)
- 原理:
- 递归地选择某个维度的中位数进行划分,构造二叉树
- 查询时回溯遍历最近邻点
- 优缺点:
- 适用于 低维欧几里得空间搜索
- 在 高维数据(>20 维) 下效率急剧下降(维度灾难)
1.2. LSH(局部敏感哈希,Locality-Sensitive Hashing)
- 类型: 基于哈希的近似最近邻搜索
- 适用场景: 高维数据、文本检索、推荐系统、图像搜索
- 原理:
- 通过 哈希函数 将相似向量映射到相同的桶
- 通过减少搜索空间,加速最近邻查找
- 经典方法:
- MinHash(Jaccard 相似度,用于集合相似性计算)
- SimHash(海量文本去重,如 Google 使用 SimHash 进行网页去重)
- 优缺点:
- 适用于高维数据,但精度可能不如图搜索(如 HNSW)
1.3. 倒排索引(Inverted Index)
- 类型: 基于索引的搜索方法
- 适用场景: 文本检索(如搜索引擎)、稀疏向量搜索
- 原理:
- 记录 关键词 -> 文档 ID 列表,可快速找到包含查询关键词的所有文档
- 向量检索时可以与 HNSW(Hierarchical Navigable Small World) 结合,提高搜索效率
- 优缺点:
- 适用于离散数据(如文本、关键词),对连续高维向量的搜索能力有限
1.4. HNSW(层次可导航小世界图,Hierarchical Navigable Small World)
- 类型: 基于图的近似最近邻搜索
- 适用场景: 高维向量检索(推荐系统、图像搜索)
- 原理:
- 构建 小世界图(Small World Graph),通过跳跃式邻居搜索快速找到最近邻
- 适用于 高维数据搜索,比 KD-Tree 和 LSH 更快、更精确
- 优缺点:
- 性能远优于 KD-Tree 和 LSH,适用于 超高维数据搜索
- 需要 较大的内存 来存储索引
1.5. FAISS(Facebook AI Similarity Search)
- 类型: 高维向量搜索库
- 适用场景: 图像检索、语音检索、推荐系统
- 原理:
- 支持 PQ(Product Quantization)、IVF(Inverted File Index)、HNSW 等多种索引方法
- 适用于 大规模向量搜索(如 十亿级别的向量数据库)
- 优缺点:
- 大规模向量搜索最优选择
- 需要 GPU 加速才能发挥最大效能
1.6. 推荐工具
- FAISS(Facebook AI): 适用于 GPU 加速的向量搜索
- Annoy(Spotify): 适用于内存受限的情况,构建高效 KD-Tree
- HNSWlib: 纯 C++ 实现的高效 HNSW 近似最近邻搜索
二、推荐算法 vs. 广告算法的区别
推荐算法(Recommendation Algorithm)和广告算法(Advertising Algorithm)在 目标、数据输入、优化目标、应用场景 等方面有较大不同,两者都涉及 个性化推荐 和 用户行为预测
2.1. 核心目标
推荐算法 | 广告算法 | |
---|---|---|
核心目标 | 提高用户体验,增加用户粘性,提升内容消费 | 提高广告转化率(CTR、CVR),优化广告收益 |
优化目标 | 让用户更喜欢和更长时间停留在平台 | 让广告主的投放 ROI 最大化,提高收益 |
2.2. 算法模型
推荐算法 | 广告算法 | |
---|---|---|
主流方法 | 协同过滤(CF)、矩阵分解、深度学习(DNN、Transformer)、强化学习 | 逻辑回归(LR)、GBDT、深度CTR模型(Wide & Deep、DeepFM、Transformer-based CTR) |
目标优化 | 召回 + 排序 | 预估 CTR/CVR + 竞价优化 |
在线/离线 | 大部分离线训练,部分在线更新 | 在线实时计算,多轮竞价 |
2.3. 核心流程
推荐算法流程
- 召回阶段(候选生成):快速筛选可能感兴趣的内容
- 基于协同过滤、用户兴趣模型、内容相似性等方法
- 粗排阶段:初步排序,过滤低质量内容
- 轻量级模型(如 GBDT、Embedding-based 方法)
- 精排阶段:更复杂的深度学习模型(DNN、Transformer)
- 预测用户点击率、停留时间、互动行为等
- 重排序 & 多目标优化:
- 结合用户体验、平台收益、内容多样性等
广告算法流程
- 广告召回:
- 召回匹配的广告(基于用户历史、关键词、兴趣等)
- CTR/CVR 预估:
- 预测该广告被点击(CTR)和转化(CVR)的概率
- eCPM 计算:
- eCPM = 预估点击率 × 出价
- 计算每个广告对平台的潜在收益
- 广告竞价:
- 竞价策略(如 Vickrey-Clarke-Groves 机制)
- 选择收益最高的广告展示
三、召回模型中的负样本选择:为什么要负采样?
在推荐系统的召回阶段,我们通常使用 监督学习 来训练模型,而监督学习需要 正样本(用户感兴趣的物品) 和 负样本(用户不感兴趣的物品)。由于真实世界中 负样本远多于正样本,因此需要 负采样(Negative Sampling) 来提升训练效率和模型效果。
3.1. 为什么要进行负采样?
3.1.1 计算资源限制
- 真实世界中,未点击的物品数量 远超已点击的物品,直接使用所有未点击的物品作为负样本,会导致 数据量过大,计算成本极高。
- 负采样可以 减少训练数据量,降低计算复杂度,提高训练速度。
3.1.2 训练效果优化
- 如果将 所有未交互的物品 作为负样本,容易导致数据 极度不均衡,模型可能会学习到 “不点击才是常态”,从而忽略正样本信息。
- 通过 合理的负采样策略,可以选取更具代表性的负样本,使模型更准确地学习用户的偏好。
3.1.3 解决数据偏差问题
- 在推荐系统中,用户未点击的内容并不一定是他们不感兴趣的(可能是 未曝光)。
- 直接将所有未点击的物品视为负样本可能会引入噪声,而负采样可以帮助过滤掉这些噪声。
3.2. 常见的负采样方法
3.2.1. 随机负采样(Random Negative Sampling)
- 方法:随机从未交互物品池中选择一定数量的物品作为负样本。
- 优点:简单易实现,计算成本低。
- 缺点:可能采样到无意义的负样本(如用户从未接触过的类别),影响训练效果。
3.2.2. 基于流行度的负采样(Popularity-based Negative Sampling)
- 方法:按照物品的流行度(如点击量、购买量)进行采样,越流行的物品被选中的概率越高。
- 优点:增加热门物品作为负样本,提高模型对流行趋势的学习能力。
- 缺点:可能导致模型偏向推荐热门物品,影响长尾物品的推荐效果。
3.2.3. 硬负采样(Hard Negative Sampling)
- 方法:选择 与用户历史兴趣最相似但未被点击 的物品作为负样本。例如,基于 Embedding 相似度 或 模型预测分数最高但未实际交互 的物品进行采样。
- 优点:
- 负样本质量高,提高模型的判别能力。
- 可以更好地区分 “用户可能感兴趣但未点击” 和 “用户完全不感兴趣” 的内容。
- 缺点:
- 计算成本较高,需要额外的相似度计算或预训练模型。
四、什么是哈利波特效应 和 新闻联播效应
4.1. 哈利波特效应
概念
- “哈利波特效应”(Harry Potter Effect)指的是 头部效应,即 极少数头部内容获得大量关注,而长尾内容则难以被发现。
- 这种现象广泛存在于 图书、电影、音乐、短视频、游戏等文娱产业,表现为 爆款作品 迅速吸引大部分用户的注意力,而其他内容则被冷落。
原因
- 马太效应(强者愈强,弱者愈弱):热门作品的知名度越高,越容易获得额外流量。
- 社交传播效应:热门内容容易被社交媒体讨论和推荐,形成病毒式传播。
- 平台推荐机制:算法倾向于推荐已有较高互动的内容,进一步放大头部效应。
影响
- 头部效应强化:资源和流量向头部内容集中,少量爆款内容占据市场大部分收益。
- 长尾内容难以崛起:中小创作者、独立作品难以获得曝光,导致内容多样性下降。
- 用户兴趣趋同:用户接触的信息可能变得越来越相似,难以发现个性化内容。
典型案例
- 哈利·波特系列图书:全球畅销,形成现象级 IP,而其他同类奇幻小说难以获得类似的市场份额。
- 抖音/B站爆款视频:少数高播放量的视频获得大量推荐和转发,而大部分普通创作者的视频很难出圈。
- 好莱坞电影:MCU(漫威电影宇宙)等超级IP大片持续主导市场,导致小成本电影生存空间缩小。
4.2. 新闻联播效应
概念
- “新闻联播效应”(Xinwen Lianbo Effect)指的是 内容同质化现象,即 所有用户看到的内容高度相似,缺乏多样性。
- 这种效应通常发生在 内容分发平台、社交媒体、搜索引擎等信息流推荐场景,由于算法或政策限制,用户被推送类似的信息,导致视野受限。
原因
- 信息茧房(Filter Bubble):推荐算法基于用户的历史行为,只推送用户“可能感兴趣”的内容,导致信息圈越来越封闭。
- 主流导向:官方或平台出于管理需求,可能会控制信息流,强调特定议题,削弱其他内容的曝光度。
- 算法收敛:推荐系统优化点击率,逐渐收敛到某些最受欢迎的内容,使得不同用户看到的内容趋于一致。
影响
- 用户多样化需求被忽视:用户接触到的信息局限于某一类型,减少了接触不同观点和内容的机会。
- 创新受限:内容创作者可能会趋同于热门话题,减少多样化创作。
- 社会认知固化:大众观点趋同,难以形成多元讨论,可能加剧偏见或误导公众认知。
典型案例
- 短视频平台的推荐机制:如果你刷短视频时喜欢看某类内容(如健身、美食),推荐算法会持续推送类似的视频,导致信息单一化。
- 微博热搜:某些新闻和话题反复出现,而其他可能同样重要的议题被忽视。
- 搜索引擎优化(SEO):搜索引擎根据用户的历史记录调整结果排序,用户可能总是看到相似的信息,而忽略其他观点。
4.3. 主要区别
维度 | 哈利波特效应 | 新闻联播效应 |
---|---|---|
核心现象 | 头部内容占据绝大部分流量,长尾内容难以崛起 | 所有人看到的信息趋于相似,内容同质化 |
主要影响 | 资源向头部集中,爆款效应加剧,内容多样性受影响 | 信息茧房效应加剧,用户认知受限,创新受阻 |
主要原因 | 马太效应、社交传播、平台推荐机制 | 信息茧房、主流导向、算法收敛 |
典型案例 | 哈利·波特、抖音爆款视频、漫威电影 | 短视频推荐、微博热搜、SEO个性化搜索 |
五、3. 无重复字符的最长子串(力扣hot100_滑动窗口)
- 思路1:
维护一个tmp_s,遍历s,如果遇到重复字符,将tmp_s中重复字符及其之前的元素都删除。index= list.index(“s”) 就可以得到当前元素在列表中的第一个位置 - 代码:
class Solution:def lengthOfLongestSubstring(self, s: str) -> int:tmp_s = []max_len = 0for i in s:if i not in tmp_s:tmp_s.append(i)max_len = max(max_len, len(tmp_s))else:max_len = max(max_len, len(tmp_s))index = tmp_s.index(i) tmp_s = tmp_s[index+1:]tmp_s.append(i)return max_len
- 思路2:滑动窗口+哈希表
维护一个哈希表,记录每个字符最后出现的索引。遍历s,tmp_s的左边界为max(i.index, 左边界),右边界为当前字符i在s中的位置 - 代码:
class Solution:def lengthOfLongestSubstring(self, s: str) -> int:dic = {}left = -1res = 0for right, s1 in enumerate(s):if s1 in dic: # 出现重复字符left = max(dic[s1], left) # 计算当前重复字符上一个位置和字串的初始位置的最大dic[s1] = rightres = max(res, right-left)return res
相关文章:
搜广推校招面经六十一
美团推荐算法 一、ANN算法了解么?说几种你了解的ANN算法 ANN 近似最近邻搜索(Approximate Nearest Neighbor Search)算法 1.1. KD-Tree(K-Dimensional Tree,K 维树) 类型: 空间划分数据结构适用场景: 低…...
某地老旧房屋自动化监测项目
1. 项目简介 自从上个世纪90年代以来,我国经济发展迅猛,在此期间大量建筑平地而起,并且多为砖混结构的住房,使用寿命通常约为30-50年,钢筋混凝土结构,钢结构等高层建筑,这些建筑在一般情况下的…...
【第一节】Python爬虫基础-HTTP基本原理
目录 前言 一、URI和URL是什么 二、什么是超文本 三、HTTP和HTTPS的区别 四、HTTP请求过程 五、请求 六、响应 前言 在着手开发爬虫程序之前,我们需要先掌握一些基础概念。本节将详细讲解HTTP的基本工作原理,重点分析从浏览器输入网址到获取网页内…...
docker打包使用有头模式playwright
1.打包镜像 创建Dockerfile文件如下 # playywright 官方镜像 FROM mcr.microsoft.com/playwright:v1.37.0-jammy# 设置非交互式环境变量和时区 ENV DEBIAN_FRONTENDnoninteractive ENV TZEtc/UTC# 安装 Python 3.9 和 pip(修复时区阻塞问题) RUN apt-g…...
VuePress 和 Docusaurus的对比
VuePress 和 Docusaurus 是两个流行的现代静态网站生成器 vuepress:首页 | VuePress Docusaurus:Docusaurus 博客 | Docusaurus中文文档 | Docusaurus中文网 一、技术栈和设计理念 VuePress 技术栈:基于Vue.js,专为技术文档设计,…...
JAVA数据库增删改查
格式 Main.java(测试类) package com.example;import com.example.dao.UserDao; import com.example.model.User;public class Main {public static void main(String[] args) {UserDao userDao new UserDao();// 测试添加用户System.out.println(" 添加用户 ");Us…...
MSTP多域生成树
协议信息 MSTP 兼容 STP 和 RSTP,既可以快速收敛,又提供了数据转发的多个冗余路径,在数据转发过程中实现 VLAN 数据的负载均衡。 MSTP 可以将一个或多个 VLAN 映射到一个 Instance(实例)(一个或多个 VLAN…...
HashMap 在 JDK 1.7 和 JDK 1.8 有什么区别
HashMap 在 JDK 1.7 和 JDK 1.8 中的实现存在显著差异,主要体现在以下几个方面: 1. 数据结构的变化 • JDK 1.7:HashMap 的底层数据结构是数组 单向链表。当哈希冲突发生时,新的元素会插入到链表的头部(头插法&#…...
Mysql忽略大小写
🚀欢迎来到我的【Mysql】专栏🚀 🙋我是小蜗,一名在职牛马。🐒我的博客主页 ➡️ ➡️ 小蜗向前冲的主页🙏🙏欢迎大家的关注,你们的关注是我创作的最大动力🙏🙏在 MySQL 中取消大小写区分主要涉及以下两个层面的配置,具体操作如下: 一、表名大…...
基于TradingView和CTPBee的自动化期货交易系统实现
引言 在量化交易领域,TradingView因其强大的技术分析工具和丰富的指标库而广受欢迎,但是其不支持国内期货自动化交易,CTPBee则是一个优秀的国产Python期货交易接口。本文将介绍如何将两者结合,实现一个完整的自动化交易系统。 本…...
昇腾CANN算子共建仓CANN-Ops正式上线Gitee,首批算子已合入
在人工智能技术呈指数级发展的今天,AI创新已走向更底层的算法创新,以DeepSeek为例,通过MoE模型架构和底层算法创新,不仅获取极佳的模型性能,又更大程度释放硬件性能,降低硬件使用成本。 算子,作…...
基于PyQt5的自动化任务管理软件:高效、智能的任务调度与执行管理
基于PyQt5的自动化任务管理软件:高效、智能的任务调度与执行管理 相关资源文件已经打包成EXE文件,可双击直接运行程序,且文章末尾已附上相关源码,以供大家学习交流,博主主页还有更多Python相关程序案例,秉着…...
Pycharm(八):字符串切片
一、字符串分片介绍 对操作的对象截取其中一部分的操作,比如想要获取字符串“888666qq.com前面的qq号的时候就可以用切片。 字符串、列表、元组都支持切片操作。 语法:字符串变量名 [起始:结束:步长] 口诀:切片其实很简单,只顾头来…...
C++编程学习笔记:函数相关特性、引用与编译流程
目录 一、函数的缺省参数 (一)全缺省参数 (二)半缺省参数 二、函数重载 (一)参数类型不同 (二)参数个数不同 (三)参数类型顺序不同 三、引用相关问题…...
Nginx 配置 HTTPS 与 WSS 完整指南
Nginx 配置 HTTPS 与 WSS 完整指南 本教程将手把手教你如何为网站配置 HTTPS 加密访问,并通过反向代理实现安全的 WebSocket(WSS)通信。以 https://www.zhegepai.cn 域名为例,完整流程约需 30 分钟完成。 一、前置准备 1.1 域名…...
链表基本操作
文章目录 1、单链表1.1 链表的创建1.2 链表的遍历1.3 链表的删除1.4 链表的插入1.5 链表和数组 2、双向链表2.1 双链表的创建2.2 双链表的删除2.3 双链表的插入2.4 双向循环链表2.5 双链表优缺点 1、单链表 链表是一种物理存储单元上非连续、非顺序的存储结构,插入…...
【huggingface 数据下载】ssh / https 不同的下载流程,hf 镜像下载注意事项
ssh 下载流程 在 linux 服务器上生成 ssh key将 pub key 放入 huggingface 的 setting 中通过 git lfs install 然后 git clone githf.co … 来下载数据 遇到的问题 一直卡在 Updating files 后 卡住的可能原因: 系统当前限制了允许监视的最大文件数࿱…...
简单版CentOS7配置haproxy
一、实验步骤 1、自行下载pes的tar包 然后解压到家目录下 tar -xzvf pes.tar.gz 2、创建一个目录 mkdir docker-compose-pes-lb2 3、在这个目录下写两个文件docker-compose.yml和haproxy.cfg docker-compose.yml version: 3 services: db: image: mysql:5.7.44 container…...
leetcode146.LRU缓存
思路源自 【面试高频】146. LRU 缓存 采用哈希表双向链表 put一个键值对时,采用头插法将缓存块置于等级较高的位置,如果put数量超出限制,那么就将尾部的缓存块删除,以此达到置换的一个效果 get一个键值对也是同样的思路…...
SpringIoC和DI
文章目录 OCP开闭原则DIP(依赖倒置原则)IOC(控制反转)依赖注入DI基于XML配置Beanset注入构造注入 使用注解存储beanController方法注解Bean扫描路径依赖注入三种注入方式优缺点分析 引入 当我们写了一个程序,遵循SpringMVC三层架构,表现层调用业务逻辑层…...
vue 路由
目录 一、路由的使用 二、声明式导航 2.1 声明式导航 2.2 声明式导航路由传参 2.2.1.字符串写法 2.2.2.对象写法 2.2.3 query 传参和 param 传参总结 2.3 命名路由 2.4 可选操作符 2.5 props 参数 三、编程式导航 3.1 replace 和 push 跳转…...
JAVA常见的 JVM 参数及其典型默认值
在 Java 线上应用中,JVM 参数的默认值取决于具体的 JVM 实现(如 Oracle JDK、OpenJDK、Zulu 等)、版本(如 Java 8、11、17 等)以及运行环境(物理机、容器等)。以下是常见的 JVM 参数及其典型默认…...
文件压缩与解压(zip4j)
maven依赖 <dependency><groupId>net.lingala.zip4j</groupId><artifactId>zip4j</artifactId><version>2.11.5</version></dependency>示例 //参数配置ZipParameters parameters new ZipParameters();parameters.setCompres…...
【操作系统】查内存泄漏方法
【操作系统】查内存泄漏方法 1. 通用检测方法1.1 代码审查1.2 运行时监测 2.Linux平台检测工具2.1 Valgrind工具套件2.2 AddressSanitizer (ASan)2.3 mtrace 3.Windows平台检测工具3.1 Visual Studio诊断工具3.2 CRT调试堆 4.嵌入式系统检测方法4.1 RT-Thread内存检测4.2 自定义…...
oracle常用sql
获取主键 1. 查询主键的两种常用方法 Oracle 的主键信息存储在以下两个视图中: USER_CONSTRAINTS:存储当前用户下所有表的约束信息(如主键、外键等)。 USER_CONS_COLUMNS:存储约束对应的列信息。 方法 1ÿ…...
【第十三届“泰迪杯”数据挖掘挑战赛】【2025泰迪杯】【思路篇】A题解题全流程(持续更新)
【第十三届“泰迪杯”数据挖掘挑战赛】【2025泰迪杯】A题解题全流程-思路(持续更新) 写在前面: 1、A题、C题将会持续更新,陆续更新发布文章 2、赛题交流咨询Q群:1037590285 3、全家桶依旧包含: 代码、…...
Qt 信号量使用方法
Qt 信号量使用方法 QSemaphore 类 常用函数介绍 函数名称函数功能QSemaphore()构造并初始化对象acquire()尝试获取n个资源,如果没有那么多资源,线程将阻塞直到有n个资源可用available()返回当前信号量可用的资源个数,这个数永远不可能为负…...
C++进阶——封装哈希表实现unordered_map/set
与红黑树封装map/set基本相似,只是unordered_map/set是单向迭代器,模板多传一个HashFunc。 目录 1、源码及框架分析 2、模拟实现unordered_map/set 2.1 复用的哈希表框架及Insert 2.2 iterator的实现 2.2.1 iteartor的核心源码 2.2.2 iterator的实…...
AI Agent 实战:搭建个人在线旅游助手
AI Agent 实战:搭建个人在线旅游助手 本次实验中,我们将继续探索 Agent 的提示词,学习更加规范的提示词撰写方法。 本实验中你将掌握的知识点 使用 Dify 构建 Agent 的方法结构化的提示词撰写技巧变量的使用方法 1. 准备 在新建 Agent 之…...
CSS中的overflow属性
在 CSS 中,overflow 属性用于控制当一个元素的内容溢出其指定的区域时,应该如何处理溢出的部分。通常用于盒模型(如 div)中,指定内容超出容器时的显示方式。 overflow 属性的常用值: 1. visible(…...
【Unity】处理文字显示不全的问题
1.选中字体文件,检查 MultiAtlasTeextures 是否勾选,未勾选的话,先勾选保存后查看是否显示正常 2.勾选后未正常显示,则在搜索框中输入未显示的文本,确认字体图集是否包含该文本,然后点击Update Atlas Textu…...
蓝桥备赛指南(11):递归简介
递归的介绍 概念:递归是指函数直接或间接调用自身的过程。 解释递归的两个关键要素: 基本情况(递归终止条件):递归函数中的一个条件,当满足该条件时,递归终止,避免无限递归。可以…...
Python 图片水印处理工具
自定义水印文本自定义水印位置支持图片裁剪支持各种图片格式 from PIL import Image, ImageDraw, ImageFont import osclass ImageWatermarker:def __init__(self, font_pathNone, font_size40):"""初始化水印处理器font_path: 字体文件路径,默认使…...
从零开始:如何打造一套完整的UI设计系统?
1. 建立色彩系统 色彩系统是设计系统的基础之一,它不仅影响界面的整体美感,还对用户体验有着深远的影响。首先,设计师需要定义主色调、辅助色和强调色,并确保这些颜色在不同场景下的应用保持一致。使用工具如Adobe Color或Coolor…...
Jenkins + CICD流程一键自动部署Vue前端项目(保姆级)
git仓库地址:参考以下代码完成,或者采用自己的代码。 南泽/cicd-test 拉取项目代码到本地 使用云服务器或虚拟机采用docker部署jenkins 安装docker过程省略 采用docker部署jenkins,注意这里的命令,一定要映射docker路径,否则无…...
c# 虚函数、接口、抽象区别和应用场景
文章目录 定义和语法实现要求继承和使用场景总结访问修饰符设计目的性能扩展性在 C# 里,虚函数、接口和抽象函数都能助力实现多态性,不过它们的定义、使用场景和特点存在差异,下面为你详细剖析: 定义和语法 虚函数:虚函数在基类里定义,使用 virtual 关键字,且有默认的实…...
数据治理的主题库是做什么的
数据治理的主题库详解 一、定义与核心概念 主题库是数据治理体系中的核心组件,指围绕某一业务主题或实体对象,通过数据清洗、整合、标准化等手段形成的逻辑化、高质量数据集。其核心特征包括: 主题导向:以业务领域(…...
pytorch模型的进阶训练和性能优化
综合案例 将MNIST数据集保存成本地图片读取本地图片进行训练读取自己的数据集进行训练用自己的模型进行训练获得更多评价指标提升模型性能的方法 MNIST转本地图片 import os import torchvision import torchvision.transforms as transforms# 下载MNIST数据集 transform t…...
i18next在vue3中的应用,可参考写法或直接复用
i18next是一个国际化相关的的依赖,适配多种框,比如vue2/3,react,next.js等等,是一个非常实用的依赖。在一次项目中接触过i18n相关内容,因此今天就整理一下这个通用的插件。 官网:Introduction …...
DM数据迁移工具
DM数据迁移工具 一、概述二、迁移准备三、启动迁移工具1.Windows 环境启动 DM 数据迁移工具2.Linux 环境启动 DM 数据迁移工具2.1启用图形化安装界面前需要通过如下命令将图形界面权限放开:2.2进入数据库安装路径 /tool 目录下,运行 ./dts 即可启动 DM 数…...
Python入门(4):函数
目录 1 基本概念 1.1 函数的定义与调用 2 函数的参数 2.1 位置参数(Positional Arguments) 2.2 默认参数(Default Arguments) 2.3 关键字参数(Keyword Arguments) **2.4 可变参数(*…...
Java基础-25-继承-方法重写-子类构造器的特点-构造器this的调用
在面向对象编程中,继承是实现代码复用和扩展的重要机制。通过继承,子类可以继承父类的属性和方法,并且可以通过方法重写来改变或扩展父类的行为。此外,构造器在对象初始化过程中扮演了重要角色,尤其是在子类构造器中如…...
Mysql之事务(上)
🏝️专栏:Mysql_猫咪-9527的博客-CSDN博客 🌅主页:猫咪-9527-CSDN博客 “欲穷千里目,更上一层楼。会当凌绝顶,一览众山小。” 目录 1.什么需要为事务? 2.事务的四个特性 1. 原子性࿰…...
2025华为软件精英挑战赛2600w思路分享
这里写自定义目录标题 得分展示对象定义请求价值计算时间同步删除操作完整思路 得分展示 对象定义 // 将一个磁盘划分为多个基于标签聚合的区块 class Block{ public:int tag 0; // 区块标签int start_pos;int end_pos;int id;int use_size 0;int v;// 为区块确定范围Bloc…...
LSTM网络是什么?
环境: LSTM网络 问题描述: LSTM网络是什么? 解决方案: LSTM 网络解释 LSTM(Long Short-Term Memory)网络 是一种特殊的递归神经网络(RNN),能够学习长期依赖关系。L…...
bert自然语言处理框架
自然语言处理框架 目录 自然语言处理框架bert自然语言处理框架概念核心特点应用场景 框架和数据集结构编码-解码框架Self-Attention 机制multi-headed机制位置编码Add与Normalize整体框架outputs训练数据集 bert自然语言处理框架 概念 BERT(Bidirectional Encoder …...
UE5学习笔记 FPS游戏制作33 游戏保存
文章目录 核心思想创建数据对象创建UIUI参数和方法打开UI存档文件的位置可以保存的数据类型 核心思想 UE自己有保存游戏的功能,核心节点,类似于json操作,需要一个数据类的对象来进行保存和读取 创建存档 加载存档 保存存档 创建数据对象…...
【超详细】一文解决更新小米澎湃2.0后LSPose失效问题
【超详细】一文解决更新澎湃2.0后LSPose失效问题 问题分析: 出现这个问题大多是因为本次为大版本更新A14->A15,因此原来的LSPose无法支持新系统特性导致的,因此我们从此出发解决这个问题。 方案一(magisk): 直接…...
Python爬虫教程007:scrapy结合实际案例的简单使用
文章目录 3.1 scrapy安装3.2 scrapy的基本使用3.2.1 scrapy项目的创建和运行3.3 58同城案例3.3.1 创建案例3.3.2 项目结构说明3.4 汽车之家案例3.1 scrapy安装 什么是scrapy: Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘、信息处…...
【可能性:如何从已有条件中分析一件事情是否会发生? 关键字摘抄】
是否可以直接从前提条件给出的信息中,推理出一件事情是否会发生呢?还真的可以,这一讲,我们就来说说,什么是逻辑上的必然性,可能性和排他性。 白马非马? 春秋战国百家争鸣时期,名家…...