当前位置: 首页 > news >正文

搜广推校招面经八十二

一、L1 和 L2 正则化的区别?对数据分布有什么要求,它们都能防止过拟合吗?

1.1. L1 与 L2 正则化的区别

特性L1 正则化(Lasso)L2 正则化(Ridge)
正则项λ * ∑|wᵢ| λ ∗ ∑ ( w i 2 ) λ * ∑(wᵢ²) λ(wi2)
几何意义曼哈顿距离欧几里得距离
是否稀疏会产生稀疏解(可做特征选择)一般不会产生稀疏解
使用场景特征选择、高维稀疏问题多重共线性、连续性特征问题

1.2. 对数据分布的要求

  • L1 正则化
    • 特征间相关性高时效果较差(可能任意选择一个);
    • 更适合高维稀疏特征(如文本、基因数据);
  • L2 正则化
    • 更适合特征均匀分布、非稀疏数据;
    • 对特征间存在多重共线性效果更稳定;
    • 对正态分布特征表现更好;

1.3. 它们都能防止过拟合吗?

是的,L1 和 L2 都能防止过拟合:

  • L1 通过让某些特征权重变为 0,起到特征选择的作用;
  • L2 通过惩罚权重过大的参数,使模型更平滑、更稳定;

1.4. 总结建议

场景推荐使用的正则化方式
高维稀疏特征L1
需要自动特征选择L1
特征之间存在多重共线性L2
更注重解的稳定性L2
想结合两者优点Elastic Net(L1 + L2 混合)

二、冷启动场景下Embedding初始化方案有那些?

2.1. 随机初始化

  • 直接高斯或者均匀随机初始化。缺点就是没有任何先验知识可能导致收敛变慢或者模型不稳定

2.2. 使用平均 Embedding

  • 所有未知的物品的Embedding = 所有老物品Embedding的平均值。这样可能稳定点,适用于新物品和老物品有几分相似

2.3. 相似对象初始化

  • 基于新对象的一些辅助信息(如属性、上下文、元数据)找出最相似的已有对象,使用其 Embedding 或加权平均。

2.4. 搞迁移学习或者叫预训练模型初始化

  • 先训练一个元模型就是输出Embedding,根据新对象的元特征生成对应的 Embedding

2.5. 使用图神经网络

  • 这个比较复杂,图本身也不好训练,感觉只有任务要求很高的情况才搞这么复杂

三、详细解释一下DCN模型

论文原文:Deep & Cross Networkfor Ad Click Predictions, KDD’2017, Google

3.1. 设计这个模型其实也是为了更加充分的特征交叉,DNN + Cross Net模型架构如下:

在这里插入图片描述

3.2. Cross Net 的具体细节

对于第 l 层:
x l + 1 = x 0 ⋅ ( w l T x l ) + b l + x l x_{l+1} = x_0 \cdot (w_l^T x_l) + b_l + x_l xl+1=x0(wlTxl)+bl+xl
其中:

  • x 0 x_0 x0 为原始输入向量(固定不变)
  • x l x_l xl 为当前层输入
  • w l ∈ R d w_l \in \mathbb{R}^d wlRd b l ∈ R d b_l \in \mathbb{R}^d blRd
  • · 为哈达马积(逐元素乘)

3.3. Cross Net的优势

X i + 1 = X 0 X i T W i + X i + b i X_{i+1} = X_0 X_i^T W_i + X_i + b_i Xi+1=X0XiTWi+Xi+bi

X 0 X_0 X0可视为常数输入, W i W_i Wi 视为函数 F F F,公式可改写为:
X i + 1 = F ( X i ) + X i + b i X_{i+1} = F(X_i) + X_i + b_i Xi+1=F(Xi)+Xi+bi

与残差连接的对比

残差连接的标准公式: y = f ( x ) + x y = f(x) + x y=f(x)+x

相似之处

  • 两者均采用“原始输入 + 变换结果”的结构。
  • 均具备避免梯度消失的特性。
  • 适合构建深层网络。

四、DIN 的 Target Attention 是怎么做的?

4.1. 背景:DIN 主要解决什么?

DIN(Deep Interest Network)用于电商推荐,它的特点是:

  • 用户有很多历史行为(点击、浏览、收藏等)
  • 但不是每次历史行为都和当前待推荐商品相关

所以,需要根据当前的待推荐商品(target item)动态地去关注用户的历史行为。这就是 Target Attention —— 针对不同的目标,动态建模兴趣的注意力机制。

4.2. DIN 中 Target Attention 的计算流程

假设:

  • 用户历史行为序列: { h 1 , h 2 , . . . , h n } \{h_1, h_2, ..., h_n\} {h1,h2,...,hn}
  • 当前候选物品(Target Item): t t t

4.2.1. Attention步骤是:

第一步:拼接特征

对每个历史行为 h i h_i hi 和当前target t t t,做特征组合。
通常的组合方法是:

  • 拼接 (Concat): [ h i , t , h i − t , h i ∘ t ] [h_i, t, h_i - t, h_i \circ t] [hi,t,hit,hit]
    • h i − t h_i - t hit:捕捉差异
    • h i ∘ t h_i \circ t hit:逐元素乘(哈达马积,捕捉交互)
    • [ ⋅ ] [\cdot] []:表示拼接
第二步:MLP 得分

将上面组合后的特征,输入一个小的MLP(多层感知机),输出一个相关性得分(attention weight)
α i = MLP ( [ h i , t , h i − t , h i ∘ t ] ) \alpha_i = \text{MLP}([h_i, t, h_i - t, h_i \circ t]) αi=MLP([hi,t,hit,hit])
注意:

  • 这里的 MLP 是共享参数的。
  • 不是标准的 “点积Attention”(比如 Transformer里的那种),而是通过 MLP学习得分。
第三步:Softmax归一化

对所有得分 { α 1 , α 2 , . . . , α n } \{\alpha_1, \alpha_2, ..., \alpha_n\} {α1,α2,...,αn} 做 softmax 归一化:
β i = exp ⁡ ( α i ) ∑ j = 1 n exp ⁡ ( α j ) \beta_i = \frac{\exp(\alpha_i)}{\sum_{j=1}^n \exp(\alpha_j)} βi=j=1nexp(αj)exp(αi)
这样可以保证权重加起来为 1。

第四步:加权求和

最后,用归一化后的权重对历史行为加权求和,得到一个综合向量:
h a t t n = ∑ i = 1 n β i h i h_{attn} = \sum_{i=1}^n \beta_i h_i hattn=i=1nβihi
这个 h a t t n h_{attn} hattn 就是最终代表用户兴趣的向量,专门针对当前target。

相关文章:

搜广推校招面经八十二

一、L1 和 L2 正则化的区别?对数据分布有什么要求,它们都能防止过拟合吗? 1.1. L1 与 L2 正则化的区别 特性L1 正则化(Lasso)L2 正则化(Ridge)正则项λ * ∑|wᵢ| λ ∗ ∑ ( w i 2 ) λ * ∑…...

机器学习——朴素贝叶斯法运用

一、朴素贝叶斯法 1.1 基本概念 朴素贝叶斯法是一种基于贝叶斯定理的简单概率分类方法,它假设特征之间相互独立。它适用于分类问题,尤其是在文本分类中表现良好。其核心思想是通过考虑各个特征的概率来预测分类(即对于给出的待分类样本&am…...

内存池管理项目——面试题总结

一.项目描述 项⽬概述:本项⽬通过实现⾸次拟合法和伙伴系统算法,完成对内存池的管理,旨在为程序提供⾼效、合理的内存分配与回收机制,优化内存使⽤效 率。 主要内容及技术: ⾸次拟合法实现:定义WORD结构体…...

基于Python+Neo4j实现新冠信息挖掘系统

软件说明书 一、引言 便携本使用说明的目的是充分叙述本软件所能实现的功能及运行环境,以便使用者了解本软件的使用范围和使用方法,并为软件的维护和更新提供必要的信息。 二、软件概述 2.1软件简介 新型冠状病毒肺炎肆虐全球,给人们的健…...

深入浅出理解并应用自然语言处理(NLP)中的 Transformer 模型

1 引言 随着信息技术的飞速发展,自然语言处理(Natural Language Processing, NLP)作为人工智能领域的一个重要分支,已经取得了长足的进步。从早期基于规则的方法到如今的深度学习技术,NLP 正在以前所未有的速度改变着我…...

AEB法规升级后的市场预测与分析:技术迭代、政策驱动与产业变革

文章目录 一、政策驱动:全球法规升级倒逼市场扩容二、技术迭代:从“基础防护”到“场景全覆盖”三、市场格局:竞争加剧与生态重构四、挑战与未来展望五、投资建议结语 近年来,全球汽车安全法规的加速升级正深刻重塑AEB&#xff08…...

《代码之美:静态分析工具与 CI 集成详解》

《代码之美:静态分析工具与 CI 集成详解》 引言 在现代软件开发的快节奏环境中,代码质量和效率始终是开发者关注的核心。无论您是初学者,还是经验丰富的资深开发者,一个强大的工具链都能让您如虎添翼。而 Python 的静态代码分析工具,如 pylint、flake8 和 mypy,正是提升…...

Adobe Photoshop(PS)2022 版安装与下载教程

Adobe Photoshop下载安装和使用教程 Adobe Photoshop,简称“PS”,是由Adobe Systems开发和发行的图像处理软件。Photoshop主要处理以像素所构成的数字图像。使用其众多的编修与绘图工具,可以有效地进行图片编辑和创造工作&#xff0c…...

Universal Value Function Approximators 论文阅读(强化学习,迁移?)

前言 Universal Value Function Approximators 个人实现(请大佬指正) *关于UVFA如何迁移的问题,这也是我为什么反复看这篇文章的原因,我觉值函数逼近的最大用法就是如何迁移,如果仅仅是更改值函数的结构,…...

论文阅读:2024 arxiv HybridFlow: A Flexible and Efficient RLHF Framework

https://www.doubao.com/chat/3875396379023618 HybridFlow: A Flexible and Efficient RLHF Framework https://arxiv.org/pdf/2409.19256 https://github.com/volcengine/verl 速览 这篇论文主要介绍了一个名为HybridFlow的新型框架,旨在提升大语言模型&…...

WPF实现多语言切换

WPF实现多语言切换完整指南 一、基础实现方案 1. 资源文件准备 首先创建不同语言的资源文件: Resources/ ├── Strings.resx // 默认语言(英语) ├── Strings.zh-CN.resx // 简体中文 └── Strings.ja-JP.resx // 日语 ​​Strings.resx​​ (默认英…...

wpf操作主流数据

WPF 操作主流数据库详解 WPF(Windows Presentation Foundation)应用程序经常需要与数据库交互以实现数据的持久化和展示。主流的关系型数据库包括 ​​SQL Server​​、​​MySQL​​、​​PostgreSQL​​ 和 ​​SQLite​​。本文将详细介绍如何在 WPF 应用程序中使用这些主…...

Docker Compose--在Ubuntu中安装Docker compose

原文网址:Docker Compose--在Ubuntu中安装Docker compose_IT利刃出鞘的博客-CSDN博客 简介 说明 本文介绍如何在Ubuntu中安装docker compose。 docker-compose是用于管理Docker的,相对于单纯使用Docker更方便、更强大。 如果还没安装docker&#xf…...

推荐几个免费提取音视频文案的工具(SRT格式、通义千问、飞书妙记、VideoCaptioner、AsrTools)

文章目录 1. 前言2. SRT格式2.1 SRT 格式的特点2.2 SRT 文件的组成2.3 SRT 文件示例 3. 通义千问3.1 官网3.2 上传音视频文件3.3 导出文案 4. 飞书妙记4.1 官网4.2 上传音视频文件4.3 导出文案4.4 缺点 5. VideoCaptioner5.1 GitHub地址5.2 下载5.2.1 通过GitHub下载5.2.2 通过…...

驱动汽车供应链数字化转型的标杆解决方案:全星研发项目管理APQP软件系统:

全星研发项目管理APQP软件系统:驱动汽车供应链数字化转型的标杆解决方案 一、行业痛点与转型迫切性 在汽车行业电动化、智能化浪潮下,主机厂对供应链企业的APQP(先期产品质量策划)合规性、开发效率及体系化管理能力提出严苛要求。…...

PyTorch数据加载与预处理

数据加载与预处理详解 1. 数据集类(Dataset和DataLoader) 1.1 Dataset基类 PyTorch中的Dataset是一个抽象类,所有自定义的数据集都应该继承这个类,并实现以下两个方法: __len__(): 返回数据集的大小__getitem__(): 根据索引返回一个样本 …...

MyBatis 官方子项目详细说明及表格总结

MyBatis 官方子项目详细说明及表格总结 1. 核心子项目说明 1.1 mybatis-3 GitHub 链接:https://github.com/mybatis/mybatis-3功能: MyBatis 核心框架的源码,提供 SQL 映射、动态 SQL、缓存、事务管理等核心功能。主要功能: 支持…...

Java学习手册:常用的内置工具类包

以下是常用 Java 内置工具包。 • 日期时间处理工具包 • java.time包(JSR 310):这是 Java 8 引入的一套全新的日期时间 API,旨在替代陈旧的java.util.Date和java.util.Calendar类。其中的LocalDate用于表示不带时区的日期&…...

启动你的RocketMQ之旅(六)-Broker详细——主从复制

前言: 👏作者简介:我是笑霸final。 📝个人主页: 笑霸final的主页2 📕系列专栏:java专栏 📧如果文章知识点有错误的地方,请指正!和大家一起学习,一…...

QT跨平台软件开发要点

一、Qt跨平台开发核心优势 1.统一代码基 通过Qt的抽象层(Qt Platform Abstraction, QPA),同一套代码可编译部署到Windows、macOS、Linux、嵌入式系统(如ARM设备)甚至移动端(通过Qt for Android/iOS&#…...

【C语言】柔性数组

目录 一柔性数组的定义与特点 定义: 特点: 注意事项 二柔性数组的使用方法 三示例代码详解 四与其他知识的结合 五总结 前言: 柔性数组是C99标准引入的一种特殊结构体成员类型,允许在结构体的末尾定义一个长度未知的数组…...

AWS中国区ICP备案全攻略:流程、注意事项与最佳实践

导语 在中国大陆地区开展互联网业务时,所有通过域名提供服务的网站和应用必须完成ICP备案(互联网内容提供商备案)。对于选择使用AWS中国区(北京/宁夏区域)资源的用户,备案流程因云服务商的特殊运营模式而有所不同。本文将详细解析AWS中国区备案的核心规则、操作步骤及避坑…...

基于Matlab的MDF文件导入与处理研究

摘要 本文围绕MDF文件格式展开全面研究,系统阐述了MDF文件的基本结构与数据块概念,深入探讨了在Matlab环境下导入和处理这些文件的理论与实践方法。首先,介绍了MDF文件在现代工业和汽车电子领域的应用背景及重要意义。接着,详细剖析了MDF文件的结构,包括头部信息、数据块、…...

架构师备考-设计模式23种及其记忆特点

引言 以下是一篇关于架构师备考中设计模式23种的博文架构及记忆技巧总结,内容清晰、结构系统,适合快速掌握核心知识点。 考试类型是给语句描述或者类图,判断是哪一种设计模式(会出现英文的名词),2024年的两…...

学习记录:DAY18

前端实战与项目部署学习笔记 前言 时间固执沉默无情的流逝, 小心握紧漠然通达的当下。 今天要把前端实战部分学完,有时间写写学科作业 ----4.26---- 放纵注定是场与自我无休止的拉扯,过度的妥协只会跌入自我空虚的深渊 真该死啊&#xff0c…...

【OSG学习笔记】Day 10: 字体与文字渲染(osgText)

osgText库简介 osgText 是OpenSceneGraph(OSG)中用于文本渲染的重要模块,支持在3D场景中添加静态/动态文字、自定义字体、文字样式(颜色、大小、对齐方式等)以及动态更新文本内容。通过结合OSG的场景图机制&#xff0…...

[特殊字符] 深入理解Spring Cloud与微服务架构:全流程详解(含中间件分类与实战经验)

📚 目录 Spring Cloud 简介与发展 Spring Cloud 与 Spring Cloud Alibaba 的关系 为什么需要微服务?单体架构 vs 微服务对比 微服务常用中间件汇总 微服务如何科学拆分? 一个微服务对应一个数据库(服务自治原则) …...

深入理解算力:从普通电脑到宏观计算世界

在科技飞速发展的当下,“算力” 一词频繁出现在我们的视野中,无论是前沿的人工智能领域,还是新兴的区块链世界,算力都扮演着至关重要的角色。但对于大多数普通人来说,算力仿佛是一个既熟悉又陌生的概念。今天&#xff…...

IntelliJ IDEA 2025.2 和 JetBrains Rider 2025.1 恢复git commit为模态窗口

模态提交在 2025.1 中作为插件存在。 如下图所示安装插件 安装完之后,在设置里把下图的配置项打勾...

Linux——动静态库

目录 1. 动静态库基本原理 2. 认识动静态库 3. 动静态库的特点 3.1 静态库的优缺点 3.2 动态库的优缺点 4. 静态库的打包和使用 4.1 打包 4.2 使用 5. 动态库的打包和使用 5.1 打包 5.2 使用 6. 库的理解与加载 6.1 目标文件 6.2 ELF文件 6.3 ELF形成到加载…...

从频域的角度理解S参数:

从频域的角度理解S参数: S参数是一种频域模型,在频域的每一个频点都可以通过该频点的S参数来得到入射信号和反射信号之间的一组关系。这种方法不关注网络内部的具体结构,无论网络内部结构是什么,只要网络是线性不变的,就可以当作“…...

Java 安全:如何保护敏感数据?

Java 安全:如何保护敏感数据? 在当今数字化时代,数据安全成为了软件开发中至关重要的课题。对于 Java 开发者而言,掌握如何在 Java 应用中保护敏感数据是必备的技能。本文将深入探讨 Java 安全领域,聚焦于敏感数据保护…...

PySpark实现ABC_manage_channel逻辑

问题描述 我们需要确定"ABC_manage_channel"列的逻辑,该列的值在客户连续在同一渠道下单时更新为当前渠道,否则保留之前的值。具体规则如下: 初始值为第一个订单的渠道如果客户连续两次在同一渠道下单,则更新为当前渠…...

栈与堆的演示

1、栈与堆的演示 &#xff08;1&#xff09;网页视图 &#xff08;2&#xff09;代码 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, in…...

【Kafka】Windows环境下生产与消费流程详解(附流程图)

1. 背景说明 在搭建基于Kafka的数据流通系统(例如流式推荐、实时日志采集)时,常见的操作是: 生产者 Producer 向 Kafka Topic 写入消息消费者 Consumer 从 Kafka Topic 读取消息本文以Windows本地环境 + Kafka 2.8.1版本为例,手把手演示生产消费流程。 2. 准备条件 Kafka…...

基于FFmpeg命令行的实时图像处理与RTSP推流解决方案

前言 在一些项目开发过程中需要将实时处理的图像再实时的将结果展示出来&#xff0c;此时如果再使用一张一张图片显示的方式展示给开发者&#xff0c;那么图像窗口的反复开关将会出现窗口闪烁的问题&#xff0c;实际上无法体现出动态画面的效果。因此&#xff0c;需要使用码流…...

神经网络笔记 - 感知机

一 感知机是什么 感知机&#xff08;Perceptron&#xff09;是一种接收输入信号并输出结果的算法。 它根据输入与权重的加权和是否超过某个阈值&#xff08;threshold&#xff09;&#xff0c;来判断输出0还是1。 二.计算方式 感知机的基本公式如下&#xff1a; X1, X2 : …...

【双指针】专题:LeetCode 15题解——三数之和

三数之和 一、题目链接二、题目三、题目解析四、算法原理解法一&#xff1a;排序 暴力枚举 利用set去重解法二&#xff1a;排序 双指针处理细节问题1、去重越界问题 2、不漏 五、编写代码六、时间复杂度和空间复杂度 一、题目链接 三数之和 二、题目 三、题目解析 i ! j …...

如何创建一个导入模板?全流程图文解析

先去找到系统内可以上传东西的按钮 把你的模板上传上去,找到对应的fileName 图里的文字写错了,是复制粘贴"filePath"到URL才能下载...

JS自动化获取网站信息开发说明

一、自动获取信息的必要性 1. 提高效率与节省时间 批量处理&#xff1a;自动化可以快速抓取大量数据&#xff0c;比人工手动操作快得多。 24/7 运行&#xff1a;自动化工具可以全天候工作&#xff0c;不受时间限制。 减少重复劳动&#xff1a;避免人工反复执行相同的任务&am…...

Python爬虫-爬取汽车之家各品牌月销量榜数据

前言 本文是该专栏的第54篇,后面会持续分享python爬虫干货知识,记得关注。 在本文中,笔者已整理19篇汽车平台相关的爬虫项目案例。对此感兴趣的同学,可以直接翻阅查看。 而本文,笔者将以汽车之家平台为例子。基于Python爬虫,实现批量爬取“各品牌月销量榜”的数据。废话…...

WPF 调用 OpenCV 库

WPF 调用 OpenCV 库指南 OpenCV 是一个强大的计算机视觉库,WPF 是 Windows 平台的 UI 框架。将两者结合可以实现强大的图像处理和计算机视觉应用。本文将详细介绍如何在 WPF 应用程序中集成和使用 OpenCV 库。 一、准备工作 1. 安装 OpenCV 方法一:通过 NuGet 安装 在 Vi…...

LLM(大语言模型)技术的最新进展可总结

截至2025年4月26日&#xff0c;LLM&#xff08;大语言模型&#xff09;技术的最新进展可总结为以下关键方向&#xff1a; 1. 架构创新与性能突破 多模态能力深化&#xff1a;GPT-4o等模型通过统一架构支持文本、图像、音频和视频的跨模态推理&#xff0c;显著提升复杂场景下的…...

Fedora 43 计划移除所有 GNOME X11 相关软件包

Fedora 43 计划移除所有 GNOME X11 相关软件包&#xff0c;这是 Fedora 项目团队为全面拥抱 Wayland 所做的重要决策。以下是关于此计划的详细介绍&#xff1a; 提案内容&#xff1a;4 月 23 日&#xff0c;Neal Gompa 提交提案&#xff0c;建议从 Fedora 软件仓库中移除所有 G…...

解构与重构:“整体部分”视角下的软件开发思维范式

在软件开发的复杂图景中&#xff0c;整体与部分的关系始终是决定项目成败的关键命题。《人月神话》“整体部分”一章以深邃的洞察力&#xff0c;揭示了软件开发过程中系统设计与实现的内在逻辑&#xff0c;不仅探讨了规格说明、设计方法等技术层面的核心要素&#xff0c;更深入…...

NdrpConformantVaryingArrayUnmarshall函数分析--重要

第一部分&#xff1a; void NdrpConformantVaryingArrayUnmarshall( PMIDL_STUB_MESSAGE pStubMsg, uchar ** ppMemory, PFORMAT_STRING pFormat, uchar fMustCopy, uchar fMustAlloc ) { uchar * …...

ZYNQ笔记(十四):基于 BRAM 的 PS、PL 数据交互

版本&#xff1a;Vivado2020.2&#xff08;Vitis&#xff09; 实验任务&#xff1a; PS 将字符串数据写入BRAM&#xff0c;再将数据读取出来&#xff1b;PL 从 BRAM 中读取数据&#xff0c;bing。通过 ILA 来观察读出的数据&#xff0c;与前面串口打印的数据进行对照&#xff0…...

月之暗面开源 Kimi-Audio-7B-Instruct,同时支持语音识别和语音生成

我们向您介绍在音频理解、生成和对话方面表现出色的开源音频基础模型–Kimi-Audio。该资源库托管了 Kimi-Audio-7B-Instruct 的模型检查点。 Kimi-Audio 被设计为通用的音频基础模型&#xff0c;能够在单一的统一框架内处理各种音频处理任务。主要功能包括&#xff1a; 通用功…...

文件操作及读写-爪哇版

文章目录 前言 初识文件文件路径里的符号文件分类文件操作方法文件读写字节流输入输出输入输出 字符流输入输出输入输出 前言 Windows用户需知&#xff1a;“/”和“\”&#xff0c; 文件路径分隔符一般都用“/”&#xff0c;但Windows系统一直保留着“\”&#xff0c;这两种符…...

【matlab】绘制maxENT模型的ROC曲线和omission curve

文章目录 一、maxENT模型二、ROC曲线三、实操3.1 数据提取3.2 绘制ROC曲线3.3 绘制遗漏曲线3.4 多次训练的ROC和测试的ROC 一、maxENT模型 前面的文章已经详细讲过了。 maxENT软件运行后&#xff0c;会生成一个html报告&#xff0c;里面有ROC曲线&#xff0c;但我们往往需要自…...