【AI模型学习】ESM2
文章目录
- 1. 版本
- 2. 开始
- 2.1 安装
- 2.2 使用预训练模型
- 2.2.1 代码
- 2.2.2 讲解
- 2.2 结构预测
- 3. 任务类型总结
- 1. 蛋白质结构预测(ESMfold)
- 2. 特征嵌入提取(esm-extract)
- 3. 零镜头变体预测(ESM-1v/ESM-2)
- 4. 逆向折叠(ESM-IF1)
- 5. 宏基因组图谱数据(ESM Atlas)
- 6. 多序列比对分析(ESM-MSA-1b)
- 7. 生成式蛋白质设计(ESM-2)
1. 版本
ESM-2 一共有多个版本,主要区别在于:
层数(depth)、参数量(size)、推理速度和精度权衡。
这些版本都遵循相同的 Transformer 编码器架构,只是在大小和计算能力上有差异。
版本一览
模型名称(Hugging Face 名) | 层数 | 参数量 | 说明 |
---|---|---|---|
esm2_t6_8M_UR50D | 6 | 8M | 极小模型,适合快速原型 |
esm2_t12_35M_UR50D | 12 | 35M | 中等小型,推荐用于入门任务 |
esm2_t30_150M_UR50D | 30 | 150M | 中等模型,效果与效率平衡 |
esm2_t33_650M_UR50D | 33 | 650M | 较大模型,适合更复杂任务 |
esm2_t36_3B_UR50D | 36 | 3B | 超大模型,强大建模能力 |
esm2_t48_15B_UR50D | 48 | 15B | 最大模型,性能最强但最重 |
模型名一般遵循这个格式:
esm2_t<层数>_<参数量>_UR50D
t<层数>
:比如t12
表示有 12 层 Transformer 编码器。<参数量>
:大概的参数数量,比如35M
,3B
等。UR50D
:代表训练用的数据集(Uniref50),是去冗余后的蛋白质数据库。
需求场景 | 推荐模型 |
---|---|
快速测试 / 教学 / CPU 调用 | esm2_t6_8M 或 t12_35M |
标准下游任务建模 | esm2_t30_150M |
结构预测 / 蛋白功能预测 | esm2_t33_650M 及以上 |
追求最强性能 | esm2_t48_15B |
注意:3B 和 15B 模型通常需要 A100 等大显存 GPU,或者分布式推理支持。
2. 开始
2.1 安装
pip install fair-esm # latest release, OR:
pip install git+https://github.com/facebookresearch/esm.git # bleeding edge, current repo main branch
2.2 使用预训练模型
2.2.1 代码
我们直接拿官网的作为示例
import torch
import esm# 加载 ESM-2 模型
model, alphabet = esm.pretrained.esm2_t33_650M_UR50D()
batch_converter = alphabet.get_batch_converter()
model.eval() # 设置为评估模式(关闭 dropout,确保结果可复现)# 准备数据(来自 ESMStructuralSplitDataset 数据集的前两个蛋白质序列)
data = [("protein1", "MKTVRQERLKSIVRILERSKEPVSGAQLAEELSVSRQVIVQDIAYLRSLGYNIVATPRGYVLAGG"),("protein2", "KALTARQQEVFDLIRDHISQTGMPPTRAEIAQRLGFRSPNAAEEHLKALARKGVIEIVSGASRGIRLLQEE"),("protein2 with mask","KALTARQQEVFDLIRD<mask>ISQTGMPPTRAEIAQRLGFRSPNAAEEHLKALARKGVIEIVSGASRGIRLLQEE"),("protein3", "K A <mask> I S Q"),
]
batch_labels, batch_strs, batch_tokens = batch_converter(data)
batch_lens = (batch_tokens != alphabet.padding_idx).sum(1)# 提取每个残基的表示(使用 CPU 推理)
with torch.no_grad():results = model(batch_tokens, repr_layers=[33], return_contacts=True)
token_representations = results["representations"][33]# 通过对每个序列的残基取平均,生成序列级别的表示
# 注意:token 0 是序列起始符号 <cls>,第一个氨基酸是 token 1
sequence_representations = []
for i, tokens_len in enumerate(batch_lens):sequence_representations.append(token_representations[i, 1 : tokens_len - 1].mean(0))# 查看模型中无监督注意力图生成的接触预测图
import matplotlib.pyplot as plt
for (_, seq), tokens_len, attention_contacts in zip(data, batch_lens, results["contacts"]):plt.matshow(attention_contacts[: tokens_len, : tokens_len])plt.title(seq)plt.show()
2.2.2 讲解
results
的结构总览:
results.keys()
# dict_keys(['logits', 'representations', 'attentions', 'contacts'])
其中包含了 4 个主要部分,分别是:
- logits:
torch.Size([4, 73, 33])
含义:每个位置的分类 logits,用于预测氨基酸(或 <mask>
的掩码预测)。
-
[4, 73, 33]
- 4:表示 batch 中有 4 个序列
- 73:是 padding 后的最大 token 长度
- 33:是氨基酸 vocabulary 的大小(包括
<mask>
、<pad>
等)
用途:
- 如果你用
<mask>
,这个张量可以用于做“突变打分”或“掩码填空” - 可以通过
torch.nn.functional.softmax(logits, dim=-1)
得到每个位置的预测概率分布
- representations:
dict
,键是层号,值是 embedding
你指定了 repr_layers=[33]
,所以返回了:
representations = {33: torch.Size([4, 73, 1280])
}
含义:第 33 层(即最后一层)输出的每个 token 的 embedding 表示。
-
维度
[4, 73, 1280]
:- 4:batch 大小
- 73:token 序列长度(含
<cls>
和<eos>
) - 1280:embedding 的维度(模型隐藏层大小)
用途:
- 提取每个残基的表示用于下游任务(分类、聚类、结构预测)
- 可以对 1~L 之间的向量取平均,生成序列级表示
- attentions:
torch.Size([4, 33, 20, 73, 73])
含义:每一层、每个头的 self-attention 权重
-
[4, 33, 20, 73, 73]
- 4:batch 中 4 条序列
- 33:ESM2 的 transformer 层数
- 20:每层的 attention head 数量
- 73 x 73:每个 head 的注意力矩阵
用途:
- 可视化每层每个头的注意力
- 为接触图预测提供基础(即下一个)
- contacts:
torch.Size([4, 71, 71])
含义:预测的残基接触图(非监督 attention 平均生成的)
- 维度
[4, 71, 71]
:对应于每个序列的残基之间的接触概率
为什么是 71 而不是 73?
因为 73 包含了<cls>
和<eos>
,它们会被自动排除,真正的残基只有 71 个。
用途:
- 可以直接作为结构接触预测图的初步结果
- 在结构预测任务中可用于辅助建模残基之间的关系
总结(表格版)
键 | 类型 | 维度 | 含义 |
---|---|---|---|
logits | Tensor | [B, L, V] | 每个 token 的分类 logits,用于 <mask> 推断 |
representations | dict | {层号: Tensor[B, L, D]} | 每层 token 表示,通常用最后一层 |
attentions | Tensor | [B, L, H, T, T] | 每层每个 head 的注意力矩阵 |
contacts | Tensor | [B, L', L'] | 每个序列的残基接触预测图(不含 /) |
2.2 结构预测
import torch
import esm# 这里中间会有几个库需要pip一下,看报错信息补好即可
# 不过好像。。这里面的问题有点小多。。。然后就是如果想做这一块的话,python版本放到3.9及以下
model = esm.pretrained.esmfold_v1()
model = model.eval().cuda()# 可选:取消注释以下语句以设置轴向注意力的块大小。这可以帮助降低显存占用。
# 块越小,显存占用越低,但计算速度可能会变慢。
# model.set_chunk_size(128)sequence = "MKTVRQERLKSIVRILERSKEPVSGAQLAEELSVSRQVIVQDIAYLRSLGYNIVATPRGYVLAGG"
# 多聚体预测时,可以用 ':' 分隔不同链with torch.no_grad():output = model.infer_pdb(sequence)with open("result.pdb", "w") as f:f.write(output)import biotite.structure.io as bsio
struct = bsio.load_structure("result.pdb", extra_fields=["b_factor"])
print(struct.b_factor.mean()) # 这将输出 pLDDT 分数的平均值
# 88.3
3. 任务类型总结
1. 蛋白质结构预测(ESMfold)
输入
- 单序列:氨基酸序列字符串(如
"MKTVRQERLKSIVRILERSKEPVSGAQLAEELSVSRQVIVQDIAYLRSLGYNIVATPRGYVLAGG"
)。 - 多聚体:用
:
分隔链的序列(如"chainA:chainB"
)。 - 批量输入:FASTA 文件(含多条序列)。
输出
- 单序列结果:PDB 格式的蛋白质结构文件,包含原子坐标和 pLDDT 评分(预测置信度)。
# 示例代码输出 output = model.infer_pdb(sequence) # PDB 文本字符串
- 批量结果:指定目录下的多个 PDB 文件,文件名对应 FASTA 序列 ID。
2. 特征嵌入提取(esm-extract)
输入
- 模型:预训练模型名称(如
esm2_t33_650M_UR50D
)或本地模型路径。 - 序列数据:FASTA 文件(含一条或多条序列)。
- 参数:指定提取的层(
--repr_layers
)和输出类型(--include mean/per_tok/contacts
)。
输出
- ** per_tok 嵌入**:每个残基的特征向量(形状为
[seq_len, hidden_dim]
)。 - ** mean 嵌入**:序列全局平均特征(形状为
[hidden_dim]
)。 - 接触预测:注意力图导出的接触概率矩阵(形状为
[seq_len, seq_len]
)。 - 文件格式:每个序列对应一个
.pt
文件,存储为 PyTorch 张量。
3. 零镜头变体预测(ESM-1v/ESM-2)
输入
- 野生型序列:氨基酸序列字符串。
- 突变位点:如
"A123G"
(第123位丙氨酸突变为甘氨酸)。 - 批量输入:CSV 或 FASTA 文件,包含多组野生型-突变序列对。
输出
- 功能影响评分:突变对蛋白质功能的预测效应(如稳定性、活性变化)。
- 示例输出:对数概率或相对效应值,用于排序突变的有害性。
4. 逆向折叠(ESM-IF1)
4.1 序列设计(给定结构采样)
- 输入:
- 结构文件:PDB 或 mmCIF 文件(含主链坐标,如
5YH2.pdb
)。 - 链选择:指定目标链(如
--chain C
)。 - 参数:采样温度(
--temperature
,控制序列多样性)。
- 结构文件:PDB 或 mmCIF 文件(含主链坐标,如
- 输出:FASTA 文件,包含生成的氨基酸序列(如
sampled_sequences.fasta
)。
4.2 序列评分(给定结构评估)
- 输入:
- 结构文件:PDB/mmCIF 文件。
- 序列文件:FASTA 文件(含待评分序列)。
- 输出:CSV 文件,包含每条序列的平均对数似然值(如
5YH2_mutated_seqs_scores.csv
)。
5. 宏基因组图谱数据(ESM Atlas)
输入
- 查询方式:
- 序列搜索:FASTA 序列,通过 API 或 Foldseek 搜索相似结构。
- 结构搜索:PDB/mmCIF 文件或结构 ID,检索同源结构。
- 批量下载:通过官网提供的链接下载全量结构数据(如.tar.gz压缩包)。
输出
- 结构数据:PDB 文件或预计算的 ESM-2 嵌入(.npy 或 .pt 文件)。
- 搜索结果:匹配的结构列表,包含相似性分数和功能注释。
6. 多序列比对分析(ESM-MSA-1b)
输入
- MSA 数据:A3M 格式的多序列比对文件(含同源序列)。
- 模型输入:通过
esm.pretrained.esm_msa1b_t12_100M_UR50S()
加载模型。
输出
- MSA 特征:从比对中提取的进化保守性嵌入,用于增强结构预测或功能分析。
- 接触预测:结合 MSA 信息的残基接触图,精度高于单序列模型。
7. 生成式蛋白质设计(ESM-2)
输入
- 设计约束:自然语言描述(如“设计一个具有 ATP 结合位点的螺旋结构”)或编程指令(如示例中的蛋白质编程语言)。
输出
- 全新序列:满足特定功能或结构约束的氨基酸序列,可通过 ESMfold 验证结构合理性。
数据格式总结表
任务 | 输入格式 | 输出格式 | 关键工具/模型 |
---|---|---|---|
结构预测 | 单/多聚体序列、FASTA | PDB 文件、pLDDT 评分 | ESMfold、esm-fold |
特征提取 | FASTA、模型名称 | .pt 张量文件 | esm-extract |
变体预测 | 野生型/突变序列 | 功能影响评分 | ESM-1v、ESM-2 |
逆向折叠 | PDB/mmCIF、FASTA | FASTA、CSV 评分文件 | ESM-IF1、sample_sequences.py |
宏基因组搜索 | FASTA、结构文件 | 匹配结构列表、嵌入数据 | ESM Atlas API |
MSA 分析 | A3M 比对文件 | 接触图、进化特征 | ESM-MSA-1b |
生成式设计 | 自然语言/编程指令 | 氨基酸序列 | ESM-2 |
相关文章:
【AI模型学习】ESM2
文章目录 1. 版本2. 开始2.1 安装2.2 使用预训练模型2.2.1 代码2.2.2 讲解 2.2 结构预测 3. 任务类型总结1. 蛋白质结构预测(ESMfold)2. 特征嵌入提取(esm-extract)3. 零镜头变体预测(ESM-1v/ESM-2)4. 逆向…...
c++11特性——可变参数模板及emplace系列接口
文章目录 可变参数模板基本语法和使用sizeof...运算符 从语法角度理解可变参数模板包扩展通过编译时递归解析参数包直接对解析行为展开 emplace系列接口举例讲解emplace_back的实现 可变参数模板 可变参数模板是c11新特性中极其重要的一节。前文我们提到过,c11中对…...
深入理解 Pre-LayerNorm :让 Transformer 训练更稳
摘要 在超深 Transformer 与大语言模型(LLM)时代,归一化策略直接决定了模型能否稳定收敛、推理性能能否最大化。把归一化层从 “残差之后” 挪到 “子层之前”(Pre-LayerNorm,Pre-LN),再将传统…...
vue3:十三、分类管理-表格--分页功能
一、实现效果 实现分页功能,并且可对分页功能和搜索框功能能动态显示 1、显示分页 2、分页功能和搜索栏隐藏 二、基础搭建 1、官网参考 Pagination 分页 | Element Plus 使用分页的附加功能 2、表格中底部写入分页 (1)样式class 在全局js中写入顶部外边距样式margin-t…...
工商总局可视化模版-Echarts的纯HTML源码
概述 基于ECharts的工商总局数据可视化HTML模版,帮助开发者快速搭建专业级工商广告数据展示平台。这款模版设计规范,功能完善,适合各类工商监管场景使用。 主要内容 本套模版采用现代化设计风格,主要包含以下核心功能模块&…...
8.2 线性变换的矩阵
一、线性变换的矩阵 本节将对每个线性变换 T T T 都指定一个矩阵 A A A. 对于一般的列向量,输入 v \boldsymbol v v 在空间 V R n \pmb{\textrm V}\pmb{\textrm R}^n VRn 中,输出 T ( v ) T(\boldsymbol v) T(v) 在空间 W R m \textrm{\pmb W}\…...
工业路由器WiFi6+5G的作用与使用指南,和普通路由器对比
工业路由器的技术优势 在现代工业环境中,网络连接的可靠性与效率直接影响生产效率和数据处理能力。WiFi 6(即802.11ax)和5G技术的结合,为工业路由器注入了强大的性能,使其成为智能制造、物联网和边缘计算的理想选择。…...
Nginx核心服务
一.正向代理 正向代理(Forward Proxy)是一种位于客户端和原始服务器之间的代理服务器,其主要作用是将客户端的请求转发给目标服务器,并将响应返回给客户端 Nginx 的 正向代理 充当客户端的“中间人”,代…...
条件随机场 (CRF) 原理及其在语义分割中的应用
条件随机场 (CRF) 原理及其在语义分割中的应用 一、条件随机场的原理 条件随机场 (Conditional Random Fields, CRF) 是一种判别式概率无向图模型。它用于在给定观测序列 (如图像中的像素) 的条件下,对另一组序列 (如像素的语义标签) 进行建模和预测。 与生成式模…...
2025年Y2大型游乐设施操作证备考练习题
Y2 大型游乐设施操作证备考练习题 单选题 1、《游乐设施安全技术监察规程(试行)》规定:对操作控制人员无法观察到游乐设施的运行情况,在可能发生危险的地方应( ),或者采取其他必要的安全措施。…...
L53.【LeetCode题解】二分法习题集2
目录 1.162. 寻找峰值 分析 代码 提交结果 2.153. 寻找旋转排序数组中的最小值 分析 图像的增长趋势可以分这样几类 逐个击破 比较明显的 先增后减再增 用二段性给出left和right的更新算法 代码 提交结果 其他做法 提交结果 3.LCR 173. 点名(同剑指offer 53:0~…...
趣味编程:抽象图(椭圆组成)
概述:本篇博客主要讲解由椭圆图案组合而成的抽象图形。 1.效果展示 该程序的实际运行是一个动态的效果,因此实际运行相较于博客图片更加灵动。 2.源码展示 // 程序名称:椭圆组合而成的抽象图案// #include <graphics.h> #include <…...
RPA浪潮来袭,职业竞争的新风口已至?
1. RPA职业定义与范畴 1.1 RPA核心概念 RPA(Robotic Process Automation,机器人流程自动化)是一种通过软件机器人模拟人类操作,实现重复性、规律性任务自动化的技术。它能够自动执行诸如数据输入、文件处理、系统操作等任务&…...
【Elasticsearch】字段别名
在 Elasticsearch 中,字段别名(Field Alias)主要用于查询和检索阶段,而不是直接用于写入数据。 为什么不能通过字段别名写入数据? 字段别名本质上是一个映射关系,它将别名指向实际的字段。Elasticsearch …...
【Linux笔记】防火墙firewall与相关实验(iptables、firewall-cmd、firewalld)
一、概念 1、防火墙firewall Linux 防火墙用于控制进出系统的网络流量,保护系统免受未授权访问。常见的防火墙工具包括 iptables、nftables、UFW 和 firewalld。 防火墙类型 包过滤防火墙:基于网络层(IP、端口、协议)过滤流量&a…...
人工智能解析:技术革命下的认知重构
当生成式AI能够自主创作内容、设计方案甚至编写代码时,我们面对的不仅是工具革新,更是一场关于智能本质的认知革命。人工智能解析的核心,在于理解技术如何重塑人类解决问题和创造价值的底层逻辑——这种思维方式的转变,正成为数字…...
Neo4j实现向量检索
最近因为Dify、RagFlow这样的智能体的镜像拉取的速度实在太麻烦,一狠心想实现自己的最简单的RAG。 因为之前图数据库使用到了neo4j,查阅资料才发现Neo4j从5.11版本开始支持向量索引,提供一个真实可用的单元测试案例。 Neo4j建向量索引表…...
SpringBoot外部化配置
外部化配置(Externalized Configuration)是指将应用的配置从代码中剥离出来,放在外部文件或环境中进行管理的一种机制。 通俗地说,就是你不需要在代码里写死配置信息(比如数据库账号、端口号、日志级别等)…...
Gut(IF: 23.1)|深度多组学破局肝癌免疫联合治疗耐药的空间微环境图谱
肝细胞癌(HCC)是癌症相关死亡的主要原因之一,晚期患者预后极差。近年来,免疫检查点抑制剂(ICI)联合治疗(如抗CTLA-4的tremelimumab和抗PD-L1的durvalumab)已成为晚期HCC的一线治疗方…...
2025年保姆级教程:Powershell命令补全、主题美化、文件夹美化及Git扩展
文章目录 1. 美化 Powershell 缘起2. 安装 oh-my-posh 和 posh-git3. 安装文件夹美化主题【可选】 1. 美化 Powershell 缘起 背景:用了 N 年的 Windows 系统突然觉得命令行实在太难用了,没有补全功能、界面也不美观。所以,我决定改变它。但是…...
LeetCode-链表-合并两个有序链表
LeetCode-链表-合并两个有序链表 ✏️ 关于专栏:专栏用于记录 prepare for the coding test。 文章目录 LeetCode-链表-合并两个有序链表📝 合并两个有序链表🎯题目描述🔍 输入输出示例🧩题目提示🧪AC递归&…...
SpringBoot3+Vue3(2)-前端基本页面配置-登录界面编写-Axios请求封装-后端跨越请求错误
前端: 清理文件 main.js 刷新后页面上什么都没有了 App.vue就留这 1.基本页面配置 新建Vue组件 单页面,考路由才操作。 1.前端根目录下安装路由 2.创建路由文件夹 main.js中添加路由配置 App.vue 添加上路由 welcomeView.vue 浏览器刷新&…...
Android Framework学习八:SystemServer及startService原理
文章目录 SystemServer、SystemServiceManger、SystemService、serviceManager的关系SystemServer进程的执行包含的ServiceSystemServer启动服务的流程startService Framework学习系列文章 SystemServer、SystemServiceManger、SystemService、serviceManager的关系 管理机制&a…...
远程访问家里的路由器:异地访问内网设备或指定端口网址
在一些情况下,我们可能需要远程访问家里的路由器,以便进行设置调整或查看网络状态等,我们看看怎么操作? 1.开启远程访问 在路由本地电脑或手机,登录浏览器访问路由管理后台,并设置开启WEB远程访问。 2.内…...
大语言模型 17 - MCP Model Context Protocol 介绍对比分析 基本环境配置
MCP 基本介绍 官方地址: https://modelcontextprotocol.io/introduction “MCP 是一种开放协议,旨在标准化应用程序向大型语言模型(LLM)提供上下文的方式。可以把 MCP 想象成 AI 应用程序的 USB-C 接口。就像 USB-C 提供了一种…...
python生成requirements.txt文件
方法一:只生成项目所用到的python包(常用) 首先安装pipreqs pip install pipreqs 然后进入到你所在的项目根目录,运行以下命令: pipreqs ./ --encodingutf-8 方法二:把本地所有安装包写入文件 pip freeze > requirements.txt …...
如何在PyCharm2025中设置conda的多个Python版本
前言 体验的最新版本的PyCharm(Community)2025.1.1,发现和以前的版本有所不同。特别是使用Anaconda中的多个版本的Python的时候。 关于基于Anaconda中多个Python版本的使用,以及对应的Pycharm(2023版)的使用,可以参考…...
StepX-Edit:一个通用图像编辑框架——论文阅读笔记
一. 前言 代码:https://github.com/stepfun-ai/Step1X-Edit 论文:https://arxiv.org/abs/2504.17761 近年来,图像编辑技术发展迅速,GPT- 4o、Gemini2 Flash等前沿多模态模型的推出,展现了图像编辑能力的巨大潜力。 这…...
vue原生table表格实现动态添加列,一行添加完换行继续添加。el-select输入框背景颜色根据所选内容不同而改变
效果如下 动态添加列 代码如下 <template><div class"table-container"><button click"addColumn">添加列</button><div class"scroll-container"><div class"table-grid"><div v-for"(r…...
maven之pom.xml
MAVEN 1、基础配置2、项目信息3、依赖管理4、构建配置5、继承与聚合6、仓库与SCM7、其他高级配置 Maven的pom.xml文件是项目的核心配置文件,用于定义项目结构、依赖关系和构建过程 https://www.runoob.com/maven/maven-pom.html 1、基础配置 **<…...
深度学习Y8周:yolov8.yaml文件解读
🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者:K同学啊 本周任务:根据yolov8n、yolov8s模型的结构输出,手写出yolov8l的模型输出、 文件位置:./ultralytics/cfg/models/v8/yolov8.…...
充电桩APP的数据分析:如何用大数据优化运营?
随着新能源汽车的普及,充电桩作为基础设施的核心环节,其运营效率直接影响用户体验和行业可持续发展。充电桩APP积累了海量用户行为、充电记录、设备状态等数据,如何利用这些数据优化运营成为关键课题。大数据分析能够帮助运营商精准定位问题、…...
shell脚本之函数详细解释及运用
什么是函数 通俗地讲,所谓函数就是将一组功能相对独立的代码集中起来,形成一个代码块,这个代码可 以完成某个具体的功能。从上面的定义可以看出,Shell中的函数的概念与其他语言的函数的 概念并没有太大的区别。从本质上讲&#…...
校平机的原理、应用及发展趋势
一、校平机的定义与作用 校平机(Leveling Machine)是一种用于矫正金属板材、带材或卷材表面平整度的工业设备。其核心功能是通过机械作用消除材料内部残余应力,修正材料在加工、运输或存储过程中产生的弯曲、波浪形、翘曲等缺陷,…...
NFM算法解析:如何用神经网络增强因子分解机的特征交互能力?
在推荐系统和广告点击率预测等场景中,特征交叉(Feature Interaction)是提升模型效果的关键。传统的因子分解机(FM)通过二阶特征交互取得了显著效果,但其线性建模方式和有限阶数限制了模型的表达能力。今天&…...
Python人工智能算法 模拟退火算法:原理、实现与应用
模拟退火算法:从物理启发到全局优化的深度解析 一、算法起源与物理隐喻 模拟退火算法(Simulated Annealing, SA)起源于20世纪50年代的固体退火理论,其核心思想可追溯至Metropolis等人提出的蒙特卡罗模拟方法。1983年,…...
服务器网络配置 netplan一个网口配置两个ip(双ip、辅助ip、别名IP别名)
文章目录 问答 问 # This is the network config written by subiquity network:ethernets:enp125s0f0:dhcp4: noaddresses: [192.168.90.180/24]gateway4: 192.168.90.1nameservers:addresses:- 172.0.0.207- 172.0.0.208enp125s0f1:dhcp4: trueenp125s0f2:dhcp4: trueenp125…...
FTP与NFS服务详解
一、FTP服务 (一)Linux下FTP客户端管理工具 1. ftp工具 安装命令:yum install ftp -y连接服务器:ftp 服务器IP,输入账号密码登录。常用命令: 命令说明ls查看远程目录文件put上传单个文件到远程服务器get…...
算法中的数学:欧拉函数
1.相关定义 互质:a与b的最大公约数为1 欧拉函数:在1~n中,与n互质的数的个数就是欧拉函数的值 eg: n1时,欧拉函数的值为1,因为1和1是互质的 n2是,值为2,因为1和2都是互质的 积性函数&…...
如果有三个服务实例部署在三台不同的服务器上,这三个服务实例的本地缓存,是存储一模一样的数据?还是各自只存一部分?
✅ 答案是:通常每个服务实例都会独立地缓存它自己访问过的数据,这些数据可能是相同的,也可能是不同的,取决于请求的内容。 📌 举个例子说明 假设你有一个商品详情页的服务,部署了 3 个服务实例(…...
Coze工作流-选择器的用法
上集回顾 上集教程我们学习了什么是变量以及变量类型的用法。即什么时候用什么变量类型 教程简介 本教程将带大家学习工作流的选择和问答模块 工作流类型选择 在Coze中,工作流是智能体的核心逻辑单元。根据任务复杂度,可选择两种模式: 类…...
《AI工程技术栈》:三层结构解析,AI工程如何区别于ML工程与全栈工程
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...
uni-app使用大集
1、手动修改页面标题 uni.setNavigationBarTitle({title: 修改标题 }); 2、单选 不止有 radio-group,还有 uni-data-checkbox 数据选择器 <!-- html部分 --> <uni-data-checkbox v-model"sex" :localdata"checkboxList"></u…...
链表day3
链表定义 struct ListNode{int val;ListNode *next; //next是一个指针变量,存储的是地址,是ListNode类型的地址ListNode(int x) : val(x),next(nullptr){} //也就是说ListNode必须接受一个int x,next指针默认为nullptr,值由外部指…...
C++23关联容器的异质擦除重载 (P2077R2)介绍
文章目录 一、基本概念二、原理重载机制类型转换 三、优势提高查找效率提升程序整体性能避免不必要的初始化确保系统实时性 四、应用场景高性能计算大型对象管理实时系统 五、代码示例六、相关图片材料结构与微观图像半导体研究图示与图表科学图表芯片与电路板 一、基本概念 在…...
Flink架构概览,Flink DataStream API 的使用,FlinkCDC的使用
一、Flink与其他组件的协同 Flink 是一个分布式、高性能、始终可用、准确一次(Exactly-Once)语义的流处理引擎,广泛应用于大数据实时处理场景中。它与 Hadoop 生态系统中的组件可以深度集成,形成完整的大数据处理链路。下面我们从…...
AI加速芯片全景图:主流架构和应用场景详解
目录 一、为什么AI芯片如此重要? 二、主流AI芯片架构盘点 三、不同芯片在训练与推理中的部署逻辑 四、真实应用案例解读 五、AI芯片发展趋势预测 AI芯片的选择,是AI系统能否高效运行的关键。今天笔者就从架构角度出发,带你系统了解主流AI加速芯片的种类、优劣对比及实际…...
Ubuntu22.04 系统安装Docker教程
1.更新系统软件包 #确保您的系统软件包是最新的。这有助于避免安装过程中可能遇到的问题 sudo apt update sudo apt upgrade -y 2.安装必要的依赖 sudo apt install apt-transport-https ca-certificates curl software-properties-common -y 3.替换软件源 原来/etc/apt/s…...
更新ubuntu软件源遇到GPG error
BUG背景 执行sudo apt update后遇到类似下列报错: E: The repository https://download.docker.com/linux/ubuntu bionic Release no longer has a Release file. N: Updating from such a repository cant be done securely, and is therefore disabled by defau…...
vue调后台接口
1.1 什么是 axios Axios 是一个基于 promise 的 HTTP 库,可以用来发送网络请求。它可以在浏览器和 node.js 中使用,本质上是对原生 XMLHttpRequest 的封装,符合最新的 ES 规范,支持 Promise API,能够拦截请求和响应&am…...