融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS ,实现单细胞级蛋白质定位
蛋白质亚细胞定位(subcellular localization of a protein)是指蛋白质在细胞结构中具体的定位情况, 这对蛋白质行使其生物学功能至关重要。举个简单例子,如果把细胞想象成一个庞大的企业,其中细胞核、线粒体、细胞膜等对应总裁办、发电部、门岗等不同的部门,那么只有对应的蛋白进入正确的「部门」才能使其正常工作,否则便会导致某些疾病发生,如癌症、阿尔兹海默病。因此,精准定位蛋白质亚细胞可以说是生命科学的核心任务之一。
尽管科研界已经对不同细胞系中的数千种蛋白质进行了空间定位分析,但到目前为止,已测量的蛋白质与细胞系组合数量还只是其中的冰山一角。比如当前最大的亚细胞定位数据集——人类蛋白质图谱(Human Protein Atlas,HPA),提供了 13,147 个基因编码的蛋白质亚细胞定位(占已知人类蛋白质编码基因的 65%), 但是整个数据集包含了 37 个细胞系,而每种蛋白质最多只能在其中三株中进行测量。与此同时,主流的实验手段很难在同一细胞中同时检测所有蛋白质数量,这严重阻碍了全面分析复杂的蛋白质网络,增加了实验复杂度和误差风险。
除此之外,蛋白质定位并非静止不变的,它的变异性不仅体现在细胞系之间,甚至在同一细胞系的单个细胞间也会发生,而现有数据图谱记录的蛋白质和细胞系对仅反映了特定条件下的结果。因此,即便是现有成果也很难直接套用,需要根据环境变化而对蛋白质定位进一步探索。
为了解决蛋白质亚细胞定位技术方法的局限性和生物系统复杂性之间的矛盾,机器学习被寄予厚望。如今已经建模并成功应用的如基于蛋白质序列的模型、基于细胞图像的模型等,虽然在某些方面表现亮眼,但不足之处也十分突出——前者忽视了细胞类型的特异性定位差异,后者则缺乏推向未知蛋白研究的泛化能力。
有鉴于此,来自美国麻省理工学院和哈佛大学的研究团队提出了一种结合蛋白质序列和细胞图像来进行未知蛋白质亚细胞定位的预测框架,命名为 Predictions of Unseen Proteins’ Subcellular localization(PUPS)。 PUPS 创新地结合了蛋白质语言模型和图像修复模型来预测蛋白质定位,使其兼并推向未知蛋白预测的泛化能力和捕获细胞可变性的细胞类型特定预测。实验证明,该框架能够准确预测训练数据集之外新实验中蛋白质的定位,具有极佳的泛化能力和高度的准确性,应用潜力突出。
PUPS 技术研究背景,目标及现有数据的局限性
研究成果以「Prediction of protein subcellular localization in single cells」为题,已发表于 Nature Methods 。
研究亮点:
-
所提研究创新地结合了蛋白质语言模型和图像绘制模型,利用蛋白质序列和细胞图像进行蛋白质定位预测,弥补了过往计算模型的不足*
-
PUPS 能够推广到未知蛋白质和细胞系,从而评估细胞系之间以及细胞系内单个细胞间蛋白质定位的变异性,并识别与具有可变定位的蛋白质相关的生物过程
-
在训练数据集之外的新实验中,PUPS 同样展示了其高度精确的预测能力,具有突出的应用潜力和医学价值
论文地址:
https://go.hyper.ai/LeaQF
数据集:以尽可能全面的数据打造可信模型
PUPS 的训练数据集来自于人类蛋白质图谱(Human Protein Atlas,HPA), 研究团队将第 16 版 HPA 数据汇总到第 22 版当中,以尽可能多的收集蛋白质的数据,确保实验分析的全面性。如下图所示:
训练集(绿色),保留集 1(橙色),保留集 2(红色) HPA 中未采用部分(灰色),HPA 中不包含部分(白色)
具体来说,训练数据集包含 340,553 个细胞数量,蛋白质变体共 8,086 种,对应 HPA 中 37 种细胞系中的 2,801 个基因,这些基因名称以字母 A-G 开头。另外,训练数据集中还额外包含了 10 个基因,包括 IHO1 、 IMPAD1 、 INKA1 、 ISPD 、 ITPRID1 、 KIAA1211L 、 KIAA1324 、 LRATD1 、 SCYL3 、 TSPAN6 。
保留数据集分为两部分:一部分为保留数据集 1, 包含 36,552 个细胞,蛋白质变体由 9,472 种构成,对应 3,312 个基因(含训练集中的 2,801 个),名称同样以 A-G 开头,但来自不同的细胞系,与训练集无重叠。同时,保留数据集 1 进一步被拆分为两个部分,用作评估集和测试集,分别包含 11,050 和 25,502 个细胞;保留数据集 2 含有 24,007 个细胞,对应 515 个基因, 其名称以字母表所有字母开头,即涵盖 A-Z,蛋白质变体共 556 种,来自完全未在训练集和保留数据集 1 中出现的新基因家族,可用于模型泛化能力的测试。
另需说明的是,BJ 细胞系图像被同时保留在了训练集和保留数据集 1 中。
在实验之前,研究团队对 HPA 中的图像进行了预处理,简单来说包含以下 5 步:
-
第一步,对每张图像向下采样 4 次,最终分辨率降至 0.32 μm/像素,以便减少计算量并去除高频噪声;
-
第二步,结合高斯模糊(σ=5)和 Otsu 阈值法从复杂背景中分离出细胞核的大致区域;
-
第三步,使用 remove_small_holes 函数,移除面积小于 300 像素的孔洞,然后将图像二值化,并去除小于 100 像素的噪声区域;
-
第四步,计算每个细胞核的质心,并以质心为中心,裁剪出 128 x 128 像素的区域作为单个细胞的 ROI;
-
第五步, 通过强度归一化 和噪声过滤,实现标准化数据分布,减少通道间干扰。
模型架构:结合蛋白质序列和图像表征预测蛋白质亚细胞定位
PUPS 模型主要由两个部分组成,一个用于从蛋白质的氨基酸序列中学习序列表示;另一个用于从靶细胞的标志性染色中学习图像表示, 然后结合蛋白质序列表示和图像表示来预测蛋白质在靶细胞中的亚细胞定位。前者使模型能够推广到未知蛋白质预测,后者使模型具备捕获单细胞水平的变异性,实现了细胞类型特异的定位预测。如下图所示:
未知细胞系中未知蛋白质亚细胞定位演示
简单来说,PUPS 利用了预训练的 ESM-2(Evolutionary Scale Modeling)蛋白质语言模型提取蛋白序列 特征 ,同时用 卷积神经网络 学习细胞的标志性染色图像特征,最终结合两部分信息预测蛋白质在靶细胞中的定位。 需要说明的是,模型所有部分同时进行训练,有助于减少前置任务的分类损失,以及预测蛋白质图像与 HPA 中实验测量的蛋白质图像之间的差异。所有参数使用 Adam 优化器进行优化,学习率为 1e-4 。
蛋白质语言模型
PUPS 通过使用语言模型、自注意力层以及一个辅助预训练任务来学习序列表征,然后根据学习到的序列表征对蛋白质定位进行分类。
具体来说,研究团队通过将 N 端 2,000 个氨基酸序列输入到预训练 ESM-2 模型中,获得特定蛋白质变体的初始表示,从而为每个氨基酸残基生成 1,280 维向量,残基少于 2,000 的变体采用零填充。这种序列长度截断是为了避免对序列长度高达数万个残基的少数蛋白质进行偏倚预测。如下图所示:
基于预训练 ESM-2 模型与轻量注意力层的蛋白质序列表征学习模型架构
为了使 ESM-2 表征适应于蛋白质定位预测,团队在后续采用了可分离卷积(separable convolutions)的轻注意力层, 应用于 ESM-2 表示最终获得 300 维序列表征。这种蛋白质序列表示既用于预测定位标签的辅助前置任务,同时也用于与图像表示相结合的蛋白质图像预测。前置任务将蛋白质序列表示输入到一个全连接的神经网络层,以输入一个 29 维向量,表示 29 个亚细胞区室定位标签中的概率分布,然后利用 S 型激活(sigmoid activation)的二元交叉熵损失将前置任务输出结果与 HPA 注释的蛋白区室进行比较。
图像绘制模型
每个细胞的图像输入包含了细胞核、微管和内质网染色这 3 个标志性染色图像通道, 其维度为 3 x 128 x 128,并以细胞核质心为中心。
图像编码通过 5 个可分离卷积层实现, 最终维度 16 x 16 x 512 。每个卷积层之后依次连接 leakyRelu 激活,批归一化以及 2D 最大* 池化 层。蛋白质序列表示被拼接至细胞图像表示的所有空间维度,随后输入 U-Net 图像解码器,为每个输入通道学习不同 权重 *。此外,模型中的空间维度加权机制允许图像表征的每个空间维度以不同权重与序列表征相结合。
解码器由 5 个可分离卷积层构成, 生成 1 x 128 x 128 的图像输出,即对应细胞的蛋白质图像预测。然后将类似于图像分割 U-Net 的跳跃连接(skip connentions)添加在标志染色生成图像表示的编码层与同深度生成蛋白质图像预测的解码层之间。研究采用了均方误差损失函数训练模型,以最小化预测蛋白质图像与实验测量蛋白质图像之间的差异。
实验结果:实现单细胞级蛋白质亚细胞精准定位
为了验证模型的可行性和有效性,研究团队提出多项实验进行验证,PUPS 在多项任务中均表现出较好的性能,凸显了其多模型融合的优势。
预测细胞系间蛋白质定位的变异性
为了评估 PUPS 在定量分析蛋白质于细胞系间定位变异性方面的性能,研究团队通过计算蛋白质核内比例量化定位变异性,发现预测值与真实数据高度相关, Holdout 1 的 pearson 相关系数为 0.794,Holdout 2 的 pearson 相关系数为 0.878 。如下图所示:
PUPS 精准预测不同细胞系间蛋白质定位的差异
随后进一步分析显示,细胞系间定位变化最大的蛋白质与转录、细胞分化和染色质调节等生物过程相关,如 ATP13A5 的实验验证证实了模型预测的准确性。此外,模型通过标志性染色捕捉细胞形态差异,无需细胞系标签即可推断蛋白质定位的细胞系特异性,为研究蛋白质功能的细胞特异性调控提供了新方法。
预测单细胞间蛋白质定位的差异性
为了评估 PUPS 对同一细胞系内单细胞间蛋白质定位变异性的预测能力,研究团队计算了每个细胞系中所有单细胞中蛋白质的核内比例方差,结果发现每种蛋白与细胞系对的单细胞变异性预测排名与真实数据高度一致, 如 Holdout 2 中前 500 个高变异对重叠率超过了 60%,并且预测的核内比例分布与实际结果一致,排除了预测误差影响。
PUPS 可预测细胞系内单细胞中蛋白质定位的可变性
另外 Gene ontology(GO)分析表明,高度可变的蛋白质与细胞分裂、转录、双链断裂修复以及凋亡等过程有关。此外,模型通过细胞标志性染色图像捕捉形态等特征,表明了单细胞变异性不仅具有随机性,还与细胞形态特征相关, 为解释单细胞异质性机制提供了新视角。
PUPS 在训练数据之外的新实验中的验证
为了验证 PUPS 在新的实验环境下预测蛋白质定位的泛化能力,研究团队选择了 9 种蛋白质在 5 个细胞系中进行验证。如下图所示:
PUPS 在 HPA 之外的实验中预测蛋白质亚细胞定位的能力
ATP13A5 、 CHID1 、 COPA 、 MESD 和 RBM23 为细胞系间变异最大的蛋白,它们都有不同的 GO term;DDIT3 和 N4BP2 是细胞系内单个细胞中变异最大的蛋白;EIF4G1 和 PSME3IP1 是细胞系间变异最小的蛋白,前者预计主要位于细胞核外,后者预计主要位于细胞核内。 5 个细胞系中,除 A375 外,其他 HeLa 、 MCF7 、 GAMG 和 HEK293FT 均包含在 HPA 中。
结果显示,PUPS 预测的蛋白质图像在视觉上与实验测量的图像相似。 利用预测蛋白图像计算的每个单细胞的核蛋白比例与实验测量图像计算的比例密切相关,pearson 相关系数为 0.767 。这表明,PUPS 可以用于定量预测以前没有实验测量或在训练图谱中使用的蛋白质的定位。
PUPS 学习到有意义的蛋白质和细胞表征
实验证明,PUPS 在未知蛋白质和细胞系中预测蛋白质定位的能力来自于学习到了蛋白质序列和细胞标志性图像的有意义表示。
研究团队绘制了对应于 12,614 个基因的 40,622 个蛋白质形态的蛋白质序列表示,具有相似定位的蛋白质往往具有相似的序列表示。为进一步证明模型能识别有意义的蛋白质序列模式以及预测定位,研究团队使用 Positional Shapley 方法计算了特定蛋白质中每个氨基酸残基对预测各细胞区室标签预测的重要性,如成功解释了 N4BP2 核定位的预测变异性,也与 CUE 结构域通泛素结合可能改变亚细胞定位的报道相符。
PUPS 学习有意义的蛋白质和细胞表征
除此了识别有意义的蛋白质序列基序外,研究团队进一步表明了 PUPS 从细胞标志性染色中学习单细胞的有意义表征。 其将从标志性染色中学习到的单细胞图像表示可视化,发现即使细胞系标签没有输入到模型当中,同一细胞系的单细胞也具有相似的图像表示。蛋白质和细胞标志性图像的联合表示保留了细胞系和蛋白质之间的分离,而每个细胞系内的不同蛋白质在不同细胞系之间的顺序相似。给定联合表示空间中每个细胞系的质心,从质心到特定蛋白质的向量在所有细胞系中大部分是平行的,即在给定序列表示的情况下,预测特定蛋白质的图像需要再表示空间中以相同方向移动,而不管细胞系是什么,这解释了 PUPS 通过学习有意义的蛋白质和细胞图像表示来推广到未知蛋白质和细胞系的能力。
此外,PUPS 还能预测致病突变对蛋白质定位的影响。 例如,针对核编码的线粒体蛋白 SDHD 和 ETHE1 的突变研究表明,SDHD 突变会导致其核定位比例增加,这与疾病中核基因组不稳定的机制一致;ETHE1 突变则显示胞质定位比例升高,与已知的核 – 胞质穿梭异常相关。这些结果表明,PUPS 可通过分析序列变异对定位的影响,为疾病机制研究提供新线索。
蛋白质亚细胞定位预测新解
正如上述所言,蛋白质亚细胞定位预测在生物信息学和生物学研究中都具有重大意义,PUPS 提供了一种融合多模态信息的思路,为该领域的研究画上了浓墨重彩的一笔。与此同时,该领域的研究经过数十年的发展,其成果也早已是百花齐放。
爱尔兰都柏林大学的团队在 Computational and Structural Biotechology Journal 杂志上发表了一项研究,其中围绕蛋白质亚细胞定位预测介绍了多种计算方法,包括基于序列、注释、混合及元预测等类别,同时文章还按真核生物、原核生物、病毒及多类别对亚细胞定位预测工具进行了分类介绍, 真核生物预测工具如 mLASSO-Hum 、 DeepPSL 等,原核生物预测工具如 PRED-LIPO 等。通过设计涵盖 7 个主要领域及 28 个子分类的机器学习和* 深度学习分类图,该研究提供了单类别和多类别预测工具分类法,从而方便用户查找方法、预测工具。论文以「Protein subcellular localization prediction tools」发表。
- 论文地址:
https://www.sciencedirect.com/science/article/pii/S2001037024001156
复旦大学生物医学研究院杨力研究组与上海* 人工智能 *实验室董楠卿研究组合作,于 4 月 12 日在 Briefings in Bioinformatics 杂志在线发表了题为「Deep Generative Model for Protein Subcellular Localization」的研究论文。研究同样基于 ESM2 蛋白质大语言模型 及 U-Net 框架,开发了具备多模态处理能力的生成式深度学习模型 deepGPS 。
据介绍,deepGPS 能够接收蛋白质序列及细胞核图像作为输入,并生成蛋白质定位的文本标签及分布图像,是一种支持蛋白质亚细胞定位预测的新型「文生图」(text-to-image)多模态模型。
- 论文地址:
https://doi.org/10.1093/bib/bbaf152
随着人工智能与生物学研究的融合加速,相关的创新性实验也在不断涌现,并逐渐打破传统方法的弊端,实现「两全其美」甚至「十全十美」的表现,从而推动生物信息学的快速发展。
相关文章:
融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS ,实现单细胞级蛋白质定位
蛋白质亚细胞定位(subcellular localization of a protein)是指蛋白质在细胞结构中具体的定位情况, 这对蛋白质行使其生物学功能至关重要。举个简单例子,如果把细胞想象成一个庞大的企业,其中细胞核、线粒体、细胞膜等…...
火山引擎火山云带宽价格
首先,成本结构方面,火山云可能用的是高质量的带宽资源,比如BGP多线网络,这种网络能保证更好的连通性和稳定性,但成本更高。另外,如果火山云的数据中心节点分布在多个地区,尤其是海外,…...
可信计算是什么?可信逻辑:计算系统安全的形式化分析框架
参考书籍《人工智能安全 (陈左宁 主编;卢锡城 、方滨兴 副主编)》第二章内容; 相关博客:可信执行环境(TEE):保障数据安全的核心技术 文章目录 一、可信计算的逻辑学基础1.1 可信性的逻辑定义与范畴1.2 双体系架构的逻…...
大模型应用开发之Dify进阶版使用教程—react前端+django后端+dify-API制作聊天界面
Dify进阶使用教程 文章目录 Dify进阶使用教程前言一、dify-docker环境搭建及简单使用二、本篇使用API源码部署启动dify后端启动dify前端基于通义模型的智能客服机器人应用与自己项目联动实战1. 使用API进行项目与dify联动1.1 在控制台主页,点击创建访问API1.2 进入API页面,这…...
快速创建 Vue 3 项目
安装 Node.js 和 Vue CL 安装 Node.js:访问 https://nodejs.org/ 下载并安装 LTS 版本。 安装完后,在终端检查版本: node -v npm -v安装 Vue CLI(全局): npm install -g vue/cli创建 Vue 3 项目 vue cr…...
【VLNs篇】05:TGS-在无地图室外环境中使用视觉语言模型进行轨迹生成和选择
栏目内容论文标题TGS: Trajectory Generation and Selection using Vision Language Models in Mapless Outdoor Environments (TGS:在无地图室外环境中使用视觉语言模型进行轨迹生成和选择)研究问题在具有非结构化越野特征(如建筑物、草地、路缘&#x…...
【未来展望】云、AI与元宇宙的融合架构
未来展望:云、AI与元宇宙的融合架构 一、技术背景与发展:从独立演进到深度融合二、技术特点:异构协同与场景化适配三、技术细节:架构层解构与核心组件四、未来发展:技术趋势与产业机遇五、结语:硅基与碳基文明的共生演进一、技术背景与发展:从独立演进到深度融合 云计算…...
React+Taro 微信小程序做一个页面,背景图需贴手机屏幕最上边覆盖展示
话不多说 直接上图 第一步 import { getSystemInfoSync } from tarojs/taro;第二步 render() {const cardBanner getImageUrlByGlobal(member-merge-bg.png);const { safeArea, statusBarHeight } getSystemInfoSync();const NAV_BAR_HEIGHT 44;const navBarHeight NAV…...
Linux笔记---信号(下)
1. sigaction函数 #include <signal.h>int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact); 功能:sigaction函数用于检查或修改与指定信号相关联的处理动作。它可以用来设置信号处理函数、信号掩码等。 参数 signum&#…...
腾讯云媒体AI解码全球视频出海智能密码
当短剧平台撞上多语种字幕困境,当直播电商遭遇文化审核危机,当经典影视困于格式壁垒——这些内容出海的难题,正被腾讯云媒体AI的智能引擎逐个破解。从东南亚的直播卡顿到中东的宗教符号雷区,从老片的低清画质到元宇宙的渲染瓶颈&a…...
Django的请求和响应+template模板
🌟 如果这篇文章触动了你的心弦,请不要吝啬你的支持! 亲爱的读者, 感谢你花时间阅读这篇分享。希望这里的每一个字都能为你带来启发或是让你会心一笑。如果你觉得这篇文章有价值,或者它解决了你一直以来的一个疑问&a…...
JAVA8怎么使用9的List.of
在 Java 8 中,List.of 方法并不可用,因为这是从 Java 9 开始引入的用于创建不可变列表的便捷方法。要在 Java 8 中达到类似的效果,您需要使用其他方式来创建列表。常规的方法是先创建集合对象然后再添加元素 List<String> list new A…...
无人机避障——深蓝学院浙大Ego-Planner规划部分
ESDF-free: 被这种类型的障碍物死死卡住的情况: 在一定范围内建立ESDF: Ego-Planner框架: 找到{p,v} pair: 【注意】:首先根据在障碍物内航迹上的点Q,以及与它相邻但不在障碍物内的两个点&#…...
Qt 最新版6.9.0使用MQTT连接腾讯云详细教程
Qt 最新版6.9.0使用MQTT连接腾讯云详细教程 一、MQTT介绍二、MQTT库编译1、源码下载2、源码编译 三、库的使用方法四、MQTT连接设备1、包含头文件 2、定义一个mqtt客户端3、实例并连接相关信号与槽4、连接服务器5、订阅topic 一、MQTT介绍 1. 概述 全称: Message Queuing Tel…...
无人机避障——深蓝学院浙大栅格地图以及ESDF地图内容
Occupancy Grid Map & Euclidean Signed Distance Field: 【注意】:目的是为了将有噪声的传感器收集起来,用于实时的建图。 Occupancy Grid Map: 概率栅格: 【注意】:由于传感器带有噪声,在实际中基于…...
Vitis 2021.1安装步骤
1.将压缩文件解压 2.打开解压后的文件夹,双击应用程序 3.安装版本2021.1,不安装2024.2,点击“continue”,然后点击“next” 4.选择“vitis”,然后点击“next” 5.点击“next” 6.选择“I Agree”,点击“next…...
【Harmony】【鸿蒙】List列表View如果刷新内部的自定义View
创建自定义View Component export struct TestView{State leftIcon?:Resource $r(app.media.leftIcon)State leftText?:Resource | string $r(app.string.leftText)State rightText?:Resource | string $r(app.string.rightText)State rightIcon?:Resource $r(app.med…...
我店模式系统开发打造本地生活生态商圈
在当今快节奏的商业环境中,商家们面临着越来越多的挑战,包括市场竞争加剧、消费者需求多样化以及运营效率的提高等。为了应对这些挑战,越来越多的商家开始寻求信息化解决方案,以提升运营效率和客户体验。我的店模式系统平台应运而…...
LeetCode[222]完全二叉树的节点个数
思路: 这个节点个数可以使用递归左儿子个数递归右儿子个数1,这个1是根节点,最后结果为节点个数,但我们没有练习到完全二叉树的性质. 完全二叉树的性质是:我简单说一下,大概就是其他节点都满了,就…...
电机试验平台:实现高效精密测试的关键工具
电机是现代工业中广泛应用的关键设备,其性能直接影响着生产效率和产品质量。为了确保电机的可靠运行和优化设计,电机试验平台成为不可或缺的工具。本文将探讨电机试验平台的概念、功能和应用,以及其在实现高效精密测试中的关键作用。 一、电…...
基于 ZigBee 的 LED 路灯智能控制器的设计
标题:基于 ZigBee 的 LED 路灯智能控制器的设计 内容:1.摘要 本文围绕基于 ZigBee 的 LED 路灯智能控制器展开研究。背景在于传统路灯控制方式存在能耗高、管理不便等问题,为实现路灯的智能化控制和节能目的,采用 ZigBee 无线通信技术来设计 LED 路灯智…...
LeetCode Hot100 (哈希)
1. 两数之和 比较简单,建立个map,看看有没有当前对应的相反的值就可以了 class Solution {public int[] twoSum(int[] nums, int target) {TreeMap<Integer, Integer> arrnew TreeMap<Integer, Integer>();int x10;int x20;for(int i0;i<…...
【力扣题目分享】二叉树专题(C++)
目录 1、根据二叉树创建字符串 代码实现: 2、二叉树的层序遍历 代码实现: 变形题: 代码实现: 3、二叉树的最近公共祖先 代码实现: 4、二叉搜索树与双向链表 代码实现: 5、从前序与中序遍历序列构…...
【烧脑算法】单序列双指针:从暴力枚举到高效优化的思维跃迁
目录 相向双指针 1498. 满足条件的子序列数目 1782. 统计点对的数目 581. 最短无序连续子数组 同向双指针 2122. 还原原数组 编辑 2972. 统计移除递增子数组的数目 II 编辑 思维拓展 1920. 基于排列构建数组 442. 数组中重复的数据 448. 找到所有数组中消失的…...
如何排查服务器 CPU 温度过高的问题并解决?
服务器CPU温度过高是一个常见的问题,可能导致服务器性能下降、系统稳定性问题甚至硬件损坏。有效排查和解决服务器CPU温度过高的问题对于确保服务器正常运行和延长硬件寿命至关重要。本文将介绍如何排查服务器CPU温度过高的问题,并提供解决方法ÿ…...
YOLO篇-3.1.YOLO服务器运行
1.服务器 服务器网站:AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL(这个是收费的) 2.数据集上传 进入网站,租用自己的服务器,租用好后点击jupyter。(这里需要先有一个数据集哦) 在根目录下进入datasets创建自己的工程名 在工程文件下…...
数智读书笔记系列034《最优解人生》对编程群体的理念契合
📘 书籍简介 核心观点 《Die with Zero》(中文译为《最优解人生》)由美国对冲基金经理比尔柏金斯(Bill Perkins)撰写,核心理念是“财产归零”。其核心主张是: 金钱是实现体验的工具:金钱本身无意义,其价值在于转化为有意义的体验,如旅行、学习、家庭时光或慈善活动…...
深度学习相比传统机器学习的优势
深度学习相比传统机器学习具有显著优势,主要体现在以下几个方面: 1. 特征工程的自动化 传统机器学习:依赖人工设计特征(Feature Engineering),需要领域专家从原始数据中提取关键特征(如边缘检测…...
深入探究C++11的核心特性
目录 引言 C11简介 统一的列表初始化 1. {} 初始化 2. std::initializer_list 变量类型推导 1. auto 2. decltype 3. nullptr 右值引用和移动语义 1. 左值引用和右值引用 2. 左值引用与右值引用比较 3. 右值引用使用场景和意义 移动赋值与右值引用的深入应用 1. 移…...
nltk-英文句子分词+词干化
一、准备工作 ①安装好nltk模块并在: nltk/nltk_data: NLTK Data 链接中手动下载模型并放入到对应文件夹下。 具体放到哪个文件夹,先执行看报错后的提示即可。 ②准备pos_map.json文件,放置到当前文件夹下。该文件用于词性统一 {"…...
系统性能分析基本概念(3) : Tuning Efforts
系统性能调优(Tuning Efforts)是指通过优化硬件、软件或系统配置来提升性能,减少延迟、提高吞吐量或优化资源利用率。以下是系统性能调优的主要努力方向,涵盖硬件、操作系统、应用程序和网络等多个层面,结合实际应用场…...
部署TOMEXAM
前提:机器上有MySQL,nginx,jdk,tomcat 1.配置MySQL [rootjava-tomcat1 ~]# mysql -u root -pLiuliu!123 mysql: [Warning] Using a password on the command line interface can be insecure. Welcome to the MySQL monitor. C…...
Nginx 1.25.4交叉编译问题:编译器路径与aclocal.m4错误解决方案
Nginx 1.25.4交叉编译问题:编译器路径与aclocal.m4错误解决方案 一、问题描述 在对Nginx 1.25.4进行交叉编译时,遇到以下复合问题: 编译器路径失效:尽管在脚本中配置了交叉编译器(如CCaarch64-himix100-linux-gcc&a…...
FPGA通信之VGA
文章目录 基本概念:水平扫描:垂直扫描: 时序如下:端口设计疑问为什么需要输出那么多端口不输出时钟怎么保证电子枪移动速度符合时序VGA转HDMI 仿真电路图代码总结:野火电子yyds 为了做图像处理, 现在我们开…...
[Git] 认识 Git 的三大区域 文件的修改和提交
文章目录 认识 Git 的三大区域:工作区、暂存区、版本库工作区、暂存区、版本库的关系流程图解 (概念) 将文件添加到仓库进行管理:git add 和 git commit场景一:第一次添加文件到仓库查看提交历史:git log(进阶理解&…...
交叉编译DirectFB报错解决方法
configure: error: *** DirectFB compilation requires fluxcomp *** Unless you are compiling from a distributed tarball you need fluxcomp available from git://git.directfb.org/git/directfb/core/flux installed in your PATH. 需要先编译安装flux git clone http…...
AllToAll通信为什么用于EP并行?
1 AllToAll通信原理 首先要明白ALLTOALL通信是做了什么事情。 假设我们有3个进程(A、B、C),每个进程都有三段数据,分别是a1, a2, a3;b1, b2, b3;c1, c2, c3。 进程A想发送:a1到进程A自己&…...
深入掌握Node.js HTTP模块:从开始到放弃
文章目录 一、HTTP模块入门:从零搭建第一个服务器1.1 基础概念解析1.2 手把手创建服务器 二、核心功能深入解析2.1 处理不同请求类型2.2 实现文件下载功能 三、常见问题解决方案3.1 跨域问题处理3.2 防止服务崩溃3.3 调试技巧 四、安全最佳实践4.1 请求头安全设置4.…...
python安装与使用
Python的安装 1.官网下载python安装包 https://www.python.org/ 2.安装python 勾选add python 3.8 to api将python加入变量 选择Customize installation进行自定义安装 一直选next直到下面界面,根据自己需要将python安装到指定位置,然后install 等贷…...
2025最新版Visual Studio Code for Mac安装使用指南
2025最新版Visual Studio Code for Mac安装使用指南 Installation and Application Guide to The Latest Version of Visual Studio Code in 2025 By JacksonML 1. 什么是Visual Studio Code? Visual Studio Code,通常被称为 VS Code,是由…...
VSCode GitHub Copilot 安装与使用完全指南
文章目录 一、安装准备1.1 系统要求1.2 Copilot订阅选择1.3 获取访问权限 二、安装步骤2.1 安装GitHub Copilot基础扩展2.2 安装GitHub Copilot Chat扩展2.3 登录和授权 三、基本使用:代码自动完成3.1 内联代码建议3.2 自定义Copilot配置3.3 使用注释引导Copilot 四…...
Github超19k+ strar的实时协同编辑的开源框架yjs
Yjs 是一个用于实现实时协同编辑的开源框架,具有以下关键特性和应用价值: 核心特性 基于 CRDT 算法 Yjs 采用无冲突复制数据类型(CRDT),确保多用户同时编辑同一文档时无需复杂锁机制或中央协调,最终实现数据…...
【Node.js】工具链与工程化
个人主页:Guiat 归属专栏:node.js 文章目录 1. Node.js 工具链概述1.1 工具链的作用1.2 Node.js 工具链全景 2. 包管理与依赖管理2.1 npm (Node Package Manager)2.2 yarn2.3 pnpm2.4 锁文件与依赖管理2.5 工作空间与 Monorepo 3. 构建工具与打包3.1 Web…...
OceanBase数据库全面指南(函数篇)函数速查表
文章目录 一、数学函数1.1 基本数学函数1.2 三角函数二、字符串函数2.1 基本字符串函数2.2 高级字符串处理函数三、日期时间函数3.1 基本日期时间函数3.2 日期时间计算函数四、聚合函数4.1 常用聚合函数4.2 分组聚合4.3 高级聚合函数五、条件判断函数5.1 基本条件函数5.2 CASE表…...
Chrome 缓存文件路径
Chrome 缓存文件路径查看方法 启动 Chrome 浏览器, 输入 Chrome://Version Google浏览器版本号以及安装路径 Windows 缓存目录 在 “运行” 中输入 %TEMP% 可打开, 一般路径是: C:\Users\Administrator\AppData\Local\Temp, 其中 Administrator 是用户名。 Windows 目录…...
Ubuntu Desktop 24.04 常用软件安装步骤
文章目录 Ubuntu Desktop 24.04 常用软件安装步骤Snipaste F1快捷截图(超方便 | 我6台电脑每台都用)搜狗输入法快速浏览工具 | 空格键快速预览文件壁纸工具 | varietySSH 工具 | Termius 终端分屏工具 | TmuxCaffeine | 避免息屏小工具 一些设置将启动台…...
Chrome 插件网络请求的全面指南
在 Chrome 插件开发中,网络请求可以在多个上下文中实现,而不仅限于 background.js 和 content.js。以下是完整的网络请求实现方案: 一、主要请求实现位置 1. Background Script (后台脚本) 特点: 生命周期最长适合处理敏感数据…...
SpringBoot Day_03
目录 一、数据校验 二、统一异常处理 1、局部异常处理(少) 2、全局异常处理(多) 三、定时器 四、springboot日志 五、swagger 六、springboot自动装配原理 总结 1、如何实现参数校验功能(掌握) …...
Ubuntu 新建用户
在 Ubuntu 22.04 中创建新用户并赋予 root 权限的步骤如下,综合多篇文档推荐的安全方法: 一、创建新用户 使用 adduser 命令创建用户 sudo adduser your_username系统会提示设置密码及填写用户信息(全名、电话等,可直接回车跳过&a…...
从法律视角看湖北理元理律师事务所的债务优化实践
债务问题解决需要专业法律支持。本文将从实务角度,解析湖北理元理律师事务所在债务优化领域的工作方法,为有需要的读者提供参考。 一、法律框架下的债务重组 利率合法性审查 识别超过法定上限的利息部分 收集相关证据材料 启动协商或诉讼程序 还款…...