当前位置: 首页 > news >正文

混合专家模型(MoE):高效处理复杂任务的智能架构,DeepSeek性能出色的秘诀

混合专家模型

1. 什么是混合专家模型

混合专家模型(Mixture of Experts,简称 MoE) 是一种先进的神经网络架构,旨在通过整合多个 专门化的子模型(或称为“专家”) 的预测来提升整体模型性能。其核心思想是将复杂任务分解为多个子任务 ,并由不同的 专家 分别处理,从而实现更高的效率和更好的性能。简单说就是分工,混合专家模型比如deepseek-R1,满血版的模型总参数量为671B,但它在运行时的激活参数量为370B,大大节省了算力。因为每个token只会激活一部分专家,所以激活参数量总参数量要小很多。详细请看:揭秘DeepSeek:引领开源模型新纪元(deepseek模型发展路径和训练流程)

1.2 术语解释

  • 专家(Expert):每个专家是一个独立的子模型,通常是一个小型的神经网络,专注于处理输入数据的一个特定子集或特征
  • 门控网络(Gate Layer):负责根据输入数据的特征,动态选择最适合的专家,并分配权重
  • 混合机制(Mixture Mechanism):将多个专家的输出按权重汇总,形成最终的模型输出

1.3 MoE模型的优点

  • 高效处理复杂任务:通过将任务分解为多个子任务,每个专家可以专注于自己擅长的部分。
  • 计算效率高:每次输入只激活部分专家,而不是整个模型,显著降低了计算成本
  • 可扩展性强:可以在有限的计算资源下扩展模型规模

2. 实例分析-MoE 在图像分类中的应用

假设我们正在开发一个图像分类模型,目标是识别不同类型的动物(如猫、狗、鸟等)。传统的单一模型可能难以同时处理所有动物的特征,而混合专家模型可以通过分工来提高效率

2.1 模型架构设计

专家(Experts)

  • 专家1:擅长生成描述性文本,如风景描写。
  • 专家2:擅长生成对话性文本,如人物对话。
  • 专家3:擅长生成技术性文本,如产品说明书。

门控网络(Gate Layer)

  • 根据输入提示(prompt)的语义特征,动态选择最适合的专家。

混合机制

  • 将各专家的输出按权重汇总,生成最终的文本。
2.1.1 工作流程:

输入提示:假设输入提示是“描述一个美丽的海滩”。

门控网络决策

  • 门控网络分析提示,判断其属于描述性文本。
  • 为专家1分配较高权重(如0.7),为其他专家分配较低权重(如0.2)。

专家处理

  • 专家1生成描述海滩的文本,如“阳光洒在金色的沙滩上,海浪轻轻拍打着岸边……”。
  • 专家2和专家3也会生成文本,但由于权重较低,它们的输出对最终结果影响较小。

输出汇总

  • 将各专家的输出按权重加权求和,生成最终的描述性文本

3 专家的具体结构

DeepSeek-R1为例,它是一个基于混合专家模型(MoE)架构的超大规模语言模型。

DeepSeek-R1 的 MoE 架构中,每一层网络包含 1个共享专家(shared expert)256个路由专家(routed expert)。在每次推理过程中,每个 token 会动态激活 8个路由专家。这种设计使得模型能够在推理时仅激活部分专家,从而显著降低计算量。

3.1 共享专家(Shared Experts)

共享专家是 MoE 架构中的一种特殊专家类型,其特点是固定激活。无论输入数据如何,共享专家始终参与计算,主要用于处理通用特征或任务

3.2 路由专家(Routed Experts)

路由专家(Routed Expert) 是一种特殊的专家网络,其激活与否由门控网络(Gating Network)动态决定。它们是模型中负责处理输入数据的专家网络的一部分,但与传统的“共享专家”不同,路由专家的激活是稀疏的基于输入的上下文特征的

在 MoE 架构中,路由专家的工作流程如下

  • 输入数据到达:输入数据首先被传递到门控网络。
  • 门控网络评分:门控网络根据输入数据的特征,为每个路由专家计算一个评分(或概率),表示该专家对当前输入的适配度
  • 选择激活的专家:门控网络根据评分选择排名最高的 Top-K 个路由专家进行激活。例如,在 DeepSeek-R1 中,每个输入 token 会激活 8个路由专家
3.2.1 路由专家的示例

假设我们正在处理一个自然语言处理任务,比如文本分类。模型的 MoE 架构可能包含以下类型的路由专家:

  • 专家1:专注于处理情感分析相关的特征。
  • 专家2:专注于处理主题分类相关的特征。
  • 专家3:专注于处理语法结构相关的特征。

当输入一段文本时,门控网络会根据文本内容动态选择最适合的路由专家进行处理。例如:
如果输入文本是情感强烈的评论,门控网络可能会激活 专家1
如果输入文本是关于某个主题的新闻报道,门控网络可能会激活 专家2

3.3 其他专家

1. 密集专家(Dense Experts)

密集专家是 MoE 架构中的另一种专家类型,与稀疏专家(路由专家)相对。密集专家的特点是全激活,即在每次计算中,所有密集专家都会被激活。这种设计适用于需要全面处理输入数据的场景,但计算成本相对较高

2. 细粒度专家(Fine-Grained Experts)

细粒度专家是 MoE 架构中的一种优化设计,通过将单个专家进一步细分为更小的单元,以实现更高的专业化。

3.条件专家(Conditional Experts)

条件专家是一种动态激活的专家类型,其激活与否取决于输入数据的特定条件。例如,某些专家可能只在输入数据满足特定条件时被激活,从而实现更灵活的任务处理。

3.4 专家的一般结构

专家通常是基于前馈神经网络(FFN)的结构,类似于 Transformer 中的前馈层。这种结构简单且高效,能够对输入数据进行非线性变换。然而,专家的结构并不局限于 FFN,也可以是更复杂的网络,甚至可以是 MoE 层本身,从而形成层级式的 MoE 结构
在这里插入图片描述

专家在 MoE 架构中替代了传统 Transformer 中的前馈网络(FFN)层。通过门控网络动态选择合适的专家,模型能够根据输入数据的特征灵活地分配计算资源,从而提高效率和性能

4.门控网络

在混合专家模型(MoE)架构中,门控网络(Gating Network) 是实现稀疏激活和动态选择专家的核心组件。

功能

门控网络的主要作用是为每个输入(例如语言模型中的 token)动态选择 最合适的专家。它通过计算每个专家的激活概率,决定哪些专家将被激活来处理当前输入。

门控网络的结构

门控网络通常是一个简单的前馈神经网络(FFN),包含一个或多个线性层,最后通过 Softmax 函数输出一个概率分布。这个分布表示每个专家对当前输入的适配度

Top-K 选择机制

在实际应用中,门控网络会根据输出的概率分布选择 Top-K 个专家进行激活。例如,对于每个输入 token,门控网络会计算所有专家的得分,并选择得分最高的 K 个专家。这种稀疏激活机制显著降低了计算成本。

4.负载均衡机制

为了避免某些专家过载,门控网络还会引入负载均衡机制。例如,通过限制每个专家处理的 token 数量(Expert Capacity),或者在训练时引入辅助损失函数(如负载均衡损失),鼓励更均匀地分配输入

import torch
import torch.nn as nn
import torch.nn.functional as Fclass Expert(nn.Module):"""一个简单的专家网络,使用两层全连接网络。"""def __init__(self, input_dim, hidden_dim, output_dim):super(Expert, self).__init__()self.fc1 = nn.Linear(input_dim, hidden_dim)self.fc2 = nn.Linear(hidden_dim, output_dim)def forward(self, x):x = F.relu(self.fc1(x))x = self.fc2(x)return xclass GatingNetwork(nn.Module):"""门控网络,用于动态选择专家。"""def __init__(self, input_dim, num_experts):super(GatingNetwork, self).__init__()self.fc = nn.Linear(input_dim, num_experts)def forward(self, x):# 输出每个专家的权重,使用 Softmax 归一化weights = F.softmax(self.fc(x), dim=-1)return weightsclass MixtureOfExperts(nn.Module):"""混合专家模型,包含多个专家和一个门控网络。"""def __init__(self, input_dim, hidden_dim, output_dim, num_experts, k=2):super(MixtureOfExperts, self).__init__()self.experts = nn.ModuleList([Expert(input_dim, hidden_dim, output_dim) for _ in range(num_experts)])self.gating_network = GatingNetwork(input_dim, num_experts)self.k = k  # 每次激活的专家数量def forward(self, x):# 计算门控网络的权重weights = self.gating_network(x)  # [batch_size, num_experts]# 获取 Top-K 专家的权重和索引top_k_weights, top_k_indices = torch.topk(weights, k=self.k, dim=-1)  # [batch_size, k]# 初始化输出batch_size, seq_len, _ = x.size()output = torch.zeros(batch_size, seq_len, output_dim, device=x.device)# 遍历每个专家,计算其输出并加权求和for i in range(self.k):expert_idx = top_k_indices[:, :, i]  # 当前激活的专家索引expert_output = self.experts[expert_idx](x)  # [batch_size, seq_len, output_dim]output += expert_output * top_k_weights[:, :, i].unsqueeze(-1)  # 加权求和return output# 示例:使用 MoE 模型
if __name__ == "__main__":# 参数设置input_dim = 10hidden_dim = 20output_dim = 5num_experts = 4k = 2  # 每次激活的专家数量# 创建模型model = MixtureOfExperts(input_dim, hidden_dim, output_dim, num_experts, k)# 创建输入数据batch_size = 3seq_len = 5input_data = torch.randn(batch_size, seq_len, input_dim)# 前向传播output = model(input_data)print("Output shape:", output.shape)  # 应该是 [batch_size, seq_len, output_dim]

解释:

  • Expert 类:每个专家是一个简单的两层全连接网络,用于处理输入数据。
  • GatingNetwork 类:门控网络是一个单层全连接网络,输出每个专家的权重,并通过 Softmax 归一化。
  • MixtureOfExperts 类:这是主模型,包含多个专家和一个门控网络。它通过门控网络动态选择 Top-K 专家,并将它们的输出加权求和。
  • 前向传播:输入数据通过门控网络计算权重,然后选择 Top-K 专家进行处理,最后将专家的输出按权重加权求和

作者码字不易,觉得有用的话不妨点个赞吧,关注我,持续为您更新AI的优质内容。

相关文章:

混合专家模型(MoE):高效处理复杂任务的智能架构,DeepSeek性能出色的秘诀

混合专家模型 1. 什么是混合专家模型 混合专家模型(Mixture of Experts,简称 MoE) 是一种先进的神经网络架构,旨在通过整合多个 专门化的子模型(或称为“专家”) 的预测来提升整体模型性能。其核心思想是…...

使用 Spring Boot 实现前后端分离的海康威视 SDK 视频监控

使用 Spring Boot 实现前后端分离的海康威视 SDK 视频监控系统,可以分为以下几个步骤: 1. 系统架构设计 前端:使用 Vue.js、React 或 Angular 等前端框架实现用户界面。后端:使用 Spring Boot 提供 RESTful API,负责与…...

C++ 内存序在多线程中的使用

目录 一、内存顺序 二、 指令重排在多线程中的问题 2.1 问题与原因 2.2 解决方案 三、六种内存序 3.1 memory_order_relaxed 3.2 memory_order_consume 3.3 memory_order_acquire 3.4 memory_order_release 3.5 memory_order_acq_rel 3.6 memory_order_seq_cst 一、…...

【MySQL】表的操作

文章目录 👉表的操作👈创建表查看表修改表删除表 👉表的操作👈 创建表 create tabletable_name (field1 datatype,field2 datatype,field3 datatype ) character set 字符集 collate 校验规则 engine 存储引擎;说明:…...

【Flink银行反欺诈系统设计方案】3.欺诈的7种场景和架构方案、核心表设计

【Flink银行反欺诈系统设计方案】3.欺诈的7种场景和架构方案、核心表设计 1. **欺诈场景分类与案例说明**1.1 **大额交易欺诈**1.2 **异地交易欺诈**1.3 **高频交易欺诈**1.4 **异常时间交易欺诈**1.5 **账户行为异常**1.6 **设备指纹异常**1.7 **交易金额突变** 2. **普适性软…...

DeepSeek-R1本机部署(VLLM+OpenWebUI)

本文搭建环境 系统:Ubuntu 22.04.4 LTS Python版本:Python 3.10 显卡:RTX 4090D 一、DeepSeek-R1-14b原始模型和q8量化模型 1.从modelscope下载模型 官方原始模型:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Di…...

计算机网络软考

1.物理层 1.两个主机之间发送数据的过程 自上而下的封装数据,自下而上的解封装数据,实现数据的传输 2.数据、信号、码元 码元就是数字通信里用来表示信息的基本信号单元。比如在二进制中,用高电平代表 “1”、低电平代表 “0”&#xff0c…...

vscode 查看3d

目录 1. vscode-3d-preview obj查看ok 2. vscode-obj-viewer 没找到这个插件: 3. 3D Viewer for Vscode 查看obj失败 1. vscode-3d-preview obj查看ok 可以查看obj 显示过程:开始是绿屏,过了1到2秒,后来就正常看了。 2. vsc…...

HTML第三节

一.初识CSS 1.CSS定义 A.内部样式表 B.外部样式表 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title&g…...

爬虫去重:数据采集时如何进行去重,及去重优化策略

更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 1. 去重的核心思路2. 常见的去重方法2.1 基于集合(Set)的去重2.2 基于布隆过滤器(Bloom Filter)的去重2.3 基于数据库的去重2.4 基于文件存储的去重2.5 基于 Redis 的去重3. 去重的优化策略3.1 URL 规范化3.2 分片去…...

IDEA集成DeepSeek,通过离线安装解决无法安装Proxy AI插件问题

文章目录 引言一、安装Proxy AI1.1 在线安装Proxy AI1.2 离线安装Proxy AI 二、Proxy AI中配置DeepSeek2.1 配置本地部署的DeepSeek&#xff08;Ollama方式&#xff09;2.2 通过第三方服务商提供的API进行配置 三、效果测试 引言 许多开发者尝试通过安装Proxy AI等插件将AI能力…...

【电子基础】运算放大器应用笔记(持续更新)

目录 运放应用1&#xff1a; 运放基础知识同相比例运算放大器计算放大倍数 电压比较器 运放应用2&#xff1a;500W调压器同相比例运算放大器计算放大倍数计算平衡电阻 积分电路 运放应用3&#xff1a;逆变电焊机电压跟随器积分电路 加油站1. 为什么比例运算放大电路要加平衡电阻…...

计算机网络核心知识点:信道容量、OSI模型与调制技术详解

目录 一、信道容量与调制技术 奈奎斯特定理&#xff08;无噪声环境&#xff09; 核心公式&#xff1a; 参数说明&#xff1a; 应用场景&#xff1a; 香农定理&#xff08;有噪声环境&#xff09; 核心公式&#xff1a; 参数说明&#xff1a; 应用场景&#xff1a; 奈奎…...

AI赋能企业协作4-NL2Sql技术路线

1.1 对话即服务的一点思考 在数智化转型的过程中&#xff0c;基于即时通信&#xff08;IM&#xff09;的协作平台正悄然成为企业智能化转型的“新基建”。协作平台天然具备高频交互、实时协同和场景化落地的特性&#xff0c;仿佛是为对话式AI量身定制的试验场——员工在熟悉的聊…...

如何用FFmpeg高效拉流(避坑指南)

FFmpeg作为音视频处理领域的“瑞士军刀”,其拉流功能在直播、监控、流媒体分析等场景中应用广泛。本文从实战角度出发,系统梳理FFmpeg拉流的核心工具链、协议适配技巧及高频踩坑点,助你快速掌握流媒体处理核心技能! 一、FFmpeg拉流工具链全解析 核心工具 ffplay:快速验证…...

面试基础--MySQL SQL 优化深度解析

MySQL SQL 优化深度解析&#xff1a;EXPLAIN、索引优化与分库分表实践 引言 在互联网大厂的高并发场景下&#xff0c;数据库的性能优化是至关重要的。MySQL 作为最流行的关系型数据库之一&#xff0c;SQL 查询的性能直接影响了系统的响应时间和吞吐量。本文将深入探讨 MySQL …...

WebRTC简介

WebRTC简介 WebRTC&#xff08;Web Real-Time Communication&#xff09;是一种支持浏览器之间进行实时音视频通信和数据传输的开放标准和技术。它由Google发起&#xff0c;现已成为W3C和IETF的标准。WebRTC允许开发者在不依赖第三方插件或软件的情况下&#xff0c;直接在网页…...

清北deepseek8本手册

“清北手册”通常是“清华大学和北京大学推出的DeepSeek手册”的简写。近期&#xff0c;随着AI技术的迅速发展&#xff0c;清北两高校陆续发布多本自家的DeepSeek学习手册&#xff0c;助力普通人学习进阶。 清华大学的DeepSeek手册已推出5册&#xff0c;内容丰富全面&#xff0…...

前后分离文件上传案例,前端HTML,后端Net6开发的webapi(完整源代码)下载

文件上传功能在项目开发中非常实用&#xff0c;本案例前端用HTML页面的form表单实现&#xff0c;后端用Net6实现。 前后分离文件上传案例&#xff0c;前端HTML&#xff0c;后端Net6&#xff08;完整源代码&#xff09; 下载链接https://download.csdn.net/download/luckyext/9…...

6.过拟合处理:确保模型泛化能力的实践指南——大模型开发深度学习理论基础

在深度学习开发中&#xff0c;过拟合是一个常见且具有挑战性的问题。当模型在训练集上表现优秀&#xff0c;但在测试集或新数据上性能大幅下降时&#xff0c;就说明模型“记住”了训练数据中的噪声而非学习到泛化规律。本文将从实际开发角度系统讲解如何应对过拟合&#xff0c;…...

六十天前端强化训练之第一天到第七天——综合案例:响应式个人博客项目

欢迎来到编程星辰海的博客讲解 目录 前言回顾 HTML5与CSS3基础 一、知识讲解 1. 项目架构设计&#xff08;语义化HTML&#xff09; 2. 响应式布局系统&#xff08;Flex Grid&#xff09; 3. 样式优先级与组件化设计 4. 完整响应式工作流 二、核心代码示例 完整HTML结…...

java数据结构_再谈String_10

目录 字符串常量池 1. 创建对象的思考 2. 字符串常量池&#xff08;StringTable&#xff09; 3. 再谈String对象创建 字符串常量池 1. 创建对象的思考 下面两种创建String对象的方式相同吗&#xff1f; public static void main(String[] args) {String s1 "hello&…...

MCP:重塑AI与数据交互的新标准

MCP&#xff1a;重塑AI与数据交互的新标准 前言 在人工智能领域&#xff0c;大型语言模型&#xff08;LLM&#xff09;的应用日益广泛&#xff0c;但其与外部数据源和工具的集成却一直面临复杂性和碎片化的挑战。 Anthropic提出的MCP&#xff08;Model Context Protocol&…...

Cursor+Claude3.7实现从原型到app开发

最近在X上看到了一些人在用Claude 3.7 Sonnet生成 app原型图的尝试&#xff0c;受到启发&#xff0c;发现这么先生成不同界面的原型图再让Cursor基于原型图开发app会是很好的尝试。尤其是&#xff0c;你也可以不两步直接生成&#xff0c;而是在过程中更可视化地思考你要生产的原…...

洛谷P1334

题目如下 思路&#xff1a; 每次选择最短的两块木板进行合并&#xff0c;直到只剩下一块木板。使用最小堆&#xff08;优先队列&#xff09;来实现这一过程。使用最小堆&#xff1a; 将所有木板的长度放入最小堆&#xff08;优先队列&#xff09; 每次从堆中取出两块最短的木…...

使用wifi连接手机adb进行调试|不使用数据线adb调试手机|找应用错误日志和操作日志

手机在开发者选项里要开启无线调试 在手机设置中查看WiFi的IP地址 设置 -> WLAN -> 已连接的WiFi -> IP地址 使用手机的IP地址连接 adb connect 192.168.1.12:xxxxx 检查连接状态 adb devices 断开特定设备 adb disconnect 192.168.x.x:xxxxx 断开所有设备 …...

大语言模型中温度参数(Temperature)的核心原理

大语言模型中温度参数&#xff08;Temperature&#xff09;的核心原理是通过调整模型输出的概率分布&#xff0c;控制生成结果的随机性和多样性。以下是其原理的详细说明&#xff1a; 一、定义与核心作用 温度参数是生成式模型&#xff08;如GPT系列&#xff09;中的一个超参数…...

【AIGC】通义万相 2.1 与蓝耘智算:共绘 AIGC 未来绚丽蓝图

一、引言 在人工智能技术迅猛发展的今天&#xff0c;AIGC&#xff08;生成式人工智能内容生成&#xff09;领域正以惊人的速度改变着我们的生活和工作方式。从艺术创作到影视制作&#xff0c;从广告设计到智能客服&#xff0c;AIGC 技术的应用越来越广泛。通义万相 2.1 作为一…...

在Ubuntu上搭建Samba服务,实现与windows之间的文件共享

1.安装samba 首先切换为root账户&#xff0c;就是带#符号的表示当前登录的是root超级用户&#xff1b; su - 如果忘记密码&#xff0c;就输入以下命令修改密码 sudo passwd root 再切换为超级用户 然后进行更新软件列表 sudo apt update sudo apt install samba安装 whe…...

Labview培训案例3: 输出正弦波并采集显示

本案例介绍如何从板卡&#xff08;USB6008&#xff09;的模拟量输出端口输出一个正弦波&#xff0c;然后模拟量输入模块进行采样&#xff0c;然后显示到vi画面的‘波形图’中。 详细代码在&#xff1a;Labview课程3&#xff1a;正弦波输出&采集数据&显示资源-CSDN文库 …...

使用 Deepseek + kimi 快速生成PPT

前言 最近看到好多文章和视频都在说&#xff0c;使用 Deepseek 和 kimi 能快速生成精美的 ppt&#xff0c;毕竟那都是别人说的&#xff0c;只有自己尝试一次才知道结果。 具体操作 第一步&#xff1a;访问 deepseek 我们访问 deepseek &#xff0c;把我们想要输入的内容告诉…...

图解MOE大模型的7个核心问题并探讨DeepSeekMoE的专家机制创新

原文地址:https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-mixture-of-experts #mermaid-svg-FU7YUSIfuXO6EVHa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-FU7YUSIfuXO6EVHa .error-icon{fill…...

青训营:简易分布式爬虫

一、项目介绍 该项目是一个简易分布式爬虫系统&#xff0c;以分布式思想为基础&#xff0c;通过多节点协作的方式&#xff0c;将大规模的网页抓取任务分解&#xff0c;从而高效、快速地获取网络数据 。 项目地址&#xff1a;https://github.com/yanchengsi/distributed_crawle…...

Scala(Array,List,Set,Map,Tuple,字符串 使用的简单介绍)

目录 Array 不可变数组 ArrayBuffer可变数组 List 不可变列表 ListBuffer 可变列表 Set 集合&#xff08;可变不可变&#xff09; Map映射(可变不可变)(键值对) Tuple 元组 字符串 Array 不可变数组 // Array 数组// scala 中的数组下标是()// scala 中的数组是值…...

fmql之Linux WDT

正点原子第52章。 基础知识 正点原子教程 fmql-dts 代码 APP代码&#xff08;不需要编写驱动代码&#xff09; static int dw_wdt_drv_probe(struct platform_device *pdev) {struct device *dev &pdev->dev;struct watchdog_device *wdd;struct dw_wdt *dw_wdt; …...

IntelliJ IDEA集成MarsCode AI

IntelliJ IDEA集成MarsCode AI IDEA中安装插件 安装完毕之后登录自己的账号 点击链接&#xff0c;注册账号 https://www.marscode.cn/events/s/i5DRGqqo/ 可以选择不同的模型...

python-leetcode-打家劫舍 III

337. 打家劫舍 III - 力扣(LeetCode) 这个问题可以通过动态规划解决。可以通过递归的方式来解决每个房子的最大偷窃金额,递归过程中,我们会记录每个房子是否偷或不偷时能够获得的最大金额。 思路: 对于每个房子,我们有两种选择: 偷这个房子,那么它的直接相邻(父亲和孩…...

数据结构——队列

1. 概念与结构 队列&#xff08;Queue&#xff09;是一种先进先出&#xff08;FIFO, First In First Out&#xff09;的数据结构&#xff0c;即最先被插入队列的数据会最先被删除。队列广泛应用于计算机科学中&#xff0c;特别是在任务调度、缓冲区管理、网络数据传输等领域。…...

GaussianCity:实时生成城市级数字孪生基底的技术突破

在空间智能领域,如何高效、大规模地生成高质量的3D城市模型一直是一个重大挑战。传统方法如NeRF和3D高斯溅射技术(3D-GS)在效率和规模上存在显著瓶颈。GaussianCity通过创新性的技术方案,成功突破了这些限制,为城市级数字孪生的构建提供了全新路径。 一、核心创新:突破传…...

【AGI】智谱开源2025:一场AI技术民主化的革命正在到来

智谱开源2025&#xff1a;一场AI技术民主化的革命正在到来 引言&#xff1a;开源&#xff0c;一场技术平权的革命一、CogView4&#xff1a;中文AI生成的里程碑1. 破解汉字生成的“AI魔咒”2. 开源协议与生态赋能 二、AutoGLM&#xff1a;人机交互的范式跃迁1. 自然语言驱动的跨…...

【算法学习之路】5.贪心算法

贪心算法 前言一.什么是贪心算法二.例题1.合并果子2.跳跳&#xff01;3. 老鼠和奶酪 前言 我会将一些常用的算法以及对应的题单给写完&#xff0c;形成一套完整的算法体系&#xff0c;以及大量的各个难度的题目&#xff0c;目前算法也写了几篇&#xff0c;题单正在更新&#xf…...

C++11中的右值引用和完美转发

C11中的右值引用和完美转发 右值引用 右值引用是 C11 引入的一种新的引用类型&#xff0c;用 && 表示。它主要用于区分左值和右值&#xff0c;并且可以实现移动语义&#xff0c;避免不必要的深拷贝&#xff0c;提高程序的性能。左值通常是可以取地址的表达式&#xf…...

Leetcode 1477. 找两个和为目标值且不重叠的子数组 前缀和+DP

原题链接&#xff1a; Leetcode 1477. 找两个和为目标值且不重叠的子数组 class Solution { public:int minSumOfLengths(vector<int>& arr, int target) {int narr.size();int sum0;int maxnINT_MAX;vector<int> dp(n,maxn);//dp[i]表示以索引i之前的满足要求…...

koa-session设置Cookie后获取不到

在谷歌浏览器中请求获取不到cookie问题之一&#xff08;谷歌安全策略&#xff09; 场景 前端使用 axios 请求&#xff0c;项目地址&#xff1a;http://192.168.8.1:5173 import axios from axiosconst request axios.create({baseURL: http://127.0.0.1:3001/,timeout: 60000,…...

Linux三种网络方式

前言 发现运维啥都得会&#xff0c;这周就遇到了网络问题自己无法解决&#xff0c;因此痛定思痛学一下。 参考文献 你管这破玩意叫网络&#xff1f; 桥接模式、NAT模式、仅主机模式&#xff0c;原来是这样工作的 交换机 构成局域网&#xff0c;实现所有设备之间的通信。 …...

android_viewtracker 原理

一、说明 我们业务中大部分场景是用 RecyclerView 实现的列表&#xff0c;而 View 的曝光通常是直接写在 adapter 的 onBindViewHolder 中&#xff0c;这样就会导致 item 还没显示出来的时候就会触发曝光。最近业务提出需要实现根据 View 显示在屏幕上面积大于 80% 才算曝光。…...

Object.defineProperty()

**Object.defineProperty()** 方法会直接在一个对象上定义一个新属性&#xff0c;或者修改一个对象的现有属性&#xff0c;并返回此对象。 plain const object1 {}; Object.defineProperty(object1, ‘property1’, { value: 42, writable: false }); object1.property1 77…...

大模型+知识图谱:重塑企业制度标准管理

在数字化转型的浪潮中&#xff0c;制度标准管理领域正迎来一场革命性的变革。借助大模型和知识图谱等前沿人工智能技术&#xff0c;制度标准管理不再仅仅是简单的文档存储和检索&#xff0c;而是演变为一个智能化、高效化、精准化的管理体系。 1.关键技术 我们的制度标准管理…...

ubuntu20系统下conda虚拟环境下安装文件存储位置

在 Conda 虚拟环境中执行 pip install 安装软件后&#xff0c;安装的文件会存储在该虚拟环境专属的 site-packages 目录中。具体路径取决于你激活的 Conda 环境路径。以下是定位步骤&#xff1a; 1. 确认 Conda 虚拟环境的安装路径 查看所有环境&#xff1a; conda info --env…...

深度学习编译器(整理某survey)

一、深度学习框架 TensorFlow PyTorch MXNet ONNX:定义了一个统一的表示&#xff0c;DL models的格式方便不同框架之间的转换模型 二、深度学习硬件 通用硬件&#xff08;CPU、GPU&#xff09;&#xff1a;通过硬件和软件优化支持深度学习工作负载 GPU:通过多核架构实现高…...