当前位置：首页 > news >正文

解析DeepSeek的技术内核：混合专家架构如何重塑AI效能

news 来源：原创 2025/8/2 22:19:18

解析DeepSeek的技术内核：混合专家架构如何重塑AI效能

在这里插入图片描述

在当今大型语言模型（LLM）竞争激烈的赛道上，中国AI企业DeepSeek凭借其独特的技术路线脱颖而出。其核心优势之一，便是对混合专家（Mixture of Experts，简称MoE）架构的创新应用，这一技术选择不仅重塑了AI模型的效能表现，更为行业带来了全新的思考方向。本文将深入解析DeepSeek如何通过MoE架构实现算力与性能的最优平衡。

MoE架构的技术本质

混合专家架构代表了一种"分而治之"的神经网络设计哲学。不同于传统的密集型Transformer架构，MoE将单一的大型神经网络分解为多个专业"专家"子网络，每个专家负责处理特定类型的输入。这种设计的精妙之处在于：系统可以根据输入内容动态激活最相关的专家，而将其他专家置于休眠状态，显著降低计算资源消耗。

在实际运行中，当输入数据进入MoE层时，首先经过一个"门控网络"，这个网络会分析输入特征并决定应该激活哪些专家。通常只会选择少数几个最相关的专家（例如8个中的2个）进行计算，从而大大减少了激活参数的数量。

DeepSeek的MoE实现具有几个关键特点：

动态路由机制：DeepSeek设计了高效的门控网络，能够实时决定输入数据应该被路由到哪些专家。这一机制不仅提高了推理准确性，还优化了计算资源分配。
专家平衡训练：为解决专家负载不均衡问题，DeepSeek采用了创新的负载平衡算法，确保各专家模块接收到均衡的训练样本，防止部分专家过度专精或闲置。
层级MoE设计：不同于简单地在网络中插入MoE层，DeepSeek实现了层级化的MoE架构，让不同层级的专家可以处理不同抽象层次的特征，进一步提升模型表达能力。

代码实现示例

以下是一个简化的PyTorch代码示例，展示了DeepSeek MoE层的基本实现原理：

import torch
import torch.nn as nn
import torch.nn.functional as Fclass MoELayer(nn.Module):def __init__(self, input_size, output_size, num_experts=8, k=2):super(MoELayer, self).__init__()self.num_experts = num_expertsself.k = k  # 每次激活的专家数量# 门控网络 - 决定激活哪些专家self.gate = nn.Linear(input_size, num_experts)# 创建多个专家网络self.experts = nn.ModuleList([nn.Sequential(nn.Linear(input_size, 4 * input_size),nn.GELU(),nn.Linear(4 * input_size, output_size)) for _ in range(num_experts)])def forward(self, x):# 计算门控权重gate_logits = self.gate(x)  # [batch_size, num_experts]# 选择top-k专家top_k_logits, top_k_indices = torch.topk(gate_logits, self.k, dim=-1)top_k_weights = F.softmax(top_k_logits, dim=-1)# 准备结果张量final_output = torch.zeros_like(x)# 对每个输入示例应用选定的专家for batch_idx in range(x.size(0)):expert_outputs = []for k_idx in range(self.k):expert_idx = top_k_indices[batch_idx, k_idx].item()expert_output = self.experts[expert_idx](x[batch_idx:batch_idx+1])expert_outputs.append(expert_output)# 加权组合专家输出combined_output = torch.zeros_like(expert_outputs[0])for k_idx in range(self.k):weight = top_k_weights[batch_idx, k_idx]combined_output += weight * expert_outputs[k_idx]final_output[batch_idx:batch_idx+1] = combined_outputreturn final_output

这段代码展示了MoE层如何选择性地激活专家并将它们的输出进行加权组合。实际的DeepSeek实现要复杂得多，包含更多优化和并行处理策略。

效能提升的量化分析

DeepSeek的MoE架构为AI效能带来了多方面的显著提升：

首先，在计算效率方面，实验数据表明，相比同等参数规模的密集模型，DeepSeek的MoE模型在推理阶段可减少50%-70%的计算量，这意味着在保持相同硬件条件下，服务能够支持更多并发用户，或以更低的成本提供同等服务。

其次，在参数利用率上，传统模型在处理任何输入时都会激活全部参数，而DeepSeek的MoE模型针对每个输入仅激活20%-30%的参数，大幅提高了参数利用效率。这种"按需激活"的特性使得DeepSeek能够构建超大规模模型，而不受硬件限制的约束。

最为关键的是，在模型性能方面，DeepSeek的MoE架构实现了"以更少的算力获得更强的能力"。例如，一个拥有100B参数的MoE模型，在激活仅25%参数的情况下，其表现可以超越一个67B参数量的密集模型，同时推理成本仅为后者的三分之一。

应对MoE架构的技术挑战

然而，MoE架构并非没有挑战。DeepSeek团队针对这些挑战提出了一系列创新解决方案：

专家负载不均衡问题

一个常见问题是某些专家可能被过度使用，而其他专家则闲置。DeepSeek采用辅助损失函数来平衡专家负载：

def calculate_balance_loss(gates, num_experts):# gates: [batch_size, seq_len, num_experts]# 计算每个专家的平均使用率expert_usage = gates.sum(dim=[0, 1]) / (gates.size(0) * gates.size(1))# 计算变异系数cv = torch.std(expert_usage) / (torch.mean(expert_usage) + 1e-8)# 平方惩罚balance_loss = cv ** 2return balance_loss

通信开销优化

为减少专家间通信开销，DeepSeek设计了专家分组策略和数据本地化处理方案，减少跨设备通信。

训练稳定性增强

MoE模型训练过程中容易出现不稳定性。DeepSeek开发了自适应学习率调整策略和梯度裁剪技术，有效提高了训练稳定性。

MoE架构的未来演进

DeepSeek的技术团队正在探索MoE架构的下一代演进，包括：

自适应专家数量：根据任务复杂度动态调整激活的专家数量，进一步优化计算资源使用。

def adaptive_topk(gate_logits, complexity_score):# 根据输入复杂度动态决定激活专家数量k = max(1, min(5, int(complexity_score * 5)))top_k_logits, top_k_indices = torch.topk(gate_logits, k, dim=-1)top_k_weights = F.softmax(top_k_logits, dim=-1)return top_k_weights, top_k_indices

跨模态专家融合：设计专门处理图像、文本、音频等不同模态数据的专家，并实现它们之间的深度融合。
终身学习专家群：开发能够持续学习的专家系统，新知识可以被整合到特定专家中，而不影响其他专家的既有能力。

结语

DeepSeek对混合专家架构的创新应用，展示了AI技术发展的新路径——不仅仅是简单地扩大模型规模，更在于如何更智能地利用已有参数和计算资源。这种思路不仅降低了AI的研发和部署成本，更提高了模型性能的上限，为AI的可持续发展提供了重要借鉴。随着DeepSeek继续在这一方向深耕，我们有理由期待更多突破性的成果出现，推动整个AI行业迈向更高效、更智能的新阶段。

解析DeepSeek的技术内核：混合专家架构如何重塑AI效能

解析DeepSeek的技术内核：混合专家架构如何重塑AI效能在当今大型语言模型（LLM）竞争激烈的赛道上，中国AI企业DeepSeek凭借其独特的技术路线脱颖而出。其核心优势之一，便是对混合专家（Mixture of Experts&…...

编程日记 2025/8/2 22:19:18

Android在kts中简单使用AIDL

Android在kts中简单使用AIDL AIDL相信做Android都有所了解，跨进程通信会经常使用，这里就不展开讲解原理跨进程通信的方式了，最近项目换成kts的方式，于是把aidl也换成了统一的方式，其中遇到了很多问题，这里…...

编程日记 2025/7/28 12:15:39

【C++】类和对象（匿名对象）

匿名对象用类型(实参) 定义出来的对象叫做匿名对象，相比之前我们定义的类型对象名(实参) 定义出来叫有名对象匿名对象生命周期只在当前一行，一般临时定义一个对象当前用一下即可，就可以定义匿名对象。 class A { public:A(int a 0):_a…...

编程日记 2025/8/2 22:16:35

Spring boot 3.4 后 SDK 升级，暨 UI API/MCP 计划

PS 写这篇文章后看到 A Deep Dive Into MCP and the Future of AI Tooling | Andreessen HorowitzWe explore what MCP is, how it changes the way AI interacts with tools, what developers are already building, and the challenges that still need solving. https://a1…...

编程日记 2025/7/27 8:36:22

使用Helm安装、升级、回滚Kubernetes应用

前言在我之前做的项目里，我们对Microk8s微服务的更新是通过自制tar包的方式做的, tar包存储了镜像和YAML文件。每次升级时，我们需要先删除所有的YAML资源，然后重新创建新的资源。这种方式存在以下问题： 服务中断：…...

编程日记 2025/8/1 1:27:49

Text-to-SQL将自然语言转换为数据库查询语句

有关Text-To-SQL方法，可以查阅我的另一篇文章，Text-to-SQL方法研究直接与数据库对话-text2sql Text2sql就是把文本转换为sql语言，这段时间公司有这方面的需求，调研了一下市面上text2sql的方法，比如阿里的Chat2DB,麻…...

编程日记 2025/7/30 7:09:24

gin学习

gin学习笔记，不仅包含了基本的增删查改外，还包括参数传递，上传下载，模版、session与中间件等，方便收藏自习可用文章目录获得个请求get打印字符串get请求xmlget请求跳转http方法路由可以通过Context的Param方法来获取…...

编程日记 2025/8/2 11:33:11

【HarmonyOS NEXT】关键资产存储开发案例

在 iOS 开发中 Keychain 是一个非常安全的存储系统，用于保存敏感信息，如密码、证书、密钥等。与文件系统不同，Keychain 提供了更高的安全性，因为它对数据进行了加密，并且只有经过授权的应用程序才能访问存储的数据。那…...

编程日记 2025/7/27 6:06:51

高德终端技术总结：高可用架构如何练成？

前言高德地图作为国民级应用，特别是出行场景的独特性，要确保在线导航高并发和交通安全级的超稳定性，这对技术团队提出异乎寻常的高要求，无论是终端、云端，还是“终端-云端”之间的连接，都必须实现“高可用…...

编程日记 2025/8/2 19:13:31

STM32八股【3】------RAM和片上FLASH

1、RAM和FLASH构成 1.RAM ┌──────────────────────────┐ │ 栈区 (Stack) │ ← 从RAM顶端向下扩展（存储局部变量、函数调用信息） │--------------------------│ │ 堆区 (Heap) │ ← …...

编程日记 2025/8/2 12:44:05

Apache Doris

Apache Doris介绍 Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库，以极速易用的特点被人们所熟知，仅需亚秒级响应时间即可返回海量数据下的查询结果，不仅可以支持高并发的点查询场景，也能支持高吞吐的复杂分析场…...

编程日记 2025/8/1 19:22:38

Debezium介绍

1.什么是Debezium Debezium 是一个开源的分布式平台，用于捕获数据库的变更事件（CDC，Change Data Capture）。它能够实时捕获数据库中的行级更改，并将这些更改作为事件流发送到消息中间件（如 Apache Kafka&a…...

编程日记 2025/7/30 15:23:32

奇迹科技：蓝牙网关赋能少儿篮球教育的创新融合案例研究

一、引言本文研究了福建奇迹运动体育科技有限公司（简称‘奇迹科技’）如何利用其创新产品体系和桂花网蓝牙网关M1500，与少儿篮球教育实现深度融合。重点分析其在提升教学效果、保障训练安全、优化个性化教学等方面的实践与成效，为…...

编程日记 2025/7/29 12:41:30

Python散点图(Scatter Plot)：高阶分析、散点图矩阵、三维散点图及综合应用

散点图：数据分析的利器在数据分析领域，散点图是一种直观且强大的可视化工具，广泛应用于揭示变量间的相关性以及识别数据集中的异常值。本文将深入探讨散点图的这两种关键功能，并结合实际案例与Python代码示例，带您全面了解散点图的应用。一、散点图如何展示变量间的相…...

编程日记 2025/7/28 1:20:56

计算机网络层超全解析：从IP协议到路由算法

🌐 （专业详解生活化类比，逻辑一镜到底） 📖 网络层的核心使命核心任务：在不同网络间为数据包选择最佳路径，实现端到端通信。类比：快递公司总部（网络层）根据…...

编程日记 2025/8/2 19:46:30

RoboVQA

RoboVQA：面向机器人技术的多模态长时推理摘要我们提出了一种可扩展、自下而上且具有内在多样性的数据收集方案，适用于中长时高级推理任务，其吞吐量比传统的自上而下分步收集方法高2.2倍。通过在3栋办公楼内使用多种实体（机器人、人类、使用抓取工具的人类）执行任意用…...

编程日记 2025/7/25 11:23:36

javascript语法入门

一、变量声明在JavaScript中，可以使用var、let和const来声明变量。 javascript var name "张三"; let age 20; 二、数据类型 JavaScript中有7种基本数据类型：undefined、null、boolean、string、symbol、number，以及object。…...

编程日记 2025/7/30 1:10:59

前端字段名和后端不一致？解锁 JSON 映射的“隐藏规则” ！！！

🚀 前端字段名和后端不一致？解锁 JSON 映射的“隐藏规则” 🌟 嘿，技术冒险家们！👋 今天我们要聊一个开发中常见的“坑”：前端传来的 JSON 参数字段名和后端对象字段名不一致，会发生…...

编程日记 2025/7/30 14:31:13

Java——ArrayList集合

ArrayList：基于动态数组实现，支持随机访问，适合频繁的随机访问操作，但在插入和删除元素时性能较差。技术层面介绍所属类库：ArrayList 位于 java.util 包中，它实现了 List 接口，因此具备 Lis…...

编程日记 2025/7/31 20:06:42

基于python+django的图书借阅网站-图书借阅管理系统源码+运行步骤

该系统是基于pythondjango开发的在线图书借阅管理系统。系统适合场景：大学生、课程作业、系统设计、毕业设计。演示地址前台地址： http://book.gitapp.cn 后台地址：http://book.gitapp.cn/#/admin 后台管理帐号： 用户名&…...

编程日记 2025/8/1 8:13:44

Flutter运行错误：UG! exception in phase ‘semantic analysis‘

最近在Mac Mini M4上通过Android Studio导入Flutter项目并运行，结果一直跑不起来，错误日志如下： 执行命令查看版本信息： flutter doctor --verbose通过输出信息Java version OpenJDK Runtime Environment (build 21.0.41242208…...

编程日记 2025/7/17 4:34:29

Python-docx库详解：轻松实现Word文档自动化生成与图片尺寸控制

Python-docx库详解：轻松实现Word文档自动化生成与图片尺寸控制在现代办公自动化的浪潮中，文档处理是一项不可或缺的任务。Python作为一种强大的编程语言，提供了丰富的库来简化这些任务。其中，python-docx库是处理Word文档的有力…...

编程日记 2025/8/1 19:18:58

【NLP 42、实践 ⑪ 用Bert模型结构实现自回归语言模型的训练】

目录数据文件一、模型定义 1.模型初始化代码运行流程 2.前向传播，计算损失 ⭐ 代码运行流程二、加载语料代码运行流程三、随机生成样本代码运行流程四、建立模型五、采样策略选择代码运行流程六、模型效果测试代码运行流程七、模型训练代码运行流程 …...

编程日记 2025/7/29 5:00:07

HTTPS

目录一 HTTPS是什么二加密三加密方案四 CA机构/证书五最终方案(对称密钥/非对称密钥/CA证书)和总体流程一 HTTPS是什么在应用层存在SSL，TLS(HTTP之下，传输层之上)加密/解密安全协议，如果HTTP经过这个协议，对端也走…...

编程日记 2025/7/31 16:15:46

electron框架（4.0）electron-builde和electron Forge的打包方式

----使用electron-builder打包（需要魔法） --安装electron-builder: npm install electron-builder -D--package.json中进行相关配置： {"name": "video-tools","version": "1.0.0","main&quo…...

编程日记 2025/7/23 11:14:19

SaaS系统的销售微服务与权限微服务边界设计

在设计SaaS系统的销售微服务与权限微服务的边界时，需要结合领域驱动设计（DDD）和微服务拆分原则，确保高内聚、低耦合。以下是结合微服务架构原则、多租户SaaS需求及权限管理场景的完整设计方案，整合了权限服务与销售服务…...

编程日记 2025/7/29 10:42:55

Unity-AI-Deepseek生成的生成模型代码

结果能用，不是很理想，从左到右，分别是body,眼睛,演睫毛,手指套（如果你知道这是什么）结果不是很理想 (下面代码已包含，修复的切线只能传Vector3参数，Unity2022测试） 你们帮我看看…...

编程日记 2025/7/31 2:02:23

Django REST Framework 请求封装源码解析与实现流程

版本说明： Django: V4.2.20 Django Rest Framework: V3.15.2 一、核心封装流程示意图 #mermaid-svg-qXJLIa9Bx1TCiPSN {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-qXJLIa9Bx1TCiPSN .error-icon{fill…...

编程日记 2025/8/2 19:34:42

简介PyCDE：Python CIRCT Design Entry

简介PyCDE：Python CIRCT Design Entry 引言在硬件设计和验证领域，随着设计复杂性的增加，传统的方法往往难以满足现代设计的需求。PyCDE（Python CIRCT Design Entry）作为CIRCT项目的一部分，旨在为硬件设计…...

编程日记 2025/8/1 5:43:49

Python实现deepseek接口的调用

简介：DeepSeek 是一个强大的大语言模型，提供 API 接口供开发者调用。在 Python 中，可以使用 requests 或 httpx 库向 DeepSeek API 发送请求，实现文本生成、代码补全，知识问答等功能。本文将介绍如何在 Python 中调用 …...

编程日记 2025/8/1 5:43:55

考研课程安排（自用）

文章目录 408数据结构（王道）计算机组成原理（王道）操作系统（王道）计算机网络（湖科大版） 数学一高等数学（微积分）线性代数和概率论 408 数据结构（王…...

编程日记 2025/7/23 13:25:37

Mybatis操作数据库（注解+xml两个方式）

文章目录 1.个人回顾2.关于mybatis注解的说明3.字段和属性不匹配的解决方案3.1第一个方案3.2第二个方案3.3第三个方案 4.xml路径配置5.xml里面的字段映射 1.个人回顾刚刚翻看了一下自己的这个之前写的博客，上一次和这个javaee相关的博客还是去年写的，也…...

编程日记 2025/7/31 1:39:19

文心快码使用体验与介绍

一、文心快码的核心作用文心快码是百度基于文心大模型开发的智能代码助手，核心价值包括： 代码生成与补全通用开发：根据注释生成HTML/CSS/JS、Python、Java等代码C专项：生成类定义、STL容器操作、智能指针代码（如st…...

编程日记 2025/8/1 20:34:48

区块链交易

文章目录交易准备合约和代码逻辑合约compile.jsindex.js 运行交易项目来自https://github.com/Dapp-Learning-DAO/Dapp-Learning/blob/main/basic/02-web3js-transaction/README-cn.md 本项目包含对交易进行签名，发送，接收交易回执，验证…...

编程日记 2025/7/31 4:24:21

LeetCode 160 Intersection Of Two Linked Lists 相交链表 Java

题目：找到两个相交列表的起始点，如图c1开始为A和B两个链表的相交点举例1：8为两个链表的相交点。注意：相交不止是数值上的相同。举例2：2为相交点举例3：没有相交点解题思路： 相交证明最后一…...

编程日记 2025/8/2 16:40:52

体育直播模板nba英超直播欧洲杯直播模板手机自适应

源码名称：体育直播模板nba英超直播欧洲杯直播模板手机自适应帝国cms 7.5模板开发环境：帝国cms7.5 空间支持：phpmysql 带软件采集，可以挂着自动采集发布，无需人工操作！ 模板特点： 程序伪静态…...

编程日记 2025/7/28 1:10:23

Android Compose 图标按钮深度剖析：从源码到实践(五)

Android Compose 图标按钮深度剖析：从源码到实践一、引言在现代 Android 应用开发中，用户界面的交互性和美观性至关重要。图标按钮作为一种常见的 UI 元素，以其简洁直观的特点，在提升用户体验方面发挥着重要作用。Android Com…...

编程日记 2025/7/25 9:16:39

【Dive Into Stable Diffusion v3.5】2：Stable Diffusion v3.5原理介绍

【Dive Into Stable Diffusion v3.5】系列博文： 第1篇：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练第2篇：Stable Diffusion v3.5原理介绍目录 1 前言1.1 扩散模型的原理1.2 损失函数1.3 加噪流程1.4 推理流程1.5 negative pr…...

编程日记 2025/7/28 9:23:40

WPF 布局舍入（WPF 边框模糊或像素错位的问题）

1. 什么是 WPF 布局舍入？ 在 WPF 开发过程中，可能会遇到界面模糊、边框错位、文本渲染不清晰等问题。这些现象通常是由于 WPF 采用设备无关像素（DIP, Device Independent Pixels），在不同 DPI 设置下，UI 元…...

编程日记 2025/7/30 15:54:46

前端-选中pdf中的文字并使用，显示一个悬浮的翻译按钮（本地pdfjs+iframe）不适用textlayer

使用pdfjs移步– vue2使用pdfjs-dist实现pdf预览（iframe形式，不修改pdfjs原来的ui和控件，dom层可以用display去掉一部分组件） 方案1：获取选择文本内容的最前面的字符坐标的位置（这种写法会导致如果选择超出…...

编程日记 2025/7/27 1:24:32

Mongodb分片模式部署

MongoDB 分片集群部署教程 1. 概述 MongoDB 分片是一种用于处理大规模数据集的集群技术。通过分片，MongoDB 可以将数据分布在多个服务器上，从而提高存储容量和读写性能。本教程将详细介绍如何从零开始部署 MongoDB 分片集群。介绍分片集群中主要由三…...

编程日记 2025/7/27 22:33:25

「一起学后端」Nest.js + MySQL 查询方法教学文档

Nest.js MySQL 查询方法教学文档文章目录 Nest.js MySQL 查询方法教学文档1. 基础 CRUD 操作1.1 创建记录1.2 查询记录1.3 更新记录1.4 删除记录 2. 复杂查询2.1 分页与排序2.2 关联查询（JOIN）2.3 聚合查询2.4 子查询 3. 高级操作3.1 事务处理3.2 Typ…...

编程日记 2025/8/1 9:16:04

基于Spring Boot的企业内管信息化系统的设计与实现（LW+源码+讲解）

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…...

编程日记 2025/7/29 17:58:37

【学习笔记】LLM推理与部署

文章目录 1 [LLMs inference] quantization 量化整体介绍（bitsandbytes、GPTQ、GGUF、AWQ）2 [LLMs inference] quantization 量化整体介绍（bitsandbytes、GPTQ、GGUF、AWQ）3 [LLMs serving] openrouter & vllm host LLM 推理服…...

编程日记 2025/7/30 1:17:36

leetcode-134.加油站

油箱容积无限，要求能环岛，说明总共加起来的油是不少于消耗量的，这是唯一一个决定能否环岛的变量，只要油量够，那么必定有一段路是攒油的路，它供给后续的消耗，使得油箱总是不空。如果油量足够&am…...

编程日记 2025/8/1 13:44:22

companion object和object 从kotlin转java分析

说明 companion object 中 companion类中的方法是普通的方法在外部类中生成静态变量，静态companion 对象 object MyClass2 中类中方法是普通方法在MyClass2中生成静态变量，静态MyClass2对象， 一 companion object 使用 kotlin转java pa…...

编程日记 2025/7/29 19:17:12

检索增强生成（2）本地PDF 本地嵌入模型

from langchain_community.document_loaders import PyPDFLoader from pathlib import Pathdef load_local_pdf(file_path):if not Path(file_path).exists():raise FileNotFoundError(f"文件 {file_path} 不存在！")loader PyPDFLoader(file_path)try:do…...

编程日记 2025/8/1 1:42:23

关于TVS管漏电流的问题？

问题描述： 在量产的带电池故事机生产中，工厂产线测试电流时，有1台机器电流比正常机器大10mA左右。原因分析： 1、分析电路原理图，去除可能出现问题的电压或器件（不影响系统），发现…...

编程日记 2025/7/28 10:20:02

2025前端面试题记录

vue项目目录的执行顺序是怎么样的？ 1、package.json 　　在执行npm run dev时，会在当前目录寻找package.json文件，此文件包含了项目的名称版本、项目依赖等相关信息。 2、webpack.config.js(会被vue-cli脚手架隐藏) 3、vue.config.js 　　对…...

编程日记 2025/8/1 1:42:51

Linux系统docker部署Ollama本地大模型及部署Hugging Face开源模型，ollama相关注意点，非ollama模型创建，模型量化，显存建议

本文主要描述在Linux系统使用docker部署ollama自有模型以及Hugging Face开源模型，也涉及到一些相关注意点，欢迎沟通讨论~ 拉取镜像拉取ollama最新镜像：docker pull ollama/ollama:latest 运行ollama 执行：docker run -d --res…...

编程日记 2025/8/1 22:33:54

解析DeepSeek的技术内核：混合专家架构如何重塑AI效能

MoE架构的技术本质

代码实现示例

效能提升的量化分析

应对MoE架构的技术挑战

MoE架构的未来演进

结语

相关文章：