本地部署DeepSeek开源大模型:从零开始的详细教程
友情提示:本文内容全部由银河易创(https://ai.eaigx.com)AI创作平台deepseek-reasoner模型生成,仅供参考。请根据具体情况和需求进行适当的调整和验证。
近年来,随着人工智能技术的飞速发展,大模型在各个领域展现出了强大的潜力。DeepSeek作为一款开源的大模型,凭借其高性能和灵活性,吸引了众多开发者和研究者的关注。本文将详细介绍如何在本地环境中部署DeepSeek开源大模型,帮助读者快速上手并应用于实际项目中。
1. 环境准备
在开始部署之前,我们需要确保本地环境满足DeepSeek的运行要求。以下是必备的软硬件条件:
1.1 硬件要求
- GPU:至少一块支持CUDA的NVIDIA GPU,显存建议在16GB以上。
- 内存:建议32GB及以上。
- 存储:至少100GB的可用磁盘空间,用于存储模型和数据。
1.2 软件要求
- 操作系统:Linux(推荐Ubuntu 20.04)或Windows 10/11。
- CUDA:建议安装CUDA 11.3及以上版本。
- cuDNN:与CUDA版本对应的cuDNN库。
- Python:Python 3.8或3.9。
- PyTorch:建议安装与CUDA版本兼容的PyTorch 1.10及以上版本。
2. 安装依赖:构建高效运行环境(扩展)
2.1 硬件与软件环境检查
2.1.1 验证GPU与CUDA兼容性
运行以下命令检查CUDA是否已正确安装:
nvidia-smi # 查看GPU信息
nvcc --version # 检查CUDA版本
如果未安装CUDA,请从NVIDIA官网下载对应版本的CUDA Toolkit,并确保安装cudnn
库。
2.1.2 操作系统与Python版本
确认操作系统的Python版本:
python --version # 确保为3.8或3.9
对于Windows用户,推荐使用Anaconda管理Python环境;Linux用户可使用系统自带的包管理器。
2.2 创建并激活虚拟环境
2.2.1 创建虚拟环境
# Linux/MacOS
python -m venv deepseek_env
source deepseek_env/bin/activate# Windows
python -m venv deepseek_env
deepseek_env\Scripts\activate
2.2.2 验证虚拟环境
which python # Linux/MacOS
where python # Windows
确认输出路径包含deepseek_env
,表示虚拟环境已激活。
2.3 安装核心依赖
2.3.1 安装PyTorch
根据CUDA版本选择对应的安装命令。例如,对于CUDA 11.3:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
2.3.2 安装Transformers库
pip install transformers
2.3.3 安装其他依赖
pip install datasets sentencepiece accelerate bitsandbytes
2.4 验证安装
运行以下代码检查核心依赖是否安装成功:
import torch
from transformers import AutoModelForCausalLMprint(torch.cuda.is_available()) # 检查CUDA是否可用
print(AutoModelForCausalLM.from_pretrained("gpt2")) # 测试Transformers库
2.5 常见问题与解决方案
问题1:CUDA不可用
- 原因:未安装或CUDA版本不匹配
- 解决方案:
- 检查
nvidia-smi
与nvcc --version
的版本是否一致 - 重新安装兼容的CUDA和PyTorch
- 检查
问题2:依赖冲突
- 原因:不同库版本不兼容
- 解决方案:使用虚拟环境隔离依赖,或手动指定版本:
pip install transformers==4.30.0 datasets==2.12.0
3. 下载DeepSeek模型:快速获取模型权重
3.1 从Hugging Face获取模型
3.1.1 基础下载方法
使用AutoModelForCausalLM
和AutoTokenizer
下载模型:
from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "deepseek/deepseek-7b"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
3.1.2 指定模型格式
可选择PyTorch或TensorFlow格式:
# PyTorch格式
model = AutoModelForCausalLM.from_pretrained(model_name, use_torch=True)# TensorFlow格式
from transformers import TFAutoModelForCausalLM
model = TFAutoModelForCausalLM.from_pretrained(model_name, from_tf=True)
3.2 加速下载与断点续传
3.2.1 使用本地下载工具
通过aria2
加速下载:
pip install aria2
aria2c -x 16 -s 16 -k 1M https://huggingface.co/deepseek/deepseek-7b/resolve/main/pytorch_model.bin
3.2.2 断点续传
Hugging Face支持断点续传,只需重新运行from_pretrained
即可。
3.3 模型存储路径管理
3.3.1 自定义存储路径
指定本地路径保存模型:
model = AutoModelForCausalLM.from_pretrained(model_name,cache_dir="./local_models"
)
3.3.2 检查模型完整性
# 检查文件大小
du -sh ./local_models/deepseek/deepseek-7b# 校验文件哈希值
sha256sum ./local_models/deepseek/deepseek-7b/pytorch_model.bin
3.4 常见问题与解决方案
问题1:下载速度慢
- 解决方案:
- 使用
aria2
加速 - 更换网络环境或使用代理
- 使用
问题2:磁盘空间不足
- 解决方案:
- 清理临时文件
- 使用符号链接将模型存储到外置硬盘
3.5 进阶技巧
3.5.1 使用Hugging Face CLI
安装并配置Hugging Face CLI:
pip install huggingface_hub
huggingface-cli login
huggingface-cli download deepseek/deepseek-7b pytorch_model.bin
3.5.2 共享模型缓存
在多台设备间共享模型缓存:
export TRANSFORMERS_CACHE="/shared/path/models"
4. 模型推理:解锁大语言模型的核心能力
4.1 基础推理流程与参数解析
在模型下载完成后,以下代码展示了完整的文本生成流程。建议将代码封装为函数以便复用:
def generate_text(prompt, max_length=100, temperature=0.9):# 初始化输入编码inputs = tokenizer(prompt, return_tensors="pt",padding=True,truncation=True,max_length=512 # 避免超过模型最大上下文长度)# 数据转移至GPUinputs = {k: v.to("cuda") for k, v in inputs.items()}# 生成配置参数generation_config = {"max_length": max_length,"temperature": temperature, # 控制随机性:低值保守,高值创意"top_k": 50, # 限制候选词数量"top_p": 0.95, # 核采样:保留累计概率95%的词汇"do_sample": True, # 启用采样模式"num_return_sequences": 1 # 生成结果数量}# 执行生成with torch.no_grad():outputs = model.generate(**inputs, **generation_config)return tokenizer.decode(outputs[0], skip_special_tokens=True)# 使用示例
print(generate_text("量子计算的三大核心优势是:"))
参数调优指南
- **temperature (0.1~1.5)**:
- <0.5:适合事实性问答
- 0.7~1.0:通用场景
-
1.2:创意文本生成
- top_k/top_p:
同时设置top_k=50
和top_p=0.95
可平衡生成质量与多样性
4.2 处理长文本的工程技巧
当处理超过模型上下文长度(如4096 tokens)的文本时,采用分块处理策略:
def process_long_text(text, chunk_size=2000):# 分块处理逻辑chunks = [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]results = []for chunk in chunks:inputs = tokenizer(f"请总结以下内容:{chunk}", # 添加任务指令return_tensors="pt").to("cuda")outputs = model.generate(inputs.input_ids,max_new_tokens=200,repetition_penalty=1.2 # 抑制重复生成)results.append(tokenizer.decode(outputs[0]))return "".join(results)# 使用示例
long_text = open("research_paper.txt").read()
print(process_long_text(long_text))
内存优化技巧
- 量化加载:对于显存不足的情况,使用8bit量化:
model = AutoModelForCausalLM.from_pretrained(model_name,load_in_8bit=True, # 8bit量化device_map="auto" # 自动分配设备 )
- 梯度检查点:
model.gradient_checkpointing_enable()
5. 模型微调:定制专属领域模型
5.1 数据准备与预处理
使用datasets
库处理训练数据,以下示例展示法律文本微调:
from datasets import load_dataset# 加载示例数据集
dataset = load_dataset("json", data_files="legal_cases.json") # 数据预处理函数
def preprocess_function(examples):# 构造指令模板prompts = [f"根据以下案情描述,分析法律适用条款:\n{text}\n答案:" for text in examples["context"]]# 分词处理tokenized = tokenizer(prompts,truncation=True,max_length=1024,padding="max_length")# 添加标签(因果语言建模)tokenized["labels"] = tokenized["input_ids"].copy()return tokenized# 应用预处理
processed_dataset = dataset.map(preprocess_function,batched=True,remove_columns=dataset["train"].column_names
)# 分割数据集
split_dataset = processed_dataset["train"].train_test_split(test_size=0.1)
5.2 高级训练配置
使用TrainingArguments
进行精细控制:
from transformers import TrainingArguments, Trainertraining_args = TrainingArguments(output_dir="./deepseek-7b-finetuned",learning_rate=2e-5, # 推荐学习率范围:1e-5 ~ 5e-5per_device_train_batch_size=2, # 根据显存调整gradient_accumulation_steps=8, # 模拟更大batch sizenum_train_epochs=3,warmup_ratio=0.1, # 预热比例logging_steps=50,evaluation_strategy="steps",eval_steps=200,save_strategy="steps",save_steps=500,fp16=True, # 混合精度训练report_to="tensorboard", # 集成TensorBoardremove_unused_columns=False # 保留原始数据列
)trainer = Trainer(model=model,args=training_args,train_dataset=split_dataset["train"],eval_dataset=split_dataset["test"],data_collator=lambda data: {"input_ids": torch.stack([x["input_ids"] for x in data]),"attention_mask": torch.stack([x["attention_mask"] for x in data]),"labels": torch.stack([x["labels"] for x in data])}
)# 启动训练
trainer.train()# 保存最终模型
model.save_pretrained("./deepseek-7b-legal")
tokenizer.save_pretrained("./deepseek-7b-legal")
5.3 微调后模型的使用
加载自定义模型进行推理:
from transformers import pipeline# 创建推理管道
legal_qa = pipeline("text-generation",model="./deepseek-7b-legal",device=0, # 指定GPU编号torch_dtype=torch.float16 # 半精度推理
)# 使用示例
response = legal_qa("根据《民法典》第一千零七十九条,诉讼离婚的法定条件包括哪些情形?",max_length=300,temperature=0.7
)
print(response[0]["generated_text"])
6. 性能优化:释放硬件潜能(扩展)
6.1 分布式训练加速
混合并行策略
# 在TrainingArguments中启用
training_args = TrainingArguments(...sharded_ddp="simple", # 简单数据并行deepspeed="./ds_config.json" # DeepSpeed配置文件
)
建议创建ds_config.json
文件配置DeepSpeed参数:
{"fp16": {"enabled": true},"optimizer": {"type": "AdamW","params": {"lr": 2e-5}},"zero_optimization": {"stage": 2,"offload_optimizer": {"device": "cpu"}}
}
6.2 注意力机制优化
启用Flash Attention加速:
# 安装flash-attention
pip install flash-attn# 在模型加载时启用
model = AutoModelForCausalLM.from_pretrained(model_name,use_flash_attention_2=True,torch_dtype=torch.float16
)
6.3 显存优化技巧
梯度检查点技术
model.gradient_checkpointing_enable()
动态显存分配
在训练参数中添加:
training_args = TrainingArguments(...gradient_accumulation_steps=4,eval_accumulation_steps=2,fp16=True
)
6.4 推理阶段优化
使用BetterTransformer
from optimum.bettertransformer import BetterTransformermodel = BetterTransformer.transform(model)
量化推理
from transformers import BitsAndBytesConfigquant_config = BitsAndBytesConfig(load_in_4bit=True,bnb_4bit_use_double_quant=True,bnb_4bit_quant_type="nf4",bnb_4bit_compute_dtype=torch.float16
)model = AutoModelForCausalLM.from_pretrained(model_name,quantization_config=quant_config
)
性能优化效果对比
优化技术 | 显存占用 | 训练速度 | 适用场景 |
---|---|---|---|
FP32基础训练 | 48GB | 1x | 小batch调试 |
FP16混合精度 | 24GB | 1.8x | 单卡训练 |
梯度检查点 | 18GB | 0.9x | 长序列处理 |
8bit量化 | 10GB | 0.7x | 低资源推理 |
DeepSpeed Zero-3 | 可扩展至多卡 | 2.5x | 大规模分布式训练 |
7. 总结
通过本文的详细教程,读者应该能够在本地环境中成功部署并运行DeepSeek开源大模型。无论是进行简单的文本生成任务,还是进行复杂的模型微调,DeepSeek都提供了强大的支持。希望本文能帮助开发者更好地利用DeepSeek大模型,推动AI技术的应用与发展。
如果你在部署过程中遇到任何问题,欢迎在评论区留言,或访问DeepSeek的官方GitHub仓库获取更多帮助。
参考文献:
- DeepSeek GitHub Repository
- Hugging Face Model Hub
- PyTorch官方文档
相关链接:
- DeepSeek官方文档
- Hugging Face Transformers库
相关文章:
本地部署DeepSeek开源大模型:从零开始的详细教程
友情提示:本文内容全部由银河易创(https://ai.eaigx.com)AI创作平台deepseek-reasoner模型生成,仅供参考。请根据具体情况和需求进行适当的调整和验证。 近年来,随着人工智能技术的飞速发展,大模型在各个领…...
java项目之基于SSM会议管理系统的设计与实现源码(ssm+mysql)
项目简介 基于SSM会议管理系统的设计与实现实现了以下功能: 基于SSM会议管理系统的设计与实现的主要使用者分为:管理员登录后修改个人的密码。用户管理中,对公司内的用户进行管理,包括会议管理员和员工,管理部门信息…...
PortSwigger——WebSockets vulnerabilities
文章目录 一、WebSockets二、Lab: Manipulating WebSocket messages to exploit vulnerabilities三、Lab: Manipulating the WebSocket handshake to exploit vulnerabilities四、Using cross-site WebSockets to exploit vulnerabilities4.1 跨站WebSocket劫持(cro…...
STM32系统架构介绍
STM32系统架构 1. CM3/4系统架构2. CM3/4系统架构-----存储器组织结构2.1 寄存器地址映射(特殊的存储器)2.2 寄存器地址计算2.3 寄存器的封装 3. CM3/4系统架构-----时钟系统 STM32 和 ARM 以及 ARM7是什么关系? ARM 是一个做芯片标准的公司,…...
智能GUI Agent是什么,有什么应用领域
智能GUI Agent是什么 研究背景与目的:GUI长期主导人机交互,LLM特别是多模态模型的出现,为GUI自动化带来变革,催生了基于LLM的GUI智能体。这些智能体可理解自然语言指令,处理复杂GUI元素并执行操作,改变了用户与软件交互方式。论文旨在梳理该领域发展脉络,剖析关键要素,…...
Python3操作MongoDB批量upsert
个人博客地址:Python3操作MongoDB批量upsert | 一张假钞的真实世界 代码如下: mongoClient MongoClient(mongodb://172.16.72.213:27017/) opsDb mongoClient.ops azScheduled opsDb.azScheduledFlowbulkOpers [] for flow in scheduledFlows.valu…...
3dgs 2025 学习笔记
CVPR 2024 3D方向总汇包含(3DGS、三维重建、深度补全、深度估计、全景定位、表面重建和特征匹配等)_cvpr2024-structure-awaresparse-viewx-ray3dreconstr-CSDN博客 https://github.com/apple/ml-hugs 3DGS COLMAP-Free 3D Gaussian Splatting ⭐code &…...
大模型笔记:pytorch实现MOE
0 导入库 import torch import torch.nn as nn import torch.nn.functional as F 1 专家模型 #一个简单的专家模型,可以是任何神经网络架构 class Expert(nn.Module):def __init__(self, input_size, output_size):super(Expert, self).__init__()self.fc nn.L…...
C#/.NET/.NET Core技术前沿周刊 | 第 25 期(2025年2.1-2.9)
前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。 欢迎投稿、推荐…...
package.json 文件配置
创建 Node.js 的配置文件 package.json npm init -y package.json 文件配置说明 配置说明示例name指定项目的名称,必须是小写字母,可以包含字母、数字、连字符(-)或下划线(_),不能有特殊字符…...
相机模数转换
模拟图像是什么? 模拟图像是指连续变化的图像,它通常来源于现实世界的物理场景,并通过光学系统(如相机镜头)投射到感光介质上。模拟图像是连续的,这意味着它在空间和颜色值上都有无穷的细节。例如…...
mysql大数据量分页查询
一、什么是MySQL大数据量分页查? MySQL大数据量分页查是指在使用MySQL数据库时,将大量数据分成多个较小的部分进行显示,以提高查询效率和用户体验。分页查询通常用于网页或应用程序中,以便用户能够逐步浏览结果集。 二、为什…...
组织结构改革:激活企业活力的 “源头活水”
难以适应市场变化、内部沟通与协作不畅、决策效率低下、运营成本增加、人才流失严重、员工士气下降、战略目标难以实现……企业如何根据市场环境变化和自身发展需求,灵活调整组织框架,赋能企业的持续健康发展? 某国有投资建设集团旗下的二级…...
金融风控项目-1
文章目录 一. 案例背景介绍二. 代码实现1. 加载数据2. 数据处理3. 查询 三. 业务解读 一. 案例背景介绍 通过对业务数据分析了解信贷业务状况 数据集说明 从开源数据改造而来,基本反映真实业务数据销售,客服可以忽略账单周期,放款日期账单金…...
Java常用设计模式面试题总结(内容详细,简单易懂)
设计模式的分类 创建型模式:通过隐藏对象创建的细节,避免直接使用 new 关键字实例化对象,从而使程序在判断和创建对象时更具灵活性。常见的模式包括: 工厂模式抽象工厂模式单例模式建造者模式原型模式 结构型模式:通…...
【Elasticsearch】文本分析Text analysis概述
文本分析概述 文本分析使 Elasticsearch 能够执行全文搜索,搜索结果会返回所有相关的结果,而不仅仅是完全匹配的结果。 如果你搜索“Quick fox jumps”,你可能希望找到包含“A quick brown fox jumps over the lazy dog”的文档,…...
ATF系统安全从入门到精通
CSDN学院课程连接:https://edu.csdn.net/course/detail/39573...
C# 上位机--变量
C# 上位机--变量 在 C# 上位机开发领域,变量是构建程序逻辑的基础元素之一。它就像是一个容器,用于存储各种类型的数据,从简单的数值到复杂的对象。正确理解和使用变量,对于开发出高效、稳定且易于维护的上位机程序至关重要。本文…...
π 的奥秘:如何用有理数逼近无理数?
本文将围绕有理数、无理数、连续统以及它们之间的深刻联系展开讨论,并结合具体的数学理论如康托尔区间套定理、戴德金分割、柯西施瓦茨不等式等,进行简要探讨 由于本文并未深入探讨,可能存在部分不严谨的地方,也欢迎各位进行纠正…...
LeetCode --- 436周赛
题目列表 3446. 按对角线进行矩阵排序 3447. 将元素分配给有约束条件的组 3448. 统计可以被最后一个数位整除的子字符串数目 3449. 最大化游戏分数的最小值 一、按对角线进行矩阵排序 直接模拟,遍历每一个斜对角线,获取斜对角线上的数字,排…...
绘制中国平安股价的交互式 K 线图
在本文中,探索如何使用 Python 的强大库进行股市数据分析与可视化。我们将以中国平安(股票代码:sh601318)为例,展示如何获取其股票数据,并绘制一张交互式 K 线图。 K 线图是股市分析中不可或缺的工具,它能够直观地显示股票的波动情况,包括开盘价、收盘价、最高价和最低…...
【ISO 14229-1:2023 UDS诊断全量测试用例清单系列:第二节】
ISO 14229-1:2023 UDS诊断服务测试用例全解析(ECU复位0x11服务) 作者:车端域控测试工程师 更新日期:2025-02-12 关键词:UDS诊断协议、ECU复位服务、0x11服务、ISO 14229-1:2023 二、ECU复位服务(0x11服务&…...
Unity URP的2D光照简介
官网工程,包括2d光照,动画,动效介绍: https://unity.com/cn/blog/games/happy-harvest-demo-latest-2d-techniques https://docs.unity3d.com/6000.0/Documentation/Manual/urp/Lights-2D-intro.html 人物脸部光照细节和脚上的阴影…...
自学人工智能大模型,满足7B模型的训练和微调以及推理,预算3万,如何选购电脑
如果你的预算是 3万元人民币,希望训练和微调 7B 参数规模的人工智能大模型(如 LLaMA、Mistral 等),你需要一台高性能的深度学习工作站。在这个预算范围内,以下是推荐的配置: 1. 关键硬件配置 (1) GPU (显卡…...
shell脚本自动安装MySQL8
环境:centos7版本:8.0.28安装包:mysql-8.0.28-linux-glibc2.12-x86_64.tar.xz 二进制包要求:安装包和shell脚本在同一目录下执行方式:sudo ./install_mysql8.sh #!/bin/bash# 定义MySQL安装目录和压缩包名称MYSQL_DIR…...
使用亚马逊针对 PyTorch 和 MinIO 的 S3 连接器进行模型检查点处理
2023 年 11 月,Amazon 宣布推出适用于 PyTorch 的 S3 连接器。适用于 PyTorch 的 Amazon S3 连接器提供了专为 S3 对象存储构建的 PyTorch 数据集基元(数据集和数据加载器)的实现。它支持用于随机数据访问模式的地图样式数据集和用于流式处理…...
DeepAR:一种用于时间序列预测的深度学习模型
介绍 DeepAR是一种基于递归神经网络(RNN)的时间序列预测模型,由亚马逊在2017年提出。它特别适用于处理多变量时间序列数据,并能够生成概率预测。DeepAR通过联合训练多个相关时间序列来提高预测性能,从而在实际应用中表…...
【无标题】《On Java中文版基础卷+进阶卷》书评
Java语言作为最热门的编程语言之一,关于Java语言的书更是数不胜数,而我选择这本《On Java中文版基础卷进阶卷》作为我学习Java语言的工具书。这本书的作者是《Java编程思想》的Bruce Eckel,《Java编程思想》在之前可谓是鼎鼎有名,…...
【鸿蒙开发】第二十九章 Stage模型-应用上下文Context、进程、线程
目录 1 Stage模型基本概念 1.1 开发流程 3 应用上下文Context的典型使用场景 3.1 获取应用文件路径 3.2 获取和修改加密分区 3.3 获取本应用中其他Module的Context 3.4 订阅进程内UIAbility生命周期变化 4 进程 4.1 概述 5 线程 5.1 线程类型 5.2 使用EventHub进行线…...
AI-Engine-Direct-Helper 快速上手及环境配置
AI-Engine-Direct-Helper 是一个强大的工具,旨在简化和加速在 Qualcomm 平台上开发 AI 应用的过程。通过提供统一的 API、跨平台支持和高效的执行性能,它为开发者提供了一个灵活且高效的开发环境。如果您正在使用 Qualcomm 平台进行 AI 开发,…...
网络安全产品架构图 网络安全相关产品
一、信息安全产品分类 背景 美国将网络和信息安全产品分了9类:鉴别、访问控制、入侵检测、防火墙、公钥基础设施、恶意程序代码防护、漏洞扫描、取证、介质清理或擦除。中国公安部将网络和信息安全产品分了7类:操作系统安全、数据库安全、网络安全、病毒…...
日常知识点之面试后反思裸写string类
1:实现一个字符串类。 简单汇总 最简单的方案,使用一个字符串指针,以及实际字符串长度即可。 参考stl的实现,为了提升string的性能,实际上单纯的字符串指针和实际长度是不够了,如上,有优化方案…...
Linux(socket网络编程)TCP连接
Linux(socket网络编程)TCP连接 基础文件目录函数系统进程控制函数fork()exec系列函数void abort(void)void assert(int expression)void exit(int status)void _exit(int status)int atexit(void (*func)(void))int on_exit(void (*function)(int,void*)…...
深入 JVM 虚拟机:字符串常量池演变与 intern() 方法工作原理解析
🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template 🌺 仓库主页: GitCode︱ Gitee ︱ Github 💖 欢迎点赞 👍 收藏 ⭐评论 📝 如有错误敬请纠正! 前言 在 Java 开发中,字符串常量池(String Constant…...
从零开始学习人工智能
从零开始学习人工智能可以按照以下步骤进行: 一、了解人工智能的基本概念 学习内容:了解人工智能的定义、发展历程、主要研究方向(如机器学习、深度学习、自然语言处理、计算机视觉等)、常见应用(如语音识别、图像识别…...
解锁电商数据宝藏:淘宝商品详情API实战指南
在电商蓬勃发展的今天,数据已成为驱动业务增长的核心引擎。对于商家、开发者以及数据分析师而言,获取精准、实时的商品数据至关重要。而淘宝,作为国内最大的电商平台,其海量商品数据更是蕴含着巨大的价值。 本文将带你深入探索淘…...
Gui-Guider1.8.1 数字时钟控件找不到定义,无法编译
我们在Gui-Guider中使用的一些控件,生成后会发现在LVGL源码中找不到该控件的定义,这时因为Gui-Guider中的一些控件是其自己编写的而不是LVGL提供的,那么我们该如何应用呢?这里拿Digital Clock数字时钟控件举例: 这里我…...
多模态模型详解
多模态模型是什么 多模态模型是一种能够处理和理解多种数据类型(如文本、图像、音频、视频等)的机器学习模型,通过融合不同模态的信息来提升任务的性能。其核心在于利用不同模态之间的互补性,增强模型的鲁棒性和准确性。 如何融合…...
Unity3D实现显示模型线框(shader)
系列文章目录 unity工具 文章目录 系列文章目录👉前言👉一、效果展示👉二、第一种方式👉二、第二种方式👉壁纸分享👉总结👉前言 在 Unity 中显示物体线框主要基于图形渲染管线和特定的渲染模式。 要显示物体的线框,通常有两种常见的方法:一种是利用内置的渲染…...
【实测】用全志A733平板搭建一个端侧Deepseek算力平台
随着DeepSeek 的蒸馏技术的横空出世,端侧 SoC 芯片上运行大模型成为可能。那么端侧芯片跑大模型的效果如何呢?本文将在全志 A733 芯片平台上部署一个 DeepSeek-R1:1.5B 模型,并进行实测效果展示。 端侧平台环境 设备:全志A733平板…...
新数据结构(7)——Object
Object类是所有类的父类,在 Java 中,每个类都直接或间接地继承自Object类,也就是说所有类都是object类的子类可以使用Object里的方法。 equals()和hashCode()是Java中Object类所包含的两个关键方法,下面将介绍两个方法。 和equa…...
数据结构-栈和队列的应用
目录 前言一、栈的应用(迷宫问题)1.1 问题描述1.2 算法选择1.3 算法精化1.4 算法实现1.5 问题结果 二、队列的应用(农夫过河问题)2.1 问题描述2.2 算法选择2.3 算法精化2.4 算法实现2.5 问题结果 总结 前言 本篇文章使用两个例子…...
【JavaScript】异步编程汇总
异步编程解决方案: 回调函数PromiseGeneratorawait / async 回调函数 回调函数是早期处理异步编程的主要方式,虽然它本身存在很多的缺陷,比如那个时候对于复杂的异步处理常常会出现回调地狱。 但是因为 JavaScript 中当时并没有很好的API来帮…...
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
前序文章 【AI系列】从零开始学习大模型GPT (1)- Build a Large Language Model (From Scratch) Build a Large Language Model 背景第1章:理解大型语言模型第2章:处理文本数据第3章:编码Attention机制什么是Attention机制?Attention机制的基本原理数学表示应用总结为什么要…...
动态规划——路径问题②
文章目录 931. 下降路径最小和算法原理代码实现 64. 最小路径和算法原理代码实现 174. 地下城游戏算法原理代码实现 931. 下降路径最小和 题目链接:931. 下降路径最小和 算法原理 状态表示: 经验题目要求:dp[i][j]表示到达[i,j]位置时&…...
【每日关注】科技圈重要动态
时代新动态 2025 年 2 月 12 日科技圈重要动态总结全球 AI 治理新进展巴黎 AI 宣言签署,美英缺席 科技巨头合作与竞争苹果联姻阿里开发中国版AI功能DeepSeek生态持续扩展OpenAI拒绝马斯克收购,矛盾公开化 汽车行业动态小米汽车销量跃居新势力第二比亚迪智…...
Postgresql的三种备份方式_postgresql备份
这种方式可以在数据库正在使用的时候进行完整一致的备份,并不阻塞其它用户对数据库的访问。它会产生一个脚本文件,里面包含备份开始时,已创建的各种数据库对象的SQL语句和每个表中的数据。可以使用数据库提供的工具pg_dumpall和pg_dump来进行…...
Linux 配置 MySQL 定时自动备份到另一台服务器
Linux 配置 MySQL 定时自动备份到另一台服务器这里写自定义目录标题 前言1、配置服务器通信1.1:配置过程 2、编写自动备份sh脚本文件3:设置定时自动执行 前言 此方案可使一台服务器上的 MySQL 中的所有数据库每天 0 点自动转储为 .sql 文件,…...
CCF-GESP 等级考试 2024年6月认证C++二级真题解析
2024年6月真题 一、单选题(每题2分,共30分) 正确答案:C 考察知识点:计算机基础与编程环境 解析:CCF 组织的 GESP 认证考试第 1 级可选择的认证语言有 Scratch、Python、C ,共 3 种。答案为C。 …...
vm虚拟机的一些操作命令
PowerShell命令 // 获取虚拟机列表: get-vm // 创建虚拟机: new-vm -Name "BrioDev75" -MemoryStartupBytes 16GB -Path "D:\Hyper-V" // 删除虚拟机: remove-vm -Name "BrioDev75" -Force (-Force参数是…...