当前位置: 首页 > news >正文

【翻译+论文阅读】DeepSeek-R1评测:粉碎GPT-4和Claude 3.5的开源AI革命

目录

  • 一、DeepSeek-R1 势不可挡
  • 二、DeepSeek-R1 卓越之处
  • 三、DeepSeek-R1 创新设计
  • 四、DeepSeek-R1 进化之路
    • 1. 强化学习RL代替监督微调学习SFL
    • 2. Aha Moment “啊哈”时刻
    • 3. 蒸馏版本仅采用SFT
    • 4. 未来研究计划

部分内容有拓展,部分内容有删除,与原文会有差异,建议结合原文、参考及视频整体阅读。
英文标题:Deepseek-R1 Review : Open Source AI Revolution Crushing GPT-4 and Claude 3.5
原文链接:https://www.geeky-gadgets.com/deepseek-r1-review/
创作者:Julian Horsey
发布时间:2025.1.28
视频来源:《Deepseek-R1 (Tested): BEST LLM EVER That’s Opensource? AGI IS HERE! (Beats O1 & 3.5 Sonnet)》(YouTube,链接不挂了,自行搜索WorldofAI)
参考文献包括但不限于:

  • DeepSeek-AI, “DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,” 2025.
  • deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别?
  • 全世界最强的算法平台codeforces究竟有什么魅力?
  • David Rein, B., et al, “GPQA: A Graduate-Level Google-Proof Q&A Benchmark,” 2023. Hunter Lightman, V., et al, “Let’s Verify Step by Step,” 2023.
  • https://paperswithcode.com/dataset/mmlu
  • Carlos E. Jimenez, J., et al, “SWE-bench: Can Language Models Resolve Real-World GitHub Issues?,” 2024.

在这里插入图片描述

一、DeepSeek-R1 势不可挡

新的AI大模型 Deepseek-R1 正在席卷全球,为开源大型语言模型(LLMs)树立了新的基准。该模型在多个任务上与 OpenAI O1、GPT-4 Omni 和 Claude 3.5 Sonnet 等有与之相当甚至更为优秀的表现。基于MIT 许可证(更宽松的软件许可)、经济实惠性和先进的功能,Deepseek-R1 正在改变 AI 技术的可访问性和实际应用。在World of AI 的这篇深入评测视频中,可以从更专业角度了解这个新开源的 AI 模型。
Deepseek-R1 在编程、数学和多语言任务等关键领域超越行业巨头 OpenAI 的 O1 和 GPT-4 Omni,证明了开源创新(open source innovation)可以与专有解决方案(proprietary solutions)相媲美,甚至超越它们。
在这里插入图片描述

在这里插入图片描述

问:
如何衡量大模型在各个任务上的性能?测试数据库如何构建?上面的条形图中横坐标都是针对什么领域的测试数据集?
答:

  1. 性能评估:让模型尝试解决这些问题,记录正确性或得分,如果是程序,则验证是否可以正确运行并解决问题。
  2. 数据库构建:收集问题👉问题预处理(格式化、清洗、标注正确答案)👉数据库更新;
  3. 条图横坐标:Pass@1表示第一次尝试就正确解决问题的比例;Percentile表示百分比。
    3.1 AIME 2024 (American Invitational Mathematics Examination 2024):美国人邀请赛数学竞赛。该竞赛由美国数学协会(MAA)管理。AIME是通往美国数学奥林匹克竞赛(USAMO)或美国初级数学奥林匹克竞赛(USAJMO)的第二阶段考试,这些竞赛是选拔参加国际数学奥林匹克(IMO)队伍的系列考试的一部分。AIME包括15个问题,考试时间为3小时,每个答案都是一个介于0到999之间的整数。旨在挑战学生的数学问题解决能力,涵盖算术、代数、计数、几何、数论和概率等中学数学主题。通常,考试中的问题需要创造性地使用中学课程知识,或者理解不同数学领域如何结合在一起来调查和解决问题。错误答案不会扣分,但正确答案会获得一分,因此最高分是15分。
    3.2 Codeforces :国外著名编程竞赛平台,评估大模型的算法和编程能力。2小时竞赛,每周一两次,代码和程序均公开(很有意思的网站),题目兼容并蓄,思维陷阱较多。
    3.3 GPOA Diamond :由198个问题组成的高质量问答数据集,仅包括专家正确答案和大多数非专家的问题。与主集GPQA(由生物学,物理和化学专家撰写的448个多项选择问题)类似,还包括第二个专家验证者犯有可证明的错误的问题。但是,Diamond的要求更加严格,要求第一个专家验证者必须正确回答,然后第二个专家验证者错误回答,但他们清楚地描述了对问题作者的解释的错误或理解。
    3.4 Math 500:OpenAI在其Let‘s Verify Step by Step论文中的作为数学基准的评估子集,包含500个问题。
    3.5 MMLU(Massive Multitask Language Understanding):大规模多任务语言理解,基准涵盖了跨STEM,人文,社会科学等57个主题。它的难度从基础级别到高级专业水平,并且可以测试世界知识和解决问题的能力。paperwithcode上的leaderboard还没更新。
    3.6 SWE-bench:涉及软件工程(SWE)相关的基准测试,"Resolved"表示模型成功解决的问题比例。该框架由2,294个软件工程问题组成,包含来自12个流行的Python存储库中的GitHub问题,这些存储库报告了错误或请求新功能,并提取对存储库进行更改以解决这些问题的请求。

但真正让 Deepseek-R1 独树一帜的不仅仅是它的性能,还有它的可访问性和经济实惠性。上周末,DeepSeek App下载量在 Android 和 Apple 应用商店中均位居第一,受欢迎程度足以体现。无论是寻找成本效益高的工具的独立开发者,还是寻求可扩展 AI 解决方案的组织,Deepseek-R1 都提供了一个让先进AI技术触手可及的未来。

二、DeepSeek-R1 卓越之处

  • Deepseek-R1 作为新的开源 AI 大模型,在多个任务上与 OpenAI O1、GPT-4 Omni 和 Claude 3.5 Sonnet 等有与之相当甚至更为优秀的表现。
  • 该模型使用 MIT 许可证,比 OpenAI O1 等专有模型便宜 30 倍,比 ChatGPT 成本效益高 96.4%。
  • 该模型支持高达 128k 的令牌数用于处理大规模数据集,并通过 API、LM Studio 和本地工具(如 Ollama)提供部署灵活性(最大生成长度为32768个tokens )
  • 提供基于OWEN的蒸馏版本,开放适用于要求响应速度快、硬件资源有限的1.5B-7B版本、适用于对模型性能有要求但无超高配置的8B-14B版本、以及适用于专业问答系统、中规模创作平台的32B-70B版本,满足多样化用户需求。
  • 其先进功能涵盖编码、数学、多语言处理、设计和总结,使其成为开发者、研究人员和跨行业组织的多功能工具。

蒸馏版本模型性能对比
在这里插入图片描述

没有人比我的MateBook2018D性能还要差的电脑吧,我测试了下本地部署,7B运转很慢,1.5B速度与网页访问答题一样。最大的优点是不会因为服务器繁忙而卡住,还可以创建私人管家,当然回答的准确性比不上671B模型。

三、DeepSeek-R1 创新设计

DeepSeek-R1 的卓越表现植根于其创新架构和先进的训练方法。
(这一段作者笔误或者错误描述了训练阶段,故删除并重新整理)
该模型的核心创新体现在群体相对策略优化(GRPO)和强化学习的多阶段训练方法上,其训练分为四个阶段:

  1. 冷启动:构建并收集了少量的长COT数据,通过监督微调(SFT)作为初始RL Actor,提升基础模型的可读性;
  2. 面向推理的增强学习:着重于增强模型的推理能力,尤其是在诸如编码,数学,科学和逻辑推理等推理密集型任务中,这些任务涉及清晰解决方案的明确问题。为减轻语言混合问题,引入语言一致性奖励;
  3. 拒绝抽样和监督微调:利用所得检查点收集SFT(有监督的微调)数据,以进行后续回合。与主要侧重于推理的初始冷启动数据不同,此阶段包含了来自其他域的数据,以增强模型在书写,角色扮演和其他通用任务中的功能;
  4. 所有情况加强学习:再次结合基于规则和结果的奖励模型,使用GRPO进行优化,以在复杂和细微的方案中捕获人类的偏好。为了结果有帮助,专注于最终摘要,确保评估强调对用户响应的效用和相关性,同时最大程度地减少对基本推理过程的干扰。对于无害性,评估了模型的全部响应,包括推理过程和摘要,以识别和减轻在生成过程中可能出现的任何潜在风险,偏见或有害内容。

DeepSeek-R1正式确诊为“为人民服务”!

Deepseek-R1 最吸引人的地方之一是其可访问性。它在 MIT 许可证下发布,可供个人、开发者和组织免费使用,这种开源精神与通常伴随高成本和限制性使用条款的专有模型形成了鲜明对比 :)

四、DeepSeek-R1 进化之路

翻译原文无此部分,为论文阅读+个人理解
论文里描述了DeepSeek-R1-Zero和DeepSeek-R1的设计框架和任务性能。前者表现出强大而有趣的推理性能,但是也遇到了挑战,包括可读性差和语言混合;为了解决这些问题并进一步提高性能,DeepSeek-R1诞生,在强化学习之前结合了多阶段训练和冷启动数据。

1. 强化学习RL代替监督微调学习SFL

强化学习基本框架

  • Agent:ML 算法(或自治系统)
  • Environment:具有变量、边界值、规则和有效操作等属性的自适应问题空间
  • Action:Agent在Environment中导航时采取的步骤
  • State:给定时间点的环境
  • Reward:执行Action的正值、负值或零值,即奖励或惩罚

DeepSeek-R1使用的强化学习框架为GRPO(Group Relative Policy Optimization)(Shao et al., 2024),探讨了LLM在没有任何监督数据的情况下发展推理能力的潜力,着重于模型自身的进化。在奖励方面,DeepSeek-R1-Zero采用了基于规则的奖励系统,由准确性奖励和格式奖励共同构成。准确性奖励评估响应是否正确,格式奖励则强调使用在< think > < /think >描述思维过程。这种结构的好处是避免了特定于内容的偏见,例如强制反思性推理或促进特定的问题解决策略,并能够准确观察模型的自然发展(开了上帝视角去理解生物为什么、怎么样进化)。为了避免大规模黑客攻击和降低重训练成本,不采用过程奖励或者回答奖励。

< think >< /think >,我理解即将Chain-of-Thought(COT)思维链显示地提供给用户,KIMI的k1.5 loong thinking也支持,相较于DP比较口语化,速度快,能够自行折叠,产品体验上比DP好,但是编程性能次之)。
强制反思性推理,指在生成回答前,检查问题逻辑、选择回答策略、定制回答风格等等,可能需要更多的算力支撑,减少了错误和偏见,但是对于一味求快求解的用户来说并不好用。
特定于内容的偏见,偏向于某一种特定的问题解决方法,例如:教导学生只用节点法做电路题目,在绘制等效电路图、分析串并联时比较容易,但对于实物连接,就没有必要甚至会带来困惑。

2. Aha Moment “啊哈”时刻

在训练的中间阶段,DeepSeek-R1-Zero学会通过重新评估其初始方法来分配更多的思维时间来解决问题,适用拟人化音调重新考虑(Like人类在滔滔不绝中突然说:“等等,我想到了另一点”,而非按照旧的思路说到底,这一点实在非常可爱)。
在这里插入图片描述

3. 蒸馏版本仅采用SFT

蒸馏版本如前面的1.5B、70B,是直接用R1的800K样本微调开源的Qwen和Llama两个较小规模的LLM,且仅应用SFT,不包含RL阶段。其中,1.5B版本在数学基准评估上能过胜过GPT-4o和Claude 3.5 Sonnet(本地部署的孩子,数学作业有救了)。作者表示主要是展示有效性,并希望专业研究进一步探索RL阶段。通过对比大模型蒸馏后与不蒸馏使用大规模RL训练的小模型,发现后者的性能并不如前者,尽管蒸馏策略经济有效,但想要突破上限需要更大的基础模型及大规模RL。

4. 未来研究计划

  • 基于COT高效增强在函数调用、多轮问答(multi-turn)、复杂角色扮演以及JSON程序输出等任务上的处理效果;
  • 突破除了中文和英文外,其他语言混合问题的限制;
  • 提示敏感问题(改变Prompt的措辞、结构、内容会导致生成的回答截然不同),只让模型进行一次尝试(one-shot)时,生成的答案容易出错;而多次尝试(multi-shot)并尝试后验证并调整,生成的答案更加准确。作者建议直接描述问题,采用zero-shot(直接告诉任务,不提供任何示例),让模型只依赖于预训练结果。
  • 软件工程任务验证时间较长,影响RL效率。未来会使用拒绝采样、异步评估来提升效率。

相关文章:

【翻译+论文阅读】DeepSeek-R1评测:粉碎GPT-4和Claude 3.5的开源AI革命

目录 一、DeepSeek-R1 势不可挡二、DeepSeek-R1 卓越之处三、DeepSeek-R1 创新设计四、DeepSeek-R1 进化之路1. 强化学习RL代替监督微调学习SFL2. Aha Moment “啊哈”时刻3. 蒸馏版本仅采用SFT4. 未来研究计划 部分内容有拓展&#xff0c;部分内容有删除&#xff0c;与原文会有…...

前缀和练习——洛谷P8218:求区间和

题目: 这道题很简单&#xff0c;直接根据题目无脑套公式 代码&#xff1a; #include<bits/stdc.h> using namespace std; const int N 1e5 9; using ll long long; ll a[N], perfix[N]; int main() {ios::sync_with_stdio(0), cin.tie(0), cout.tie(0);//取消同步输…...

uv 安装包

是的&#xff0c;你可以使用 uv 来安装 Python 包。uv 是一个高性能的 Python 包安装器和解析器&#xff0c;由 astral.sh 团队开发&#xff0c;旨在替代 pip 和 pip-tools&#xff0c;提供更快的包安装体验。 ### 如何使用 uv 安装包 1. **安装 uv**&#xff1a; 如果你还…...

【机器学习】训练(Training)、验证(Validation)和测试(Testing)

机器学习中训练(Training)、验证(Validation)和测试(Testing)这三个阶段的作用和关系。 1. 训练阶段 (Training) - 使用训练集数据来训练模型 - 模型通过学习训练数据的特征和模式来调整其内部参数 - 这个阶段模型会不断优化以减少预测误差 - 通常使用最大的数据集比例&…...

3. k8s二进制集群之负载均衡器高可用部署

Haproxy 和 Keepalived安装Haproxy配置文件准备Keepalived配置及健康检查启动Haproxy & Keepalived服务继续上一篇文章《K8S集群架构及主机准备》,下面介绍负载均衡器搭建过程 Haproxy 和 Keepalived安装 在负载均衡器两个主机上安装即可 apt install haproxy keepalived…...

C++游戏开发实战:从引擎架构到物理碰撞

&#x1f4dd;个人主页&#x1f339;&#xff1a;一ge科研小菜鸡-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 1. 引言 C 是游戏开发中最受欢迎的编程语言之一&#xff0c;因其高性能、低延迟和强大的底层控制能力&#xff0c;被广泛用于游戏…...

MSPFN 代码复现

1、环境配置 conda create -n MSPFN python3.9 conda activate MSPFN pip install opencv-python pip install tensorflow pip install tqdm pip install matplotlib2、train 2.1 创建数据集 2.1.1 数据集格式 |--rainysamples |--file1&#xff1a; |--file2:|--fi…...

[c语言日寄]浮点数在内存中的储存

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋&#xff1a;这是一个专注于C语言刷题的专栏&#xff0c;精选题目&#xff0c;搭配详细题解、拓展算法。从基础语法到复杂算法&#xff0c;题目涉及的知识点全面覆盖&#xff0c;助力你系统提升。无论你是初学者&#xff0c;还是…...

PySpark学习笔记5-SparkSQL

sparkSql的数据抽象有两种。 一类是data set适用于java和Scala 一类是data frame适用于java&#xff0c;Scala&#xff0c;python 将r d d转换为data frame #方式一 df spark.createDataFrame(rdd,schema[name,age]) #方式二 schema Structtype(). add(id,integertype(),nu…...

支持 APQP (先期产品质量策划) 的软件系统-汽车电子行业专用研发管理信息化平台

支持 APQP (先期产品质量策划) 的软件系统 在制造业竞争白热化的当下&#xff0c;产品质量已然成为企业立足市场的核心竞争力。APQP&#xff08;先期产品质量策划&#xff09;作为保障产品质量的关键流程&#xff0c;贯穿于产品从概念萌生到最终交付的整个生命周期&#xff0c…...

配置@别名路径,把@/ 解析为 src/

路径解析配置 webpack 安装 craco npm i -D craco/craco 项目根目录下创建文件 craco.config.js &#xff0c;内容如下 const path require(path) module.exports {webpack: {// 配置别名alias: {// 约定&#xff1a; 使用 表示src文件所在路径: path.resolve(__dirname,src)…...

以为是响应式对象丢失导致数据没有回显

背景&#xff1a;之前ruoyi生成的vue2代码&#xff0c; <el-form ref“form”&#xff0c;后面我改成vue3的写法&#xff0c;没有实例化form&#xff0c; 在vue3中是需要定义const form ref(); 导致点击了修改后&#xff0c;页面弹框显示出来&#xff0c;数据没有回显。 一直…...

【汇编语言】直接定址表(二)—— 「代码‘导航员’:直接定址表的功能与应用」

文章目录 前言1. 直接定址表1.1 问题引入&#xff08;一&#xff09;—— 为算法清晰而查表1.2 分析与解决问题1.2.1 两个十六进制表示一个字节1.2.2 得到数值对应的数码字符1.2.2.1 最粗暴的方法——比较1.2.2.2 使用映射关系来解决1.2.2.3 存在的问题及解决 1.3 得到子程序1.…...

05vue3实战-----配置项目代码规范

05vue3实战-----配置项目代码规范 1.集成editorconfig配置2.使用prettier工具2.1安装prettier2.2配置.prettierrc文件&#xff1a;2.3创建.prettierignore忽略文件2.4VSCode需要安装prettier的插件2.5VSCod中的配置2.6测试prettier是否生效 3.使用ESLint检测3.1VSCode需要安装E…...

不含101的数

不含101的数 真题目录: 点击去查看 E 卷 200分题型 题目描述 小明在学习二进制时&#xff0c;发现了一类不含101的数&#xff1a; 将数字用二进制表示&#xff0c;不能出现 101 。 现在给定一个整数区间 [l,r] &#xff0c;请问这个区间包含了多少个不含 101 的数&#xff…...

Linux/C高级(精讲)----shell结构语句、shell数组

shell脚本 功能性语句 test 可测试对象三种&#xff1a;字符串 整数 文件属性 每种测试对象都有若干测试操作符 1&#xff09;字符串的测试&#xff1a; s1 s2 测试两个字符串的内容是否完全一样 s1 ! s2 测试两个字符串的内容是否有差异 -z s1 测试s1 字符串的长度是…...

基于微信小程序的消防隐患在线举报系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…...

java基础2(黑马)

一、变量里的数据在计算机中的存储原理 1.二进制 .二进制&#xff1a;只有0、1&#xff0c; 按照逢二进一的方式表示数据。 十进制数字11转换为&#xff1a;1011 方法&#xff1a;除二取余法 计算机中表示数据的最小单元&#xff0c;一个字节&#xff08;Byte&#xff0c;简…...

计算机中数值表示:原码、反码、补码与移码

1 前言 计算机科学中&#xff0c;数字的表示方式至关重要&#xff0c;因为计算机内部只能识别处理二进制数据。为了在计算机中实现对整数的表示&#xff0c;提出了多种数值编码方式&#xff0c;其中最常用的是原码、反码、补码和移码。 2 原码 2.1 原码的定义 原码(Signed …...

1.8 组合模式(Composite Pattern)

定义 组合模式&#xff08;Composite Pattern&#xff09; 是一种结构型设计模式&#xff0c;它将对象组合成树形结构以表示“部分-整体”的层次结构。组合模式让客户端可以以相同的方式对待单个对象和对象集合。组合模式使得客户可以统一处理树形结构中的单个对象和对象的集合…...

QFileDialog::getOpenFileName(this,“文件对话框“,“.“,“c++ files(*.cpp);;“); 文件对话框显示乱码

在使用 QFileDialog::getOpenFileName 时&#xff0c;如果文件对话框显示乱码&#xff0c;通常是因为编码问题。Qt 默认使用 UTF-8 编码&#xff0c;但如果你的系统或源代码文件的编码不一致&#xff0c;可能会导致乱码。 以下是几种可能的解决方法&#xff1a; 1. 确保源代码…...

【C语言系列】深入理解指针(5)

深入理解指针&#xff08;5&#xff09; 一、sizeof和strlen的对比1.1sizeof1.2strlen1.3sizeof和strlen的对比 二、数组和指针笔试题解析2.1 一维数组2.2 字符数组2.2.1代码1&#xff1a;2.2.2代码2&#xff1a;2.2.3代码3&#xff1a;2.2.4代码4&#xff1a;2.2.5代码5&#…...

为什么使用nohup 和 启动的python脚本,日志没有在nohup.out中

当你使用 nohup 和 & 启动 Python 脚本时&#xff0c;输出通常会被重定向到 nohup.out 文件&#xff0c;但是有几个原因可能导致日志没有出现在这个文件中&#xff1a; Python 程序的输出被重定向了&#xff1a; 如果你的 Python 脚本中使用了 sys.stdout 或 sys.stderr 进…...

MySQL的存储引擎对比(InnoDB和MyISAM)

InnoDB 特点&#xff1a; 事务支持&#xff1a;InnoDB 是 MySQL 默认的事务型存储引擎&#xff0c;支持 ACID&#xff08;原子性、一致性、隔离性、持久性&#xff09;事务。行级锁定&#xff1a;支持行级锁&#xff0c;能够并发执行查询和更新操作&#xff0c;提升多用户环境…...

uniapp访问django目录中的图片和视频,2025[最新]中间件访问方式

新建中间件, middleware.py 匹配,以/cover_image/ 开头的图片 匹配以/episode_video/ 开头的视频 imageSrc: http://192.168.110.148:8000/cover_image/12345/1738760890657_mmexport1738154397386.jpg, videoSrc: http://192.168.110.148:8000/episode_video/12345/compres…...

Python递归复习题

寒假打卡第二十一天&#xff0c;当前mit6.100L进度(16/26) &#xff0c;今天补一下递归复习题。 问题1&#xff1a;编写一个递归程序来计算正和n&#xff08;n-2&#xff09;&#xff08;n-4&#xff09;的整数&#xff08;直到且不包括n-x<0&#xff09; def sum_series(n…...

2025 年前端开发趋势展望,开启新征程

新年伊始&#xff0c;作为一名深耕 Web 前端开发领域的博主&#xff0c;我迫不及待地想和大家分享我对 2025 年前端开发趋势的洞察。过去一年里&#xff0c;前端领域的技术创新和变革令人目不暇接&#xff0c;而新的一年&#xff0c;更是充满无限可能。 框架与工具的持续演进 …...

90,【6】攻防世界 WEB Web_php_unserialize

进入靶场 进入靶场 <?php // 定义一个名为 Demo 的类 class Demo { // 定义一个私有属性 $file&#xff0c;默认值为 index.phpprivate $file index.php;// 构造函数&#xff0c;当创建类的实例时会自动调用// 接收一个参数 $file&#xff0c;用于初始化对象的 $file 属…...

Redis --- 使用GEO实现经纬度距离计算

什么是GEO&#xff1f; Spring Boot 项目中可以通过 Spring Data Redis 来使用 Redis GEO 功能&#xff0c;主要通过 RedisTemplate 和 GeoOperations 接口来操作地理位置数据。 Service public class GeoService {Autowiredprivate RedisTemplate<String, Object> red…...

同步 CDC

同步 CDC 当设计包括来自同一 MMCM/PLL 的时钟之间的同步 CDC 路径时&#xff0c;您可以使用以下技术来更好地控制时钟插入延迟和 时滞&#xff0c;并因此控制这些路径上的松弛。 重要提示&#xff1a; 如果 CDC 路径在源自不同 MMCM/PLL 的时钟之间&#xff0c;则跨越 …...

Linux环境下载Ollama慢或卡顿解决方案

一、下载方式 官方下载方式是到ollama官网下载ollama: https://ollama.com/ 复制下载链接执行&#xff1a; curl -fsSL https://ollama.com/install.sh | sh二、卡顿现象 执行后经常会出现下载失败或者进度条特别慢的情况&#xff0c;甚至直接退出下载&#xff1a; 三、…...

生成式AI安全最佳实践 - 抵御OWASP Top 10攻击 (下)

今天小李哥将开启全新的技术分享系列&#xff0c;为大家介绍生成式AI的安全解决方案设计方法和最佳实践。近年来生成式 AI 安全市场正迅速发展。据IDC预测&#xff0c;到2025年全球 AI 安全解决方案市场规模将突破200亿美元&#xff0c;年复合增长率超过30%&#xff0c;而Gartn…...

2025年家用音响市场分析:潜力无限,音质为王的新纪元

引言&#xff1a;音质革命引领市场新风尚 在数字化浪潮的推动下&#xff0c;家用音响市场正经历一场前所未有的变革&#xff0c;其增长潜力犹如破晓之光&#xff0c;照亮了音频技术的未来之路。随着消费者对高品质生活追求的不断提升&#xff0c;以及对智能家居生态融合的日益…...

neo4j-在Linux中安装neo4j

目录 切换jdk 安装neo4j 配置neo4j以便其他电脑可以访问 切换jdk 因为我安装的jdk是1.8版本的&#xff0c;而我安装的neo4j版本为5.15,Neo4j Community 5.15.0 不支持 Java 1.8&#xff0c;它要求 Java 17 或更高版本。 所以我需要升级Java到17 安装 OpenJDK 17 sudo yu…...

AI 场景下,函数计算 GPU 实例模型存储最佳实践

作者&#xff1a;有松 当前&#xff0c;函数计算 FC 已被广泛应用在各种 AI 场景下&#xff0c;函数计算支持通过使用容器镜像部署 AI 推理应用&#xff0c;并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用&#xff0c;并快速解决不同…...

股指入门:股指期货是什么意思?在哪里可以做股指期货交易?

股指期货是一种以股票指数为标的物的期货合约&#xff0c;也可以称为股票指数期货或期指。 股指期货是什么意思&#xff1f; 股指期货是一种金融衍生品&#xff0c;其标的资产是股票市场上的股指&#xff0c;例如标普500指数、道琼斯工业平均指数、上证50指数等。 股指期货允…...

【分布式理论六】分布式调用(4):服务间的远程调用(RPC)

文章目录 一、RPC 调用过程二、RPC 动态代理&#xff1a;屏蔽远程通讯细节1. 动态代理示例2. 如何将动态代理应用于 RPC 三、RPC 序列化四、RPC 协议编码1. 协议编码的作用2. RPC 协议消息组成 五、RPC 网络传输1. 网络传输流程2. 关键优化点 一、RPC 调用过程 RPC&#xff08…...

aliyun 的 ip 设置方法

aliyun 的 ip 设置方法 阿里云&#xff1a;网络编程 bind&#xff1a;cannot assign requested address errno:99 问题。 公网IP,&#xff0c;弹性公网IP&#xff0c;主私网IP 1. 公网IP, --> NAT --> 主私网IP &#xff0c;设置方法&#xff1a; 服务器端 ip 为&…...

ASP.NET Core分布式缓存

目录 分布式缓存 概述 IDistributedCache接口中定义的主要方法及主要的扩展方法 用什么做缓存服务器 使用 封装分布式缓存操作 分布式缓存 概述 分布式系统中&#xff0c;内存缓存不满足要求的话&#xff0c;把缓存数据保存到专门的缓存服务器&#xff0c;所有Web应用通…...

【CUDA】内存模型

目录 一、Programmable 1.1 寄存器(Registers) 1.2 本地内存(Local Memory) 1.3 共享内存(shared Memory) 1.4 常量内存(Constant Memory) 1.5 全局内存(Global Memory) 1.6 纹理内存(Textrue Memory) 1.7 总结 二、Cache(Non-programmable) 三、固定内存 四、零拷贝…...

使用Pygame制作“吃豆人”游戏

本篇博客展示如何使用 Python Pygame 编写一个简易版的“吃豆人&#xff08;Pac-Man&#xff09;” 风格游戏。这里我们暂且命名为 Py-Man。玩家需要控制主角在一个网格地图里移动、吃掉散布在各处的豆子&#xff0c;并躲避在地图中巡逻的幽灵。此示例可帮助你理解网格地图、角…...

Pyecharts系列课程04——折线图/面积图(Line)

本章我们学习在Pyecharts中折线图&#xff08;Line&#xff09;的使用。折线图通用应用于数据的趋势分析。 折线图 我们现在有两组数据&#xff0c;x_data是2024年的月份&#xff0c;y_data为对应张三甲每个月的用电量。 # 家庭每月用电量趋势 x_data ["1月", &q…...

mysql 学习10 多表查询 -多表关系,多表查询

多表关系 一对多 多对多 创建学生表 #多对多表 学生选课系统create table student(id int primary key auto_increment comment 主键ID,name varchar(64) comment 姓名,studentnumber varchar(10) comment 学号 )comment 学生表;insert into student(id,name,studentnumber)va…...

lambda 表达式详解

lambda 表达式详解 lambda 表达式详解基本语法示例代码及详细解释1. 简单的lambda表达式2. 带参数的lambda表达式3. 捕获外部变量4. 使用mutable关键字修改捕获的变量5. 按引用捕获外部变量6. 自动推导返回类型 捕获列表的几种形式总结 Lambda表达式的常用的应用场景&#xff1…...

从0开始达芬奇(3.5)

媒体优化 顾名思义就是降低分辨率等来使素材的回放更加流畅。&#xff08;在低配电脑上也可以流畅运行&#xff09; ⭐方法一&#xff1a;&#xff08;一般使用第二种&#xff09; 播放→代理模式→二分之一或者四分之一 ⭐⭐⭐方法二&#xff1a;优化媒体文件&#xff08;简…...

【Uniapp-Vue3】z-paging插件组件实现触底和下拉加载数据

一、下载z-paing插件 注意下载下载量最多的这个 进入Hbuilder以后点击“确定” 插件的官方文档地址&#xff1a; https://z-paging.zxlee.cn 二、z-paging插件的使用 在文档中向下滑动&#xff0c;会有使用方法。 使用z-paging标签将所有的内容包起来 配置标签中的属性 在s…...

Ubuntu20.04 本地部署 DeepSeek-R1

一、下载ollama 打开 ollama链接&#xff0c;直接终端运行提供的命令即可。如获取的命令如下&#xff1a; curl -fsSL https://ollama.com/install.sh | sh确保是否安装成功可在终端输入如下命令&#xff1a; ollama -v注意&#xff1a; 如遇到Failed to connect to github.…...

Linux 设备驱动分类(快速理解驱动架构)

Linux 设备驱动分类&#xff08;快速理解驱动架构&#xff09; 在 Linux 设备驱动开发中&#xff0c;最基础的概念就是 设备驱动的分类。 Linux 设备驱动主要分为 字符设备、块设备和网络设备&#xff0c;它们分别对应不同类型的硬件资源。 理解这些分类&#xff0c;不仅能帮助…...

Java语法糖详解

前言 在现代编程语言的发展历程中&#xff0c;语法糖&#xff08;Syntactic Sugar&#xff09;作为一种提升代码可读性和开发效率的重要特性&#xff0c;已经成为语言设计的重要组成部分。Java作为一门成熟且广泛应用的编程语言&#xff0c;在其长期演进过程中&#xff0c;语法…...

567.字符串的排列

目录 一、题目二、思路2.1 解题思路2.2 代码尝试2.3 疑难问题 三、解法四、收获4.1 心得4.2 举一反三 一、题目 二、思路 2.1 解题思路 用两个哈希表比较来判断。s1的哈希表是否与s2相同。在窗口滑动过程中&#xff0c;用哈希表来维护。 2.2 代码尝试 class Solution { pub…...