当前位置: 首页 > news >正文

Deepseek 与 ChatGPT:AI 浪潮中的双子星较量

 

引言 

在人工智能飞速发展的当下,AI 语言模型成为了人们关注的焦点。Deepseek 与 ChatGPT 作为其中的佼佼者,各自展现出独特的魅力,引领着 AI 技术的发展潮流。今天,就让我们深入探讨这两款模型,看看它们在 AI 领域中是如何大放异彩的。

技术原理:创新与传统的碰撞

Deepseek:算法革新引领新方向

Deepseek 采用的混合专家模型(MoE)是其技术亮点之一。从原理上来说,MoE 将一个大的语言模型拆分成多个较小的专家模型,每个专家模型专注于处理特定类型的任务。当面对用户的问题时,模型会根据问题的特征,动态地将任务分配给最合适的专家模型。这就好比一个大型企业,不同的部门负责不同的业务板块,遇到业务时,能迅速找到对应的专业团队来处理,大大提高了处理效率。

以自然语言处理中的文本分类任务为例,有的专家模型擅长处理新闻类文本,有的则对科技类文本分类更有优势。Deepseek 通过特殊的门控机制,能快速判断输入文本的类别,然后将其分配给相应的专家模型,从而实现更精准的分类。

        同时,多头潜在注意力机制(MLA)进一步提升了 Deepseek 的性能。传统的注意力机制在处理长文本时,计算量会随着文本长度的增加而大幅增长,导致效率降低。而 MLA 通过对文本进行分层处理,在不同的层次上捕捉文本的语义信息,不仅提高了语义解析的准确性,还实现了高压缩率,减少了对大量硬件资源的依赖。

此外,Deepseek 的 R1 模型完全由强化学习驱动。在传统的监督学习中,需要大量的标注数据来训练模型,而标注数据的获取往往需要耗费大量的人力和时间成本。Deepseek 的 R1 模型通过强化学习,只需要少量的标注数据作为引导,模型就可以在与环境的交互中不断学习和改进,提升自己的推理能力,这无疑大大降低了训练成本。

ChatGPT:基于 GPT 架构的稳健前行

ChatGPT 基于 GPT 架构,这是一种基于 Transformer 的预训练语言模型。GPT 架构通过在海量的文本数据中进行无监督学习,自动学习到语言的模式、语法和语义信息。然后,再通过大规模的监督微调(SFT),利用人工标注的数据对模型进行进一步的优化,使其能够更好地满足实际应用的需求。

在创意写作方面,ChatGPT 能够根据用户给出的主题和要求,生成富有创意和逻辑性的文章。比如,用户要求写一篇科幻小说,ChatGPT 可以迅速构思出故事的背景、人物和情节,生成一篇内容丰富的小说片段。在多领域知识融合方面,ChatGPT 也表现出色,无论是历史、科学还是文化等领域的知识,它都能进行整合和运用,回答用户的综合性问题。

然而,这种基于大规模数据和算力的模式也存在一定的局限性。首先,训练 GPT 模型需要消耗大量的计算资源,包括高性能的 GPU 集群和大量的电力,这使得模型的训练成本非常高昂。其次,由于模型的训练依赖于大量的数据,数据的质量和多样性对模型的性能有着至关重要的影响。如果数据存在偏差或不完整,可能会导致模型生成的结果出现错误或不准确。

性能表现:数据说话见真章

推理能力

在 Chatbot Arena 基准测试中,DeepSeek-R1 成绩斐然,位列全类别第三,与 ChatGPT-4o 并列,在风格控制类模型中更是排名第一。在数学推理任务中,DeepSeek-R1 能够快速准确地解决复杂的数学问题。例如,在求解高等数学中的微积分问题时,DeepSeek-R1 不仅能够给出正确的答案,还能详细地解释解题步骤和思路,这对于学生和科研人员来说非常有帮助。

在编程辅助方面,DeepSeek-R1 同样表现出色。当开发者遇到代码编写难题时,DeepSeek-R1 可以根据问题描述,提供相应的代码示例和解决方案。它还能对代码进行语法检查和优化建议,帮助开发者提高代码的质量和效率。相比之下,ChatGPT o1 模型在这些方面的表现稍显逊色。

多语言处理

DeepSeek 凭借跨语种 Token 解析技术,在多语言处理方面具有天然的优势。它能够直接处理多种语言的文本,无需复杂的翻译适配过程。无论是中文、英文、法文还是其他语言,DeepSeek 都能准确地理解和生成文本。例如,在国际商务交流中,DeepSeek 可以实时地进行多语言翻译和交流,帮助不同国家的商务人士顺利沟通。

而 ChatGPT 在非英语场景下,需要借助翻译工具来实现多语言交互。这不仅增加了交互的复杂性,还可能导致翻译过程中的信息丢失或不准确。在灵活性和实时性方面,ChatGPT 相对 DeepSeek 稍逊一筹。

成本效益

DeepSeek 以较小的参数量,实现了接近 ChatGPT 的性能,这是其成本效益优势的重要体现。参数量是衡量语言模型规模的一个重要指标,通常情况下,参数量越大,模型的能力越强,但同时训练和运行成本也越高。DeepSeek 通过创新的算法设计,在较小的参数量下,依然能够达到优秀的性能表现。

较低的推理成本使得更多的企业和开发者能够负担得起。对于一些小型企业和初创公司来说,使用 DeepSeek 进行 AI 应用开发的成本大大降低,这有助于推动 AI 技术在更广泛的领域落地。例如,一些小型的电商企业可以利用 DeepSeek 开发智能客服系统,提升客户服务质量,而无需承担高昂的技术成本。

应用场景:各显神通展身手

DeepSeek 的垂直深耕

在企业级应用中,DeepSeek 展现出了强大的实力。岚图、吉利等车企利用 DeepSeek 优化智驾系统,取得了显著的效果。在智能驾驶过程中,智驾系统需要实时处理大量的传感器数据,并做出准确的决策。DeepSeek 通过对传感器数据的分析和处理,能够帮助智驾系统降低误检率,提高决策的准确性,从而缩短开发周期,提升产品的安全性和可靠性。

云服务商也快速接入 DeepSeek,构建边缘计算生态。在边缘计算场景下,设备的计算资源有限,需要一种高效的 AI 模型来处理本地数据。DeepSeek 的低算力需求和高性能表现,使其非常适合在边缘设备上运行。例如,在智能家居设备中,DeepSeek 可以实时分析用户的行为数据,提供个性化的服务和建议。

对于开发者和个人用户来说,DeepSeek 也是一个得力助手。在游戏创作方面,开发者可以利用 DeepSeek 生成游戏剧情、角色对话等内容,大大提高游戏开发的效率。在国际象棋对弈中,DeepSeek 能够帮助用户制定独特的 “非常规策略”,击败 ChatGPT,展现出其在策略制定方面的优势。

ChatGPT 的通用优势

ChatGPT 在内容生成和客户服务领域优势明显。在内容生成方面,无论是撰写新闻稿件、广告文案还是学术论文,ChatGPT 都能根据用户的要求,生成高质量的内容。例如,媒体机构可以利用 ChatGPT 快速生成新闻报道的初稿,记者再根据实际情况进行修改和完善,提高新闻报道的效率。

在客户服务领域,ChatGPT 能够快速准确地回答客户的问题,提供解决方案。许多大型企业都将 ChatGPT 集成到自己的客服系统中,实现 24 小时不间断的客户服务。不过,ChatGPT 的高级功能需要付费解锁,这在一定程度上限制了个体用户的使用深度。对于一些普通用户来说,可能无法享受到 ChatGPT 的全部功能。

开源策略:开源与闭源的不同道路

Deepseek 的开源之路

DeepSeek 采用 MIT 协议开源模型权重与推理代码,这一举措在 AI 社区引起了广泛的关注和积极的响应。开源意味着全球的开发者和中小企业都可以免费获取 DeepSeek 的技术资源,进行二次开发和创新。这不仅促进了技术的共享和传播,还激发了全球 AI 开发者的创造力。

HuggingFace 发起的 Open R1 项目就是对 DeepSeek 技术的进一步探索和拓展。在这个项目中,开发者们可以基于 DeepSeek 的模型,进行各种应用场景的开发和优化。华为、荣耀等厂商也已集成 DeepSeek 的 API,将其应用到自己的产品和服务中。例如,华为在其智能语音助手和智能办公软件中集成 DeepSeek,提升了产品的智能化水平。

ChatGPT 的闭源策略

ChatGPT 转向闭源,构建了付费服务的商业生态。OpenAI 通过提供付费订阅服务,向用户提供更高级的功能和更好的使用体验。这种闭源策略虽然为 OpenAI 带来了商业上的成功,但也引发了一些争议。一方面,闭源使得其他开发者无法直接接触和改进 ChatGPT 的技术,限制了技术的创新和发展。另一方面,付费服务也使得一些用户无法享受到 ChatGPT 的全部功能,导致技术的普及和应用受到一定的限制。

相比之下,DeepSeek 的开源模式为非西方国家参与 AI 竞争提供了机会。许多发展中国家的科研机构和企业可以利用 DeepSeek 的开源技术,进行自主研发和创新,提升自身在 AI 领域的竞争力。

争议与挑战:前进路上的阻碍

技术路线之争

OpenAI 曾指责 DeepSeek “数据蒸馏”,认为 DeepSeek 在训练过程中可能使用了 OpenAI 的数据。然而,经过调查,并没有证实这一抄袭指控。有趣的是,ChatGPT 推出的 “深度研究” 功能,被指模仿 DeepSeek 的深度推理逻辑。这一争议反映了 AI 领域中不同技术路线之间的竞争和碰撞。

不同的技术路线都有其优势和局限性,DeepSeek 的算法优化路线注重通过创新的算法来提高模型的性能和效率,降低对算力的依赖;而 ChatGPT 的算力扩张路线则强调通过大规模的数据和算力来提升模型的能力。这两种路线的竞争,不仅推动了技术的发展,也引发了学术界和产业界对 AI 技术发展方向的深入思考。

算力与算法平衡

DeepSeek 通过算法优化降低了算力依赖,这是其在技术上的一大突破。然而,从长远来看,硬件瓶颈依然是 AI 发展面临的一个重要问题。随着 AI 技术的不断发展,对算力的需求也在不断增加。即使是算法优化做得再好,也无法完全摆脱对硬件的依赖。

ChatGPT 依赖算力堆砌,虽然在性能上取得了一定的优势,但也面临着成本高昂和可持续性的压力。高昂的算力成本使得许多企业和机构难以承受,限制了 AI 技术的普及和应用。此外,大量的算力消耗也对能源供应和环境造成了一定的影响。

如何在算力与算法之间找到平衡,是 AI 发展亟待解决的问题。一方面,需要继续加大对算法研究的投入,不断探索新的算法和技术,提高模型的效率和性能;另一方面,也需要加强对硬件技术的研发,提升硬件的计算能力和能源效率,降低算力成本。

总结:竞争推动 AI 未来发展

DeepSeek 和 ChatGPT,一个以开源、低成本和垂直领域创新为特色,挑战着 ChatGPT 的通用性霸权,推动 AI 技术走向民主化;一个凭借成熟的生态与品牌优势,成为多场景应用的标杆。它们之间的竞争,本质上是 “算法优化” 与 “算力扩张” 两条技术路线的博弈。

在这场激烈的竞争中,我们看到的不仅仅是两款模型的较量,更是 AI 技术不断突破边界、向更高效、普惠方向发展的强大动力。随着技术的不断进步,相信在未来,DeepSeek 和 ChatGPT 将继续引领 AI 技术的发展潮流,为我们的生活和工作带来更多惊喜与变革。无论是在医疗、教育、金融还是其他领域,AI 技术都将发挥越来越重要的作用,改变我们的生活方式,推动社会的进步和发展。

相关文章:

Deepseek 与 ChatGPT:AI 浪潮中的双子星较量

引言 在人工智能飞速发展的当下,AI 语言模型成为了人们关注的焦点。Deepseek 与 ChatGPT 作为其中的佼佼者,各自展现出独特的魅力,引领着 AI 技术的发展潮流。今天,就让我们深入探讨这两款模型,看看它们在 AI 领域中是…...

open-webui安装

docker安装openwebui 拉取镜像 docker pull ghcr.io/open-webui/open-webui:maindocker images启动 docker run -d -p 8346:8080 --name open-webui ghcr.io/open-webui/open-webui:maindocker ps查看端口占用 lsof -i:8346访问地址 http://ip:port http://127.0.0.1:8346...

docker 安装jenkins

使用docker 容器安装jenkins比较方便,但是细节比较重要,这里实战安装了一遍,可用: 拉取最新的jenkins镜像 docker pull jenkins/jenkins 如果没有翻墙的话,可以会有下面的报错: Error response from dae…...

前端利器:DateUtils 日期时间工具深度剖析

序言 在前端开发中,日期和时间的处理是一个常见且重要的任务。从格式化日期展示到复杂的日期计算,每一个环节都需要精确和高效的代码支持。今天,我们就来深入探讨一个精心打造的前端日期时间工具类 DateUtils,它涵盖了从基础的日…...

Denoising Diffusion Restoration Models论文解读

论文要点 恢复的线性逆问题可以使用预训练的DDPM完成:1. 将降质矩阵使用SVD,得到分解矩阵;2. 使用分解矩阵将图像投影到降质类型间共享的谱空间;3. 谱空间中执行DDPM。 评价 同Track的方法同样很多,比如后续的DDNM、…...

【Windows API】SetFilePointerEx函数用法介绍

目录 一、函数概述 二、函数原型与参数解析 1. hFile(文件句柄) 2. liDistanceToMove(移动距离) 3. lpNewFilePointer(新指针位置) 4. dwMoveMethod(移动基准点) 三、返回值与…...

uniapp uni.request重复请求处理

类似这种切换tab时,如果操作很快并且网络不太好,就出现数据错乱,在网上查了一圈,有一个使用uview拦截处理的,但是原生uni.requse没有找到详细的解决办法,就查到使用 abort 方法,我自己封装了一个…...

unity学习47:寻路和导航,unity2022后版本如何使用 Navmesh 和 bake

目录 1 寻路和导航对移动的不同 1.1 基础的移动功能 1.1.1 基础移动 1.1.2 智能导航寻路 1.1.3 智能导航寻路还可以 2 如何实现这个效果? 2.1 通过地图网格的形式 2.1.1 警告信息 the static value has been deprecated的对应搜索 2.1.2 新的navigation ba…...

Windows安装node.js详细教程

一、什么是node.js Node.js 是一个基于 Chrome V8 引擎的javascript运行环境。 Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型。 Node 是一个让 JavaScript 运行在服务端的开发平台,它让javascript成为与PHP、Python等服务端语言平起平坐的脚步语言。 由 Rya…...

大模型领域常见的专业术语和关键词及简要解释

现在大语言模型非常火热,特别是deepseek,想要了解、学习、应用、设计开发大模型,则我们需要先知道大模型邻域都包含哪些方面,以及在大模型领域的各个方面,都有哪些常见的专业术语和关键词。 以下我们从大模型领域的模型架构、训练方法到优化技术、应用和伦理问题等多个方…...

单细胞转录组画小提琴VlnPlot只显示需要类型细胞

探序基因肿瘤研究院 整理 在R语言中,单细胞转录组数据画小提琴图中,我们如果想只展示出需要的特定细胞类型,可以把这需要展示的细胞类型单独构建成一个Seurat对象,再画图。 例如我们在Seurat对象中的meta.data表格中&#xff0c…...

UE 播放视频

一.UI播放视频 1.导入视频文件至工程文件夹 2.文件夹内右健选择Media -> File Meida Source创建testFileMeidaSource文件。 编辑FilePath为当前视频 3.右键->Media->Media Player 创建testMediaPlayer文件 4.右键创建testMediaTexture。编辑MediaPlayer设置testMedia…...

当pcie设备变化时centos是否会修改网络设备的名称(AI回答)

当pcie设备变化时centos是否会修改网络设备的名称 在CentOS(以及其他基于Linux的操作系统)中,网络接口的命名通常遵循特定的规则,尤其是在使用PCIe设备(如网络适配器)时。网络接口的命名通常基于设备的物理…...

SpringSecurity基于配置方法控制访问权限:MVC匹配器、Ant匹配器

Spring Security 是一个功能强大且高度可定制的身份验证和访问控制框架。在 Spring Security 中,可以通过配置方法来控制访问权限。认证是实现授权的前提和基础,在执行授权操作前需要明确目标用户,只有明确目标用户才能明确它所具备的角色和权…...

《养生》(二)

一、基础生活调整 1‌.作息规律‌ 固定每天7-8小时睡眠,尽量22:30前入睡,晨起后拉开窗帘晒太阳5分钟,调节生物钟‌ ‌2.饮食优化‌ 三餐定时,每餐细嚼慢咽20次以上,优先吃蔬菜和蛋白质(如鸡蛋、豆腐&#x…...

本地部署MindSearch(开源 AI 搜索引擎框架),然后上传到 hugging face的Spaces——L2G6

部署MindSearch到 hugging face Spaces上——L2G6 任务1 在 官方的MindSearch页面 复制Spaces应用到自己的Spaces下,Space 名称中需要包含 MindSearch 关键词,请在必要的步骤以及成功的对话测试结果当中 实现过程如下: 2.1 MindSearch 简…...

STM32 看门狗

目录 背景 独立看门狗(IWDG) 寄存器访问保护 窗口看门狗(WWDG) 程序 独立看门狗 设置独立看门狗程序 第一步、使能对独立看门狗寄存器的写操作 第二步、设置预分频和重装载值 第三步、喂狗 第四步、使能独立看门狗 喂狗…...

Ansys Motor-CAD:热分析

您好,汽车迷: 在这篇博客中,我将讨论如何使用 Ansys Motor-CAD 中的热物理模型对 IPM 电机进行热分析。我展示了可以应用的各种冷却系统,并演示了一些计算方法,包括稳态、简单瞬态和占空比。 热物理和设置 选择热物理…...

Swagger 转 Word 技术方案

项目概述 本项目旨在提供一种便捷的工具,将 Swagger API 文档转换为 Word 文档,方便开发人员和团队进行文档管理和分享。通过简单的配置和操作,用户可以快速生成包含 API 接口信息、请求参数、返回参数等内容的 Word 文档。 技术架构 本项目基于 Java 开发,采用 Spring …...

对CSS了解哪些?

CSS(Cascading Style Sheets,层叠样式表)是用来描述HTML文档外观和布局的语言。以下是对CSS的常见了解范围: 1. CSS 基础 选择器:如通用选择器 (*)、类型选择器、类选择器 (.class)、ID选择器 (#id)、后代选择器、伪类…...

使用 Docker-compose 部署 MySQL

使用 Docker Compose 部署 MySQL 本文将详细指导如何使用 docker-compose 部署 MySQL,包括基本配置、启动步骤、数据持久化以及一些高级选项。通过容器化部署 MySQL,你可以快速搭建一个隔离的数据库环境,适用于开发、测试或小型生产场景。 关…...

【C语言】指针(5)

前言:上篇文章的末尾我们使用了转移表来解决代码冗余的问题,那我们还有没有什么办法解决代码冗余呢?有的这就是接下来要说的回调函数。 往期文章: 指针1 指针2 指针3 指针4 文章目录 一,回调函数二,qsort实现快速排序1…...

go~为什么会有json.Number这种类型存在

解决 JSON 数值类型的不确定性 在 JSON 格式里,数值类型没有明确区分整数和浮点数,一个数值可能是整数(如 123),也可能是浮点数(如 123.45)。而在 Go 语言中,整数(如 in…...

Jmeter连接数据库、逻辑控制器、定时器

Jmeter直连数据库 直接数据库的使用场景 直连数据库的关键配置 添加MYSQL驱动Jar包 方式一:在测试计划面板点击“浏览”按钮,将你的JDBC驱动添加进来 方式二:将MySQL驱动jar包放入到lib/ext目录下,重启JMeter 配置数据库连接信…...

DeepSeek智能测试助手:分类+推理+导出一站式工具

前言 测试开发工程师在日常工作中需要处理大量测试文档,并且这些文档需要被高效分类、清洗和管理,同时结合强大的 AI 推理能力(如 DeepSeek 模型)进行智能化处理和分析。为此,我们开发了一款基于 PyQt5 的 GUI 工具&a…...

20250220找回Ubuntu22.04中丢失的文件管理器

20250220找回Ubuntu22.04中丢失的文件管理器 2025/2/20 18:05 在Ubuntu20.04.6中 生产服务器上 强制安装deb安装包的时候,把 桌面显示搞丢了。 Ubuntu的桌面用得少,但是没有还是挺不方便的,一通操作,桌面回来了。还是有很多/不少功…...

IMX6ULL的公板的以太网控制器(MAC)与物理层(PHY)芯片(KSZ8081RNB)连接的原理图分析(包含各引脚说明以及工作原理)

目录 什么叫以太网?它与因特网有何区别?公板实现以太网的原理介绍(MII/RMII协议介绍)公板的原理图下载地址公板中IMX6ULL处理器与MAC(以太网控制器)有关的原理图IMX6ULL处理器的MAC引脚说明1. **ENET1_TX_DATA0**2. **ENET1_TX_DATA1**3. **ENET1_TX_EN*…...

一周学会Flask3 Python Web开发-request请求对象与url传参

锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili request请求对象封装了从客户端发来的请求报文信息,我们可以从中获取所有数据。 request对象包含的常用属性&…...

2024年国赛高教杯数学建模C题农作物的种植策略解题全过程文档及程序

2024年国赛高教杯数学建模 C题 农作物的种植策略 原题再现 根据乡村的实际情况,充分利用有限的耕地资源,因地制宜,发展有机种植产业,对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物,优化种植策略&…...

WEB前端将指定DOM生成图片并下载最佳实践(html2canvas)

前言: html2canvas 是一个 JavaScript 库,其主要作用是将 HTML 元素或其部分内容渲染为 Canvas 图像。通过它,开发者可以将网页中的任意 DOM 元素(包括文本、图片、样式等)转换为图片格式(如 PNG 或 JPEG&…...

C# 十六进制字符串转换为十进制

在 C# 中,将十六进制(Hexadecimal)字符串转换为十进制(Decimal)整数非常简单。以下是几种常见的方法: 方法 1: 使用 Convert.ToInt32 Convert.ToInt32 方法可以直接将十六进制字符串转换为十进制整数。 示…...

第4章 信息系统架构(三)

4.3 应用架构 应用架构的主要内容是规划出目标应用分层分域架构,根据业务架构规划目标应用域、应用组和目标应用组件,形成目标应用架构逻辑视图和系统视图。从功能视角出发,阐述应用组件各自及应用架构整体上,如何实现组织的高阶…...

Qt 保留小数点 固定长度 QString 格式化

QString的arg()函数格式化输出double类型数值,包括fieldWidth、fmt、prec和fillChar参数的作用。示例代码展示了如何设置精度和填充字符,以及字段宽度的影响。文中提到,当fieldWidth小于实际长度时,前面的填充不会被截断。此外&am…...

亲测可用,IDEA中使用满血版DeepSeek R1!支持深度思考!免费!免配置!

作者:程序员 Hollis 之前介绍过在IDEA中使用DeepSeek的方案,但是很多人表示还是用的不够爽,比如用CodeChat的方案,只支持V3版本,不支持带推理的R1。想要配置R1的话有特别的麻烦。 那么,今天,给…...

AI训练中的常用指令

以下是一些常用于深度学习训练的 Linux 指令,可以帮助你高效管理和执行训练任务: 文件管理 查看当前目录内容:ls进入目录:cd 路径/到/目录创建新目录:mkdir 新目录名称删除文件或目录: 删除文件&#xff…...

汽车同轴供电(PoC)电感器市场报告:未来几年年复合增长率CAGR为14.3%

汽车同轴供电(PoC)系统旨在通过同轴电缆传输电力和数据。 该技术适用于各种汽车应用,如摄像头系统、传感器和其他需要通过单根电缆传输电力和数据的车载设备。 汽车 PoC 系统中的电感器有多种用途,包括能量存储:电感器…...

C++中间件DDS介绍

C DDS 库简介 DDS(Data Distribution Service) 是一种用于实时分布式系统通信的中间件标准,由 OMG(Object Management Group) 提出。它是一种发布/订阅(Publish/Subscribe)模式的数据通信框架&…...

强化学习笔记

强化学习的总体目标:寻找最优策略。 关键名词 智能体(Agent) 状态(State):智能体相对于环境的状态 s ∈ S s∈S s∈S 状态空间(State space):把所有状态放在一起&…...

【个人记录】openEuler安装K3S并配置为GPU节点

前言 国内网络环境特殊,在线安装比较麻烦,K3S采用离线安装方式进行部署。 安装整体思路是: 安装GPU驱动安装CUDA工具安装nvidia容器运行时安装K3S设置K3S使用GPU 基础环境 采用All In One方式(其实只有一张GPU卡)部…...

SpringAI系列 - ToolCalling篇(二) - 如何设置应用侧工具参数ToolContext(有坑)

目录 一、引言二、集成ToolContext示例步骤1: 在`@Tool`标注的工具方法中集成`ToolConext`参数步骤2:`ChatClient`运行时动态设置`ToolContext`参数三、填坑一、引言 在使用AI大模型的工具调用机制时,工具参数都是由大模型解析用户输入上下文获取的,由大模型提供参数给本地…...

Linux系统中常见的词GNU是什么意思?

GNU 是 “GNU’s Not Unix” 的递归缩写,它是一个自由软件项目,旨在创建一个完全自由的操作系统。这个名字反映了GNU项目的核心理念:它试图创建一个类Unix的系统,但不是Unix本身。 GNU 项目由 理查德斯托曼(Richard S…...

Revit API:对元素过滤的三点思考

一、为什么要对元素进行过滤? 提高效率:Revit模型可能包含成千上万的元素,直接对所有元素进行操作会非常耗时。通过过滤,可以只选择需要处理的元素,从而提高代码的执行效率。 精准控制:通过过滤&#xff0…...

计算机毕业设计Python农产品推荐系统 农产品爬虫 农产品可视化 农产品大数据(源码+LW文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

计算机网络之TCP的可靠传输

上一篇内容可能比较多,显得比较杂乱,这一篇简单总结一下TCP是靠什么实现可靠传输的吧。 校验和 TCP是端到端的传输,由发送方计算校验和,接收方进行验证,目的是为了验证TCP首部和数据在发送过程中没有任何改动&#x…...

linux 驱动编程配置(minis3c2440)

1.介绍 1. 启动过程:启动u-boot------>>启动linux内核----->>挂载根文件系统 2. uboot是一个裸机程序,是一个bootloader,用于启动linux系统以及系统初始化 ubootloader主要完成了哪些任务:1. 初始化异常向量表&a…...

数据库基础1

MySQL在C语言中的操作步骤 C语言操作MySQL的基本流程如下: 引入MySQL头文件初始化MySQL连接连接到MySQL服务器执行SQL语句获取查询结果处理查询结果释放结果集和连接 数据库中有哪些约束规则 1.主键约束 promary key 具有唯一且非空 2.外键约束 foreign key 3.非…...

Redis文档总结

文档:https://redis.com.cn/topics/why-use-redis.html 1.我们为什么一定要用 Redis 呢? 速度快,完全基于内存,使用 C 语言实现,网络层使用 epoll 解决高并发问题,单线程模型避免了不必要的上下文切换及竞争…...

论文笔记(七十二)Reward Centering(二)

Reward Centering(二) 文章概括摘要2 简单的奖励中心 文章概括 引用: article{naik2024reward,title{Reward Centering},author{Naik, Abhishek and Wan, Yi and Tomar, Manan and Sutton, Richard S},journal{arXiv preprint arXiv:2405.0…...

25年2月通信基础知识补充:多普勒频移与多普勒扩展、3GPP TDL信道模型

看文献过程中不断发现有太多不懂的基础知识,故长期更新这类blog不断补充在这过程中学到的知识。由于这些内容与我的研究方向并不一定强相关,故记录不会很深入请见谅。 【通信基础知识补充7】25年2月通信基础知识补充1 一、多普勒频移与多普勒扩展傻傻分不…...

ASUS/华硕无畏16 X1605VA 原厂Win11 22H2系统 工厂文件 带ASUS Recovery恢复

华硕工厂文件恢复系统 ,安装结束后带隐藏分区,带一键恢复,以及机器所有的驱动和软件。 支持型号:X1605VA 系统版本:Windows 11 22H2 文件下载:点击下载 文件格式:工厂文件 安装教程&#x…...