当前位置: 首页 > news >正文

超越 DeepSeek V3 -->【Qwen2.5-Max】

🔥 先说明,不是广子,不是广子!!!单纯分享这个工具给大家,毕竟最近使用 DeepSeek 太容易崩了,每天深度思考一次之后就开始转圈圈用不了,然后就找到了这个工具使用


一、前言 – DeepSeek

最近大家都知道DeepSeek 最近非常非常火🔥,我看了一下 DeepSeek 的深度思考推理能力是大家最喜欢用的一个功能,也是它相比于其他 AI 更加高明的情况,我们官网现在所用的 DeepSeek 一般指的就是最新的版本 DeepSeek-V3

但是一个 AI 它总有进阶的过程吧,就类似于我们用的豆包一样,基于大数据的搜索,此时我们看到的 DeepSeek 就是处于 DeepSeek-V3 的时期,

那么 deepseek-V3deepseek-R1 的区别在哪?

  • DeepSeek-V3(基础模型) + 推理能力(训练) = DeepSeek-R1

相当于 DeepSeek-V3 就是基础智商,而 R1 就是基于基础智商训练得到 DeepSeek-R1

DeepSeek-V3通用的自然语言处理模型

  • DeepSeek V3 采用混合专家(MoE)架构,主要面向自然语言处理(NLP)任务,旨在提供高效、可扩展的解决方案。
  • 其优势在于高效的多模态处理能力(文本、图像、音频、视频)和较低的训练成本(557.6万美元,仅需2000块H800 GPU)。
  • 在基准测试中,V3的表现接近GPT-4o和Claude-3.5-Sonnet,但更注重综合场景的适用性。

DeepSeek-R1专注于高级推理任务

  • 专为复杂推理任务设计,强化在数学、代码生成和逻辑推理领域的性能。
  • 通过大规模强化学习(RL)和冷启动技术,R1在无需大量监督微调(SFT)的情况下,实现了与OpenAI o1系列相当的推理能力。

二、初步介绍

如果要使用的话,可以去 Qwen官网,或者 阿里云百炼,都是可以的

【获得 Qwen 的 API】:教程

通义千问(Qwen):由阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。
在这里插入图片描述

以下是其一些核心特点和优势:

1、多语言支持

  • 支持多种语言,包括但不限于中文、英文、法语、西班牙语、葡萄牙语、俄语、阿拉伯语、日语、韩语、越南语、泰语、印尼语等。
  • 可以为全球用户提供服务,并在跨语言交流中表现出色。

2、强大的对话能力

  • 经过大量训练,能够进行自然流畅的多轮对话,理解上下文关系,保持对话连贯性。
  • 在开放域问答、任务型对话、情感陪伴等方面表现优异。

3、丰富的知识库

  • 基于阿里巴巴集团内部的历史积累以及互联网上的海量数据进行训练,拥有广泛的知识覆盖范围。
  • 可以回答从科学常识到最新技术趋势的各种问题。

4、内容生成能力

  • 擅长生成各种类型的内容,例如文章、诗歌、故事、剧本、邮件、报告等。
    同时还具备代码写作能力,可以理解和生成多种编程语言的代码片段。

三、深入了解

1, Qwen vs DeepSeek

Qwen2.5-Max 其实也是类似于 DeepSeek-V3 的基础模型,而 Qwen2.5-Max 的比 DeepSeek-V3 的智商还高,在 Chatbot Arena【大模型盲测绑定】 上排名 几乎把很多 开源、闭源、前沿非推理模型都比了下去,如下:
在这里插入图片描述

Chatbot Arena 大模型盲测榜单:是通过匿名的方式去把大模型两两组队,然后让用户进行盲测,然后用户给体验好的进行投票

注意:这个也是免费的,界面很像那个 ChatGPT,如下:
在这里插入图片描述

2, 代码编写及实况预览

我们先来看看它的知识储备
在这里插入图片描述

  • 现在和我们暂时也就两个月左右的时差

然后我们来测试,先让它做一个代码并进行实况预览,如下:
在这里插入图片描述

  • 它这个实况预览还是不错的

3, 中文写作

其实 R1 在大众中的爆火,我感觉就离不开它的写作能力,当时让它给我写的一篇骈文,不得不说第一眼惊艳到我了 ,深度思考真的不错哈
在这里插入图片描述
但是我用 Qwen 生成类似的中文的话,效果还是差上不少的:

在这里插入图片描述

但是要比另外 用 V3生成的要相对好上一丢丢,我相信 Qwen2.5 应该也能很快退出它的推理模型

4, 图片视频

这个就是它相比于 DeepSeek 更加方便的地方了,它可以生成图片和视频,如下:
在这里插入图片描述
我也测试调了一下它的图片生成,发现有点过于 AI 化,但是如果再进行更详细的语言描述和调整的话就会好上很多,比我以前看到的一些AI图还是要好不少的,而且图片生成免费,速度也挺快的,这点很赞 👍

在这里插入图片描述

  • 视频生成的话,还是有点太慢了,我测了一下估摸着至少得7、8分钟 一个视频,而且还有点容易崩,如下:
    在这里插入图片描述
    如果对视频生成感兴趣的,可以去 混元 AI,这个挺好的,但是要收费

看了上面的功能,其实我们就可以让 AI 帮我们生成一些不知道怎么描述的图片,比如:装修图,可以先让 AI 给我们生成提示词,然后再用 AI 生成图片
在这里插入图片描述
然后再利用我们生成的提示词生成图片即可

值得一提的是:Qwen 2.5 有三个全家桶,针对数学的 Qwen 2.5-Math、常规的大语言模型 Qwen2.5 和专门针对编程的 Qwen2.5-Coder 模型
在这里插入图片描述
感兴趣的可以去搜一些相关知识

四、小结

总的来说,这个 Qwen2.5 的功能还是挺齐全的,代码的实况预览也是可以的,比 DeepSeek V3 是要相对好些,但是如果要和 DeepSeek R1 比的话,就还是相对差一些,毕竟现在 DeepSeek 有点卡,本地部署显卡也带不动,用 Qwen 2.5- Max 是个不错的选择啦,当然啦,也期望 Qwen 2.5-Max 也能早日推出它的推理模型,

相关文章:

超越 DeepSeek V3 -->【Qwen2.5-Max】

🔥 先说明,不是广子,不是广子!!!单纯分享这个工具给大家,毕竟最近使用 DeepSeek 太容易崩了,每天深度思考一次之后就开始转圈圈用不了,然后就找到了这个工具使用 一、前言…...

301.华为交换机堆叠技术基础

华为交换机堆叠技术基础 一、概念及原理部分1.堆叠简介1.1 什么是堆叠1.2 可靠性网络架构1.3 华为堆叠设备1.4 其他厂商的堆叠2.堆叠的示意图3.堆叠的应用3.1 中小企业3.2 园区网4.堆叠的原理4.1基本的概念4.2 堆叠建立4.3 角色选举4.4 版本同步4.5 配置同步4.6 堆叠系统的登录…...

【开源AI】AI一页一页读PDF

【开源AI】AI一页一页读PDF 可以在这里看 : 让AI 处理 PDF 文件,提取其中的知识点,并生成总结。 只是无法修改,后续若有更新在csdn这里。 【OpenAI】 API 更新: JSON 结构化输出约束机制( JSON Schema) 的一次实战。知识库的JSON Schema形式 每一页都要总结,总结的知识…...

Spring AI 介绍

文章来源:AI 概念 (AI Concepts) _ Spring AI1.0.0-SNAPSHOT中文文档(官方文档中文翻译)|Spring 教程 —— CADN开发者文档中心 本节介绍 Spring AI 使用的核心概念。我们建议仔细阅读它,以了解 Spring AI 是如何实现的。 模型 AI 模型是旨在处理和生成…...

React - 事件绑定this

在 React 中,this 的绑定是一个常见问题,尤其在类组件中使用事件处理函数时。JavaScript 中的 bind 函数用于设置函数调用时 this 的值。 bind 函数的作用 bind() 方法创建一个新的函数,当被调用时,其 this 关键字被设置为提供的…...

【3.Git与Github的历史和区别】

目录 Git的历史和Github的区别本质和功能 Git的历史和Github的区别 Git是由Linux内核的创造者Linus Torvalds于2005年创建的。当时,Linux内核开源项目使用BitKeeper作为版本控制系统,但2005年BitKeeper的商业公司终止了与Linux社区的合作,收…...

【设计模式】【行为型模式】职责链模式(Chain of Responsibility)

👋hi,我不是一名外包公司的员工,也不会偷吃茶水间的零食,我的梦想是能写高端CRUD 🔥 2025本人正在沉淀中… 博客更新速度 📫 欢迎V: flzjcsg2,我们共同讨论Java深渊的奥秘 &#x1f…...

【算法学习】二分查找开区间写法总结

根据灵神教学中的二分查找开区间写法进行如下总结: 我们需要注意的是,lowerBound 模板求解的是 > target 的最小下标 private int lowerBound(int[] nums, int target) {int left -1;int right nums.length; // 开区间 (left, right)while (left …...

信息科技伦理与道德3-2:智能决策

2.2 智能推荐 推荐算法介绍 推荐系统:猜你喜欢 https://blog.csdn.net/search_129_hr/article/details/120468187 推荐系统–矩阵分解 https://blog.csdn.net/search_129_hr/article/details/121598087 案例一:YouTube推荐算法向儿童推荐不适宜视频 …...

【干活分享】2025年可以免费问答的一些GPT网站-deepseek等免费gpt

2025年已经到来,大家也都陆续回归到忙碌的工作中。在新的一年里,如何更高效地完成工作任务,提升工作效率,是很多人关心的问题。今天,就为大家分享一些实用性很强的GPT网站,帮助大家在工作中事半功倍。 Dee…...

webpack配置之---入口

entry 单入口 由于一般的单页面项目只有一个入口,也就是单入口,单入口的配置方式有以下三种方式,如果有遗漏的欢迎补充 1、字符串方式 以下这几行代码解释: entry:本项目的入口文件 output:本项目打包…...

Golang GORM系列:GORM CRUM操作实战

在数据库管理中,CRUD操作是应用程序的主干,支持数据的创建、检索、更新和删除。强大的Go对象关系映射库GORM通过抽象SQL语句的复杂性,使这些操作变得轻而易举。本文是掌握使用GORM进行CRUD操作的全面指南,提供了在Go应用程序中有效…...

[M模拟] lc380. O(1) 时间插入、删除和获取随机元素(模拟+数据结构+脑筋急转弯+数组快捷删除技巧+项目思考)

文章目录 1. 题目来源2. 题目解析 1. 题目来源 链接:380. O(1) 时间插入、删除和获取随机元素 题单: 待补充 2. 题目解析 其实这个题目抽象一下的话在项目中也能出现,可能日常项目中没有算法基础的话,就很容易直接去进行新内…...

30~32.ppt

目录 30.导游小姚-介绍首都北京❗ 题目​ 解析 31.小张-旅游产品推广文章 题目 解析 32.小李-水的知识❗ 题目​ 解析 30.导游小姚-介绍首都北京❗ 题目 解析 新建幻灯片-从大纲-重置-检查设计→主题对话框→浏览主题:考生文件夹(注意&#x…...

一键查看电脑各硬件详细信息 轻松查看电脑硬件参数

今天为大家推荐两款非常实用的电脑硬件查看软件,它们能够一键快速查看电脑的各种配置信息,使用起来非常方便。 一键查看电脑各硬件详细信息 这款软件是绿色版的,无需安装,打开即可使用,文件大小仅为900多KB&#xff0…...

java如何创建自定义异常?

在Java中,创建自定义异常通常需要继承Exception类或其子类。以下是创建自定义异常的基本步骤: 定义异常类:创建一个新的类,继承自Exception或RuntimeException(根据需要选择)。 构造方法:提供一…...

2025/2/10 心得

第一题。J. C - Grand Garden (AI) 问题陈述 在一个花坛里,有 NN 朵花,编号为 1,2,\ldots,N1,2,…,N。最初,所有花的高度都是 00。你将得到一个高度序列 h{h\_1,h\_2,h\_3,\ldots\} 作为输入。你希望通过重复以下“浇水”操作来将所有花的编…...

Visual Studio 2022 中使用 Google Test

要在 Visual Studio 2022 中使用 Google Test (gtest),可以按照以下步骤进行: 安装 Google Test:确保你已经安装了 Google Test。如果没有安装,可以通过 Visual Studio Installer 安装。在安装程序中,找到并选择 Googl…...

软开关和硬开关

硬开关: 电路结构相对简单,一般只包含基本的开关管、电源、负载等元件,没有专门的谐振电路来辅助开关过程。 开关管在导通或关断时,电压或电流的变化率非常快,形成急剧的开关过程。开通时,开关器件的电流…...

C++17中的std::clamp:限制值的范围

文章目录 一、背景与动机二、std::clamp的定义三、使用示例示例1:基本用法示例2:浮点数和自定义类型 四、实际应用场景1. 游戏开发2. 图形处理3. 数值计算 五、注意事项六、总结 在C17中, std::clamp是一个极为实用的算法,它能够…...

Python的

& 运算符可用于不同集合类型,它主要用于集合的交集操作 下面分别介绍它在 set(集合)和 frozenset(不可变集合)这两种常见集合类型中的使用 set 类型 set 是 Python 中内置的可变集合类型,使用 & …...

计算机毕业设计Spark+大模型知网文献论文推荐系统 知识图谱 知网爬虫 知网数据分析 知网大数据 知网可视化 预测系统 大数据毕业设计 机器学习

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

13.8 聚焦应用场景的Prompt设计实战:从通用到领域专用的翻译质量跃升

聚焦应用场景的Prompt设计实战:从通用到领域专用的翻译质量跃升 关键词:领域特定Prompt设计、翻译质量优化、动态术语控制、多阶段推理链、Prompt版本管理 1. 翻译Prompt设计核心原则 1.1 领域知识深度渗透 def build_medical_prompt(): return ChatPromptTemplate.from_…...

基础入门-HTTP数据包红蓝队研判自定义构造请求方法请求头修改状态码判断

知识点: 1、请求头&返回包-方法&头修改&状态码等 2、数据包分析-红队攻击工具&蓝队流量研判 3、数据包构造-Reqable自定义添加修改请求 一、演示案例-请求头&返回包-方法&头修改&状态码等 数据包 客户端请求Request 请求方法 …...

Golang Web单体项目目录结构最佳实践

在Golang 开发Web 项目的过程中,如何组织目录结构是一项至关重要的任务。合理的目录结构不仅能提高代码的可维护性,还能为团队协作提供清晰的代码规范。 为什么要设计合理的目录结构? 在 Golang 项目中,代码的组织方式会影响开发…...

【系统架构设计师】体系结构文档化

目录 1. 说明2. 重要性3. 主要内容4. 编写原则5. 实践建议6. 例题6.1 例题1 1. 说明 1.绝大多数的体系结构都是抽象的,由一些概念上的构建组成。2.层的概念在任何程序设计语言中都不存在。3.要让系统分析员和程序员去实现体系结构,还必须将体系结构进行…...

C++性能优化—AI润色版

上接《C性能优化—人工底稿版》 C性能优化深度解析:从编码技巧到硬件协同 "过早优化是万恶之源" —— Donald Knuth 但合理的性能优化是优秀C工程师的核心能力。本文从编码实践到硬件原理,系统梳理C性能优化的知识体系。 一、性能优化的哲学…...

继承(python)

一、基础知识 (一)定义:子类能继承父类所有的公有属性和公有方法(先使用子类的方法、属性) (二)格式: class 子类名(父类名): #父类 class Ph…...

jmap使用

常用命令 jmap -heap PID jmap -histo PID | head -20 jmap -dump:formatb,fileheap_dump.hprof PID jmap 是 Java 开发工具包(JDK)提供的一个命令行工具,用于生成 Java 进程的内存映射信息。它可以帮助开发者分析 Java 堆内存的使用情况…...

Android的MQTT客户端实现

在 Android 平台上实现 MQTT 客户端的完整技术方案,涵盖基础实现、安全连接、性能优化和最佳实践: 一、技术选型与依赖配置 推荐库 Eclipse Paho Android Service(官方维护,支持后台运行) gradle 复制 // build.gradl…...

Vue.js 如何自定义主题和样式

Vue.js 如何自定义主题和样式 今天我们来聊聊如何在 Vue 项目中自定义主题和样式。无论是你想让自己的应用看起来独一无二,还是想快速适配设计稿,自定义主题和样式都是必不可少的一环。下面我将和大家分享几种常见的自定义方法和技巧。 为什么要自定义…...

强化学习 DPO 算法:基于人类偏好,颠覆 PPO 传统策略

目录 一、引言二、强化学习基础回顾(一)策略(二)价值函数 三、近端策略优化(PPO)算法(一)算法原理(二)PPO 目标函数(三)代码示例&…...

线上HBase client返回超时异常分析 HBase callTimeout=60000

问题现象 HBase client直接返回超时异常 HBase callTimeout=60000, callDuration=60301: row ‘12649160863966c2790195059018040900010003320’ on table ‘Z_UPA’ at region=Z_UPA,1213d1a56,1184027415643. ba7224f83dbb09591a74b7059f17., hostname=abcd,60020,891863950…...

CTF中特别小的EXE是怎么生成的

我们在打CTF时候,出题的爷爷们给出的exe都很小 就10k左右,有的甚至就5k,那时候我很郁闷啊。现在我也能了啊哈哈 不多bb按如下操作: 我们来看看正常的release生成的代码# Copy #include "windows.h" int main(){ Messa…...

Python 字典(一个简单的字典)

在本章中,你将学习能够将相关信息关联起来的Python字典。你将学习如何访问和修改字典中的信息。鉴于字典可存储的信息量几乎不受限制,因此我们会演示如何遍 历字典中的数据。另外,你还将学习存储字典的列表、存储列表的字典和存储字典的字典。…...

爬虫技巧汇总

一、UA大列表 USER_AGENT_LIST 是一个包含多个用户代理字符串的列表,用于模拟不同浏览器和设备的请求。以下是一些常见的用户代理字符串: USER_AGENT_LIST [Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; Hot Lingo 2.0),Mozilla…...

SCT2A15一款5.5V-100V 1.8A峰值电流限制 高效率非同步降压DCDC转换器,SOT23-6L封装

SCT2A15是一款异步降压转换器&#xff0c;输入电压范围从5.5V到100V&#xff0c;可适应各种降压应用&#xff0c;是汽车、工业和照明应用的理想选择。 SCT2A15集成了975mΩ高侧MOSFET&#xff0c;峰值输出电流在Vin<60V时限制为1.8A&#xff0c;可支持高峰值电流的应用。 SC…...

数据结构——二叉树

好&#xff0c;上一篇我们已经讲过了堆&#xff0c;也已经了解了二叉树的基础知识后&#xff0c;我们今天来实现二叉树的相关代码。 由于初始二叉树&#xff0c;由于现在对二叉树结构掌握还不够深入&#xff0c;为了降低学习成本&#xff0c;此处我们来手动快速创建一棵简单的二…...

六、 通用异步收发器UART

6.1 UART简介 UART&#xff08;Universal Asynchronous Receiver/Transmitter&#xff0c;通用异步收发传输器&#xff09;是一种用于异步串行通信的硬件设备。它通过两根信号线&#xff08;TX 和 RX&#xff09;实现全双工通信&#xff0c;广泛应用于微控制器、计算机和外设之…...

基于Kotlin中Flow扩展重试方法

最近项目中统一采用Kotlin的Flow来重构了网络请求相关代码。 目前的场景是&#xff0c;接口在请求的时候需要一个accessToken值&#xff0c;因为此值会过期或者不存在&#xff0c;需要刷新&#xff0c;因此最终方案是在使用Flow请求的时候先获取accessToken值然后再进行接口请求…...

在 Open WebUI+Ollama 上运行 DeepSeek-R1-70B 实现调用

在 Open WebUI Ollama 上运行 DeepSeek-R1-70B 实现调用 您可以使用 Open WebUI 结合 Ollama 来运行 DeepSeek-R1-70B 模型&#xff0c;并通过 Web 界面进行交互。以下是完整的部署步骤。 1. 安装 Ollama Ollama 是一个本地化的大模型管理工具&#xff0c;它可以在本地运行 …...

速度超越DeepSeek!Le Chat 1100tok/s闪电回答,ChatGPT 4o和DeepSeek R1被秒杀?

2023年&#xff0c;当全球科技界还在ChatGPT引发的AI狂潮中沉浮时&#xff0c;一场来自欧洲的"静默革命"正悄然改变游戏规则。法国人工智能公司Mistral AI推出的聊天机器人Le Chat以"比ChatGPT快10倍"的惊人宣言震动业界&#xff0c;其背后承载的不仅是技术…...

如何使用C++将处理后的信号保存为PNG和TIFF格式

在信号处理领域&#xff0c;我们常常需要将处理结果以图像的形式保存下来&#xff0c;方便后续分析和展示。C提供了多种库来处理图像数据&#xff0c;本文将介绍如何使用stb_image_write库保存为PNG格式图像以及使用OpenCV库保存为TIFF格式图像。 1. PNG格式保存 使用stb_ima…...

2 CXX-Qt #[cxx_qt::bridge] 宏指南

#[cxx_qt::bridge] 宏是用于在 Rust 中创建一个模块&#xff0c;该模块能够桥接 Rust 和 Qt&#xff08;通过 C&#xff09;之间的交互。它允许你将 Rust 类型暴露给 Qt 作为 QObject、Q_SIGNAL、Q_PROPERTY 等&#xff0c;同时也能够将 Qt 的特性和类型绑定到 Rust 中&#xf…...

PHP函数介绍—get_headers(): 获取URL的响应头信息

概述&#xff1a;在PHP开发中&#xff0c;我们经常需要获取网页或远程资源的响应头信息。PHP函数get_headers()能够方便地获取目标URL的响应头信息&#xff0c;并以数组形式返回。本文将介绍get_headers()函数的用法&#xff0c;以及提供一些相关的代码示例。 get_headers()函…...

C#树图显示目录下所有文件以及文件大小(使用Stack元组来替换递归)

接上篇 C#树图显示目录下所有文件以及文件大小_c# 查看文件夹里面有多少文件-CSDN博客 上一篇我们使用递归的方法来实现绑定目录和文件到树图中,关键程序代码如下: 这里我们使用Stack的方式非递归方法来实现绑定目录和文件到树图: /// <summary>/// 递归方法&#xff…...

计算机毕业设计Python+Spark知识图谱医生推荐系统 医生门诊预测系统 医生数据分析 医生可视化 医疗数据分析 医生爬虫 大数据毕业设计 机器学习

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…...

机器学习:朴素贝叶斯分类器

贝叶斯决策论是概率框架下实施决策的基本方法,对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。 贝叶斯定理是贝叶斯决策论的基础&#xff0c;描述了如何根据新的证据更新先验概率&#xff0c;贝叶斯定理&…...

解决 keep-alive 缓存组件中定时器干扰问题

当使用 keep-alive 缓存组件时&#xff0c;组件中的定时器可能会在组件被缓存后继续运行&#xff0c;从而干扰其他组件的逻辑。为了避免这种情况&#xff0c;可以通过以下方法解决&#xff1a; 1. 在组件的 deactivated 钩子中清理定时器 keep-alive 为缓存的组件提供了 acti…...

1-portal认证功能

很多时候公共网络需要提供安全认证功能&#xff0c;比如我们去星巴克或者商场、酒店&#xff0c;我们连接wifi上网的时候&#xff0c; 需要认证后才可以上网。 用户可以主动访问已知的Portal认证网站&#xff0c;输入用户名和密码进行认证&#xff0c;这种开始Portal认证的方式…...