当前位置: 首页 > news >正文

深入解析:思维链模型在大语言模型中的应用与实践

在人工智能领域,大语言模型的发展正以前所未有的速度改变着我们的生活和工作方式。从早期的文本生成到如今的复杂推理,模型的能力不断进化。而其中,思维链(Chain-of-Thought, CoT)技术的出现,更是为大模型的推理能力带来了质的飞跃。本文将深入探讨思维链模型的核心原理、应用场景、技术实现,以及从实验室到生产环境的关键挑战。

一、从生成到推理:大模型的进化之路

大语言模型的发展经历了从“生成”到“理解”再到“推理”的三个阶段。早期的模型(如 GPT-2)主要侧重于文本生成能力,能够根据输入生成连贯的文本,但在逻辑推理和复杂问题解决方面表现有限。随后,模型逐渐具备了更强的语义理解能力(如 GPT-3),能够更好地理解上下文并生成更准确的回答。然而,真正的突破在于推理能力的提升,而思维链技术正是实现这一目标的核心。

(一)思维链的起源与发展

思维链的概念最初由谷歌大脑的高级研究员 Jason Wei 提出,并在 2022 年 1 月发表的论文「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」中进行了详细阐述。其核心思想是通过显式地展示模型的推理过程,提升其在复杂任务中的表现。简单来说,思维链就是让模型像人类一样,将问题分解为多个步骤,逐步推导出答案。这种“分步思考”的方式不仅提高了模型的准确性,还使其具备了更强的可解释性。

(二)思维链的核心价值

思维链的核心价值在于其“分而治之”的策略。当面对复杂难题时,模型摒弃直接生成答案的简单做法,而是通过一系列中间步骤进行逻辑推导。以数学问题为例,传统模型可能直接输出结果,而借助思维链技术的模型则会详细列出步骤,清晰展示整个推理流程,这使得模型的推理过程更加透明,便于发现潜在错误。

二、思维链:推理大模型的核心

思维链技术的核心原理是将复杂问题分解为多个简单的子问题,并逐步解决这些子问题,最终得出答案。这种分步推理的方式不仅提高了模型的准确性,还增强了其可解释性。以下是思维链技术的关键要素:

(一)分步提示设计

在编写大模型应用时,通过特定格式的提示(Prompt)要求模型展示思考过程。例如,使用关键词如“Let’s think step by step”触发逐步推理。这种提示设计支持零样本(Zero-shot)和少样本(Few-shot)两种模式。

(二)中间状态生成

模型生成中间推理步骤作为文本,每个步骤作为后续推理的上下文基础。通过自回归方式逐步生成内容,最终得出结果。

(三)结果提取

在推理过程中,模型会逐步生成中间结果,并最终提取出最终答案。这一过程不仅提高了模型的准确性,还使其具备了更强的可解释性。

三、思维链的应用场景

思维链技术的应用场景非常广泛,涵盖了从教育到医疗、从金融到法律等多个领域。以下是几个典型的应用案例:

(一)教育领域

在智能辅导系统中,思维链可以帮助学生理解复杂问题的解决过程。例如,在数学辅导中,模型可以逐步展示解题步骤,帮助学生掌握解题思路。

(二)医疗领域

在医疗诊断中,思维链可以帮助医生分析患者的症状和检查结果,逐步推导出可能的诊断结果。例如,模型可以根据患者的症状(如发热、咳嗽)和检查结果(如白细胞计数升高),逐步推导出可能的疾病(如肺炎)。

(三)金融领域

在风险评估和投资决策中,思维链可以帮助分析师逐步推导出潜在的风险和收益。例如,模型可以根据市场数据(如股票价格、经济指标)逐步推导出投资建议。

(四)法律领域

在法律咨询中,思维链可以帮助律师分析案件事实和法律条文,逐步推导出法律意见。例如,模型可以根据案件事实(如合同条款、双方行为)和法律条文逐步推导出法律责任。

四、应用技术原理

(一)分步提示设计

在编写大模型应用时,通过特定格式的提示(Prompt)要求模型展示思考过程。例如,使用关键词如“Let’s think step by step”触发逐步推理。这种提示设计支持零样本(Zero-shot)和少样本(Few-shot)两种模式。

(二)中间状态生成

模型生成中间推理步骤作为文本,每个步骤作为后续推理的上下文基础。通过自回归方式逐步生成内容,最终得出结果。

(三)结果提取

在推理过程中,模型会逐步生成中间结果,并最终提取出最终答案。这一过程不仅提高了模型的准确性,还使其具备了更强的可解释性。

(四)示例代码

以下是使用思维链技术解决数学问题的代码示例:

from openai import OpenAI
client = OpenAI(api_key="api_key", base_url="https://dashscope.aliyuncs.com/compatible-mode/v1")def chain_of_thought(question):prompt = f"""
Q: {question}
A: 让我们一步一步地思考这个问题。"""response = client.chat.completions.create(model="qwen-plus",messages=[{"role": "user", "content": prompt}],temperature=0.7,max_tokens=500)return response.choices[0].message.content# 测试数学问题
result = chain_of_thought("如果一辆车在2小时内行驶了120公里,那么它的平均速度是多少公里/小时?")
print(result)

(五)关键要素解析

  • 提示工程:使用明确的步骤指示词,保持问题与推理的格式一致性,示例选择需具有代表性。
  • 温度参数:较低温度(0.2-0.5)适合确定性推理,较高温度(0.7-1.0)促进创造性思考。

(六)技术优势

  • 提升复杂问题解决能力:数学题准确率提升40%+。
  • 增强结果可解释性:模型的推理过程更加透明。
  • 支持多步骤逻辑验证:便于发现潜在错误。
  • 降低幻觉(Hallucination)概率:减少模型生成错误信息的可能性。

五、表面简单背后的实际复杂性

虽然思维链技术在应用层面看似简单,但其背后隐藏着巨大的复杂性。这些复杂性主要体现在模型训练、推理优化和算法核心难题等方面。

(一)模型训练成本

  • 数据需求:需要清洗TB级的高质量文本数据(例如 LLaMA 训练用了 1.4T token)。
  • 计算资源:训练 175B 参数的 GPT-3 需约 3640 PetaFLOP/s-day(约 460 万美元电费)。
  • 分布式训练:需掌握模型并行、流水线并行技术。

(二)推理优化挑战

  • 显存管理:加载 7B 参数模型需约 28GB 显存(FP32 精度)。
  • 速度优化
    • KV Cache 优化:如 vLLM 的 PagedAttention。
    • 动态批处理:Continuous batching。
  • 量化技术:将 FP32 转为 INT8/INT4(需处理精度损失)。

(三)算法核心难题

  • 长程依赖处理:Transformer 的注意力复杂度 O(n²) 问题。
  • 知识一致性:避免事实性错误(如 RAG 增强技术)。
  • 安全防护:对抗 Prompt 注入攻击的防御机制。

六、从 Demo 到生产的关键差距

从实验室的 Demo 到生产环境的实现,存在巨大的差距。以下是几个关键方面的对比:

(一)性能指标对比

  • 响应速度:从 2-10 秒/请求提升到 <500 毫秒/请求。
  • 并发能力:从单请求提升到 1000+ QPS。
  • 显存占用:从完整加载到量化 + 卸载优化。

(二)工程化必需组件

  • 负载均衡:合理分配用户请求。
  • 路由决策:根据问题类型选择合适的推理模块。
  • 结果验证:确保推理结果的准确性。
  • 安全过滤:防止恶意攻击。

(三)生产环境代码示例

以下是工业级推理服务的核心逻辑(简化版):

class InferenceService:def __init__(self):self.model = load_quantized_model()self.cache = RedisCache()self.validator = FactChecker()async def handle_request(self, prompt):# 检查缓存if cached := self.cache.get(prompt):return cached# 推理过程with torch.cuda.amp.autocast():  # 混合精度加速output = self.model.generate(prompt,use_flash_attention=True,  # 注意力优化max_new_tokens=200)# 后处理validated = self.validator.check(output)self.cache.set(prompt, validated)return validated

七、未来展望

随着技术的不断进步,思维链模型将在更多领域发挥重要作用。未来的发展方向可能包括:

(一)多模态融合

将思维链技术与多模态数据(如图像、语音)结合,进一步提升模型的推理能力。

(二)实时交互

开发实时交互的推理系统,提高用户体验。

(三)模型压缩与优化

通过量化、剪枝等技术,进一步优化模型的性能和效率。

八、总结

思维链模型作为大语言模型的重要技术突破,为复杂推理任务提供了强大的支持。其分步推理的方式不仅提高了模型的准确性,还增强了其可解释性。虽然从实验室到生产环境存在诸多挑战,但随着技术的不断发展,思维链模型将在更多领域发挥重要作用,为人工智能的发展注入新的动力。


相关文章:

深入解析:思维链模型在大语言模型中的应用与实践

在人工智能领域&#xff0c;大语言模型的发展正以前所未有的速度改变着我们的生活和工作方式。从早期的文本生成到如今的复杂推理&#xff0c;模型的能力不断进化。而其中&#xff0c;思维链&#xff08;Chain-of-Thought, CoT&#xff09;技术的出现&#xff0c;更是为大模型的…...

服务器多客户端连接核心要点(1)

刷题 服务器多客户端连接核心要点 多进程服务器 实现原理 fork子进程&#xff1a;每次accept新客户端后&#xff0c;调用fork创建子进程。独立处理&#xff1a;子进程负责与客户端通信&#xff08;如read/write&#xff09;&#xff0c;父进程继续监听新连接。 特点 隔离性…...

SIGIR 2025端到端生成式推荐ETEGRec

文章目录 1. 背景2. 方法2.1 框架图2.2 问题定义2.3 Item Tokenizer2.4 Generative Recommender2.5 ⭐️Sequence-Item Alignment2.6 ⭐️Preference-Semantic Alignment2.7 交替优化 3. 总结 现阶段 GRM 大多是两阶段的模型&#xff0c;第一阶段进行内容理解-行为语义对齐&…...

rust 中的 EBNF 介绍

在 rust 参考手册中&#xff0c;有大量类似&#xff1a; 句法 MacroInvocation :SimplePath ! DelimTokenTreeDelimTokenTree :( TokenTree* )| [ TokenTree* ]| { TokenTree* }TokenTree :Token排除 定界符(delimiters) | DelimTokenTreeMacroInvocationSemi :SimplePath ! (…...

解决 Redis 缓存与数据库一致性问题的技术指南

Redis 缓存与数据库一致性是分布式系统中常见的挑战&#xff0c;尤其在高并发场景下&#xff08;如电商、用户管理、对账系统&#xff09;。Redis 作为高性能缓存&#xff0c;常用于加速数据访问&#xff0c;但其与数据库&#xff08;如 MySQL&#xff09;之间的数据同步可能因…...

LlamaIndex 第六篇 SimpleDirectoryReader

SimpleDirectoryReader 是将本地文件数据加载到 LlamaIndex 的最简单方式。虽然在实际生产场景中&#xff0c;您更可能需要使用 LlamaHub 提供的多种数据读取器&#xff08;Reader&#xff09;&#xff0c;但 SimpleDirectoryReader 无疑是快速入门的理想选择。 支持的文件类型…...

window 显示驱动开发-配置内存段类型

视频内存管理器&#xff08;VidMm&#xff09;和显示硬件仅支持某些类型的内存段。 因此&#xff0c;内核模式显示微型端口驱动程序&#xff08;KMD&#xff09;只能配置这些类型的段。 KMD 可以配置内存空间段和光圈空间段&#xff0c;其中不同&#xff1a; 内存空间段由保存…...

【人工智能学习之动作识别TSM训练与部署】

【人工智能学习之动作识别TSM训练与部署】 基于MMAction2动作识别项目的开发一、MMAction2的安装二、数据集制作三、模型训练1. 配置文件准备2. 关键参数修改3. 启动训练4. 启动成功 ONNX模型部署方案一、环境准备二、执行转换命令 基于MMAction2动作识别项目的开发 一、MMAct…...

PostgreSQL冻结过程

1.冻结过程 冻结过程有两种模式&#xff0c;依特定条件而择其一执行。为方便起见&#xff0c;将这两种模式分别称为惰性模式&#xff08;lazy mode&#xff09;和迫切模式&#xff08;eager mode&#xff09;。 并发清理&#xff08;Concurrent VACUUM&#xff09;通常在内部…...

SSHv2公钥认证示例-Paramiko复用 Transport 连接

在 Paramiko 中复用 Transport 连接时&#xff0c;若要通过 公钥认证&#xff08;而非密码&#xff09;建立连接&#xff0c;需手动加载私钥并与 Transport 关联。以下是详细操作步骤及完整代码示例&#xff1a; 步骤 1&#xff1a;加载私钥文件 使用 RSAKey 或 Ed25519Key 类…...

华为5.7机考-最小代价相遇的路径规划Java题解

题目内容 输入描述 输出描述 示例&#xff1a; 输入&#xff1a; 2 1 2 2 1 输出&#xff1a; 3 思路&#xff1a; Dijkstra 算法实现 dijkstra(int sx, int sy, int[][] dirs) 方法&#xff1a; 参数&#xff1a;起点坐标 (sx, sy) 和允许的移动方向 初始化&#xff1…...

element-ui分页的使用及修改样式

1.安装 npm install element-ui -S 2.在main.js中引入,这里是全部引入&#xff0c;也可以按需引入 import ElementUI from element-ui import element-ui/lib/theme-chalk/index.css Vue.use(ElementUI) 3.使用 layout"prev, pager, next, jumper" &#xff1a;jumpe…...

[Unity]-[UI]-[Image] 关于UI精灵图资源导入设置的详细解释

Unity UI Sprite UI资源导入详解图片导入项目Texture TypeTexture ShapeAdvanced Setting 高级设置 图片设置案例常见细节问题 知识点详解来源 UI资源导入详解 Unity中的UI资源有图片、矢量图、字体、预制体、图集、动画等等资源。 这其中图片是最重要以及最基础的资源组成&a…...

MLX-Audio:高效音频合成的新时代利器

MLX-Audio&#xff1a;高效音频合成的新时代利器 现代社会的快节奏生活中&#xff0c;对语音技术的需求越来越高。无论是个性化语音助手&#xff0c;还是内容创作者所需的高效音频生成工具&#xff0c;语音技术都发挥着不可或缺的作用。今天&#xff0c;我们将介绍一个创新的开…...

操作系统导论——第27章 插叙:线程API

关键问题&#xff1a;如何创建和控制线程&#xff1f; 操作系统应该提供哪些创建和控制线程的接口&#xff1f;这些接口如何设计得易用和实用&#xff1f; 一、线程创建 编写多线程程序的第一步就是创建新线程&#xff0c;因此必须存在某种线程创建接口。在 POSIX 中&#xff1…...

代采系统:定义、优势与未来趋势

一、代采系统的定义 代采系统是一种基于互联网的集中采购平台&#xff0c;它通过整合供应链资源&#xff0c;为中小企业或个人提供采购代理服务。商家可以在没有自己库存的情况下销售产品&#xff0c;当客户下单时&#xff0c;订单信息会自动或手动发送给供应商&#xff0c;由…...

后缀表达式+栈(详解)(c++)

前言 很抱歉&#xff0c;上一期没有介绍栈stack的用法&#xff0c;今天简要介绍一下&#xff0c;再讲讲后缀表达式&#xff0c;用stack栈做一些后缀表达式的练习。 栈 栈stack是c中系统给出的栈&#xff0c;有了它&#xff0c;就不用自己创建栈啦&#xff01; 头文件 栈sta…...

Kaggle图像分类竞赛实战总结详细代码解读

前言 我是跟着李沐的动手学深度学习v2视频学习深度学习的&#xff0c;光看不做假把式&#xff0c;所以在学习完第七章-现代卷积神经网络之后&#xff0c;参加了一次李沐发布的Kaggle竞赛。自己动手&#xff0c;从组织数据集开始&#xff0c;到训练&#xff0c;再到推理&#x…...

开源AI对比--dify、n8n

原文网址&#xff1a;开源AI对比--dify、n8n-CSDN博客 简介 本文介绍开源AI工作流工具的选型。 对比 项difyn8n占优者学习难度简单中等dify核心理念用LLM构建应用。“连接一切”。以工作流自动化连接各系统。平手工作模式 Chatflow&#xff1a;对话。支持用户意图识别、上下…...

【SQL系列】多表关联更新

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

软件设计师教程——第一章 计算机系统知识(下)

前言 在竞争激烈的就业市场中&#xff0c;证书是大学生求职的重要加分项。中级软件设计师证书专业性强、认可度高&#xff0c;是计算机相关专业学生考证的热门选择&#xff0c;既能检验专业知识&#xff0c;又有助于职业发展。本教程将聚焦核心重点&#xff0c;以点带面构建知…...

华为银河麒麟 V10(ARM)系统软件部署全攻略:Redis、RabbitMQ、MySQL 等集群搭建指南

一、Redis 集群部署&#xff08;主从 哨兵模式&#xff09; 1. 环境准备 系统&#xff1a;华为银河麒麟 V10&#xff08;ARM64&#xff09;节点&#xff1a;3 台服务器&#xff08;1 主 2 从 3 哨兵&#xff09; 2. 安装包下载 bash # 华为镜像站 wget https://update.c…...

World of Warcraft [CLASSIC][80][Deluyia] [Fragment of Val‘anyr]

瓦兰奈尔的碎片 [Fragment of Valanyr] 有时候下个班打个游戏&#xff0c;没想到套路也这么多&#xff0c;唉&#xff0c;何况现实生活&#xff0c;这一个片版本末期才1000G&#xff0c;30个&#xff0c;也就30000G&#xff0c;时光徽章等同月卡15000G&#xff0c;折合一下也就…...

C++:求分数序列和

【描述】 有一个分数序列 2/1,3/2,5/3,8/5,13/8,21/13,.... 求这个分数序列的前n项之和。 输入 输入有一行&#xff1a;正整数n。 输出 输出有一行&#xff1a;分数序列的和&#xff08;浮点数&#xff0c;精确到小数点后4位&#xff09;。 【样例输入】 99 【样例输出】 160.4…...

支付宝沙盒模式商家转账经常出现 响应异常: 解包错误

2025年5月9日16:27:08 php8.3 laravel11 octane swoole加速 测试时不时就出现 响应异常: 解包错误 错误信息&#xff1a; Yansongda\Artful\Exception\InvalidResponseException: 响应异常: 解包错误 in /opt/www/vendor/yansongda/artful/src/Direction/CollectionDirect…...

第04章—技术突击篇:如何根据求职意向进行快速提升与复盘

经过上一讲的内容阐述后&#xff0c;咱们定好了一个与自身最匹配的期望薪资&#xff0c;接着又该如何准备呢&#xff1f; 很多人在准备时&#xff0c;通常会选择背面试八股文&#xff0c;这种做法效率的确很高&#xff0c;毕竟能在“八股文”上出现的题&#xff0c;也绝对是面…...

数据统计的意义:钱包余额变动

钱包余额变动统计的核心意义在于通过数据可视化实现资金流动的透明化管理&#xff0c;其价值主要体现在以下五个维度&#xff1a; 一、财务健康诊断&#xff08;&#xff09; 资金流动可视化 通过期初/期末余额对比&#xff0c;可快速识别异常波动&#xff08;如连续3个月余额…...

单调栈模版型题目(3)

单调栈型题目贡献法 基本模版 这是数组a中的 首先我们要明白什么叫做贡献&#xff0c;在一个数组b{1,3,5}中&#xff0c;连续包含1的连续子数组为{1}&#xff0c;{1,3}&#xff0c;{1,3,5}&#xff0c;一共有三个&#xff0c;这三个数一共能组成6个连续子数组&#xff0c;而其…...

PostgreSQL 的 pg_advisory_lock 函数

PostgreSQL 的 pg_advisory_lock 函数 pg_advisory_lock 是 PostgreSQL 提供的一种应用级锁机制&#xff0c;它不锁定具体的数据库对象&#xff08;如表或行&#xff09;&#xff0c;而是通过数字键值来协调应用间的并发控制。 锁的基本概念 PostgreSQL 提供两种咨询锁(advi…...

NLP基础

1. 基本概念 自然语言处理&#xff08;Natural Language Processing&#xff0c;简称NLP&#xff09;是人工智能和语言学领域的一个分支&#xff0c;它涉及到计算机和人类&#xff08;自然&#xff09;语言之间的相互作用。它的主要目标是让计算机能够理解、解释和生成人类语言…...

[AI Tools] Dify 工具插件上传指南:如何将插件发布到官方市场

Dify 作为开源的 LLM 应用开发平台,不仅支持本地化插件开发,也提供了插件市场机制,让开发者能够将自己构建的插件发布并供他人使用。本文将详细介绍如何将你开发的 Dify Tools 插件上传至官方插件市场,包括 README 编写、插件打包、仓库 PR 等核心步骤。 一、准备 README 文…...

Qt读写XML文档

XML 结构与概念简介 XML&#xff08;可扩展标记语言&#xff09; 是一种用于存储和传输结构化数据的标记语言。其核心特性包括&#xff1a; 1、树状结构&#xff1a;XML 数据以层次化的树形结构组织&#xff0c;包含一个根元素&#xff08;Root Element&#xff09;&#xff…...

htmlUnit和Selenium的区别以及使用BrowserMobProxy捕获网络请求

1. Selenium&#xff1a;浏览器自动化之王 核心定位&#xff1a; 跨平台、跨语言的浏览器操控框架&#xff0c;通过驱动真实浏览器实现像素级用户行为模拟。 技术架构&#xff1a; 核心特性&#xff1a; 支持所有主流浏览器&#xff08;含移动端模拟&#xff09; 精…...

C#黑魔法:鸭子类型(Duck Typing)

C#黑魔法&#xff1a;鸭子类型(Duck Typing) 如果它走起路来像鸭子&#xff0c;叫起来像鸭子&#xff0c;那么它就是鸭子。 鸭子类型&#xff0c;主要应用于动态语言类型&#xff0c;比如JS、Python等&#xff0c;核心理念为&#xff1a;关注对象的行为&#xff08;方法或属性…...

2025 年数维杯数学建模B题完整论文代码模型

《2025 年数维杯数学建模B题完整论文代码模型》 B题完整论文 一、赛事背景与题目总览 2025 年第十届数维杯大学生数学建模挑战赛的 B 题聚焦于“马拉松经济的高质量发展思路探索”。近年来&#xff0c;我国马拉松赛事如同一颗颗璀璨的星星&#xff0c;在城市的天空中闪耀&am…...

C++23 中的 views::chunk:深入探索与应用

文章目录 一、views::chunk 的背景与动机二、views::chunk 的基本用法语法与参数示例代码 三、views::chunk 的高级用法处理不完整块与 views::drop 和 views::take 结合 四、性能分析五、应用场景1. 批量处理数据2. 分页显示3. 并行处理 六、与其他范围适配器的组合1. 与 view…...

库室指静脉人脸门禁机 LK-BM-S10C/JR

1、采用大于等于四核处理器&#xff0c;主频大于1G&#xff1b; 2、内存≥4G DDR3&#xff1b;存储≥8G 3、核心模块采用国产工业级处理芯片和嵌入式Android实时多任务系统&#xff0c;采用模块化设计,模块间通过标准接口相连&#xff1b; 4、大于等于10英寸电容屏&#xf…...

低成本自动化改造的18个技术锚点深度解析

执行摘要 本文旨在深入剖析四项关键的低成本自动化技术&#xff0c;这些技术为工业转型提供了显著的运营和经济效益。文章将提供实用且深入的指导&#xff0c;涵盖老旧设备联网、AGV车队优化、空压机系统智能能耗管控以及此类项目投资回报率&#xff08;ROI&#xff09;的严谨…...

线程中常用的方法

知识点详细说明 Java线程的核心方法集中在Thread类和Object类中,以下是新增整合后的常用方法分类解析: 1. 线程生命周期控制 方法作用注意事项start()启动新线程,JVM调用run()方法多次调用会抛出IllegalThreadStateException(线程状态不可逆)。run()线程的任务逻辑直接调…...

运维体系架构规划

运维体系架构规划是一个系统性工程&#xff0c;旨在构建高效、稳定、安全的运维体系&#xff0c;保障业务系统的持续运行。下面从规划目标、核心模块、实施步骤等方面进行详细阐述&#xff1a; 一、规划目标 高可用性&#xff1a;确保业务系统 724 小时不间断运行&#xff0c…...

C++结构体介绍

结构体的定义 在C中&#xff0c;结构体&#xff08;struct&#xff09;是一种用户定义的数据类型&#xff0c;允许将不同类型的数据组合在一起。结构体的定义使用struct关键字&#xff0c;后跟结构体名称和一对花括号{}&#xff0c;花括号内包含成员变量的声明。 struct Pers…...

RoPE长度外推:外插内插

RoPE:假定 α \alpha α是定值 其中一半位置是用cos表示的 cos ⁡ ( k α − 2 i d ) \cos(k\alpha^{-\frac{2i}{d}}) cos(kα−d2i​)(另一半是sin)(d是词嵌入维度) 当太长如何解决: 1 直接不管—外插 缺点:超过一定长度性能急剧下降。(较大时&#xff0c;对应的很多位置编码…...

牛客练习赛138-题解

牛客练习赛138-题解 https://ac.nowcoder.com/acm/contest/109081#question A-小s的签到题 题目描述 给定一个比赛榜单&#xff1a; 第一行是 n 个不同的大写字母&#xff0c;代表题号第二行是 n 个形如a/b的字符串&#xff0c;表示每道题的通过人数和提交人数 找到通过人…...

MySQL高可用方案全攻略:选型指南与AI运维实践

MySQL高可用方案全攻略:选型指南与AI运维实践 引言:当数据库成为业务生命线 在数字化时代,数据库就是企业的"心脏"。一次数据库宕机可能导致: 电商网站每秒损失上万元订单游戏公司遭遇玩家大规模流失金融系统引发连锁反应本文将为你揭秘: MySQL主流高可用方案…...

【库(Library)、包(Package)和模块(Module)解析】

在Python中&#xff0c;**库&#xff08;Library&#xff09;、包&#xff08;Package&#xff09;和模块&#xff08;Module&#xff09;**是代码组织的不同层级&#xff0c;而import语句的导入行为与它们密切相关。以下是详细对比和解释&#xff1a; &#x1f4e6; 1. 核心概…...

记录一次使用thinkphp使用PhpSpreadsheet扩展导出数据,解决身份证号码等信息科学计数法问题处理

PhpSpreadsheet官网 PhpSpreadsheet安装 composer require phpoffice/phpspreadsheet使用composer安装时一定要下载php对应的版本&#xff0c;下载之前使用php -v检查当前php版本 简单使用 <?php require vendor/autoload.php;use PhpOffice\PhpSpreadsheet\Spreadshee…...

为什么业务总是被攻击?使用游戏盾解决方案

业务频繁遭受攻击的核心原因在于攻防资源不对等&#xff0c;攻击者利用技术漏洞、利益驱动及企业防护短板发起攻击&#xff0c;而游戏盾通过针对性架构设计实现高效防御。以下是具体分析与解决方案&#xff1a; ​​一、业务被攻击的根源​​ ​​利益驱动攻击​​ ​​勒索与数…...

4.1【LLaMA-Factory 实战】医疗领域大模型:从数据到部署的全流程实践

【LLaMA-Factory实战】医疗领域大模型&#xff1a;从数据到部署的全流程实践 一、引言 在医疗AI领域&#xff0c;构建专业的疾病诊断助手需要解决数据稀缺、知识专业性强、安全合规等多重挑战。本文基于LLaMA-Factory框架&#xff0c;详细介绍如何从0到1打造一个垂直领域的医…...

二维旋转矩阵:让图形动起来的数学魔法 ✨

大家好&#xff01;今天我们要聊一个超酷的数学工具——旋转矩阵。它就像数学中的"旋转魔法"&#xff0c;能让图形在平面上优雅地转圈圈。别被"矩阵"这个词吓到&#xff0c;其实它就是一个数字表格&#xff0c;但功能超级强大&#xff01; 一、什么是旋转…...

go语言封装、继承与多态:

1.封装&#xff1a; 封装是通过将数据和操作数据的方法绑定在一起来实现的。在Go语言中&#xff0c;封装通过结构体&#xff08;struct&#xff09;和方法&#xff08;method&#xff09;来实现。结构体的字段可以通过大小写来控制访问权限。 package stutype Person struct …...