当前位置: 首页 > news >正文

《大模型时代——智能体的崛起与应用实践(微课视频版)》

在人类技术演进的长河中,人工智能(Artificial Intelligence,AI)无疑是最具革命性的篇章之一。随着科技的飞速发展,人类迎来了一个全新的纪元—大模型时代。本章旨在深入剖析这一时代的内涵,从大模型的基本概念出发,探索其发展历程,关键技术要素,核心价值,以及支撑其发展的相关技术或方法,为读者描绘一幅智能体崛起与应用实践宏伟画卷的开篇,通义千问[1]以大模型时代为主题绘制的图像如图1-1所示。

图1 1 绚丽多彩的大模型时代即将到来(通义千问生成)
什么是大语言模型
大模型这一术语近年来频繁出现在人工智能研究与应用的前沿,它不仅象征着技术趋势,更标志着人工智能领域的一场革命。大模型的核心在于其规模和能力的双重飞跃,通常指代那些拥有数十亿甚至数千亿参数的深度学习模型。这些模型通过在海量数据上进行预训练,掌握了丰富的语言模式、世界知识和复杂的逻辑推理能力。不同于早期的AI系统,大模型能够执行多样化的任务,从文本生成、翻译、问答到图像识别和音乐创作等,展现出了跨领域的泛化能力。鉴于当前智能体应用中主要是大语言模型(Large Language Model,LLM),故在本书后续内容中,除非特别说明,所提及的大模型均指大语言模型。
LLM的本质是一个语言模型,其工作原理是基于统计学习方法,通过分析大量的文本数据来预测下一个词或句子出现的概率。在预训练阶段,语言模型会在大规模的文本语料库上进行训练,学习文本数据中的模式、语法和语义信息。在微调阶段,语言模型可以在特定任务上进行调整,以适应特定的应用场景。为了更具体地描述语言模型的工作原理,引入式(1-1):
⏞I┴(x_1 ) ⏞went┴(x_2 ) ⏞to┴(x_3 ) ⏞the┴(x_4 )→argmax Ρ(x_5 | x_1,x_2,x_3,x_4 )→⏞store┴(x_5 ) (1-1)
式(1-1)表明,一个序列的概率可以通过计算每个词在给定前面所有词的条件下出现的概率来得到。在实际应用中,为了简化计算,通常会引入一些假设,例如马尔可夫假设,它假设一个词出现的概率只与它前面的几个词有关,而不是与整个序列的历史有关。
为了更直观地理解LLM的工作机制,一个典型的模型工作原理如图1-2所示。该流程包括学习大量文本数据,通过这种方式,LLM能够获得推理和生成能力。这些能力使模型能够通过预测下一个词或句子出现的概率,有效地完成各种下游任务,如文本生成、翻译、问答等。

图1 2 一个典型的大语言模型工作原理
图1-2展示了LLM的工作原理。左侧的结构化数据和非结构化文本知识输入LLM中,经过处理后,LLM能够生成文本、回答问题及提取信息。此外,图1-2底部还列出了部分与LLM相关的企业和它们的产品,如OpenAI、GPT-4、Gemini、智谱清言和Llama 2等。接下来,将结合图1-2的内容,对LLM在开发和应用过程中的关键环节进行阐述,这些环节对于模型的构建和优化至关重要:
1.文本收集、整理和预处理
文本收集:在这一阶段,研究人员会从各种渠道收集大量的文本数据,包括书籍、文章、网页内容、对话记录等。这些数据的多样性和覆盖面对于训练一个全面、能力强的大模型至关重要。
文本整理:收集到的文本需要经过整理,以确保数据的质量和一致性。这可能包括去除重复内容、纠正错误、统一文本格式等。
预处理:在训练模型之前,文本数据需要经过预处理,以提升模型训练的效率和效果。预处理步骤包括分词、去除停用词、词干提取、词性标注等。此外,还涉及将文本转换为模型能够理解的表示,如使用词嵌入(Embedding)技术。
2.大模型的预训练、微调和强化学习
预训练:在这一阶段,模型会在大规模的文本语料库上进行训练,学习文本数据中的模式、语法和语义信息,预训练的目的是让模型获得广泛的语言理解和逻辑推理能力[2,3]。
微调:预训练完成后,模型会在特定格式的任务上进行微调。微调会使用针对特定任务标记的数据集,让模型适应特定的应用场景,如文本分类、机器翻译等,此外,要想获得能够理解人类对话方式的能力,也需要进行特定的微调[4]。
强化学习:强化学习是一种通过与环境互动来学习最优策略的方法[5]。在大模型的训练过程中,强化学习可以用于进一步提升模型在特定任务上的表现,例如生成更符合特定风格或目标的文本。
此外,为了使大模型能够体现出类似于人类的伦理判断和价值观,也需要采用专门的强化学习策略。这涉及设计能够引导模型学习到正确行为规范的环境和奖励机制,确保模型在生成内容或做出决策时能够遵循社会的伦理标准和法律法规。通过这种方式,强化学习不仅能提升模型的技术性能,还能够促进模型在社会责任和伦理道德方面的表现,使其更好地服务于人类社会。
3.面向下游任务的知识和内容输出
知识输出:经过预训练和微调的大模型存储着大量且丰富的知识,这些知识可以用于回答问题、提供解释、生成摘要等。模型可以根据输入的提示或上下文,输出相关的知识和信息。
内容生成:大模型还能够生成各种类型的文本内容,如文章、故事、诗歌等。这些生成的内容可以用于娱乐、教育、创意写作等多个领域。
多模态输出:除了文本,一些大模型还能够生成其他类型的内容,如图像、音频等,这种多模态的输出能力使大模型在处理和理解多模态数据方面具有广泛的应用潜力。当然,多模态输出这部分并不在本文的研究范围内。
大模型的发展历程
大模型的兴起可追溯至深度学习技术的突破与算力的大幅提升。从早期的Word2Vec[6]等词嵌入技术,到Transformer架构[7]的诞生,再到GPT[8]系列、BERT[9]、T5[10]等模型的相继问世,每次迭代都标志着大模型在规模和能力上的重大跨越。这一历程不仅体现了技术的迭代,更是数据利用、算法优化与硬件协同发展的集中体现。具体来讲,大模型的发展可以分为几个关键阶段:
(1)萌芽期:20世纪90年代至2010年前后,AI主要依赖于专家系统和规则引擎,但受限于手动编程的知识表示,难以处理复杂任务。此时,浅层学习模型开始出现,如支持向量机、神经网络等,为后来深度学习的兴起奠定了基础。
(2)突破期:2013年,Geoffrey Hinton等人提出的深度学习技术在图像识别竞赛中的巨大成功,标志着深度学习时代的到来[11]。同年,Word2Vec的发布,为自然语言处理(Natural Language Processing,NLP)带来了词嵌入的概念,让机器首次能够理解词语的语境意义。
(3)变革期:2017年,Google Brain团队推出了Transformer架构,解决了序列到序列学习中的并行化难题,极大地提升了模型训练效率。同年,OpenAI发布的GPT-1,首次展示了基于Transformer的大规模语言模型在生成任务上的潜力。
(4)爆发期:随后几年,BERT、GPT-2、GPT-3、T5等模型相继发布,参数量从几百万激增至几千亿,预训练-微调范式的成功应用,让大模型成为AI研究的焦点。这些模型在多项基准测试中刷新记录,展示了超越人类水平的特定任务性能。
大语言模型发展的里程碑节点如图1-3所示。图1-3详细描绘了从早期Word2Vec词嵌入技术的出现,到Transformer架构的创新,再到GPT系列、BERT、T5等模型的推出,每步都在模型规模和能力上实现了显著飞跃。这一过程不仅展现了技术的快速进步,也体现了数据利用、算法优化和硬件发展的紧密协作。图1-3将带您深入了解这一激动人心的发展历程。

图1 3 大模型发展过程中的一些重要里程碑节点
关键技术要素
本节旨在剖析大模型时代到来的技术必然性和自然语言处理领域的突破性技术要素,围绕Transformer架构的创新设计、预训练与微调技术的策略性进展,以及硬件加速与并行计算在模型训练效率上的显著提升,全方位解码推动当代语言模型不断向前发展的核心动力与关键技术。
1.3.1 模型架构:Transformer的奥秘
Transformer架构自2017年提出以来,彻底革新了自然语言处理领域。它摒弃了传统循环神经网络[12](Recurrent Neural Network,RNN)和长短期记忆网络[13](Long Short-Term Memory network,LSTM)在处理序列数据时的顺序依赖性,通过并行处理机制显著提高了训练速度,Transformer架构[7]的原理如图1-4所示。

图1 4 Transformer架构组成
Transformer的核心组件包括自注意力机制、位置编码、多头注意力和残差连接等。
(1)自注意力机制:这是Transformer的灵魂,它使模型能够直接关注输入序列的不同部分,从而捕捉序列内部的长距离依赖关系。自注意力计算过程涉及3个向量:Query(查询)、Key(键)和Value(值)。对于序列中的每个单词,模型会计算它与其他所有单词的相似度(通过Query和Key的点积),然后利用这些相似度作为权重,对Value进行加权求和,以此获得当前单词的上下文表示。
(2)位置编码:在Transformer模型中,由于自注意力机制本身不包含对序列中元素位置信息的考虑,因此引入了位置编码的概念。位置编码通过固定或可学习的方式,向输入的词嵌入中添加位置信息,这样模型就能够识别并区分序列中各个单词的相对位置。这种编码方式使Transformer模型能够理解词序,对于处理诸如语法结构和句子意义等依赖于词序的任务至关重要。
(3)多头注意力:多头注意力机制是Transformer模型中的一个核心组成部分,它通过并行地执行多个自注意力机制,也就是所谓的“头”,来增强模型的表达能力和学习效率。每个自注意力头都能够独立地关注输入序列的不同部分,从而捕捉到多种上下文特征。这种并行化的处理方式允许模型同时考虑序列中的多个位置信息,使模型能够在不同层次上学习到丰富的表示,进而提高了处理复杂语言结构的效能。
(4)残差连接与层归一化:每层Transformer都会在自注意力和前馈网络之间使用残差连接和层归一化,这有助于梯度流动,减少训练难度,加速收敛过程。残差连接通过在自注意力模块和前馈网络之间引入一个直接连接,有助于梯度在网络中的流动,防止了深层网络中梯度消失或爆炸的问题。层归一化则对每层的输入进行标准化处理,减少了内部协变量偏移,使模型更容易学习。这两者的结合使用,不仅减少了训练难度,还加速了模型的收敛过程,使Transformer模型能够有效地学习到输入数据的复杂特征。
1.3.2 预训练策略:从无监督到强大的语言表示
预训练是指在大量无标注文本数据上训练模型,以便模型能够学习到语言的一般规律和结构。常见的预训练任务包括
(1)掩码语言模型(Masked Language Modeling,MLM):以BERT为代表的MLM任务,随机遮蔽输入文本中的某些词汇,模型需要预测被遮蔽词汇。这种任务迫使模型理解和预测上下文,从而学习丰富的语言表示,BERT掩码语言模型的预测机理如图1-5所示。

图1 5 BERT掩码语言模型的预测机理
(2)下一句预测(Next Sentence Prediction,NSP):下一句预测是一种预训练任务,尽管它在某些最新的模型中可能不再作为标配,但它曾经是增强模型理解文本连贯性的重要手段。NSP任务通过训练模型判断两个句子是否在原始文本中相邻,从而让模型学会捕捉句子间的逻辑关系和连贯性。以BERT作为预训练语言模型的下一句预测实例如图1-6所示。

图1 6 下一句预测方法实例展示
(3)无监督学习:无监督学习是在自然语言处理中的一种重要预训练方法,它利用大规模的无标注数据对模型进行训练。在这个过程中,模型能够自主学习并捕捉到丰富的语言模式和知识。这些通过无监督学习获得的知识随后可以通过微调策略迁移到各种特定的任务上,极大地提升了模型的泛化能力和对未知数据的处理能力。无监督学习的优势在于它不依赖于昂贵的标注数据,因此能够在大规模数据集上高效地学习,为模型提供了广泛的语言理解基础。

相关文章:

《大模型时代——智能体的崛起与应用实践(微课视频版)》

在人类技术演进的长河中,人工智能(Artificial Intelligence,AI)无疑是最具革命性的篇章之一。随着科技的飞速发展,人类迎来了一个全新的纪元—大模型时代。本章旨在深入剖析这一时代的内涵,从大模型的基本概念出发,探索其发展历程,关键技术要素,核心价值,以及支撑其发…...

第三节:GoLangChain提示词(Prompts)处理详解

在使用大语言模型(LLM)时,提示词(Prompt)是与模型交互的关键。良好的提示词设计能够显著提升模型输出的质量。本文将基于langchaingo库,详细介绍Go语言中处理提示词的几种主要方式。 1. 引言在与大语言模型交互时,提示词的设计至关重要。LangChain框架提供了一套完整的提示词…...

rhel8 中vdo 邏輯卷的邏輯擴容

物理盤 = 500G vdo size = 2000G 擴容到5000Gumount /home/repo vdo stop --name=vdo01 vdo growLogical --name=vdo01 --vdoLogicalSize=5000Gdf --human-readable /home/repoxfs_growfs /dev/mapper/vdodf --human-readable /home/repovdostats --human...

Codeforces Round 1051 (Div. 2) 部分题解

D E F 题解Codeforces Round 1051 (Div. 2) 部分题解 D - Inversion Graph Coloring 理解成二分图,图中没有奇环,等价于序列不存在 \(i<j<k\) 使得 \(a_i>a_j>a_k\) 。 设 \(f_{i,x,y}\) 表示前 \(i\) 个数,当前序列最大值为 \(x\) ,下一个不能取小于 \(y\) 的…...

kingbase金仓数据库的密码有效期和密码复杂度

Kingbase金仓数据库提供了密码有效期和复杂度配置功能,可以通过以下方式进行设置: 一. 密码有效期配置 插件identity_pwdexp identity_pwdexp是KingbaseES的一个扩展插件,用于设置口令有效期。 KingbaseES的用户管理中含有口令有效期这一属性,用户密码过期检查就是通过设置…...

HDF5文件

掌握HDF5文件:先理解核心结构(打基础),再学C#读写库(搭环境),最后实战读写操作(练手)。 全程结合代码示例,确保新手能跟上。 阶段1:先搞懂HDF5文件的核心结构(必须先理解!) HDF5(Hierarchical Data Format 5)是一种分层结构的二进制文件格式,专门用于存储和管…...

Error encountered when performing Introspect the Portion of idea Introspect using JDBC metadata在哪设置

Error encountered when performing Introspect the Portion of 最新解决方案&新版本idea Introspect using JDBC metadata在哪设置?前言 使用idea2025专业版(MAC)连接mySQL后无法显示表结构,并且报错 Error encountered when performing Introspect the Portion of 1 …...

核桃 CSP-S 模拟

核桃 CSP-S 模拟 T3 题意: 给定一个 \(01\) 串,选定一个操作序列,每次从原串中删除一个数,保持原串中相对顺序不变,把形成的新字符串加入答案字符串,求出本质不同答案字符串总数。 其中 \(n\le 400\) 思路: 我们不妨把题意转化一下,对于每一个节点赋值 \(t_i\) 表示 \(…...

正确输入连字号、连接号、破折号和负号

转载:Pigman - 博客园: 正确输入连字号、连接号、破折号和负号论文书写和报告编制中,经常出现连字号、连接号、破折号和负号的混淆使用,既不符合规范也影响文档美观。下面对这组符号进行区分,并给出word下正确输入方法。连字号 (Hyphen),[-] 1) 英语中的复合词,…...

9 月记录

P13644 K-LCA 给出树和 \(k\),每次询问给出区间 \([l,r]\),找到选择 \(k\) 个区间内的点使得 LCA 深度最大。 \(n,q\le 10^5,1<k\le n\)。考虑回滚莫队,每次加入一个点,二分最深的子树个数 \(\ge k\) 的祖先,可以做到两个 \(\log\)。 考虑树链剖分,标号是先标号轻儿子…...

python基础-元组

元组: 一个元组可以存储多个数据,切元组内的数据是不可更改 t1 = (10,20,30)t2 = (10,)t3 = 10, 元组操作:元组不支持修改,只支持查找tuple.index()访问:下标访问: tuple[index]统计某项元素出现的次数: tuple.count(item)元组的长度: length = len(tuple)目标元素的位置…...

.net core中获得程序集以及注入框架的方法总结

虚方法public class Animal { // 虚方法 public virtual void MakeSound() { Console.WriteLine("动物发出声音"); } }public class Dog : Animal { // 重写虚方法 public override void MakeSound() { Console.WriteLine("汪汪汪!"); } }var sss = Assem…...

python基础篇-list(列表)

list:列表中可以一次性存储多个数据,且数据项的类型可以不同 常见操作:1.查找下标访问,查找某个位置的数据项: list[index]查找某个数据项首次出现的下标: list.index[item, 开始位置下标, 结束位置下标];如果存在则返回出现位置下标,如果不存在,则报错出现的次数: li…...

vscode使用powershell中文乱码

VSCode使用终端中文乱码 原因: vscode编辑文本默认使用utf-8,但是windows的终端默认使用gbk(简体中文)编码。utf-8采用1-4位记录一个字符,其中中文采用3位。gbk采用两位记录一个中文字符。所以中文显示乱码。 解决方案:先确认终端是中文编码,在终端输入chcp,若输出936表…...

关于如何读懂 P11832 [省选联考 2025] 图排列?

题面太形式化了! 我!根!本!读!不!懂! 这题想要拿分必须转化题面。 初步转化 他只给了我们 \((p_{a_i},p_{b_i})\),然后让我们去找最小的 \(p\)? 没给我 \(a_i,b_i\)?\(a_i,b_i\) 不用刻意构造出来,我们只需要时刻保证 \(a_i,b_i\) 的限制就可以了。 假设我们拿到了最…...

Untitled

Untitled展开思考过程 Hinted 3/5 似乎没有性质,因此考虑做一步转化。 考虑一个点若被同种边通过大于 2 次,那么 必然有一次没有用,考虑每条边可以是区间 +1 或者是区间 -k(k 足够大),要求最终每个点 <0 并且绝对值不是 k 的倍数 让我想到同余最短路,但是我们可以考虑…...

敏感性分析

什么是敏感性分析? 数学模型只是实际问题的一个粗略的抽象,最优解也只是针对某一特定的数学模型。管理者要对未来做各种假设,在这些假设下,测试可能产生的结果,通过对各种结果深入分析来指导决策。通常,在取得最初版本模型的最优解之后,进行分析 才能取得对问题深入的认…...

完整教程:论园区电气安全管理系统的重要性

完整教程:论园区电气安全管理系统的重要性pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !impo…...

基于CSU8RP1186芯片的握力器解决方案

握力器方案采用高精度传感器、ADC芯片和先进的数据处理技术,可将物体的重量以千克和磅为单位进行准确测量和记录,其原理是通过在称重时,握力器传感器的金属构架受力形变,贴片上的金属丝也随着被拉长或缩短,金属丝电阻因此改变,通过测量金属丝的电阻变化,得到所称重物的数…...

亮相2025年服贸会,天翼云打造高质量算力服务新生态!

近日,2025年中国国际服务贸易交易会(简称服贸会)在北京隆重举行。本届服贸会以“数智领航,服贸焕新”作为年度主题,顺应服务贸易数字化、智能化、绿色化趋势,聚焦人工智能、医疗健康、智慧物流、商旅文体健融合发展等专业领域,展示多个国家和地区的创新发展成果。天翼云…...

易路薪酬专家Agent:基于10亿级数据与AI的智能薪酬解决方案

导读: 在AI深度赋能人力资源管理的趋势下,薪酬模块的智能化已成为企业提升人效与战略决策的关键。本文深度解析易路人力资源科技公司最新推出的人才薪酬专家Agent,重点介绍其基于10亿级动态市场数据与多智能体协同(市场数据Agent、薪酬诊断Agent、竞品招聘动态Agent)的核心…...

有点意思!Java8后最有用新特性排行榜!

相信这两天看了 JDK 25 新特性的同学已经彻底对 Oracle 失望了,这那是挤牙膏啊?是连牙膏都懒得挤了。 所以,大家都在评论区喊话,如果你(Oracle)实在不想发可以不发,但不要糊弄大家。 那么,今天呢。我也把从 JDK 8 之后的长期支持版:JDK11、JDK17、JDK21、JDK25 的新特…...

数据结构 Trick 之:KDT 求 k 近/远 点

注意,此 Trick 的时间复杂度是错的,但是貌似目前没人能卡满。 能够解决的问题\(O(n \sqrt n)\) 可过。 维护二维平面。 每次求到一个点的 \(k\) 近或 \(k\) 远点。 \(k\) 很小(\(20\) 左右)思路 二维空间想到 KDTree(TreeKevin Durant Tree)。 众所周知,动态维护 \(k\) …...

.NET 8程序配置版本及产品信息

一、给主程序单独添加配置 1、双击主程序,会打开主程序的.csproj文件,在PropertyGroup下添加 <Company>Your Company</Company><Product>Your Product</Product><Version>1.2.3</Version><FileVersion>1.2.3.0</FileVersion…...

C语言第二讲:进制转化

C语言中进制转化的符号表示进制 数据类型 赋值格式二进制 %0b a=0b1010八进制 %o a=03344十进制 %d a=1234十六进制 %x/%X a=0x34a5 / 0X43D6输出时转化: int a=100; printf("%o",a); 赋值时转化: int a; a=03355//赋值为八进制数...

XXL-JOB(4)

XXL-JOB(4)分片任务 分片任务能更好的利用集群的能力,可以同时调度多个机器并行运行任务。分片任务的实现原理包括以下几个核心步骤:1、任务分配当一个分片任务被触发时,调度器会根据任务的分片参数决定需要多少个执行器参与任务。每个执行器或执行线程会接收到一个分片索…...

QOJ #10485. Peculiar Protocol 题解

Description 你有一个序列 \(a_1, a_2, \dots, a_n\),以及两个参数 \(d, r\)。 你可以做如下操作若干次:每次选择一段区间,使得他们的和可以被表示成 \(k \times d + r\) 的形式,其中 \(k\) 是一个非负整数。 你把 \(k\) 加入分数中,然后在序列中删去这一段,剩下的序列合…...

C++ 常用关键字

1. static 控制作用域、生命周期或类成员归属 // 1. 全局/命名空间:仅当前文件可见(避免跨文件重定义) static int global_static = 10; // 其他文件无法通过 extern 访问// 2. 局部变量:生命周期延长至程序结束(仅初始化1次) void counter() {static int cnt = 0; cnt++…...

【AP出版】第四届数理统计与经济分析国际学术会议 (MSEA 2025)

第四届数理统计与经济分析国际学术会议 (MSEA 2025)将于2025年12月05-07日在中国广州召开。【高录用快见刊:最快一周内即可录用,会后3-4个月见刊】 【征稿范围:数理统计、经济分析大方向主题均可收稿】 第四届数理统计与经济分析国际学术会议 (MSEA 2025) 2025 4th Internat…...

数据结构 Trick 之:区间子区间计数

能够解决的问题\(O(n \log n)\) 可过。 维护数列,无修改,每次查询一个区间的所有子区间。 离线思路 看到一个区间的所有子区间这种查询,直接做显然是做不了的。 考虑离线,那么将询问区间进行右端点排序,然后就可以扫描线搞掉一维。 我们从左往右枚举 \(r\) 维护线段树 \(t…...

mapstruct.Mapper|Mapping详解

------------------------------------------------------------------------------------------ org.mapstruct.Mapper 和 org.mapstruct.Mapping 是 MapStruct 框架中的核心注解,用于实现 Java 对象之间的自动映射。MapStruct 是一个代码生成器,通过注解配置生成类型安全、…...

抽象代数-学习笔记

主要积累一些遇到的例子、题目。不定时更新。 运算有结合律的运算:普通/复数/矩阵/模意义下加法、乘法,映射复合,与或异或/集合相关, min/max。 仅仅满足部分群公理:\(\mathbb{N}^*, \mathbb{N}\)。\(\{0,1,2\}\) 上可构造有单位元、有逆元但无结合律的运算。 域的性质仅仅…...

如何在保证质量的前提下,快速完成一份 PPT?

这是一个非常经典且普遍的问题,尤其对于产品经理、咨询顾问等角色来说,PPT既是生产力工具,也是时间吞噬黑洞。你能意识到这个问题并寻求解决方案,已经领先了很多人。 在保证质量的前提下快速完成PPT,绝非单纯追求“手速”,而是一套系统工程,涉及工作流程、工具链、方法论…...

Source Code Summarization in the Era of Large Language Models 论文笔记

介绍 (1) 发表:ICSE25 (2) 背景 之前的研究表明,与传统的代码摘要模型相比,LLM 生成的摘要在表达方式上与参考摘要有很大不同,并且倾向于描述更多的细节。因此,传统的评估方法是否适合评估 LLM 生成摘要的质量仍然未知 (3) 贡献 受到 NLP 工作的启发,本文对使用 LLM 本身…...

线性回归-入门案例

使用公开的房价数据集进行预测,数据包含8个特征1个目标值 特征最多使用2次幂代码示例 import numpy as np import pandas as pd from sklearn.datasets import fetch_california_housing from sklearn.linear_model import LinearRegression from sklearn.metrics import mean…...

XXL-JOB(3)

XXL-JOB(3)开发Bean模式(基于方法)Bean模式任务,支持基于方法的开发方式,每个任务对应一个方法。基于方法开发的任务,底层会生成JobHandler代理,和基于类的方式一样,任务也会以JobHandler的形式存在于执行器任务容器中。优点:每个任务只需要开发一个方法,并添加”@Xxl…...

ClickHouse 表引擎深度解析:ReplacingMergeTree、PARTITION、PRIMARY KEY、ORDER BY 详解 - 若

ClickHouse 表引擎深度解析:ReplacingMergeTree、PARTITION、PRIMARY KEY、ORDER BY 详解 前言 ClickHouse 作为高性能的列式数据库,其表引擎设计是其核心优势之一。ReplacingMergeTree 是处理重复数据的利器,而 PARTITION、PRIMARY KEY、ORDER BY 等配置直接影响查询性能和…...

UOS统信服务器操作系统V20(1070)安装mysql8.4.5(建议安装glibc2.28版本)

环境:OS:UOS Server 20 统信服务器操作系统V20(1070)mysql:8.4.5 glib.2.17 操作系统下载https://www.chinauos.com/resource/download-server查看系统glibc版本[root@localhost yum.repos.d]# ldd --versionldd (GNU libc) 2.28Copyright (C) 2018 Free Software Foundation, …...

web5(phps源码泄露)

访问index.phps,会自动下载index.php文件 点击查看即可得到flag...

web3(自带网络工具包查看数据)

查看源码什么也没有扫目录也什么都没有只能说信息收集能力还欠佳, 我们可以先尝试使用浏览器自带的网络工具查看一下数据包。...

web17(备份的sql文件泄露)

用常见的数据库工具打开即可...

web11(通过Dns检查查询Flag)

:::info 223.5.5.5测试的解析结果是否具有代表性?(来自阿里云官网)具备一定的代表性,在国内客户端使用223.5.5.5有一定的用户群体,但是该测试结果并不能代表全部用户;如果223.5.5.5测试已经生效,但是您本地仍然不能访问,那么可以侧面反映至少使用223.5.5.5的Local DNS用户…...

ctfshow_web11

ctf.show_web11简单的代码审计,这段代码定义了一个名为replaceSpecialChar的函数,该函数接受一个字符串$strParam作为参数。函数内部使用了正则表达式$regex来匹配SQL语句中的一些关键字,包括select、from、where、join、sleep、and、空格\s、union和逗号,。preg_replace($r…...

ctfshow_web13

ctf.show_web13今天也算是碰到一个新类型的文件上传类的题目(与文件包含结合了可以说)首先尝试了直接传一句话木马,全都被ban了,算是没招了就扫了下目录,进去看一眼,好像页面没回显什么东西,再试试看upload.php.bak(这里看备份文件算是一种新思路,说不定过滤了什么东西…...

ctfshow_web9

ctf.show_web9尝试爆破无果,应该不是弱口令爆破题,那么我们就扫一下目录进去看看访问该目录后会自动下载一个php文件,打开看看可以看出这是一个sql注入漏洞,通过post传参一个paasword的变量值。经过md5加密后被用来与用户名匹配 md5($pass, true) 返回的是 MD5 哈希的二进制…...

锁屏界面无法通过任意键弹出开机密码

长按ctrl+alt+delete弹出...

应急响应-日志分析 - voasem

web服务器日志在很多时候,我们经常需要分析网站的日志,以此来查看网站运行的各种情况。比如说如果网站被攻击,我们可以通过查看日志来溯源攻击者。 Apache 日志目录:/Apache/logs/logs目录下有两个文件,一个是 access.log ,就是用户的访问日志。还有一个是 error.log,这…...

ctfshow web 10

ctfshow web 10打开题目长这样,点击取消会自动下载indexs.php文件,打开查看源码 <?php$flag="";function replaceSpecialChar($strParam){$regex = "/(select|from|where|join|sleep|and|\s|union|,)/i";return preg_replace($regex,"",$s…...

【ACM出版】第四届公共管理、数字经济与互联网技术国际学术会议(ICPDI 2025)

第四届公共管理、数字经济与互联网技术国际学术会议(ICPDI 2025)定于2025年9月26-28日在中国-北京举行。【高录用快见刊、检索:审稿录用速度快】 【录用信息完整:含ISSN号,DOI,封面目录】 第四届公共管理、数字经济与互联网技术国际学术会议(ICPDI 2025) The 4th Inter…...

SMA的射频连接器

SMA的射频连接器射频相关的器件和应用设备经常会用到各种各样的射频连接器,这里将介绍一部分常用的连接器。上图是不同型号的连接器的使用频率,这里仅供参考,因为随着工艺和科技的发展,各个型号的连接器使用频率范围可能会有所变化。SMA连接器SMA型射频同轴连接器是Bendix公…...