初识大模型——大语言模型 LLMBook 学习(一)
1. 大模型发展历程
🔹 1. 早期阶段(1950s - 1990s):基于规则和统计的方法
代表技术:
-
1950s-1960s:规则驱动的语言处理
- 早期的 NLP 主要依赖 基于规则的系统,如 Noam Chomsky 提出的 生成语法(Generative Grammar)。
- 这些系统使用手工编写的规则来解析和生成句子,但扩展性差。
-
1970s-1990s:统计语言模型(Statistical Language Models, SLM)
- 1980s 以后,随着计算能力的提高,研究者开始使用 统计方法 处理语言,如 n-gram 语言模型。
- 1990s,隐马尔可夫模型(HMM) 和 条件随机场(CRF) 被广泛用于语音识别和词性标注。
🔹 2. 机器学习时代(2000s - 2018s):神经网络与深度学习
代表技术:
-
2000s:基于神经网络的 NLP
- 2003 年,Bengio 等人提出神经网络语言模型(Neural Language Model, NLM),引入了**词向量(Word Embeddings)**的概念。
- 2013 年,Google 的 Word2Vec 算法问世,使得词向量学习成为 NLP 研究的标准方法。
-
2014-2017:RNN、LSTM、Seq2Seq 和 Attention
- 2014 年,循环神经网络(RNN) 和 长短时记忆网络(LSTM) 被用于机器翻译。
- 2015 年,Google 提出了 Seq2Seq 模型,用于机器翻译和文本摘要。
- 2017 年,Google 发表论文《Attention Is All You Need》,提出 Transformer 模型,彻底改变 NLP 领域。
🔹 3. 预训练大模型时代(2018 - 至今):Transformer 和大规模语言模型
代表技术:
-
2018 年:BERT(Google)
- Google 发表 BERT(Bidirectional Encoder Representations from Transformers),首次引入 双向 Transformer 预训练,显著提升 NLP 任务的表现。
-
2019 年:GPT-2(OpenAI)
- OpenAI 推出 GPT-2(Generative Pre-trained Transformer 2),展示了强大的文本生成能力,但由于担心滥用,最初未完全公开。
-
2020 年:GPT-3(OpenAI)
- GPT-3 具有 1750 亿参数,是当时最大的语言模型,能够执行多种 NLP 任务,如写作、翻译、编程等。
-
2021 年:T5、GPT-3.5、Codex
- Google 推出 T5(Text-to-Text Transfer Transformer),强调统一 NLP 任务的架构。
- OpenAI 发布 Codex,用于代码生成,并成为 GitHub Copilot 的核心技术。
-
2022 年:GPT-4、PaLM、BLOOM
- OpenAI 发布 GPT-4,具备更强的推理能力和多模态(文字+图片)处理能力。
- Google 推出 PaLM(Pathways Language Model),支持更大的数据规模和更广泛的任务。
- 由多个研究机构联合开发的 BLOOM 模型,作为开源替代方案。
-
2023-2024 年:GPT-4 Turbo、Gemini、Claude
- OpenAI 推出 GPT-4 Turbo,在 GPT-4 的基础上优化了速度和成本。
- Google DeepMind 发布 Gemini 1.5,支持更长的上下文窗口(100 万 token)。
- Anthropic 公司推出 Claude 3,在推理和多模态能力上有所提升。
🔹 未来趋势
- 更大规模、更高效的模型:模型参数越来越大,但也在优化计算效率,如 Mixture-of-Experts(MoE)架构。
- 多模态 AI:不仅支持文本,还能理解和生成图像、音频、视频等内容。
- 个性化 AI:未来的 AI 可能会根据用户习惯进行个性化调整,提高交互体验。
- 更强的推理与规划能力:AI 可能会发展出更复杂的逻辑推理和长期规划能力。
- 更安全和可控的 AI:随着 AI 能力增强,如何避免滥用和确保安全性成为重要研究方向。
大语言模型具有以下能力:
- 范围广泛的世界知识
- 较强的人类指令遵循能力
- 改进的复杂任务推理能力
- 较强的通用任务解决能力
- 较好的人类对齐能力
- 较强的多轮对话交互能力
这些能力使得大语言模型在知识问答、任务执行、逻辑推理、对话交互等方面表现出色,并推动 AI 技术在各个领域的应用与发展。 🚀
2. 大模型的到来引发的变革
大语言模型(LLM,如 GPT-4、Gemini、Claude 等)的发展,不仅提升了人工智能的能力,还在多个领域引发了深远的变革。以下是主要影响:
1. 人工智能应用的普及
🚀 传统 AI 向通用 AI 过渡
- 过去的 AI 主要是 专用 AI(如语音助手、搜索引擎、翻译工具)。
- 大模型推动了 通用 AI(AGI)的发展,使 AI 能够处理更广泛的任务,如写作、编程、推理、创意生成等。
✅ 影响:
- AI 由“工具”向“智能助手”转变,能自主执行复杂任务。
- AI 进入日常生活,如智能客服、虚拟助理、AI 生成内容(AIGC)。
2.生产力革命
📈 提高工作效率,改变工作方式
- 自动化办公:AI 生成报告、邮件、PPT,提升效率。
- 智能编程:AI 辅助代码开发(如 GitHub Copilot),减少重复劳动。
- 数据分析:AI 处理大规模数据,提高商业决策能力。
✅ 影响:
- 减少重复性工作,让人类专注于创造性任务。
- 降低技术门槛,让非专业人士也能利用 AI 进行复杂任务。
3.产业变革
🏭 传统行业的智能化升级
- 媒体与内容创作:AI 生成文章、视频、音乐(AIGC)。
- 教育:智能辅导、个性化学习、自动批改作业。
- 医疗:AI 辅助诊断、药物研发、健康管理。
- 法律:合同审查、法律咨询自动化。
- 金融:智能投顾、风险评估、自动交易。
✅ 影响:
- AI 让企业 降本增效,提高竞争力。
- 传统行业加速 数字化转型,催生新商业模式。
4.人才市场的变化
👨💻 AI 取代部分岗位,催生新职业
- 减少低端重复性工作(如数据录入、基础客服)。
- 催生新职业(如 AI 提示工程师、AI 伦理专家)。
- 要求更高的技能(如 AI 驱动的决策、创造性思维)。
✅ 影响:
- 部分岗位被 AI 替代,需要 提升技能 适应变化。
- 人机协作成为主流,AI 辅助人类完成更复杂的任务。
5.信息传播与认知变革
🌍 AI 影响人类获取和理解信息的方式
- 搜索引擎升级:AI 直接回答问题,减少传统搜索需求。
- 个性化推荐:AI 根据用户偏好提供精准内容。
- 信息生成:AI 生成新闻、报告、社交媒体内容。
✅ 影响:
- 加速信息传播,但也带来 虚假信息 风险。
- 改变学习方式,知识获取更加高效。
6.伦理与安全挑战
⚠️ AI 发展带来的风险
- 假信息泛滥:AI 生成的假新闻、深度伪造(deepfake)可能误导公众。
- 数据隐私问题:AI 需要大量数据,可能涉及隐私泄露。
- 算法偏见:AI 可能继承训练数据中的偏见,影响公平性。
- 滥用问题:AI 可能被用于诈骗、恶意攻击等。
✅ 影响:
- 需要 加强 AI 监管,制定 伦理规范。
- 促进 可信 AI 发展,确保 AI 透明、公正、安全。
7.科研与技术创新
🧠 AI 促进科学研究
- 加速新药研发:AI 预测分子结构,缩短研发周期。
- 物理与天文:AI 处理大规模数据,加速科学发现。
- 数学与理论研究:AI 辅助证明数学定理。
✅ 影响:
- AI 成为 科研助手,加速突破前沿科技。
- 促进 跨学科融合,推动新技术发展。
大模型的到来不仅是 AI 领域的技术突破,更是 社会、经济、文化 领域的深刻变革。它提升了生产力,改变了产业格局,同时也带来了新的挑战和机遇。未来,我们需要 合理利用 AI,推动技术向更加 安全、透明、可控 的方向发展。🚀
3. 大模型技术基础
1.大模型的定义
- 大语言模型 指的是 参数规模极大(通常数十亿到万亿级)的 预训练语言模型,能够理解和生成自然语言。
- 这些模型通过 大规模数据训练,具备 广泛的知识 和 语言理解能力。
2.大模型的架构
- 主要采用 Transformer 解码器架构
- Transformer 是目前最先进的深度学习架构之一,具有 并行计算能力强、长距离依赖建模能力强 等特点。
- 其中,大模型通常使用 解码器(Decoder) 结构,而非完整的编码器-解码器结构。
3.大模型的训练过程
训练过程分为 两大阶段:
🔹 预训练(Pre-training)—— 训练基础能力
- 数据:使用 海量文本数据(如书籍、论文、网页、对话等)。
- 优化目标:预测下一个词(Next Token Prediction)。
- 结果:训练出 基础模型(Base Model),具备 语言理解和生成能力,但尚未针对具体任务优化。
🔹 后训练(Fine-tuning)—— 增强任务能力
- 数据:使用 大量指令数据(如人类指令、对话数据、任务示例等)。
- 优化方法:
- SFT(Supervised Fine-Tuning):监督微调,让模型更好地遵循人类指令。
- RLHF(Reinforcement Learning with Human Feedback):基于人类反馈的强化学习,使模型的回答更符合人类偏好。
- 结果:训练出 指令模型(Instruct Model),能够更好地执行 特定任务(如问答、代码生成、写作等)。
拓展定律
核心观点
更大的模型(更多参数)+ 更多数据 + 更强算力 = 更强的 AI 能力
通过扩展 计算量(Compute)、数据规模(Dataset Size) 和 模型参数(Parameters),可以系统性地降低模型的 测试损失(Test Loss),提升模型的表现。
1. 计算量(Compute)
计算量越大,模型训练得越充分,损失下降。
但计算量的 回报递减,即增加计算量带来的收益逐渐减少。
2. 数据规模(Dataset Size)
训练数据越多,模型的泛化能力越强,损失下降更快。
但如果数据质量低,单纯增加数据可能不会带来提升。
3. 模型参数(Parameters)
更大的模型(更多参数)通常表现更好,但前提是有足够的数据和计算资源支持。过大的模型如果数据不足,可能会导致 过拟合(overfitting)。
-
大模型为何有效?
- 过去 AI 发展依赖于 算法优化,但大模型时代,规模扩展(Scaling)成为核心驱动力。
- 只要 数据、算力、模型规模 继续增长,AI 仍能不断进步。
-
GPT-4、Gemini 等大模型的成功
- 这些模型的进化路径符合 扩展定律,即通过 增加参数、数据、算力 来提升能力。
- 例如 GPT-4 相比 GPT-3,主要是 参数规模更大、数据更多、训练更充分,因此表现大幅提升。
-
未来发展趋势
- 目前的大模型仍在 扩展阶段,但未来可能会遇到 数据瓶颈 或 计算成本过高 的问题。
- 研究人员正在探索 更高效的训练方法,如 混合专家模型(MoE)、自监督学习优化 等,以减少计算成本。
涌现能力
📌 什么是涌现能力?
涌现能力(Emergent Abilities) 指的是 在小型模型中不存在,但在大规模模型中突然出现的能力。
1. 涌现能力的定义
- 原始论文定义:
“在小型模型中不存在,但在大模型中出现的能力。”
- 这意味着 某些复杂任务的能力 只有当模型达到 足够大的规模 时才会突然显现,而不是随着规模线性增长。
2.涌现能力的特点
- 非线性增长:随着模型规模扩大,某些能力不会逐步提升,而是在 达到某个临界点 后突然跃升。
- 超越随机水平:在小模型中,模型的表现接近随机水平,但在大模型中,表现远超随机猜测。
- 任务多样性:涌现能力可以体现在 数学推理、自然语言理解(NLU)、上下文推理 等多个任务上。
3. 论文中的实验结果
-
数学运算(Mod. Arithmetic)
- 小模型几乎无法完成数学计算,但当模型规模达到 (10^{22}) 级别时,准确率突然大幅提升。
-
多任务自然语言理解(Multi-task NLU)
- 小模型的表现接近随机水平,但大模型在理解复杂语境时表现显著提升。
-
上下文词义理解(Word in Context)
- 只有当模型达到一定规模时,才能正确理解 同一个词在不同上下文中的含义。
某些能力只有当模型足够大时才会涌现,而不是随着规模逐步提升。
- 只有当模型达到一定规模时,才能正确理解 同一个词在不同上下文中的含义。
涌现能力的影响
-
大模型的突破:
- 过去,AI 主要依赖 手工设计规则 或 小规模模型优化,但涌现能力表明 规模本身就是一种优化手段。
- 只要 增加参数、数据和计算量,AI 可能会自动学会某些复杂能力。
-
AI 发展趋势:
- 未来 AI 可能会继续展现 更多未曾预料的能力,比如更强的推理、规划、甚至自主学习能力。
- 研究人员需要探索 如何控制和利用这些能力,避免不可预测的风险。
4.大模型核心技术解析
1.规模扩展(Scaling)
- 扩展定律(Scaling Laws) 表明,增加模型参数、数据规模和计算量,可显著提升模型能力。
- 关键点:参数规模增大(如 GPT-3 → GPT-4)、数据规模扩展、计算能力提升(GPU/TPU)。
2.数据工程(Data Engineering)
- 数据数量、质量和预处理方法 直接决定模型性能。
- 关键点:海量高质量数据、数据清洗与增强、去噪处理。
3.高效预训练(Efficient Pre-training)
- 大模型训练需要强大计算资源,需建立高效、可扩展训练架构。
- 关键点:分布式训练、混合精度计算(FP16/FP8)、自监督学习。
4.能力激发(Capability Activation)
- 基础模型需微调(Fine-tuning) 以适应特定任务。
- 关键点:微调、对齐技术(RLHF)、提示工程(Prompt Engineering)。
5.人类对齐(Human Alignment)
- 防止错误、有害或偏见内容,确保 AI 可靠性。
- 关键点:安全性优化、减少幻觉(Hallucination)、伦理与公平性。
6.工具使用(Tool Use)
- 结合外部工具增强能力,拓展应用范围。
- 关键点:代码执行(Python、SQL)、搜索引擎集成、插件(Plugins)。
5.GPT和DeepSeek介绍
1. GPT体系
2.GPT发展历程
1. GPT-1(2018):开创预训练 + 微调范式
🔹 关键优化点
- 引入 Transformer 架构:相比 RNN 和 LSTM,Transformer 具备 更强的并行计算能力,提升了训练效率。
- 自回归预训练(Autoregressive Pre-training):使用 无监督学习 训练,预测下一个词(Next Token Prediction)。
- 微调(Fine-tuning):在特定任务(如问答、情感分析)上进行微调,提高模型的任务适应性。
- 参数规模:1.17 亿(1.17B)。
🔹 局限性
- 数据规模较小(仅使用 BookCorpus 训练)。
- 未使用大规模互联网数据,知识覆盖有限。
- 缺乏对齐技术,容易生成不准确或不安全的内容。
2.GPT-2(2019):扩大规模,提升文本生成能力
🔹 关键优化点
- 大规模数据训练:使用 WebText 数据集,涵盖更广泛的文本内容。
- 参数规模大幅增长:
- GPT-2 小型版:1.5 亿(0.15B)
- GPT-2 完整版:15 亿(1.5B)
- 更自然的文本生成:生成的文本连贯性和上下文理解能力显著提升。
- 零样本(Zero-shot)、少样本(Few-shot)学习:在 没有微调的情况下 也能完成部分任务。
🔹 局限性
- 仍然存在幻觉(Hallucination),容易生成不真实的内容。
- 缺乏人类对齐(Alignment),可能生成有害或偏见内容。
- 计算成本较高,训练难度增加。
3.GPT-3(2020):参数暴涨,涌现能力初现
🔹 关键优化点
- 参数规模爆炸式增长:
- GPT-3:1750 亿(175B)参数,远超 GPT-2。
- 更强的涌现能力(Emergent Abilities):
- 数学运算、代码生成、逻辑推理 等能力显著增强。
- 少样本学习(Few-shot Learning)能力提升:
- 通过 提示工程(Prompt Engineering),模型可以在 几乎不需要微调的情况下 解决复杂任务。
- 更丰富的数据训练:
- 训练数据涵盖 书籍、论文、代码、新闻、对话 等多种文本来源。
🔹 局限性
- 仍然缺乏 RLHF(人类反馈强化学习),容易生成不安全或有害内容。
- 计算成本极高,推理速度较慢。
- 幻觉问题依然存在,在事实性任务上仍有错误。
4.InstructGPT(2022):引入 RLHF,提高对齐性
🔹 关键优化点
- 引入人类反馈强化学习(RLHF):
- 通过 人类评分数据 训练模型,使其更符合人类期望。
- 减少有害内容,提高回答的安全性和准确性。
- 优化对话能力:
- 更自然、更符合用户意图,减少胡编乱造的情况。
- 成为 ChatGPT 的基础:
- InstructGPT 是 ChatGPT 的前身,使 AI 更适合对话交互。
🔹 局限性
- 仍然存在幻觉问题,但比 GPT-3 有所改善。
- 对话能力增强,但仍然无法进行深度推理和长期记忆。
4.GPT-4(2023):多模态增强,推理能力升级
🔹 关键优化点
- 引入多模态能力(Multimodal):
- 支持图像输入,可以理解图片内容(如 OpenAI 的 GPT-4V)。
- 推理能力大幅提升:
- 更强的逻辑推理、数学计算和代码生成能力。
- 更长的上下文窗口,可以处理更长的文本输入。
- 更强的对齐技术:
- 优化 RLHF 训练,减少幻觉,提高事实性回答的准确率。
- 更安全的内容生成,降低偏见和错误信息。
🔹 局限性
- 仍然无法完全消除幻觉问题,在部分领域仍可能生成错误信息。
- 计算成本极高,推理速度仍然有限。
- 对话记忆仍然有限,无法进行长期上下文追踪。
6.GPT-4.5 / GPT-5(未来预测)
🔹 可能的优化点
- 更长的上下文窗口(如 100K+ tokens)。
- 更强的多模态能力(结合视频、音频、3D 视觉等)。
- 更高效的推理能力(更接近 AGI)。
- 更低的计算成本,使 AI 更容易普及。
- 更强的个性化与记忆能力,可以长期记住用户的偏好和对话历史。
3.DeepSeek技术
发展历程
改进点
DeepSeek-V3
DeepSeek-R1
参考文献
Datawhale大模型组队学习地址
相关文章:
初识大模型——大语言模型 LLMBook 学习(一)
1. 大模型发展历程 🔹 1. 早期阶段(1950s - 1990s):基于规则和统计的方法 代表技术: 1950s-1960s:规则驱动的语言处理 早期的 NLP 主要依赖 基于规则的系统,如 Noam Chomsky 提出的 生成语法&…...
Array and string offset access syntax with curly braces is deprecated
警告信息 “Array and string offset access syntax with curly braces is deprecated” 是 PHP 中的一个弃用警告(Deprecation Notice),表明在 PHP 中使用花括号 {} 来访问数组或字符串的偏移量已经被标记为过时。 背景 在 PHP 的早期版本…...
27. Harmonyos Next仿uv-ui 组件NumberBox 步进器组件禁用状态
温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! 文章目录 1. 组件介绍2. 效果展示3. 禁用状态设置3.1 整体禁用3.2 输入框禁用3.3 长按禁用 4. 完整示例代码5. 知识点讲解5.1 禁用状态属性5.2 禁用…...
Java高频面试之集合-08
hello啊,各位观众姥爷们!!!本baby今天来报道了!哈哈哈哈哈嗝🐶 面试官:详细说说CopyOnWriteArrayList CopyOnWriteArrayList 详解 CopyOnWriteArrayList 是 Java 并发包(java.util…...
做到哪一步才算精通SQL
做到哪一步才算精通SQL-Structured Query Language 数据定义语言 DDL for StructCREATE:用来创建数据库、表、索引等对象ALTER:用来修改已存在的数据库对象DROP:用来删除整个数据库或者数据库中的表TRUNCATE:用来删除表中所有的行…...
SpringAI介绍及本地模型使用方法
博客原文地址 前言 Spring在Java语言中一直稳居高位,与AI的洪流碰撞后也产生了一些有趣的”化学反应“,当然你要非要说碰撞属于物理反应也可以, 在经历了一系列复杂的反应方程后,Spring家族的新成员——SpringAI,就…...
空指针异常的触发
面向对象分析: 当你要吃饭,饭是对象,提供吃饭这个功能,所以饭为null时,你去调吃饭这个功能,就是去操作饭这个抽象模型,但这个模型是null,就是空指针异常了,但如果有了饭…...
尚硅谷爬虫note15n
1. 多条管道 多条管道开启(2步): (1)定义管道类 (2)在settings中开启管道 在pipelines中: import urllib.request # 多条管道开启 #(1)定义管道类 #(2)在setti…...
基于SSM+Vue的汽车维修保养预约系统+LW示例
1.项目介绍 系统角色:管理员、员工、用户功能模块:用户管理、员工管理、汽车类型管理、项目类型管理、维修/预约订单管理、系统管理、公告管理等技术选型:SSM,vue(后端管理web),Layuiÿ…...
【商城实战(13)】购物车价格与数量的奥秘
【商城实战】专栏重磅来袭!这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建,运用 uniapp、Element Plus、SpringBoot 搭建商城框架,到用户、商品、订单等核心模块开发,再到性能优化、安全加固、多端适配…...
在线json转ArkTs-Harmonyos
轻松将 JSON 数据转换为类型安全的 ArkTs 接口。快速准确地生成代码,提升开发效率,告别手动编写,让您的开发流程更加流畅! gotool...
Cannot resolve symbol ‘view‘ Androidstudio报错解决办法
报错原因 出现 Cannot resolve symbol view 错误是因为代码中的 view 变量未正确定义或不在当前作用域内。以下是常见场景和解决方法: 场景 1:在 点击事件监听器 中获取 view 如果代码在 OnClickListener 的 onClick 方法中,view 是方法的参…...
三级缓存架构
三级缓存架构是一种通过分层缓存设计来优化系统性能、降低数据库负载、提高数据访问效率的解决方案,尤其适用于高并发、高吞吐量的业务场景(如电商、社交平台、实时推荐等)。其核心思想是通过多级缓存逐层过滤请求,减少对底层存储…...
webshell一些上传心得
我们以upload-labs为基础 一、前端拦截: 如第一关 工作方式: 直接在前端拦截 绕过方式: 因为没有限制后端,所有可以用bs 绕过前端修改格式即可 将需要上传的php文件改成jpg格式 使用burp suite 拦截上传后,使用re…...
doris:阿里云 MaxCompute
MaxCompute 是阿里云上的企业级 SaaS(Software as a Service)模式云数据仓库。 什么是 MaxCompute 连接 MaxCompute 示例 -- 1. 创建Catalog。 CREATE CATALOG mc PROPERTIES ("type" "max_compute","mc.default.projec…...
MyBatis-Plus 分页查询接口返回值问题剖析
在使用 MyBatis-Plus 进行分页查询时,很多开发者会遇到一个常见的问题:当分页查询接口返回值定义为 Page<T> 时,执行查询会抛出异常;而将返回值修改为 IPage<T> 时,分页查询却能正常工作。本文将从 MyBatis-Plus 的分页机制入手,详细分析这一问题的根源,并提…...
【面试】框架
框架 1、介绍一下Spring 的 IOC2、将一个类声明为 Bean 的注解有哪些3、Bean 的作用域有哪些4、Spring 框架中的 Bean 是线程安全的吗5、Spring 容器对象的懒加载6、Spring 容器中的 bean 生命周期7、谈谈自己对于 Spring DI 的了解8、注入 Bean 的注解有哪些9、Spring Boot 如…...
MWC 2025 | 紫光展锐联合移远通信推出全面支持R16特性的5G模组RG620UA-EU
2025年世界移动通信大会(MWC 2025)期间,紫光展锐联合移远通信,正式发布了全面支持5G R16特性的模组RG620UA-EU,以强大的灵活性和便捷性赋能产业。 展锐芯加持,关键性能优异 RG620UA-EU模组基于紫光展锐V62…...
《苍穹外卖》SpringBoot后端开发项目重点知识整理(DAY1 to DAY3)
目录 一、在本地部署并启动Nginx服务1. 解压Nginx压缩包2. 启动Nginx服务3. 验证Nginx是否启动成功: 二、导入接口文档1. 黑马程序员提供的YApi平台2. YApi Pro平台3. 推荐工具:Apifox 三、Swagger1. 常用注解1.1 Api与ApiModel1.2 ApiModelProperty与Ap…...
Mysql内置函数
日期函数: 例如: select current_date();---打印日期 select current_time()----打印时间 select current_timestamp();打印时间戳 select now(); ----日期时间 select date(‘2020-10-01 00:00:00’); ----提取日期进行打印: 也可以配合…...
一文了解汽车图像传感器
2024年底,安森美做了题为"How Automotive Image Sensors Transform the Future of Autonomous Driving"的演讲,这里结合其内容对自动驾驶图像传感器做一个介绍。 当前的自动驾驶感知技术主要有两大技术路线:一种是仅使用摄像头作为传感器进行信息采集的纯…...
cocos creator使用mesh修改图片为圆形,减少使用mask,j减少drawcall,优化性能
cocos creator版本2.4.11 一个mask占用drawcall 3个以上,针对游戏中技能图标,cd,以及多玩家头像,是有很大优化空间 1.上代码,只适合单独图片的,不适合在图集中的图片 const { ccclass, property } cc._decorator;c…...
面向高质量视频生成的扩散模型方法-算法、架构与实现【附核心代码】
目录 算法原理 架构 代码示例 算法原理 正向扩散过程:从真实的视频数据开始,逐步向其中添加噪声,随着时间步 t 的增加,噪声添加得越来越多,最终将原始视频数据变成纯噪声。数学上,t 时刻的视频数据与 t…...
vue3框架的响应式依赖追踪机制
当存在一个响应式变量于视图中发生改变时会更新当前组件的所以视图显示,但是没有视图中不写这个响应式变量就就算修改该变量也不会修改视图,这是为什么?我们能否可以理解宽泛的理解为vue组件的更新就是视图的更新,单当视图中不存在…...
Ubuntu本地部署Open manus(完全免费可用)
目录 1.介绍 2.环境搭建 3.更改配置 4.运行 1.介绍 关于由于邀请码的限制,导致很多用户无法顺利体验manus带来的ai agent体验,但是最近开源的open manus是另一个不错的选择。 先来看看运行的结果: 我让open manus帮我打开小米的主页&am…...
MacOS Big Sur 11 新机安装brew wget python3.12 exo
MacOS Big Sur 11,算是很老的系统了,所以装起来brew有点费劲。 首先安装brew 官网: /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 官网加速: 按照官网的方法࿰…...
基于USB Key的Web系统双因素认证解决方案:构建安全与便捷的登录体系
摘要 在网络安全威胁日益严峻的背景下,传统的“用户名密码”认证方式已难以应对钓鱼攻击、密码窃取等风险。上海安当基于USB Key技术,推出了一套面向Web系统的双因素认证解决方案,通过硬件与密码学的深度融合,实现用户身份的高强度…...
项目工坊 | Python驱动淘宝信息爬虫
目录 前言 1 完整代码 2 代码解读 2.1 导入模块 2.2 定义 TaoBao 类 2.3 search_infor_price_from_web 方法 2.3.1 获取下载路径 2.3.2 设置浏览器选项 2.3.3 反爬虫处理 2.3.4 启动浏览器 2.3.5 修改浏览器属性 2.3.6 设置下载行为 2.3.7 打开淘宝登录页面 2.3.…...
数据安全_笔记系列12:数据访问控制中的三个管理员权限划分
数据安全_笔记系列04:数据访问控制中的“三权分立”机制详解 文章链接:https://blog.csdn.net/fen_fen/article/details/145852242 数据安全_笔记系列12:数据访问控制中的三个管理员权限划分 这三个角色的职责和权限划分。 系统应具有相互独…...
通义千问本地配置并实现微调
通义千问本地配置并实现微调 最小Qwen模型大小942mb from modelscope import snapshot_download model_dir = snapshot_download(“qwen/Qwen2.5-0.5B”, cache_dir=“./models2.5”) Qwen2.5-0.5B:942MB from modelscope import snapshot_download model_dir = snapshot_d…...
文件上传漏洞(upload靶场)
目录 Pass-01:前端绕过 方法一:浏览器禁用js 方法二:直接修改或删除js脚本 方法三:修改后缀绕过 Pass-02:服务器检测 Pess-03:黑名单绕过 Pass-04:.htaccess文件 Pass-05:windows特性和user.ini 方法一:php.自动解析为ph…...
Leetcode 刷题记录 05 —— 普通数组
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答。 目录 01 最大子数组和 方法一:动态规划(卡达尼算法) 方法…...
随机过程的核心概念与Matlab实现
摘要 本文系统讲解随机过程的核心理论与Matlab实现,涵盖随机变量分布、蒙特卡罗仿真、信息熵计算及平稳过程特性。通过高斯、瑞利分布的生成代码、蒙特卡罗积分估计、窄带信号仿真等案例,结合功率谱分析与自相关函数推导,演示随机过程建模与…...
git worktree的使用
git worktree 是 Git 提供的一个强大功能,允许你在同一个仓库中同时创建多个工作目录,每个目录对应一个分支,从而实现并行开发。以下是 git worktree 的常用命令和使用方法: 1. 创建新的工作目录(Worktree)…...
delphi 正则提取html中的内容
function ExtractTextFromHTML(const HTML: string): string; var RegEx: TRegEx; begin Result := HTML; // 移除<script>标签及其内容 Result := TRegEx.Replace(Result, <script.*?>.*?</script>, , [roIgnoreCase, roSingleLine]); // 移除<s…...
深度学习系列79:Text2sql调研
参考 https://github.com/topics/text-to-sql 这里是一些资源:https://github.com/eosphoros-ai/Awesome-Text2SQL/blob/main/README.zh.md 这里是综述文章:https://zhuanlan.zhihu.com/p/647249972 1. 数据集 Spider: 一个跨域的复杂text2sql数据集&a…...
分布式锁—5.Redisson的读写锁一
大纲 1.Redisson读写锁RedissonReadWriteLock概述 2.读锁RedissonReadLock的获取读锁逻辑 3.写锁RedissonWriteLock的获取写锁逻辑 4.读锁RedissonReadLock的读读不互斥逻辑 5.RedissonReadLock和RedissonWriteLock的读写互斥逻辑 6.写锁RedissonWriteLock的写写互斥逻辑…...
【AI热点】Manus技术细致洞察报告(篇2)
针对大家对Manus产品褒贬不一的现象,基于近期对Manus的多方实测、公开信息与开源竞品的比对分析而撰写,旨在为从业者、技术爱好者以及潜在用户提供一个较为系统、专业的视角。报告将围绕Manus的核心原理、功能特点、技术亮点、常见应用场景与不足&#x…...
虚幻基础:动画层接口
文章目录 动画层:动画图表中的函数接口:名字,没有实现。动画层接口:由动画蓝图实现1.动画层可直接调用实现功能2.动画层接口必须安装3.动画层默认使用本身实现4.动画层也可使用其他动画蓝图实现,但必须在角色蓝图中关联…...
C#的简写技巧
在C#中,有许多简写技巧可以让你的代码更加简洁高效,以下是一些常见的: 1. 变量声明与初始化 使用 var 关键字 :当你能从初始化表达式中推断出变量类型时,可以使用 var 关键字代替显式的类型声明。例如: va…...
【js逆向】
地址:aHR0cHM6Ly93d3cud2VpYm90b3AuY24vMi4wLw f12进入 debugger,过debugger 查看预览数据 全局搜索 请求网址中的 api.weibotop.cn 在下方疑似找到了加密和解密的函数 断点调试 控制台输出 那个n就是 常见的 cryptoJs库 const cryptoJs require(cry…...
汽车一键启动按钮更换注意事项
汽车一键启动开关更换教程 一键启动开关是现代汽车中常见的便捷配置,但随着时间的推移,这个部件可能会出现失灵的情况。当一键启动开关发生故障时,许多车主选择自行更换。以下是整理的一键启动开关更换教程: 更换前的准备 选择匹…...
为wordpress自定义一个留言表单并可以在后台进行管理的实现方法
要为WordPress添加留言表单功能并实现后台管理,你可以按照以下步骤操作: 1. 创建留言表单 首先,你需要创建一个留言表单。可以使用插件(如Contact Form 7)或手动编写代码。 使用Contact Form 7插件 安装并激活Contact Form 7插件。 创建…...
Hive函数、外部表和分区表
目录 1. Hive自定义函数1.1 pom.xml中依赖配置1.2 Hive自定义函数示例代码1.3 打包并演示 2. 外部表3. 分区表参考 1. Hive自定义函数 Hive中简单的自定义函数需要继承org.apache.hadoop.hive.ql.udf.generic.GenericUDF,并且实现其中的三个方法: 方法功…...
再聊 Flutter Riverpod ,注解模式下的 Riverpod 有什么特别之处,还有发展方向
三年前我们通过 《Flutter Riverpod 全面深入解析》 深入理解了 riverpod 的内部实现,而时隔三年之后,如今Riverpod 的主流模式已经是注解,那今天就让我们来聊聊 riverpod 的注解有什么特殊之处。 前言 在此之前,我们需要先回忆…...
每日一题----------String 和StringBuffer和StringBuiler重点
本质:是一个char字符数组存储字符串 总结: 1.如果字符串存在大量的修改操作,一般使用StringBuffer或者StringBuilder。 2.如果字符串存在大量的修改操作,并且单线程的情况,使用StringBuilder。 3.如果字符串存在大…...
使用AI一步一步实现若依前端(5)
功能5:侧边栏菜单动态显示 功能4:首页使用Layout布局 功能3:点击登录按钮实现页面跳转 功能2:静态登录界面 功能1:创建前端项目前言 在若依中,侧边栏显示的菜单项,是根据登录用户的角色动态显…...
如何在需求分析阶段考虑未来扩展性
在需求分析阶段考虑未来扩展性的关键在于 前瞻规划、灵活架构、标准设计。其中,前瞻规划尤为重要,因为通过全面分析业务发展趋势与技术演进,能够在初期设计阶段预留足够扩展空间,降低后期改造成本,为企业长期发展奠定坚…...
平面机械臂运动学分析
平面机械臂运动学分析 一 整体概述1 研究步骤: 二 正向1 几何分析2 matlab 仿真模拟(1)实现效果(2)matlab代码: 3 DH矩阵计算法(1)计算公式(2)计算结果验证&a…...
1688店铺所有商品数据接口详解
一、接口概述淘宝开放平台提供 1688.items.onsale.get/taobao.item_search_shop 接口,可批量获取店铺在售商品列表,包含商品 ID、标题、价格、销量、图片等核心信息。该接口适用于商品库管理、竞品监控、数据分析等场景 二、接口调用流程 前期准…...