哈尔滨工业大学DeepSeek公开课人工智能:大模型原理 技术与应用-从GPT到DeepSeek|附视频下载方法
导 读INTRODUCTION
今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek 技术前沿与应用”的报告。
本报告深入探讨了大语言模型在自然语言处理(NLP)领域的核心地位及其发展历程,从基础概念出发,延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务,本身也蕴含大量知识,如地理信息、语义理解和推理能力。随着技术的发展,尤其是transformer模型的引入,预训练模型时代开启,GPT系列模型成为里程碑,GPT-3通过大规模参数和数据预训练,展现强大的文本生成能力,尽管存在知识准确性问题。ChatGPT的出现通过无监督、有监督和强化学习的融合,显著提高了模型性能和泛化能力,尤其在推理任务上取得突破。DeepSeek的RE模型通过极致的模型架构优化和开源精神,实现了高性价比、高性能的推理能力,接近甚至媲美顶尖模型,引起广泛关注。
此外,讨论了如何有效利用大模型的策略,包括清晰指令、提供丰富参考资料、分解复杂问题等,以及专业领域知识融合的方法,如检索增强和微调。最后,展望了人工智能的未来方向,强调了语言模型作为AI基石的重要地位和持续的研究挑战。
哈尔滨工业大学:《大模型原理 技术与应用-从GPT到DeepSeek》
网盘下载:https://pan.quark.cn/s/230cde4fd7c8
以下是部分内容预览:
1.大语言模型原理、技术和应用介绍
介绍主要围绕大语言模型的原理、技术和应用展开,重点讨论从GPT到DeepSeek的发展过程。主讲人陈万祥来自计算学部人工智能学院,专注于社会计算与交互机器人研究中心的研究。他强调了语言作为交流工具和知识载体的重要性,并解释了大语言模型如何通过分析和理解人类历史上的文字,掌握和创造知识。
2.自然语言处理:人工智能的皇冠明珠
自然语言处理专注于人类语言的文本符号处理,涉及理解和生成两个关键方面,被视为认知智能的一部分,是人工智能领域中尤为复杂且重要的部分。该领域的突破被视为推动人工智能更大进展的关键,因此自然语言处理被誉为人工智能皇冠上的明珠。随着语言模型的发展,自然语言处理不仅在其自身领域取得了显著进步,也促进了整个人工智能领域的快速发展。
3.自然语言处理的发展历程及大模型技术
自然语言处理学科历史悠久,自上世纪50年代计算机发明后,机器翻译作为重要研究课题诞生,旨在解决美苏冷战时期的情报需求。尽管最初认为机器翻译任务简单,但历经70年发展,至今仍未彻底解决,尽管现有技术已显著提升。早期尝试通过知识灌输和浅层机器学习解决自然语言处理问题,效果有限。深度学习的出现,尤其是预训练语言模型,为自然语言处理带来了革命性进展,奠定了大模型技术的基础。大模型,或大规模预训练语言模型,已成为当前自然语言处理领域的核心技术。
4.预训练语言模型及其在自然语言处理中的应用
预训练语言模型,以GPT为代表,是一种通过大量文本数据进行训练,以生成和理解自然语言的模型。它通过衡量一个句子在语言中出现的概率,为自然语言处理任务提供支持。预训练语言模型不仅在机器翻译、拼音输入法和语音识别等任务中起到关键作用,还能通过预测下一个词的概率来辅助理解和生成流畅的文本。
5.语言模型的重要性及GPT的创新点
语言模型在预测下一个词的过程中蕴含大量知识,如地理信息、语义信息和推理能力。GPT通过使用transformer模型、预训练和简化下游任务模型的创新,有效提升了语言模型的性能,开启了自然语言处理预训练的时代。这些创新使得GPT能更准确地理解和生成语言,解决了传统技术的不足,从而在多种自然语言处理任务中取得显著成果。
6.预训练模型在自然语言处理中的作用及发展
讨论了预训练模型在自然语言处理领域的应用和优势,对比了预训练和非预训练模型处理数据的方法。通过类比教育过程,阐述了预训练模型如何通过大量未标注数据学习通用任务,随后在特定任务上进行精调以提高效果。特别提到了GPT系列模型的发展,从GPT1到GPT3,模型规模逐渐增大,至GPT3时参数量达到了1750亿,强调了大模型在当前技术下的重要性。
7.大模型在学术界的发展与挑战
在学术界,早在2020年之前就认识到大模型的重要性,特别是GP3模型因其巨大参数量带来的预训练和精调难题,促使研究者探索新范式。Open I提出的方法是让下游任务适应模型,而非模型适应任务,这通过将任务转化为语言模型预测上下文的任务来实现。例如,情感分类任务可以通过给定任务描述和示例让模型识别文本情感。GP3模型展示了强大的文本生成能力,甚至能自动编写代码,引发了通用人工智能是否已到来的讨论。然而,GP3也存在明显不足,如知识不准确和推理能力缺失,导致其在某些任务上的表现不如其他特定工作。因此,后续研究致力于增强模型的鲁棒性、解释性和推理能力。
8.ChatGPT的关键技术及其突破
对话中详细介绍了ChatGPT通过无监督学习和大规模预训练语言模型实现显著效果的关键技术。ChatGPT不仅模型规模大,预训练数据量也巨大,这使其见过的知识更多,参数容量更大。此外,对话指出ChatGPT颠覆了仅预训练的范式,通过将所有任务统一格式进行精调,使其不仅在已见过的任务上表现优异,还能泛化到从未见过的任务上,展现了强大的任务泛化能力。
9. ChatGPT关键技术及其引发的模型竞争
ChatGPT采用无监督学习、有监督学习和强化学习三项关键技术,其中强化学习特别通过人类反馈进行强化对齐,以使生成结果更符合人类期望并减少人工标注难度。这项技术的出现引起了学术界和工业界的广泛关注,激发了众多公司投入到相关领域,导致新模型层出不穷,形成了激烈的竞争态势。
10.Deep Seek模型为何突然走红
Deep Seek(DP sik)模型在一月底发布后迅速引起关注,尤其在国外,其在Nature杂志的报道中被描述为一款高性价比、完全开源的推理模型,性能可媲美顶级的OE模型。这些特点,尤其是其高性能和开源性,使得Deep Seek在众多模型中脱颖而出。
11.DeepSeek的推理模型及其核心技术创新
深入探讨了DeepSeek开发的推理模型及其发展历程,强调了模型从V1到V3、R1 zero再到21的迭代更新。特别提及了GRPO技术,这是一种由DeepSeek在去年二月提出的强化学习方法,其显著特点是无需驾驶网络,降低了对机器性能的要求,提高了学习的稳定性和效率。该模型在复杂推理任务上表现优异,主要贡献在于证明了通过强化学习即可获得推理能力,无需人工标注数据,从而大幅降低了成本。此外,模型架构的极致优化使得训练和推理速度大幅提升,降低了对算力的需求,拓宽了应用范围。DeepSeek坚持开源精神,公开了模型和详细的技术报告,这与某些竞争对手的封闭做法形成鲜明对比。推理被认为是人工智能发展的第六次范式变迁,DeepSeek的成功复现为这一技术路线的可行性提供了信心,激发了更多相关研究和实践。
12.思维链和强化学习在推理能力中的应用
推理技术在解决问题时,模仿人类分步骤思考的过程,而不是一步到位。2022年提出的思维链范式,让模型在输出时不仅给出最终答案,还展示中间解题步骤,增强了模型的推理能力。早期模型如Deep sik RE和OE通过强化学习,使模型自动学习推理能力,而不是依赖模型大小的增加。RE zero模型通过自我博弈和强化学习,让模型探索推理步骤,如果得出正确答案则给予奖励,错误则惩罚,以此训练模型的推理过程。这种技术不仅学习稳定性好,还能节省资源。
13.强化学习在自动推理过程中的显著进展
通过强化学习的方法,模型在AIME(美国数学奥赛)题目的表现从39%显著提升到了71%,接近预览版的open IOE能力。随着模型训练步骤的增加,其推理能力持续增长,显示了模型在算力充足的情况下探索更多路径的可能性。特别的是,模型在学习过程中展现了自我反思的能力,即能够识别错误的推理并进行修正,称为aha moment。同时,推理步骤随学习过程的增加而自然增长,但是否越多越好还需根据问题的复杂性决定。此外,为解决RE zero在推理步骤的可读性问题,阿尔法zero(R one)在冷启动阶段引入少量示例以指导模型学习一种语言和规范的格式,经过四个步骤的改进,模型的推理格式和语言表达更加规范,其能力从71%提升到接近80%,几乎与open I的正式版模型相当。
14.极致模型优化与开放的AI技术
讨论了Dik在模型架构优化方面的重要工作,包括使用算法优化、深度混合专家模型(MOE)、多头隐含注意力机制和多词源预测等技术,提高了模型预测效率和学习效率。此外,还介绍了在模型训练中的混合精度、并行训练架构和跨节点高效通讯等底层创新,以及Dik将这些核心技术和模型参数全面开源,甚至包括底层文件系统的优化,展示了其在AI领域的开放和极致优化策略。
15.Deep Sick模型的优化策略及影响
Deep Sick模型通过集合多种优化策略,显著降低了训练成本至其他模型如LAMA的十分之一,同时提高了性能。这种成本效益使得在有限资源下也能充分利用现有计算能力。Deep Sick的发布对Meta的LAMA项目造成压力,甚至影响了Meta的决策和人员调整。从GPT到Deep Sick的发展历程中,技术路线保持一致,主要通过大规模语言模型预训练并结合transformer架构,而Deep Sick在工程优化上达到了新的高度。
16.大模型应用及prompt设计原则
强调了有效使用大模型的关键原则,主要包括:确保指令清晰具体,使用分隔符提高识别准确性,提供示例以引导模型产生更佳结果,供给丰富参考资料以增强回答的准确性和深度,将复杂问题分解为步骤逐一解决,利用模型内置的外部工具如Python程序和搜索引擎提升问题解决能力,以及给予模型更多思考时间以获得更佳结果。这些策略旨在优化与大模型的互动,提高其在各种任务中的表现。
17.大模型在专业领域应用的挑战与策略
讨论了在特定专业领域中应用大模型时遇到的挑战和解决策略。首先提出通过优化prompt(即prompt工程)来充分利用模型的能力,即使模型可能未充分掌握某一领域的专业知识。如果单纯的知识不足,建议使用检索增强(RAG)技术,即通过检索相关领域的知识库来辅助模型生成更准确的答案。对于风格或格式上的问题,则可以通过微调模型来解决。此外,还介绍了智能体和多智能体技术在解决问题和科学研究中的应用,以及在实际应用中需考虑的模型小型化、个性化、安全性和隐私性等问题。最后,提到了实验室在大模型训练、增强及应用领域的工作,包括发布的开源对话模型“活字”。
18.大模型技术在代码生成与智能医疗等领域的应用
讨论聚焦于利用大模型技术在多个领域的创新应用,包括代码自动生成、智能医疗、以及机器人控制。首先,介绍了一种名为“珠算”的代码大模型,该模型具备轻量化、高效且功能强大的特点,能自动完成代码编写任务,从而提升编程效率并辅助模型进行复杂推理。此外,讨论了大模型在精神健康领域的应用,例如与中小学生聊天以缓解心理压力,以及通过引导式对话分析和疏导心理疾病。在医疗领域,介绍了中国首个医学大模型“本草”,以及基于大模型的多智能体辩论和人机融合医疗会诊平台,用于解决复杂医疗问题。最后,提到了软硬一体的机器脑项目,展示了通用机器人脑在控制多种形态机器人、执行复杂任务(如自动打咖啡)方面的潜力,体现了大模型技术在智能机器人领域的应用前景。
19.人工智能未来发展方向及阶段预测
讨论了人工智能未来的发展方向,强调了从当前推理阶段向多模态、具身能力乃至社会自组织机器人的演进。提到了从非交互式到交互式的转变,并详细介绍了Open I提出的通用人工智能发展的五个阶段:聊天机器人、推理器、代理、创新和组织,每个阶段代表了AI能力的逐步提升。此外,还探讨了实现这些阶段所需的条件,包括互联网级别的数据、多模态和物理控制能力,以及最终的社会自组织能力。
20. 自然语言处理与大模型技术的未来展望
重点介绍了自然语言处理(NLP)作为人工智能的关键领域,被誉为人工智能皇冠上的明珠。大模型,也被称为基础模型(foundation model),已成为人工智能的基石,支撑着其他能力的发展。特别提到了deep seek的R一模型,其三大核心贡献包括仅通过强化学习获得推理能力、极致的模型优化,以及开源和蒸馏技术的应用。报告还探讨了transformer模型的主导地位和未来可能的替代技术,以及自然语言处理从面向自然语言转向基于自然语言的处理,语言模型成为人工智能的基石。最后,提出了创新能力和人工智能学院作为未来研究和教育的方向。
篇幅有限以上只是部分内容概览
相关文章:
哈尔滨工业大学DeepSeek公开课人工智能:大模型原理 技术与应用-从GPT到DeepSeek|附视频下载方法
导 读INTRODUCTION 今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek 技术前沿与应用”的报告。 本报告深入探讨了大语言模型在自然语言处理(NLP)领域的核心地位及其发展历程,从基础概念出发,延伸至语言模型在机器翻…...
ChatGPT vs DeepSeek vs Copilot vs Claude:谁将问鼎AI王座?
李升伟 整理 2025年的人工智能领域创新涌动,ChatGPT、DeepSeek、Copilot和Claude四大模型各领风骚。这些AI系统各具特色,分别专注于编程、创意写作、技术推理和AI伦理等不同领域。本文将深入解析这些AI模型的功能特性及其优势领域。 核心AI模型解析 C…...
【嵌入式Linux】基于ArmLinux的智能垃圾分类系统项目
目录 1. 功能需求2. Python基础2.1 特点2.2 Python基础知识2.3 dict嵌套简单说明 3. C语言调用Python3.1 搭建编译环境3.2 直接调用python语句3.3 调用无参python函数3.4 调用有参python函数 4. 阿里云垃圾识别方案4.1 接入阿里云4.2 C语言调用阿里云Python接口 5. 香橙派使用摄…...
Vue3中router最佳封装落地
文章目录 前言一、拆分路由文件夹?二、main.ts中注册路由总结 前言 router在使用过程中如果我们直接在一个文件的一个数组中配置,最后路由越来越多会导致不易管理,我们可以将一个页面的路由配置在一个数组中最后统一导入,这样就会…...
[Linux] make自动化构建
目录 一.什么是make 二.Makefile结构 2.1 典型结构 2.2 变量 1. 普通变量(User-Defined Variables) 2. 自动变量(Automatic Variables) 3. 预定义变量(Built-in Variables) 4. 函数变量࿰…...
剑指 Offer II 113. 课程顺序
comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20113.%20%E8%AF%BE%E7%A8%8B%E9%A1%BA%E5%BA%8F/README.md 剑指 Offer II 113. 课程顺序 题目描述 现在总共有 numCourses 门课需要选,记为 0 到 n…...
蓝桥杯 小球反弹
问题描述 有一个长方形,长为 343720 单位长度,宽为 233333 单位长度。 在其内部左上角顶点有一小球(无视其体积),其初速度方向如图所示,且保持运动速率不变。分解到长宽两个方向上的速率之比为࿱…...
Python 监听模式(Observer Pattern)
1. 监听模式技术方案 监听模式(Observer Pattern)是一种行为设计模式,允许对象(称为“观察者”或“监听者”)在另一个对象(称为“被观察者”或“主题”)的状态发生变化时接收通知。这种模式的核…...
蓝桥备赛(25)算法篇【差分】
一、差分 前缀和和差分的核心思想是预处理 , 可以在暴力枚举的过程中 , 快速给出查询结果 , 从而优化时间复杂度 。 最经典的用空间替换时间的做法。 学完差分之后 , 大家会发现 , 前缀和与差分是一对互逆的运算 二、一…...
Linux|fork命令及其使用的写时拷贝技术
fork复制进程 fork通过以下步骤来复制进程: 分配新的进程控制块:内核为新进程分配一个新的进程控制块(PCB),用于存储进程的相关信息,如进程 ID、状态、寄存器值、内存指针等。复制进程地址空间࿱…...
sgpt 终端使用指南
1. 什么是 sgpt? sgpt 是一个基于 OpenAI API 的命令行工具,允许用户在终端中与 AI 进行交互,支持自然语言对话、代码生成、Shell 命令生成等功能。本文将介绍 sgpt 的安装方法、基本用法、配置文件路径及修改方式,并提供完整的配…...
python如何提取html中所有的图片链接
在Python中,你可以使用BeautifulSoup库来解析HTML内容,并提取其中所有的图片链接(即<img>标签的src属性)。以下是一个示例代码,展示了如何做到这一点: 首先,确保你已经安装了BeautifulSo…...
第十一章 | 智能合约主网部署与验证详解
📚 第十一章 | 智能合约主网部署与验证详解 ——让你的合约真正上线、公开、透明! ✅ 本章导读 前面我们写了各种合约,ERC20、NFT、DAO…… 但只在本地测试或测试网上部署运行,项目还没“上链”! 主网上线部署&#…...
一文读懂Python之json模块(33)
一、json模块介绍 json模块的功能是将序列化的json数据从文件里读取出来或者存入文件。json是一种轻量级的数据交换格式,在大部分语言中,它被理解为数组(array)。 json模块序列化与反序列化的过程分别是 encoding和 decoding。e…...
TextView、AppCompatTextView和MaterialTextView该用哪一个?Android UI 组件发展史与演进对照表
在 Android 开发中,UI 组件一直在不断演进,从最初的原生组件,到 Support Library(AppCompat 兼容库),再到如今的 Material Design 组件。这篇文章将梳理 Android UI 组件的发展历史,并提供详细的…...
三层网络 (服务器1 和 服务器2 在不同网段)
服务器1 和 服务器2 在不同网段,并且通过三层交换机实现通信 1. 网络拓扑 假设网络拓扑如下: 服务器1: mac0:IP 地址 192.168.1.10/24,网关 192.168.1.1 mac1:IP 地址 10.0.1.10/24,网关 10.0…...
23种设计模式-创建型模式-工厂方法
文章目录 简介场景问题1. 直接依赖具体实现2. 违反开闭原则3. 条件分支泛滥4. 代码重复风险 解决根本问题完整类图完整代码说明核心优势代码优化静态配置表动态策略 总结 简介 工厂方法是一种创建型设计模式,它提供了在父类中创建对象的接口,但允许子类…...
el-table单元格编辑,动态增删行,回车/上下左右箭头切换单元格
🤵 作者:coderYYY 🧑 个人简介:前端程序媛,目前主攻web前端,后端辅助,其他技术知识也会偶尔分享🍀欢迎和我一起交流!🚀(评论和私信一般会回!!) 👉 个人专栏推荐:《前端项目教程以及代码》 基于 Element UI 实现表格单元格编辑与键盘导航功能 Element UI …...
基于springboot的新闻推荐系统(045)
摘要 随着信息互联网购物的飞速发展,国内放开了自媒体的政策,一般企业都开始开发属于自己内容分发平台的网站。本文介绍了新闻推荐系统的开发全过程。通过分析企业对于新闻推荐系统的需求,创建了一个计算机管理新闻推荐系统的方案。文章介绍了…...
解决Selenium滑动页面到指定元素,点击失效的问题
White graces:个人主页 🙉专栏推荐:Java入门知识🙉 🐹今日诗词:君失臣兮龙为鱼,权归臣兮鼠变虎🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 ⛳️点赞 ☀️收藏⭐️关注Ǵ…...
医学图像白血病分割数据集labelme格式245张5类别
数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):245 标注数量(json文件个数):245 标注类别数:5 标注类别名称:["basophil Leukemia","Lymphocyte…...
深度学习Python编程:从入门到工程实践
第一章 Python语言概述与生态体系 1.3 Python在工业界的应用场景 # 示例:使用FastAPI构建RESTful接口 from fastapi import FastAPI from pydantic import BaseModelapp = FastAPI()class Item(BaseModel):name: strprice: float@app.post("/items/") async def cr…...
DHCPv6 Stateless Vs Stateful Vs Stateless Stateful
DHCPv6常见配置模式 在 IPv6 网络中,DHCPv6 的 Stateless(无状态)、Stateful(有状态) 和 Stateless + Stateful(混合模式) 是三种常见的配置模式。它们的主要区别在于客户端如何获取 IPv6 地址和其他网络配置信息(如 DNS 服务器)。 Stateless(无状态)模式 Statele…...
Redis Cluster 详解
Redis Cluster 详解 1. 为什么需要 Redis Cluster? Redis 作为一个高性能的内存数据库,在单机模式下可能会遇到以下问题: 单机容量受限:Redis 是基于内存存储的,单机的内存资源有限,单实例的 Redis 只能…...
Spring(8)——MyBatis入门(2)
一、Mybatis的xml配置文件 Mybatis的开发有两种方式: 注解xml 上一篇博客介绍了用注解的方式操作数据库,这一篇介绍通过xml配置文件的方式操作数据库。 1.1 xml配置文件规则 在Mybatis中使用XML映射文件方式开发,需要符合一定的规范&…...
解析DeepSeek的技术内核:混合专家架构如何重塑AI效能
解析DeepSeek的技术内核:混合专家架构如何重塑AI效能 在当今大型语言模型(LLM)竞争激烈的赛道上,中国AI企业DeepSeek凭借其独特的技术路线脱颖而出。其核心优势之一,便是对混合专家(Mixture of Experts&…...
Android在kts中简单使用AIDL
Android在kts中简单使用AIDL AIDL相信做Android都有所了解,跨进程通信会经常使用,这里就不展开讲解原理跨进程通信的方式了,最近项目换成kts的方式,于是把aidl也换成了统一的方式,其中遇到了很多问题,这里…...
【C++】类和对象(匿名对象)
匿名对象 用 类型(实参) 定义出来的对象叫做匿名对象,相比之前我们定义的 类型 对象名(实参) 定义出来叫有名对象匿名对象生命周期只在当前一行,一般临时定义一个对象当前用一下即可,就可以定义匿名对象。 class A { public:A(int a 0):_a…...
Spring boot 3.4 后 SDK 升级,暨 UI API/MCP 计划
PS 写这篇文章后看到 A Deep Dive Into MCP and the Future of AI Tooling | Andreessen HorowitzWe explore what MCP is, how it changes the way AI interacts with tools, what developers are already building, and the challenges that still need solving. https://a1…...
使用Helm安装、 升级、 回滚Kubernetes应用
前言 在我之前做的项目里,我们对Microk8s微服务的更新是通过自制tar包的方式做的, tar包存储了镜像和YAML文件。 每次升级时,我们需要先删除所有的YAML资源,然后重新创建新的资源。 这种方式存在以下问题: 服务中断:…...
Text-to-SQL将自然语言转换为数据库查询语句
有关Text-To-SQL方法,可以查阅我的另一篇文章,Text-to-SQL方法研究 直接与数据库对话-text2sql Text2sql就是把文本转换为sql语言,这段时间公司有这方面的需求,调研了一下市面上text2sql的方法,比如阿里的Chat2DB,麻…...
gin学习
gin学习笔记,不仅包含了基本的增删查改外,还包括参数传递,上传下载,模版、session与中间件等,方便收藏自习可用 文章目录 获得个请求get打印字符串get请求xmlget请求跳转http方法路由可以通过Context的Param方法来获取…...
【HarmonyOS NEXT】关键资产存储开发案例
在 iOS 开发中 Keychain 是一个非常安全的存储系统,用于保存敏感信息,如密码、证书、密钥等。与文件系统不同,Keychain 提供了更高的安全性,因为它对数据进行了加密,并且只有经过授权的应用程序才能访问存储的数据。那…...
高德终端技术总结:高可用架构如何练成?
前言 高德地图作为国民级应用,特别是出行场景的独特性,要确保在线导航高并发和交通安全级的超稳定性,这对技术团队提出异乎寻常的高要求,无论是终端、云端,还是“终端-云端”之间的连接,都必须实现“高可用…...
STM32八股【3】------RAM和片上FLASH
1、RAM和FLASH构成 1.RAM ┌──────────────────────────┐ │ 栈区 (Stack) │ ← 从RAM顶端向下扩展(存储局部变量、函数调用信息) │--------------------------│ │ 堆区 (Heap) │ ← …...
Apache Doris
Apache Doris介绍 Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场…...
Debezium介绍
1.什么是Debezium Debezium 是一个开源的分布式平台,用于捕获数据库的变更事件(CDC,Change Data Capture)。它能够实时捕获数据库中的行级更改,并将这些更改作为事件流发送到消息中间件(如 Apache Kafka&a…...
奇迹科技:蓝牙网关赋能少儿篮球教育的创新融合案例研究
一、引言 本文研究了福建奇迹运动体育科技有限公司(简称‘奇迹科技’)如何利用其创新产品体系和桂花网蓝牙网关M1500,与少儿篮球教育实现深度融合。重点分析其在提升教学效果、保障训练安全、优化个性化教学等方面的实践与成效,为…...
Python散点图(Scatter Plot):高阶分析、散点图矩阵、三维散点图及综合应用
散点图:数据分析的利器 在数据分析领域,散点图是一种直观且强大的可视化工具,广泛应用于揭示变量间的相关性以及识别数据集中的异常值。本文将深入探讨散点图的这两种关键功能,并结合实际案例与Python代码示例,带您全面了解散点图的应用。 一、散点图如何展示变量间的相…...
计算机网络层超全解析:从IP协议到路由算法
🌐 (专业详解生活化类比,逻辑一镜到底) 📖 网络层的核心使命 核心任务:在不同网络间为数据包选择最佳路径,实现端到端通信。 类比:快递公司总部(网络层)根据…...
RoboVQA
RoboVQA:面向机器人技术的多模态长时推理 摘要 我们提出了一种可扩展、自下而上且具有内在多样性的数据收集方案,适用于中长时高级推理任务,其吞吐量比传统的自上而下分步收集方法高2.2倍。通过在3栋办公楼内使用多种实体(机器人、人类、使用抓取工具的人类)执行任意用…...
javascript语法入门
一、变量声明 在JavaScript中,可以使用var、let和const来声明变量。 javascript var name "张三"; let age 20; 二、数据类型 JavaScript中有7种基本数据类型:undefined、null、boolean、string、symbol、number,以及object。…...
前端字段名和后端不一致?解锁 JSON 映射的“隐藏规则” !!!
🚀 前端字段名和后端不一致?解锁 JSON 映射的“隐藏规则” 🌟 嘿,技术冒险家们!👋 今天我们要聊一个开发中常见的“坑”:前端传来的 JSON 参数字段名和后端对象字段名不一致,会发生…...
Java——ArrayList集合
ArrayList:基于动态数组实现,支持随机访问,适合频繁的随机访问操作,但在插入和删除元素时性能较差。 技术层面介绍 所属类库:ArrayList 位于 java.util 包中,它实现了 List 接口,因此具备 Lis…...
基于python+django的图书借阅网站-图书借阅管理系统源码+运行步骤
该系统是基于pythondjango开发的在线图书借阅管理系统。系统适合场景:大学生、课程作业、系统设计、毕业设计。 演示地址 前台地址: http://book.gitapp.cn 后台地址:http://book.gitapp.cn/#/admin 后台管理帐号: 用户名&…...
Flutter运行错误:UG! exception in phase ‘semantic analysis‘
最近在Mac Mini M4上通过Android Studio导入Flutter项目并运行,结果一直跑不起来,错误日志如下: 执行命令查看版本信息: flutter doctor --verbose通过输出信息Java version OpenJDK Runtime Environment (build 21.0.41242208…...
Python-docx库详解:轻松实现Word文档自动化生成与图片尺寸控制
Python-docx库详解:轻松实现Word文档自动化生成与图片尺寸控制 在现代办公自动化的浪潮中,文档处理是一项不可或缺的任务。Python作为一种强大的编程语言,提供了丰富的库来简化这些任务。其中,python-docx库是处理Word文档的有力…...
【NLP 42、实践 ⑪ 用Bert模型结构实现自回归语言模型的训练】
目录 数据文件 一、模型定义 1.模型初始化 代码运行流程 2.前向传播,计算损失 ⭐ 代码运行流程 二、加载语料 代码运行流程 三、 随机生成样本 代码运行流程 四、建立模型 五、采样策略选择 代码运行流程 六、模型效果测试 代码运行流程 七、模型训练 代码运行流程 …...
HTTPS
目录 一 HTTPS是什么 二 加密 三 加密方案 四 CA机构/证书 五 最终方案(对称密钥/非对称密钥/CA证书)和总体流程 一 HTTPS是什么 在应用层存在SSL,TLS(HTTP之下,传输层之上)加密/解密安全协议,如果HTTP经过这个协议,对端也走…...
electron框架(4.0)electron-builde和electron Forge的打包方式
----使用electron-builder打包(需要魔法) --安装electron-builder: npm install electron-builder -D--package.json中进行相关配置: {"name": "video-tools","version": "1.0.0","main&quo…...