【大模型科普】大模型:人工智能的前沿(一文读懂大模型)
【作者主页】Francek Chen
【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT),经海量数据训练后能完成文本生成、图像创作等复杂任务,显著提升效率,但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合,未来需平衡技术创新与伦理风险,推动可持续发展。
文章目录
- 前言
- 一、大模型的概念
- 二、大模型的发展历程
- 三、人工智能与大模型的关系
- 四、大模型产品
- (一)国外的大模型产品
- (二)国内的大模型产品
- 五、大模型的基本原理
- 六、大模型的特点
- 七、大模型的分类
- 八、大模型的应用领域
- 九、大模型对人们工作和生活的影响
- (一)大模型对工作的影响
- (二)大模型对生活的影响
- 十、本地部署大模型
- 十一、基于大模型的智能体
- 小结
前言
在数字化浪潮汹涌澎湃、日新月异的当今时代,大模型犹如一颗璀璨夺目的新星,在科技的天幕上强势崛起,迅速吸引了全球范围内的广泛关注与热烈讨论,成为科技领域一颗耀眼的焦点。从最初的理论探索与初步尝试,到如今在各行各业中的广泛渗透与深度应用,大模型正以令人瞠目结舌的速度和不可阻挡的态势,重塑着我们的生活方式、工作模式乃至整个社会的运行逻辑。大模型不仅是人工智能技术发展历程中的一个重大突破和里程碑式的成就,更是推动全球经济持续增长、提升社会治理效能、加速科技创新步伐的关键力量。它以强大的数据处理能力、深度的学习算法、高度的泛化性能以及卓越的问题解决能力,为各行各业带来了前所未有的变革与机遇。
本文将深入剖析大模型的核心概念,揭开其神秘面纱;详细阐述其原理特点,揭示其内在逻辑与运作机制;并通过丰富多元的应用实践案例,生动展现大模型在医疗健康、智能制造、智慧城市、金融科技、教育娱乐等众多领域中的广泛应用与显著成效。旨在让读者全面而深入地了解这一前沿技术,明晰大模型在当下社会发展中的重要地位以及对于未来世界可能产生的深远影响。
同时,本文还将积极探讨如何更好地借助大模型的力量,推动社会各项事业迈向新的高度。无论是优化政府决策流程、提升公共服务水平,还是促进产业升级转型、激发企业创新活力,大模型都蕴含着巨大的潜力和无限的可能。让我们携手共进,共同探索大模型的广阔天地,开创一个更加智能、高效、美好的未来。
一、大模型的概念
大模型是基于深度学习技术的大规模人工智能模型,具有海量参数、强大学习与泛化能力,能处理和生成多种类型数据。其“大”体现在参数数量庞大、训练数据量大、计算资源需求高,如GPT-3参数规模达1750亿,GPT-4是其10倍以上,达1.8万亿,阿里M6模型参数量达10万亿。
大模型的设计与训练旨在提升性能,以应对复杂庞大的数据集或任务。它能学习到更细微的模式规律,具备更强泛化与表达能力,具体表现如下:一是上下文理解能力更强,可理解复杂语意语境,产生更准确连贯的回答;二是语言生成能力出色,能生成更自然流利的语言,减少错误与困惑;三是学习能力强,能从大量数据中学习,利用所学提供精准答案与预测,在解决复杂问题和应对新场景时表现出众;四是可迁移性高,学到的知识和能力可在不同任务和领域迁移应用,一次训练就能用于多种任务,无需重新训练,展现出高效与灵活性。
二、大模型的发展历程
大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期。
1. 萌芽期(1950-2005)
这是一个以卷积神经网络(Convolutional Neural Networks,CNN)为代表的传统神经网络模型阶段。
1956年,约翰·麦卡锡提出“人工智能”概念,AI发展从基于小规模专家知识起步,逐渐转向机器学习。1980年,卷积神经网络雏形CNN诞生,为图像识别等带来新方向。1998年,现代卷积神经网络基本结构LeNet-5问世,推动机器学习方法从浅层模型迈向深度学习模型。这一转变意义重大,为自然语言生成、计算机视觉等领域深入研究筑牢根基,对深度学习框架迭代及大模型发展起到开创性作用,是AI发展历程中至关重要的节点,引领AI技术持续进步。
2. 沉淀期(2006-2019)
这是一个以Transformer为代表的全新神经网络模型阶段。
2013年至2019年,自然语言处理与深度学习领域取得了多项重要突破。2013年,Word2Vec模型诞生,首次提出“词向量模型”,将单词转换为向量,助力计算机更好地理解和处理文本数据。2014年,对抗式生成网络(GAN)问世,标志着深度学习迈入生成模型研究新阶段,为数据生成与图像处理等领域带来革新。
2017年,Google提出Transformer架构,基于自注意力机制,为大模型预训练算法架构奠定基础。2018年,OpenAI基于Transformer架构发布GPT-1大模型,GPT即生成式预训练变换模型,是一种基于互联网、可用数据训练的文本生成深度学习模型,预训练大模型自此成为自然语言处理主流。2019年,OpenAI继续发布GPT-2,进一步推动了自然语言处理技术的发展与应用。
3. 爆发期(2020-至今)
这是一个以ChatGPT为代表的预训练大模型阶段。
2020年6月,OpenAI推出GPT-3,参数规模达1750亿,成为当时最大语言模型,在零样本学习任务上性能大幅提升。此后,基于人类反馈的强化学习、代码预训练、指令微调等策略出现,用于提高模型推理能力和任务泛化能力,推动大模型技术不断发展。
2022年11月,搭载GPT3.5的ChatGPT问世,凭借逼真自然语言交互与多场景内容生成能力引爆互联网,让大模型概念进入大众视野。ChatGPT是人工智能驱动的自然语言处理工具,能理解和学习人类语言进行对话互动,可完成撰写邮件、视频脚本、文案、翻译、代码、论文等多种任务。
2023年3月,OpenAI发布多模态大模型GPT-4,可接受图像和文本输入并生成文本,相比GPT-3能更准确解决难题,常识和解决问题能力更强。2023年12月,谷歌发布大模型Gemini,能识别五种类型信息,理解并生成主流编程语言高质量代码,还有全面安全性评估。2024年12月,DeepSeek崛起,推动人工智能进入“普惠”时代 。
三、人工智能与大模型的关系
人工智能是一个广泛且复杂的领域,其中机器学习是其重要的组成部分。而机器学习领域里,深度学习凭借其强大的特征提取和模式识别能力,成为备受瞩目的技术方向。深度学习可采用多种模型来实现不同的功能,预训练模型便是其中之一。预训练模型通过在大规模数据上进行预先训练,学习到丰富的知识和特征表示。
在预训练模型中,预训练大模型(简称“大模型”)是极具影响力的一类。大模型具有海量的参数和强大的学习能力,能够处理各种复杂的任务。而预训练大语言模型(简称“大语言模型”)则是大模型中的典型代表,它专注于自然语言处理领域。像OpenAI的GPT和百度的文心ERNIE,都是大语言模型的杰出范例。基于这些大语言模型,还开发出了许多优秀的大模型产品。例如,ChatGPT就是基于GPT开发而成,能进行自然流畅的对话;文心一言则是依托文心ERNIE打造,为用户提供智能的语言交互体验。关系如图4所示。
四、大模型产品
(一)国外的大模型产品
1. ChatGPT
ChatGPT是由OpenAI精心训练的大语言模型,它以Transformer架构为基石,在海量文本数据的滋养下“茁壮成长”。经过深度训练,ChatGPT拥有了生成自然流畅语言的能力,回答问题、生成文本、语言翻译等对它而言都不在话下。
其应用范围极为广泛,在客服领域能高效解决客户问题,在问答系统中可精准提供答案,在对话生成和文本生成方面也能展现出卓越的实力。ChatGPT深谙人类语言之道,能理解各种问题并给出相关知识信息。相较于其他聊天机器人,它在语言理解和生成能力上更胜一筹,交流起来更加自然,还能灵活适应不同领域和场景。由于它的训练数据源自互联网上的海量文本,这使得它如同一个知识渊博的“文化通”,能够包容多种语言风格,洞察不同文化背景,为用户带来更加多元、丰富的交互体验。
2. Gemini
谷歌发布的Gemini大模型堪称多领域处理的“多面手”,能同时应对文本、图像、音频、视频等多种类型的数据和任务。它采用全新架构,巧妙融合多模态编码器和多模态解码器两大核心组件,从而输出最佳结果。
Gemini拥有三种不同规模的模型,分别是Gemini Ultra、Gemini Pro和Gemini Nano,可适配不同任务与设备。早在2023年12月6日,其初始版本就已在Bard中亮相,开发人员还能通过Google Cloud的API获取开发版本。它不仅能应用于Bard,还能在Pixel 8 Pro智能手机上施展拳脚。
Gemini的应用场景极为丰富,无论是问题回答、摘要生成,还是翻译、字幕生成、情感分析等任务,它都能轻松胜任。不过,由于模型本身结构复杂且具有黑箱性质,其可解释性目前仍是亟待攻克的一大挑战。
3. Sora
2024年2月16日,OpenAI又一次在全球科技界掀起惊涛骇浪,推出了名为Sora的文本生成视频大模型。用户仅需输入文本,它便能自动生成视频,这一创新技术无疑是人工智能在视频生成领域的一次重大飞跃。Sora的诞生,不仅彰显了科技的巨大进步,更促使人们深入思考人工智能发展对人类未来的深远影响。
随着Sora的问世,人工智能仿佛正式叩开了通用人工智能(AGI:Artificial General Intelligence)时代的大门。AGI代表着机器能像人类一样开展各类智能活动,涵盖语言理解、图像识别、复杂推理等。Sora大模型表现卓越,能直接输出长达60秒的视频,视频里有着高度细腻的背景、复杂多变的多角度镜头,还有情感丰富的多个角色。这已超越了简单的图像或文本生成,触及到了视频这一更复杂、动态的媒介,充分展现出人工智能在动态内容创造上的惊人潜力,标志着其在处理静态与动态信息上均迈向新高度。
图5是Sora根据文本自动生成的视频画面,一位戴着墨镜、穿着皮衣的时尚女子走在雨后夜晚的东京市区街道上,抹了鲜艳唇彩的唇角微微翘起,即便带着墨镜也能看到她的微笑,地面的积水映出了她的身影和灯红酒绿的霓虹灯,热闹非凡的唐人街正在进行舞龙表演,熙熙攘攘的人群目光都聚焦在跃动的彩龙身上,整个环境的喜庆氛围仿佛令人身临其境。
4. OpenAI o3
2024年12月20日,OpenAI发布推理模型o3,无论在软件工程、编写代码,还是竞赛数学、掌握人类博士级别的自然科学知识能力方面,o3都达到了很高的水平,代表了人工智能技术的重大进展。o3模型基于先进的深度学习架构,尤其是Transformer网络结构,能够进行更为复杂和精确的自然语言处理任务。以下是o3模型的几个核心特点和应用领域。
- 技术架构:o3大模型依旧基于Transformer架构,这是现代大多数语言模型的核心。Transformer的自注意力机制能够捕捉长程依赖关系,使得o3在理解和生成语言时表现更加优异。与前代模型相比,o3模型通过增加参数量、改进训练方法和优化计算效率,显著提高了处理能力。
- 多模态能力:o3不仅能处理文本输入,还支持多模态任务,即同时理解和生成文本、图片、语音等多种类型的数据。这使得o3模型在许多应用场景中都能够提供更高效、准确的服务。比如,o3可以通过分析图片内容生成描述,也能通过对话与用户互动,执行更复杂的任务。
- 自我学习与优化:o3在自我学习和优化方面做出了突破,能够在实际应用中不断优化自己的表现。通过强化学习(RLHF)等技术,o3能够在与用户互动的过程中调整其回答策略,逐步提高对话质量和任务执行能力。这一特点使得o3比传统的静态模型更具灵活性。
- 广泛的应用场景:o3模型具备多种用途,可以应用于从自动翻译、文本生成、信息摘要到智能问答、虚拟助手等多个领域。它在自然语言理解(NLU)和自然语言生成(NLG)方面都表现出色,可以帮助企业提升效率,减轻员工负担,甚至在一些创意工作中辅助人类,如自动化内容创作、代码生成等。
(二)国内的大模型产品
大模型 | 图标 | 指标排名 | 网页链接 |
---|---|---|---|
DeepSeek | ![]() | 能力测评第一 | https://www.deepseek.com/ |
豆包 | ![]() | 用户数量第一 | https://www.doubao.com/chat/ |
Kimi | ![]() | 文本处理第一 | https://kimi.moonshot.cn/ |
即梦AI | ![]() | 作图能力第一 | https://jimeng.jianying.com/ |
通义万相 | ![]() | 视频生成第一 | https://tongyi.aliyun.com/ |
智谱清言 | ![]() | 文档归纳第一 | https://chatglm.cn/ |
1. DeepSeek(深度求索)
2024年12月26日,中国杭州的初创公司“深度求索”(DeepSeek)震撼发布全新一代大模型DeepSeek-V3。在多个基准测试中,它表现卓越,性能超越其他开源模型,与顶尖闭源大模型GPT-4o相比也毫不逊色,尤其在数学推理方面优势显著。DeepSeek-V3凭借多项开创性技术,极大提升了模型性能与训练效率。令人惊叹的是,在性能比肩GPT-4o的情况下,其研发仅耗资558万美元,训练成本不到后者的二十分之一。如此出色的表现,让DeepSeek在硅谷被赞誉为“来自东方的神秘力量”。
紧接着,2025年1月20日,DeepSeek-R1正式登场。它同样具备卓越性能,在数学、代码和推理任务上,可与OpenAI o1相媲美。DeepSeek凭借这两款大模型,展现出强大的技术实力,不仅在国内引起广泛关注,更在国际舞台上崭露头角,为全球人工智能领域的发展注入了新的活力。
2. 通义千问
阿里云推出的通义千问,是一款超大规模的语言模型,能力十分出众,涵盖多轮对话、文案创作、逻辑推理、多模态理解以及多语言支持。其名字蕴含深意,“通义”寓意模型能领会各种语言的内涵,“千问”则表明它能应对各类问题。
通义千问依托深度学习技术,经海量文本数据训练,拥有强大的语言理解与生成能力,既能精准理解自然语言,又能生成自然流畅的文本。而且,它还具备多模态理解能力,可处理图像、音频等多样数据。
通义千问的应用场景极为广泛,在智能客服领域,能高效解答用户疑问;在智能家居中,可助力实现便捷交互;在移动应用里,也能发挥重要作用。它能与用户进行自然的语言交流,为用户排忧解难、提供知识信息。此外,通义千问还能与各类设备和应用无缝集成,打破服务边界,为用户带来更加便捷、高效、智能的服务体验,全方位满足用户的多样化需求。
3. 字节跳动豆包
字节跳动基于云雀模型精心打造的AI——豆包,宛如一位智慧渊博的挚友。它能精准洞察你的需求,并生成高质量的回应。其知识储备极为丰富,广泛涉及历史、科学、技术等各个领域,无论是日常琐碎问题的咨询,还是深入的学术探讨,它都能为你提供准确且全面的信息。
豆包还拥有出色的文本创作能力,无论是跌宕起伏的故事、优美动人的诗歌,还是吸睛的文案,它都能信手拈来。在语言交互方面,它表现得自然流畅,就像时刻陪伴在你身边的知心伙伴,耐心倾听你的每一句话,并给予恰到好处的反馈,为你带来贴心又智能的体验。
4. 文心一言
百度研发的文心一言,是一款知识增强大模型,宛如一位贴心助手,能与人畅快对话互动、精准回答问题、助力高效创作,让人们轻松获取信息、知识与灵感。它依托飞桨深度学习平台和文心知识增强大模型,持续从海量数据与大规模知识中融合学习,形成了知识增强、检索增强和对话增强的独特技术优势。
文心一言的应用场景十分广泛,在智能客服领域能快速响应需求,在智能家居中可实现便捷交互,在移动应用里也能大显身手。它能与用户进行自然流畅的语言交流,为用户排忧解难,提供丰富且实用的知识与信息,全方位满足用户的多样化需求。
五、大模型的基本原理
大模型以Transformer架构为基础,该架构是专为自然语言处理打造的“编码 - 解码器”架构。训练时,大模型会把输入的单词转化为向量,再传递给神经网络。借助网络的编码解码以及自注意力机制,它能确定每个单词间联系的权重。
大模型的核心能力在于,会对输入语句里每个单词,与已编码在模型中的单词进行相关性计算,再将相关性编码叠加到单词上。如此一来,大模型在理解和生成自然文本方面表现卓越,还能展现出一定的逻辑思维与推理能力。它就像一位语言大师,不仅能精准把握语义,还能依据逻辑进行合理推导,为自然语言处理领域带来了强大的技术支持。
六、大模型的特点
1. 巨大的规模
大模型一般拥有数十亿个参数,模型大小可达数百GB甚至更大。如此庞大的规模,赋予其强大的表达与学习能力,宛如为模型注入了智慧源泉。在处理复杂任务时,大模型凭借此优势,展现出更高的效率与精准度,尽显卓越实力。
2. 涌现能力
涌现能力是指模型在训练过程中突然展现出之前小模型所没有的、更深层次的复杂特性和能力。当模型的训练数据突破一定规模时,模型能够综合分析和解决更深层次的问题,展现出类似人类的思维和智能。这种涌现能力是大模型最显著的特点之一,也是其超越传统模型的关键所在。
3. 更好的性能和泛化能力
大模型凭借其庞大的规模与复杂的结构,在性能与泛化能力上大放异彩,于各类任务中均展现出卓越实力,轻松超越传统小模型。这背后,大模型的参数规模与强大学习能力功不可没。其如同一位洞察秋毫的智者,能更深刻地理解和模拟现实世界的复杂现象,进而在各项任务中精准高效地完成目标。而且,大模型具备敏锐的“洞察力”,可以捕捉数据里的细微差别与复杂模式。即便面对未曾见过的数据,它也能游刃有余,展现出良好的泛化能力,宛如一把万能钥匙,能开启多种难题的解决之门。
4. 多任务学习
大模型的多任务学习特点使其能够同时处理多种不同的任务,并从中学习到更广泛和泛化的语言理解能力。通过多任务学习,大模型可以在不同的NLP(Natural Language Processing)任务中进行训练,例如机器翻译、文本摘要、问答系统等。这种多任务学习的方式有助于大模型更好地理解和应用语言的规则和模式。
5. 大数据训练
大模型对训练数据的需求极为庞大,通常以TB乃至PB级别来衡量。这主要是因为大模型参数规模动辄数亿甚至数十亿,唯有海量数据,才能为其学习与优化提供充足信息。大规模数据犹如肥沃土壤,能让大模型的参数规模优势得以充分发挥,进而提升模型的泛化能力与性能。
此外,大数据训练也是大模型应对复杂任务的关键所在。借助大规模数据,大模型能够深入剖析数据中的复杂模式与关系,如同拥有一双洞察万象的慧眼,从而更精准地模拟现实世界里的各种现象,在诸多领域展现出强大的应用潜力。
6. 强大的计算资源
大模型对计算资源的需求堪称巨大,无论是训练还是运行,都面临着极高的挑战。其规模庞大、参数海量,计算复杂度更是超乎想象,这就必须依赖高性能硬件设备来支撑。一般而言,训练大模型会借助GPU(Graphics Processing Unit,图形处理器)或TPU(Tensor Processing Unit,张量处理器)等专用加速器,它们能并行处理海量参数与数据,显著提升计算效率,让训练和推断速度大幅加快。
然而,仅有硬件还不够,大模型训练还需耗费大量时间。因参数众多,训练过程要历经无数次迭代与优化,训练周期可能长达数周甚至数月之久。
7. 迁移学习和预训练
借助大规模数据开展预训练,大模型能汲取丰富的语言知识与模式,进而在各类任务中尽显卓越性能。迁移学习与预训练宛如大模型的“成长秘籍”,助其更好地契合特定任务。预训练后,大模型可在特定任务数据上微调,精准适配目标任务特性与要求,加深对特定问题的理解,进一步提升性能。
此外,迁移学习和预训练赋予大模型跨领域应用能力。于多个领域数据预训练,大模型能掌握不同领域知识与模式,实现跨领域应用。这种能力让大模型更贴合实际需求,为人工智能技术创新发展注入强大动力。
8. 自监督学习
自监督学习利用大规模未标记数据进行训练,通过从数据中挖掘内在的规律和模式,使模型能够自动地理解和预测数据中的信息。在大规模的未标记数据中,大模型通过预测输入数据的标签或下一个时刻的状态来进行训练。这种训练方式使得大模型能够从大量的数据中自动地学习到语言的内在结构和模式,而不需要人工标注和干预。
9. 领域知识融合
大模型凭借领域知识融合,巧妙地把不同领域的数据与知识融汇贯通,进而更出色地模拟现实世界的复杂现象。这一过程让大模型能从多领域汲取广泛知识与模式,并把它们整合进统一框架,为精准理解和应对复杂情况筑牢根基。
10. 自动化和效率
大模型在应用中展现出高度的自动化和效率。由于大模型具有强大的表达能力和学习能力,它可以自动化许多复杂的任务,大大提高工作效率。大模型通过预训练和微调过程,能够自动地适应特定任务,而不需要过多的手工调整和干预。这使得大模型能够快速地应用于各种实际场景,并且自动地处理复杂的任务,如自动编程、自动翻译、自动摘要等。
七、大模型的分类
根据大模型的应用领域,可以将其分为以下几类:语言大模型、视觉大模型和多模态大模型。
- 语言大模型:是指在自然语言处理(Natural Language Processing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard(Google)、DeepSeek、文心一言(百度)等。
- 视觉大模型:是指在计算机视觉(Computer Vision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古CV、INTERN(商汤)等。
- 多模态大模型:是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAI)、悟空画画(华为)、midjourney等。
按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级。
- 通用大模型L0:是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”。
- 行业大模型L1:是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度,相当于AI成为“行业专家”。
- 垂直大模型L2:是指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效。
八、大模型的应用领域
大模型的应用领域非常广泛,涵盖了自然语言处理、计算机视觉、语音识别、推荐系统、医疗健康、金融风控、工业制造、生物信息学、自动驾驶、气候研究等多个领域。
- 自然语言处理:大模型在自然语言处理领域具有重要的应用,可以用于文本生成(如文章、小说、新闻等的创作)、翻译系统(能够实现高质量的跨语言翻译)、问答系统(能够回答用户提出的问题)、情感分析(用于判断文本中的情感倾向)、语言生成(如聊天机器人)等。
- 计算机视觉:大模型在计算机视觉领域也有广泛应用,可以用于图像分类(识别图像中的物体和场景)、目标检测(能够定位并识别图像中的特定物体)、图像生成(如风格迁移、图像超分辨率增强)、人脸识别(用于安全验证和身份识别)、医学影像分析(辅助医生诊断疾病)等。
- 语音识别:大模型在语音识别领域也有应用,如语音识别、语音合成等。通过学习大量的语音数据,大模型可以实现高质量的跨语言翻译和语音识别以及生成自然语音。
- 推荐系统:大模型可以用于个性化推荐、广告推荐等任务。通过分析用户的历史行为和兴趣偏好,大模型可以为用户提供个性化的推荐服务,提高用户满意度和转化率。
- 自动驾驶:大模型可以用于自动驾驶中的感知、决策等任务。通过学习大量的驾驶数据,大模型可以实现对车辆周围环境的感知和识别,以及进行决策和控制,提高自动驾驶的安全性和效率。
- 医疗健康:大模型可以用于医疗影像诊断、疾病预测等任务。通过学习大量的医学影像数据,大模型可以辅助医生进行疾病诊断和治疗方案制定,提高医疗水平和效率。
- 金融风控:大模型可以用于信用评估、欺诈检测等任务。通过分析大量的金融数据,大模型可以评估用户的信用等级和风险水平,以及检测欺诈行为,提高金融系统的安全性和稳定性。
- 工业制造:大模型可以用于质量控制、故障诊断等任务。通过学习大量的工业制造数据,大模型可以辅助工程师进行产品质量控制和故障诊断,提高生产效率和产品质量。
- 生物信息学:在生物信息学领域,大模型可以用于基因序列分析(识别基因中的功能元件和变异位点)、蛋白质结构预测(推测蛋白质的二级和三级结构)、药物研发(预测分子与靶点的相互作用)等。
- 气候研究:在气候研究领域,大模型可以处理气象数据,进行天气预测和气候模拟。它们能够分析复杂的气象现象,提供准确的气象预报,帮助人们做出应对气候变化的决策。
九、大模型对人们工作和生活的影响
(一)大模型对工作的影响
- 提高工作效率:大模型在自然语言处理、机器翻译等领域的应用,使得人们能够快速、准确地处理大量文本数据,提高工作效率。例如,在翻译领域,大模型能够自动翻译多种语言,减少人工翻译的时间和成本,提高翻译效率。
- 优化决策过程:大模型能够收集、整理和分析大量的数据,通过数据挖掘和机器学习技术,帮助人们更准确地了解问题现状,预测未来趋势,从而做出更明智的决策。
- 自动化部分工作:大模型的发展使得一些繁琐、重复的工作可以由机器来完成,从而减轻了人们的工作负担。例如,在金融领域,大模型可以自动分析大量的金融数据,帮助人们做出更准确的决策。
- 创造新的就业机会:随着大模型的普及和应用,将创造出许多新的就业机会。例如,需要更多的人来开发和维护大模型,也需要更多的人来利用大模型进行各种应用开发。
(二)大模型对生活的影响
- 改善生活质量:大模型在智能家居、智能客服等领域的应用,使得人们的生活更加便利、舒适。例如,通过智能家居系统,人们可以通过语音指令控制家电,实现智能化生活。
- 提高学习效率:大模型在教育领域的应用,可以帮助人们更高效地学习新知识。例如,通过大模型的智能推荐功能,人们可以根据自己的兴趣和需求,获取更加个性化的学习资源。
- 增强娱乐体验:大模型在娱乐领域的应用,可以提供更加丰富、多样的娱乐体验。例如,通过大模型的语音识别功能,人们可以通过语音指令控制游戏,实现更加智能化的游戏体验。
十、本地部署大模型
具体操作步骤可参考这篇博客:【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)
十一、基于大模型的智能体
智能体(AI Agent),又称“人工智能代理”,是一种模仿人类智能行为的智能化系统,它就像是拥有丰富经验和知识的“智慧大脑”,能够感知所处的环境,并依据感知结果,自主地进行规划、决策,进而采取行动以达成特定目标。简单来说,智能体能够根据外部输入做出决策,并通过与环境的互动,不断优化自身行为。
智能体本身既不是单纯的软件也不是硬件,而是一个更为宽泛的概念,它们可以是软件程序、机器人或其他形式的系统,具备一定的自主性和智能性。
基于大模型的智能体是指利用大语言模型(如GPT、BERT等)作为核心组件,构建的能够执行特定任务、与环境交互并做出决策的人工智能系统。这些智能体具有自主性、交互性、适应性等特点,能够模拟人类的认知和决策过程,提供更加自然、高效和个性化的交互体验。它们能够处理海量数据,进行高效的学习与推理,并展现出跨领域的应用潜力。
1. Operator
2025年1月23日,OpenAI发布了一个创新性的智能体——Operator,它是一个能够像人类一样使用计算机的智能体。它基于OpenAI最新研发的CUA(Computer-Using Agent)模型,CUA 将 GPT-4o 的视觉功能与通过强化学习获得的高级推理相结合,经过训练可以与图形用户界面(GUI,即人们在屏幕上看到的按钮、菜单和文本字段)进行交互。Operator通过观察屏幕并使用虚拟鼠标和键盘来完成任务,而无需依赖专门的API接口。这种设计使其可以适配任何为人类设计的软件界面,带来极高的灵活性。
Operator好比一个博士水平的个人助理,你给他一个复杂的任务,它就会自动执行。Operator的主要功能包括自主完成诸如采购杂货、提交费用报表、订票、买日用品、填写表格等任务,旨在通过自动化操作提升日常生活和工作效率。它还可以一边在StubHub搜索勇士队比赛门票,一边处理网球场预订、寻找清洁服务和DoorDash订餐,实现多任务并行处理。
2. Deep Research
2025年2月3日,OpenAI发布了一款新的智能体产品——Deep Research。Deep Research由OpenAI o3模型的一个版本提供支持,该模型针对网页浏览和数据分析进行了优化,它利用推理来搜索、解释和分析互联网上的大量文本、图像和PDF,并根据需要根据遇到的信息做出调整。Deep Research具有以下四大核心技术:
(1)数据雷达。会自动24小时扫描全球知识库。
(2)知识拼图。能把零散的信息拼成完整的战略地图。
(3)逻辑推理。发现矛盾时,自动回溯、验证,调整推理路径。
(4)学术裁缝。可以综合各种知识,生成完美的报告,还附带文献引用。
3. 文心智能体平台AgentBuilder
文心智能体平台AgentBuilder,是基于文心大模型的智能体构建平台,为开发者提供低成本的开发方式,支持广大开发者根据自身行业领域、应用场景,采用多样化的能力、工具,打造大模型时代的原生应用。并且为开发者提供百度生态流量分发路径,完成商业闭环。
2024年7月5日起,百度文心智能体平台(AgentBuilder)免费开放文心大模型4.0。
文心智能体平台(AgentBuilder)核心能力如下:
- 零基础自然语言创建:通过自然语言开启配置,系统模型基于设定理解,自动生成基础配置,实现“一句话”轻松创建智能体。
- 数字形象一键配置:多样的数字人形象与人声,供各类型智能体开发者挑选,打造人格化的智能体,提升用户交互体验。
- 高兼容数据集能力:国内领先的数据集接入能力,支持大容量、多格式、多途径接入,满足专业或特定智能体构建。
- 多样化工具插件:百度官方与行业合作伙伴提供各类型专业工具,帮助开发者实现复杂功能,增强智能体服务性能。
- 百度生态流量分发:文心智能体平台是“开发+分发+运营+变现”一体化赋能平台,已打通百度搜索、小度、一言、地图、车机等多场景、多设备分发。
- 数据飞轮全面调优:平台支持问答对调优、智能体诊断,底座大模型则可通过分发数据反馈进行自主调优,让智能体学习升级、更加聪明。
小结
大模型是基于深度学习技术的人工智能模型,通常具备庞大的参数量和训练数据,能够处理和生成各种类型的数据。它的核心优势包括强大的上下文理解能力、语言生成能力和学习能力,能够在不同任务和领域间迁移和应用知识。大模型的成功得益于其庞大的规模和复杂结构,它能够从大量数据中学习微妙的规律,具有更强的泛化能力和问题解决能力。
大模型的发展经历了三个阶段:萌芽期、沉淀期和爆发期。在萌芽期,传统的神经网络和卷积神经网络为后续大模型的研究奠定了基础;沉淀期随着Transformer架构的提出,使得大模型的预训练算法逐渐成熟;爆发期从2020年起,OpenAI的GPT-3以及随后的GPT-4和ChatGPT等模型的出现,推动了大模型的广泛应用和普及。
目前,全球各大公司如OpenAI、谷歌等都已推出多种大模型产品,涵盖了自然语言处理、图像识别、视频生成等多个领域。国内如阿里、百度、字节跳动等企业也在积极布局,推出了如DeepSeek、通义千问、文心一言等大模型,进一步推动了人工智能技术的快速发展。
欢迎 点赞👍 | 收藏⭐ | 评论✍ | 关注🤗
相关文章:
【大模型科普】大模型:人工智能的前沿(一文读懂大模型)
【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…...
[漏洞修复]用yum update修openssh漏洞
[漏洞修复]用yum update修openssh漏洞 1. 需求2. 更新Yum仓库2.1 生成本地仓库2.2 生成内网仓库2.3 将Openssh的包更新到仓库 3. 客户端升级3.1 客户端repo文件配置3.2 升级Openssh3.3 升级后的确认 1. 需求 最近经常有朋友问Openssh 漏洞修复的问题,我也在自己的gitee仓库里更…...
[RH342]iscsi配置与排错
[RH342]iscsi配置与排错 1. 服务端配置1.1 安装targetcli1.2 准备磁盘1.3 服务端配置1.4 防火墙配置 2. 客户端配置2.1 安装客户端软件2.2 配置客户端2.3 连接登录服务端2.4 挂载使用 3. 安全验证扩展3.1 服务端3.2 客户端 4. 常见的排错点4.1 服务端常见错误4.2 客户端常见错误…...
Nginx 代理访问一个 Web 界面时缺少内容
1. 资源路径问题 Web 页面中的静态资源(如图片、CSS、JavaScript 文件)可能使用了相对路径或绝对路径,而这些路径在代理后无法正确加载。 解决方法: 检查资源路径:打开浏览器的开发者工具(按 F12…...
HOVER:人形机器人的多功能神经网络全身控制器
编辑:陈萍萍的公主一点人工一点智能 HOVER:人形机器人的多功能神经网络全身控制器HOVER通过策略蒸馏和统一命令空间设计,为人形机器人提供了通用、高效的全身控制框架。https://mp.weixin.qq.com/s/R1cw47I4BOi2UfF_m-KzWg 01 介绍 1.1 摘…...
SEO新手基础优化三步法
内容概要 在网站优化的初始阶段,新手常因缺乏系统性认知而陷入技术细节的误区。本文以“三步法”为核心框架,系统梳理从关键词定位到内容布局、再到外链构建的完整优化链路。通过拆解搜索引擎工作原理,重点阐明基础操作中容易被忽视的底层逻…...
遨游科普:三防平板是哪三防?有哪些应用场景?
在工业智能化与数字化转型的浪潮中,电子设备的耐用性和环境适应性成为关键需求。普通消费级平板电脑虽然功能强大,但在极端环境下往往“水土不服”。而三防平板凭借其独特的防护性能,正逐步成为“危、急、特”场景的核心工具。 AORO P300 Ult…...
Etcd 服务搭建
💢欢迎来到张胤尘的开源技术站 💥开源如江河,汇聚众志成。代码似星辰,照亮行征程。开源精神长,传承永不忘。携手共前行,未来更辉煌💥 文章目录 Etcd 服务搭建预编译的二进制文件安装下载 etcd 的…...
C++《红黑树》
在之前的篇章当中我们已经了解了基于二叉搜索树的AVL树,那么接下来在本篇当中将继续来学习另一种基于二叉搜索树的树状结构——红黑树,在此和之前学习AVL树类似还是通过先了解红黑树是什么以及红黑树的结构特点,接下来在试着实现红黑树的结构…...
Axios 请求取消:从原理到实践
Axios 请求取消:从原理到实践 在现代前端开发中,网络请求是不可或缺的一部分。Axios 是一个基于 Promise 的 HTTP 客户端,广泛应用于浏览器和 Node.js 环境中。然而,在某些场景下,我们可能需要取消正在进行的请求&…...
【css酷炫效果】纯CSS实现照片堆叠效果
【css酷炫效果】纯CSS实现照片堆叠效果 缘创作背景html结构css样式完整代码基础版进阶版(增加鼠标悬停查看) 效果图 想直接拿走的老板,链接放在这里:https://download.csdn.net/download/u011561335/90492022 缘 创作随缘,不定时更新。 创…...
论文精度:Transformers without Normalization
前言 论文题目:Transformers without Normalization 作者:Jiachen Zhu 1,2 , Xinlei Chen 1 , Kaiming He 3 , Yann LeCun 1,2 , Zhuang Liu 1,4,† 论文地址:https://arxiv.org/pdf/2503.10282 摘要 这篇论文探讨了现代神经网络中广泛使用的归一化层是否是必不可少的。…...
基于香橙派 KunpengPro学习CANN(3)——pytorch 模型迁移
通用模型迁移适配可以分为四个阶段:迁移分析、迁移适配、精度调试与性能调优。 迁移分析 迁移支持度分析: 准备NPU环境,获取模型的源码、权重和数据集等文件;使用迁移分析工具采集目标网络中的模型/算子清单,识别第三方…...
微软远程桌面即将下架?Splashtop:更稳、更快、更安全的 RDP 替代方案
近日,Windows 官方博客宣布:将于2025年5月27日起,在 Windows 10 和 Windows 11 应用商店中下架“Microsoft 远程桌面”应用,建议用户迁移至新的 Windows App。这一变动引发了广大用户对远程访问解决方案的关注。作为全球领先的远程…...
【Python】Python与算法有应用关系吗?
李升伟 整理 是的,Python与算法有着密切的应用关系。Python作为一种高级编程语言,因其简洁的语法和强大的库支持,被广泛应用于算法设计、实现和应用中。以下是Python与算法之间的一些主要应用关系: 1. 算法学习与教学࿱…...
js,html,css,vuejs手搓级联单选
<!DOCTYPE html> <html lang"zh"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>级联选择器</title><script src"h…...
将Django连接到mysql
将Django连接到mysql 文章目录 将Django连接到mysql一.按照我的文章 在Django模型中的Mysql安装 此篇 的步骤完成mysql的基础配置二.Django配置 一.按照我的文章 ‘在Django模型中的Mysql安装’ 此篇 的步骤完成mysql的基础配置 基础配置具体内容 1.打开PowerShell 安装mysql的…...
每天五分钟深度学习框架pytorch:基于pytorch搭建循环神经网络RNN
本文重点 我们前面介绍了循环神经网络RNN,主要分析了它的维度信息,其实它的维度信息是最重要的,一旦我们把维度弄清楚了,一起就很简单了,本文我们正式的来学习一下,如何使用pytorch搭建循环神经网络RNN。 RNN的搭建 在pytorch中我们使用nn.RNN()就可以创建出RNN神经网络…...
【力扣刷题实战】无重复的最长字串
大家好,我是小卡皮巴拉 文章目录 目录 力扣题目: 无重复的最长字串 题目描述 解题思路 问题理解 算法选择 具体思路 解题要点 完整代码(C) 兄弟们共勉 !!! 每篇前言 博客主页&#x…...
vulhub/joker 靶机----练习攻略
1. 靶机下载地址 https://download.vulnhub.com/ha/joker.zip 下载下来是ova文件,直接双击,在VMware打开,选择保存位置,点击导入。 2. 设置网卡模式为NAT,打开靶机 3.老规矩,打开kali,扫同C…...
Nuxt2 vue 给特定的页面 body 设置 background 不影响其他页面
首先认识一下 BODY_ATTRS 他可以在页面单独设置 head () {return {bodyAttrs: {form: form-body}};},设置完效果是只有这个页面会加上 接下来在APP.vue中添加样式...
【Go】运算符笔记
基本数学运算 Go 语言支持常见的 算术运算符,用于执行数学计算。 运算符说明加法-减法*乘法/除法%取余自增--自减 整数运算只能得到整数部分 package mainimport ("fmt""math" )func main() {go_math() }func go_math() {x, y : 8, 5fmt.Pr…...
常见的前端安全问题
前端安全是 Web 开发中至关重要的一环,以下是常见的前端安全问题及对应的防御措施: 1. XSS(跨站脚本攻击) 攻击原理 攻击者向页面注入恶意脚本(如 JavaScript),在用户浏览器中执行,…...
基于Spring Boot的项目申报系统的设计与实现(LW+源码+讲解)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...
SPI驱动(九) -- SPI_Master驱动程序
文章目录 参考资料:一、SPI传输概述二、SPI传输的两种方法2.1 旧方法2.2 新方法 参考资料: 参考资料: 参考内核源码: drivers\spi\spi.c 一、SPI传输概述 SPI控制器的作用是发起与它下面挂接的SPI设备之间的数据传输,那么控制…...
Transformer网络发展概述2025.3.18
一.Transformer概述 1.1 定义与原理 Transformer是一种基于自注意力机制的深度学习模型,在处理序列数据时表现卓越。其核心原理包括: 自注意力机制 :允许模型同时考虑输入序列中的所有位置,捕捉语义关系多头注意力 :…...
3.4 二分查找专题:LeetCode 69. x 的平方根
1. 题目链接 LeetCode 69. x 的平方根 2. 题目描述 给定一个非负整数 x,计算并返回 x 的平方根的整数部分(向下取整)。 示例: 输入:x 4 → 输出:2输入:x 8 → 输出:2࿰…...
机器人曲面跟踪Surface-Tracking
定义 机器人曲面跟踪(Surface-Tracking)是指机器人通过实时感知工件曲面的三维形貌,动态调整运动轨迹和位姿,以精确跟随曲面进行加工(如打磨、抛光、喷涂等)的技术。 力 - 位姿协同控制 力控模式ÿ…...
opencv中stitch图像融合
openv版本: opencv249 vs :2010 qt : 4.85 #include "quanjing.h"#include <iostream> #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2/imgproc/imgproc.hpp> #include <open…...
深入解析ES6+新语法:复杂的迭代器与生成器
一、迭代器(Iterator):数据遍历的统一协议 1. 迭代器协议的本质 **迭代器协议(Iterator Protocol)** 是一种标准化的数据访问接口,它要求对象实现一个 next() 方法,每次调用返回包含 { valu…...
【C语言】自定义类型:结构体
一、结构体类型的声明 我们前面学习操作符的时候已经接触过结构体了,下面我们回顾一下结构体的基本内容。 创建结构体的语法如上所示: struct是创建结构体的关键字,然后tag就是我们结构体的名称,member-list是结构体的成员列表&…...
微服务即时通信系统---(五)框架学习
目录 ODB 介绍 安装 build2安装 odb-compiler安装 ODB运行时库安装 mysql和客户端开发包安装 boost profile库安装 总体打包安装 总体卸载 总体升级 头文件包含和编译时指明库 ODB常见操作介绍 类型映射 ODB编程 类与接口介绍 mysql连接池对象类 mysql客户端…...
蓝桥杯练习day1:自除数
前言 自除数 是指可以被它包含的每一位数整除的数。 例如,128 是一个 自除数 ,因为 128 % 1 0,128 % 2 0,128 % 8 0。 自除数 不允许包含 0 。 给定两个整数 left 和 right ,返回一个列表,列表的元素…...
0基础 | 上下拉电阻典型应用场景
三极管典型运用: 上拉电阻 下拉电阻 限流电阻 此处开关为三极管 左侧电阻:驱动电阻【限流电阻】 (控制mos管) 下面电阻:下拉电阻【关断电阻】 %%作用1: (因为IO口输出信号分为低电平&…...
MySQL数据高效同步到Elasticsearch的四大方案
目录 引言 一、为什么需要MySQL到ES的同步? 二、四大同步方案对比 三、方案详解与代码实战 1. 应用层双写:简单但强耦合 2. 定时任务同步:可控的准实时 3. Logstash JDBC:离线迁移利器 4. Binlog监听:生产级实…...
Docker详解
云是一种服务理念。在云里docker是业务的最小载体 doker是管理容器的引擎,为应用打包、部署平台、而非单纯的虚拟化技术 1.轻量级虚拟化 2.一致性 4.高效的资源利用 5.易于部署和扩展 docker和虚拟机的区别: 虚拟机:真机需要一个操作系…...
清晰易懂的Maven安装教程(含自定义依赖包位置)
初学者也能看懂的 Maven 安装教程(含自定义依赖包位置) Maven 是一个强大的项目管理和构建工具,广泛用于 Java 项目的依赖管理和构建自动化。本教程将手把手教你如何在 Windows 系统上安装 Maven,并配置环境变量,同时…...
王道数据结构6.3
顶点x的第一个邻接点以及下一个邻接点 int first_neighbor(Algraph G, int x){if(G.vertices[x].firstarc! nullptr){return G.vertices[x].firstarc->adjvex;}else return -1; }int next_neighbor(Algraph G,int x,int y){ArcNode *pG.vertices[x].firstarc;while(p! null…...
【Linux操作系统——学习笔记二】Linux简单导航命令操作
一、前言 学习Linux,本质上是学习在命令行下熟练使用Linux的各类命令。 命令行:是一种通过输入命令和参数与计算机系统进行交互的方式,可以使用各种字符化命令对系统发出操作指令,打开Linux终端,进入命令行界面。 …...
贪心算法——c#
贪心算法通俗解释 贪心算法是一种"每一步都选择当前最优解"的算法策略。它不关心全局是否最优,而是通过局部最优的累积来逼近最终解。优点是简单高效,缺点是可能无法得到全局最优解。 一句话秒懂 自动售货机找零钱:用最少数量的…...
SPI 总线协议
1、协议介绍 SPI,是英语 Serial Peripheral interface 的缩写,顾名思义就是串行外围设备接口。是 Motorola 首先在其 MC68HCXX 系列处理器上定义的。 SPI,是一种高速的,全双工,同步的通信总线。主节点或子节点的数据在…...
单片机开发资源分析的实战——以STM32G431RBT6为例子的单片机资源分析
目录 第一点:为什么叫STM32G431RBT6 从资源手册拿到我们的对STM32G431RBT6的资源描述 第二件事情,关心我们的GPIO引脚输出 第三件事情:去找对应外设的说明部分 第一点:为什么叫STM32G431RBT6 对于命名规则不太熟悉的朋友看这里…...
物联网(IoT)架构中,平台层的应用与技术
在物联网(IoT)架构中,平台层是连接物理设备(感知层)和应用服务(应用层)的核心部分。它负责数据的采集、处理、存储、分析以及设备管理等功能,是物联网系统的“大脑”。以下是平台层的主要功能及其技术实现手段: 平台层的主要功能 设备管理: 功能:管理物联网设备的注…...
大语言模型的压缩技术
尽管人们对越来越大的语言模型一直很感兴趣,但MistralAI 向我们表明,规模只是相对而言的,而对边缘计算日益增长的兴趣促使我们使用小型语言获得不错的结果。压缩技术提供了一种替代方法。在本文中,我将解释这些技术,并…...
JVM 2015/3/15
定义:Java Virtual Machine -java程序的运行环境(java二进制字节码的运行环境) 好处: 一次编写,到处运行 自动内存管理,垃圾回收 数组下标越界检测 多态 比较:jvm/jre/jdk 常见的JVM&…...
DeepSeek辅助学术写作中期能力及提示词分享
目录 确立三论 收集资料 选取论据 展开论证 大家好这里是AIWritePaper官方账号!更多内容👉AIWritePaper~在如今这个学术圈的“快车道”上,时间就像是一场永不停歇的赛跑,而论文质量则是那颗我们拼命追逐的“金苹果”。最近一款…...
Git 实战指南:本地客户端连接 Gitee 全流程
本文将以 Gitee(码云)、系统Windows 11 为例,详细介绍从本地仓库初始化到远程协作的全流程操作 目录 1. 前期准备1.1 注册与配置 Gitee1.2 下载、安装、配置客户端1.3 配置公钥到 Gitee2. 本地仓库操作(PowerShell/Git Bash)2.1 初始化本地仓库2.2 关联 Gitee 远程仓库3. …...
汇编基础知识
机器语言 1、机器语言是机器指令的集合,机器指令就是机器可以正确执行的命令,由二进制数组成 2、当今我们常用的是pc机,由一个芯片完成上述功能,即CPU是一种微处理器,每一种微处理器由于自身硬件设计和内部构造不同都…...
线程池的拒绝策略适用场景思考
ThreadPoolExecutor有四种拒绝策略。刚开始学习线程池的时候我就觉得,就是应该当任务饱和(达到拒绝策略)时,就应该拒绝任务,抛出异常。最近仔细思考了下,既然线程池这么设计,也应该有一定的道理…...
on-policy对比off-policy
目录 持续更新。。。 on-policy与off-policy的定义 Q-learning属于on-policy算法还是off-policy算法? 为什么off-policy适用于从离线经验或多种探索策略中学习,明明 On-policy 也可以基于探索学习的啊? 重要性权重方法 off-policy方法可…...