当前位置: 首页 > news >正文

《探寻真正开源的大模型:开启AI创新新纪元》

《探寻真正开源的大模型:开启AI创新新纪元》

  • 一、开源大模型崛起:AI 发展的新曙光
  • 二、开源大模型的 “庐山真面目”
  • 三、明星开源大模型闪耀登场
    • (一)LLaMA 3:实力强劲的开源先锋
    • (二)Phi-3:小巧精悍的多面手
    • (三)BERT:自然语言处理的基石
    • (四)Falcon 180B:性能怪兽的 “双面性”
    • (五)BLOOM:多语言处理的集大成者
    • (六)XGen-7B:长文本处理的行家
    • (七)GPT-NeoX 和 GPT-J:灵活多变的应用利器
    • (八)Vicuna-13B:智能聊天的贴心伙伴
    • (九)Mistral 7B:长文理解的得力助手
    • (十)零一万物(Yi 系列模型):多语言理解的智慧中枢
  • 四、如何甄选适合你的开源大模型
  • 五、开源大模型的未来:无限可能的探索之旅

一、开源大模型崛起:AI 发展的新曙光

在当今科技飞速发展的时代,人工智能大模型已成为推动各领域变革的核心力量。从智能语音助手为我们提供便捷服务,到智能写作工具助力内容创作,再到智能客服提升企业服务效率,大模型的应用场景不断拓展,逐渐融入人们生活的方方面面。
然而,在大模型领域,长期以来闭源模型占据主导地位,少数科技巨头掌控着核心技术与资源,犹如筑起了一道高墙,限制了技术的广泛传播与创新活力的释放。但近年来,开源大模型如同一股蓬勃兴起的浪潮,打破了这一局面,为 AI 发展注入了新的生机与活力。
开源大模型具有诸多显著优势。它赋予了开发者自由使用、修改代码的权利,极大地激发了全球范围内开发者的创新热情。大家不再受限于闭源模型的黑箱模式,可以深入探究模型的内部机制,根据自身需求定制优化,从而加速技术迭代。例如,某科研团队基于开源大模型进行医疗影像分析研究,通过修改模型架构,使其对特定病症的识别准确率大幅提升,为疾病早期诊断带来新突破;同时,开源社区汇聚了全球智慧,不同背景的开发者、研究者在这里交流协作,分享经验与成果,形成了强大的知识共享网络。无论是初出茅庐的学生,还是经验丰富的专家,都能在社区中找到用武之地,共同推动技术边界的拓展。而且,开源大模型降低了中小企业、科研机构等进入 AI 领域的门槛,让更多创新力量得以参与竞争,避免了技术的垄断与单一化发展,为 AI 生态的多元化繁荣奠定了基础。

二、开源大模型的 “庐山真面目”

开源大模型,顾名思义,是指源代码向公众开放的大规模人工智能模型。它打破了传统闭源模式下技术的封闭性,将模型的构建蓝图毫无保留地展现在开发者面前。这意味着无论是专业的科研团队,还是业余的技术爱好者,只要对 AI 开发有想法、有热情,都能深入探究模型的底层逻辑,了解每一个神经元连接、每一层网络结构的设计初衷。例如,在自然语言处理领域备受瞩目的 BERT 模型,其源代码公开后,全球各地的开发者纷纷基于它进行二次开发,针对不同语言、不同领域的文本处理需求,衍生出了众多各具特色的优化版本。
其具有高度的可定制性。不同行业、不同企业面临的业务场景千差万别,闭源模型往往提供标准化的解决方案,难以满足多样化的需求。而开源大模型则允许开发者根据自身实际情况,对模型架构、参数进行调整优化。一家专注于医疗影像诊断的初创公司,借助开源大模型,通过重新训练模型,使其精准识别各类病症特征,辅助医生快速、准确地做出诊断,大大提高了诊断效率,为患者争取了更多宝贵的治疗时间;在金融领域,银行可以利用开源大模型定制风险评估系统,通过对海量金融数据的学习,精准预测贷款违约风险,保障金融业务的稳健运行。
社区驱动是开源大模型的显著特征。全球开发者围绕开源大模型汇聚成庞大的社区,大家在这里分享经验、交流见解、协同开发。这种集思广益的模式使得模型能够快速迭代升级,不断融入新的技术与智慧。以 Hugging Face 社区为例,它为众多开源大模型提供了展示、交流与合作的平台,开发者们在这里共享预训练模型、数据集,共同攻克技术难题。当某个开发者在模型训练中遇到棘手的梯度消失问题时,在社区中发布求助信息,很快就能得到来自世界各地同行的建议与解决方案,推动项目顺利进展。
开源大模型大多免费或低成本。对于中小企业、科研机构以及个人开发者而言,闭源大模型高昂的使用许可费用往往令人望而却步。而开源大模型则提供了免费使用的基础版本,即使需要一些额外的定制化开发或技术支持,成本也相对较低。这使得更多创新力量能够投身于 AI 应用开发的浪潮中,避免了技术被少数巨头垄断,促进了整个 AI 产业生态的多元化繁荣。

三、明星开源大模型闪耀登场

(一)LLaMA 3:实力强劲的开源先锋

Meta 作为 AI 领域的重要力量,重磅推出的 LLaMA 3 无疑是开源大模型中的佼佼者。它涵盖了 80 亿参数的 8B 版本以及 700 亿参数的 70B 版本,展现出强大的性能实力。这两个版本通过人类反馈的强化学习(RLHF)进行微调,使其能够更好地理解人类意图,生成更加贴合需求的文本。在自然语言生成任务中,面对给定的主题,LLaMA 3 能够迅速构思出逻辑连贯、内容丰富的文本段落,无论是撰写科技评论、文学创作还是日常交流对话,都表现得游刃有余;在编程任务方面,它能够辅助开发者理解代码逻辑、提供代码片段建议,助力编程效率的提升。
例如,某小型科技创业公司致力于开发一款智能写作辅助工具,基于 LLaMA 3 模型进行定制开发。他们利用 LLaMA 3 的开源特性,针对写作场景进行优化,使其能够精准理解用户的写作需求,提供风格适宜的语句、段落建议。在产品试用阶段,用户反馈该工具大大激发了创作灵感,提高了写作速度与质量,为公司赢得了良好的市场口碑,也充分彰显了 LLaMA 3 在实际应用中的价值。

(二)Phi-3:小巧精悍的多面手

微软 AI 研究院精心打造的 Phi-3 系列模型,以其独特的小型化设计与高效能表现备受瞩目。该系列包含 Mini、Small 和 Medium 三个版本,其中最小的 Phi-3-Mini 虽仅有 3.8B 参数,却在关键基准测试中崭露头角,与大型模型一较高下。它在智能手机等移动设备上展现出卓越的运行能力,能够快速响应用户需求。
在日常生活场景中,当用户身处没有网络覆盖的偏远地区,Phi-3-Mini 可在手机上离线运行,为用户提供诸如行程规划、知识问答等智能服务;在边缘计算场景下,智能安防摄像头搭载 Phi-3-Mini 模型,能够实时分析视频画面,精准识别异常行为并及时发出警报,大大提升安防效率,以小身材发挥大能量,为智能生活添彩助力。

(三)BERT:自然语言处理的基石

回顾自然语言处理(NLP)的发展历程,谷歌于 2017 年推出的 BERT 模型无疑是一座具有划时代意义的里程碑。它基于 Transformer 架构构建,凭借创新性的双向编码器设计,彻底革新了 NLP 任务的处理方式。在机器阅读理解任务中,面对复杂的文本篇章与问题,BERT 能够深入理解文本语义,精准定位关键信息,给出准确答案,在知名的 SQuAD 数据集上取得了超越人类平均水平的成绩;在文本分类任务中,无论是对新闻文章进行主题分类,还是对社交媒体评论判断情感倾向,BERT 都能以高准确率完成任务,为信息筛选与舆情分析提供有力支持。
众多后续的开源大模型纷纷借鉴 BERT 的架构设计与预训练思路,不断拓展 NLP 的边界,推动该领域向着更高精度、更广泛应用的方向大步迈进。

(四)Falcon 180B:性能怪兽的 “双面性”

Falcon 180B 宛如一头性能卓越的巨兽,以其 1800 亿参数的超大规模和惊人的性能称霸开源大模型领域。它在多项自然语言处理基准测试中表现非凡,力压众多竞争对手,如在 Hugging Face 开源大模型榜单上,以显著优势位居前列。其处理复杂文本任务时的强大能力令人惊叹,面对长篇学术论文,能够快速提炼核心观点、总结关键内容;在智能写作辅助方面,能够生成逻辑严谨、语言流畅的高质量文本,为创作者提供丰富灵感。
然而,要驾驭这头 “巨兽” 并非易事,它对计算资源有着极高的要求。运行 Falcon 180B 模型,通常需要配备多张高端 GPU,且内存容量要达到数百 GB,这使得个人开发者在硬件门槛前望而却步。但对于拥有强大算力的科研机构和企业而言,Falcon 180B 无疑是推动前沿研究、打造智能应用的得力工具,有望在诸如生物医药研发中的文献分析、金融领域的风险报告生成等场景发挥巨大价值。

(五)BLOOM:多语言处理的集大成者

BLOOM 模型由国际团队联合研发,以其 1760 亿参数的磅礴体量和卓越的多语言处理能力独树一帜。它能够用 46 种语言以及 13 种编程语言流畅地生成连贯、准确的文本,仿佛一位精通多国语言的 “大师”。在跨国企业的文档处理工作中,BLOOM 可以快速将一份英文产品说明书翻译为多种目标语言版本,且译文质量上乘,保留了原文的专业术语与逻辑结构,大大提高了企业的国际化沟通效率;在多语言客服场景下,它能够理解不同语言客户的咨询内容,并以合适的语言精准回复,有效提升客户满意度。
尤为值得一提的是,BLOOM 的源代码和训练数据完全对外开放,这种高度的透明度为全球研究人员深入探究模型内部机制、进行定制优化提供了极大便利,加速了多语言 AI 技术的创新发展。

(六)XGen-7B:长文本处理的行家

Salesforce 推出的 XGen-7B 在处理长文本方面展现出独特的优势,尤其是其高级版本 XGen-7B-8K-base,配备了长达 8K 的上下文窗口,犹如拥有超强记忆力的 “智者”。在处理长篇小说、专业文献等超长文本时,它能够完整地捕捉文本前后的逻辑关联,精准理解复杂的语义信息。文学研究者利用 XGen-7B 分析经典长篇小说的主题演变、人物关系时,模型能够基于全文内容给出深入见解;在商业领域,面对冗长的市场调研报告、合同文本,它可以迅速提取关键要点,为企业决策提供高效支持,助力企业在信息洪流中精准把握核心价值。

(七)GPT-NeoX 和 GPT-J:灵活多变的应用利器

EleutherAI 实验室开发的 GPT-NeoX 和 GPT-J 两款模型各具特色,GPT-NeoX 拥有 200 亿参数,GPT-J 参数规模为 60 亿。它们虽未经过 RLHF 训练,却在灵活性上表现卓越,能够适应多种自然语言处理任务。在文本生成任务中,面对给定的主题或开头,它们能够快速生成风格各异、富有创意的文本内容,为创作者提供多样化的灵感源泉;在情感分析任务里,对社交媒体上的海量评论进行快速扫描,精准判断情感倾向,助力企业了解公众舆论。
研究人员基于 GPT-NeoX 模型开发情感分析工具时,通过对不同领域文本数据的微调训练,使其在影视评论、产品反馈等场景下的情感判断准确率大幅提升,为内容创作者、市场营销人员等提供了有力的数据洞察支持。

(八)Vicuna-13B:智能聊天的贴心伙伴

Vicuna-13B 作为一款开源对话模型,基于 LLaMa 13B 精心微调而成,专注于智能聊天领域,致力于为用户带来贴心、高效的交互体验。在电商行业,它化身智能客服,实时解答顾客关于产品信息、购物流程、售后保障等各类问题,以快速、准确的回复提升顾客购物体验,助力商家提高客户转化率;在医疗保健领域,为患者提供初步的健康咨询,如症状解读、日常保健建议等,缓解患者就医前的焦虑情绪;在教育场景下,充当智能学习助手,帮助学生答疑解惑、梳理知识脉络,激发学习兴趣。
通过实际应用案例对比,相较于传统基于规则的客服系统,Vicuna-13B 能够更好地理解用户的自然语言问题,给出更贴合需求、人性化的回答,显著提升交互质量,让智能聊天真正走入人们的生活。

(九)Mistral 7B:长文理解的得力助手

Mistral 7B v0.2 版本重磅来袭,带来诸多亮点更新,其中上下文长度提升至 32K 且取消滑动窗口的优化尤为引人注目。这使得它在处理长文档、长篇幅专业资料时如鱼得水。科研人员在研读篇幅冗长的学术论文时,Mistral 7B 能够一次性理解大量文本内容,精准提炼关键研究成果、实验数据,助力科研效率飞跃;在内容创作领域,面对长篇小说创作、系列文章策划等任务,它可以基于前文内容连贯地生成后续情节,保持风格统一、逻辑连贯,为创作者打开灵感大门,成为应对长文本挑战的得力伙伴。

(十)零一万物(Yi 系列模型):多语言理解的智慧中枢

01.AI 推出的 Yi 系列模型,凭借 3T 多语言语料库的深度滋养,展现出卓越的语言理解、常识推理与阅读理解能力。在跨语言翻译场景中,无论是商务合同、文学作品还是日常交流对话,Yi 系列模型都能精准捕捉源语言的语义精髓,以地道的表达方式呈现高质量译文;在多语言内容创作方面,为全球创作者提供灵感支持,轻松跨越语言障碍,激发多元创意。
对于跨国企业的全球化营销文案撰写、国际文化交流项目中的内容创作等需求,Yi 系列模型能够充分理解不同文化背景下的语言习惯,产出贴合目标受众的优质内容,搭建起沟通世界的智慧桥梁。

四、如何甄选适合你的开源大模型

面对琳琅满目的开源大模型,如何挑选出最契合自身需求的那一款呢?这需要综合考量多方面因素。
首先是许可限制。不同的开源大模型采用各异的开源许可证,有些许可证允许自由商用,而有些则对商业用途设有特定条件,如要求开源衍生作品、注明出处等。若你计划将模型应用于商业项目,务必仔细研读许可证条款,确保合规使用,避免潜在的法律风险。
应用场景也是关键。倘若你旨在开发一款智能写作辅助工具,那么擅长自然语言生成的 LLaMA 3、GPT-NeoX 等模型或许是首选;若要为移动应用赋能,使其能在离线状态下提供智能服务,Phi-3 这种小型化且高效能、适配资源受限环境的模型则更为妥当;若是处理跨国业务中的多语言文档,BLOOM、零一万物(Yi 系列模型)凭借卓越的多语言处理能力,可助你一臂之力,轻松跨越语言障碍。
精度需求不容忽视。通常而言,参数规模越大的模型,在复杂任务上的表现往往更优,能够提供更为精准的回答。但对于一些简单任务,小型模型或许已足够应对,且运行成本更低。比如在日常闲聊场景,Vicuna-13B 就能很好地满足需求,而处理专业学术文献的深度分析时,Falcon 180B、Mixtral 8x7B 等大型模型可能更具优势。
资源投入是实际部署时必须考虑的要点。运行大模型对计算资源要求颇高,包括 GPU 的显存、算力,以及内存、存储容量等。像 Falcon 180B 这类超大规模模型,若无强大的硬件支撑,运行过程极易出现卡顿甚至无法启动的情况。此时,可关注模型的量化版本,通过降低参数精度来减少内存占用,提升运行效率,或者选择如 Phi-3、Mistral 7B 等对资源需求相对温和的模型。
预训练模型的可用性同样重要。部分开源大模型提供了预训练好的版本,开发者可直接在此基础上进行微调,能大幅节省训练时间与成本。若你拥有特定领域的专业数据,利用这些预训练模型进行针对性微调,可快速打造出专属的智能应用。

五、开源大模型的未来:无限可能的探索之旅

展望未来,开源大模型的前景一片光明,将在诸多方面持续发力,为人类社会带来更为深远的变革。
技术层面,模型架构的创新从未止步。研究者们不断探索全新的架构设计,致力于突破现有模型的性能瓶颈,提升训练效率与推理速度,让模型能够在更短的时间内处理海量复杂信息。与此同时,多模态融合成为发展的重要方向,将文本、图像、音频、视频等多种信息有机结合,使模型能够像人类一样全方位感知世界,进而解锁更多创新应用场景。例如,在智能医疗领域,医生可借助多模态大模型,同时参考患者的病历文本、影像检查结果、生命体征监测音频等数据,快速、精准地做出诊断,制定个性化治疗方案;在智能教育场景中,学生能通过与融合多种感官信息的教材互动,获得沉浸式学习体验,极大提高学习效果。
随着量子计算技术的逐步成熟,其强大的计算能力有望为开源大模型训练注入新动力,大幅缩短训练周期,加速模型迭代进程,促使模型性能实现质的飞跃。
开源社区作为开源大模型发展的核心驱动力,未来将愈发繁荣昌盛。全球开发者的参与热情持续高涨,不同地域、不同专业背景的人才汇聚于此,形成庞大的智慧网络。社区内的交流协作将更加紧密高效,知识共享更加顺畅,无论是初学者分享学习心得,还是资深专家探讨前沿技术难题,都能迅速得到回应与支持。这种协同创新模式将孕育出更多新颖的模型变种与应用思路,推动开源大模型向多元化、精细化方向发展。
各大科技企业与科研机构将进一步加大对开源社区的投入,提供丰富的资源与平台支持。他们不仅开放更多先进的模型、算法和数据集,还举办各类培训、竞赛活动,发掘培养优秀人才,助力社区成员提升技术水平,为开源大模型生态注入源源不断的活力。
应用领域拓展是开源大模型未来发展的重要着力点。在医疗健康领域,基于开源大模型开发的智能诊断系统将更加精准可靠,助力早期疾病筛查与诊断,为患者争取宝贵的治疗时间;个性化医疗方案制定也将成为常态,通过分析患者的基因数据、病史、生活习惯等多维度信息,为其量身定制最适宜的治疗路径。教育行业中,智能辅导系统能够依据学生的学习进度、知识掌握情况和学习风格,提供定制化学习指导,实现真正意义上的因材施教;虚拟学习环境将更加逼真生动,让学生足不出户即可身临其境地感受历史、探索科学奥秘。
制造业借助开源大模型实现智能化升级,优化生产流程,精准预测设备故障,降低生产成本,提高产品质量与生产效率;智能供应链管理系统能够实时跟踪物流信息、优化库存配置,确保供应链的稳定高效运行。在文化创意产业,开源大模型激发创作者灵感,辅助生成剧本、音乐、绘画等作品,甚至推动全新艺术形式的诞生,为人类文化宝库增添绚丽色彩。
开源大模型的崛起为人工智能发展开辟了广阔天地,其蕴含的无限潜力正等待我们携手挖掘。在未来的征程中,让我们紧密关注开源大模型的发展动态,积极投身其中,探索创新应用,共同见证人工智能为人类社会带来的美好变革,畅享智能科技带来的便捷与惊喜。

相关文章:

《探寻真正开源的大模型:开启AI创新新纪元》

《探寻真正开源的大模型:开启AI创新新纪元》 一、开源大模型崛起:AI 发展的新曙光二、开源大模型的 “庐山真面目”三、明星开源大模型闪耀登场(一)LLaMA 3:实力强劲的开源先锋(二)Phi-3&#x…...

麒麟信安云在长沙某银行的应用入选“云建设与应用领航计划(2024)”,打造湖湘金融云化升级优质范本

12月26日,2024云计算产业和标准应用大会在北京成功召开。大会汇集政产学研用各方专家学者,共同探讨云计算产业发展方向和未来机遇,展示云计算标准化工作重要成果。 会上,云建设与应用领航计划(2024)建云用…...

C#如何操作数据库

C#如何操作数据库 前言1、查询操作2、增删改操作3、需要返回id主键的sql语句执行 前言 本文主要交代如何通过引用 using MySql.Data.MySqlClient;来操作数据库 需要导入.dll文件 例如:在本地Mysql下载目录下->Connecter NET 8.0->Assemblies->net5.0->…...

c++领域展开第八幕——类和对象(下篇 初始化列表、类型转换、static成员)超详细!!!!

文章目录 前言一、初始化列表二、类型转换三、static成员总结 前言 上篇博客我们实现了一个简单的日期类,基本的类和对象是清楚了 今天我们再来学习后面的一些类和对象的语法,慢慢的完善所学的东西 fellow me 一、初始化列表 • 之前我们实现构造函数时…...

termux-boot安卓开机自动启动应用

termux安装 github 蓝奏云 v119.1 termux-boot安装 github 蓝奏云 v0.8.1 安装 给权限运行加锁后台 am启动应用命令 am start -n 包名/启动项获取包名和启动入口(图中app为爱玩机工具箱) 例 简黑时钟蓝奏云 包名com.hm.jhclock 桌面启动项com.hm.jh…...

Echart实现3D饼图示例

在可视化项目中,很多地方会遇见图表;echart是最常见的;这个示例就是用Echart, echart-gl实现3D饼图效果,复制即可用 //需要安装,再引用依赖import * as echarts from "echarts"; import echar…...

【JAVA】神经网络的基本结构和前向传播算法

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默, 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……) 2、学会Oracle数据库入门到入土用法(创作中……) 3、手把…...

设计模式-抽象工厂模式

在设计模式中,抽象工厂模式(Abstract Factory Pattern)是一个非常常见且重要的模式,它属于创建型模式,用于提供创建一组相关或相互依赖对象的接口,而无需指定具体类。它的核心思想是将“创建对象”这一功能…...

webpack

前言 在现代前端开发的浪潮中,Webpack 已经成为一个不可或缺的构建工具。它不仅能够帮助我们打包 JavaScript 代码,还能够处理各种资源(如 CSS、图片、字体等),并提供一系列优化手段,极大地提升开发效率和…...

BLIP论文笔记

论文地址 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 论文思想 其实Clip就相当于只用了ITC...

Java List 集合详解:基础用法、常见实现类与高频面试题解析

正文 在 Java 集合框架中,List 是一个非常重要的接口,广泛用于存储有序的元素集合。本文将带你深入了解 List 接口的基本用法、常见实现类及其扩展,同时通过实际代码示例帮助你快速掌握这些知识。 👉点击获取2024Java学习资料 1…...

HTML5 SSE

HTML5 SSE(Server-Sent Events,服务器发送事件)是一种允许服务器实时向浏览器推送数据的技术。它是HTML5规范的一部分,主要通过HTTP协议实现。SSE的主要特点包括: 单向通信:与WebSocket不同,SSE…...

SpringBoot篇(监控)

目录 学习前言 一、什么是监控? 二、监控的意义 1. 简介 2. 总结 3. 思考 三、可视化监控平台 1. 简介 2. 实操 2.1. 服务端开发 2.2. 客户端开发 配置多个客户端 2.3. 总结 2.4. 思考 四、监控原理 1. 简介 2. 总结 五、自定义监控指标 1. 简介…...

python23-常用的第三方库01:request模块-爬虫

requests 模块是 Python 中的一个第三方库,用于发送 HTTP 请求。 它提供了一个简单且直观的 API,使得发送网络请求和解析响应变得非常容易。requests 模块支持各种 HTTP 方法,如 GET、POST、PUT、DELETE 等,并且具有处理 cookies…...

【pytorch】现代卷积神经网络

文章目录 1 AlexNet2 VGG3 NiN4 GoogLeNet5 批量规范化batch normalization6 ResNet6.1 残差块6.2 resnet 7 DenseNet7.1 稠密块体7.2 过渡层7.3 DenseNet模型 1 AlexNet AlexNet由八层组成:五个卷积层、两个全连接隐藏层和一个全连接输出层。 AlexNet使用ReLU而不…...

Excel 身份证号计算年龄

1. 设置身份证号列格式 复制身份证列值到记事本或其他地方重新设置身份证号列单元格格式为“文本”将复制出去的身份证号重新复制粘贴回来 2. 年龄列单元格中添加公式 DATEDIF(DATE(LEFT(MID(A2, 7, 8), 4), MID(MID(A2, 7, 8), 5, 2), RIGHT(MID(A2, 7, 8), 2)), TODAY(), …...

【ArcGIS Pro】完整的nc文件整理表格模型构建流程及工具练习数据分享

学术科研啥的要用到很多数据,nc文件融合了时间空间数据是科研重要文件。之前分享过怎样将nc文件处理成栅格后整理成表格。小编的读者还是有跑不通整个流程的,再来做一篇总结篇,也分享下练习数据跟工具,如果还是弄不了的&#xff0…...

WebRTC的线程模型

WebRTC中的线程类: Thread类: (1)Thread类中的数据: class Thread {// 消息队列:MessageList messages_; // 消息队列,所有需要线程处理的消息,都要先入队PriorityQueue delayed_m…...

活动预告 | Microsoft Power Platform 在线技术公开课:实现业务流程自动化

课程介绍 参加“Microsoft Power Platform 在线技术公开课:实现业务流程自动化”活动,了解如何更高效地开展业务。参加我们举办的本次免费培训活动,了解如何借助 Microsoft AI Builder 和 Power Automate 优化工作流。结合使用这些工具可以帮…...

Docker安装(Docker Engine安装)

一、Docker Engine和Desktop区别 Docker Engine 核心组件:Docker Engine是Docker的核心运行时引擎,负责构建、运行和管理容器。它包括守护进程(dockerd)、API和命令行工具客户端(docker)。适用环境&#…...

Spring自动化创建脚本-解放繁琐的初始化配置!!!(自动化SSM整合)

一、实现功能(原创,转载请告知) 1.自动配置pom配置文件 2.自动识别数据库及数据表,创建Entity、Dao、Service、Controller等 3.自动创建database.properties、mybatis-config.xml等数据库文件 4.自动创建spring-dao.xml spring-mvc.xml …...

Llama系列关键知识总结

系列文章目录 第一章:LoRA微调系列笔记 第二章:Llama系列关键知识总结 第三章:LLaVA模型讲解与总结 文章目录 系列文章目录Llama: Open and Efficient Foundation Language Models关键要点LLaMa模型架构:Llama2分组查询注意力 (G…...

分布式系统架构6:链路追踪

这是小卷对分布式系统架构学习的第6篇文章,关于链路追踪,之前写过traceId的相关内容:https://juejin.cn/post/7135611432808218661,不过之前写的太浅了,且不成系统,只是简单的理解,今天来捋一下…...

flink cdc使用flink sql方式运行一直报Make sure a planner module is on the classpath

flink cdc使用flink sql方式运行一直报Make sure a planner module is on the classpath 引入jar包信息: flink-connector-oracle-cdc:3.2.1 flink:1.20.0 flink-table-runtime:1.20.0 flink-streaming-java:1.20.0 flink-clients:1.20.0 Exception in thread &q…...

Vue.js组件开发-怎样将style私有化

Vue.js组件开发中&#xff0c;将style私有可以通过使用<style scoped>来实现的。scoped属性会告诉Vue为这个组件的CSS样式添加一个数据属性&#xff0c;从而确保这些样式只应用于该组件的元素&#xff0c;而不会影响到其他组件或全局样式。 示例&#xff1a; 展示如何使…...

第十届“挑战杯”大学生课外学术科技作品竞赛解析及资料

“挑战杯”被誉为大学生科技创新创业的“奥林匹克”盛会&#xff0c;它汇聚了来自各个学科、各个年级的精英人才。在这里&#xff0c;同学们带着对未知的好奇和对知识的渴望&#xff0c;组成一个个团队&#xff0c;向难题发起挑战。现在&#xff0c;第十届“挑战杯”大学生课外…...

从0入门自主空中机器人-2-1【无人机硬件框架】

关于本课程&#xff1a; 本次课程是一套面向对自主空中机器人感兴趣的学生、爱好者、相关从业人员的免费课程&#xff0c;包含了从硬件组装、机载电脑环境设置、代码部署、实机实验等全套详细流程&#xff0c;带你从0开始&#xff0c;组装属于自己的自主无人机&#xff0c;并让…...

跟着逻辑先生学习FPGA-实战篇第一课 6-1 LED灯闪烁实验

硬件平台&#xff1a;征战Pro开发板 软件平台&#xff1a;Vivado2018.3 仿真软件&#xff1a;Modelsim10.6d 文本编译器&#xff1a;Notepad 征战Pro开发板资料 链接:https://pan.baidu.com/s/1AIcnaGBpNLgFT8GG1yC-cA?pwdx3u8 提取码:x3u8 1 知识背景 LED&#xff0c;又名…...

【文献精读笔记】Explainability for Large Language Models: A Survey (大语言模型的可解释性综述)(四)

****非斜体正文为原文献内容&#xff08;也包含笔者的补充&#xff09;&#xff0c;灰色块中是对文章细节的进一步详细解释&#xff01; 四、提示范式&#xff08;Explanation for Prompting Paradigm&#xff09; 随着语言模型规模的扩大&#xff0c;基于提示&#xff08;prom…...

分布式算法(五):初识ZAB协议

文章目录 一、什么是Zookeeper二、ZAB与Zookeeper的关系为什么Zookeeper不直接使用Paxos 三、ZAB简介1.名词解释提案&#xff08;Proposal&#xff09;事务&#xff08;Transaction&#xff09;原子广播&#xff08;Atomic Broadcast&#xff09; 2.集群角色领导者&#xff08;…...

用Python操作字节流中的Excel工作簿

Python能够轻松地从字节流中加载文件&#xff0c;在不依赖于外部存储的情况下直接对其进行读取、修改等复杂操作&#xff0c;并最终将更改后的文档保存回字节串中。这种能力不仅极大地提高了数据处理的灵活性&#xff0c;还确保了数据的安全性和完整性&#xff0c;尤其是在网络…...

PHP-Casbin v4.0.0 发布,支持 ACL、RBAC、ABAC 等模型的访问控制框架

PHP-Casbin 是一个用 PHP 语言打造的轻量级开源访问控制框架&#xff0c;支持 ACL、RBAC、ABAC 多种模型。它采用了元模型的设计思想&#xff0c;支持多种经典的访问控制方案&#xff0c;如基于角色的访问控制 RBAC、基于属性的访问控制 ABAC 等。 更新内容&#xff1a; http…...

MIT S081 Lab 2 System Calls

Lab链接 一 实现trace功能 1 题目要求 In this assignment you will add a system call tracing feature that may help you when debugging later labs. You’ll create a new trace system call that will control tracing. It should take one argument, an integer “ma…...

Oracle Dataguard(主库为 Oracle 11g 单节点)配置详解(2):配置主数据库

Oracle Dataguard&#xff08;主库为 Oracle 11g 单节点&#xff09;配置详解&#xff08;2&#xff09;&#xff1a;配置主数据库 目录 Oracle Dataguard&#xff08;主库为 Oracle 11g 单节点&#xff09;配置详解&#xff08;2&#xff09;&#xff1a;配置主数据库一、配置…...

(leetcode算法题)10. 正则表达式匹配

10. 正则表达式匹配 - 力扣&#xff08;LeetCode&#xff09; 此题的要求一个字符串 s 和一个字符规律 p之间支持 . 和 * 的正则表达式匹配 . 匹配任意单个字符 * 匹配零个或多个前面的那一个元素 所谓匹配&#xff0c;是要涵盖 整个 字符串 s 的&#xff0c;而不是部分字符串…...

Hive性能调优考量

Hive作为大数据领域常见的数据仓库组件&#xff0c;在设计和开发阶段需要注意效率。影响Hive效率的不仅仅是数据量过大&#xff0c;数据倾斜、job&#xff08;小文件过多&#xff09;或者磁盘I/O过多、MapReduce分配不合理等因素都会对Hive的效率有影响。对Hive的调优可以从架构…...

2024-12-29-sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现 今夜偏知春气暖,虫声新透绿窗纱。

文章目录 sklearn学习(26) 模型选择与评估-交叉验证&#xff1a;评估估算器的表现26.1 计算交叉验证的指标26.1.1 cross_validate 函数和多度量评估26.1.2 通过交叉验证获取预测 26.2 交叉验证迭代器26.2.1 交叉验证迭代器–循环遍历数据26.2.1.1 K 折26.2.1.2 重复 K-折交叉验…...

Spring Boot + MinIO 实现分段、断点续传,让文件传输更高效

一、引言 在当今的互联网应用中&#xff0c;文件上传是一个常见的功能需求。然而&#xff0c;传统的文件上传方式在面对大文件或不稳定的网络环境时&#xff0c;可能会出现性能瓶颈和上传失败的问题。 传统文件上传&#xff0c;就像是用一辆小推车搬运大型家具&#xff0c;一…...

获取用户详细信息-ThreadLocal优化

Thread全局接口可用&#xff0c;不用再重复编写。所以为了代码的复用&#xff0c;使用Thread。把之前的内容&#xff08;函数的参数和map与username&#xff09;注释掉&#xff0c;换为Thread传过来的内容&#xff08;map与username&#xff09;。 因为Thread需要在拦截器里面…...

R语言6种将字符转成数字的方法,写在新年来临之际

咱们临床研究中&#xff0c;拿到数据后首先要对数据进行清洗&#xff0c;把数据变成咱们想要的格式&#xff0c;才能进行下一步分析&#xff0c;其中数据中的字符转成数字是个重要的内容&#xff0c;因为字符中常含有特殊符号&#xff0c;不利于分析&#xff0c;转成数字后才能…...

Go语言方法和接收器类型详解

Go语言方法和接收器类型详解 1. 方法接收器类型 1.1 值接收器 值接收器方法不会改变接收器的状态&#xff0c;因为Go语言会在调用时复制接收器的值。因此&#xff0c;任何对接收器成员变量的修改都只会影响副本&#xff0c;而不会影响原始结构体实例。 type Person struct …...

Linux常用命令总结

目录 查询java服务的pid查询pid上的进程占用的端口方法 1&#xff1a;使用 lsof 查询端口方法 2&#xff1a;使用 netstat 查询端口方法 3&#xff1a;使用 ss 命令查询端口 system相关命令 查询java服务的pid JPS查询pid上的进程占用的端口 要根据进程 ID&#xff08;PID&am…...

Linux总结之CentOS Stream 9安装mysql8.0实操安装成功记录

Linux总结之CentOS Stream 9安装mysql8.0实操安装成功记录 由于网上很多的mysql8.0安装教程都是老版本或者安装过程记录有问题&#xff0c;导致经常安装到一半需要删除重新安装。所以将成功的实操安装过程记录一下&#xff0c;方面后面查阅&#xff0c;大家还有问题的可以在此讨…...

ROS2软件架构全面解析-学习如何设计通信中间件框架

前言 ROS&#xff08;Robot Operating System&#xff09; 2 是一个用于开发机器人应用的软件平台&#xff0c;也称为机器人软件开发工具包 (SDK)。 ROS2是ROS1的迭代升级版本 &#xff0c;最主要的升级点是引入DDS&#xff08;Data Distribution Service&#xff09;为基础的…...

基于微信小程序的校园自助打印系统

博主介绍&#xff1a;java高级开发&#xff0c;从事互联网行业六年&#xff0c;熟悉各种主流语言&#xff0c;精通java、python、php、爬虫、web开发&#xff0c;已经做了多年的设计程序开发&#xff0c;开发过上千套设计程序&#xff0c;没有什么华丽的语言&#xff0c;只有实…...

Linux命令——3.网络与用户

文章目录 一、网络1.网络测试与诊断2.网络接口配置3.无线网络配置4.防火墙与网络管理6.防火墙管理1&#xff09;firewalld命令2&#xff09;iptables命令 二、用户和群组1.管理员模式2.用户账户管理1&#xff09;useradd创建2&#xff09;usermod修改3&#xff09;userdel 删除…...

2、redis的持久化

redis的持久化 在redist当中&#xff0c;高可用的技术包括持久化&#xff0c;主从复制&#xff0c;哨兵模式&#xff0c;集群。 持久化是最简单的高可用的方法&#xff0c;作用就是备份数据。即将数据保存到硬盘&#xff0c;防止进程退出导致数据丢失。 redis持久化方式&…...

建造者模式 Builder Pattern

在创建一个对象的时候&#xff0c;构造器参数有点多&#xff0c;而且有些参数还是可选的&#xff0c;再者还有不少同类型的&#xff0c;那就更应该使用 builder 模式了。 使用 Builder 模式的初衷是 把易变性&#xff08;mutability&#xff09;移动到Builder类&#xff0c;而…...

制作一个类似ChatGPT的AI对话网站,模型能力使用ChatGPT

要快速搭建一个类似ChatGPT的AI对话网站&#xff0c;并且使用类似ChatGPT的模型能力&#xff0c;可以考虑以下技术和工具&#xff1a; ### 1. **使用现有的AI模型平台** - **OpenAI API**: 如果你希望使用类似于ChatGPT的能力&#xff0c;OpenAI提供了强大的API服务&#xff08…...

LinuxC高级day2

1.在家目录下创建目录文件&#xff0c;dir a.dir下创建dir1和dir2 b.把当前目录下的所有文件拷贝到dir1中&#xff0c; c.把当前目录下的所有脚本文件拷贝到dir2中 d.把dir2打包并压缩为dir2.tar.xz e.再把dir2.tar.xz移动到dir1中 f.解压dir1中的压缩包 g.使用tree工具&#x…...