小米 MiMo 开源:7B 参数凭什么 “叫板” AI行业巨头?
目录
一、技术革命的起点:小米AI战略的“破局者”
1.1 战略背景:从硬件厂商到AI基础设施提供商
1.2 团队揭秘:“天才少女”罗福莉与小米AI梦之队
二、技术架构解析:7B参数如何实现“推理跃迁”
2.1 核心技术原理
2.2 技术指标与基准测试
三、对比优势:重新定义“推理大模型”标准
3.1 与闭源模型的对比
3.2 与开源模型的对比
3.3 技术路径的颠覆性
四、开源生态与应用场景
4.1 开源策略与技术普惠
4.2 核心应用场景
五、未来展望:从推理到多模态的AI跃迁
5.1 技术演进路线
5.2 行业影响与挑战
六、结语:小米的“AI宣言”与行业启示
一、技术革命的起点:小米AI战略的“破局者”
2025年4月30日,小米集团正式开源其首个专注于推理能力的大语言模型**Xiaomi MiMo**,这一动作不仅标志着小米在AI领域的战略升级,更在全球范围内引发了关于“小参数模型能否挑战行业巨头”的激烈讨论。作为小米大模型Core团队的首个公开成果,MiMo以7B参数规模在数学推理(AIME 24-25)和代码生成(LiveCodeBench v5)等核心任务中超越OpenAI的o1-mini和阿里QwQ-32B等闭源/开源模型,其技术路径被业界评价为“开启了大模型轻量化发展的新纪元”。
1.1 战略背景:从硬件厂商到AI基础设施提供商
小米的AI布局可追溯至2016年成立的AI实验室,经过7年发展,团队规模已达3000余人,覆盖视觉、语音、NLP等多个领域。2023年ChatGPT的爆发式增长加速了小米的战略转型,雷军亲自推动成立大模型Core团队,并提出“软件×硬件×AI”的战略公式。
- 技术积累:小米在端侧AI领域的长期投入为MiMo奠定了基础。例如,小爱同学的语音交互技术、小米汽车的智能座舱系统,均依赖于高效的推理能力。
- 行业挑战:面对OpenAI、Meta等巨头的参数军备竞赛,小米选择差异化路径——聚焦推理能力优化,而非盲目追求模型规模。
1.2 团队揭秘:“天才少女”罗福莉与小米AI梦之队
小米大模型Core团队的核心成员包括DeepSeek-V2的关键开发者罗福莉,以及来自清华、北大等顶尖高校的算法专家。团队采用“预训练-后训练”协同优化架构,在数据工程、算法创新和基础设施上实现了三大突破:
二、技术架构解析:7B参数如何实现“推理跃迁”
2.1 核心技术原理
MiMo的技术突破源于三大核心模块的协同作用:
(1)多阶段训练框架
- 预训练阶段:采用三阶段数据混合策略,逐步将数学和代码数据占比提升至70%,并引入合成推理数据(如数学证明、算法竞赛题解),使模型接触到更多推理模式。
- 后训练阶段:
- 强化学习(RL):通过TDDR机制,将测试用例按难度分级(简单/中等/困难),动态分配奖励权重(如困难题9分,简单题1分),激励模型攻克高价值问题。
- 数据重采样:针对易错题进行动态筛选和重采样,稳定训练过程,减少策略更新的跳跃性。
(2)模型架构创新
- 多Token预测(MTP):在预训练阶段引入MTP模块,允许模型同时预测多个未来token,推理速度提升40%(接受率超75%)。例如,在数学证明中,MTP可并行生成多个中间步骤,显著提高长链条推理效率。
- 高效注意力机制:结合分组查询注意力(GQA)和旋转位置编码(RoPE),降低显存占用,适配端侧设备。例如,在手机端运行时,MiMo-7B的内存消耗比同规模模型减少30%。
(3)基础设施优化
- Seamless Rollout引擎:通过异步生成与验证,将GPU空闲时间压缩至最低,训练效率提升2.29倍,验证速度加快1.96倍。该引擎已集成至小米自研的AI训练平台,支持万卡级集群扩展。
2.2 技术指标与基准测试
MiMo在多个权威评测中展现出“以小博大”的实力:
(数据来源:小米技术报告)
三、对比优势:重新定义“推理大模型”标准
3.1 与闭源模型的对比
- OpenAI o1-mini:作为OpenAI的推理专用模型,o1-mini在数学任务中表现优异,但参数规模达175B,且需付费使用。MiMo-7B在AIME 25中以55.4分超越o1-mini的52.1分,同时成本降低90%。
- Google Gemini Pro:Gemini Pro在多模态任务中领先,但推理能力依赖千亿参数。MiMo-7B的代码生成准确率(82.1%)已接近Gemini Pro的85%,而参数仅为其1/150。
3.2 与开源模型的对比
- 阿里QwQ-32B-Preview:作为阿里的32B参数推理模型,QwQ在数学任务中得分50.3,显著低于MiMo-7B的55.4分。小米通过合成数据和TDDR机制,实现了“参数减半,性能翻倍”。
- DeepSeek-R1-Distill-7B:DeepSeek的7B蒸馏模型在强化学习潜力评估中表现优异,但MiMo-7B在相同RL数据条件下,数学与代码领域的潜力值提升15%。
3.3 技术路径的颠覆性
- 参数效率革命:MiMo证明算法优化(如MTP、TDDR)可替代算力堆砌。例如,其7B模型在代码生成任务中的效率是传统模型的2.3倍。
- 端侧部署优势:MiMo-7B在消费级GPU(如RTX 4090)上推理速度达25 tokens/s,支持手机、车机等端侧设备实时交互,而同等性能的闭源模型需依赖云端算力。
四、开源生态与应用场景
4.1 开源策略与技术普惠
小米将MiMo-7B的四个变体模型(Base、SFT、RL、RL-Zero)全部开源,托管于Hugging Face平台([https://huggingface.co/XiaomiMiMo](https://huggingface.co/XiaomiMiMo)),并提供完整的训练代码和工具链。github仓库:https://github.com/XiaomiMiMo 。这一举措的意义在于:
(1)降低技术门槛:中小企业和开发者可免费使用MiMo,例如教育机构可基于MiMo构建数学解题助手,成本仅为闭源模型的1/3。
(2)推动行业协作:开源社区可贡献优化方案,例如GitHub上已有开发者基于MiMo-7B-RL构建了代码自动调试插件。
4.2 核心应用场景
(1)教育领域
- 数学解题辅助:MiMo可提供详细的解题步骤,支持AIME、IMO等竞赛级题目。例如,学生输入题目后,模型会生成逐步推导过程,并标注关键逻辑节点。
- 编程教学:通过代码生成和调试功能,帮助学生理解算法逻辑。例如,在Python教学中,MiMo可自动补全代码框架,并解释每一步的作用。
(2)科研与学术
- 论文写作:辅助生成实验设计、数据分析部分,例如根据研究主题自动生成文献综述的结构框架。
- 算法开发:在机器学习模型调优中,MiMo可提出参数优化建议,缩短实验周期。
(3)软件开发
- 代码生成与优化:支持多语言代码生成(如Java、C++),并自动修复逻辑错误。例如,输入需求描述后,模型可输出完整的函数代码,并添加注释。
- 低代码开发:通过自然语言交互,快速搭建应用原型。例如,非技术人员可通过对话生成数据库表结构和API接口。
(4)智能客服与金融
- 复杂问题解答:在智能客服场景中,MiMo可处理多层级逻辑问题,例如金融产品的风险评估、保险条款的解读。
- 数据分析:自动生成报表解读和趋势预测,例如根据股市数据生成投资建议。
(5)小米生态深度整合
- 手机与IoT:集成至澎湃OS,实现本地化代码生成(如WPS自动注释)、数学解题(作业帮题库解析),提升用户体验。
- 汽车智能座舱:优化语音交互逻辑,例如理解“打开空调并导航到最近的充电站”等多模态指令。
五、未来展望:从推理到多模态的AI跃迁
5.1 技术演进路线
小米已启动MiMo-2的研发,目标包括:
(1)多模态能力扩展:整合视觉、语音等模态,支持图文混合输入输出,例如根据数学公式图像生成LaTeX代码。
(2)长上下文支持:将上下文窗口扩展至128K tokens,支持复杂文档(如法律合同、学术论文)的深度分析。
(3)端云协同架构:结合小米自研的端侧模型MiLM2,形成“云处理复杂任务+端侧实时响应”的混合架构,适配智能家居、工业质检等场景。
5.2 行业影响与挑战
- 对开源社区的贡献:MiMo的开源推动了推理模型的标准化,例如Hugging Face已将其纳入“推荐模型库”,并提供官方支持。
- 安全与伦理考量:需加强对齐策略,防止幻觉错误,尤其在教育、医疗等敏感场景。小米已成立AI伦理委员会,制定数据隐私保护规范。
- 生态协同创新:通过“MiMo开发者计划”与金山办公、作业帮等合作,探索教育、办公领域的B端付费模式。
六、结语:小米的“AI宣言”与行业启示
Xiaomi MiMo的开源不仅是技术突破,更是小米向全球AI竞赛提交的“效率优先”答卷。通过“小参数+算法优化”路径,小米证明了推理能力的提升不依赖算力堆砌,而是数据质量、模型架构与工程效率的综合结果。对于行业而言,MiMo揭示了大模型发展的新范式:从“通用型”转向“垂直型”,从“参数军备竞赛”转向“端侧智能化”。未来,随着小米万卡GPU集群的建成和多模态技术的突破,MiMo或将成为推动AI普惠的核心引擎,为全球开发者和企业提供一条“低成本、高效能”的AI落地路径。
相关文章:
小米 MiMo 开源:7B 参数凭什么 “叫板” AI行业巨头?
目录 一、技术革命的起点:小米AI战略的“破局者” 1.1 战略背景:从硬件厂商到AI基础设施提供商 1.2 团队揭秘:“天才少女”罗福莉与小米AI梦之队 二、技术架构解析:7B参数如何实现“推理跃迁” 2.1 核心技术原理 2.2 技术指…...
构建高可用性的LVS-DR群集:实现无缝的负载均衡与故障转移
目录 一、LVS-DR集群 1.LVS-DR工作原理 2.数据包流向分析 3.LVS-DR模式特点 二、直接路由模式(LVS-DR) 1.资源清单 2.配置负载调度器(lvs) 3.配置节点服务器(web1、web2) 4.测试LVS群集 5.使用NFS发布共享资源(nfs上) …...
低光图像增强新色彩空间HVI:技术突破与创新解析(HVI: ANewColor Space for Low-light Image Enhancement)
摘要 低光图像增强(LLIE)是计算机视觉领域的关键任务,旨在从受损的低光图像中恢复细节信息。针对现有方法在标准RGB(sRGB)空间易产生色偏与亮度伪影的问题,以及HSV色彩空间转换引发的红/黑噪声问题…...
Abaqus学习笔记
目录 Abaqus介绍 学习资源 编辑Abaqus/CAE abaqus下载安装 abaqus基本操作 Abaqus启动 新建模型 编辑 编辑修改界面背景 编辑编辑结果信息的显示与否 编辑计算结果信息字体设置 编辑允许多绘图状态 单位量纲 视图操作 事前说明 ODB文件 本构关系…...
AquaCrop 模型新视角:多技术助力农业精准水管理
技术点目录 模型原理介绍与数据要求及模型分析数据制备、模型运行与案例实践(界面GUI版本)模型优化与敏感性分析(基于R语言实践)源代码分析(基于FORTRAN)未来气候变化影响分析与案例实践(基于Py…...
从知识图谱到精准决策:基于MCP的招投标货物比对溯源系统实践
前言 从最初对人工智能的懵懂认知,到逐渐踏入Prompt工程的世界,我们一路探索,从私有化部署的实际场景,到对DeepSeek技术的全面解读,再逐步深入到NL2SQL、知识图谱构建、RAG知识库设计,以及ChatBI这些高阶应用。一路走来,我们在AI的领域里一步一个脚印,不断拓展视野和能…...
【平面波导外腔激光器专题系列】1064nm单纵模平面波导外腔激光器
摘要:我们介绍了平面波导外腔二极管激光器 (PW-ECL) 的特性。据我们所知,这是第一款蝶形封装的 1064nm半导体激光器,其可以稳定锁定到外部参考频率。我们从精密实验的角度评估了它的性能,特别是使用碘的超精细吸收线,在…...
C++ 算法学习之旅:从入门到精通的秘籍
在编程的浩瀚宇宙中,C 算法宛如璀璨的星辰,照亮我们前行的道路。作为一名 C 算法小白,或许你和我一样,怀揣着对算法的好奇与憧憬,却又在学习的道路上感到迷茫。别担心,今天我就和大家分享一下如何学习各种基…...
按摩椅上的气囊系统 是现代按摩椅中非常关键的组成部分,它与机芯系统相辅相成,为用户提供全方位、更接近真人按摩的体验
按摩椅上的气囊系统是现代按摩椅中非常关键的组成部分,它与机芯系统相辅相成,为用户提供全方位、更接近真人按摩的体验。 一、按摩椅气囊的产生背景 1. 传统按摩方式的局限 早期的按摩椅主要依赖机械式的“凸轮电机”或简单的机芯滚轮结构,…...
配置Hadoop集群环境-使用脚本命令实现集群文件同步
(一)Hadoop的运行模式 hadoop一共有如下三种运行方式: 1. 本地运行。数据存储在linux本地,测试偶尔用一下。我们上一节课使用的就是本地运行模式hadoop100。 2. 伪分布式。在一台机器上模拟出 Hadoop 分布式系统的各个组件&…...
Linux系统(OpenEuler22.03-LTS)部署FastGPT
在 openEuler 22.03 LTS 系统上通过 Docker Compose 安装 FastGPT 的步骤如下: 官方参考文档:https://doc.fastgpt.cn/docs/development/docker/ 1. 安装 Docker 和 Docker Compose 可以参考我之前离线安装Docker的文章:openEuler 22.03 LT…...
FastExcel 本地开发和Linux上上传Resource文件的差异性
不能直接通过路径来获取 这个是一个下载导出文件的操作 GetMapping(value "/export/all") public void exportAll(HttpServletResponse response, LaylineListReq req) throws IOException {// 从类路径下获取 Excel 文件资源ClassPathResource classPathResource…...
Excel学习笔记
在excel表格中,某列的数据最大,则整行都红色底色标出,怎么实现? 更改x值,excel图表上动态显示 该值的Y值且动态显示十字交叉线 为了实现如下图所示的效果,需要做出几个辅助列就行。 step1:先写…...
数据中台-数仓分层结构【Doris】
数据仓库采用Doris进行搭建,并分为ODS/DWD/DWM/DWS/ADS等层级结构进行分层数据存储。Doris是百度开源的MPP数据库,可有效支撑大数据量的数据计算和分布式扩展存储。 数据仓库分层架构设计目标 解耦与复用性:通过分层隔离原始数据与业务逻辑&a…...
使用Jmeter对AI模型服务进行压力测试
一、JMeter介绍 Apache JMeter 是一款开源的性能测试工具,主要用于评估Web应用程序的负载和性能。它支持多种类型的测试,包括但不限于: 负载测试:模拟大量用户访问系统以检测其在高负载下的表现。性能测试:评估系统在…...
测试用例管理平台哪些好用?9款主流测试平台对比
在当今软件开发领域,测试用例管理平台已成为提升产品质量和团队协同效率的关键工具。本文将围绕“测试用例管理平台”这一核心关键词,全面解析市面上9款主流产品,帮助企业管理者和测试团队快速了解各平台的核心优势和适用场景,从而…...
C++函数传值与传引用对比分析
在C编程中,函数参数传递的方式直接影响程序的性能、内存管理以及代码逻辑的正确性。传值(Pass by Value)和传引用(Pass by Reference)是两种最常用的参数传递方式,它们各有优缺点,适用于不同的场…...
【se-res模块学习】结合CIFAR-10分类任务学习
继CIFAR-10图像分类:【Res残差连接学习】结合CIFAR-10任务学习-CSDN博客 再优化 本次训练结果在测试集上的准确率表现可达到90%以上 1.训练模型(MyModel.py) import torch import torch.nn as nnclass SENet(nn.Module): # SE-Net模块def…...
二元随机响应(Binary Randomized Response, RR)的翻转概率
随机响应(Randomized Response)机制 ✅ 回答核心: p 1 1 e ε 才是「翻转概率」 \boxed{p \frac{1}{1 e^{\varepsilon}}} \quad \text{才是「翻转概率」} p1eε1才是「翻转概率」 而: q e ε 1 e ε 是「保留真实值」…...
湖北理元理律师事务所:债务优化中的“生活保障”方法论
债务危机往往伴随生活质量骤降,如何在还款与生存间找到平衡点,成为债务优化的核心挑战。湖北理元理律师事务所基于多年实务经验,提出“双轨并行”策略:法律减负与生活保障同步推进。 债务优化的“温度法则” 1.生存资金预留机制…...
RFID智能书柜:精准定位,找书告别 “大海捞针”
在传统图书馆的浩瀚书海,找书无异于在错综复杂的迷宫里徘徊。读者在书架间来回奔波,耗费大量时间精力,还常一无所获。RFID智能书柜的出现,彻底改写了这一局面。它搭载的RFID读写器与天线协同工作,能实时精准定位贴有RF…...
视觉图像处理及多模态融合初探
(一)指标汇总 1. 图像采集与质量提升 指标描述可能的量化值图像清晰度反映图像中物体的边缘和细节的清晰程度例如:1-10 分(1 为极不清晰,10 为非常清晰)噪声水平表示图像中随机噪声的多少例如:噪声强度百分比(0%-100%)畸变程度描述图像中物体形状的变形程度例如:畸变…...
射频前端模组芯片(PA)三伍微电子GSR2337 兼容替代SKY85337, RTC7646, KCT8247HE
射频前端模组芯片(PA)三伍微电子GSR2337 兼容替代SKY85337, RTC7646, KCT8247HE 型号GSR2337 频率: 2.4 GHz 类型: FEM (PALNASW) WIFI: 11n/ac/ax 功率: 21dBmEVM-43dB5V 封装: 3*3 mm 电压: 3.3V & 5V P2P: SKY85…...
python 接收c++的.so传的jsoncpp字符串
叮!快来看看我和文心一言的奇妙对话~点击链接 https://yiyan.baidu.com/share/57o6vGa3GY -- 文心一言,既能写文案、读文档,又能绘画聊天、写诗做表,你的全能伙伴! 要从 C 动态链接库 (.so 文件) 中接收 JS…...
EasyRTC嵌入式音视频通话SDK驱动智能硬件音视频应用新发展
一、引言 在数字化浪潮下,智能硬件蓬勃发展,从智能家居到工业物联网,深刻改变人们的生活与工作。音视频通讯作为智能硬件交互与协同的核心,重要性不言而喻。但嵌入式设备硬件资源受限,传统音视频方案集成困难。EasyRT…...
Day19 常见的特征筛选算法
常见的特征筛选算法 1. 方差筛选 原理 :方差衡量的是数据的离散程度。在特征筛选中,如果某个特征的方差很小,说明该特征在不同样本上的值差异不大,那么它对模型的区分能力可能很弱。方差筛选就是通过设定一个方差阈值࿰…...
如何使用极狐GitLab 软件包仓库功能托管 terraform?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 Terraform 模块库 (BASIC ALL) 基础设施仓库和 Terraform 模块仓库合并到单个 Terraform 模块仓库功能引入于极狐GitLab 15.1…...
15前端项目----用户信息/导航守卫
登录/注册 持久存储用户信息问题 退出登录导航守卫解决问题 持久存储用户信息 本地存储:(在actions中请求成功时) 添加localStorage.setItem(token,result.data.token);获取存储:(在user仓库中,state中tok…...
重定向及基础实验
1.if指令 if (判断条件){ 执行语句; } if的正则表达式 #比较变量和字符串是否相等,相等时if指令认为该条件为true,反之为false ! #比较变量和字符串是否不相等,不相等时if指令认为条件为true,反之为false ~ #区分大小写字符&…...
CBO和HBO区别及介绍
CBO(Cost-Based Optimizer)和 HBO(Heuristic-Based Optimizer)是两种数据库查询优化器的类型,它们在优化策略和实现方式上有显著的区别。以下是详细的解释和对比: 1. CBO(Cost-Based Optimizer…...
华为HCIP-AI认证考试版本更新通知
华为HCIP-AI认证考试版本更新通知 HCIP-AI-EI Developer V2.5认证发布 华为官方宣布,HCIP-AI-EI Developer V2.5认证考试将于2025年3月31日正式上线。新版认证聚焦AI工程化开发与行业实践,新增大模型部署优化、AI边缘计算等前沿技术内容&…...
【算法-链表】链表操作技巧:常见算法
算法相关知识点可以通过点击以下链接进行学习一起加油!双指针滑动窗口二分查找前缀和位运算模拟 链表是一种灵活的数据结构,广泛用于需要频繁插入和删除的场景。掌握链表的常见操作技巧,如插入、删除、翻转和合并等,能帮助开发者更…...
【探寻C++之旅】第十三章:红黑树
请君浏览 前言1. 红黑树的概念1.2 红黑树的规则1.3 红黑树如何确保最长路径不超过最短路径的两倍?1.4 红黑树的效率 2. 红黑树的实现2.1 红黑树的结构2.2 红黑树的插入情况1:变色情况2:单旋变色情况2:双旋变色代码演示 2.3 红黑树…...
JavaScript 性能优化全攻略:从基础到实战
引言 在现代 Web 开发中,JavaScript 作为核心语言,其性能直接影响用户体验。无论是单页应用(SPA)还是复杂交互页面,性能优化始终是开发者关注的核心。 本文将从基础策略、最新技巧、常见误区和实战案例四个维度,系统性地解析 JavaScript 性能优化的关键方法,并提供可复…...
Kafka消息队列之 【消费者分组】 详解
消费者分组(Consumer Group)是 Kafka 提供的一种强大的消息消费机制,它允许多个消费者协同工作,共同消费一个或多个主题的消息,从而实现高吞吐量、可扩展性和容错性。 基本概念 消费者分组:一组消费者实例的集合,这些消费者实例共同订阅一个或多个主题,并通过分组来协调…...
HuggingFace与自然语言处理(从框架学习到经典项目实践)[ 01 API操作 ]
本教程适用与第一次接触huggingface与相应框架和对nlp任务感兴趣的朋友,该栏目目前更新总结如下: Tokenizer: 支持单句/双句编码,自动处理特殊符号和填充。 批量编码提升效率,适合训练数据预处理。Datasets…...
uniapp-文件查找失败:‘@dcloudio/uni-ui/lib/uni-icons/uni-icons.vue‘
uniapp-文件查找失败:‘dcloudio/uni-ui/lib/uni-icons/uni-icons.vue’ 今天在HBuilderX中使用uniapp开发微信小程序时遇到了这个问题,就是找不到uni-ui组件 当时创建项目,选择了一个中间带的底部带选项卡模板,并没有选择内置u…...
springboot+vue实现在线网盘(云盘)系统
今天教大家如何设计一个网盘(云盘)系统系统 , 基于目前主流的技术:前端vue,后端springboot。 同时还带来的项目的部署教程。 视频演示 springbootvue实现在线网盘(云盘)系统 图片演示 一. 系统概述 用过百…...
启智平台调试 qwen3 4b ms-swift
以上设置完成后,我们点击新建任务。等待服务器创建和分配资源。 资源分配完成后我们看到如下列表,看到资源running状态,后面有一个调试按钮,后面就可以进入代码调试窗体界面了。 点击任务名称 跳转 访问github失败 加速器开启…...
KAXA凯莎科技AGV通信方案如何赋能智能仓储高效运作?
AGV智慧物流系统融合了先进的自动导航技术和智能控制算法,通过激光雷达、摄像头、激光传感器等多种感知设备,实现仓库内的精准定位与自主导航。系统具备环境实时感知能力,能够动态避障,并基于任务调度智能规划最优路径,…...
【AI提示词】费曼学习法导师
提示说明 精通费曼学习法的教育专家,擅长通过知识解构与重构提升学习效能。 提示词 Role: 费曼学习法导师 Profile language: 中文description: 精通费曼学习法的教育专家,擅长通过知识解构与重构提升学习效能background: 认知科学硕士背景࿰…...
体绘制中的传输函数(transfer func)介绍
文章目录 VTK volume不透明度传输函数梯度不透明度传输函数颜色传输函数VTK volume VTK (Visualization Toolkit) 中的 Volume(体积)是一个重要的概念,特别是在处理和可视化三维数据时。以下是 VTK Volume 的一些关键概念: 定义: Volume 在 VTK 中代表一个三维数据集,通…...
Algolia - Docsearch的申请配置安装【以踩坑解决版】
👨🎓博主简介 🏅CSDN博客专家 🏅云计算领域优质创作者 🏅华为云开发者社区专家博主 🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入!…...
【文档智能】开源的阅读顺序(Layoutreader)模型使用指南
一年前,笔者基于开源了一个阅读顺序模型(《【文档智能】符合人类阅读顺序的文档模型-LayoutReader及非官方权重开源》), PDF解析并结构化技术路线方案及思路,文档智能专栏 阅读顺序检测旨在捕获人类读者能够自然理解的…...
现在的AI应用距离通用agent差的那点儿意思
现在的AI应用距离通用Agent差的那点儿意思 引言:从"生成力"到"行动力" 当前AI应用最显著的进步体现在内容生成能力上——无论是ChatGPT的流畅对话,还是Midjourney的惊艳画作,都展示了强大的生成力。然而,正…...
LeetCode 热题 100 238. 除自身以外数组的乘积
LeetCode 热题 100 | 238. 除自身以外数组的乘积 大家好,今天我们来解决一道经典的算法问题——除自身以外数组的乘积。这道题在 LeetCode 上被标记为中等难度,要求在不使用除法的情况下,计算数组中每个元素的乘积,其中每个元素的…...
分享 2 款基于 .NET 开源的实时应用监控系统
前言 在现代软件开发和运维管理中,实时应用监控系统扮演着至关重要的角色。它们能够帮助开发者和运维人员实时监控应用程序的状态,及时发现并解决问题,从而确保应用的稳定性和可靠性。今天大姚给大家分享 2 款基于.NET 开源的实时应用监控系…...
使用pytorch保存和加载预训练的模型方法
需要使用到的函数 在 PyTorch 中,torch.save() 和 torch.load() 是用于保存和加载模型的核心函数。 torch.save() 函数 主要用途:将模型或模型的状态字典(state_dict)保存到文件中。 语法: torch.save(obj, f, pi…...
Linux/AndroidOS中进程间的通信线程间的同步 - 消息队列
本文介绍消息队列,它允许进程之间以消息的形式交换数据。数据的交换单位是整个消息。 POSIX 消息队列是引用计数的。只有当所有当前使用队列的进程都关闭了队列之后才会对队列进行标记以便删除。POSIX 消息有一个关联的优先级,并且消息之间是严格按照优…...
DNA Launcher:打造个性化安卓桌面,开启全新视觉体验
DNA Launcher是一款专为安卓手机设计的桌面美化软件,旨在为用户提供丰富多样的桌面美化选项和全新的操作逻辑。通过这款软件,用户可以轻松调整桌面布局、更换主题、添加个性化元素,打造出独一无二的手机桌面。它支持多分辨率重新布局…...