Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
在全球 290 位开发者的协作下,Apache Doris 在 2024 年完成了 7000+ 次代码提交,并发布了 22 个版本,实现在实时分析、湖仓一体和半结构化数据分析等核心场景的技术突破及创新。
2025 年,Apache Doris 社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建实时、高效、统一的数据底座。
全部规划可见:Apache Doris Roadmap 2025
Apache Doris 2024 Review
回顾 2024 年,Apache Doris 重点聚焦于全面提升实时分析、湖仓融合分析、日志分析在实际应用场景中的效能,可将核心工作归纳为以下五个方面:
查询优化方面
- 优化器新增了多项优化规则,实现了统计信息的高效自动收集,具备了自适应执行并发度的能力。
- 在物化视图的构建以及透明改写方面,投入大量精力深入优化,极大提升查询效率。
- 对 ARM 架构包含 AWS Graviton 处理器、华为鲲鹏处理器进行深入性能优化。
存储优化方面
- 持续提升导入稳定性,尤其在高并发、小批量以及 Routine Load 的健壮性等方面。
- 探索更为复杂的数据处理场景,如对多语句事务的支持等。
半结构化分析方面
- 提升 VARIANT 数据类型成熟度,成为业界最高效的 JSON 格式数据处理方案。
- 日志存储与分析场景的用户量增长迅猛,有上百家中大型企业用户采用 Doris 替换 Elasticsearch、Clickhouse、Loki 来应对日志场景。
Lakehouse 湖仓分析方面
- 作为 Doris 重点支持的场景之一,2024 年针对 Hive、Iceberg、Hudi、Paimon 进行了大量兼容和深度优化工作,性能和稳定性有明显提升。
- 进一步完善 SQL 方言的兼容支持,以便于用户能够实现平滑迁移,在多个大型用户实际场景中,兼容性高达 99%以上。
云原生存算分离方面
- 在 3.0 版本中,Doris 全面支持了存算分离架构,将云原生理念引入开源社区,进一步增强了无服务化以及按需弹性场景的支持能力 。
2024 年除了新功能的开发和架构性能优化,我们也花费大量时间进行质量保障,包含深入 Reivew 之前的功能设计,以确保稳定性及可扩展性;大量的黑盒、白盒测试;仿生产系统长稳压测;混沌测试等。我们希望在保持 Doris 创新力的同时,依然能够更加聚焦在 Doris 核心功能与稳定性上,确保用户、客户能够获得真正的收益和价值。
Apache Doris 2025 Roadmap
2025 年,社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建更加实时、高效、统一的数据底座,工作重点将围绕以下几个关键方面展开:
- 深耕三大核心场景: 进一步聚焦实时分析、湖仓分析以及半结构化数据分析三大核心分析场景**,**并在这些方向上持续深耕细作,不断提升性能与应用效果,为用户提供更为优质、高效的分析服务。
- 大模型 GenAI 场景融合应用: Doris 社区始终坚持创新、拓展技术边界。2025 年将在与生成式人工智能(GenAI)融合应用上进行重点投入,打造适配 GenAI 时代的数据基础设施。本周我们在 Webinar 直播活动中介绍了多款热门 AI 大模型与 Doris 的融合应用。
- 安全可靠的云原生: 2025 年,云原生方向的工作重点将聚焦于数据安全、ETL 易用性和存算分离关键方面展开。
- 加强数据处理能力: 加强批量数据处理和增量数据处理能力,为数据加工、ETL 等场景提供更高性价比解决方案,满足用户日益增长的复杂数据处理需求。
- 进一步提升稳定性: 从技术优化到流程把控,全方位保障 Doris 在运行过程中的稳定性,降低风险,为用户提供更加可靠的产品与服务。
- 开放的社区生态: 积极开展更多与各方的社区合作,完善社区支持工作,为社区成员提供更加全面的服务,无论是技术支持、经验分享或是资源支持等。
01 深耕三大核心场景
实时分析
实时分析场景是 Doris 的立足之本,致力于打造速度最快且最具成本效益的分析型数据库。2025 年将持续优化 Doris 查询引擎、查询优化器,使其在无论单表查询还是复杂的多表关联查询,均能游刃有余、展现卓越的性能。
在查询引擎方面, 将继续强化 Doris 在自适应能力、通用场景支持以及资源管控等方面的能力。并重点从以下几个方向着手:
- 在 TopN 加速和延迟物化方面,Doris 目前已初步支持这些功能,但应用范围有限。未来将计划全局泛化,使其在复杂的多表关联场景中也能发挥优化作用,从而进一步提升查询性能。同时将引入用户可管理的全局字典能力,帮助用户在维度关联等场景下显著提升性能。
- 对 ARM 架构的深度适配将是今年的重点任务之一。2025 年计划为不同型号的 CPU 定制向量化库,以进一步提升 Doris 在各类 ARM 机型上的运行性能。
- 在资源管理方面, 2025 年将实现管理的统一性和可观测性。目前,Doris 的资源管理主要针对用户请求,如查询和导入。后续计划将把所有内部任务(如 Schema Change、Compaction 和统计信息收集)纳入统一的资源管理框架,并统一管理这些任务在资源受限情况下的行为,包括取消和排队等操作。还将对资源调度机制本身进行优化,包括引入多优先级队列调度等新技术,以提升混合负载场景下各执行任务的可预期性。此外,将增加更丰富的系统表和监控指标,以全面展示 Doris 运行细节,提升 Query Profile 的可视化程度和可理解性。
在查询优化器方面, 查询优化器在数据库技术中占据着重要地位,被誉为数据库领域的“明珠”。2025 年,Doris 的查询优化器将着重于规划性能、质量管理和可观测性这三个关键方面:
-
规划性能: 规划性能的优劣直接影响到集群的吞吐能力、QPS 以及实际使用体验。
- 简单查询场景:对“
SELECT * FROM table WHERE
”这类查询语句,采取特殊优化措施,通过剔除不必要的改写规则、加速分区裁剪等操作,减少查询过程中的迭代次数,以提升系统的响应速度和处理效率。 - 复杂多表关联场景:在涉及十几张表甚至更多表的关联查询场景中,优化查询规划时间,规划时间缩短至秒级以下,提升复杂查询的执行效率。
- 简单查询场景:对“
-
规划质量管理:
- 引入基于历史统计信息的查询规划(HBO)。无论是基于代价的优化器(CBO)还是规则的优化器(RBO),都会遇到信息估算不准确问题。传统的统计信息收集方式虽能解决部分问题,但其收集成本高、覆盖范围和准确性有限。基于历史统计信息的规划方法则具有更强的场景适配性,能根据用户历史查询场景和数据特点准确预测和规划,提升查询规划的质量。
- 建立完善的 Plan 管理机制。在特定业务场景下,用户可以通过注入 Hint 获取最优查询规划并保存自定义的 Plan 规则,当再遇到类似查询需求时,可直接复用。未来将支持对指定 Plan 进行固化,避免系统升级或者数据变更后出现 Plan 漂移,确保查询规划的稳定可靠。
- 探索 Plan 候选集自动优化机制。通过让系统不断学习和分析历史查询数据及执行结果,自动调整优化 Plan 候选集,使系统在面对复杂查询场景时能够更智能地选择最优查询规划,持续提升系统整体性能。
-
规划可观测性:
- 2025 年将提供丰富机制,如查询规划的回放、在线 Tracing 等功能,帮助用户更好地观察和理解查询规划的迭代过程。用户可清晰了解查询优化器各阶段采取的策略及性能表现。这将有利于及时发现和解决查询过程中出现的问题,提升用户对 Doris 的使用体验。
湖仓一体
在 2025 年,社区将重点推进开放湖仓生态的建设,打造统一的分析入口,以高效便捷地实现湖仓数据处理与分析,全面提升用户体验。今年,我们的重点工作将集中在以下几个方向:
- 完善开放湖仓生态: 随着 Iceberg 、Paimon 、Hudi 等生态迅猛发展,Doris 现已对接完善。2025 年除持续优化 DDL(数据定义语言)和 DML(数据操作语言)操作外,将密切关注湖格式的最新发展动态及其他主流开放湖格式,及时跟进包括新的数据类型、数据格式更新,并及时对接兼容,为用户提供更加流畅的数据集成能力。
- 优化物化视图: 物化视图在湖仓融合过程中的重要桥梁,可通过透明改写实现查询加速,也可支持湖上数据加工操作。Doris 现已全面实现对 Hive、Iceberg、Hudi 和 Paimon 的物化视图分区增量更新和改写能力支持。后续将进一步增强物化视图的可操作性,例如实现逻辑视图与物化视图之间的转换及物化视图的智能推荐等。同时,还计划尝试暴露数据血缘相关信息,帮助用户更好地将 Doris 集成到其数据平台中,提升整体的数据处理效率和数据管理水平。
半结构化数据分析
在 2025 年,半结构化数据分析将实现重大突破,从单一日志分析场景全面升级为可观测领域的行业标准。 今年将加大在性能优化、成本控制以及生态建设方面的投入,构建业内领先的可观测性产品基础设施。
- 在全文索引能力方面,2025 年将支持多语言分词器,如支持 IK 和 Unicode ICU 分词器,并提供用户自定义字典功能,增强分词器的灵活性和适配性。同时,计划在存算分离场景实现索引的增量构建,提升数据处理的效率,并在确保索引性能的前提下,降低存储资源的消耗,以更低的成本实现高效数据分析。
- 在系统可观测性层面,重点加强对索引相关信息的展示,包括索引的构建过程、命中率、过滤率等关键信息,以此更清晰地展示索引的运行状态,用户可更有效地管理和优化索引,提升系统的整体性能与稳定性。
- 在 Variant 列类型支持方面,2024 年以来,众多湖格式也开始支持 Variant 列类型,充分证明其在半结构化数据处理中的优势。Doris 作为这一领域的先行者,将进一步拓展 Variant 列类型的能力,例如,支持数万列规模宽表,以应对大规模数据存储和处理;对稀疏列进行优化,提升数据存储和检索的效率;支持更灵活地控制子列的展开范围,能够根据具体需求更精准地操作和管理数据;同时,还将支持对指定子列构建索引,进一步提升数据查询的速度和准确性、降低索引存储的成本。
- 在生态合作方面, 对接更多的日志传输组件,如 iLogtail、Vector 等。并与相关社区积极联动,共同探索和推出可观测性方面的最佳实践。通过不断优化和完善,提升对日志数据的处理能力和效率。
总体而言,我们的愿景是将 Doris 打造成可观测性领域的行业标准,以更低的成本、更卓越的性能,为广大用户提供更优质、高效的半结构化数据的存储与分析服务。
02 GenAI 场景的融合创新
2025年,Apache Doris 将持续增强对 AI 场景的支持能力:
- Apache Doris 2.1 版本基于 Arrow Flight 实现了高速数据传输通道,使数据科学和机器学习的软件可以直接从 Doris 中高速读取数据进行建模分析。
- 在湖仓融合分析场景中,Doris 可以作为 Lakehouse 的计算和查询引擎,利用其高效的性能,加速大规模数据的预处理,并将结果写回 Lakehouse,以支持后续的模型训练等 AI 场景使用。
- Doris 还可以作为特征存储系统,服务于智能推荐、风控系统等场景。
- 在 GenAI 场景中, RAG 是提升准确性和减少幻觉的关键技术,RAG 通过混合检索来提升效率和准确性,常见方式包含向量检索、全文检索、知识图谱检索等,相比于使用多套系统,如果单一系统能够支持多种检索,将大幅提升效率、简化架构并减少数据冗余。Apache Doris 自 2.0 开始支持完善的全文检索能力,目前正重点支持向量索引的能力,预计 2025 年 2 季度在社区发布(部分互联网大厂已在大规模上线验证中)。 届时,Doris 将从高效分析引擎扩展为高效的分析和混合检索引擎,成为智能时代实时、高效、统一的数据底座。
- 2025 年,Apache Doris 也将加强 NL2SQL、Data Agent、MCP 等应用的布局。近期,我们在 Webinar 直播活动中介绍了多款热门 AI 模型与 Doris 的融合应用,包括利用 DataAgent 实现智能数据代理、通过 RAG 增强知识检索以及结合 ChatBI 打造自然语言交互分析,同时介绍了 Doris MCP Server 的构建及实现。点击查看直播回放及资料
03 安全可靠的云原生
2025 年,云原生方向的工作重点将聚焦于数据安全、ETL 易用性和存算分离等关键方面展开。
- 在数据安全与集群高可用上
- 跨集群复制(CCR)功能:增加主动的主备切换等关键能力。同时,我们正在筹备详细的 CCR 实践教程,帮助用户在实际应用中实现跨地域集群的高可用性,有效应对故障和异常,确保数据安全和业务连续性。
- 数据加密:随着 Doris 在金融、政企等行业的广泛应用,以及海外用户对数据合规性和敏感性要求的提升,透明数据加密(TDE)的需求日益增强,这方面工作很快完成。
- 在 ETL 易用性上
- 临时表功能:由腾讯公司贡献的临时表功能,此前已在 GP 数据库中广泛应用。借助临时表,用户可以更便捷地对数据进行临时加工和验证,同时无需担心数据清理等繁琐操作,显著提升数据处理的效率和灵活性。
- 多语句写入事务功能:该功能允许用户在同一个写入事务内对多张表进行 ETL 操作,并确保这些操作原子生效,从而保障数据的一致性和完整性。这一功能为用户在构建 ETL 作业时提供了更高的灵活性,能够更好地满足不同业务场景下的数据处理需求。
- 存算分离:
- 2024 年,Apache Doris 3.0 版本已支持存算分离全新架构,2025 年将对这一场景进行持续优化和打磨,将存储层打造成一个坚实可靠的数据基座,为 Doris 之上的各种功能提供强有力的支撑和保障。具体优化包括冷数据的优化处理、制定更灵活的 Cache(缓存)策略等。例如,在读写分离场景下,支持将写集群中实时写入的数据快速预热到读集群的 Cache 中,从而提高数据的新鲜度和系统整体性能。
04 加强数据处理能力
2025 年,社区将加强批量数据和增量数据处理能力。
- 在批量数据处理领域, 如何利用有限资源处理更大规模的数据是一个关键问题。据 Snowflake 的统计,其平台上 80% 的任务属于 ELT 任务,而仅有 20%的任务来自在线查询。需要注意的是,这些 ELT 任务所处理的数据规模通常为 TB 级别,而非 Hive 或 Spark 所面对的超大数据场景。因此,通过数据溢写、分批次调度以及资源隔离管控等技术手段,能够在实时数据处理框架下,满足绝大多数用户在 ELT 场景中的需求。因此,批处理领域将成为社区持续探索的重要方向。
- 在增量数据处理领域, 目前仍然在规划中,包括 Binlog、实时增量物化视图等功能,2025 年也将持续探索创新,以满足用户日益变化的数据处理需求。
05 进一步提升稳定性
2025 年,将从以下三个维度全面提升 Doris 的稳定性:
- 优化发版规则: 2025 年将继续对 2.1 和 3.0 这 2 个版本持续迭代,上半年将发布 3.1 版本,并预计下半年成为最新稳定版本。今年起,我们优化了三位版本的迭代规则,严格限制新功能和非必要优化,仅允许必要的 Bug 修复。3.1 版本将基于 3.0 稳定版本分支迭代,而非直接从 Master 分支拉取,且仅并入经过全面测试的必要功能和优化,力求缩短 3.1 的稳定周期。此外,今年还会发布 4.0 版本,推出面向 AI 时代的数据基础设施。
- 强化代码审查: 对 PR 模板进行了调整,要求提交者提供更加详尽的描述,包括是否进行了测试、是否存在行为变更、是否配备了相应的文档等内容。目前,社区正在筹备引入强制单测覆盖率准入机制,以进一步规范开发流程。希望通过这些机制,减少人为疏忽,确保代码质量,从而提升 Doris 的整体稳定性。
- 加强测试环节: 除社区流水线的基础测试外,还新增了丰富的测试场景,如压力测试、混沌测试以及专项测试,通过全方位、多维度的测试,进一步夯实 Doris 的稳定性基础。
结束语
以上,就是 Apache Doris 2025 年 Roadmap 的完整介绍。在此,感谢每一位支持 Apache Doris 社区的开发者及使用者,感谢你们共建与支持。我们热忱欢迎更多朋友加入社区,共同迎接挑战。
相关文章:
Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
在全球 290 位开发者的协作下,Apache Doris 在 2024 年完成了 7000 次代码提交,并发布了 22 个版本,实现在实时分析、湖仓一体和半结构化数据分析等核心场景的技术突破及创新。 2025 年,Apache Doris 社区将秉承“以场景驱动创新…...
springboot+easyexcel实现下载excels模板下拉选择
定义下拉注解 Target(ElementType.FIELD) Retention(RetentionPolicy.RUNTIME) public interface ExcelDropDown {/*** 固定下拉选项*/String[] source() default {};/*** 动态数据源key(从上下文中获取)*/String sourceMethod() default "";…...
vue3+ts+element-plus 开发一个页面模块的详细过程
目录、文件名均使用kebab-case(短横线分隔式)命名规范 子组件目录:./progress-ctrl/comps 1、新建页面文件 progress-ctrl.vue <script setup lang"ts" name"progress-ctrl"></script><template>&l…...
软考《信息系统运行管理员》- 7.1 物联网运维
物联网的概念及特征 物联网是在计算机互联网的基础上,通过射频识别 (RFID) 、 无线传感器、红外感应器、 全球定位系统、激光扫描器等信息传感设备,按约定的协议,把物与物之间通过网络连接起来, 进行信息交换和通信,以…...
【GPT入门】第33 课 一文吃透 LangChain:chain 结合 with_fallbacks ([]) 的实战指南
[TOC](【GPT入门】第33课 一文吃透 LangChain:chain 结合 with_fallbacks ([]) 的实战指南) 1. fallback概述 模型回退,可以设置在llm上,也可以设置在chain上,都带有with_fallbacks([])函数 2. llm的回退 2.1 代码 核心代码&…...
裴蜀定理:整数解的奥秘
裴蜀定理:整数解的奥秘 在数学的世界里,裴蜀定理(Bzout’s Theorem)是数论中一个非常重要的定理,它揭示了二次方程和整数解之间的关系。它不仅仅是纯粹的理论知识,还在计算机科学、密码学、算法优化等多个…...
Table as Thought论文精读
标题:Table as Thought: Exploring Structured Thoughts in LLM Reasoning 作者:Zhenjie Sun, Naihao Deng, Haofei Yu, Jiaxuan You 单位:University of Illinois Urbana-Champaign, University of Michigan 摘要: llm的推理…...
PyQt6实例_A股日数据维护工具_使用
目录 前置: 下载预备更新的数据 使用工具更新 用工具下载未复权、前复权、权息数据 在PostgreSQL添加两个数据表 工具&视频 前置: 1 本系列将以 “PyQt6实例_A股日数据维护工具” 开头放置在“PyQt6实例”专栏 2 日数据可在“数据库”专栏&…...
MySQL客户端工具-图形化工具-DataGrip 安装与使用
一. 常见的图形化工具 二. DataGrip 安装 官网:DataGrip:由 JetBrains 开发的数据库和 SQL 跨平台 IDE 二. DataGrip 使用...
企业管理系统的功能架构设计与实现
一、企业管理系统的核心功能模块 企业管理系统作为现代企业的中枢神经系统,涵盖了多个核心功能模块,以确保企业运营的顺畅与高效。这些功能模块通常包括: 人力资源管理模块:负责员工信息的录入、维护、查询及统计分析,…...
1.Qt信号与槽
本篇主要介绍信号和槽,如何关联信号和槽以及用QPixmap在窗口中自适应显示图片 本文部分ppt、视频截图原链接:[萌马工作室的个人空间-萌马工作室个人主页-哔哩哔哩视频] 1. 信号 一般不需要主动发送信号,只有自定义的一些控件才需要做信号的…...
再生认证体系有哪些?不同标准对应的要求及可以做的审核机构
再生认证体系 标准 GRS再生回收认证要求 再生原材料的上游企业:需要具备GRS认证证书,以确保原材料的可追溯性和再生成分。 认证条件: 最终商品的再生成分比例必须至少为20%。 只有由至少50%的回收材料制成的产品才能贴上GRS标签。 认证机构…...
[CISSP] [6] 密码学和对称密钥算法
密码学的目标 1. 机密性(Confidentiality) 目标:保护信息不被未授权访问。 通过 加密(Encryption)技术确保数据只能被授权方解密和读取。主要方法: 对称加密(AES、3DES)ÿ…...
thinkphp每条一级栏目中可自定义添加多条二级栏目,每条二级栏目包含多个字段信息
小程序客户端需要展示团购详情这种结构的内容,后台会新增多条套餐,每条套餐可以新增多条菜品信息,每条菜品信息包含菜品名称,价格,份数等字段信息,类似于购物网的商品多规格属性,数据表中以json类型存储,手写了一个后台添加和编辑的demo 添加页面 编辑页面(json数据…...
混杂模式(Promiscuous Mode)与 Trunk 端口的区别详解
一、混杂模式(Promiscuous Mode) 1. 定义与工作原理 定义:混杂模式是网络接口的一种工作模式,允许接口接收通过其物理链路的所有数据包,而不仅是目标地址为本机的数据包。工作层级:OSI 数据链路层&#x…...
Spring Boot项目信创国产化适配指南
将 Spring Boot 项目适配信创国产化环境,需要从底层基础设施到上层应用组件进行全面替换和调整。以下是主要替换点和适配步骤的总结: 一、基础软件替换 1. JDK 替换 国外JDK:Oracle JDK、OpenJDK国产JDK: 阿里龙井(D…...
MySQL:数据类型
数值类型 数值类型用于存储整数、小数、浮点数等,主要分为整数类型和浮点类型。 整数类型 数据类型存储大小取值范围(有符号)取值范围(无符号)说明TINYINT1字节-128 ~ 1270 ~ 255小整数,如布尔值&#x…...
maven引入项目内本地包方法
最近在写java实现excel转pdf功能; 网上有个包很好用,免费:spire.xls.free-5.3.0.jar。 但是maven打包项目时报错,找不到这个包。 jar包位置如下: 在项目/src/jar/spire.xls.free-5.3.0.jar。 解决方法:…...
ARP协议
ARP协议 ARP协议的作用 当网络设备有数据要发送给另一台网络设备时,必须要知道对方的网络层地址(即IP地址)。IP地址由网络层来提供,但是仅有IP地址是不够的,IP数据报文必须封装成帧才能通过数据链路进行发送。数据帧…...
科技赋能安居梦:中建海龙以模块化革新重塑城市更新范式
在北京市西城区桦皮厂胡同,一栋始建于上世纪70年代的住宅楼正经历着一场脱胎换骨的蜕变。这座曾被鉴定为D级危房的建筑,在中建海龙科技有限公司(以下简称“中建海龙”)的匠心打造下,仅用三个月便完成"原拆原建&qu…...
2025 AI智能数字农业研讨会在苏州启幕,科技助农与数据兴业成焦点
4月2日,以"科技助农数据兴业”为主题的2025AI智能数字农业研讨会在苏州国际博览中心盛大启幕。本次盛会吸引了来自全国各地相关部门领导、知名专家学者、行业协会组织,以及县级市农业企业代表、县级市农产品销售商等万名嘉宾齐聚姑苏城,…...
2000-2021年 全国各地区城镇登记失业率数据
全国各地区城镇登记失业率数据2000-2021年.ziphttps://download.csdn.net/download/2401_84585615/90259723 https://download.csdn.net/download/2401_84585615/90259723 城镇登记失业率是衡量地区就业状况的重要指标,反映了在一定时期内,符合就业条件的…...
Cursor的主要好处
以下是Cursor的主要好处: 代码生成与优化 • 快速生成代码:根据简短描述或部分代码片段,Cursor能快速生成完整代码模块,还能智能预测下一步操作,将光标放在合适位置,让开发者一路Tab键顺滑编写代码。 • …...
超便捷语音转文字工具CapsWriter-Offline本地部署与远程使用全流程
文章目录 前言1. 软件与模型下载2. 本地使用测试3. 异地远程使用3.1 内网穿透工具下载安装3.2 配置公网地址3.3 修改config文件3.4 异地远程访问服务端 4. 配置固定公网地址4.1 修改config文件 5. 固定tcp公网地址远程访问服务端 前言 今天给大家安利一个绝对能让你工作效率飙…...
什么是数据仓库
什么是数据仓库 Data warehouse 是面向主题的 主要根据各种数据来源,来进行历史分析 形成一个趋势分析 为数据挖掘、预测建模、机器学习提供基础数据 与传统数据库比如gaussdb的区别。数据仓库注重历史数据分析,guassdb注重实时事务处理 数据仓库时企业的…...
【动态规划】二分优化最长上升子序列
最长上升子序列 II 题解 题目传送门:AcWing 896. 最长上升子序列 II 一、题目描述 给定一个长度为 N 的数列,求数值严格单调递增的子序列的长度最长是多少。 输入格式: 第一行包含整数 N第二行包含 N 个整数,表示完整序列 输…...
MySQL的安装与初始化流程
MySQL概述 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,MySQL AB公司被Sun公司收购,Sun公司又被Oracle公司收购,目前属于Oracle公司。 MySQL是目前最流行的关系型数据库管理系统,在WEB应用方面MySQL是最…...
flink standalone集群模式部署
一. 环境准备 1、下载并安装jdk11 2、下载flink 并解压 3、确保服务器之间的免密登录 二、集群搭建 搭建集群至少有三台机器,每台机器的分配角色如下 master: jobManager salve01:taskManager salve02:taskManager 1、在JobManager(…...
Linux线程概念与控制:【线程概念(页表)】【Linux线程控制】【线程ID及进程地址空间布局】【线程封装】
目录 一. 线程概念 1.1什么是线程 1.2分页式存储管理 1.2.1虚拟地址和页表的由来 1.2.2物理内存管理 1.2.3页表 1.2.4页目录结构 1.2.5二级页表地址转换 1.3线程的优点 二.进程VS线程 三.Linux线程控制 3.1POSIX线程库 3.2创建线程 编辑 pthread库是个什么东西 …...
7-6 混合类型数据格式化输入
本题要求编写程序,顺序读入浮点数1、整数、字符、浮点数2,再按照字符、整数、浮点数1、浮点数2的顺序输出。 输入格式: 输入在一行中顺序给出浮点数1、整数、字符、浮点数2,其间以1个空格分隔。 输出格式: 在一行中…...
最新全开源码支付系统,赠送3套模板
最新全开源码支付系统,赠送3套模板 码支付是专为个人站长打造的聚合免签系统,拥有卓越的性能和丰富的功能。它采用全新轻量化的界面UI 让您能更方便快捷地解决知识付费和运营赞助的难题,同时提供实时监控和管理功能,让您随时随地…...
Eclipse Leshan 常见问题解答 (FAQ) 笔记
本笔记基于 Eclipse Leshan Wiki - F.A.Q. 页面内容,旨在解答关于 Eclipse Leshan(一个开源的 LwM2M 服务器和客户端 Java 实现)的常见问题,帮助您更好地理解和使用该工具。 一、Leshan 是什么,我该如何使用它&#x…...
【6】数据结构的栈篇章
目录标题 栈的定义顺序栈的实现顺序栈的初始化入栈出栈获取栈顶元素顺序栈总代码与调试 双端栈的实现双端栈的初始化入栈出栈双端栈总代码与调试 链栈的实现链栈的初始化入栈出栈获取栈顶元素链栈总代码与调试 栈的定义 定义:栈(Stack)是一种…...
开源虚拟化管理平台Proxmox VE部署超融合
Proxmox VE 是一个功能强大、开源的虚拟化平台,结合了 KVM 和 LXC,同时支持高可用集群、存储管理(ZFS、Ceph)和备份恢复。相比 VMware ESXi 和 Hyper-V,PVE 具有开源、低成本、高灵活性的特点,适用于中小企…...
C语言基础要素(019):输出ASCII码表
计算机以二进制处理信息,但二进制对人类并不友好。比如说我们规定用二进制值 01000001 表示字母’A’,显然通过键盘输入或屏幕阅读此数据而理解它为字母A,是比较困难的。为了有效的使用信息,先驱者们创建了一种称为ASCII码的交换代…...
函数柯里化(Currying)介绍(一种将接受多个参数的函数转换为一系列接受单一参数的函数的技术)
文章目录 柯里化的特点示例普通函数柯里化实现使用Lodash进行柯里化 应用场景总结 函数柯里化(Currying)是一种将接受多个参数的函数转换为一系列接受单一参数的函数的技术。换句话说,柯里化将一个多参数函数转化为一系列嵌套的单参数函数。 …...
基于大模型的主动脉瓣病变预测及治疗方案研究报告
目录 一、引言 1.1 研究背景 1.2 研究目的 1.3 研究意义 二、大模型预测主动脉瓣病变原理 2.1 大模型介绍 2.2 数据收集与处理 2.3 模型训练与优化 三、术前预测与评估 3.1 主动脉瓣病变类型及程度预测 3.2 患者整体状况评估 3.3 手术风险预测 四、术中应用与监测…...
VSCode开发者工具快捷键
自动生成浏览器文件.html的快捷方式 在文本里输入: ! enter VSCode常用快捷键列表 代码格式化:Shift Alt F向上或向下移动一行:Alt Up 或者 Alt Down快速复制一行代码:Shift Alt Up 或者 Shift Alt Down快速保…...
AI助力PPT制作,让演示变得轻松高效
AI助力PPT制作,让演示变得轻松高效!随着科技的进步,AI技术早已渗透到各行各业,特别是在办公领域,AI制作PPT已不再是未来的梦想,而是现实的工具。以前你可能需要花费数小时来制作一个完美的PPT,如…...
行业专家视角下的技术选型与任务适配深度解析
行业专家视角下的技术选型与任务适配深度解析 一、任务属性与技术栈的映射逻辑 (1)学术类项目需优先考虑技术严谨性、可复现性和理论深度: 机器学习模型开发:PyTorchJupyterMLflow形成完整实验闭环,TensorFlow Exte…...
从零构建大语言模型全栈开发指南:第五部分:行业应用与前沿探索-5.2.1模型偏见与安全对齐(Red Teaming实践)
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 大语言模型全栈开发指南:伦理与未来趋势 - 第五部分:行业应用与前沿探索5.2.1 模型偏见与安全对齐(Red Teaming实践)一、模型偏见的来源与影响1. 偏见的定义与分类2. 偏见的实际影响案例二、安全对齐…...
JUC系列JMM学习之随笔
JUC: JUC 是 Java 并发编程的核心工具包,全称为 Java Util Concurrent,是 java.util.concurrent 包及其子包的简称。它提供了一套强大且高效的并发编程工具,用于简化多线程开发并提高性能。 CPU核心数和线程数的关系:1核处理1线程(同一时间单次) CPU内核结构: 工作内…...
OpenRouter开源的AI大模型路由工具,统一API调用
简介 OpenRouter是一个开源的路由工具,它可以绕过限制调用GPT、Claude等国外模型。以下是对它的详细介绍: 一、主要功能 OpenRouter专注于将用户请求智能路由到不同的AI模型,并提供统一的访问接口。它就像一个“路由器”,能…...
3.9/Q2,Charls最新文章解读
文章题目:Association between remnant cholesterol and depression in middle-aged and older Chinese adults: a population-based cohort study DOI:10.3389/fendo.2025.1456370 中文标题:中国中老年人残留胆固醇与抑郁症的关系࿱…...
水下图像增强与目标检测:标签缺失的“锅”?
水下图像增强与目标检测:标签缺失的“锅”? 在水下计算机视觉领域,图像增强和目标检测一直是研究热点。然而,一个有趣的现象引起了研究者的关注:在某些情况下,增强后的水下图像用于目标检测时,…...
从扩展黎曼泽塔函数构造物质和时空的结构-13
得到这些数据到底有什么用呢?无非都是振动,只有频率不同。电性振动和磁性振动的正交环绕关系,本质上只是某个虚数单位的平方倍数, 既然如此,我们就可以考虑,把电和磁当成同一种东西。比如通过改变真空介电常…...
Android学习总结之handler源码级
一、核心类关系与线程绑定(ThreadLocal 的核心作用) 1. Looper 与 ThreadLocal 的绑定 每个线程的 Looper 实例通过 ThreadLocal<Looper> sThreadLocal 存储,确保线程隔离: public final class Looper {// 线程本地存储&…...
多模态学习(八):2022 TPAMI——U2Fusion: A Unified Unsupervised Image Fusion Network
论文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp&arnumber9151265 目录 一.摘要 1.1 摘要翻译 1.2 摘要解析 二.Introduction 2.1 Introduciton翻译 2.2 Introduction 解析 三. related work 3.1 related work翻译 3.2 relate work解析 四…...
adb检测不到原来的设备List of devices attached解决办法
进设备管理器-通用串行总线设备 卸载无法检测到的设备驱动 重新拔插数据线...
探索高通骁龙光线追踪技术
什么是光线追踪? 光线追踪(Raytracing)是通过模拟现实世界中光线的传播过程并生成更加真实的效果的一种图形渲染技术。 早期在电影,动画,设计等领域已经使用软件摸拟光线追踪来渲染更加真实的图像。一般的做法是从相…...