当前位置: 首页 > news >正文

从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档

从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档

  • 一、引言:破解文档“理解力”瓶颈
  • 二、核心功能:合合信息的“破局”亮点
    • 功能亮点1:复杂图表的高精度解析
      • 图表解析:为大模型装上精准“标尺”
      • 表格数据精准还原
    • 功能亮点2:多元素智能识别与版面精准还原
      • 双栏论文解析:保证段落语义连贯,图表定位精准。
      • 公式识别:符号高度还原,确保原始语义准确无误。
    • 功能亮点3:灵活配置的文档解析参数
    • 功能亮点4:智能文档抽取——解析、检索与生成一体化
    • 功能亮点5:百页文档极速解析,效率提升十倍
  • 三、技术优势:AI驱动的全栈解决方案
    • 1、逻辑版面分析:文档结构的精准还原
    • 2、深度学习与开放词汇检测:适应复杂场景
    • 3、全流程优化:端到端的处理链条
    • 4、行业适配性:精准满足各行业需求
      • 科研领域
      • 教育领域
      • 金融领域
      • 企业服务
  • 四、用户体验与生态共建:零门槛试用,灵活接入
    • 零门槛试用平台:即传即用,实时预览
    • 灵活的API与SDK接入方案
    • 智能溯源功能:用得更放心
  • 五、展望未来:让大模型更懂世界
  • 参考文章


请添加图片描述

🌈你好呀!我是 是Yu欸
🚀 感谢你的陪伴与支持~ 欢迎添加文末好友
🌌 在所有感兴趣的领域扩展知识,不定期掉落福利资讯(*^▽^*)

版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。

请添加图片描述

一、引言:破解文档“理解力”瓶颈

在当今数据爆炸的时代,PDF、Word、图片及PPT文档中蕴含着大量未被充分利用的信息资源。为了从大数据淘到有用的知识,科研人员逐页比对论文图表以捕捉关键数据,金融分析师通宵解析百页财报;传统方法不仅低效,而且难以应对海量数据。

随着deepseek等大模型逐渐步入视野,理论上文档解析工作应能大幅简化。

然而,实际情况却不尽如人意。当前的多模态大模型虽然具备强大的视觉与语言交互能力,但在解析非结构化文档时,仍面临复杂版式、多元素混排以及严密逻辑推理等挑战。

据华南理工大学的一项全面测评显示(Exploring OCR Capabilities of GPT-4V(ision): A Quantitative and In-depth Evaluation),即便是先进的GPT-4V,文字识别能力与专业OCR模型相比,差距高达数十个百分点。在识别图片中文字上尤其存在显著不足。

GPT-4V与OCR模型性能对比

与此同时,即使是微小的解析错误,也可能诱发“大模型幻觉”,最终导致下游模型的判断失误,为决策者带来巨大风险。

对此,华为团队在其论文(An Empirical Study of Scaling Law for OCR)中指出,集成OCR技术后,多模态大模型在视觉问答(VQA)任务中的准确率和泛化能力均有显著提升,进一步验证了OCR在提高大模型综合性能中的关键作用。

Our results reveal a significant improvement in the accuracy of the model for scene-based VQA tasks upon the integration of OCR. Additionally, there is a noticeable enhancement in document-based VQA tasks. These findings suggest that the incorporation of OCR not only enhances the model’s accuracy but also extends its generalization capabilities across diverse VQA scenarios. This evidence distinctly highlights the vital role that OCR inputs play in augmenting the performance of LVLM for downstream tasks. Furthermore, the improved accuracy with OCR integration underscores the model’s enhanced ability to interpret and analyze combined visual and textual data, thereby validating the efficacy of multimodal approaches in tackling complex analytical challenges.

我们的研究结果表明,在集成OCR后,基于场景的VQA任务的模型精度有了显著提高。此外,基于文档的VQA任务也有明显的增强。这些发现表明,OCR的结合不仅提高了模型的准确性,而且扩展了其在不同VQA场景中的泛化能力。这一证据清楚地强调了OCR输入在提高多模态大模型在下游任务中的表现方面所起的重要作用。此外,OCR集成提高的准确性进一步体现了模型在解释和分析视觉与文本数据组合方面的增强能力,从而验证了多模态方法在解决复杂分析挑战方面的有效性。

OCR增强VQA任务性能示意图

正是在这一背景下,合合信息推出了“大模型加速器2.0”项目。该项目依托行业领先的文档与图表解析技术,从数据源头出发,有效降低大模型“幻觉”风险,确保获取的知识更加精准可靠,从而助力各行业实现真正意义上的智能化决策。

让我们一起看看它是如何破局的吧!

二、核心功能:合合信息的“破局”亮点

合合信息大模型加速器2.0 针对文档与图表解析中的多项痛点,提供了突破性的解决方案。

p.s.对具体技术原理感兴趣的朋友可以看看第三章节 ~

下面从六个方面展示其核心功能亮点:

功能亮点1:复杂图表的高精度解析

图表直观生动,是汇报、讲演和宣传的有力工具,但在反向提取图表数据时往往遇到重重挑战。

图表解析:为大模型装上精准“标尺”

合合信息针对图表信息密度高、类型多样以及设计风格复杂的问题,采用先进的视觉与文本双重建模技术:

  • 多图表类型高效适配:无论柱状图、折线图、饼图还是复合型图表,系统均能精准提取关键数据点、坐标轴信息及图例标注,并自动转化为Markdown格式,便于后续数据再利用。

  • 复合图表拆分与重构:面对柱形图与折线图融合的复合图表,合合信息的解析引擎可自动拆分并完整还原数据至Excel表格,确保数据完整无遗漏。

  • 视觉与文本深度融合建模:通过生成式深度学习方法,从布局、线条、颜色到图标标记进行多维特征建模,大幅降低图表识别过程中的误读和漏读风险。

图1:图表解析模块识别复合图表并输出结构化数据示意图。
对于有数值标注的图表,TextIn文档解析可以直接输出准确表格,将其转化为结构化数据,方便后续的数据入库、分析或输入大模型进行处理。
对于没有明确数值的复杂图表,TextIn接口也会通过精确测量给出预估数值,在仅有扫描件、图片文件的情况下,帮助挖掘更多有效数据信息,完成分析及预测工作。

图表解析示意图

表格数据精准还原

合合信息突破了表格识别领域的技术瓶颈,能够高效识别和还原有线表、无线表、跨页合并表格及混合复杂表格。在面对合并单元格、无边框表格等行业难题时,技术优势尤为显著。

图2:表格数据一一对应,可以直接点击跳转对应图表中的数据

表格精准解析示意图

图3:金融年报密集表格,数据均可完整输出为Markdown或JSON格式,保留原始逻辑。

金融年报表格解析示例

功能亮点2:多元素智能识别与版面精准还原

合合信息TextIn采用物理与逻辑版面分析技术,能精准识别文档中的段落、公式、页眉页脚等多种元素,并模拟人类阅读顺序还原版面,确保语义连贯,彻底避免“断章取义”的问题。

双栏论文解析:保证段落语义连贯,图表定位精准。

图4:图表排版清晰,且双栏变单栏时很好地模拟了人类的阅读顺序

在这里插入图片描述

公式识别:符号高度还原,确保原始语义准确无误。

图5:支持看到所有公式,更方便阅读理论部分

公式精准识别示例

功能亮点3:灵活配置的文档解析参数

用户可根据实际需求自由选择和配置解析参数,满足不同场景下对手写内容、复杂公式等高难度内容的识别需求。即使是高难度的量子公式,也能实现精准识别。

图6:可供选择的参数

在这里插入图片描述

图7:最左边是给他的笔记图,中间是进行切边矫正后的图,最右边是识别结果

在这里插入图片描述

(小提示:如果识别有差异,可以尝试左下角的重新识别噢)

在这里插入图片描述

功能亮点4:智能文档抽取——解析、检索与生成一体化

融合文档解析、文档检索和文本生成三大核心技术:

  • 解析:利用版面分析技术进行深度解析。

  • 检索:采用混合多路检索技术,实现高效信息定位。

  • 生成:依托垂直领域语义模型,将解析结果一键填充至数据库,极大提高工作效率。

图8:智能文档抽取支持多个内容公式。

在这里插入图片描述

图9:结合了解析、检索、生成的智能文档抽取,可以一键填充到数据库,更方便快捷。

在这里插入图片描述

功能亮点5:百页文档极速解析,效率提升十倍

通过分布式计算和GPU加速,合合信息实现了传统文档解析工具10倍以上的效率提升。百页级文档解析仅需1.5秒,极大提升了企业年报、金融研报等高强度文档处理场景的生产力,单日可轻松处理数千份文档。

在这里插入图片描述

这六大功能亮点共同构筑了合合信息大模型加速器2.0 的核心竞争力,“破局”传统文档解析的瓶颈,为各行业的智能化转型提供强大支持。


三、技术优势:AI驱动的全栈解决方案

合合信息大模型加速器2.0通过领先的AI技术,形成了完整的端到端文档解析解决方案,融合逻辑版面分析、深度学习、全流程优化及场景适配性,为行业提供精准且高效的数据处理工具。

AI全栈解决方案示意图

1、逻辑版面分析:文档结构的精准还原

随着文档内容与结构复杂性逐渐增加,传统的物理布局分析技术已经难以满足日益增长的精准性需求。逻辑版面分析(Document Logical Analysis, DLA)融合了文档元素的物理位置与语义信息,使得文档解析从单纯的视觉层面深入到语义层次。其核心目标在于构建文档的语义结构树,从而实现文档元素的精准分类,如标题、段落、图表、公式及页脚页眉等。

以合合信息的TextIn算法为例,算法核心使用Transformer架构,精准预测每个段落与其邻近段落的关系,包括子标题、主标题、表格标题以及段落的合并、并列关系。通过识别并确认这些语义关系,形成精确的树状结构,呈现出清晰的目录架构。

2、深度学习与开放词汇检测:适应复杂场景

合合信息自主研发的DocUNet、U2Net等深度学习模型,与先进的生成式AI技术结合,有效应对海量真实文档的复杂布局需求,特别是医学、工程领域存在的历史文档数据缺失、扫描件质量低下等问题。

传统工具如WebPlotDigitizer、Tesseract OCR等,虽能完成基本图表识别,但在精度、复杂度和易用性方面均存在不足。合合信息通过全新的深度学习技术与视觉Transformer架构,能精准、高效地识别并解析复杂图表类型,包括堆叠柱状图等多种复杂结构。

3、全流程优化:端到端的处理链条

合合信息的解析模块覆盖从图像预处理到语义分析的完整流程,有更好的应用级效果:

  1. 图表检测与定位:采用高效的级联检测策略,精准定位图表位置。
  2. 图表类型分类:基于CNN和视觉Transformer技术实现图表类型高精度分类。
  3. 图表结构分析:使用视觉-语言预训练模型,精准解析图表布局、数据点和颜色编码逻辑。
  4. 数据重建与映射:利用线性插值算法实现图像元素到结构化数据的精确转换,确保数据的高完整性。

4、行业适配性:精准满足各行业需求

合合信息大模型加速器2.0针对金融、教育、医疗、科研等47个特定应用场景进行深度优化,提升行业数据处理效率与准确性。

科研领域

高效解析论文和报告中的图表和文本,助力精准知识库构建与学术成果高效复用。

图11:很好的辅助理解了论文的脉络,包括研究方法等内容,更方便复现论文。

科研领域应用示例

图12:帮忙提取出了论文实验结果的表格,不需要手动打字构造,节省了大量时间。

科研图表精准解析

教育领域

自动批改和分析试卷、作业,及时反馈错误并解析原因,助力教学效率提升。

图13:不仅给出答案和正误判断,还帮忙分析了可能的原因。

教育领域作业批改示例

金融领域

精准解析上市公司年报的财务数据及图表,提供实时风险预警与精准财务分析支持。

图14:对金融财报进行了详尽的解析。

金融年报解析示例

企业服务

应用于RPA自动化流程,快速实现合同、报告等重要文档的结构化处理,大幅降低人力成本,支持高效数据溯源。

图15:企业服务 - 合同文档解析示例。

企业服务文档解析示例

合合信息的AI驱动全栈解决方案,持续赋能各行各业,推动数据驱动的智能化转型与升级。


四、用户体验与生态共建:零门槛试用,灵活接入

合合信息致力于构建开放且便捷的用户体验,提供了功能强大的在线平台和灵活的开发者生态,让个人开发者与企业用户都能轻松享受到AI赋能的高效便捷。

零门槛试用平台:即传即用,实时预览

合合信息提供的在线试用平台支持多种文档格式(如PDF、Doc、PNG)的便捷上传与实时预览编辑。用户无需具备编程能力,即可一键完成文档的智能转换与结构化数据提取,大幅降低了技术使用门槛,实现非技术用户的无障碍体验。

p.s.上面的功能演示图片均为在线平台测试结果 ~

灵活的API与SDK接入方案

合合信息为开发者与企业客户提供了全面、灵活的API与SDK方案,支持实时调用、异步处理及私有化部署等多种模式,可灵活适应高并发在线场景和离线处理需求。清晰明了的代码示例帮助开发者快速接入,轻松打造个性化知识库和智能问答系统。

用户端操作界面示意图——轻松体验文档与图表解析的强大功能
例如python接口代码:

import requests
import jsondef get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()class TextinOcr(object):def __init__(self, app_id, app_secret):self._app_id = app_idself._app_secret = app_secretself.host = 'https://api.textin.com'def recognize_pdf2md(self, image_path, options, is_url=False):"""pdf to markdown:param options: request params:param image_path: string:param is_url: bool:return: responseoptions = {'pdf_pwd': None,'dpi': 144,  # 设置dpi为144'page_start': 0,'page_count': 1000,  # 设置解析的页数为1000页'apply_document_tree': 0,'markdown_details': 1,'page_details': 0,  # 不包含页面细节信息'table_flavor': 'md','get_image': 'none','parse_mode': 'scan',  # 解析模式设为scan}"""url = self.host + '/ai/service/v1/pdf_to_markdown'headers = {'x-ti-app-id': self._app_id,'x-ti-secret-code': self._app_secret}if is_url:image = image_pathheaders['Content-Type'] = 'text/plain'else:image = get_file_content(image_path)headers['Content-Type'] = 'application/octet-stream'return requests.post(url, data=image, headers=headers, params=options)if __name__ == "__main__":# 请登录后前往 “工作台-账号设置-开发者信息” 查看 app-id/app-secrettextin = TextinOcr('#####c07db002663f3b085#####', '######1b1b11a9f9bcd7cc7b######')# 示例 1:传输文件image = 'file/example.pdf'resp = textin.recognize_pdf2md(image, {'page_start': 0,'page_count': 1000,  # 设置解析页数为1000页'table_flavor': 'md','parse_mode': 'scan',  # 设置解析模式为scan模式'page_details': 0,  # 不包含页面细节'markdown_details': 1,'apply_document_tree': 1,'dpi': 144  # 分辨率设置为144 dpi})print("request time: ", resp.elapsed.total_seconds())result = json.loads(resp.text)with open('result_1.json', 'w', encoding='utf-8') as fw:json.dump(result, fw, indent=4, ensure_ascii=False)# 示例 2:传输 URLimage = 'https://example.com/example.pdf'resp = textin.recognize_pdf2md(image, {'page_start': 0,'page_count': 1000,  # 设置解析页数为1000页'table_flavor': 'md','parse_mode': 'scan',  # 设置解析模式为scan模式'page_details': 0,  # 不包含页面细节'markdown_details': 1,'apply_document_tree': 1,'dpi': 144  # 分辨率设置为144 dpi}, True)print("request time: ", resp.elapsed.total_seconds())result = json.loads(resp.text)with open('result_2.json', 'w', encoding='utf-8') as fw:json.dump(result, fw, indent=4, ensure_ascii=False)

智能溯源功能:用得更放心

随着大模型在行业中的深入应用,精准且可追溯的数据变得至关重要。为此,合合信息推出了知识库智能溯源功能,用户在“投喂”知识库的Markdown或JSON文件中,能清晰地标记页码、坐标等空间位置信息,从而实现对任意句子、段落的快速溯源和复核。

例如,在财务分析场景中,当大模型从数千页的财报文件中精准抽取收入、利润等关键数据后,分析师可以通过溯源功能快速定位原始表格与页面,有效防范数据错漏,保障信息的高度可靠性和准确性。这一功能极大提升了用户对大模型的信任感,使行业安心使用AI技术。


五、展望未来:让大模型更懂世界

我们一起测评了合合信息如何利用技术创新有效破解文档与图表解析难题,增强大模型对专业文档的精准理解与应用能力。

合合信息大模型加速器2.0项目的启动,不仅为海量非结构化数据的高效利用提供了解决方案,也为大模型在实际应用中的“理解力”提升奠定了坚实基础。


按官网说明,合合信息未来将继续优化文档解析与图表解析技术,拓展多模态数据处理能力,计划支持流程图、思维导图等多种非结构化内容的智能解析,进一步降低大模型“幻觉”风险,推动AI技术在更多领域落地应用。与此同时,通过开放生态共建,与开发者、行业专家共同探索更丰富的应用场景,实现数据智能化和决策科学化的跨越式升级。


欢迎大家体验并关注合合信息大模型加速器2.0,让我们携手开启数据智能时代的新篇章!

点击下方链接注册体验,可赠送1000次文档解析权限,200次docflow权益(2周使用权益),一起来体验探索最新的文档解析与智能决策技术吧:

https://www.textin.com/user/login?redirect=%2F&from=0320xpkx-pr-kol

参考文章

1、Large OCR Model:多模态大模型的文字识别能力之痛,由OCR大模型来缓解
2、Exploring OCR Capabilities of GPT-4V(ision) : A Quantitative and In-depth Evaluation
3、An Empirical Study of Scaling Law for OCR
4、图表解析技术:逆向提取图表数据,需要哪几步?
5、解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”
6、击败全球上千参赛队伍,合合信息获ICDAR“文本篡改检测”赛道冠军
7、中国信通院携手合合信息发布《文本图像篡改检测系统技术要求》


hello,我是 是Yu欸 。如果你喜欢我的文章,欢迎三连给我鼓励和支持:👍点赞 📁 关注 💬评论,我会给大家带来更多有用有趣的文章。
原文链接 👉 ,⚡️更新更及时。

欢迎大家点开下面名片,添加好友交流。

相关文章:

从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档

从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档 一、引言:破解文档“理解力”瓶颈二、核心功能:合合信息的“破局”亮点功能亮点1:复杂图表的高精度解析图表解析:为大模型装上精准“标尺”表格数据精准还原 功…...

Python SciPy面试题及参考答案

目录 什么是 SciPy?它与 NumPy 有什么区别? 如何在 Python 中安装 SciPy? 如何导入 SciPy 库? SciPy 中有哪些子模块?简要介绍它们的功能。 如何使用 SciPy 进行数值积分?请举例说明。 SciPy 中提供了哪些求解微分方程的函数? 什么是插值?SciPy 中如何进行插值?…...

21.Excel自动化:如何使用 xlwings 进行编程

一 将Excel用作数据查看器 使用 xlwings 中的 view 函数。 1.导包 import datetime as dt import xlwings as xw import pandas as pd import numpy as np 2.view 函数 创建一个基于伪随机数的DataFrame,它有足够多的行,使得只有首尾几行会被显示。 df …...

【redis】数据类型之Stream

Redis Stream是Redis 5.0版本引入的一种新的数据类型,它提供了一种持久化的、可查询的、可扩展的消息队列服务。 它结合了Redis高性能的特性与持久化能力,支持: 多消费者组模式(Consumer Groups)消息回溯&#xff08…...

day17 周末两天偷懒没更新,今天炼丹加学习,完结STL常用容器部分

还剩下两个常用容器,一个是set(集合容器) , 一个是map容器 set/multiset 容器 set容器是关联式容器,该容器的特点是:所有元素都会在插入时被自动排序 set/multiset 都是关联式容器 ,其底层结构是使用二叉树实现的。…...

嵌入式开发场景中Shell脚本执行方式的对比

‌Shell脚本执行方式对比表‌ ‌执行方式‌‌命令示例‌‌是否需要执行权限‌‌是否启动子Shell‌‌环境变量影响范围‌‌适用场景‌‌嵌入式开发中的典型应用‌‌直接执行脚本‌./script.sh是是子Shell内有效独立运行的脚本,需固定环境自动化构建脚本(…...

数据结构之多项式相加的链表实现

在计算机科学中,多项式的表示和运算经常会用到。使用链表来表示多项式是一种常见且有效的方法,它可以方便地处理多项式的各项,并且在进行多项式相加等运算时具有较好的灵活性。 多项式通常由一系列的项组成,每一项包含一个系数和…...

Java 实现将Word 转换成markdown

日常的开发中&#xff0c;需要将word 等各类文章信息转换成格式化语言&#xff0c;因此需要使用各类语言将word 转换成Markdown 1、引入 jar包 <dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version&g…...

IEEE PDF Xpress校验出现 :字体无法嵌入问题以及pdf版本问题

文章目录 问题描述一、字体嵌入问题首先查看一下&#xff0c;哪些字体没有被嵌入查看window的font文件夹里的字体下载字体的网站修复字体嵌入问题 二、pdf版本不对 问题描述 在处理IEEE的camera ready的时候&#xff0c;提交到IEEE express的文件没有办法通过validate&#xf…...

Sa-Token

简介 Sa-Token 是一个轻量级 Java 权限认证框架&#xff0c;主要解决&#xff1a;登录认证、权限认证、单点登录、OAuth2.0、分布式Session会话、微服务网关鉴权 等一系列权限相关问题。 官方文档 常见功能 登录认证 本框架 用户提交 name password 参数&#xff0c;调用登…...

StarRocks 中 CURRENT_TIMESTAMP 和 CURRENT_TIME 分区过滤问题

背景 本文基于Starrocks 3.3.5 最近在进行Starrocks 跑数据的时候&#xff0c;发现了一个SQL 扫描了所有分区的数据&#xff0c;简化后的SQL如下&#xff1a; select date_created from tableA where date_createddate_format(current_time(), %Y-%m-%d %H:%i:%S) limit 20其…...

GithubPages+自定义域名+Cloudfare加速+浏览器收录(2025最新排坑)

前言 最近刷到一个小视频&#xff0c;讲述了选择域名选择的三宗罪&#xff0c;分别是 不要使用 .net&#xff0c;因为它价格贵&#xff0c;但是在顶级域名中的 SEO 效果却不是很好&#xff0c;也就是性价比很低不要使用 .cn&#xff0c;因为国外访问该网站可能会很慢&#xf…...

Canvas粒子系统终极指南:从基础运动到复杂交互的全流程实现

文章目录 一、粒子系统基础架构1.1 粒子数据结构设计1.2 粒子系统管理器 二、基础粒子效果实现2.1 重力场模拟2.2 弹性碰撞效果 三、高级交互实现3.1 鼠标吸引效果3.2 颜色渐变粒子 四、性能优化策略4.1 粒子池复用4.2 分层渲染 五、复杂效果实现5.1 烟花爆炸效果5.2 流体模拟 …...

【QT】新建QT工程(详细步骤)

新建QT工程 1.方法(1)点击new project按钮&#xff0c;弹出对话框&#xff0c;新建即可&#xff0c;步骤如下&#xff1a;(2) 点击文件菜单&#xff0c;选择新建文件或者工程&#xff0c;后续步骤如上 2.QT工程文件介绍(1).pro文件 --》QT工程配置文件(2)main.cpp --》QT工程主…...

详解Http:在QT中使用Http协议

目录 一、HTTP 概述 1、主要特点 2、HTTP 方法 3、HTTP 状态码 4、HTTP 头部 5、HTTP的工作原理 二、在Qt中使用HTTP 1、发送简单的HTTP请求 2、发送POST请求 3、处理异步请求 4、使用QSslConfiguration进行HTTPS 5、 处理JSON响应 6、处理错误 三、总结 一、HTTP…...

Next.js 中间件鉴权绕过漏洞 (CVE-2025-29927) 复现利用与原理分析

免责声明 本文所述漏洞复现方法仅供安全研究及授权测试使用&#xff1b; 任何个人/组织须在合法合规前提下实施&#xff0c;严禁用于非法目的&#xff1b; 作者不对任何滥用行为及后果负责&#xff0c;如发现新漏洞请及时联系厂商并遵循漏洞披露规则。 漏洞原理 Next.js 是一个…...

AI时代的数据底座:火山引擎多模态数据湖的设计与实践

资料来源&#xff1a;火山引擎-开发者社区 随着大模型的发展和应用&#xff0c;文本的边界被拓宽&#xff0c;图像、视频、语音各种模态涌现&#xff0c;并给数据管理、检索、计算带来巨大挑战。 火山引擎多模态数据湖 解决方案则可实现海量结构化、半结构化及非结构化数据的统…...

Numpy用法(二)

一.数组变维 1.1 reshape reshape() 可以改变数组维度&#xff0c;但是返回的是一个新的数组&#xff0c;原数组的形状不会被修改.reshape后产生的新数组是原数组的一个视图&#xff0c;即它与原数组共享相同的数据&#xff0c;但可以有不同的形状或维度&#xff0c;且对视图…...

STM32 IIC通信

目录 IIC简介硬件电路连接I2C时序基本单元IIC完整数据帧MPU6050封装硬件IIC内部电路 IIC简介 IIC&#xff08;Inter-Integrated Circuit&#xff09;是 IIC Bus 简称&#xff0c;中文叫集成电路总线。它是一种串行通信总线&#xff0c;使用多主从架构&#xff0c;由飞利浦公司…...

快速入门 JSON 数据格式

引言 JSON&#xff0c;全称 JavaScript Object Notion&#xff0c;类似于XML&#xff0c;YAML&#xff0c;Properties等&#xff0c;是一种数据交换格式&#xff0c;相比于XML&#xff0c;更简单&#xff0c;更轻量&#xff0c;更容易理解。 JSON vs XML 使用 JSON 目前被广…...

FFmpeg —— 中标麒麟系统下使用FFmpeg内核+Qt界面,制作完整功能音视频播放器(附:源码)

🔔 FFmpeg 相关音视频技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…) 程序运行效果...

硬件测试工装设计不合理的补救措施

硬件测试工装设计不合理的补救措施主要包括重新评估设计需求、优化工装结构、强化工装校准与验证。其中&#xff0c;优化工装结构尤其重要&#xff0c;通过结构优化能够有效解决因设计不合理导致的测试准确性下降和可靠性不足的问题。根据工程实践数据&#xff0c;经过优化结构…...

任意文件读取漏洞

fofa语句&#xff1a;body"/vite/client" /fs/etc/passwd?import&raw?? https://35.175.173.157/fs/etc/passwd?import&raw?? http://geometer.dev.mvergely.com/fs/etc/passwd?import&raw??...

如何使用RK平台的spi驱动 spidev

RK平台spidev驱动读取RC522版本号示例 1. 硬件与驱动确认 确认SPI接口连接&#xff1a;RC522的SPI引脚与RK开发板的对应SPI控制器正确连接&#xff08;CS、CLK、MOSI、MISO&#xff09;检查内核配置&#xff1a; Bash # 内核需启用以下配置 CONFIG_SPIy CONFIG_SPI_MASTERy…...

网路传输层UDP/TCP

一、端口号 1.端口号 1.1 五元组 端口号(port)标识了一个主机上进行通信的不同的应用程序. 如图所示, 在一个机器上运行着许多进程, 每个进程使用的应用层协议都不一样, 比如FTP, SSH, SMTP, HTTP等. 当主机接收到一个报文中, 网络层一定封装了一个目的ip标识我这台主机, …...

1.2-WAF\CDN\OSS\反向代理\负载均衡

WAF&#xff1a;就是网站应用防火墙&#xff0c;有硬件类、软件类、云WAF&#xff1b; 还有网站内置的WAF&#xff0c;内置的WAF就是直接嵌在代码中的安全防护代码 硬件类&#xff1a;Imperva、天清WAG 软件&#xff1a;安全狗、D盾、云锁 云&#xff1a;阿里云盾、腾讯云WA…...

Dify 服务器部署指南

1. 系统要求 在开始部署之前&#xff0c;请确保你的服务器满足以下要求&#xff1a; 操作系统&#xff1a;Linux&#xff08;推荐使用 Ubuntu 20.04 或更高版本&#xff09;内存&#xff1a;至少 4GB RAM存储&#xff1a;至少 20GB 可用空间网络&#xff1a;稳定的互联网连接…...

从车间到数字生态:MES如何引领制造业智能化革命‌

在全球制造业加速迈向工业4.0的浪潮中&#xff0c;传统生产模式正经历颠覆性变革。制造执行系统&#xff08;MES&#xff09;作为连接物理车间与数字世界的核心纽带&#xff0c;正从“生产辅助工具”升级为“智能决策大脑”&#xff0c;推动制造业向数据驱动、柔性化与可持续化…...

Error:Flash Download failed

出现这个就是编译器要换...

Spring容器生命周期详解

Spring容器生命周期详解 Spring容器的生命周期从启动到关闭分为多个阶段&#xff0c;包括Bean的加载、实例化、初始化、使用和销毁。以下是详细流程和关键点&#xff1a; 1. 容器启动阶段 1.1 容器实例化 核心接口&#xff1a;BeanFactory&#xff08;基础容器&#xff09;或…...

革新测试管理 2.0丨Storm UTP统一测试管理平台智能化升级与全流程优化

承接上篇&#xff1a;从基础架构到深度协同 在首篇文章《革新测试管理 | 统一测试管理平台如何实现远程、协同、自动化&#xff1f;》中&#xff0c;我们探讨了Storm UTP如何通过云端协作、自动化测试框架和分布式执行能力打破传统测试壁垒。经过一年多的客户实践与技术迭代&a…...

将 char [] str = “hello,you,world” 改为 “world,you,hello“,要求空间复杂度为1

题目&#xff1a; 将 char [] str “hello,you,world” 改为 "world,you,hello",要求空间复杂度为1 &#xff08;也就是使用的变量只能是单个字符或者常数&#xff0c;不能使用数组&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff09; 解…...

运维规则之总结(Summary of Operation and Maintenance Rules)

运维规则之总结 在运维领域&#xff0c;经验和流程往往决定了系统的稳定性与可靠性。一个运维人&#xff0c;总结出了以下10条运维规则&#xff0c;涵盖了从基础管理到高级策略的全面内容&#xff0c;旨在帮助运维人员更好地应对各种挑战&#xff0c;确保系统的平稳运行。 1.…...

MongoDB 创建数据库

MongoDB 创建数据库 引言 MongoDB 是一款高性能、可扩展的 NoSQL 数据库&#xff0c;广泛应用于大数据领域。在 MongoDB 中&#xff0c;创建数据库是进行数据存储的第一步。本文将详细介绍 MongoDB 数据库的创建方法&#xff0c;包括手动创建和自动创建两种方式。 MongoDB 数…...

SpringSecurity OAuth2:授权服务器与资源服务器配置

文章目录 引言一、OAuth2基础概念与架构二、授权服务器配置三、令牌策略与存储方式四、资源服务器配置五、远程令牌验证与内省总结 引言 在现代分布式应用架构中&#xff0c;OAuth2已成为实现安全授权与认证的事实标准。Spring Security对OAuth2提供了全面支持&#xff0c;使开…...

Vue 2 探秘:visible 和 append-to-body 是谁的小秘密?

&#x1f680; Vue 2 探秘&#xff1a;visible 和 append-to-body 是谁的小秘密&#xff1f;&#x1f914; 父组件&#xff1a;identify-list.vue子组件&#xff1a;fake-clue-list.vue 嘿&#xff0c;各位前端探险家&#xff01;&#x1f44b; 今天我们要在 Vue 2 的代码丛林…...

C#高级:启动、中止一个指定路径的exe程序

一、启动一个exe class Program {static void Main(string[] args){string exePath "D:\测试\Test.exe";// 修改为你要运行的exe路径StartProcess(exePath);}private static bool StartProcess(string exePath){// 创建一个 ProcessStartInfo 对象来配置进程启动参…...

windows下安装sublime

sublime4 alpha 4098 版本 下载 可以根据待破解的版本选择下载 https://www.sublimetext.com/dev crack alpha4098 的licence 在----- BEGIN LICENSE ----- TwitterInc 200 User License EA7E-890007 1D77F72E 390CDD93 4DCBA022 FAF60790 61AA12C0 A37081C5 D0316412 4584D…...

Qt 日志输出(重定向)

在软件开发中&#xff0c;日志输出是调试和问题排查的关键手段。Qt框架提供了灵活的日志系统&#xff0c;支持从简单的控制台输出到复杂的自定义日志处理。本文将详细介绍Qt中五种常用的日志输出方法&#xff0c;并附上完整代码示例。 一、使用Qt内置日志函数 Qt提供了五个全局…...

51c嵌入式~MOS~合集1

我自己的原文哦~ https://blog.51cto.com/whaosoft/12074888 一、MOS管&#xff1a;米勒效应、开关损耗以及参数匹配 MOS管即场效应管&#xff08;MOSFET&#xff09;&#xff0c;属于压控型&#xff0c;是一种应用非常广泛的功率型开关元件&#xff0c;在开关电源、逆变器…...

一文详解k8s体系架构知识

0.云原生 1.k8s概念 1. k8s集群的两种管理角色 Master&#xff1a;集群控制节点&#xff0c;负责具体命令的执行过程。master节点通常会占用一股独立的服务器&#xff08;高可用部署建议用3台服务器&#xff09;&#xff0c;是整个集群的首脑。 Master节点一组关键进程&#xf…...

Linux内核软中断分析

一、软中断类型 在Linux内核中&#xff0c;中断处理分为上半部&#xff08;硬中断&#xff09;和下半部。上半部负责快速响应硬件事件&#xff0c;而下半部用于处理耗时任务&#xff0c;避免阻塞系统。下半部有三种机制&#xff1a;软中断&#xff08;Softirq&#xff09;、小任…...

从医疗大模型到综合医疗智能体:算法、架构与路径全流程分析

一、引言 1.1 研究背景与意义 随着信息技术的飞速发展,医疗领域正经历着深刻的变革。医疗智能体作为人工智能技术在医疗行业的重要应用,正逐渐成为提升医疗服务质量、优化医疗流程、促进医疗资源合理分配的关键力量。从最初简单的医疗信息管理系统,到如今能够辅助诊断、制定…...

2025跳槽学习计划

&#xff08;1&#xff09;编程基础&#xff1a; 目录学习资料Chttps://www.bilibili.com/video/BV1z64y1U7hs?spm_id_from333.1387.favlist.content.clickLinuxPytorchhttps://www.bilibili.com/video/BV1if4y147hS?spm_id_from333.1387.favlist.content.clickopencv数据结…...

数据库后续

-- 添加作者字段 alter table t_hero add author varchar(100); -- 更新数据 update t_hero set author "曹雪芹" where id 1; update t_hero set author "曹雪芹" where id 2; update t_hero set author "曹雪芹" where id 3; upd…...

程序员软件工具推荐列表

&#x1f91f;致敬读者 &#x1f7e9;感谢阅读&#x1f7e6;笑口常开&#x1f7ea;生日快乐⬛早点睡觉 &#x1f4d8;博主相关 &#x1f7e7;博主信息&#x1f7e8;博客首页&#x1f7eb;专栏推荐&#x1f7e5;活动信息 文章目录 程序员软件工具推荐列表1. Snipaste2. VSCod…...

如何在WordPress中限制用户登录到一台设备

在当今的互联网环境下&#xff0c;许多用户习惯共享账户信息&#xff0c;虽然看似无害&#xff0c;却可能对网站运营产生负面影响。尤其是对于那些经营会员网站和在线课程的平台&#xff0c;限制用户同时登录的设备数量显得尤为重要。本文将详细探讨如何在WordPress中限制用户登…...

基于大模型的自发性气胸全方位预测与诊疗方案研究

目录 一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 二、大模型预测自发性气胸的原理及技术基础 2.1 大模型介绍 2.2 模型构建与训练数据 2.3 模型训练与优化 三、术前风险预测与准备 3.1 术前风险预测指标 3.2 基于预测的术前准备 3.3 手术方案与麻醉方案制定…...

文章记单词 | 第14篇(六级)

一&#xff0c;单词释义 affection&#xff1a;n. 喜爱&#xff0c;钟爱&#xff1b;爱慕之情&#xff1b;感情stream&#xff1a;n. 小河&#xff0c;溪流&#xff1b;一连串&#xff0c;源源不断&#xff1b;水流&#xff0c;气流&#xff1b;vi. 流&#xff0c;流动&#x…...

系统如何查找文件?inode号又是什么?

下面分别详细解释您提到的三个问题&#xff1a; “文件系统怎么定位文件”、“inode 是什么”、“为什么删除后还可能被占用”。 一、文件系统怎么定位文件 1.1 目录与文件名并不直接存储文件数据 在常见的 Unix/Linux 文件系统&#xff08;如 ext4、xfs&#xff09;或类似的…...