当前位置：首页 > news >正文

JetsonOrin源码安装部署PaddlePaddle

news 来源：原创 2025/8/15 1:34:51

Jetson Orin 源码安装部署Paddle

部署环境

系统架构: Arm
CUDA: 11.4
cmake: 3.18.0
python:3.8
在这里插入图片描述

注意环境中的版本问题，之前装onnxruntime的时候cmake被升级到了3.31.0，但是编译Paddle时会报错，因此特意降级回了官方推荐的3.18.0

具体环境版本参考官方依赖表

源码下载

Paddle官方提供预编译版本的推理库,可自行查找有没有适合自己系统环境的版本。不同的Paddle版本对应的预编译库也不一样。
这里我们选择源码编译安装。经过测试，在Paddle2.3、2.6、3.0中选择了 2.3 版本，因为2.6和3.0依赖的python路径需要非常的全，尝试使用了virtualenvwrapper也不行。
下载程序源码

git clone https://github.com/PaddlePaddle/Paddle.git
cd Paddle
git checkout release/2.3

编译安装

这一步非常重要，官方文档中并没有说明ARM架构需要配置和关掉哪些选项，如果你遇到了大量莫名其妙的报错，那么大概率是cmake时的配置问题

mkdir build_cuda && cd build_cuda
cmake .. -DPY_VERSION=3.8 -DWITH_TESTING=ON -DCMAKE_BUILD_TYPE=Release -DON_INFER=ON -DWITH_PYTHON=ON -DWITH_XBYAK=OFF -DWITH_CONTRIB=OFF -DWITH_MKL=OFF -DWITH_MKLDNN=OFF -DWITH_GPU=ON -DWITH_ARM=ON -DWITH_NV_JETSON=ON -DWITH_NCCL=OFF -DCUDA_ARCH_NAME=All -DWITH_TENSORRT=ON -DTENSORRT_ROOT=/usr -DCMAKE_CXX_FLAGS='-Wno-error -w' ..

具体每个参数的含义可参考下面的错误举例
cmake成功之后开始编译,8个核时间大概一下午

make -j8

编译飞桨过程中可能会打开很多文件，如果编译过程中显示 “Too many open files” 错误时，请使用指令 ulimit -n 102400 来增大当前进程允许打开的文件数

ulimit -n 102400

编译成功后可在 dist 目录找到生成的 .whl 包

pip3 install python/dist/[wheel 包名字]

编译 C++推理库，很快

make inference_lib_dist -j4

编译成功后，所有产出均位于 build 目录下的 paddle_inference_install_dir 目录内。

错误举例

c++: error: unrecognized command line option ‘-m64’：
现象：第三方库的flag.make里都带有 CXX_FLAGS = -Wno-error=deprecated-declarations -Wno-deprecated-declarations -std=c++14 -m64 -fopenmp -O3 -DNDEBUG
原因：cmake时没有启用 -DWITH_ARM=ON
/Paddle/paddle/phi/backends/dynload/nvjpeg.h:14:10: fatal error: nvjpeg.h: No such file or directory: cmake时没有启用 -DWITH_NV_JETSION=ON
/usr/bin/ld: cannot find -liomp5: cmake时没有关闭MKL，设置-DWITH_MKL=OFF -DWITH_MKLDNN=OFF
/Paddle/paddle/phi/api/lib/api_gen_utils.cc:44:19: note: remove ‘std::move’ call : cmake时没有启用-DCMAKE_CXX_FLAGS=‘-Wno-error -w’ 导致警告升级为错误

参考

fatal error: nvjpeg.h: No such file or directory
nvjpeg.h: No such file or directory
Paddle官方安装文档

JetsonOrin源码安装部署PaddlePaddle

Jetson Orin 源码安装部署Paddle 部署环境系统架构: Arm CUDA: 11.4 cmake: 3.18.0 python:3.8 注意环境中的版本问题，之前装onnxruntime的时候cmake被升级到了3.31.0，但是编译Paddle时会报错，因此特意降级回了官方推荐的3.18.0 具体环…...

编程日记 2025/8/15 1:34:51

入门到入土，Java学习 day20(多线程下)

void wait() 当前线程等待，直到被其他线程唤醒 void notify() 随机唤醒单个线程 void notifyAll() 唤醒所有线程阻塞队列在测试方法中创建带锁队列，然后在对象类中也创建队列但是不赋值，用构造方法将测试方法中的对象赋值然后用put和t…...

编程日记 2025/8/1 18:51:57

【TCP】三次挥手，四次挥手详解--UDP和TCP协议详解

活动发起人小虚竹想对你说： 这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧&#xff01…...

编程日记 2025/8/15 1:33:47

栈(LIFO)算法题

1.删除字符串中所有相邻的重复字符注意，我们需要重复处理，而不是处理一次相邻的相同元素就结束了。对示例来说，如果只进行一次处理，结果为aaca，但是处理之后又出现了相邻的重复元素，我们还得继续处理&…...

编程日记 2025/8/12 23:30:29

印章/公章识别：PaddleX下的“Seal-Recognition”模型

最近做项目需要对印章进行识别，并提取其中的印章文字，又不希望这个模型太大，还要方便部署，于是乎这个模型是个不错的选择。一、模型简介 “Seal-Recognition”模型是PaddleX旗下的一款模型（PaddleX 是基于飞桨框架构…...

编程日记 2025/8/12 10:10:36

从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）

文章目录第一部分：AI开发的背景与历史1.1 人工智能的起源与发展1.2 神经网络与深度学习的崛起1.3 Transformer架构与LLM的兴起1.4 当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1 机器学习：AI的基础2.1.1 机器学习的类型2.1.2 机器学…...

编程日记 2025/8/15 1:32:28

DeepSeek入门宝典——行业应用篇

大家好，我是吾鳴。今天吾鳴要给大家分享一份由51CTO智能研究院出品的DeepSeek报告——《DeepSeek入门宝典——行业应用篇》。这份报告主要从DeepSeek核心能力、行业赋能与应用案例、合作伙伴与生态建设和学习资料与体系化方案做了详细的介绍，报告一共有…...

编程日记 2025/8/15 1:32:54

K8S学习之基础三十一：k8s中RBAC 的核心概念

Kubernetes (k8s) 中的 RBAC（Role-Based Access Control，基于角色的访问控制）是一种用于管理用户和服务账户对集群资源访问权限的机制。RBAC 允许管理员通过定义角色（Role）和角色绑定（RoleBinding&#xff…...

编程日记 2025/7/16 1:39:20

JAVA数据库技术（一）

JDBC 简介 JDBC（Java Database Connectivity）是Java平台提供的一套用于执行SQL语句的Java API。它允许Java程序连接到数据库，并通过发送SQL语句来查询、更新和管理数据库中的数据。JDBC为不同的数据库提供了一种统一的访问方式，使…...

编程日记 2025/8/8 8:04:30

【Agent】OpenManus-Flow组件详细分析

1. Flow架构概述 OpenManus 的Flow组件实现了一个灵活的工作流管理系统，主要用于协调多个智能体的协作，以完成复杂任务。Flow组件的核心是基于计划的执行模型，它将任务分解为一系列步骤，然后逐步执行这些步骤，直到任务…...

编程日记 2025/8/14 8:37:41

MySQL环境安装详细教程（Windows/macOS/Linux）

摘要：本文详细介绍了在Windows、macOS和Linux三大操作系统下安装MySQL数据库的完整流程，帮助开发者快速搭建本地MySQL环境。一、MySQL安装前准备官网下载访问MySQL官网 → 选择"Downloads" → 选择"MySQL Community (GPL) Downloads&…...

编程日记 2025/8/14 10:39:12

【人工智能基础2】人工神经网络、卷积神经网络基础、循环神经网络、长短时记忆网络

文章目录三、人工神经网络1. 神经元感知模型2. 神经网络模型3. 学习规则:修改神经网络的权重和偏置反向传播算法（BP）优化器 - 梯度下降法四、卷积神经网络基础（CNN）1. 基本原理2. 计算过程五、循环神经网络（RNN&…...

编程日记 2025/8/15 1:32:27

如何查看windows系统的硬件环境（附方法

方法一：使用命令指示符查询在“开始”菜单中搜索：命令指示符，并以管理员身份打开， 输入：systeminfo，就可以查看硬件、CPU、处理器等详细内容 systeminfo 方法二：在资源监视器中查看按住 “…...

编程日记 2025/8/11 22:02:51

基于树莓派的水果分类系统（论文+源码）

针对小型农户的在水果加工销售环节中的分类需求，本文设计并实现了基于树莓派的视觉识别分类系统。本章根据所选水果的具体情况，简述系统各模块的实现方法，设计树莓派的程序算法，并选择合适的器件型号，开发所用的辅助工…...

编程日记 2025/8/15 1:32:54

Gemini Robotics：将人工智能带入物理世界

25年3月来自谷歌的技术报告“Gemini Robotics: Bringing AI into the Physical World”。大型多模态模型的最新进展，已使数字领域出现卓越的通才能力，但将其转化为机器人等物理智体仍然是一项重大挑战。一般有用的机器人需要能够理解周围的物理世界&am…...

编程日记 2025/8/15 1:33:48

2.5[frontEnd]

requestAnimationFrame 是浏览器原生 API，定义在 window 对象中，属于 Web API 的一部分。无需任何导入即可直接使用，其类型定义包含在 TypeScript 标准库中。 React 组件挂载时执行该 useEffect 初始化节流计时器 lastEmit 和 25ms 触发间隔…...

编程日记 2025/8/14 19:08:23

【动手学深度学习】#2线性神经网络

主要参考学习资料： 《动手学深度学习》阿斯顿张等著【动手学深度学习 PyTorch版】哔哩哔哩跟李牧学AI 目录 2.1 线性回归2.1.1 线性回归的基本元素线性模型损失函数解析解随机梯度下降 2.1.3 最大似然估计 2.2 线性回归从零开始实现2.2.1 生成数据集2.2.2 读取数…...

编程日记 2025/8/15 1:30:57

C语言动态内存管理(上)

欢迎拜访：雾里看山-CSDN博客本篇主题：C语言动态内存管理(上) 发布时间：2025.3.16 隶属专栏：C语言目录为什么需要动态内存管理静态分配的局限性动态分配的优势动态内存函数malloc函数介绍函数使用 free函数介绍函数使用 calloc…...

编程日记 2025/8/15 1:33:46

图解多头注意力机制：维度变化一镜到底

目录一、多头注意力机制概述二、代码实现1. pyTorch 实现2. tensorFlow实现三、维度变化全流程详解1. 参数设定2. 维度变化流程图3. 关键步骤维度变化四、关键实现细节解析1. 多头拆分与合并2. 注意力分数计算3. 掩码处理技巧五、完整运行示例六、总结与常见问题1. 核心优势…...

编程日记 2025/8/15 1:30:43

Navicat如何查看密码

近期遇到需要将大部分已存储的navicat数据库转发给其他人，于是乎进行导出文件奈何对方不用navicat，无法进行文件的导入从而导入链接搜罗navicat的密码查看，大部分都为php代码解析以下转载GitHub上看到的一个python代码解析的脚本这里是对…...

编程日记 2025/8/10 5:03:00

第4节：分类任务

引入： 独热编码（one-hot）：对于分类任务的输出，也就是是或不是某类的问题，采取独热编码的形式将y由一离散值转化为连续的概率分布，最大值所在下标为预测类输入的处理：对于任意一张…...

编程日记 2025/8/15 1:33:46

EasyCVR安防视频汇聚平台助力工业园区构建“感、存、知、用”一体化智能监管体系

在现代工业园区的安全管理和高效运营中，视频监控系统扮演着不可或缺的角色。然而，随着园区规模的扩大和业务的复杂化，传统的视频监控系统面临着诸多挑战，如设备众多难以统一管理、数据存储分散、智能分析能力不足、信息利用率低下…...

编程日记 2025/8/9 21:57:58

计算机网络——DNS

一、什么是DNS？ DNS（Domain Name System，域名系统） 是互联网的核心服务，负责将人类可读的域名（如 www.baidu.com）转换为机器可识别的 IP地址（如 14.119.104.254）。它像一…...

编程日记 2025/8/15 1:32:53

STC89C52单片机学习——第20节: [8-2]串口向电脑发送数据电脑通过串口控制LED

写这个文章是用来学习的,记录一下我的学习过程。希望我能一直坚持下去,我只是一个小白,只是想好好学习,我知道这会很难，但我还是想去做！ 本文写于：2025.03.15 51单片机学习——第20节: [8-2]串口向电脑发送数据&电脑通过串口控制LED 前言…...

编程日记 2025/8/15 1:32:51

1.5[hardware][day5]

Link类跳转指令可以拆分为两个部分，一个是跳转，即下一个PC的生成，如果将分支条件的比较放到译码级来进行，则这部分只涉及取值级和译码级流水；另一个是Link操作，简单来说就是写寄存器，这部则主要…...

编程日记 2025/8/15 1:30:42

Java 多线程编程：提升系统并发处理能力！

多线程是 Java 中实现并发任务执行的关键技术，能够显著提升程序在多核处理器上的性能以及处理多任务的能力。本文面向初级到中级开发者，从多线程的基本定义开始，逐步讲解线程创建、状态管理、同步机制、并发工具以及新兴的虚拟线程技术。每部…...

编程日记 2025/8/9 22:33:33

Mininet 的详细设计逻辑

Mininet 是一个轻量级网络仿真工具，其核心目标是在单台物理机上快速构建复杂的虚拟网络拓扑，支持 SDN（软件定义网络）和传统网络协议的实验与验证。其设计逻辑围绕虚拟化、模块化和灵活性展开，以下是其详细设计架构…...

编程日记 2025/8/15 1:32:24

原生微信小程序实现导航漫游（Tour）

效果： 小程序实现导航漫游 1、组件 miniprogram/components/tour/index.wxml  <view class"guide" wx:if"{{showGuide}}"><view style"{{guideStyle}}" class"guide-box"><view class&quo…...

编程日记 2025/8/9 1:24:47

Spring(6）——Spring、Spring Boot 与 Spring MVC 的关系与区别

Spring、Spring Boot 与 Spring MVC 的关系与区别 1. 核心定位 Spring 定位：基础框架，提供 IoC（控制反转） 和 DI（依赖注入） 核心功能，管理对象生命周期及依赖关系。功能：支持事务管…...

编程日记 2025/8/11 17:13:58

神聖的綫性代數速成例題2. 行列式的性質

性質 1：行列式與它的轉置行列式相等： 設為行列式，為其轉置行列式，則。性質 2：交換行列式的兩行 (列)，行列式變號： 若行列式經過交換第行和第行得到行列式，則。性質 3&#xff…...

编程日记 2025/8/11 8:25:20

文章目录 ModelScope推理QwQ32Bmodel_scope下载QwQ32BModelScope 调用QwQ-32B ModelScope推理QwQ32B 以下载 qwq32b 为例子需要安装的 python 包 transformers4.49.0 accelerate>0.26.0 torch2.4.1 triton3.0.0 safetensors0.4.5可以使用 conda 创建一个虚拟环境安装 cond…...

编程日记 2025/8/14 18:14:22

使用unsloth进行grpo强化学习训练

说明 unsloth框架可以进行各种sft训练，包括lora和grpo训练。我参考官方方法，使用模型Qwen2.5-3B-Instruct和数据集gsm8k，写了一个grpo训练的例子。代码这个代码加载模型Qwen2.5-3B-Instruct和数据集gsm8k。训练完成后先保存lora模型然后…...

编程日记 2025/8/14 8:49:33

【c++】【智能指针】shared_ptr底层实现

【c】【智能指针】shared_ptr底层实现智能指针之前已经写过了，但是考虑到不够深入，应该再分篇写写。 1 shared_ptr 1.1 shared_ptr 是什么 std::shared_ptr是一个类模板，它的对象行为像指针，但是它还能记录有多少个对象共享它…...

编程日记 2025/8/12 22:38:00

python拉取大视频导入deepseek大模型解决方案

使用Python拉取大视频并导入大模型，需要综合考虑数据获取、存储、处理和资源管理，确保高效稳定地处理大视频数据，同时充分利用大模型的性能，以下是分步方案及代码示例： --- 1. 分块下载大视频（避免内存溢出…...

编程日记 2025/8/13 4:20:56

【Python】面向对象

编程的两大特点面向过程：着重于做什么面向对象（ oop）：着重于谁去做 python是面向对象语言，面向对象三大特点：封装、继承、多态面向对象：便于代码管理，方便迭代更新。新式类、经…...

编程日记 2025/8/11 10:25:39

leetcode日记（100）填充每个节点的下一个右侧节点指针

和层序遍历差不多的思路，将节点储存在队列里，一边取出节点一边放入取出节点的左右节点，直到队列空。 /* // Definition for a Node. class Node { public:int val;Node* left;Node* right;Node* next;Node() : val(0), left(NULL), right(NU…...

编程日记 2025/8/12 14:05:14

docker入门篇

使用docker可以很快部署相同的环境,这也是最快的环境构建,接下来就主要对docker中的基础内容进行讲解.Docker 是一个用于开发、交付和运行应用程序的开源平台，它可以让开发者将应用程序及其依赖打包到一个容器中，然后在任何环境中运行这个容器&#xff0…...

编程日记 2025/8/14 4:36:21

python语法

1. 前面先写import导入模块，完整的语法是： [from 模块名] import [模块 | 类 | 变量 | 函数 | *] [as 别名] 语法还可以是： from 模块名 import 功能名如果import整个模块的话，需要用.功能名()，来用这个功能&#xff…...

编程日记 2025/8/8 22:11:13

Dify使用部署与应用实践

最近在研究AI Agent，发现大家都在用Dify，但Dify部署起来总是面临各种问题，而且我在部署和应用测试过程中也都遇到了，因此记录如下，供大家参考。Dify总体来说比较灵活，扩展性比较强，适合基于它做…...

编程日记 2025/8/8 19:09:40

微信小程序接入DeepSeek模型（火山方舟），并在视图中流式输出

引言： DeepSeek，作为一款先进的自然语言处理模型，以其强大的文本理解和生成能力著称。它能够处理复杂的文本信息，进行深度推理，并快速给出准确的回应。DeepSeek模型支持流式处理，这意味着它可以边计算边输…...

编程日记 2025/8/8 2:00:34

前端性能优化指标及优化方案

前端性能优化的核心目标是提高页面加载速度、降低交互延迟、减少资源占用。常见的 Web 性能指标包括 LCP、FID、CLS、TTFB、TTI、FCP 等。关键性能指标（Web Vitals） 指标优化方案 （1）LCP（Largest Contentful Paint&…...

编程日记 2025/8/9 4:46:33

正则化介绍

简单介绍正则化是用于控制模型的复杂度，防止模型在训练数据上过度拟合（overfitting）。正则化通过在模型的损失函数中引入额外的惩罚项，来对模型的参数进行约束，从而降低模型的复杂度。这个额外的惩罚通常与模型参数的…...

编程日记 2025/8/14 23:59:14

AI时代：数字媒体的无限可能

人工智能和数字媒体技术正深刻改变着我们的生活。通过大数据分析、机器学习等技术，人工智能不仅能精准预测用户需求，还能在医疗、金融等多个领域提供高效解决方案。与此同时，数字媒体技术的进步使得信息传播更加迅速和广泛。社会计算作为新兴…...

编程日记 2025/8/14 11:40:36

自动化爬虫drissionpage

自动化爬虫drissionpage官网自动化测试框架：DrissionPage DrissionPage调用工具汇总网络爬虫工具比较-DrissionPage、Selenium、Playwright...

编程日记 2025/7/8 23:08:19

禁毒知识竞赛主持稿串词

尊敬的各位领导、各位来宾、参赛选手们：大家好！ 在市禁毒委员会的领导下，今年我市开展了以“参与禁毒战争，构建和谐社会”为主题的禁毒宣传月活动。为了进一步加强我市禁毒宣传力度，促进社会治安的好转和社会主义物质文…...

编程日记 2025/8/14 17:26:39

【JDK17】Jlink一秒生成精简的JRE

之前介绍了 Java17模块化的JDK，模块化后按需使用Jlink 用于精简生成 JRE 环境，这让快速的开发环境增强了编码的愉悦感。在实际生产环境中使用 mave 进行项目的构建，其次再是精简 JRE 缩小容器镜像体积，为实现一体化的流程&#xf…...

编程日记 2025/8/13 10:50:25

机器学习周报--文献阅读

文章目录摘要Abstract 1 文章内容1.1 模型结构1.1.1 LSTMAT的结构设置1.1.2 AWPSO算法优化模型 1.2 实验与结果讨论1.2.1 处理缺失数据1.2.2 模型评估指标1.2.3 比较实验1.2.4 消融实验（ABLATION EXPERIMENTS） 2相关知识2.1 自适应权重粒子群优化&#…...

编程日记 2025/8/8 16:36:17

硬件地址反序？用位操作为LED灯序“纠偏”。反转二进制数即可解决

特别有意思，LED的灯序与其硬件地址刚好相反，没办法直接通过加1实现二进制进位的亮灯操作，查了一些资料说用数组和switch实现，觉得太麻烦了，思索良久，就想到了反转二进制数解决这个问题。 reverse_bits( )是…...

编程日记 2025/8/13 19:15:09

A* floyd算法 bellman-ford

求源点到目标点最短距离排序的里面要加上与目标点一个预估距离,与dj算法差距只有这儿预估要小于等于真实的最短距离,吸引力要适当越接近实际距离越快 #include<bits/stdc.h> using namespace std;// 方向向量：上、右、下、左 const vector<int> …...

编程日记 2025/8/12 23:56:19

【数据挖掘】KL散度（Kullback-Leibler Divergence, KLD）

KL散度（Kullback-Leibler Divergence, KLD） 是衡量两个概率分布 P 和 Q之间差异的一种非对称度量。它用于描述当使用分布 Q 逼近真实分布 P 时，信息丢失的程度。 KL散度的数学定义给定两个离散概率分布 P(x)和 Q(x)，它们在相同的…...

编程日记 2025/8/6 2:55:54

Jetson Orin 源码安装部署Paddle

部署环境

源码下载

编译安装

错误举例

参考

相关文章：