当前位置: 首页 > news >正文

【AI知识库云研发部署】RAGFlow + DeepSeek

gpu

安装screen:yum install screen

配置ollama

下载官方安装脚本并执行: curl -fsSL  https://ollama.com/install.sh  | sh

通过screen后台运行ollama:screen -S ollama

在screen会话中启动服务:

export OLLAMA_KEEP_ALIVE=-1
export OLLAMA_HOST=0.0.0.0:11434 
export OLLAMA_NUM_PARALLEL=16
export OLLAMA_ORIGINS=*
ollama serve

通过ollama拉取模型

ollama pull deepseek-r1:8b
ollama pull bge-m3

结束所有ollama进程:pkill -f ollama

安装cmakeyum install cmake

wget https://huggingface.co/klnstpr/bge-reranker-v2-m3-Q8_0-GGUF/resolve/main/bge-reranker-v2-m3-q8_0.gguf

git clone  https://github.com/ggerganov/llama.cpp

TencentOS 3需要修改ggml/src/CMakeLists.txt才能编译:

find / -type f -path "*/ggml/src/CMakeLists.txt" 2>/dev/null
vim ggml/src/CMakeLists.txt

在llama.capp文件夹下
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j16
cd build/bin
screen -S llama.cpp
注意路径是否正确:
./llama-server -m /data/workspace/bge-reranker-v2-m3-q8_0.gguf --port 11435 --reranking --pooling rank -ngl 25 --host 0.0.0.0 -ub 16384

cpu

在云服务器 CVM (cpu版)中,克隆 RAGFlow 知识库:git clone https://github.com/infiniflow/ragflow.git   根据README.md安装

这里用cvm没用云研发的原因是云研发已经是容器环境了,不支持docker in docker

安装后从本地浏览器直接访问cvm,比如我的cvm是9.34.5.10,则访问http:/9.34.5.10

同样的添加其他几个,添加完成后如图:

到这一步基本完成了,回到主页开始上传文档,然后开始rag问答

注意等待文档解析完成

由于用的模型很拉垮,这里会很慢,耐心等待

相关文章:

【AI知识库云研发部署】RAGFlow + DeepSeek

gpu 安装screen:yum install screen 配置ollama: 下载官方安装脚本并执行: curl -fsSL https://ollama.com/install.sh | sh 通过screen后台运行ollama:screen -S ollama 在screen会话中启动服务: export OLLA…...

HTML07:表格标签

表格 基本结构 单元格行列跨行跨列 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>表格学习</title><style>td {text-align: center;vertical-align: middle;}</style> </he…...

【专家库】Kuntal Chowdhury

昆塔尔乔杜里 Kuntal Chowdhury 是 NVIDIA 的 6G 开发者关系经理和技术布道师。他致力于推动与 NVIDIA 平台和工具的开发者和早期采用者生态系统的联系&#xff0c;以促进 6G 研究社区的蓬勃发展。在此之前&#xff0c;他是 BlueFusion, Inc. 的创始人&#xff0c;这是一家创新…...

IAA-Net:一种实孔径扫描雷达迭代自适应角超分辨成像方法——论文阅读

IAA-Net:一种实孔径扫描雷达迭代自适应角超分辨成像方法 1. 论文的研究目标与实际意义1.1 研究目标1.2 实际问题与产业意义2. 论文的创新方法、公式与优势2.1 方法框架与核心步骤2.2 核心公式与推导2.2.1 回波模型与目标函数2.2.2 正则化加权矩阵设计2.2.3 迭代更新公式2.2.4 …...

[论文阅读]MCP Guardian: A Security-First Layer for Safeguarding MCP-Based AI System

MCP Guardian: A Security-First Layer for Safeguarding MCP-Based AI System http://arxiv.org/abs/2504.12757 推出了 MCP Guardian&#xff0c;这是一个框架&#xff0c;通过身份验证、速率限制、日志记录、跟踪和 Web 应用程序防火墙 &#xff08;WAF&#xff09; 扫描来…...

提示词工程:通向AGI时代的人机交互艺术

‌引言&#xff1a;从基础到精通的提示词学习之旅‌ 欢迎来到 ‌"AGI时代核心技能"‌ 系列课程的第二模块——‌提示词工程‌。在这个模块中&#xff0c;我们将系统性地探索如何通过精心设计的提示词&#xff0c;释放大型语言模型的全部潜力&#xff0c;实现高效、精…...

地级市-机器人、人工智能等未来产业水平(2009-2023年)-社科数据

地级市-机器人、人工智能等未来产业水平&#xff08;2009-2023年&#xff09;-社科数据https://download.csdn.net/download/paofuluolijiang/90623814 https://download.csdn.net/download/paofuluolijiang/90623814 此数据集统计了2009-2023年全国地级市在机器人、人工智能等…...

神经网络中之多类别分类:从基础到高级应用

神经网络中之多类别分类&#xff1a;从基础到高级应用 摘要 在机器学习领域&#xff0c;多类别分类是解决复杂问题的关键技术之一。本文深入探讨了神经网络在多类别分类中的应用&#xff0c;从基础的二元分类扩展到一对多和一对一分类方法。我们详细介绍了 softmax 函数的原理…...

破解工业3D可视化困局,HOOPS Visualize助力高效跨平台协作与交互!

一、当前3D可视化面临的痛点 &#xff08;1&#xff09;性能瓶颈 现有的许多3D可视化工具在处理大型复杂模型时往往力不从心。例如在航空航天、汽车制造等高端制造业&#xff0c;动辄涉及数以亿计的三角面片和海量的纹理细节。这些超大规模的模型在渲染时常常出现卡顿、延迟&…...

感知器准则感知器神经元模型——等价

不同的东西&#xff0c;很多刊物有误。但两者等价。 感知器神经元模型的误差反馈学习 y y y&#xff1a;期望值 y ^ \hat{y} y^​&#xff1a;实际输出值 权重更新公式为&#xff1a; w i ← w i η ( y − y ^ ) x i w_i \leftarrow w_i \eta(y - \hat{y})x_i wi​←wi​…...

Qt学习Day0:Qt简介

0. 关于Qt Qt是C的实践课&#xff0c;之前在C中学习的语法可以有具体的应用场景。Qt的代码量很大&#xff0c;不要死记硬背&#xff0c;学会查询文档的能力更加重要。 建议提升一下相关单词的储备量&#xff1a; 1. Qt是什么&#xff1f; Qt是一个基于C语言的图形用户界面&a…...

JAVA设计模式——(十二)原型模式(Prototype Pattern)

JAVA设计模式——&#xff08;十二&#xff09;原型模式&#xff08;Prototype Pattern&#xff09; 介绍理解实现Email类测试 应用 介绍 用原型实例指定创建对象的种类&#xff0c;并且通过复制原型已有的对象用于创建新的对象。 理解 原型实例便是我们需要复制的类的实例&…...

C++命名空间

什么是命名空间 命名空间是一种用来避免命名冲突的机制&#xff0c;它可以将一段代码的名称隔离开&#xff0c;使其与其他代码的名称不冲突 简单来说,就是编译器检测到相同的名称的函数,变量,或者其他的相同名称的东西,也许会有疑问,怎么能出现相同的名称的变量呢.这就是C引入的…...

Hello Robot 推出Stretch 3移动操作机器人 提升开源与可用性

Stretch 3机器人是Hello Robot推出的新一代移动操作机器人&#xff0c;专注于提升开源开发与实际应用能力。它结合了先进的设计理念和工程技术&#xff0c;旨在为家庭任务和辅助技术提供智能化解决方案。通过优化硬件性能和软件兼容性&#xff0c;这款机器人不仅增强了灵活性&a…...

[Linux_69] 数据链路层 | Mac帧格式 | 局域网转发 | MTU MSS

目录 0.引入 1.以太网帧格式 2.重谈局域网转发的原理(基于协议) 小结 3.认识MTU 3.1MTU对IP协议的影响 3.2MTU对UDP协议的影响 3.3MTU对于TCP协议的影响 0.引入 在去年的这篇文章中&#xff0c;我们有对网络进行过一个概述[Linux#47][网络] 网络协议 | TCP/IP模型 | 以…...

I2C总线驱动开发:MPU6050应用

引言 I2C&#xff08;Inter-Integrated Circuit&#xff09;总线作为嵌入式系统中广泛使用的通信协议&#xff0c;在传感器、外设控制等领域扮演着重要角色。本文将深入探讨I2C总线的工作原理、Exynos4412平台裸机驱动实现、Linux内核中的I2C子系统架构&#xff0c;并以MPU605…...

15.命令模式:思考与解读

原文地址:命令模式&#xff1a;思考与解读 更多内容请关注&#xff1a;深入思考与解读设计模式 引言 在软件开发中&#xff0c;尤其是当系统涉及多个请求、操作或任务时&#xff0c;你是否遇到过这样的情况&#xff1a;每个操作都有自己的执行逻辑&#xff0c;且这些操作可能…...

2025年软件工程与数据挖掘国际会议(SEDM 2025)

2025 International Conference on Software Engineering and Data Mining 一、大会信息 会议简称&#xff1a;SEDM 2025 大会地点&#xff1a;中国太原 收录检索&#xff1a;提交Ei Compendex,CPCI,CNKI,Google Scholar等 二、会议简介 2025年软件开发与数据挖掘国际会议于…...

博客系统测试报告

文章目录 目录1. 项目背景2. 项目简介3. 测试工具4. 测试用例5. 功能测试6. 性能测试7. 弱网测试8. 自动化测试9. bug简述10. 测试结论 目录 项目背景项目简介测试工具测试用例功能测试性能测试弱网测试自动化测试bug简述测试结论 1. 项目背景 为了将平时自己写的笔记、知识…...

window 显示驱动开发-线程同步和 TDR

下图显示了 Windows 显示驱动程序模型 (WDDM) 中显示微型端口驱动程序的线程同步的工作原理 如果发生硬件超时&#xff0c;则会启动 超时检测和恢复 (TDR) 进程。 GPU 计划程序调用驱动程序的 DxgkDdiResetFromTimeout 函数&#xff0c;这将重置 GPU。 DxgkDdiResetFromTimeou…...

GEC6818蜂鸣器驱动开发

相关知识&#xff1a;Linux设备驱动开发 insmod 编译好的.ko文件后再运行beep_app.c编译完成的可执行文件即可使板子蜂鸣。 beep_drv.c: #include <linux/module.h> //包含了加载模块时需要使用的大量符号和函数声明 #include <linux/kernel.h> //包含了printk内…...

WPF MVVM入门系列教程(五、命令和用户输入)

&#x1f9ed; WPF MVVM入门系列教程 一、MVVM模式介绍二、依赖属性三、数据绑定四、ViewModel五、命令和用户输入六、ViewModel案例演示 WPF中的命令模型 在WPF中&#xff0c;我们可以使用事件来响应鼠标和键盘动作。 但使用事件会具备一定的局限性&#xff0c;例如&#x…...

基于Jetson Nano与PyTorch的无人机实时目标跟踪系统搭建指南

引言&#xff1a;边缘计算赋能智能监控 在AIoT时代&#xff0c;将深度学习模型部署到嵌入式设备已成为行业刚需。本文将手把手指导读者在NVIDIA Jetson Nano&#xff08;4GB版本&#xff09;开发板上&#xff0c;构建基于YOLOv5SORT算法的实时目标跟踪系统&#xff0c;集成无人…...

创建简易个人关系图谱(Neo4j )

1. 启动 Neo4j 并进入 Neo4j Browser 确保 Neo4j 已启动&#xff0c;访问&#xff1a; http://localhost:7474/2. 创建人物节点&#xff08;Person&#xff09; (1) 创建 Alice CREATE (alice:Person {name: "Alice", age: 28, gender: "Female"}) RETUR…...

JavaScript 到命令和控制 (C2) 服务器恶意软件分析及防御

攻击始于一个经过混淆的JavaScript文件,该文件从开源服务中获取编码字符串以执行PowerShell脚本。然后,该脚本从一个IP地址和一个URL缩短器下载一个JPG图像和一个文本文件,这两个文件都包含使用隐写术嵌入的恶意MZ DOS可执行文件。这些有效载荷一旦执行,就会部署Stealer恶意…...

[原创](现代Delphi 12指南):[macOS 64bit App开发]: 如何自动打开“安全性与隐私“控制面板?

[作者] 常用网名: 猪头三 出生日期: 1981.XX.XX 企鹅交流: 643439947 个人网站: 80x86汇编小站 编程生涯: 2001年~至今[共24年] 职业生涯: 22年 开发语言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、 开发工具: Visual Studio、Delphi、XCode、…...

springboot微服务连接nacos超时

问题现象 java应用启动失败&#xff0c;查看日志&#xff0c;发现是连接Nacos超时&#xff0c;获取不到配置&#xff0c;导致dubbo注册失败&#xff0c;错误日志如下&#xff1a; 2025-05-01 14:50:08.973 ERROR [TW-172.29.245.61-9063-3] [com.alibaba.nacos.common.utils.…...

react-transition-group 在 React 18 及以上版本中的兼容性问题

出现问题 在React19中下载react-transition-group&#xff08;4.4.5&#xff09;&#xff0c;正常导入使用&#xff1a; 出现下述报错&#xff1a; 报错原因 React18开始&#xff0c;已废弃findDOMNode &#xff0c;而 react-transition-group 的 4.4.5 版本仍然使用了 findD…...

day17 天池新闻数据KMeans、DBSCAN 与层次聚类的对比

在数据分析中&#xff0c;聚类是一种常见的无监督学习方法&#xff0c;用于将数据划分为不同的组或簇。本文将通过news数据集&#xff08;news.csv&#xff09;&#xff0c;使用 KMeans、DBSCAN 和层次聚类三种方法进行聚类分析&#xff0c;并对比它们的性能。 数据来源于天池 …...

数学复习笔记 3

background music 《有人懂你》赵十三 前言 也别开始强化吧&#xff0c;复盘前面复习过的内容&#xff0c;可能是更稳的方式。 无穷级数 写无穷级数的例题。感觉自己真的学会了么&#xff0c;我生怕一写一个不吱声了。呜呜呜。这一章有 27 个例题。我从最后一个例题开始写…...

Navicat Premium 17 备份,还原数据库(PostGreSql)

目录 备份 还原备份 备份 1、点击数据库&#xff0c;点击备份 2、点击新建备份 3、点击备份&#xff0c;查看执行日志 还原备份 1、点击备份、右键还原备份从... 2、 选择文件目录&#xff0c;以及xxx.nb3文件&#xff0c;点击打开 3、点击还原 4、执行日志...

25_05_02Linux架构篇、第1章_03安装部署nginx

Linux_基础篇 欢迎来到Linux的世界&#xff0c;看笔记好好学多敲多打&#xff0c;每个人都是大神&#xff01; 题目&#xff1a;安装部署nginx 版本号: 1.0,0 作者: 老王要学习 日期: 2025.05.02 适用环境: Centos7 文档说明 本文档聚焦于 CentOS 7 环境下 Nginx 的安装部…...

PostgreSQL存储过程“多态“实现:同一方法名支持不同参数

引言 在传统编程语言中&#xff0c;方法重载&#xff08;同一方法名不同参数&#xff09;是实现多态的重要手段。但当我们将目光转向PostgreSQL数据库时&#xff0c;是否也能在存储过程&#xff08;函数&#xff09;中实现类似的功能&#xff1f;本文将深入探讨PostgreSQL中如…...

Messenger.Default.Send 所有重载参数说明

Messenger.Default.Send 是 MVVM 框架中实现消息传递的核心方法,其重载参数主要用于控制消息的发送范围和接收条件。以下是其所有重载形式及参数说明: ‌1. 基本消息发送‌ Send<TMessage>(TMessage message) ‌参数说明‌: TMessage:消息类型(泛型参数),可以是任…...

java安全入门

文章目录 java基础知识this变量方法可变参数构造方法继承的关键字protected super阻止继承方法重载向上转型和向下转型多态抽象接口static静态字段default方法 包final内部类 java序列化与反序列化反射urldns链动态代理类加载器&#xff08;ClassLoader&#xff09;双亲委派模型…...

【开源深度解析】从零打造AI暗棋对战系统:Python实现中国象棋暗棋全攻略

&#x1f3b2;【开源深度解析】从零打造AI暗棋对战系统&#xff1a;Python实现中国象棋暗棋全攻略 &#x1f308; 个人主页&#xff1a;创客白泽 - CSDN博客 &#x1f525; 系列专栏&#xff1a;&#x1f40d;《Python开源项目实战》 &#x1f4a1; 热爱不止于代码&#xff0c;…...

UE5 Daz头发转Blender曲线再导出ABC成为Groom

先安装Daz to Blender Import插件 【神器】 --DAZ一键导入blender插件的详细安装和使用&#xff0c;自带骨骼绑定和控制器&#xff0c;多姿势动画&#xff0c;Importer桥接插件_哔哩哔哩_bilibili 然后安装DAZHairConverter插件 一分钟将DAZ头发转化成Blender粒子毛发_哔哩哔…...

【Java学习】反射

目录 反射类 一、泛型参数 二、反射类类型 三、实例化 1.实例化材料 2.结构信息可使用化 四、使用 1.Class —类完整结构信息 1.1Class<类>实例化 1.2Class<类>实例获取 1.2.1Class类静态获取&#xff1a; 1.2.2信息类静态获取 1.2.3信息类非静态获取 …...

SQLite数据类型

目录 1 SQLite的类型概述 1.1 存储类&#xff08;Storage Classes&#xff09; 1.2 类型亲和性&#xff08;Type Affinity&#xff09; 2 类型亲和性分配规则 3 数据类型详细说明 3.1 INTEGER类型 3.2 REAL类型 3.3 TEXT类型 3.4 BLOB类型 3.5 NULL类型 3.6 NUMERI…...

Django异步任务处理方式总结

在 Django 中实现异步任务处理是优化性能和用户体验的关键。以下是几种常见的异步任务处理方式及详细说明&#xff1a; 1. Celery&#xff08;最主流方案&#xff09; 适用场景&#xff1a;需要可靠、分布式、复杂任务队列的项目&#xff08;如定时任务、重试机制、多节点部署…...

AI技术下研发体系重构

导语&#xff1a; 人工智能技术已发展70余年&#xff0c;经历了从逻辑符号主义向数据驱动范式的转变&#xff0c;目前正处于向多模态、通用化以及伦理化方向演化的阶段。在接下来的五年内&#xff0c;人工智能技术的商业化应用预计将迎来关键性的转变。大模型技术的突破、多模…...

UE5 使用插槽和物理约束对角色新增的饰品添加物理效果

这是一条项链,分为链部分和吊坠部分 新增物理碰撞资产,链部分在前面(作为固定),吊坠部分在后面(作为物理模拟) 链部分的Physics设置 连接部分的设置 吊坠部分 添加物理约束,在Constraint里面添加角色名和饰品名 在约束里面可以对特定骨骼约束,这里需要把链部分约束...

邂逅蓝耘元生代:ComfyUI 工作流与服务器虚拟化的诗意交织

往期推荐&#xff1a; 探秘蓝耘元生代&#xff1a;ComfyUI 工作流创建与网络安全的奇妙羁绊-CSDN博客 工作流 x 深度学习&#xff1a;揭秘蓝耘元生代如何用 ComfyUI 玩转 AI 开发-CSDN博客 探索元生代&#xff1a;ComfyUI 工作流与计算机视觉的奇妙邂逅-CSDN博客 解锁元生代&a…...

【Elasticsearch】在kibana中能获取已创建的api keys吗?

在 Kibana 中&#xff0c;目前没有直接的界面功能可以列出或查看已创建的 API 密钥&#xff08;API keys&#xff09;。API 密钥的管理和查看主要通过 Elasticsearch 的 REST API 来完成&#xff0c;而不是通过 Kibana 的管理界面。 在 Kibana 中使用 Dev Tools 查看 API 密钥…...

[论文阅读]Deep Cross Network for Ad Click Predictions

摘要 特征工程是许多预测模型成功的关键。然而&#xff0c;这个过程是困难的&#xff0c;甚至需要手动特征工程或穷举搜索。DNN能够自动学习特征交互&#xff1b;然而&#xff0c;它们隐式地生成所有的交互&#xff0c;并且不一定有效地学习所有类型的交叉特征。在本文中&…...

薪技术|0到1学会性能测试第45课-apache调优技术

前面的推文我们掌握了apache监控技术,今天我们继续来看下apache调优技术,究竟是怎么做性能调优???后续文章都会系统分享干货,带大家从0到1学会性能测试。 Apache调优技术 Apache最近的版本是2.2版,Apache2.2是一个多用途的web服务器,其设计在灵活性、可移植性和性能中…...

Linux之基础开发工具二(makefile,git,gdb)

目录 一、自动化构建-make/makefile 1.1、背景 1.2、基本使用 1.3、推导过程 1.4、语法拓展 二、进度条小程序 2.1、回车与换行 2.2、行缓冲区 2.3、练手-倒计时程序 2.4、进度条程序 三、版本控制器-Git 3.1、版本控制器 3.2、gitee的使用 3.2.1、如何创建仓库 …...

cesium之自定义地图与地图叠加

在appvue中,cesium支持更换不同的地图资源,代码如下 <template><div id"cesiumContainer" ref"cesiumContainer"></div> </template><script setup> import * as Cesium from cesium; import "./Widgets/widgets.css&…...

链表结构深度解析:从单向无头到双向循环的实现全指南

上篇博客实现动态顺序表时&#xff0c;我们会发现它存在许多弊端&#xff0c;如&#xff1a; • 中间/头部的插⼊删除&#xff0c;时间复杂度为O(N) • 增容需要申请新空间&#xff0c;拷⻉数据&#xff0c;释放旧空间。会有不⼩的消耗。 • 增容⼀般是呈2倍的增⻓&#xff0c;…...

Apache Velocity代码生成简要介绍

Apache Velocity 概述 Apache Velocity 是一个基于 Java 的模板引擎&#xff0c;它允许将 Java 代码与 HTML、XML 或其他文本格式分离&#xff0c;实现视图与数据的解耦。在 Web 开发中&#xff0c;Velocity 常用于生成动态网页内容&#xff1b;在其他场景下&#xff0c;也可用…...