当前位置: 首页 > news >正文

淘宝历史价格采集合规指南:官方 API + 轻量爬虫混合方案

在电商数据分析领域,获取淘宝商品的历史价格数据对于企业制定价格策略、进行竞品分析以及消费者洞察市场价格波动趋势都具有重要意义。然而,由于淘宝平台对数据安全和合规性的严格要求,历史价格采集工作需要在合法合规的框架内进行。本文将详细介绍一种结合官方 API 与轻量爬虫的混合方案,助力企业及个人在合规前提下高效获取淘宝历史价格数据。​

一、淘宝平台规则解读​

1.1 数据使用条款​

淘宝平台明确规定,任何对平台数据的采集、存储、使用和共享行为,都必须遵守其服务协议和隐私政策。未经淘宝书面授权,不得通过自动化脚本、爬虫程序等方式批量获取平台数据。这意味着,直接使用暴力爬虫无节制地抓取淘宝商品历史价格数据属于违规行为,可能导致账号封禁、法律诉讼等严重后果。例如,曾经有一些数据服务公司因大规模、恶意采集淘宝商品数据,被淘宝平台起诉并承担了相应的法律责任。​

1.2 知识产权保护​

淘宝商品的描述、图片、价格等信息均受知识产权保护。在采集历史价格数据时,不能侵犯商家的知识产权。比如,不能将采集到的数据用于非法商业用途,如为仿冒产品定价提供参考,或者在未经授权的情况下将数据转售给第三方,以此谋取不正当利益。​

二、官方 API 使用指南​

2.1 API 权限申请

淘宝为开发者提供了部分官方 API,用于合法获取商品相关数据。首先,企业或个人需要注册开发者账号,提交相关资质审核,包括企业营业执照(个人开发者需提供个人身份证明及相关开发能力证明)等信息。审核通过后,根据业务需求申请特定的 API 权限,如商品价格查询 API。例如,一家专注于电商数据分析的企业,在提交了详细的企业介绍、数据使用场景说明以及安全保障措施等资料后,成功获得了淘宝商品价格相关 API 的调用权限。​

2.2 价格数据获取​

通过官方 API 获取商品历史价格数据,一般需要按照 API 文档规范构建请求。以 Python 语言为例,使用requests库发送 HTTP 请求,示例代码如下:

import requests
import json# 假设已获取到有效的API密钥和访问令牌
api_key = "your_api_key"
access_token = "your_access_token"
product_id = "1234567890"  # 替换为实际商品IDurl = f"https://api.taobao.com/router/rest?method=taobao.item.price.get&app_key={api_key}&access_token={access_token}&fields=id,price&num_iid={product_id}"
response = requests.get(url)if response.status_code == 200:data = json.loads(response.text)if "item_price" in data:price_info = data["item_price"]print(f"商品ID: {price_info['id']}, 当前价格: {price_info['price']}")else:print("未获取到价格信息")
else:print(f"请求失败,状态码: {response.status_code}")

 

上述代码通过向淘宝 API 发送请求,获取指定商品的当前价格信息。若要获取历史价格,部分 API 可能需要提供时间范围参数,开发者需根据 API 文档要求准确设置。然而,官方 API 可能在数据的时间跨度、获取频率等方面存在限制,难以满足一些对历史价格数据有全面、高频需求的场景,此时就需要结合轻量爬虫作为补充手段。​

三、轻量爬虫设计与合规要点​

3.1 爬虫技术选型​

为了确保合规性与低侵入性,选择轻量、智能的爬虫框架十分关键。以 Python 的BeautifulSoup库结合Selenium为例,BeautifulSoup用于解析 HTML 页面,Selenium则可以模拟浏览器行为,处理 JavaScript 渲染的页面数据,这对于淘宝商品详情页中动态加载的价格历史信息获取尤为重要。例如,当淘宝商品详情页中的历史价格图表是通过 JavaScript 动态生成时,Selenium可以驱动浏览器加载页面,等待数据渲染完成后,再由BeautifulSoup提取所需的价格数据。​

3.2 模拟人类行为​

轻量爬虫在运行过程中,要尽可能模拟人类用户的浏览行为。设置合理的请求间隔时间,避免短时间内发送大量请求,造成对淘宝服务器的压力。例如,每次请求之间随机等待 3 - 5 秒,模拟人类用户在浏览页面时的思考和操作时间。同时,随机化请求头信息,包括浏览器类型、操作系统等,伪装成真实用户的请求。以下是使用Selenium设置随机请求头的示例代码:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import randomuser_agents = ["Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36","Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36","Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0"
]chrome_options = Options()
chrome_options.add_argument(f"user-agent={random.choice(user_agents)}")
driver = webdriver.Chrome(options=chrome_options)

 

3.3 数据提取策略​

在提取历史价格数据时,只抓取公开可见的信息,避免访问淘宝平台明确禁止访问的敏感数据区域。例如,通过分析淘宝商品详情页的 HTML 结构,定位到历史价格展示区域的 DOM 元素,使用BeautifulSoup的选择器精准提取价格数据及对应的时间戳。对于一些需要登录才能查看的价格信息,不要尝试通过破解登录机制获取,严格遵守淘宝平台的访问控制规则。​

四、混合方案实施步骤​

4.1 数据需求分析​

在实施混合方案前,明确所需历史价格数据的范围、时间跨度、频率等需求。例如,一家电商品牌运营公司,需要分析过去一年自家商品以及竞品在淘宝平台的价格波动情况,以便制定季度促销策略。根据这一需求,确定需要采集的数据包括商品 ID、日期、价格等字段,时间跨度为一年,采集频率为每周一次。​

4.2 官方 API 优先调用​

首先尝试使用官方 API 获取满足需求的数据。按照 API 的调用限制和规范,定期请求数据并存储。如上述电商品牌运营公司,通过官方 API 获取近一个月内的商品价格数据,因为官方 API 在时效性和数据准确性上有保障,且合规风险低。​

4.3 轻量爬虫补充​

对于官方 API 无法覆盖的历史数据范围或因调用限制无法获取的更频繁数据,启用轻量爬虫。在爬虫运行过程中,严格遵循模拟人类行为和合规的数据提取策略,补充采集所需的历史价格数据。例如,对于超过一个月的历史价格数据,使用轻量爬虫按照每周一次的频率进行采集,将采集到的数据与官方 API 获取的数据整合,形成完整的历史价格数据集。​

五、数据存储与使用合规​

5.1 数据存储安全​

无论是通过官方 API 还是轻量爬虫获取的数据,都要妥善存储,保障数据安全。采用加密技术对存储的数据进行加密,防止数据泄露。例如,使用 SSL/TLS 加密协议对数据传输过程加密,在数据库存储时,对敏感字段如价格数据进行字段级加密。同时,设置严格的访问权限,只有经过授权的人员和程序才能访问和使用这些数据。​

5.2 数据使用限制​

采集到的淘宝历史价格数据仅能用于合法的商业分析、研究等用途,不得用于任何侵犯淘宝平台、商家或消费者权益的行为。例如,利用这些数据进行市场价格走势分析,为企业内部定价决策提供参考是合规的;但将数据出售给非法的数据交易平台,或者用于欺诈消费者的价格误导行为则是违法违规的。企业应建立内部数据使用规范,对数据的访问、处理、共享等环节进行严格管控,确保数据使用在合规轨道上运行。​

遵循淘宝平台规则,采用官方 API 与轻量爬虫相结合的混合方案,在保障数据安全与合规的前提下,能够有效地满足对淘宝历史价格数据的采集需求。无论是企业进行市场分析,还是消费者了解商品价格波动,都应在合法合规的框架内开展数据采集与利用活动,共同维护健康、有序的电商数据生态环境。​

相关文章:

淘宝历史价格采集合规指南:官方 API + 轻量爬虫混合方案

在电商数据分析领域,获取淘宝商品的历史价格数据对于企业制定价格策略、进行竞品分析以及消费者洞察市场价格波动趋势都具有重要意义。然而,由于淘宝平台对数据安全和合规性的严格要求,历史价格采集工作需要在合法合规的框架内进行。本文将详…...

文档控件DevExpress Office File API v24.2亮点:不再支持非Windows系统

DevExpress Office File API是一个专为C#, VB.NET 和 ASP.NET等开发人员提供的非可视化.NET库。有了这个库,不用安装Microsoft Office,就可以完全自动处理Excel、Word等文档。开发人员使用一个非常易于操作的API就可以生成XLS, XLSx, DOC, DOCx, RTF, CS…...

TDengine.C/C++ 连接器

简介 C/C 开发人员可以使用 TDengine 的客户端驱动,即 C/C 连接器(以下都用 TDengine 客户端驱动表示),开发自己的应用来连接 TDengine 集群完成数据存储、查询以及其他功能。TDengine 客户端驱动的 API 类似于 MySQL 的 C API。…...

什么是混合搜索Hybrid Search?

🧠 向所有学习者致敬! “学习不是装满一桶水,而是点燃一把火。” —— 叶芝 我的博客主页: https://lizheng.blog.csdn.net 🌐 欢迎点击加入AI人工智能社区! 🚀 让我们一起努力,共创AI未来! 🚀 混合搜索通常指一种结合多种搜索方法或技术的搜索策略,旨在提供更…...

滤波器:模拟滤波器和数字滤波器的区别

滤波器是一种用于从信号中去除不需要的频率成分,只保留所需频率成分的电子设备或算法。根据实现方式的不同,滤波器主要分为模拟滤波器和数字滤波器两大类。以下是对这两种滤波器的详细比较: 一、实现方式与原理 模拟滤波器 实现方式&#xf…...

AudioRecord 录制pcm转wav

pcm转wav PCM 格式校验pcm 添加 wav 头信息WAVWAV 格式检验小端序? 参考地址 PCM 格式校验 /*** 专业PCM文件验证(支持动态参数与多格式)* param silenceThreshold 静音检测阈值(0.0~1.0),默认90%零值为静…...

625SJBH网上便利店的设计与实现

1前 言 目前,网络正以一种前所未有的冲击力在影响着人类的活动,包括人类的生产和日常生活。网络的诞生和发展,颠覆了传统的信息传播方式,冲破了存在于传统交流方式中时间和空间的种种壁垒,极大地改变了人类从物质到精…...

如何开发英语在线训练小程序:从0到1的详细步骤

在数字化学习的浪潮下,英语在线训练小程序凭借便捷、高效的学习模式,成为众多英语学习者的得力助手。如果你也想开发一款独具特色的英语在线训练小程序,不妨参考以下步骤,开启你的小程序开发之旅。 一、前期规划 (…...

java设计模式-装饰者模式

装饰者模式(Decorator) 定义 1、动态的将新功能附加到对象上,在对象功能扩展方面,他比继承更有弹性,也体现了开闭原则(OCP) 2、这里提到的动态的将新功能附加到对象和OCP原则,在后面应用实际上会以代码的形式体现。 //饮料 // 饮…...

我提了一个 Androidx IssueTracker

问题 在运行 gradle plugin 插件的 transform R8 阶段出现了报错 Caused by: com.android.tools.r8.internal.xk: java.lang.NullPointerException: Cannot invoke “String.length()” because “” is null 报错日志 FAILURE: Build failed with an exception.* What went w…...

spring mvc @ResponseBody 注解转换为 JSON 的原理与实现详解

ResponseBody 注解转换为 JSON 的原理与实现详解 1. 核心作用 ResponseBody 是 Spring MVC 的一个注解,用于将方法返回的对象直接序列化为 HTTP 响应体(如 JSON 或 XML),而不是通过视图解析器渲染为视图(如 HTML&…...

RK3588芯片NPU的使用:Windows11 Docker中运行MobileNet模型以及部署到开发板进行目标检测

本文的目标 本文将在RKNN Docker环境(见本系列的第二篇文章)中练习MobileNet图像分类示例,并通过adb工具部署到RK3588开发板。 MobileNet简介请参考上一篇文章。 开发环境说明 主机系统:Windows11目标设备:搭载RK35…...

智能仓储数字孪生Demo(Unity实现)

一、项目背景与行业痛点 医药流通行业仓储管理面临三大核心挑战: 合规性风险:GSP(药品经营质量管理规范)对温湿度、药品批次追溯的严苛要求,传统人工记录易出错效率瓶颈:库区布局复杂,人工巡检…...

Qt上hook钩子的使用,监测键盘和鼠标。

演示平台:windows。 编译环境:Qt5.12.2 MinGW 64-bit Windows API: ///加载钩子 /*** SetWindowsHookEx 函数解释* int idHook 所监控的挂钩类型* HOOKPROC lpfn 监控信息的处理函数* HINSTANCEhMod 监控信息的动态链接位置 nullptr则与本线…...

Android12源码编译之预置Android Studio项目Android.mk文件编写

1、在AndroidManifest.xml文件中添加package"com.sprd.silentinstalldemo"属性&#xff0c;因为新版本的Android Studio默认生成的AndroidManifest.xml是没有这个属性值的 <?xml version"1.0" encoding"utf-8"?> <manifest xmlns:an…...

微服务注册中心选择指南:Eureka vs Consul vs Zookeeper vs Nacos

文章目录 引言微服务注册中心概述什么是服务注册与发现选择注册中心的标准 常见的微服务注册中心1. Eureka1.1 理论基础1.2 特点1.3 示例代码 2. Consul2.1 理论基础2.2 特点2.3 示例代码 3. Zookeeper3.1 理论基础3.2 特点3.3 示例代码 4. Nacos4.1 理论基础4.2 特点4.3 示例代…...

pg_waldump无法定位WAL文件问题

目录 排查pg_waldump无法定位WAL文件问题的步骤1. 确认WAL文件路径配置2. 检查WAL文件名格式3. 验证文件存在性4. 检查文件权限5. 时间线历史文件检查6. 使用pg_controldata验证状态7. 尝试指定完整路径 典型错误场景及解决方案 排查pg_waldump无法定位WAL文件问题的步骤 1. 确…...

Mysql安装

Mysql安装 1. windows安装1.1 官网下载1.2 安装 1. windows安装 1.1 官网下载 官网下载 选择对于版本&#xff0c;然后跳转到下载页 1.2 安装...

Windows版-RabbitMQ自动化部署

一键完成Erlang环境变量配置&#xff08;ERLANG_HOME系统变量&#xff09;‌ 一键完成RabbitMQ环境变量配置&#xff08;RabbitMQ系统变量&#xff09;‌ 实现快速安装部署RabbitMQ PS&#xff1a; 需提前下载安装&#xff1a; - otp_win64_25.0.exe (Erlang) - rabbit…...

spring mvc的拦截器HandlerInterceptor 接口详解

HandlerInterceptor 接口详解 1. 接口方法说明 方法作用执行时机返回值/注意事项preHandle请求处理前拦截在控制器方法执行前调用返回 false 中断后续流程&#xff1b;返回 true 继续执行postHandle控制器方法执行后拦截在控制器方法返回结果后&#xff0c;视图渲染前调用无返…...

Linux平台内存泄漏检测工具介绍: ASan vs Valgrind

目录&#xff1a; 前言Valgrind 介绍在Ubuntu上安装Valgrind 核心主要功能Valgrind 基本用法1. --leak-checkfull2. --show-leak-kindsall3. --track-originsyes4. 其他常用选项--tool<name>--log-file<filename>-v / --verbose--error-exitcode<n> 示例命令…...

c# 数据结构 链表篇 有关单链表的一切

本人能力有限,本文仅作学习交流与参考,如有不足还请斧正 目录 0.单链表好处 0.5.单链表分类 1.无虚拟头节点情况 图示: 代码: 头插/尾插 删除 搜索 遍历全部 测试代码: 全部代码 2.有尾指针情况 尾插 全部代码 3.有虚拟头节点情况 全部代码 4.循环单链表 几个…...

二叉树层平均值:层序遍历+队列解法详解

给定一个非空二叉树的根节点 root , 以数组的形式返回每一层节点的平均值。与实际答案相差 10-5 以内的答案可以被接受。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;[3.00000,14.50000,11.00000] 解释&#xff1a;第 0 层的平均值为 …...

解决 Docker Swarm 集群节点故障:从问题剖析到修复实战

解决 Docker Swarm 集群节点故障&#xff1a;从问题剖析到修复实战 在使用 Docker Swarm 构建容器编排集群时&#xff0c;可能会遭遇各种难题。本文将分享一次处理 Docker Swarm 集群节点故障的实战经历&#xff0c;涵盖问题出现的缘由、详细剖析以及完整的解决步骤&#xff0…...

【Java中级】11章、注解、元注解介绍、快速入门,了解java注解的基本使用方式【2】

文章内容 JDK内置的基本注释类型 Override DeprecatedSuppressWarnings 元注解 对注释进行注解 ❤️内容涉及注解的定义&#xff0c;快速入门&#xff0c;注意事项 &#x1f308; 跟着B站一位老师学习的内部类内容&#xff0c;现写这篇文章为学习内部类的小伙伴提供思路支持&…...

Qt中自定义插件和库(1)

Qt中自定义插件和库(1) 在Qt中自定义插件和库的方法有两种&#xff1a; 1.提升法。 2.自定义Qt Designer 插件法。 下面就以《Qt 5.9 C开发指南》一书中的例子来讲解。下面先讲提升法。 一、提升法 提升法(Promotion)是Qt Designer中重用自定义控件的一种方法&#xff0c…...

RK3568下QT实现视频播放器

在开发多媒体应用时,视频播放器是常见的项目。QT 作为一款跨平台的 C++ 应用程序开发框架,凭借丰富的类库和工具,让开发视频播放器变得简单。本文将介绍如何使用 QT 的QMediaPlayer和QVideoWidget类,实现一个简单的视频播放器,并逐步添加打开视频、播放、暂停、停止以及进…...

Shell脚本核心要点总结

刷题&#xff1a; Shell脚本核心要点总结 一、Shell基础 定义&#xff1a;Shell是用户与内核交互的接口&#xff0c;本质是多个指令的集合&#xff0c;需遵循逻辑关系。类型&#xff1a; 编译型语言&#xff08;如C&#xff09;&#xff1a;需编译器&#xff08;如gcc&#xf…...

C++-FFmpeg-(5)-1-ffmpeg原理-ffmpeg编码接口-AVFrame-AVPacket-最简单demo

1.视频编码原理 2.FFMpeg编码接口和AVPacket结构体详解 2.1ffmpeg编码接口 -编码器上下文 2.2AVPacket结构体 2.3AVFrame结构体 3.视频播放最简单demo 3.1FFMpeg编码器获取和上下文打开 3.2视频帧创建和测试 1.视频编码原理 1.1 流程&#xff1a;像素格式转换-&…...

Opencv计算机视觉编程攻略-第十二节 处理视频序列

视频由一系列图像构成&#xff0c;这些图像称为帧&#xff0c;帧是以固定时间间隔获取的&#xff08;称为帧速率&#xff0c;通常用帧/秒表示&#xff0c;例如大疆无人机抽取每一帧&#xff09;&#xff0c;本文将介绍如何读取、处理和存储视频序列。如果从视频序列中提取出独立…...

浮点许可优化管理软件 - 智能许可管理专家

为什么选择浮点许可优化管理软件? 在当今数字化时代&#xff0c;企业软件许可支出持续攀升&#xff0c;如何实现许可资源的最优配置成为一大挑战。浮点许可优化管理软件通过先进的算法和自动化技术&#xff0c;帮助企业实现许可资源的精准管理和成本优化。 革命性的智能化功能…...

Spring Boot接口返回Long类型的数据时丢失精度的全局处理

1、问题 当实体类中的字段为Long类型时&#xff0c;通过Ajax请求返回给前段&#xff0c;在js中数据会丢失精度 直接通过postman请求或通过浏览器请求&#xff0c;看下响应则不会丢失精度 2、处理方式 1、使用JsonSerialize注解 JsonSerialize(using ToStringSerializer.…...

量子计算入门:开启未来计算的次元之门

在科幻电影中&#xff0c;我们常看到“量子计算机”被描绘成无所不能的黑科技——破解密码、模拟宇宙、瞬间完成超算百年的任务。但现实中&#xff0c;量子计算究竟是什么&#xff1f;它真的能颠覆传统计算机吗&#xff1f; 一、从“硬币”到“薛定谔的猫”&#xff1a;量子世界…...

学习日志37—基于变分量子电路的量子机器学习算法综述

基于变分量子电路的量子机器学习算法综述 论文原链接参考&#xff1a;https://crad.ict.ac.cn/article/cstr/32373.14.issn1000-1239.202330979 这篇综述的核心内容是基于变分量子电路&#xff08;VQCs&#xff09;的量子机器学习算法的研究现状、应用进展以及面临的挑战和未…...

初入Web网页开发

1、网页哪些内容 1.1 三个核心文件的作用 index.html&#xff1a;网页的骨架&#xff0c;用HTML编写网页结构和内容。 script.js&#xff1a;网页的行为&#xff0c;用JavaScript实现交互功能&#xff08;如按钮点击事件&#xff09;。 styles.css&#xff1a;网页的外观&…...

Vue进行前端开发流程

一、创建vue项目 创建vue项目&#xff1a;先进入要操作的目录下&#xff0c;注意本项目是用vue2开发的。 vue create vue项目名 二、项目开发 1.创建项目结构 2.开发功能模块 主入口App.vue <template><div class"boss-app"><Header /><m…...

【深度学习:实战篇】--PyTorch+Transformer谣言检测系统

任务&#xff1a;构建一个多模态谣言检测模型。 数据集描述如下&#xff1a; 数据集包含以下模态&#xff1a; 谣言文本&#xff1a;谣言的核心文本信息。2. 配图&#xff1a;与谣言文本相关的图像数据&#xff1b;3. OCR 文本&#xff1a;可以通过 PaddleOCR 从配图中提取的…...

PostGreSQL/openGauss表膨胀处理

如果面试官问你&#xff0c;Oracle与PG/OG最大的区别是什么&#xff1f;你要是没回答出MVCC机制&#xff0c;表膨胀&#xff0c;那你多半挂了。 在PG/OG数据库中&#xff0c;命令vacuum full&#xff0c;插件pg_repack用于处理表膨胀&#xff0c;但是别高兴得太早&#xff0c;如…...

视频融合平台EasyCVR搭建智慧粮仓系统:为粮仓管理赋能新优势

一、项目背景 当前粮仓管理大多仍处于原始人力监管或初步信息化监管阶段。部分地区虽采用了简单的传感监测设备&#xff0c;仍需大量人力的配合&#xff0c;这不仅难以全面监控粮仓复杂的环境&#xff0c;还容易出现管理 “盲区”&#xff0c;无法实现精细化的管理。而一套先进…...

基于 Node.js 和 Spring Boot 的 RSA 加密登录实践

在当今的互联网应用开发中&#xff0c;用户数据的安全性至关重要。登录功能作为用户进入系统的第一道防线&#xff0c;其安全性更是不容忽视。本文将介绍一种基于 RSA 加密的登录方案&#xff0c;前端使用 Node.js 的 node-forge 库对密码进行公钥加密&#xff0c;后端使用 Spr…...

jupyter在Pycharm中遇到的一个问题

jupyter比较简洁&#xff0c;可以分块执行&#xff0c;下面显示结果&#xff0c;还能用Markdown写注释&#xff0c;总体来说来还是比较好用的。 但是遇到了一个奇怪的问题&#xff0c;从一个py文件中导入一个函数&#xff0c;结果输出为None。但是如果直接把这个函数的内容复制…...

十二、buildroot系统 adb登录权限设置

4.6.4、adb权限设置 ​ android-adbd 是 ADB&#xff08;Android Debug Bridge&#xff09;的守护进程&#xff0c;允许开发者远程访问和调试设备。它通常用于 Android 设备&#xff0c;但在嵌入式 Linux上&#xff0c;也可以用来提供远程 shell、文件传输和应用调试功能。 ​…...

MySQL、Oracle 和 PostgreSQL 是三种主流的关系型数据库的主要原理性差异分析

MySQL、Oracle 和 PostgreSQL 是三种主流的关系型数据库&#xff0c;它们在底层原理和设计哲学上存在显著差异&#xff0c;尤其在存储引擎、事务处理、并发控制、索引结构、复制机制等方面。以下是它们的主要原理性差异分析&#xff1a; 1. 存储引擎与架构设计 MySQL 多存储引…...

【AI开源大模型工具链ModelEngine】【01】应用框架-源码编译运行

ModelEngine提供从数据处理、知识生成&#xff0c;到模型微调和部署&#xff0c;以及RAG&#xff08;Retrieval Augmented Generation&#xff09;应用开发的AI训推全流程工具链。 GitCode开源地址&#xff1a;https://gitcode.com/ModelEngineGitee开源地址&#xff1a;https…...

一文掌握 google浏览器插件爬虫 的制作

更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、技术栈1. 前端技术(浏览器插件开发)2. 爬虫技术3. 后端(可选)4. 整体技术栈组成二、开发步骤1. 创建 Chrome 插件基础结构(1)`manifest.json` 配置(2)前端页面(`popup.html`)(3)前端逻辑(`popup.js`)…...

【leetcode 100】贪心Java版本

划分字母区间 题目 我的思路&#xff1a;第一次没有一点思路&#xff0c;第二次看了官网思路后&#xff0c;写的以下答案&#xff0c;没有搞明白循环遍历&#xff0c; //是不对的以下&#xff1a; class Solution {public List<Integer> partitionLabels(String s) {Li…...

Linux用Wireshark进行Thread网络抓包关键步骤

用Nordic nRF52840 Dongle作为RCP配合Wireshark进行Thread网络抓包是debug Thread网络的有效工具之一&#xff0c;主要流程在这里&#xff0c;不再赘述&#xff1a;官方流程 但是按官方流程会卡在一个地方&#xff0c;第一次费劲解决后&#xff0c;今天在另一台机器重新配的时…...

项目管理中客户拒绝签字验收?如何处理和预防

客户拒绝签字验收&#xff1f;如何处理和预防&#xff1f;核心在于&#xff1a;正面沟通、证据留存、灵活应对、合同条款明确、阶段验收机制。其中正面沟通格外关键&#xff0c;如果在发现客户迟迟不愿签字时能够主动沟通&#xff0c;了解其顾虑或不满并迅速针对性解决&#xf…...

docker 修改镜像源教程

当在拉取镜像时报以下错误时&#xff0c;可以通过更换镜像源解决 rootlocalhost:/etc/docker# docker pull mysql Using default tag: latest Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for …...

【JAVA】十、基础知识“类和对象”干货分享~(三)

目录 1. 封装 1.1 封装的概念 1.2 访问限定符 public&#xff08;公开访问&#xff09; private&#xff08;私有访问&#xff09; 1.3 包 1.3.1 包的概念 1.3.2 导入包中的类 1.3.3 自定义包 2. static成员 2.1 static变量&#xff08;类变量&#xff09; 2.1.1 sta…...