当前位置：首页 > news >正文

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-build.py

news 来源：原创 2025/9/19 6:20:21

build.py

ultralytics\data\build.py

build.py

1.所需的库和模块

2.class InfiniteDataLoader(dataloader.DataLoader):

3.class _RepeatSampler:

4.def seed_worker(worker_id):

5.def build_yolo_dataset(cfg, img_path, batch, data, mode="train", rect=False, stride=32, multi_modal=False):

6.def build_grounding(cfg, img_path, json_file, batch, mode="train", rect=False, stride=32):

7.def build_dataloader(dataset, batch, workers, shuffle=True, rank=-1):

8.def check_source(source):

9.def load_inference_source(source=None, batch=1, vid_stride=1, buffer=False):

1.所需的库和模块

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/licenseimport os
import random
from pathlib import Pathimport numpy as np
import torch
from PIL import Image
from torch.utils.data import dataloader, distributedfrom ultralytics.data.dataset import GroundingDataset, YOLODataset, YOLOMultiModalDataset
from ultralytics.data.loaders import (LOADERS,LoadImagesAndVideos,LoadPilAndNumpy,LoadScreenshots,LoadStreams,LoadTensor,SourceTypes,autocast_list,
)
from ultralytics.data.utils import IMG_FORMATS, PIN_MEMORY, VID_FORMATS
from ultralytics.utils import RANK, colorstr
from ultralytics.utils.checks import check_file

2.class InfiniteDataLoader(dataloader.DataLoader):

# 这段代码定义了一个名为 InfiniteDataLoader 的类，它继承自 PyTorch 的 DataLoader 类，并通过修改其行为来实现无限循环的数据加载功能。
# 定义了一个名为 InfiniteDataLoader 的类，继承自 PyTorch 的 DataLoader 类。这表明它将复用 DataLoader 的功能，同时添加一些自定义行为。
class InfiniteDataLoader(dataloader.DataLoader):# 重用工作器的数据加载器。# 使用与原始数据加载器相同的语法。"""Dataloader that reuses workers.Uses same syntax as vanilla DataLoader."""# 定义了 InfiniteDataLoader 的初始化方法，接收任意数量的位置参数 ( *args ) 和关键字参数 ( **kwargs )。这些参数将被传递给父类 DataLoader 的初始化方法。def __init__(self, *args, **kwargs):# 无限循环使用 worker 的 Dataloader，继承自 DataLoader。"""Dataloader that infinitely recycles workers, inherits from DataLoader."""# 调用父类 DataLoader 的初始化方法，完成标准的 DataLoader 初始化过程。super().__init__(*args, **kwargs)# object.__setattr__(name, value)# 在Python中， object.__setattr__() 是一个特殊方法，用于设置对象的属性。它是 object 类的一个方法，而 object 是Python中所有类的基类。 __setattr__() 方法在设置对象属性时被自动调用，但也可以在子类中被重写以自定义属性赋值的行为。# 参数 ：# name ：要设置的属性的名称。# value ：属性的值。# 行为 ：# 当对一个对象的属性进行赋值操作时，例如 obj.attr = value ，Python会自动调用该对象的 __setattr__() 方法。这个方法的默认实现会设置一个名为 name 的属性，其值为 value 。# 为什么使用 object.__setattr__ ：# 在某些情况下，你可能需要直接调用 __setattr__() 方法，特别是当你需要绕过属性赋值的默认行为时。例如，你可能想要在设置属性之前执行一些额外的检查或操作。# 注意事项 ：# 使用 object.__setattr__() 时，应该谨慎，因为它会绕过属性的正常赋值机制，包括可能的属性监视器或装饰器。# 在大多数情况下，直接使用 obj.attr = value 就足够了，除非有特殊需求需要自定义属性赋值的行为。# 通过 object.__setattr__ 方法，将 self.batch_sampler 替换为 _RepeatSampler(self.batch_sampler) 。 _RepeatSampler 是一个包装器，用于将 batch_sampler 的行为从有限迭代转换为无限迭代。 这是实现无限数据加载的关键步骤。object.__setattr__(self, "batch_sampler", _RepeatSampler(self.batch_sampler))# 调用父类 DataLoader 的 __iter__ 方法，初始化一个 迭代器 self.iterator 。这个迭代器将 用于后续的无限循环 。self.iterator = super().__iter__()# 定义了 __len__ 方法，用于返回 InfiniteDataLoader 的长度。def __len__(self):# 返回批量采样器的采样器的长度。"""Returns the length of the batch sampler's sampler."""# 返回 _RepeatSampler 中原始 batch_sampler 的长度。虽然 _RepeatSampler 本身是无限的，但这里返回的是原始采样器的长度，用于提供一个有限的参考值。return len(self.batch_sampler.sampler)# 定义了 __iter__ 方法，用于实现无限循环的迭代行为。def __iter__(self):# 创建一个无限重复的采样器。"""Creates a sampler that repeats indefinitely."""# 循环 len(self) 次。虽然 _RepeatSampler 是无限的，但这里通过 len(self) 控制循环次数，确保每次迭代都能从 _RepeatSampler 中获取数据。for _ in range(len(self)):# 通过 next(self.iterator) 获取下一个批次的数据，并将其作为生成器的输出。yield next(self.iterator)# 定义了 __del__ 方法，用于在对象被销毁时执行清理操作。def __del__(self):# 确保工作线程被终止。"""Ensure that workers are terminated."""# 开始一个 try 块，用于捕获可能的异常。try:# 检查 self.iterator 是否有 _workers 属性。如果没有，则直接返回，跳过后续清理操作。if not hasattr(self.iterator, "_workers"):return# 遍历 self.iterator 中的所有工作线程 _workers 。for w in self.iterator._workers:  # force terminate# 如果工作线程仍在运行，则调用 terminate() 方法强制终止线程。if w.is_alive():w.terminate()# 调用 _shutdown_workers() 方法，清理工作线程。self.iterator._shutdown_workers()  # cleanup# 捕获并忽略所有异常，确保 __del__ 方法不会因异常而失败。except Exception:pass# 定义了一个 reset 方法，用于重置迭代器。def reset(self):# 重置迭代器。# 当我们想要在训练时修改数据集的设置时，这很有用。"""Reset iterator.This is useful when we want to modify settings of dataset while training."""# 通过调用 self._get_iterator() 方法 重新获取一个新的迭代器 ，从而重置数据加载器的状态。self.iterator = self._get_iterator()
# InfiniteDataLoader 是一个自定义的 DataLoader 类，通过以下方式实现了无限循环的数据加载功能。无限循环的采样器：在初始化时，将 DataLoader 的 batch_sampler 替换为 _RepeatSampler 包装器，从而实现无限循环的采样行为。迭代器管理：在 __iter__ 方法中，通过循环调用 next(self.iterator) ，实现无限循环的数据生成。提供了 reset 方法，用于重置迭代器的状态。资源清理：在 __del__ 方法中，强制终止所有工作线程并清理资源，避免线程泄漏。兼容性： __len__ 方法返回原始采样器的长度，确保与标准 DataLoader 的行为兼容。通过继承 DataLoader ，复用了其大部分功能，同时添加了无限循环的特性。这种设计特别适合需要无限循环数据加载的场景，例如在训练深度学习模型时，数据集需要被不断重复使用。

3.class _RepeatSampler:

# 这段代码定义了一个名为 _RepeatSampler 的类，它是一个简单的迭代器包装器，用于无限重复一个给定的采样器（ sampler ）。
# 定义了一个名为 _RepeatSampler 的类。从命名来看，它可能是一个辅助类（以单下划线开头的名称通常表示“受保护”的类或方法），用于重复采样器的行为。
class _RepeatSampler:# 永远重复的采样器。"""Sampler that repeats forever.Args:sampler (Dataset.sampler): The sampler to repeat."""# 定义了类的初始化方法 __init__ ，接收一个参数。# 1.sampler ：是一个可迭代对象（如生成器、列表或其他迭代器），它将被 _RepeatSampler 包装并无限重复。def __init__(self, sampler):# 初始化一个无限重复给定采样器的对象。"""Initializes an object that repeats a given sampler indefinitely."""# 将传入的 sampler 存储为类的实例属性 self.sampler ，以便后续使用。self.sampler = sampler# 定义了类的 __iter__ 方法，使 _RepeatSampler 成为一个可迭代对象。当调用 iter(_RepeatSampler) 或在 for 循环中使用 _RepeatSampler 时，会调用此方法。def __iter__(self):# 迭代‘采样器’并产生其内容。"""Iterates over the 'sampler' and yields its contents."""# 开始一个无限循环。这意味着 _RepeatSampler 会不断地重复 sampler 的行为，直到外部显式中断。while True:# iter(self.sampler) ：获取 sampler 的迭代器。# yield from ：将 sampler 的迭代器中的每个元素逐一生成。当 sampler 的迭代结束时， while True 循环会重新开始，从而实现无限重复。yield from iter(self.sampler)
# _RepeatSampler 是一个简单的迭代器包装器，其核心功能是将一个有限的采样器（ sampler ）转换为一个无限重复的迭代器。具体来说。输入： sampler 是一个可迭代对象，可以是生成器、列表或其他任何支持迭代的对象。行为： _RepeatSampler 使用 while True 实现无限循环。每次循环中，它通过 yield from 将 sampler 的元素逐一生成。当 sampler 的迭代结束时，循环会重新开始，从而实现无限重复。用途：这种设计通常用于需要无限重复数据采样的场景，例如在数据增强、循环训练或无限数据流的生成中。4. 特点： _RepeatSampler 是一个轻量级的包装器，不修改原始 sampler 的行为，只是无限重复其输出。它依赖于 sampler 的可迭代性，因此 sampler 必须是一个有效的可迭代对象。
# 示例用法 ：
# 假设有一个简单的采样器 ：
# sampler = [1, 2, 3]  # 一个简单的可迭代对象
# repeat_sampler = _RepeatSampler(sampler)
# for i, value in enumerate(repeat_sampler):
#     print(value)
#     if i >= 10:  # 手动中断，否则会无限打印
#         break
# 输出将是 ：
# 1
# 2
# 3
# 1
# 2
# 3
# 1
# 2
# 3
# 1
# 在这个例子中， _RepeatSampler 将 [1, 2, 3] 无限重复，直到手动中断。

4.def seed_worker(worker_id):

# 这段代码定义了一个名为 seed_worker 的函数，用于在多线程或多进程数据加载时为每个工作线程或进程设置随机种子。
# 定义了一个函数 seed_worker ，接收一个参数。
# 1.worker_id ：表示当前工作线程或进程的唯一标识。
# # noqa 是一个注释，通常用于告诉某些代码检查工具（如 flake8 ）忽略这一行的检查。
def seed_worker(worker_id):  # noqa# 设置数据加载器工作器种子 https://pytorch.org/docs/stable/notes/randomness.html#dataloader。"""Set dataloader worker seed https://pytorch.org/docs/stable/notes/randomness.html#dataloader."""# torch.initial_seed() ：获取当前 PyTorch 的初始随机种子。# % 2**32 ：将种子值限制在 0 到 2^32 - 1 的范围内。这是因为 NumPy 的随机种子需要是一个 32 位的整数。# worker_seed ：最终的随机种子值，用于后续的随机数生成。worker_seed = torch.initial_seed() % 2**32# 使用 worker_seed 设置 NumPy 的随机种子。这确保了在 NumPy 的随机操作中，每个工作线程或进程都会生成独立且可复现的随机数序列。np.random.seed(worker_seed)# 使用 worker_seed 设置 Python 标准库 random 模块的随机种子。这同样确保了在 random 模块的随机操作中，每个工作线程或进程的随机行为是独立且可复现的。random.seed(worker_seed)
# seed_worker 函数的作用是为多线程或多进程环境中的每个工作线程或进程设置独立的随机种子。它的主要功能包括。获取初始种子：通过 torch.initial_seed() 获取 PyTorch 的初始随机种子，并将其限制在 32 位整数范围内。设置 NumPy 和 Python 的随机种子：使用相同的种子值分别设置 NumPy 和 Python random 模块的随机种子。这确保了在多线程或多进程环境中，每个工作线程或进程的随机行为是独立的，并且可以通过相同的初始种子复现。用途：这种设计通常用于深度学习中的数据加载器（如 PyTorch 的 DataLoader ），尤其是在使用多进程加载数据时。通过为每个工作进程设置独立的随机种子，可以避免随机数生成的冲突，同时保证数据增强或其他随机操作的可复现性。

5.def build_yolo_dataset(cfg, img_path, batch, data, mode="train", rect=False, stride=32, multi_modal=False):

# 这段代码定义了一个名为 build_yolo_dataset 的函数，用于根据配置和输入参数构建 YOLO 数据集。
# 定义了一个函数 build_yolo_dataset ，接收以下参数 ：
# 1.cfg ：配置对象，包含数据集和训练的相关参数。
# 2.img_path ：图像路径。
# 3.batch ：批量大小。
# 4.data ：数据配置，可能包含类别信息等。
# 5.mode ：数据集模式，默认为 "train" ，表示训练模式。
# 6.rect ：是否使用矩形批次，默认为 False 。
# 7.stride ：模型的步幅，默认为 32 。
# 8.multi_modal ：是否使用多模态数据集，默认为 False 。
def build_yolo_dataset(cfg, img_path, batch, data, mode="train", rect=False, stride=32, multi_modal=False):# 构建 YOLO 数据集。"""Build YOLO Dataset."""# 根据 multi_modal 参数的值，选择使用 YOLOMultiModalDataset 或 YOLODataset 类。 如果 multi_modal 为 True ，则使用 YOLOMultiModalDataset （可能支持多模态输入，如图像和文本）。 否则，使用标准的 YOLODataset 。dataset = YOLOMultiModalDataset if multi_modal else YOLODataset# 调用选定的 dataset 类的构造函数，并传入一系列参数来初始化数据集。return dataset(# 将传入的 img_path 参数传递给数据集类，指定 图像路径 。img_path=img_path,# 从配置对象 cfg 中获取 imgsz 属性，并将其传递给数据集类，指定 图像大小 。imgsz=cfg.imgsz,# 将传入的 batch 参数传递给数据集类，指定 批量大小 。batch_size=batch,# 根据 mode 参数的值决定是否启用数据增强。 如果 mode 是 "train" ，则启用数据增强（ augment=True ）。 否则，禁用数据增强（ augment=False ）。augment=mode == "train",  # augmentation# 将 配置对象 cfg 传递给数据集类，作为超参数（ hyp ）。 注释中提到可能需要添加一个 get_hyps_from_cfg 函数来更清晰地提取超参数。hyp=cfg,  # TODO: probably add a get_hyps_from_cfg function    TODO：可能添加 get_hyps_from_cfg 函数。# 决定是否使用矩形批次。 如果 cfg.rect 为 True ，则启用矩形批次。 否则，检查传入的 rect 参数。rect=cfg.rect or rect,  # rectangular batches# 从配置对象 cfg 中获取 cache 属性，指定是否缓存数据。 如果 cfg.cache 未定义，则默认为 None 。cache=cfg.cache or None,# 从配置对象 cfg 中获取 single_cls 属性，指定是否为单类别训练。 如果 cfg.single_cls 未定义，则默认为 False 。single_cls=cfg.single_cls or False,# 将传入的 stride 参数转换为整数，并传递给数据集类，指定 模型的步幅 。stride=int(stride),# 根据 mode 参数的值设置填充比例。 如果是训练模式（ mode == "train" ），填充比例为 0.0 。 否则，填充比例为 0.5 。pad=0.0 if mode == "train" else 0.5,# 使用 colorstr 函数为日志输出添加颜色，并指定前缀为当前模式（如 "train: " 或 "val: " ）。prefix=colorstr(f"{mode}: "),# 从配置对象 cfg 中获取 task 属性，并传递给数据集类，指定 任务类型 。task=cfg.task,# 从配置对象 cfg 中获取 classes 属性，并传递给数据集类，指定 类别信息 。classes=cfg.classes,# 将传入的 data 参数传递给数据集类，可能包含 数据集的配置信息 。data=data,# 根据 mode 参数的值设置数据集的使用比例。 如果是训练模式，使用 cfg.fraction （可能用于指定训练数据的子集比例）。 否则，默认为 1.0 ，表示使用全部数据。fraction=cfg.fraction if mode == "train" else 1.0,)
# build_yolo_dataset 函数的作用是根据配置和输入参数动态构建 YOLO 数据集。其主要功能包括。动态选择数据集类：根据 multi_modal 参数的值，选择使用 YOLOMultiModalDataset 或 YOLODataset 。灵活配置数据集：支持多种模式（如训练模式和验证模式）。根据模式动态调整数据增强、填充比例和数据集使用比例。从配置对象 cfg 中提取多种参数，如图像大小、超参数、缓存设置等。可扩展性：函数通过参数化设计，支持不同的数据集配置和模式。提供了对多模态数据集的支持（通过 multi_modal 参数）。用途：该函数主要用于 YOLO 模型的训练和验证阶段，用于构建适合 YOLO 模型的数据集。通过灵活的参数配置，可以适应不同的训练需求，如单类别训练、矩形批次、数据缓存等。这种设计使得数据集的构建过程更加灵活和可配置，适合在多种场景下使用 YOLO 模型进行目标检测任务。

6.def build_grounding(cfg, img_path, json_file, batch, mode="train", rect=False, stride=32):

# 这段代码定义了一个名为 build_grounding 的函数，用于构建一个名为 GroundingDataset 的数据集。这个函数的结构与之前解释的 build_yolo_dataset 函数类似，但它是专门为“grounding”任务设计的，可能用于视觉-语言对齐或其他多模态任务。
# 定义了一个名为 build_grounding 的函数，接收以下参数 ：
# 1.cfg ：配置对象，包含数据集和训练的相关参数。
# 2.img_path ：图像路径。
# 3.json_file ：JSON 文件路径，可能包含标注信息或其他元数据。
# 4.batch ：批量大小。
# 5.mode ：数据集模式，默认为 "train" ，表示训练模式。
# 6.rect ：是否使用矩形批次，默认为 False 。
# 7.stride ：模型的步幅，默认为 32 。
def build_grounding(cfg, img_path, json_file, batch, mode="train", rect=False, stride=32):# 构建 YOLO 数据集。"""Build YOLO Dataset."""# 调用 GroundingDataset 类的构造函数，并传入一系列参数来初始化数据集。 GroundingDataset 是一个专门用于 grounding 任务的数据集类。return GroundingDataset(# 将传入的 img_path 参数传递给数据集类，指定 图像路径 。img_path=img_path,# 将传入的 json_file 参数传递给数据集类，指定 JSON 文件路径 。这个文件可能包含标注信息或其他元数据。json_file=json_file,# 从配置对象 cfg 中获取 imgsz 属性，并将其传递给数据集类，指定 图像大小 。imgsz=cfg.imgsz,# 将传入的 batch 参数传递给数据集类，指定 批量大小 。batch_size=batch,# 根据 mode 参数的值决定是否启用数据增强。 如果 mode 是 "train" ，则启用数据增强（ augment=True ）。 否则，禁用数据增强（ augment=False ）。augment=mode == "train",  # augmentation# 将 配置对象 cfg 传递给数据集类，作为超参数（ hyp ）。 注释中提到可能需要添加一个 get_hyps_from_cfg 函数来更清晰地提取超参数。hyp=cfg,  # TODO: probably add a get_hyps_from_cfg function# 决定是否使用矩形批次。 如果 cfg.rect 为 True ，则启用矩形批次。 否则，检查传入的 rect 参数。rect=cfg.rect or rect,  # rectangular batches# 从配置对象 cfg 中获取 cache 属性，指定是否缓存数据。 如果 cfg.cache 未定义，则默认为 None 。cache=cfg.cache or None,# 从配置对象 cfg 中获取 single_cls 属性，指定是否为单类别训练。 如果 cfg.single_cls 未定义，则默认为 False 。single_cls=cfg.single_cls or False,# 将传入的 stride 参数转换为整数，并传递给数据集类，指定 模型的步幅 。stride=int(stride),# 根据 mode 参数的值设置 填充比例 。 如果是训练模式（ mode == "train" ），填充比例为 0.0 。 否则，填充比例为 0.5 。pad=0.0 if mode == "train" else 0.5,# 使用 colorstr 函数为日志输出添加颜色，并指定前缀为当前模式（如 "train: " 或 "val: " ）。prefix=colorstr(f"{mode}: "),# 从配置对象 cfg 中获取 task 属性，并传递给数据集类， 指定任务类型 。task=cfg.task,# 从配置对象 cfg 中获取 classes 属性，并传递给数据集类，指定 类别信息 。classes=cfg.classes,# 根据 mode 参数的值设置数据集的使用比例。 如果是训练模式，使用 cfg.fraction （用于指定训练数据的子集比例）。 否则，默认为 1.0 ，表示使用全部数据。fraction=cfg.fraction if mode == "train" else 1.0,)
# build_grounding 函数的作用是根据配置和输入参数动态构建一个名为 GroundingDataset 的数据集，可能用于视觉-语言对齐或其他多模态任务。其主要功能包括。动态配置数据集：支持多种模式（如训练模式和验证模式）。根据模式动态调整数据增强、填充比例和数据集使用比例。从配置对象 cfg 中提取多种参数，如图像大小、超参数、缓存设置等。多模态数据支持：除了图像路径，还支持 JSON 文件路径，可能用于存储标注信息或其他元数据。可扩展性：函数通过参数化设计，支持不同的数据集配置和模式。提供了对矩形批次和数据缓存的支持。用途：该函数主要用于 grounding 任务，可能涉及视觉和语言的结合，例如视觉问答（VQA）、视觉定位或视觉-语言对齐任务。通过灵活的参数配置，可以适应不同的训练需求，如单类别训练、矩形批次、数据缓存等。这种设计使得数据集的构建过程更加灵活和可配置，适合在多种场景下使用 grounding 模型进行多模态任务。

7.def build_dataloader(dataset, batch, workers, shuffle=True, rank=-1):

# 这段代码定义了一个名为 build_dataloader 的函数，用于根据输入参数构建一个适合训练或验证的数据加载器（ DataLoader ）。函数的核心功能是根据环境配置和需求，动态调整数据加载器的参数，并支持分布式训练和无限循环加载数据。
# 定义了一个名为 build_dataloader 的函数，接收以下参数 ：
# 1.dataset ：数据集对象，用于加载数据。
# 2.batch ：批量大小。
# 3.workers ：工作线程数，用于并行加载数据。
# 4.shuffle ：是否打乱数据，默认为 True 。
# 5.rank ：分布式训练中的进程排名，默认为 -1 （表示非分布式训练）。
def build_dataloader(dataset, batch, workers, shuffle=True, rank=-1):# 返回用于训练或验证集的 InfiniteDataLoader 或 DataLoader。"""Return an InfiniteDataLoader or DataLoader for training or validation set."""# 将 批量大小 batch 限制为数据集长度 len(dataset) 的最小值，避免批量大小超过数据集的总样本数。batch = min(batch, len(dataset))# 通过 torch.cuda.device_count() 获取可用的 CUDA 设备数量（GPU 数量），并存储在变量 nd 中。nd = torch.cuda.device_count()  # number of CUDA devices# 计算 实际使用的 工作线程数 nw 。# os.cpu_count() 获取系统的 CPU 核心数。# max(nd, 1) 确保至少有一个设备（GPU 或 CPU）。# os.cpu_count() // max(nd, 1) 计算每个设备分配的 CPU 核心数。# 最终， nw 的值是上述计算结果与用户指定的 workers 的最小值。nw = min(os.cpu_count() // max(nd, 1), workers)  # number of workers# 根据 rank 的值决定是否使用分布式采样器。 如果 rank == -1 （非分布式训练）， sampler 为 None 。 否则，使用 torch.utils.data.distributed.DistributedSampler ，并根据 shuffle 参数决定是否打乱数据。sampler = None if rank == -1 else distributed.DistributedSampler(dataset, shuffle=shuffle)# 创建一个 PyTorch 的 随机数生成器 generator ，用于控制数据加载器的随机行为。generator = torch.Generator()# 为随机数生成器 设置种子值 ，确保随机行为的可复现性。 6148914691236517205 是一个固定的种子值。 RANK 是当前进程的排名（可能来自分布式训练环境），确保每个进程的随机行为独立。generator.manual_seed(6148914691236517205 + RANK)# 返回一个 InfiniteDataLoader 对象，用于支持无限循环的数据加载。return InfiniteDataLoader(# 将传入的 dataset 对象传递给 InfiniteDataLoader 。dataset=dataset,# 将 批量大小 batch 传递给 InfiniteDataLoader 。batch_size=batch,# 决定是否在数据加载器中启用数据打乱。 如果 shuffle=True 且 sampler=None （非分布式训练），则启用数据打乱。 否则，禁用数据打乱（分布式训练中由 DistributedSampler 控制）。shuffle=shuffle and sampler is None,# 将计算得到的 工作线程数 nw 传递给 InfiniteDataLoader 。num_workers=nw,# 将 采样器 sampler 传递给 InfiniteDataLoader 。sampler=sampler,# 将 PIN_MEMORY 参数传递给 InfiniteDataLoader ，控制 是否使用内存锁定 （ pin_memory ）。 PIN_MEMORY 是一个全局变量，通常在代码其他地方定义。# PIN_MEMORY -> 用于控制数据加载器是否启用内存锁定（pin memory）。pin_memory=PIN_MEMORY,# 从数据集对象中获取 collate_fn 方法（如果存在）。 collate_fn 用于将多个样本组合成一个批次。 如果数据集没有定义 collate_fn ，则默认为 None 。collate_fn=getattr(dataset, "collate_fn", None),# 将 seed_worker 函数设置为工作线程的初始化函数，用于 为每个工作线程设置独立的随机种子 。worker_init_fn=seed_worker,# 将随机数生成器 generator 传递给 InfiniteDataLoader ，用于 控制数据加载的随机行为 。generator=generator,)
# build_dataloader 函数的作用是根据输入参数动态构建一个适合训练或验证的数据加载器（ InfiniteDataLoader ）。其主要功能包括。动态调整参数：根据数据集大小和可用设备数量（CPU/GPU）动态调整批量大小和工作线程数。支持分布式训练，通过 DistributedSampler 控制数据分发。随机行为控制：使用随机数生成器 generator 和种子值确保数据加载的随机行为可复现。为每个工作线程设置独立的随机种子，避免随机数生成冲突。支持无限循环加载：返回的是 InfiniteDataLoader ，支持无限循环的数据加载，适合需要重复使用数据集的训练场景。灵活配置：支持自定义 collate_fn 方法，用于处理数据批次的组合。根据是否启用分布式训练动态调整数据打乱行为。用途：该函数适用于深度学习任务中的数据加载，尤其是在训练和验证阶段。通过灵活的参数配置，可以适应不同的硬件环境和训练需求。这种设计使得数据加载器的构建过程更加灵活和可扩展，适合在多种场景下使用，尤其是在分布式训练和无限循环加载数据的需求中。# 在深度学习中，内存锁定（ pin_memory ） 是一个与数据加载和 GPU 加速相关的重要概念。它主要用于优化数据从 CPU 内存传输到 GPU 内存的过程。
# 内存锁定的作用 ：内存锁定（ pin_memory=True ）的作用是将数据存储在**页锁定内存（Pinned Memory）**中，而不是普通的 CPU 内存。页锁定内存是一种特殊的内存区域，它不会被操作系统交换到磁盘（即不会被“交换”或“分页”），并且可以直接被 GPU 访问。
# 为什么需要内存锁定？
# 提高数据传输速度 ：当数据存储在普通 CPU 内存中时，操作系统可能会将内存中的数据交换到磁盘，这会导致数据访问延迟增加。 而页锁定内存（Pinned Memory）不会被交换到磁盘，因此可以更快地被 GPU 访问。
# 零拷贝传输 ：使用页锁定内存时，数据可以直接从 CPU 内存传输到 GPU 内存，而不需要中间的拷贝操作。这种传输方式被称为零拷贝（Zero-Copy）。 零拷贝可以显著减少数据传输的时间和资源消耗。
# 减少 CPU 和 GPU 之间的同步开销 ：当数据存储在页锁定内存中时，GPU 可以更高效地从 CPU 内存中读取数据，从而减少 CPU 和 GPU 之间的同步等待时间。
# 在 PyTorch 中的应用 ：
# 在 PyTorch 中， pin_memory 是 DataLoader 的一个参数。当设置 pin_memory=True 时， DataLoader 会将数据加载到页锁定内存中，从而加速数据从 CPU 到 GPU 的传输。
# from torch.utils.data import DataLoader
# dataloader = DataLoader(
#     dataset=my_dataset,
#     batch_size=32,
#     shuffle=True,
#     pin_memory=True,  # 启用内存锁定
#     num_workers=4
# )
# 注意事项 ：
# 仅适用于 GPU 训练 ：内存锁定（ pin_memory ）仅在使用 GPU 进行训练时有效。如果仅使用 CPU 训练，启用 pin_memory 不会有任何效果。
# 内存占用增加 ：使用页锁定内存会增加 CPU 内存的占用量，因为它会锁定一部分内存，防止操作系统将其交换到磁盘。如果系统内存不足，可能会导致性能下降。
# 最佳实践 ：在 GPU 资源充足且系统内存足够的情况下，启用 pin_memory 可以显著提高数据加载效率。 如果系统内存有限，建议谨慎使用 pin_memory ，或者减少 num_workers 的数量以降低内存占用。
# 总结 ：内存锁定（ pin_memory ）是一种优化技术，通过将数据存储在页锁定内存中，可以加速数据从 CPU 内存传输到 GPU 内存的过程。它特别适用于 GPU 训练场景，能够显著提高数据加载效率，减少 CPU 和 GPU 之间的同步开销。然而，它也会增加内存占用，因此需要根据实际硬件配置和需求进行合理使用。

8.def check_source(source):

# 这段代码定义了一个名为 check_source 的函数，用于检查和处理输入的图像或视频源，并根据输入类型返回相应的标志和处理后的数据源。
# 定义了一个函数 check_source ，接收一个参数。
# 1.source ：表示输入的图像或视频源。
def check_source(source):# 检查源类型并返回相应的标志值。"""Check source type and return corresponding flag values."""# 初始化了五个布尔变量，分别用于 标记输入源的类型 。# webcam ：是否为摄像头输入。# screenshot ：是否为屏幕截图。# from_img ：是否为图像文件或图像数据。# in_memory ：是否为内存中的数据（如加载器返回的数据）。# tensor ：是否为 PyTorch 张量。webcam, screenshot, from_img, in_memory, tensor = False, False, False, False, False# 判断输入 source 是否为字符串、整数或 Path 对象。 字符串或 Path 对象通常表示文件路径或 URL。 整数通常表示本地 USB 摄像头的设备索引。if isinstance(source, (str, int, Path)):  # int for local usb camera# 将 source 转换为字符串，以便后续处理。source = str(source)# 判断 source 是否为图像或视频文件。 Path(source).suffix[1:] 获取文件扩展名（去掉点号）。 IMG_FORMATS | VID_FORMATS 是一个集合，包含支持的图像和视频格式。 如果文件扩展名在支持的格式中，则 is_file 为 True 。is_file = Path(source).suffix[1:] in (IMG_FORMATS | VID_FORMATS)# 判断 source 是否为 URL（支持的协议包括 HTTP、HTTPS、RTSP、RTMP 和 TCP）。is_url = source.lower().startswith(("https://", "http://", "rtsp://", "rtmp://", "tcp://"))# 判断 source 是否为摄像头输入。# 如果 source 是数字（表示摄像头索引），则 webcam 为 True 。# 如果 source 以 .streams 结尾（表示流媒体输入），则 webcam 为 True 。# 如果 source 是 URL 且不是文件，则 webcam 为 True 。webcam = source.isnumeric() or source.endswith(".streams") or (is_url and not is_file)# 判断 source 是否为屏幕截图模式（ source 为 "screen" ）。screenshot = source.lower() == "screen"# 如果 source 是 URL 且是文件（如在线视频或图像文件），调用 check_file 函数下载文件。if is_url and is_file:# def check_file(file, suffix="", download=True, download_dir=".", hard=True):# -> 用于检查文件是否存在，如果不存在则尝试下载文件，并返回文件的路径。直接返回 file 。返回下载后的文件路径，将其转换为字符串形式。如果找到文件，返回第一个匹配的文件路径。 如果未找到文件，返回空列表 [] 。# -> return file / return str(file) / return files[0] if len(files) else []  # return filesource = check_file(source)  # download# 判断 source 是否为 LOADERS 类型（ LOADERS 是一个元组，包含加载器类）。 如果是，则标记为 in_memory ，表示 数据已在内存中 。elif isinstance(source, LOADERS):# 设置 in_memory 为 True 。in_memory = True# 判断 source 是否为列表或元组。elif isinstance(source, (list, tuple)):# 调用 autocast_list 函数，将列表中的所有元素转换为 PIL 图像对象或 NumPy 数组。# def autocast_list(source): -> 将输入的图像源列表转换为统一的图像对象格式，以便后续处理。函数返回 files 列表，其中包含 所有转换后的图像对象 。 -> return filessource = autocast_list(source)  # convert all list elements to PIL or np arrays# 设置 from_img 为 True ，表示 输入为图像数据 。from_img = True# 判断 source 是否为 PIL 图像对象或 NumPy 数组。elif isinstance(source, (Image.Image, np.ndarray)):# 设置 from_img 为 True 。from_img = True# 判断 source 是否为 PyTorch 张量。elif isinstance(source, torch.Tensor):# 设置 tensor 为 True 。tensor = True# 如果 source 不属于上述任何类型，则进入 else 分支。else:# 抛出 TypeError 异常，提示用户输入类型不支持，并建议查阅相关文档。raise TypeError("Unsupported image type. For supported types see https://docs.ultralytics.com/modes/predict")    # 不支持的图像类型。有关支持的类型，请参阅 https://docs.ultralytics.com/modes/predict 。# 返回处理后的 source 和各个标志变量。return source, webcam, screenshot, from_img, in_memory, tensor
# check_source 函数的作用是检查输入的图像或视频源，并根据输入类型返回相应的标志和处理后的数据源。其主要功能包括。支持多种输入类型：文件路径（图像或视频）。URL（在线图像或视频）。摄像头输入（本地 USB 摄像头或流媒体）。屏幕截图模式。内存中的数据（如加载器返回的数据）。PIL 图像对象、NumPy 数组或 PyTorch 张量。自动处理输入：如果输入是 URL 且是文件，会调用 check_file 函数下载文件。如果输入是列表或元组，会调用 autocast_list 函数将元素转换为统一的图像格式。返回标志变量：根据输入类型返回布尔标志（如 webcam 、 screenshot 、 from_img 等），便于后续处理。异常处理：如果输入类型不支持，会抛出异常并提示用户。这种设计使得函数能够灵活处理多种输入源，适用于多种场景，如图像处理、视频流处理或实时摄像头输入。

9.def load_inference_source(source=None, batch=1, vid_stride=1, buffer=False):

# 这段代码定义了一个名为 load_inference_source 的函数，用于根据输入的图像或视频源加载数据，并返回一个适合推理（inference）的数据集对象。
# 定义了一个函数 load_inference_source ，接收以下参数 ：
# 1.source ：输入的图像或视频源，默认为 None 。
# 2.batch ：批量大小，默认为 1 。
# 3.vid_stride ：视频帧的采样间隔，默认为 1 （即每帧都采样）。
# 4.buffer ：是否使用缓冲区，用于流媒体输入，默认为 False 。
def load_inference_source(source=None, batch=1, vid_stride=1, buffer=False):# 加载用于对象检测的推理源并应用必要的转换。"""Loads an inference source for object detection and applies necessary transformations.Args:source (str, Path, Tensor, PIL.Image, np.ndarray): The input source for inference.batch (int, optional): Batch size for dataloaders. Default is 1.vid_stride (int, optional): The frame interval for video sources. Default is 1.buffer (bool, optional): Determined whether stream frames will be buffered. Default is False.Returns:dataset (Dataset): A dataset object for the specified input source."""# 调用 check_source 函数，对输入的 source 进行检查，并获取以下返回值 ：# source ：处理后的输入源。# stream ：布尔值，表示 是否为流媒体输入 （如摄像头或视频流）。# screenshot ：布尔值，表示 是否为屏幕截图 。# from_img ：布尔值，表示 是否为图像文件或图像数据 。# in_memory ：布尔值，表示 输入是否已经加载到内存中 。# tensor ：布尔值，表示 输入是否为 PyTorch 张量 。source, stream, screenshot, from_img, in_memory, tensor = check_source(source)# 根据输入源的类型，确定 source_type 。# 如果 in_memory 为 True ，则直接从 source 中获取 source_type 。# 否则，通过 SourceTypes 枚举类（或类似结构）根据 stream 、 screenshot 、 from_img 和 tensor 的值确定 source_type 。source_type = source.source_type if in_memory else SourceTypes(stream, screenshot, from_img, tensor)# Dataloader    这是一个注释，表示接下来的代码用于选择合适的 数据加载器 （ dataset ）。# 如果输入是 PyTorch 张量（ tensor=True ），则使用 LoadTensor 类加载数据。if tensor:dataset = LoadTensor(source)# 如果输入已经加载到内存中（ in_memory=True ），则直接将 source 作为数据集对象。elif in_memory:dataset = source# 如果输入是流媒体（ stream=True ），则使用 LoadStreams 类加载数据，并根据 vid_stride 和 buffer 参数配置视频帧的采样间隔和缓冲区。elif stream:dataset = LoadStreams(source, vid_stride=vid_stride, buffer=buffer)# 如果输入是屏幕截图（ screenshot=True ），则使用 LoadScreenshots 类加载数据。elif screenshot:dataset = LoadScreenshots(source)# 如果输入是图像文件或图像数据（ from_img=True ），则使用 LoadPilAndNumpy 类加载数据。elif from_img:dataset = LoadPilAndNumpy(source)# 如果输入是其他类型的图像或视频文件，则使用 LoadImagesAndVideos 类加载数据，并根据 batch 和 vid_stride 参数配置批量大小和视频帧的采样间隔。else:dataset = LoadImagesAndVideos(source, batch=batch, vid_stride=vid_stride)# Attach source types to the dataset    这是一个注释，表示接下来的代码将 source_type 附加到数据集对象上。# 使用 setattr 函数，将 source_type 作为属性附加到 dataset 对象上，以便后续使用。setattr(dataset, "source_type", source_type)# 返回构建好的数据集对象 dataset 。return dataset
# load_inference_source 函数的作用是根据输入的图像或视频源加载数据，并返回一个适合推理（inference）的数据集对象。其主要功能包括。输入源检查：调用 check_source 函数，对输入源进行检查，并获取输入源的类型标志（如是否为流媒体、屏幕截图、图像文件等）。动态选择数据加载器：根据输入源的类型，选择合适的数据加载器类（如 LoadTensor 、 LoadStreams 、 LoadScreenshots 、 LoadPilAndNumpy 或 LoadImagesAndVideos ）。配置数据加载器的参数（如批量大小、视频帧采样间隔、缓冲区等）。附加输入源类型：将输入源的类型（ source_type ）附加到数据集对象上，便于后续处理。灵活性和扩展性：支持多种输入源类型，包括图像文件、视频文件、流媒体、屏幕截图和 PyTorch 张量。支持自定义批量大小和视频帧采样间隔。用途：该函数适用于推理阶段，用于加载和处理输入数据，使其适合模型推理。通过动态选择数据加载器，可以适应多种输入场景，如实时摄像头输入、屏幕截图或本地文件。这种设计使得函数能够灵活处理多种输入源，适用于多种推理场景，如目标检测、图像分类或视频分析。

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-build.py

build.py ultralytics\data\build.py 目录 build.py 1.所需的库和模块 2.class InfiniteDataLoader(dataloader.DataLoader): 3.class _RepeatSampler: 4.def seed_worker(worker_id): 5.def build_yolo_dataset(cfg, img_path, batch, data, mode"train"…...

编程日记 2025/9/19 6:20:21

智能体（AI Agent、Deepseek、硅基流动）落地实践Demo——借助大模型生成报表，推动AI赋能企业决策

文章目录一、引言二、系统设计与技术细节2.1 系统架构2.2 核心组件说明三、 Demo 代码推荐博客： 四、输出年度营销报告1. 总销售额根据提供的数据，年度总销售额为：740.0。2. 各产品销售额3. 各地区销售额4. 各产品在各地区的销售情况分…...

编程日记 2025/9/17 15:24:44

mac os设置jdk版本

打开环境变量配置文件 sudo vim ~/.bash_profile 设置不同的jdk版本路径 # 设置JAVA_HOME为jdk17路径 export JAVA_HOME$(/usr/libexec/java_home -v 17)# 设置JAVA_HOME为jdk8路径 export JAVA_HOME$(/usr/libexec/java_home -v 1.8) 设置环境变量 # 将jdk加入到环境变量…...

编程日记 2025/9/18 22:31:17

Llama 3.1 本地电脑部署 Linux系统【轻松简易】

本文分享在自己的本地电脑部署 llama3.1，而且轻松简易，快速上手。这里借助Ollama工具，在Linux系统中进行大模型部署~ Llama3.1，有三个版本：8B、70B、405B Llama 3.1 405B 是第一个公开可用的模型，在常识…...

编程日记 2025/9/16 14:33:53

计算机网络安全之一:网络安全概述

1.1 网络安全的内涵随着计算机和网络技术的迅猛发展和广泛普及，越来越多的企业将经营的各种业务建立在Internet/Intranet环境中。于是，支持E-mail、文件共享、即时消息传送的消息和协作服务器成为当今商业社会中的极重要的IT基础设施。然而&#xff0…...

编程日记 2025/9/18 11:01:44

docker 部署JAR

docker pull openjdk:23 使用Docker运行生成的JAR包是一个将应用程序容器化的好方法，它确保了你的应用可以在任何安装了Docker的环境中以相同的方式运行。以下是创建一个Docker镜像并运行包含你Java应用程序的JAR包的基本步骤。1. 准备 Dockerfile首先，在…...

编程日记 2025/9/16 14:33:49

深研究：与Dify建立研究自动化应用

许多个人和团队面临筛选各种网页或内部文档的挑战，以全面概述一个主题。那么在这里我推荐大家使用Dify，它是一个用于LLM应用程序开发的低代码，开源平台，它通过自动化工作流程的多步搜索和有效汇总来解决此问题，仅需要最小的编码。在本文中，我们将创建“ Deepresearch”…...

编程日记 2025/9/16 14:33:47

第1章:LangChain4j的聊天与语言模型

LangChain4J官方文档翻译与解析目标文档路径: https://docs.langchain4j.dev/tutorials/chat-and-language-models/ 语言模型的两种API类型 LangChain4j支持两种语言模型（LLM）的API： LanguageModel：这种API非常简单，…...

编程日记 2025/9/14 10:43:21

IPv6报头40字节具体怎么分配的？

目录 IPv6报头结构字段详解示例代码：IPv6报头的Python实现输出示例 IPv6协议是为了解决IPv4地址耗尽问题而设计的下一代互联网协议。与IPv4相比，IPv6不仅提供了更大的地址空间，还简化了报头结构，提高了网络设备的处理效率。…...

编程日记 2025/9/16 14:33:46

Ubuntu ARM / aarch64 CPU 镜像下载：如何在 ARM 设备上安装和使用 Ubuntu

随着 ARM 架构的逐渐普及，尤其是在移动设备和高效能计算设备中的应用，许多开发者和用户开始关注基于 ARM 架构的操作系统。Ubuntu 作为一款广泛使用的 Linux 发行版，自然也为 ARM 架构提供了优化的版本。本文将详细介绍如何下载适用于 ARM / …...

编程日记 2025/9/16 5:17:50

图论入门算法:拓扑排序(C++)

上文中我们了解了图的遍历(DFS/BFS), 本节我们来学习拓扑排序. 在图论中, 拓扑排序(Topological Sorting)是对一个有向无环图(Directed Acyclic Graph, DAG)的所有顶点进行排序的一种算法, 使得如果存在一条从顶点 u 到顶点 v 的有向边 (u, v) , 那么在排序后的序列中, u 一定…...

编程日记 2025/9/16 14:33:42

MySQL中count(1)和count(*) 的区别

MySQL中count(1)和count(*) 的区别在 MySQL 中，COUNT(1) 和 COUNT(*) 均用于统计查询结果中的行数，但它们在语义及其背后的机制上有一些区别。基本功能 COUNT(*)：统计表中所有行的数量，无论列是否为 NULL。 COUNT(1)&#xf…...

编程日记 2025/9/16 14:33:41

Android 14输入系统架构分析：图解源码从驱动层到应用层的完整传递链路

一、资料快车 1、深入了解Android输入系统：https://blog.csdn.net/innost/article/details/47660387 2、书籍 - Android系统源代码情景分析二、Perface 1、参考： 2、系统程序分析方法 1）加入log，并跟着log一步步分析 -logc…...

编程日记 2025/9/16 7:59:26

Web入侵实战分析-常见web攻击类应急处置实验2

场景说明某天运维人员，发现运维的公司站点被黑页，首页标题被篡改，你获得的信息如下： 操作系统：windows server 2008 R2业务：公司官网网站架构：通过phpstudy运行apache mysqlphp开放端口&…...

编程日记 2025/9/16 14:33:37

Jenkins 配置 Credentials 凭证

Jenkins 配置 Credentials 凭证一、创建凭证 Dashboard -> Manage Jenkins -> Manage Credentials 在 Domain 列随便点击一个 (global) 二、添加凭证点击左侧 Add Credentials 四、填写凭证 Kind：凭证类型 Username with password： 配置用…...

编程日记 2025/9/16 14:33:36

Android Http-server 本地 web 服务

时间：2025年2月16日地点：深圳.前海湾需求我们都知道 webview 可加载 URI，他有自己的协议 scheme： content:// 标识数据由 Content Provider 管理file:// 本地文件 http:// 网络资源特别的，如果你想直接…...

编程日记 2025/9/19 5:44:46

selenium爬取苏宁易购平台某产品的评论

目录 selenium的介绍 1、 selenium是什么？ 2、selenium的工作原理 3、如何使用selenium？ webdriver浏览器驱动设置关键步骤代码运行结果注意事项 selenium的介绍 1、 selenium是什么？ 用于Web应用程序测试的工具。可以驱动浏览…...

编程日记 2025/9/16 14:33:32

Linux中POSIX应用场景

Linux 提供了丰富的 POSIX（Portable Operating System Interface）标准接口，这些接口可以帮助开发者编写可移植、高效的应用程序。POSIX 标准定义了一系列系统调用和库函数，涵盖了文件操作、进程管理、线程管理、信号处理、同步机制…...

编程日记 2025/9/14 4:17:41

Boringssl介绍

BoringSSL 是 Google 从 OpenSSL 分支出来的一个开源 TLS/SSL 库，旨在为 Google 的产品和服务提供一个更加轻量、安全和现代化的加密库。它是 OpenSSL 的一个替代品，专注于简化代码、提高安全性和减少潜在的攻击面。以下是对 BoringSSL 的详细介绍&…...

编程日记 2025/9/16 13:37:27

react实例与总结(二)

目录一、脚手架基础语法(16~17) 1.1、hello react 1.2、组件样式隔离(样式模块化) 1.3、react插件二、React Router v5 2.1、react-router-dom相关API 2.1.1、内置组件 2.1.1.1、BrowserRouter 2.1.1.2、HashRouter 2.1.1.3、Route 2.1.1.4、Redirect 2.1.1.5、L…...

编程日记 2025/9/16 13:37:25

僵尸进程、孤儿进程

一、僵尸进程、孤儿进程僵尸进程、孤儿进程 1、僵尸进程： （1）定义：子进程死了（内存、打开的文件等都释放了），但没有完全死（数据结构<包含进程ID，进程状态、运行时…...

编程日记 2025/9/16 13:37:24

快速入门Springboot+vue——MybatisPlus多表查询及分页查询

学习自哔哩哔哩上的“刘老师教编程”，具体学习的网站为：7.MybatisPlus多表查询及分页查询_哔哩哔哩_bilibili，以下是看课后做的笔记，仅供参考。多表查询多表查询[Mybatis中的]：实现复杂关系映射，可以使…...

编程日记 2025/9/16 13:37:22

redis解决高并发看门狗策略

当一个业务执行时间超过自己设定的锁释放时间，那么会导致有其他线程进入，从而抢到同一个票,所有需要使用看门狗策略，其实就是开一个守护线程，让守护线程去监控key，如果到时间了还未结束，就会将这个key重新s…...

编程日记 2025/9/19 1:37:52

深入解析 MySQL 8 C++ 源码：二级索引回表操作

在数据库系统中，索引是优化查询性能的关键技术之一。MySQL 的 InnoDB 存储引擎支持多种索引类型，其中二级索引（非聚簇索引）和聚簇索引（主键索引）是最常见的两种。然而，由于二级索引的叶子节点只…...

编程日记 2025/9/16 13:37:18

MySQL如何解决幻读？

目录一、什么是幻读？ 1.1 幻读的定义 1.2 幻读的示例 1.3 幻读产生的原因？ 1.4?读已提交（Read Committed） 1.4.1 确定事务等级 1.4.2 非锁定读取准备示例结论 1.4.3 锁定读取准备示例分析结论 1.5?可重…...

编程日记 2025/9/16 13:37:16

RabbitMQ的脑裂（网络分区）问题

问题描述： Mnesia reports that this RabbitMQ cluster has experienced a network partition. There is a risk of losing data 一、什么是MQ脑裂？ 网络分区如果另一个节点在一段时间内（默认为 60 秒）无法与其联系&#xff0…...

编程日记 2025/9/17 16:09:15

【网络安全 | 漏洞挖掘】价值$40000：从路径遍历升级至RCE

未经许可，不得转载。文章目录路径遍历RCE路径遍历在进行目标侦查和端口扫描时，我发现了一个使用 8443 端口的子域名：http://admin.target.com:8443。许多人可能会忽略返回 404 的子域名，但我并没有。对 http://admin.target.com:8443/FUZZ 进行模糊测试时，我发现了一…...

编程日记 2025/9/16 13:37:13

程函方程的详细推导

以下是基于非均匀介质弹性波方程（无纵波假设）推导程函方程的详细过程，完整考虑纵波（P 波）和横波（S 波）的耦合效应：...

编程日记 2025/9/16 13:37:11

AD(Altium Designer)三种方法导入图片

目录 1、脚本方式导入图片 1.1 准备脚本文件和导入图片 1.2 运行脚本 1.3 导入文件 1.4 选中文件 2.5 运行 2.6 导入图片 2.7 选择图片 2.8 转换 2.9 退出 2.10 联合 2.11 确认 2.12 调整大小 2.13 复制 2.14 粘贴 2、图片直接导入图片 2.1点击放置 2.2 图片…...

编程日记 2025/9/16 13:37:09

fpga助教面试题

第一题 module sfp_pwm( input wire clk, //clk is 200M input wire rst_n, input wire clk_10M_i, input wire PPS_i, output reg pwm ) reg [6:0] cunt ;always (posedge clk ) beginif(!rst_n)cunt<0;else if(cunt19) //200M是10M的20倍cunt<0;elsecunt<cunt1;…...

编程日记 2025/9/16 13:37:07

问题记录汇总

记录一些问题如何分析错误帧问题-CSDN博客...

编程日记 2025/9/4 5:22:27

安全问答—安全的基本架构

前言将一些安全相关的问答进行整理汇总和陈述，形成一些以问答呈现的东西，加入一些自己的理解，欢迎路过的各位大佬进行讨论和论述。很多内容都会从甲方的安全认知去进行阐述。 1.安全存在的目的？ 为了支持组织的目标、使命和宗…...

编程日记 2025/9/12 18:20:04

玩客云 IP查找

1.玩客云使用静态IP在不同网段路由器下不能使用，动态不好找IP地址 1.1使用python3 实现自动获取发送 import requests import os import socket# 从环境变量获取 PushPlus 的 token 和群组编码 PUSH_PLUS_TOKEN os.getenv("PUSH_PLUS_TOKEN") PUSH_PLU…...

编程日记 2025/9/15 0:33:32

鸿蒙与跨端迁移的重要性

鸿蒙操作系统（HarmonyOS）是由华为公司开发的一款面向未来的全场景分布式操作系统。它旨在提供一个统一的平台，支持各种设备之间的无缝协作和数据共享，从而为用户提供更加连贯和高效的体验。在鸿蒙的生态系统中，跨端迁移…...

编程日记 2025/9/19 0:20:47

MATLAB学习之旅：从入门到基础实践

在当今科技飞速发展的时代，MATLAB作为一款强大的数学软件，犹如一把神奇的钥匙，能够打开众多领域的大门。无论是工程计算、数据分析，还是算法开发、可视化呈现，MATLAB都展现出了无与伦比的魅力。今天，就让我们踏上这段奇妙的MATLAB学习之旅，从最基础的部分开始，逐步探索…...

编程日记 2025/9/15 15:45:41

【队列】循环队列（Circular Queue）详解

文章目录一、循环队列简介二、循环队列的判空和判满三、循环队列的实现leetcode 622. 设计循环队列一、循环队列简介在实际开发中，队列是一种常用的数据结构，而循环队列（Circular Queue）则一般是一种基于数组实现的队列&#x…...

编程日记 2025/9/13 11:18:37

Spring-GPT智谱清言AI项目(附源码)

一、项目介绍本项目是Spring AI第三方调用整合智谱请言（官网是：https://open.bigmodel.cn）的案例，回答响应流式输出显示，这里使用的是免费模型，需要其他模型可以去 https://www.bigmodel.cn/pricing 切换…...

编程日记 2025/9/8 8:20:53

【JavaEE进阶】MyBatis入门

目录 🌴前言 🌲什么是MyBatis? 🌳准备工作 🚩创建工程 🚩配置数据库连接字符串 🚩数据准备 🚩编写持久层代码 🍃单元测试 🌴前言在应⽤分层学习时,我们了解到…...

编程日记 2025/9/16 4:55:06

网络安全:防范NetBIOS漏洞的攻击

稍微懂点电脑知识的朋友都知道，NetBIOS 是计算机局域网领域流行的一种传输方式，但你是否还知道，对于连接互联网的机器来讲，NetBIOS是一大隐患。漏洞描述 NetBIOS(Network Basic Input Output System，网络基本输入输…...

编程日记 2025/9/15 13:54:54

【OS安装与使用】part3-ubuntu安装Nvidia显卡驱动+CUDA 12.4

文章目录一、待解决问题1.1 问题描述1.2 解决方法二、方法详述2.1 必要说明2.2 应用步骤2.2.1 更改镜像源2.2.2 安装NVIDIA显卡驱动：nvidia-550（1）查询显卡ID（2）PCI ID Repository查询显卡型号（3&#xf…...

编程日记 2025/9/15 15:23:33

如何在本地和服务器新建Redis用户和密码

文章目录一. Redis安装二. 新建Redis用户，测试连接2.1 本地数据库2.2 线上数据库2.2.1 安装和配置2.2.2 测试连接三. 配置四. 分布式一. Redis安装 Redis安装可以设置开机自动启动，也可以在去查看系统服务，按[win R]，输入命…...

编程日记 2025/9/15 22:05:17

使用SHOW PROCESSLIST和SHOW ENGINE INNODB STATUS排查mysql锁等待问题

现象： mysql 查某表一直不能结束，查别的表没有问题。已知之前刚刚alter此表想把它的一个字段长度增长，但是这个操作一直没有结束。现在应该怎么办? 方案: 使用 SHOW PROCESSLIST; 查看当前所有活动的SQL线程，找出是否有长时间…...

编程日记 2025/9/13 22:32:24

探索HarmonyOS的UI开发新境界：从基础到进阶的深度解析

在科技日新月异的今天，操作系统作为连接硬件与软件的桥梁，其重要性不言而喻。HarmonyOS，作为华为自主研发的分布式全场景操作系统，正以其独特的分布式技术架构和一次开发多端部署的能力，引领着操作系统的新潮流。本文将…...

编程日记 2025/9/18 12:56:41

Android 动态加入Activity 时 manifest 注册报错解决。使用manifestPlaceholders 占位

需求如下： 项目测试demo 有多个渠道，部分渠道包含支付功能，在主测试代码外，需要一个单独 Activity 调用测试代码。 MainActivityPayActivity渠道A包含不包含渠道B包含包含因为支付功能需要引入对应的 moudule，因此…...

编程日记 2025/9/18 12:13:27

OpenCV（1）：简介、安装、入门案例、基础模块

1 OpenCV 简介 OpenCV 是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV 也将会继续发挥重要的作用。OpenCV 提供了大量的计算机视觉算法…...

编程日记 2025/9/13 14:20:57

Linux-GlusterFS操作子卷

文章目录分布式卷添加卷分布式卷删除子卷删除总卷 🏡作者主页：点击！ 🤖Linux专栏：点击！ ⏰️创作时间：2025年02月20日19点30分分布式卷添加卷 Node1上进行操作扩容 #服务器端 gluster volu…...

编程日记 2025/9/14 18:26:43

kettle从入门到精通第九十二课 ETL之kettle 使用Kettle的Carte对外发布读写接口

场景：使用kettle实现将查询结果返回给客户端，也就是说kettle暴露查询接口供外围系统调用。前提必须是使用carte服务才可以提供接口供外部系统调用。具体实操方法如下： 1、设计转换根据具体需求设计转换，主要用到的步骤有获取变…...

编程日记 2025/9/18 6:06:38

【精调】LLaMA-Factory 快速开始1: Meta-Llama-3.1-8B-Instruct

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml llamafactory-cli chat examples/inference/llama3_lora_sft.yaml llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml模型下载 git clone https://www.modelscope.cn/LLM-Research/Meta-Lla…...

编程日记 2025/9/12 8:42:00

数据库加密全解析：从传输到存储的安全实践

title: 数据库加密全解析：从传输到存储的安全实践 date: 2025/2/17 updated: 2025/2/17 author: cmdragon excerpt: 数据加密是数据库安全的最后一道物理防线。传输层SSL/TLS配置、存储加密技术及加密函数实战应用，覆盖MySQL、PostgreSQL、Oracle等主流数据库的20+生产级加密…...

编程日记 2025/9/9 12:40:10

PHP+Apache+MySQL安装（Windows）

一、安装教程参考链接1 参考链接2 二、问题描述 PHP安装目录下找不到php8apache2_4.dll PHP安装包下载错误 Apache Service Monitor: request operation has failed! 定位问题： 查看【事件查看器】解决问题安装或更新与PHP版本相对应的Visual C Redistribu…...

编程日记 2025/8/30 13:50:11

build.py

1.所需的库和模块

2.class InfiniteDataLoader(dataloader.DataLoader):

3.class _RepeatSampler:

4.def seed_worker(worker_id):

5.def build_yolo_dataset(cfg, img_path, batch, data, mode="train", rect=False, stride=32, multi_modal=False):

6.def build_grounding(cfg, img_path, json_file, batch, mode="train", rect=False, stride=32):

7.def build_dataloader(dataset, batch, workers, shuffle=True, rank=-1):

8.def check_source(source):

9.def load_inference_source(source=None, batch=1, vid_stride=1, buffer=False):

相关文章：