医用药片数据集
药片检测数据集是一个概念验证(POC)数据集,经过精心设计,旨在展示人工智能在制药应用中的潜力。该数据集包含标签图像,专门用于训练识别药片的计算机视觉 模型。
观看: 如何在Ultralytics YOLO11 中的医疗药片检测数据集上训练模型? Google Colab
该数据集是制药工作流程中质量控制、包装自动化和高效分拣等基本任务自动化的基础资源。通过将该数据集整合到项目中,研究人员和开发人员可以探索创新的解决方案,从而提高准确性、简化操作并最终改善医疗效果。
数据集结构
医用药片数据集分为两个子集:
- 训练集:由 92 幅图像组成,每幅图像都标注了类别
pill
. - 验证集:包括 23 幅图像和相应的注释。
应用
利用计算机视觉进行医用药片检测可实现制药业的自动化,为以下任务提供支持:
- 药品分拣:根据大小、形状或颜色自动分拣药丸,提高生产效率。
- 人工智能研发:作为开发和测试制药用计算机视觉算法的基准。
- 数字库存系统:通过集成自动药丸识别功能,实现实时库存监控和补货计划,为智能库存解决方案提供动力。
- 质量控制:通过识别缺陷、异常或污染,确保药丸生产的一致性。
- 假药检测:通过对照已知标准分析视觉特征,帮助识别潜在的假药。
数据集 YAML
我们提供了一个 YAML 配置文件来定义数据集的结构,包括路径和类。对于医用药片数据集,YAML 配置文件中的 medical-pills.yaml
文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.
ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
# └── medical-pills ← downloads here (8.19 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/medical-pills # dataset root dir
train: train/images # train images (relative to 'path') 92 images
val: valid/images # val images (relative to 'path') 23 images
test: # test images (relative to 'path')
# Classes
names:
0: pill
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip
使用方法
要在图像大小为 640 的医用药片数据集上训练 YOLO11n 模型 100次,请使用以下示例。有关详细参数,请参阅模型的训练页面。
列车示例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640
推理示例
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")
# Start prediction with a fine-tuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/medical-pills-sample.jpg"
图片和注释示例
医用药片数据集以标注图像为特色,展示了药片的多样性。下面是该数据集中的标签图像示例:
- 镶嵌图像:显示的是由镶嵌数据集图像组成的训练批次。马赛克图像通过将多幅图像合并为一幅图像来增强训练的多样性,从而提高模型的泛化能力。
与其他数据集整合
为了进行更全面的药物分析,可以考虑将医用药丸数据集与其他相关数据集(如用于包装识别的包装密封数据集或用于脑肿瘤的医学影像数据集)结合起来,开发端到端的医疗人工智能解决方案。
引文和致谢
该数据集根据AGPL-3.0 许可提供。
如果您在研究或开发工作中使用 Medical-pills 数据集,请使用上述详细信息进行引用:
@dataset{Jocher_Ultralytics_Datasets_2024,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {Dec},
title = {Ultralytics Datasets: Medical-pills Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
version = {1.0.0},
year = {2024}
}
常见问题
医用药片数据集的结构是什么?
数据集包括 92 幅用于训练的图像和 23 幅用于验证的图像。每张图像都标注了 pill
这样就能对制药应用模型进行有效的培训和评估。
如何在医用药片数据集上训练YOLO11 模型?
您可以使用所提供的Python 或CLI 方法对图像大小为 640px 的YOLO11 模型进行 100 次历时训练。详细说明请参阅 "训练示例"部分,有关模型功能的更多信息,请查阅YOLO11 文档。
在人工智能项目中使用医用药片数据集有什么好处?
该数据集实现了药片检测的自动化,有助于防伪、质量保证和制药流程优化。该数据集还是开发人工智能解决方案的宝贵资源,可提高用药安全和供应链效率。
如何对医用药片数据集进行推理?
推理可使用Python 或CLI 方法与微调后的YOLO11 模型一起完成。有关其他选项,请参阅推理示例部分的代码片段和预测模式文档。
在哪里可以找到医用药片数据集的 YAML 配置文件?
YAML 文件见medical-pills.yml,其中包含数据集路径、类以及在该数据集上训练模型所必需的其他配置细节。