分享一个收集自互联网+手动标注的微信小程序码
、葵花码
、太阳码
目标检测数据集。
- 条形码和二维码:收集自Roboflow、BenSouchet、Kaggle
- 葵花码:出自微信,又称为微信小程序码、太阳码;最早出现在2022年初,用于防疫追踪;未找到现成的数据集,通过在百度、搜狗、360、Bing和Chrome图片搜索引擎,搜索关键词[
微信小程序码
、葵花码
、太阳码
],人工筛选获得700余张
- 条形码和二维码:收集到数据集大多是VOC或其它自定义数据集格式,可参考reop,转换至YOLO格式数据集
- 葵花码:首先,通过X-AnyLabeling人工打标;然后,基于extract_box.py提取标注区域图像Crop;其次,基于random_paste.py,将Crop图像随机贴图至Pascal/VOC数据集上,生成5k对合成数据;最后,合并人工标注及合成数据,构成最终的数据集
- 标注数据查看:可通过show_yolo.py,对YOLO格式标注框进行绘制,校验准确性
标签 | 索引 | 数量 | 备注 |
---|---|---|---|
条形码 barcode | 0 | 4565 | - |
二维码 qrcode | 1 | 5791 | - |
葵花码 kuihuama | 2 | 5712 | 其中5k为copy_paste合成数据 |
- 将整理好的YOLO格式数据集,分享至百度云盘链接,提取码:9pff
- http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
- https://universe.roboflow.com
- https://www.kaggle.com/datasets
- https://github.com/BenSouchet/barcode-datasets
- https://github.com/DLLXW/objectDetectionDatasets
- https://github.com/CVHub520/X-AnyLabeling
- CC BY 4.0