easydata-python

A toolkit for processing data powered by PaddlePaddle, which include data augmentation, data cleaning and data annotation.


Keywords
PaddlePaddle, PP-DataAug, PP-DataClean
License
Apache-2.0
Install
pip install easydata-python==0.5.1

Documentation

EasyData

简介

EasyData 旨在打造一套通用、领先且实用的数据自动扩充与数据清洗工具库,并提供开源数据集与标注工具大全,助力开发者获得高质量的训练、推理数据,从而提升 AI 算法的实用效果。

PP-DataClean 数据清洗效果图 PP-DataAug 数据自动扩充效果图
120+经典产业数据集 7+半自动标注工具

📣 近期更新

  • 💥 直播预告:11.23-11.24日每晚8点半,EasyData研发团队详解数据清洗策略和数据合成工具。微信扫描下方二维码,关注公众号并填写问卷后进入官方交流群,获取获取直播链接与20G重磅EasyData学习大礼包(自研半自动标注应用程序,数据处理相关CVPR、AAAI、ACL、IJCAI顶级会议paper list,手把手教学视频以及学习资料),获取发布最新资讯。
  • 🔥2022.11 发布 EasyData beta/0.5
    • 发布数据清洗工具,包括图像方向矫正、低质图像过滤能力,使用该工具可以在多个视觉任务中提升效果。
    • 发布数据扩充工具,支持增广数据生成、重复和低质数据过滤,使用该工具可以在整图识别场景中提升效果。
    • 新增CV、NLP、Speech方向的120+数据集,7经典+自研半自动标注工具

快速开始

👫 开源社区

  • 📑项目合作: 如果您是企业开发者且有明确的EasyData应用需求,填写问卷链接待更新后可免费与官方团队展开不同层次的合作。
  • 👫加入社区: 微信扫描二维码并填写问卷之后,加入交流群与EasyData研发工程师1V1交流
  • 🎁社区共建:EasyData欢迎与大家一起打造行业把数据治理打造成业界的新标准

🛠️ EasyData 模型列表(更新中)

类别 亮点 文档说明 模型下载
图像方向矫正 自动矫正图像,大大提升多项视觉任务在旋转图像上精度 文档 下载链接
模糊图像过滤 判断图像是否模糊,可以广泛应用于模糊图像过滤、视觉相关业务的前处理等 文档 下载链接
广告码图像过滤 判断图像是否含有二维码、条形码、小程序码,可以广泛应用于广告码过滤、审核等业务 文档 下载链接

📖 文档教程

许可证书

本项目的发布受Apache 2.0 license许可认证。