vitextaug

Text data augmentation for Vietnamese


License
MIT
Install
pip install vitextaug==0.0.7

Documentation

Text Data Augmentation for Vietnamese

Download VTA folder from here

Installing

    pip install --upgrade vitextaug

Usage

    >>> from vitextaug.augmentor import LexicalReplacement, WordEmbeddingReplacement
    >>> text = "Sau cơn lũ quét qua, bản Hòa Sơn tan hoang, nhiều nhà cửa, tài sản của người dân bị nước lũ cuốn trôi. "
    >>> lr = LexicalReplacement(path="/home/longnt/VTA/",
                                replacement_rate=0.9)

    >>> print(lr.augment(text))
    'sau cơn lũ quét , bản hoà sơn tan hoang , nhiều nhà cửa , đồng tiền bạc của người dân quê hương bị lũ cuốn đi .'