DataAnalysis

Pacote de pré-processamento de texto


License
MIT
Install
pip install DataAnalysis==0.0.6

Documentation

DataAnalysis

DataAnalysis é uma biblioteca que pode ser usada para o pré-processamento de um arquivo csv.

Parâmetros:

input_file: nome do arquivo com a extensão csv

api_small_talks: url da api de small talks

content_column: nome ou índice da coluna de conteúdo do arquivo csv

encoding: codificação do arquivo

sep: separador usado no arquivo

batch: número de batches para usar na api de small talks

Installation

Use o gerenciador de pacotes pip para instalar o DataAnalysis

pip install DataAnalysis

Usage

import DataAnalysis as da

p = da.PreProcessing(input_file, api_small_talks, content_column, encoding, sep, batch)
p.process(output_file, lower = True, punctuation = True, abbreviation = True, typo = True, small_talk = True,
emoji = True, wa_emoji = True, accentuation = True, number = True, relevant = False, cpf = True,
url = True, email = True, money = True, code = True, time = True, date = True, tagging = True)

License

MIT