datasets

A dataset utils repository based on tf.data. For tensorflow>=2.0.0b only!

Deprecated!!! Use nlp-datasets instead!

Requirements

python 3.6
tensorflow>=2.0.0b

Installation

pip install nlp-datasets

Build dataset for seq2seq models. seq2seq_dataset.py
Build dataset for NMT. nmt_dataset.py
Build dataset for DSSM. dssm_dataset.py
Build dataset for MatchPyramid. matchpyramid_dataset.py

Usage

For NMT task

from nlp_datasets import NMTSameFileDataset

o = NMTSameFileDataset(config=None, logger_name=None)
train_files = [] # your files
# train_dataset is an instance of tf.data.Dataset
train_dataset = o.build_train_dataset(train_files)

from nlp_datasets import NMTSeparateFileDataset

o = NMTSeparateFileDataset(config=None, logger_name=None)
feature_files = [] # your files
label_files = []
train_dataset = o.build_train_dataset(feature_files,label_files)

For DSSM task

from nlp_datasets import DSSMSameFileDataset

o = DSSMSameFileDataset(config=None, logger_name=None)
train_dataset = o.build_train_dataset(train_files=[])

from nlp_datasets import DSSMSeparateFileDataset

o = DSSMSeparateFileDataset(config=None, logger_name=None)
query_files = []
doc_files = []
label_files = []
train_dataset = o.build_train_dataset(query_files, doc_files, label_files)

For MatchPyramid task

from nlp_datasets import MatchPyramidSameFileDataset

o = MatchPyramidSameFileDataset(config=None, logger_name=None)
train_dataset = o.build_train_dataset(train_files=[])

from nlp_datasets import MatchPyramidSeparateFilesDataset

o = MatchPyramidSeparateFilesDataset(config=None, logger_name=None)
query_files = []
doc_files = []
label_files = []
train_dataset = o.build_train_dataset(query_files, doc_files, label_files)

naivenmt-datasets
Release 0.0.7

Release 0.0.7

0.0.7

0.0.6

0.0.5

0.0.4

0.0.3

0.0.2

0.0.1

Documentation

datasets

Requirements

Installation

Contents

Usage

For NMT task

For DSSM task

For MatchPyramid task

Stats

Development practices

Releases

Contributors

naivenmt-datasets Release 0.0.7

Release 0.0.7 Toggle Dropdown 0.0.7 0.0.6 0.0.5 0.0.4 0.0.3 0.0.2 0.0.1

Documentation

datasets

Requirements

Installation

Contents

Usage

For NMT task

For DSSM task

For MatchPyramid task

Stats

Development practices

Releases

Contributors

naivenmt-datasets
Release 0.0.7

Release 0.0.7

0.0.7

0.0.6

0.0.5

0.0.4

0.0.3

0.0.2

0.0.1