manifestare

A manifesto is a textual genre that consists of a kind of formal, persuasive and public statement for the transmission of opinions, decisions, intentions and ideas. We want it for data!

This library intend to provide a simple, fluent, and descriptive API to explicit DataFrames expectations. It supports both pyspark.DataFrame and pandas.DataFrame.

Features

`PandasDataFrameManifesto`

`init()`

Creates a PandasDataFrameManifesto instance to explicit define expectations about a given pandas.Dataframe.

from manifestare.core import PandasDataFrameManifesto

manifesto = PandasDataFrameManifesto()

assert isinstance(manifesto, PandasDataFrameManifesto)

`describeThat(df)`

Set a DataFrame in the Manifesto to be evaluated against matchers.

import pandas as pd
from manifestare.core import PandasDataFrameManifesto

data = {
    'x': [0, 1],
    'y': [1, 0]
}

df = pd.DataFrame(data)

manifesto = PandasDataFrameManifesto()
manifesto.describeThat(df)

assert manifesto.df != None

`doesHaveColumn(column)`

Evaluate if a given column exists in the DataFrame being described.

import pandas as pd
from manifestare.core import PandasDataFrameManifesto

data = {
    'x': [0, 1],
    'y': [1, 0]
}

df = pd.DataFrame(data)

# pass
PandasDataFrameManifesto()\
    .describeThat(df)\
    .doesHaveColumn('x')
    
# fail
PandasDataFrameManifesto()\
    .describeThat(df)\
    .doesHaveColumn('z')

`SparkDataFrameManifesto`

`init()`

Creates a SparkDataFrameManifesto instance to explicit define expectations about a given pyspark.sql.Dataframe.

from manifestare.core import SparkDataFrameManifesto

manifesto = SparkDataFrameManifesto()

assert isinstance(manifesto, SparkDataFrameManifesto)

`describeThat(df)`

Set a DataFrame in the Manifesto to be evaluated against matchers.

from pyspark.sql import SparkSession
from manifestare.core import SparkDataFrameManifesto

values, columns = [[(0, 1), (1, 0)], ['x', 'y']]

spark = SparkSession.builder.appName('manifestare').getOrCreate()
df = spark.createDataFrame(values, columns)

manifesto = SparkDataFrameManifesto()
manifesto.describeThat(df)

assert manifesto.df != None

`doesHaveColumn(column)`

Evaluate if a given column exists in the DataFrame being described.

from pyspark.sql import SparkSession
from manifestare.core import SparkDataFrameManifesto

values, columns = [[(0, 1), (1, 0)], ['x', 'y']]

spark = SparkSession.builder.appName('manifestare').getOrCreate()
df = spark.createDataFrame(values, columns)

# pass
SparkDataFrameManifesto()\
    .describeThat(df)\
    .doesHaveColumn('x')

# fail
SparkDataFrameManifesto()\
    .describeThat(df)\
    .doesHaveColumn('z')

manifestare
Release 0.0.1

Release 0.0.1

0.0.1

Documentation

manifestare

Features

`PandasDataFrameManifesto`

`init()`

`describeThat(df)`

`doesHaveColumn(column)`

`SparkDataFrameManifesto`

`init()`

`describeThat(df)`

`doesHaveColumn(column)`

Stats

Development practices

Releases

Contributors

manifestare Release 0.0.1

Release 0.0.1 Toggle Dropdown 0.0.1

Documentation

manifestare

Features

PandasDataFrameManifesto

__init__()

describeThat(df)

doesHaveColumn(column)

SparkDataFrameManifesto

__init__()

describeThat(df)

doesHaveColumn(column)

Stats

Development practices

Releases

Contributors

manifestare
Release 0.0.1

Release 0.0.1

0.0.1

`PandasDataFrameManifesto`

`init()`

`describeThat(df)`

`doesHaveColumn(column)`

`SparkDataFrameManifesto`

`init()`

`describeThat(df)`

`doesHaveColumn(column)`