QuAcc/quacc/main.py

import pandas as pd
import quapy as qp
from quapy.method.aggregative import SLD
from quapy.protocol import APP
from sklearn.svm import SVC

import quacc.evaluation as eval
from quacc.estimator import AccuracyEstimator

from .data import get_dataset

qp.environ["SAMPLE_SIZE"] = 100

pd.set_option("display.float_format", "{:.4f}".format)


def test_2(dataset_name):
    train, test = get_dataset(dataset_name)

    model = SVC(probability=True)

    print(f"fitting model {model.__class__.__name__}...", end=" ", flush=True)
    model.fit(*train.Xy)
    print("fit")

    qmodel = SLD(SVC(probability=True))
    estimator = AccuracyEstimator(model, qmodel)

    print(f"fitting qmodel {qmodel.__class__.__name__}...", end=" ", flush=True)
    estimator.fit(train)
    print("fit")

    n_prevalences = 21
    repreats = 1000
    protocol = APP(test, n_prevalences=n_prevalences, repeats=repreats)
    print(
        f"Tests:\n\
        protocol={protocol.__class__.__name__}\n\
        n_prevalences={n_prevalences}\n\
        repreats={repreats}\n\
        executing...\n"
    )
    df = eval.evaluation_report(
        estimator,
        protocol,
        aggregate=True,
    )
    print(df.to_string())


def main():
    for dataset_name in [
        "imdb",
        # "hp",
        # "spambase",
    ]:
        print(dataset_name)
        test_2(dataset_name)
        print("*" * 50)


if __name__ == "__main__":
    main()
fixed evaluation_report and dataframe visualization 2023-06-02 19:36:54 +02:00			`import pandas as pd`
first test on quantification for accuracy 2023-05-11 21:43:59 +02:00			`import quapy as qp`
Refactoring completed 2023-05-20 20:23:17 +02:00			`from quapy.method.aggregative import SLD`
fixed evaluation_report and dataframe visualization 2023-06-02 19:36:54 +02:00			`from quapy.protocol import APP`
main updated 2023-06-08 15:20:11 +02:00			`from sklearn.svm import SVC`
first test on quantification for accuracy 2023-05-11 21:43:59 +02:00
Refactoring completed 2023-05-20 20:23:17 +02:00			`import quacc.evaluation as eval`
			`from quacc.estimator import AccuracyEstimator`

fixed evaluation_report and dataframe visualization 2023-06-02 19:36:54 +02:00			`from .data import get_dataset`
Refactoring completed 2023-05-20 20:23:17 +02:00
fixed evaluation_report and dataframe visualization 2023-06-02 19:36:54 +02:00			`qp.environ["SAMPLE_SIZE"] = 100`
first test on quantification for accuracy 2023-05-11 21:43:59 +02:00
fixed evaluation_report and dataframe visualization 2023-06-02 19:36:54 +02:00			`pd.set_option("display.float_format", "{:.4f}".format)`
first test on quantification for accuracy 2023-05-11 21:43:59 +02:00

Refactoring completed 2023-05-20 20:23:17 +02:00			`def test_2(dataset_name):`
			`train, test = get_dataset(dataset_name)`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00
main updated 2023-06-08 15:20:11 +02:00			`model = SVC(probability=True)`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00
main updated 2023-06-08 15:20:11 +02:00			`print(f"fitting model {model.__class__.__name__}...", end=" ", flush=True)`
Refactoring completed 2023-05-20 20:23:17 +02:00			`model.fit(*train.Xy)`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00			`print("fit")`

main updated 2023-06-08 15:20:11 +02:00			`qmodel = SLD(SVC(probability=True))`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00			`estimator = AccuracyEstimator(model, qmodel)`

main updated 2023-06-08 15:20:11 +02:00			`print(f"fitting qmodel {qmodel.__class__.__name__}...", end=" ", flush=True)`
Refactoring completed 2023-05-20 20:23:17 +02:00			`estimator.fit(train)`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00			`print("fit")`

			`n_prevalences = 21`
			`repreats = 1000`
			`protocol = APP(test, n_prevalences=n_prevalences, repeats=repreats)`
main updated 2023-06-08 15:20:11 +02:00			`print(`
			`f"Tests:\n\`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00			`protocol={protocol.__class__.__name__}\n\`
			`n_prevalences={n_prevalences}\n\`
			`repreats={repreats}\n\`
			`executing...\n"`
			`)`
			`df = eval.evaluation_report(`
			`estimator,`
			`protocol,`
			`aggregate=True,`
			`)`
Refactoring completed 2023-05-20 20:23:17 +02:00			`print(df.to_string())`


added project structure 2023-05-17 14:02:29 +02:00			`def main():`
			`for dataset_name in [`
added aggregation on evaluation report 2023-06-05 21:54:22 +02:00			`"imdb",`
main updated 2023-06-08 15:20:11 +02:00			`# "hp",`
			`# "spambase",`
added project structure 2023-05-17 14:02:29 +02:00			`]:`
			`print(dataset_name)`
Refactoring completed 2023-05-20 20:23:17 +02:00			`test_2(dataset_name)`
added project structure 2023-05-17 14:02:29 +02:00			`print("" 50)`


first test on quantification for accuracy 2023-05-11 21:43:59 +02:00			`if __name__ == "__main__":`
added project structure 2023-05-17 14:02:29 +02:00			`main()`