QuAcc/quacc/evaluation/method.py

from functools import wraps
from typing import Callable, Union

import numpy as np
from quapy.method.aggregative import SLD
from quapy.protocol import UPP, AbstractProtocol, OnLabelledCollectionProtocol
from sklearn.linear_model import LogisticRegression

import quacc as qc
from quacc.evaluation.report import EvaluationReport
from quacc.method.model_selection import GridSearchAE

from ..method.base import BQAE, MCAE, BaseAccuracyEstimator

_methods = {}


def method(func):
    @wraps(func)
    def wrapper(c_model, validation, protocol):
        return func(c_model, validation, protocol)

    _methods[func.__name__] = wrapper

    return wrapper


def evaluate(
    estimator: BaseAccuracyEstimator,
    protocol: AbstractProtocol,
    error_metric: Union[Callable | str],
) -> float:
    if isinstance(error_metric, str):
        error_metric = qc.error.from_name(error_metric)

    collator_bck_ = protocol.collator
    protocol.collator = OnLabelledCollectionProtocol.get_collator("labelled_collection")

    estim_prevs, true_prevs = [], []
    for sample in protocol():
        e_sample = estimator.extend(sample)
        estim_prev = estimator.estimate(e_sample.X, ext=True)
        estim_prevs.append(estim_prev)
        true_prevs.append(e_sample.prevalence())

    protocol.collator = collator_bck_

    true_prevs = np.array(true_prevs)
    estim_prevs = np.array(estim_prevs)

    return error_metric(true_prevs, estim_prevs)


def evaluation_report(
    estimator: BaseAccuracyEstimator,
    protocol: AbstractProtocol,
    method: str,
) -> EvaluationReport:
    report = EvaluationReport(name=method)
    for sample in protocol():
        e_sample = estimator.extend(sample)
        estim_prev = estimator.estimate(e_sample.X, ext=True)
        acc_score = qc.error.acc(estim_prev)
        f1_score = qc.error.f1(estim_prev)
        report.append_row(
            sample.prevalence(),
            acc_score=acc_score,
            acc=abs(qc.error.acc(e_sample.prevalence()) - acc_score),
            f1_score=f1_score,
            f1=abs(qc.error.f1(e_sample.prevalence()) - f1_score),
        )

    return report


@method
def bin_sld(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(c_model, SLD(LogisticRegression()))
    est.fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
        method="bin_sld",
    )


@method
def mul_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, SLD(LogisticRegression()))
    est.fit(validation)
    return evaluation_report(
        estimator=est,
        protocor=protocol,
        method="mul_sld",
    )


@method
def bin_sld_bcts(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(c_model, SLD(LogisticRegression(), recalib="bcts"))
    est.fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
        method="bin_sld_bcts",
    )


@method
def mul_sld_bcts(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, SLD(LogisticRegression(), recalib="bcts"))
    est.fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
        method="mul_sld_bcts",
    )


@method
def mul_sld_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = SLD(LogisticRegression())
    est = GridSearchAE(
        model=model,
        param_grid={
            "q__classifier__C": np.logspace(-3, 3, 7),
            "q__classifier__class_weight": [None, "balanced"],
            "q__recalib": [None, "bcts", "vs"],
        },
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=True,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
        method="mul_sld_gs",
    )
diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`from functools import wraps`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`from typing import Callable, Union`
diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00			`import numpy as np`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`from quapy.method.aggregative import SLD`
			`from quapy.protocol import UPP, AbstractProtocol, OnLabelledCollectionProtocol`
			`from sklearn.linear_model import LogisticRegression`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`import quacc as qc`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`from quacc.evaluation.report import EvaluationReport`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`from quacc.method.model_selection import GridSearchAE`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`from ..method.base import BQAE, MCAE, BaseAccuracyEstimator`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00
diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`_methods = {}`


			`def method(func):`
			`@wraps(func)`
			`def wrapper(c_model, validation, protocol):`
			`return func(c_model, validation, protocol)`

			`_methods[func.__name__] = wrapper`

			`return wrapper`

baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`def evaluate(`
			`estimator: BaseAccuracyEstimator,`
			`protocol: AbstractProtocol,`
			`error_metric: Union[Callable \| str],`
			`) -> float:`
			`if isinstance(error_metric, str):`
			`error_metric = qc.error.from_name(error_metric)`

			`collator_bck_ = protocol.collator`
			`protocol.collator = OnLabelledCollectionProtocol.get_collator("labelled_collection")`

			`estim_prevs, true_prevs = [], []`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`for sample in protocol():`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`e_sample = estimator.extend(sample)`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`estim_prev = estimator.estimate(e_sample.X, ext=True)`
			`estim_prevs.append(estim_prev)`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`true_prevs.append(e_sample.prevalence())`

			`protocol.collator = collator_bck_`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`true_prevs = np.array(true_prevs)`
			`estim_prevs = np.array(estim_prevs)`

			`return error_metric(true_prevs, estim_prevs)`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00

			`def evaluation_report(`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`estimator: BaseAccuracyEstimator,`
			`protocol: AbstractProtocol,`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`method: str,`
			`) -> EvaluationReport:`
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00			`report = EvaluationReport(name=method)`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`for sample in protocol():`
			`e_sample = estimator.extend(sample)`
			`estim_prev = estimator.estimate(e_sample.X, ext=True)`
			`acc_score = qc.error.acc(estim_prev)`
			`f1_score = qc.error.f1(estim_prev)`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`report.append_row(`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`sample.prevalence(),`
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00			`acc_score=acc_score,`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`acc=abs(qc.error.acc(e_sample.prevalence()) - acc_score),`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`f1_score=f1_score,`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`f1=abs(qc.error.f1(e_sample.prevalence()) - f1_score),`
baselines refactored and updated, report updated 2023-10-19 02:36:53 +02:00			`)`

			`return report`


diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`@method`
			`def bin_sld(c_model, validation, protocol) -> EvaluationReport:`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`est = BQAE(c_model, SLD(LogisticRegression()))`
			`est.fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`method="bin_sld",`
			`)`
Dataset refactored, training sampling added 2023-10-20 23:36:05 +02:00

diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`@method`
			`def mul_sld(c_model, validation, protocol) -> EvaluationReport:`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`est = MCAE(c_model, SLD(LogisticRegression()))`
			`est.fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocor=protocol,`
			`method="mul_sld",`
			`)`
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00

diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`@method`
			`def bin_sld_bcts(c_model, validation, protocol) -> EvaluationReport:`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`est = BQAE(c_model, SLD(LogisticRegression(), recalib="bcts"))`
			`est.fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`method="bin_sld_bcts",`
			`)`
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00

diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`@method`
			`def mul_sld_bcts(c_model, validation, protocol) -> EvaluationReport:`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`est = MCAE(c_model, SLD(LogisticRegression(), recalib="bcts"))`
			`est.fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`method="mul_sld_bcts",`
			`)`
plots, avg table, conf added; method updated 2023-10-23 03:14:35 +02:00

diag plot fixed, opts, avg plot, best score added 2023-10-27 12:37:18 +02:00			`@method`
			`def mul_sld_gs(c_model, validation, protocol) -> EvaluationReport:`
grid search base implementation, MCAE adapted 2023-11-02 00:28:13 +01:00			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = SLD(LogisticRegression())`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid={`
			`"q__classifier__C": np.logspace(-3, 3, 7),`
			`"q__classifier__class_weight": [None, "balanced"],`
			`"q__recalib": [None, "bcts", "vs"],`
			`},`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=True,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`method="mul_sld_gs",`
			`)`