aggiungere media tabelle
plot; 3 tipi (appunti + email + garg)
sistemare kfcv baseline
aggiungere metodo con CC oltre SLD
prendere classe più popolosa di rcv1, togliere negativi fino a raggiungere 50/50; poi fare subsampling con 9 training prvalences (da 0.1-0.9 a 0.9-0.1)
variare parametro recalibration in SLD
fix grafico diagonal
varianti recalib: bcts, SLD (provare exact_train_prev=False)
vedere cosa usa garg di validation size
per model selection testare il parametro c del classificatore, si esplora in np.logscale(-3,3, 7) oppure np.logscale(-4, 4, 9), parametro class_weight si esplora in None oppure "balanced"; va usato qp.model_selection.GridSearchQ in funzione di mae come errore, UPP come protocollo
plot collettivo, con sulla x lo shift e prenda in considerazione tutti i training set, facendo la media sui 9 casi (ogni line è un metodo), risultati non ottimizzati e ottimizzati
salvare il best score ottenuto da ogni applicazione di GridSearchQ
import baselines
testare anche su imbd
plot avg con train prevalence sull'asse x e media su test prevalecne
realizzare grid search per task specifico partendo da GridSearchQ
provare PACC come quantificatore