TODO updated, dataset imdb parameter added

This commit is contained in:
Lorenzo Volpi 2023-10-27 17:05:01 +02:00
parent 3345514c99
commit a6c69264b6
2 changed files with 7 additions and 1 deletions

View File

@ -29,3 +29,8 @@
- [x] salvare il best score ottenuto da ogni applicazione di GridSearchQ
- nel caso di bin fare media dei due best score
- [x] import baselines
- [ ] testare anche su imbd
- [ ] plot avg con train prevalence sull'asse x e media su test prevalecne
- [ ] realizzare grid search per task specifico partendo da GridSearchhQ
- [ ] provare PACC come quantificatore

View File

@ -42,8 +42,9 @@ class Dataset:
def __spambase(self):
return qp.datasets.fetch_UCIDataset("spambase", verbose=False).train_test
# provare min_df=5
def __imdb(self):
return qp.datasets.fetch_reviews("imdb", tfidf=True).train_test
return qp.datasets.fetch_reviews("imdb", tfidf=True, min_df=3).train_test
def __rcv1(self):
n_train = 23149