TODO updated, dataset imdb parameter added
This commit is contained in:
parent
3345514c99
commit
a6c69264b6
5
TODO.md
5
TODO.md
|
@ -29,3 +29,8 @@
|
|||
- [x] salvare il best score ottenuto da ogni applicazione di GridSearchQ
|
||||
- nel caso di bin fare media dei due best score
|
||||
- [x] import baselines
|
||||
|
||||
- [ ] testare anche su imbd
|
||||
- [ ] plot avg con train prevalence sull'asse x e media su test prevalecne
|
||||
- [ ] realizzare grid search per task specifico partendo da GridSearchhQ
|
||||
- [ ] provare PACC come quantificatore
|
|
@ -42,8 +42,9 @@ class Dataset:
|
|||
def __spambase(self):
|
||||
return qp.datasets.fetch_UCIDataset("spambase", verbose=False).train_test
|
||||
|
||||
# provare min_df=5
|
||||
def __imdb(self):
|
||||
return qp.datasets.fetch_reviews("imdb", tfidf=True).train_test
|
||||
return qp.datasets.fetch_reviews("imdb", tfidf=True, min_df=3).train_test
|
||||
|
||||
def __rcv1(self):
|
||||
n_train = 23149
|
||||
|
|
Loading…
Reference in New Issue