TODO updated, dataset imdb parameter added
This commit is contained in:
parent
3345514c99
commit
a6c69264b6
5
TODO.md
5
TODO.md
|
@ -29,3 +29,8 @@
|
||||||
- [x] salvare il best score ottenuto da ogni applicazione di GridSearchQ
|
- [x] salvare il best score ottenuto da ogni applicazione di GridSearchQ
|
||||||
- nel caso di bin fare media dei due best score
|
- nel caso di bin fare media dei due best score
|
||||||
- [x] import baselines
|
- [x] import baselines
|
||||||
|
|
||||||
|
- [ ] testare anche su imbd
|
||||||
|
- [ ] plot avg con train prevalence sull'asse x e media su test prevalecne
|
||||||
|
- [ ] realizzare grid search per task specifico partendo da GridSearchhQ
|
||||||
|
- [ ] provare PACC come quantificatore
|
|
@ -42,8 +42,9 @@ class Dataset:
|
||||||
def __spambase(self):
|
def __spambase(self):
|
||||||
return qp.datasets.fetch_UCIDataset("spambase", verbose=False).train_test
|
return qp.datasets.fetch_UCIDataset("spambase", verbose=False).train_test
|
||||||
|
|
||||||
|
# provare min_df=5
|
||||||
def __imdb(self):
|
def __imdb(self):
|
||||||
return qp.datasets.fetch_reviews("imdb", tfidf=True).train_test
|
return qp.datasets.fetch_reviews("imdb", tfidf=True, min_df=3).train_test
|
||||||
|
|
||||||
def __rcv1(self):
|
def __rcv1(self):
|
||||||
n_train = 23149
|
n_train = 23149
|
||||||
|
|
Loading…
Reference in New Issue