2021-10-21 17:14:40 +02:00
|
|
|
2. tablas?
|
|
|
|
3. fetch dataset (download, unzip, etc.)
|
|
|
|
4. model selection
|
|
|
|
5. plots
|
2021-10-25 13:37:22 +02:00
|
|
|
8. No me convence que la lectura de los samples (caso en que no hay ground truth) viene en orden aleatorio
|
2021-10-26 18:41:10 +02:00
|
|
|
9. Experimentar con vectores densos (PCA sobre tfidf por ejemplo)
|
|
|
|
10. Si cambiamos el formato de los samples (por ejemplo, en lugar de svmlight con .txt a PCA con .dat) hay que cambiar
|
|
|
|
cosas en el código. Está escrito varias veces un glob(*.txt)
|
|
|
|
11. Quitar las categorias como columnas de los ficheros de prevalences
|
|
|
|
12. sample_size cannot be set to a non-integer in GridSearchQ whith protocol="gen" (it could, but is not indicated in doc)
|
|
|
|
13. repair doc of GridSearchQ
|
|
|
|
14. reparar la calibracion en LR (lo tuve que quitar para que funcionara GridSearchQ, y lo quité en todos los ficheros)
|
|
|
|
15. podria poner que el eval_budget se usase en GridSearchQ con generator function para el progress bar de tqdm
|