Download Taller de LIBSVM

Document related concepts
no text concepts found
Transcript
Taller de LIBSVM
Aurelio Sanabria Universidad de Costa Rica
Preparación
1. Descargar LIBSVM: http://www.csie.ntu.edu.tw/~cjlin/libsvm/
2. Descargar los datos para el taller de la dirección:
itcr.ac.cr/~ausanabria/
http://ic-
3. ¿Qué es weka?, ¿De dónde sale?, ¿En que se usa? //Gallirallus australis//
Pre-procesamiento
1. Importar el archivo Original.Freq20.5C.arff
2. Ejecutar la siguiente lista de filtros para preparar los datos
• Para eliminar la columna AGREEMENT
– filters.unsupervised.attribute.Remove
• Combina dos clases diferentes
– weka.filters.unsupervised.attribute.MergeManyValues
• Elimina las instancias de una clase particular
– weka.filters.unsupervised.instance.RemoveWithValues
3. Guarda el archivo en formato libsvm
4. Ejecutar el siguiente filtro:
• Para eliminar el TwitterID
– filters.unsupervised.attribute.Remove
Entrenamiento del modelo de clasificación
1. Separar el archivo resultante en dos conjuntos utilizando subset.py
python subset.py -s 1 <archivo> <cantidad> <archivo entrenamiento> <archivo evaluación>
2. Seleccionar los parámetros del modelo utilizando grid.py
python grid.py -v 2 <archivo entrenamiento>
3. Entrenar el modelo utilizando svm-train
svm-train -s0 -t2 <archivo entrenamiento> <archivo modelo>
1
4. Validar el modelo utilizando svm-predict
svm-predict <archivo validación> <modelo> <predicción>
2