J. Martín Arevalillo, H. Navarro Veguillas
Para el problema de clasificación binaria en conjuntos de datos de alta dimensión, este trabajo presenta un procedimiento orientado a la detección de interacciones genéticas bivariantes con gran capacidad discriminante, pero con distribuciones marginales irrelevantes desde el punto de vista predictivo. Los procedimientos basados en la búsqueda secuencial, como el conocido Varsel, suelen perder este tipo de patrones bidimensionales debido a la propia naturaleza del método. Otras soluciones, como los indicadores TSP y CorScore, asumen una forma determinada para la interacción bidimensional subyacente. Para abordar el problema, se propone un nuevo método basado en la división por bloques del espacio de variables predictoras y el uso de técnicas de clasificación diversas como motores de la búsqueda. El procedimiento se aplica tanto a datos artificiales como a datos reales procedentes de microarrays de ADN mostrando sus ventajas e inconvenientes.
Palabras clave: algoritmos de clasificación, interacciones bivariantes, datos de alta dimensión
Programado
JC3 Clasificación y análisis multivariante 2
19 de abril de 2012 12:00
Sala Londres