O...
¿Cómo encontrar numéricamente el valor de las variables que producen una condición determinada?
Buenas
Digamos que tengo un problema en el que, bajo ciertas condiciones, sucede algo.
Por ejemplo:
- una máquina que deja de funcionar.
- un sensor que, por alguna razón, empieza a producir valores extraños.
- una persona que sufre un infarto.
- ciertos factores que provocan la quiebra de una empresa.
Quisiera saber por qué ha ocurrido o cuándo es más probable que ocurra al reproducir las mismas condiciones.
Para ello dispongo de los datos que se han recopilado en múltiples experimentos (dispositivos o personas).
Recogidos en una tabla con varias variables input (continuas y/o discretas, quizás incluyendo el tiempo) y un output.
Quiero encontrar qué entrada (o combinación o función de ellas como la derivada) es más probable que produzca ese output (categórico o que representa una condición extrema).
No tengo una función paramétrica ni un modelo específico, por lo que se me ocurre ajustar un árbol de decisión o una red neuronal.
Una vez ajustado el modelo no lo quiero usar sólo para predecir a partir de unos input sino que quiero utilizarlo como función blackbox en un problema de optimización, que probablemente tenga ruido y máximos locales. Y normalmente los datos suelen ser muy desbalanceados (pocas observaciones de la categoría problemática).
¿Hay alguna otra forma más fácil o directa de resolver este problema?
Para acabar diciendo... la máquina (o persona) suele fallar cuando las variables XXX toman el valor YYY o cuando se da cierto patrón.