Autor Tema: Estadística Clásica vs Estadística Computacional

0 Usuarios y 1 Visitante están viendo este tema.

26 Mayo, 2020, 03:39 am
Leído 138 veces

YeffGC

  • Aprendiz
  • Mensajes: 330
  • País: sv
  • Karma: +0/-0
  • Sexo: Masculino
Título cambiado:
Estadistica  Clasica vs Estadistica Computacional-->Estadística  Clásica vs Estadística Computacional


Hola amigos abro este debate ya que soy alineado a la probabilidad clasica.

Ultimamente he estado en debate con un amigo sobre la utilidad de estudiar de la estadistica clasica hablando de teoremas pruebas de hipotésis tal como conocida el me habla sobre que ahora existen cosas como machine learning y redes neuronales cosas que con un solo codigo hace todo lo que comunmente hacemos en inferencia.

¿Que tan real es la evolución de la estadisticas y probabildad a esa area o solo una herramienta que  depende de la estadistica clasica?

26 Mayo, 2020, 06:55 am
Respuesta #1

geómetracat

  • Moderador Global
  • Mensajes: 1,675
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
Dejo algunos pensamientos sobre el tema.

Yo diría que son enfoques complementarios, y que lo ideal es conocer ambos.

Ahora hay mucho "hype" con el machine learning, pero aunque es un conjunto de técnicas muy potentes, ni es la panacea ni va a desbancar por completo la estadística clásica.

El machine learning, y deep learning o redes neuronales en particular, es especialmente potente para problemas de predicción con gran cantidad de datos, pero a cambio suele ser bastante malo en términos de explicabilidad (¿qué factores son los que tiene en cuenta el algoritmo?).
Dependiendo del tipo de problema, sobre todo si lo que uno quiere es comprobar la influencia de ciertos factores en un resultado o hacer inferencia, los algoritmos de machine learning no son útiles. En particular, los tests de hipótesis no quedan superados por el machine learning. La prueba está en que los científicos de datos los siguen usando (bajo el nombre de A/B testing).

Hay otra diferencia muy significativa entre ambos campos. Mientras la estadística está muy matematizada y tienes muchos teoremas y resultados rigurosos, el machine learning es un campo más bien empírico. Si tú quieres calcular intervalos de confianza o varianzas de algún tipo en machine learning tienes que usar métodos computacionales tipo bootstrap. En cambio, si eres capaz de modelizar tus datos razonablemente bien por una distribución conocida (por ejemplo, una normal de parámetros desconocidos), tienes teoremas que te dan cotas exactas (o al menos exactas asintóticamente) para la varianza de tus estimadores.

Además, las redes neuronales tienen una serie de problemas teóricos y conceptuales que hasta donde yo sé no han sido resueltos. Uno de los problemas es el de la arquitectura: no queda muy claro por qué unas arquitecturas funcionan mejor que otras, y al final parece que la cosa se reduce a un "prueba y error". Otro problema teórico es el de que la función de error no es convexa, por lo que en principio no puedes asegurar que el error del algoritmo converja a un mínimo global.

En fin, aunque parece que esté poniendo a caldo el machine learning, en realidad es muy útil para cualquier persona interesada en estadística conocer machine learning, y viceversa, es útil conocer estadística para personas interesadas en machine learning. Cada campo tiene una serie de herramientas que van bien para unos determinados tipos de problemas.
La ecuación más bonita de las matemáticas: \( d^2=0 \)

04 Junio, 2020, 09:09 pm
Respuesta #2

YeffGC

  • Aprendiz
  • Mensajes: 330
  • País: sv
  • Karma: +0/-0
  • Sexo: Masculino
Las bases estadísticas no pueden ser reemplazadas con redes neuronales ya no se realizan pruebas de normalidad 

04 Junio, 2020, 09:25 pm
Respuesta #3

geómetracat

  • Moderador Global
  • Mensajes: 1,675
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
No entiendo la frase.
Las bases estadísticas no pueden ser reemplazadas con redes neuronales
Totalmente de acuerdo.
Citar
ya no se realizan pruebas de normalidad 
No entiendo muy bien qué quieres decir con esto ni cómo ligarlo con lo anterior.
La ecuación más bonita de las matemáticas: \( d^2=0 \)