Autor Tema: Hipótesis

0 Usuarios y 1 Visitante están viendo este tema.

27 Julio, 2020, 05:47 am
Leído 44 veces

carixto

  • Junior
  • Mensajes: 72
  • País: cl
  • Karma: +0/-0
  • Sexo: Femenino
Hola
Necesito urgente ayuda con este problema, ya que no puedo realizarlo.
Un conjunto de datos tiene 600 ejemplos. Para probar adecuadamente el rendimiento de la hipótesis final, se reserva un subconjunto de 200 seleccionado al azar que nunca se utiliza en la fase de entrenamiento; Estos forman un conjunto de prueba. Utiliza un modelo de aprendizaje con 1,000 hipótesis y selecciona la hipótesis final g basada en los 400 ejemplos de entrenamiento. Deseamos estimar [texx] E_{out}(g) [/texx] Nosotras tenemos acceso a dos estimaciones: [texx] E_{in}(g) [/texx] el error en la muestra en los 400 ejemplos de entrenamiento; y [texx] E_{test}(g)[/texx]el error de prueba en los 200 ejemplos de prueba que se dejaron de lado.
1.Usando una tolerancia de error del 5%([texx]\delta=0,05 [/texx]) , ¿qué estimación tiene la 'barra de error' más alta?
2.¿Hay alguna razón por la que no debería reservar aún más ejemplos para las pruebas?
Saludos