Download Tarea 5

Document related concepts
no text concepts found
Transcript
Estadística III
Tarea 5
1. En un estudio se obtuvieron datos de variables que pueden estar
relacionadas con el número de semanas que está desempleado un
trabajador de la industria. La variable dependiente de este estudio
(semanas) se definió como el número de semanas que un empleado
debido a despido. En este estudio se usaron las siguientes variables
independientes:
Age (edad)
Educ (educación)
Married (casado)
Head (cabeza)
Tenure (ocupación)
Manager
(administrativo)
Sales (ventas)
Edad del trabajador
Número de años de estudio
Variable ficticia; 1 sí es casado, 0 si no es así
Variable ficticia; 1 sí es cabeza de familia, 0 si no es
así
Número de años en el trabajo anterior
Variable ficticia; 1 sí su ocupación es en
administración, 0 si no es así
Variable ficticia; 1 sí su ocupación es en ventas, 0 si
no es así
a. Obtenga la mejor ecuación estimada de regresión que tenga una
variable.
b. Emplee el procedimiento por pasos para obtener la mejor ecuación
estimada de regresión. Use 0.05 como Alpha to enter y Alpha to
remove.
c. Use el procedimiento de selección hacia adelante para obtener la
mejor ecuación estimada de regresión. Use 0.05 como Alpha to
enter.
d. Use el procedimiento de eliminación hacia atrás para obtener la
mejor ecuación estimada de regresión. Use 0.05 como Alpha to
remove.
e. Use el procedimiento de regresión de los mejores subconjuntos para
obtener la mejor ecuación estimada de regresión.
2. La Ladies Professional Golfers Association (LPGA) lleva estadísticas
sobre el desempeño y las ganancias de sus miembros en la LPGA Tour.
En los archivos titulados LPGATour2.mtw y LPGATour2.xls se presentan
las estadísticas de fin de año sobre el desempeño de las 30 jugadores
que tuvieron las mejores ganancias en la LPGA Tour de 2005
(www.lpga.com, 2006). Earnings (ganancias) (miles) son las ganancias
totales en miles de dólares en todos los eventos de la gira; Scoring Avg.,
es la puntuación promedio de la jugadora en todos los eventos; Drive
Average es la distancia media alcanzada en el drive por el jugador en
yardas; Greens in Reg., es el porcentaje de veces que una jugadora
llega al green en regulación; Putting Avg.. es el promedio de putts
realizados en el green en regulación, y Sand Saves es el porcentaje de
veces que la jugadora logra "subir y bajar" ("up and down") cuando se
encuentra en un búnker de arena al lado de green. Sea Drive Greens
una nueva variable independiente que represente la interacción entre la
distancia media alcanzada en el drive por el jugador y Greens in Reg.
Use los métodos que vimos en clase recientemente para obtener la
mejor ecuación estimada de regresión múltiple para estimar Scoring
Avg. de un jugador.
Related documents