miércoles, 16 de noviembre de 2016
sábado, 12 de noviembre de 2016
Regresión Lineal Múltiple
Mediante un modelo de regresión lineal múltiple, se pretende
explicar el comportamiento de una determinada variable que denominaremos
variable a explicar, variable endógena o variable dependiente, (y
representaremos con la letra Y) en función de un conjunto de k variables
independientes explicativas X1, X2, ..., Xk
Para determinar el modelo anterior, es necesario hallar
(estimar) el valor de los coeficientes a, b1, b2, b3,.., bn. Para encontrar una ecuación que permita estimar
el valor de la variable dependiente con base en la variable independiente
Ejemplo:
Los siguientes datos
corresponden al % de ventas esperado respecto al mes anterior cuyos valores
dependen tanto del mes anterior como de la inversión en propaganda.
a) Obtenga la ecuación de regresión
múltiple
b) Cuál es el valor esperado para el mes
11, si la inversión en propaganda será de 2M$?
CON EXCEL
Ejercicio
de clase:
En un cierto país, se tienen los datos de
ña remuneración media por hora y la tasa de desempleo entre los años 2010 y 2014.
Remuneración por hora (Dlls)
|
Tasa de desempleo (%) X1
|
Tiempo (años) X2
|
2.19
|
6.1
|
2010 (1)
|
2.26
|
6.2
|
2011 (2)
|
2.32
|
7.8
|
2012 (3)
|
2.39
|
5.8
|
2013 (4)
|
2.46
|
5.7
|
2014 (5)
|
Obtenga:
a) La ecuación de regresión múltiple
b) Calcule la remuneración esperada para 2017, con una tasa de
desempleo de 0.5
c) Calcule la remuneración esperada para 2016, con una tasa de
desempleo de 5
miércoles, 9 de noviembre de 2016
ANÁLISIS DE REGRESIÓN LINEAL
Una vez determinada la
existencia de la relación entre dos variables se procede a realizar un análisis
de regresión, que consiste en:
Desarrollar la ecuación de regresión y proporcionar
estimados de Y con base en valores de X, mediante el uso del Método de Mínimos
Cuadrados.
La fórmula es:
Ejercicio de Tarea
La
siguiente tabla muestra la tensión arterial de una muestra de pacientes de
acuerdo a su edad.
Obtenga
a) El diagrama de dispersión
b) Coeficiente de correlación
c) Prueba de Hipótesis sobre el coeficiente
d) El modelo de regresión lineal
e) La tensión arterial esperada para una persona de
36 años
miércoles, 2 de noviembre de 2016
COEFICIENTE DE CORRELACIÓN
Definición: Grupo de técnicas para medir la asociación entre dos variables
En este tema el foco
de interés cambia hacia el estudio de la relación entre dos variables, por
ejemplo:
a) cantidad que se gasta por mes en
publicidad y el resultado de sus ventas mensuales
b) kilómetros por litro y el peso del auto
c) relación entre el número de horas que
estudiaron los alumnos para un examen y la calificación que obtuvieron
Identificando
si la relación entre dos variables es:
·
Fuerte o débil
·
Directa o Inversa
Desarrollando
una ecuación para expresar dicha relación y estimar una variable con base en
otra, utilizando el análisis de regresión.
La idea básica del
análisis de correlación es reportar la asociación entre dos variables. Por lo
general, el primer paso es trazar los datos en un diagrama de dispersión.
En este diagrama debemos identificar dos variables:
·
La variable independiente proporciona la base
para la estimación. Es la variable predictora. Regularmente (x)
La variable dependiente es la variable que se desea predecir o estimar. También puede ser descrita como el resultado de un valor conocido de la variable independiente.
Regularmente (y)
El primer paso para realizar un análisis de correlación consiste en
trazar un diagrama de dispersión, determinando cuál es la variable
independiente (X) y cuál la variable dependiente (Y).
2.
miércoles, 26 de octubre de 2016
ANOVA
TEMA: ANÁLISIS DE VARIANZA
SUBTEMA: PRUEBA F ANOVA (Análisis de
la Técnica de la Varianza)
Se trata de realizar una prueba de hipótesis para comparar tres o más
medias poblacionales (m),
para determinar si pueden ser iguales. Se utiliza la distribución de
probabilidad F.
Características
1. Las poblaciones siguen una distribución normal
2. Las poblaciones tienen desviaciones estándares iguales (s)
3. Las poblaciones son independientes
Ejercicios
1.
Las aerolíneas desde hace algún tiempo han reducido sus servicios como
alimentos y bocadillos durante sus vuelos, y empezaron a cobrar un precio
adicional por algunos de ellos. Una empresa realizó una encuesta de 25
preguntas con 4 posibles respuestas: para excelente se consideraron 4 puntos,
para bueno 3, para regular 2 y para deficiente 1. La calificación mayor será de
100 puntos.
De
acuerdo a los siguientes valores obtenidos al encuestar pasajeros de 4
aerolíneas. ¿Hay alguna diferencia entre los niveles de satisfacción medios con
respecto a las 4 aerolíneas? Use un nivel de significancia de 0.01
Northern | WTA | Pocono | Branson |
94 | 75 | 70 | 68 |
90 | 68 | 73 | 70 |
85 | 77 | 76 | 72 |
80 | 83 | 78 | 65 |
88 | 80 | 74 | |
68 | |||
65 |
2.
Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la
hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se
seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5 grupos.
Al primero de ellos no se le suministra ningún tratamiento, al segundo una
dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el
fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las
presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos
son:
Grupo
|
||||
1
|
2
|
3
|
4
|
5
|
180
|
172
|
163
|
158
|
147
|
173
|
158
|
170
|
146
|
152
|
175
|
167
|
158
|
160
|
143
|
182
|
160
|
162
|
171
|
155
|
181
|
175
|
170
|
155
|
160
|
Hay diferencia significativa de la eficacia del tratamiento
contra la hipertensión, entre los cinco
grupos?
3 Para determinar si existe
diferencia significativa en el nivel de Matemáticas de 4 grupos de
estudiantes de Ingeniería se realizó un examen aleatorio a 6 individuos
por grupo. Determine cuáles son los grupos en los cuales existen diferencias a
un 95% de nivel de confianza.
A | B | C | D |
75 | 78 | 55 | 64 |
93 | 91 | 66 | 72 |
78 | 97 | 49 | 68 |
71 | 82 | 64 | 77 |
63 | 85 | 70 | 56 |
76 | 77 | 68 | 95 |
lunes, 24 de octubre de 2016
ANÁLISIS DE VARIANZA
TEMA: ANÁLISIS DE VARIANZA
SUBTEMA: PRUEBA F PARA LA RAZÓN DE
DOS VARIANZAS
Se trata de realizar una prueba de hipótesis para varianzas s2. Con ella se
prueba si dos muestras provienen de poblaciones que tienen varianzas iguales. Se
utiliza la distribución de probabilidad F, la cual debe su nombre a sir Ronald Fisher,
utilizando n-1 grados de libertad de cada muestra.
Características
1. Existe una familia de distribuciones F
2. La distribución F es continua
3. La distribución F no puede ser negativa
4. Tiene sesgo positivo
5. Es asintótica
TABLAS DE LA DISTRIBUCIÓN F
EJEMPLO
1. Un servicio de Limusinas
considera dos rutas al aeropuerto. Una por la carretera 25 y otra por la
autopista I-75. El Gerente está interesado en comparar los tiempos de las dos
rutas para saber si existe alguna diferencia entre la variación de los tiempos de manejo de las dos rutas. Usando
un nivel de significancia de 0.10, realice una prueba de hipótesis considerando
los siguientes valores maestrales.
EJERCICIOS DE CLASE
1. Un profesor quiere determinar si hay mayor
variabilidad en las puntuaciones de los exámenes finales de los alumnos que
toman el curso de Introducción a la Contabilidad, pero que no están estudiando
la carrera de Contaduría, que en las de aquellos que toman el curso y estudian
la carrera de Contaduría. Para determinarlo toma una muestra de 13 alumnos de su lista que no están
estudiando Contaduría y una muestra de 10 alumnos de su lista que están
estudiando Contaduría, compruebe la sospecha del profesor con un nivel de significancia del 0.05.
Considere los siguientes datos:
n1=13
|
n2=10
|
varianza=210.2 |
varianza=36.5
|
2. El corporativo de un banco desea conocer si
existe evidencia de una variabilidad en los tiempos de espera para mejorar el
proceso de atención, de una sucursal ubicada en una zona residencial y otra
ubicada en zona comercial. Considere un nivel de significancia del
10% y los siguientes datos:
Zona Residencial
4.21
|
5.55
|
3.02
|
5.13
|
4.77
|
2.4
|
3.54
|
6.19
|
6.46
|
5.12
|
0.38
|
6.1
|
4.5
|
3.2
|
Zona Comercial
9.66
|
5.9
|
8.02
|
5.79
|
8.73
|
3.82
|
8.01
|
9.91
|
6.17
|
4.08
|
5.64
|
6.68
|
10.49
|
8.35
|
3.
La escala de evaluación de la
ansiedad que provocan las
computadoras en las computadoras utilizan una escala desde 20 (sin ansiedad),
hasta 100 (mayor ansiedad).
Investigadores de la Universidad de Miami, aplicaron esta prueba a 172
estudiantes, con el fin de evaluar si existe mayor variabilidad en la ansiedad
en los hombres que estudian administración que en las mujeres. Los resultados
fueron los siguientes:
Medida
|
Hombres
|
Mujeres
|
media |
40.26
|
36.85
|
Varianza
|
13.35
|
9.42
|
Tamaño de muestra
|
100
|
72
|
Con un nivel de
significancia del 0.01. Pruebe la sospecha de la Universidad de Miami
4. Un
estudio sobre los hábitos de escuchar iPod de hombres y mujeres, identificó que
el tiempo medio de escucha de los hombres era de 35 minutos por día, en una muestra
de 10 hombres, con una desviación estándar de 10 minutos por día. El tiempo medio de escucha de las 12 mujeres
estudiadas también fue de 35 minutos, pero la desviación estándar fue de
12 minutos por día. A un nivel de
significancia de 0.10 ¿Puede concluir que hay variación entre los tiempos de
escucha de los hombres y de las mujeres?
Suscribirse a:
Entradas (Atom)