Esta entrada es un resumen del curso de Khan Academy «AP statistics».
Condiciones para inferir datos en rectas de pendiente:
- Linear: La relación ha de ser lineal entre los valores X e Y (correlación).
- Independence: Los datos han de ser independientes, es decir que sean muestras de samples diferentes, o que no se supere el 10% del total de la población.
- Normal: Los datos han de estar normalizados, tanto para los valores X como los valores Y.
- Equal Variance: Han de tener una varianza similar (o también desviación estándar).
- Random: Valores escogidos al azar.
Los grados de libertad para los coeficientes de regresión se calculan usando la tabla ANOVA donde los grados de libertad son n-(k+1), donde k es el número de variables independientes. Entonces, para un análisis de regresión simple, una variable independiente k=1 y los grados de libertad son n-2, n-(1+1).
Intervalos de confianza para pendientes
La fórmula para el cálculo de intervalo de confianza es,
Ejemplo,
Pepona tomó una muestra aleatoria de 20 equipos de fútbol en toda Europa y realizó un seguimiento de la cantidad promedio de goles que marcó cada equipo por partido, y cuántos partidos en total ganó cada equipo, en 2014 - 2015. Aquí está la salida de la computadora de un análisis de regresión de mínimos cuadrados en su muestra:

Asumiendo que todas las condiciones se cumplen, calcula el intervalo de confianza porcentual del 99% para la pendiente de la línea de regresión de mínimos cuadrados.
Cogemos el valor Coef y SE_Coef de la variable independiente, Goals. Y aplicamos la fórmula:
donde t es con DF (18, recuerda 20-2) = 2.878
CI = (15.748, 12.291)
Hipótesis test para pendientes
Cálculo de la estadística t para la pendiente de la línea de regresión, para comprobar que la pendiente de la población es 0.