El modelo lineal general o modelo de regresión multivariante es un modelo estadístico lineal. Puede ser escrito como[1]
donde es una matriz con observaciones de las variables dependientes (siendo cada columna un conjunto de observaciones de una de las variables), es una matriz con observaciones de las variables independientes (siendo cada columna un conjunto de observaciones de una de las variables), es una matriz con parámetros (que, habitualmente, hay que estimar), y es una matriz con errores (ruido). Generalmente, se asume que los errores están incorrelacionados y que siguen una distribución normal multivariante.
El modelo lineal general incluye varios modelos estadísticos diferentes: ANOVA, ANCOVA, MANOVA, MANCOVA, regresión lineal ordinaria, t-test y F-test. El modelo lineal general es una generalización de la regresión lineal múltiple al caso de más de una variable dependiente. Si , y fueran vectores columna, la ecuación matricial anterior representaría un modelo de regresión lineal múltiple.
Los test de hipótesis con el modelo lineal general pueden realizarse de dos formas: multivariantes o como varios test univariantes independientes.
La regresión lineal múltiple es una generalización de la regresión lineal simple al caso de más de una variable independiente, y es un caso particular del modelo lineal general, restringido a una única variable dependiente. El modelo básico de regresión lineal múltiple es
para cada observación .
En la fórmula anterior consideramos n observaciones de una variable dependiente y de p variables independientes. Así, es la -ésima observación de la variable dependiente, y es la observación -ésima de la variable independiente -ésima, . Los valores representan parámetros a estimar, y las variables son los errores normales independientes e idénticamente distribuidos.
En el modelo lineal general, en cambio, hay una ecuación como la anterior para cada una de las variables dependientes, y todas ellas comparten el mismo conjunto de variables explicativas y por tanto son estimadas simultáneamente unas con otras:
para cada observación indexada por y para cada variable dependiente indexada por .