Un diagrama de caja (también, diagrama de caja y bigotes o box plot) es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles. De esta manera, se muestran a simple vista la mediana y los cuartiles de los datos,[1] y también pueden representarse sus valores atípicos. Conviene recordar que se utilizan las bisagras de Tukey, y no los cuartiles, a la hora de dibujar la caja del gráfico, aunque los resultados son semejantes en muestras grandes.
Discretas y Continuas
El diagrama de caja incluye los siguientes elementos:
Para la elaboración de manera manual de este tipo de gráfico, primero se obtiene la media de cada intervalo, y luego la mediana de la tabla de frecuencias en general. Con estos datos, se utiliza la fórmula de la media de cada intervalo elevado a la mediana. Los datos obtenidos en esta fórmula son la interpretación.
+-----+-+ * o |-----------| | |---| +-----+-+ +---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+ 0 1 2 4 5 7 9 10 12 15
Cuando los datos se extienden más allá de esto, significa que hay valores atípicos en la serie y entonces hay que calcular los límites superior e inferior, Li y Ls.