Este código de R corresponde a la figura 6.10 del libro Análisis de datos con el programa estadístico R: una introducción aplicada de Salas-Eljatib (2021).

Cargando los datos de ejemplo

Ocuparemos la dataframe fishgrowth del paquete datana.

library(datana)
data(fishgrowth)
df <- fishgrowth
head(df) #primeras seis filas
  age length  scale
1   1     71 1.9061
2   1     64 1.8771
3   1     57 1.0974
4   1     68 1.3311
5   1     72 1.5928
6   1     80 1.9160
nrow(df) #numero de filas de la dataframe
[1] 439

Estos datos contienen variables biometricas para individuos del pez Micropterus dolomieu en el lago West Bearskin del estado de Minnesota (USA). Estos datos provienen del paquete alr4 Weisberg (2014) del libro de Weisberg (2013).

El gráfico

Para realizar este gráfico basta símplemente con utilizar la función xyBoxplot del paquete datana de Salas-Eljatib (2021).

source("xyBoxplot.R") #aca cargo la funcion
xyBoxplot(x=df$length,y=df$scale) #aplicando la funcion con opciones por defecto

xyBoxplot(x=df$length,y=df$scale, xlab="Variable x",
       col.dots = "red")#color de los puntos

El gráfico del libro

xyBoxplot(x=df$length,y=df$scale, ylab="Radio (mm)",
       xlab="Largo (mm)")

Este gráfico puede ser de mucha utilidad tambien para cuando se esta analizando la homocedasticidad de los residuales de un modelo de regresion. Por ejemplo, ver la figura sobre residuales de un modelo estadístico para cada variable predictora en Salas, Stage, and Robinson (2008).

Bibliografía

Salas, C., A. R. Stage, and A. P. Robinson. 2008. “Modeling Effects of Overstory Density and Competing Vegetation on Tree Height Growth.” Forest Sci. 54 (1): 107–22.

Salas-Eljatib, C. 2021. Análisis de datos con el programa estadístico R: una introducción aplicada. Santiago, Chile: Editorial Universidad Mayor.

Weisberg, S. 2013. Applied Linear Regression. 4rd ed. USA: Wiley-Interscience.

———. 2014. alr4: Methods and Data to Accompany Applied Linear Regression, Fourth Edition. Hoboken, NJ: Wiley. http://z.umn.edu/alr4ed.