Análisis visual de dependencia bivariada entre variables aleatorias continuas

Ponente(s): Arturo Erdely Ruiz, Manuel Rubio Sánchez
Los scatterplots generados a partir de pares de variables aleatorias continuas pueden no ser herramientas confiables para evaluar la dependencia entre ellas. El teorema de Sklar implica que los diagramas de dispersión creados a partir de sus estadísticos de orden (rankplots) son preferibles para dicho análisis, ya que exclusivamente transmiten información pertinente a la dependencia. Esto contrasta marcadamente con los scatterplots convencionales, que mezclan información de la dependencia con información sobre las distribuciones marginales de las variables. Dicha información adicional es ajena al análisis de dependencia y puede distorsionar la interpretación visual de la relación entre las variables. En esta presentación se exploran los fundamentos teóricos de los rankplots, y se ofrecen perspectivas sobre cómo interpretar la información que revelan. Se examinan sus conexiones con diversas medidas de asociación, incluidos los coeficientes de correlación de Pearson y Spearman, así como la medida de dependencia de Schweizer-Wolff. Además, se introduce una visualización novedosa para el análisis de dependencia, denominada dplot, y se demuestra su eficacia a través de ejemplos con datos reales. https://arxiv.org/abs/2404.00820