• Relation numérique-numérique
• Relation numérique à catégorique
• Relation catégorielle à catégorique
Pour connaître la relation bivariée entre deux variables numériques, un diagramme de dispersion est généralement utilisé si les deux variables sont continues, et un graphique à barres est utilisé si une variable est catégorique et l'autre est continue:
> bibliothèque (ggplot2)
> bibliothèque (gridExtra)
> ggplot (Cars93,
aes (Cars93 $ Prix, Cars93 $ MPG.city)) + geom_point (aes (couleur = (Cars93 $ Type))) + ge
om_smooth ()
Figure 1: Montrer la relation entre le prix et le kilométrage dans une ville pour différents types de voitures
De même, la relation entre le prix et le kilométrage sur route peut être représentée à l'aide d'un diagramme de dispersion:
> bibliothèque (ggplot2)
> bibliothèque (gridExtra)
> ggplot (Cars93,
aes (Cars93 $ Prix, Cars93 $ MPG.highway)) + geom_point (aes (couleur = (Cars93 $ Type)))
+ geom_smooth ()
Figure 2: Relation entre le prix et le kilométrage sur les autoroutes
Les relations numeric-categorical et two-categorical sont expliquées en détail dans le chapitre 3, Visualize Diamond Dataset.
La relation multivariée est un moyen statistique d'examiner plusieurs variables dépendantes et indépendantes et leurs relations. Dans ce chapitre, nous parlerons brièvement des relations multivariées entre plus de deux variables, mais nous discuterons des détails de l'analyse multivariée dans nos chapitres suivants. Les relations multivariées entre diverses variables peuvent être connues en utilisant la méthode de corrélation ainsi que la tabulation croisée: