• analyse-de-donnes-cestad
  • analytics_tools_original
  • data-minig1
  • data-minig2
  • Data-Mining-1030
  • Big-data-azzurro
  • marketing-statistics
Enquêtes
Collete des données
Traitement des données
Analyse des données
 
Programmation
Programmation statistique
Developpement des macros
Modélisation et plus encore
 
Data Mining
Exploration des données
Modélisation prédictive
Big Data
 
Formations certifiantes
Formations à la carte
Semilaires et conférences

 

 

La relation ou l'association entre deux variables est connue sous le nom d'analyse bivariée. Il y a trois façons possibles de regarder la relation:
• Relation numérique-numérique
• Relation numérique à catégorique
• Relation catégorielle à catégorique
Pour connaître la relation bivariée entre deux variables numériques, un diagramme de dispersion est généralement utilisé si les deux variables sont continues, et un graphique à barres est utilisé si une variable est catégorique et l'autre est continue:
> bibliothèque (ggplot2)
> bibliothèque (gridExtra)
> ggplot (Cars93,
aes (Cars93 $ Prix, Cars93 $ MPG.city)) + geom_point (aes (couleur = (Cars93 $ Type))) + ge
om_smooth ()
 
Figure 1: Montrer la relation entre le prix et le kilométrage dans une ville pour différents types de voitures

De même, la relation entre le prix et le kilométrage sur route peut être représentée à l'aide d'un diagramme de dispersion:
> bibliothèque (ggplot2)
> bibliothèque (gridExtra)
> ggplot (Cars93,
aes (Cars93 $ Prix, Cars93 $ MPG.highway)) + geom_point (aes (couleur = (Cars93 $ Type)))
+ geom_smooth ()
 
Figure 2: Relation entre le prix et le kilométrage sur les autoroutes
Les relations numeric-categorical et two-categorical sont expliquées en détail dans le chapitre 3, Visualize Diamond Dataset.

La relation multivariée est un moyen statistique d'examiner plusieurs variables dépendantes et indépendantes et leurs relations. Dans ce chapitre, nous parlerons brièvement des relations multivariées entre plus de deux variables, mais nous discuterons des détails de l'analyse multivariée dans nos chapitres suivants. Les relations multivariées entre diverses variables peuvent être connues en utilisant la méthode de corrélation ainsi que la tabulation croisée: