-
Détails
-
Écrit par Elie Chancelin
-
Catégorie parente: Data mining
-
Catégorie : Manipulation de données à l'aide de données R intégrées
Si le chemin du répertoire Windows est défini, pour importer un fichier dans le système R, il n'est pas nécessaire d'écrire le chemin d'accès complet du fichier. Si le chemin d'accès du répertoire Windows est défini sur un autre emplacement dans votre système et que vous voulez toujours accéder au fichier, le chemin complet doit être donné pour lire le fichier:
[1] "C:/Users/Documents"
> setwd("C:/Users/Documents")
> getwd()
[1] "C:/Users/Documents"
> setwd("C:/Users/Documents")
Tout fichier dans le dossier de documents peut être lu sans mentionner le chemin détaillé. Par conséquent, il est toujours suggéré de changer le répertoire Windows dans le dossier où réside le fichier.
Il existe différents formats de fichiers parmi eux, le format CSV ou texte est le meilleur pour la plate-forme de programmation R. Cependant, nous pouvons importer d'autres formats de fichiers:
[1] "X0" "X70" "X4" "X1" "X1.1" "general" "X57"
[8] "X52" "X41" "X47" "X57.1"
> dt<-read.csv("E:/Datasets/hs0.csv")
> names(dt)
[1] "X0" "X70" "X4" "X1" "X1.1" "general" "X57"
[8] "X52" "X41" "X47" "X57.1"
Si vous utilisez la commande read.csv, il n'est pas nécessaire d'écrire l'en-tête True et le séparateur comme une virgule, mais si vous utilisez la commande read.table, il est obligatoire de l'utiliser. Sinon, il lira la première variable de l'ensemble de données:
> data
<- read.table("E:/Datasets/hs0.csv",header
=T,sep
=",") [1] "X0" "X70" "X4" "X1" "X1.1" "general" "X57"
[8] "X52" "X41" "X47" "X57.1"
> data<- read.table("E:/Datasets/hs0.csv",header=T,sep=",")
> names(data)
[1] "X0" "X70" "X4" "X1" "X1.1" "general" "X57"
[8] "X52" "X41" "X47" "X57.1"
Tout en mentionnant les chemins pour extraire les fichiers, vous pouvez utiliser soit / ou \\; les deux façons fonctionneront. Dans les projets réels, les données sont généralement stockées au format Excel. Comment lire des données au format Excel est un défi. Il n'est pas toujours pratique de stocker des données au format CSV, puis de les importer. Le script suivant montre comment importer des fichiers Excel dans R. Deux bibliothèques supplémentaires sont nécessaires pour importer un fichier SGBDR tel qu'Excel. Ces bibliothèques sont mentionnées dans le script et les exemples de données sont également fournis:
Loading required package: rJava
Loading required package: xlsxjars
> dat<-read.xlsx("E:/Datasets/hs0.xls","hs0")
gender id race ses schtyp prgtype read
write math science socst
1 0 70 4 1 1 general 57 52 41 47 57
2 1 121 4 2 1 vocati 68 59 53 63 61
3 0 86 4 3 1 general 44 33 54 58 31
4 0 141 4 3 1 vocati 63 44 47 53 56
5 0 172 4 2 1 academic 47 52 57 53 61
6 0 113 4 2 1 academic 44 52 51 63 61
> library(xlsx)
Loading required package: rJava
Loading required package: xlsxjars
> library(xlsxjars)
> dat<-read.xlsx("E:/Datasets/hs0.xls","hs0")
> head(dat)
gender id race ses schtyp prgtype read write math science socst
1 0 70 4 1 1 general 57 52 41 47 57
2 1 121 4 2 1 vocati 68 59 53 63 61
3 0 86 4 3 1 general 44 33 54 58 31
4 0 141 4 3 1 vocati 63 44 47 53 56
5 0 172 4 2 1 academic 47 52 57 53 61
6 0 113 4 2 1 academic 44 52 51 63 61
L'importation de données à partir de fichiers SPSS est expliquée comme suit. Les systèmes logiciels d'entreprise hérités génèrent des données au format SPSS ou au format SAS. La syntaxe d'importation de données à partir de fichiers SPSS et SAS nécessite des packages ou des bibliothèques supplémentaires. Pour importer les fichiers SPSS, le package Hmisc est utilisé et pour importer les fichiers SAS, la bibliothèque sas7bdat est utilisée:
> mydata <- spss.get("E:/Datasets/wage.sav", use.value.labels=TRUE)
HRS RATE ERSP ERNO NEIN ASSET AGE DEP RACE SCHOOL
1 2157 2.905 1121 291 380 7250 38.5 2.340 32.1 10.5
2 2174 2.970 1128 301 398 7744 39.3 2.335 31.2 10.5
3 2062 2.350 1214 326 185 3068 40.1 2.851 NA 8.9
4 2111 2.511 1203 49 117 1632 22.4 1.159 27.5 11.5
5 2134 2.791 1013 594 730 12710 57.7 1.229 32.5 8.8
6 2185 3.040 1135 287 382 7706 38.6 2.602 31.4 10.7
> mydata <- read.sas7bdat("E:/Datasets/sales.sas7bdat")
YEAR NET_SALES PROFIT
1 1990 900 123
2 1991 800 400
3 1992 700 300
4 1993 455 56
5 1994 799 299
6 1995 666 199

> library(Hmisc)
> mydata <- spss.get("E:/Datasets/wage.sav", use.value.labels=TRUE)
> head(mydata)
HRS RATE ERSP ERNO NEIN ASSET AGE DEP RACE SCHOOL
1 2157 2.905 1121 291 380 7250 38.5 2.340 32.1 10.5
2 2174 2.970 1128 301 398 7744 39.3 2.335 31.2 10.5
3 2062 2.350 1214 326 185 3068 40.1 2.851 NA 8.9
4 2111 2.511 1203 49 117 1632 22.4 1.159 27.5 11.5
5 2134 2.791 1013 594 730 12710 57.7 1.229 32.5 8.8
6 2185 3.040 1135 287 382 7706 38.6 2.602 31.4 10.7
> library(sas7bdat)
> mydata <- read.sas7bdat("E:/Datasets/sales.sas7bdat")
> head(mydata)
YEAR NET_SALES PROFIT
1 1990 900 123
2 1991 800 400
3 1992 700 300
4 1993 455 56
5 1994 799 299
6 1995 666 199
L'exportation d'un ensemble de données de R vers un emplacement externe peut être effectuée en modifiant la commande read dans la commande write et en modifiant le chemin du répertoire dans lequel vous voulez stocker le fichier.