Le but de ce DM est de vérifier que vous avez compris les principales étapes à suivre lorsque l’on analyse un jeu de données.

Pour cela, vous appliquerez la démarche de statistiques descriptives vue en cours aux divers jeux de données proposés:

À chaque étape, vous justifierez que ce que vous calculez ou affichez a bien du sens. Le cas échéant, si le jeu de données ne satisfait pas les hypothèses attendues, vous essayerez de vous restreindre à un sous-ensemble du jeu de données en justifiant vos choix. Si vous avez l’impression qu’il y a plusieurs régimes (successifs ou supperposés), vous séparerez les deux régimes et les analyserez séparément.

On rappelle les différentes fonctions de base de R qui pourront vous êtres utiles: str, summary, mean, diff, sort, var, sd, plot, plot.ts, hist, boxplot.

Récupération des jeux de données

## [1] 11.6838 11.8706 10.9645 11.8823 11.8841 11.8561
##  num [1:23450] 11.7 11.9 11 11.9 11.9 ...

La première visualisation des données

Afin de faciliter l’analyse des jeux de données, nous regardons d’abord la distribution générale de toutes les données.

Il y en a 23450, bien que les données premières sont approximativement autour le valeur de 11.8, totalment,les valeurs de données autour 2.9 sont la majorité.Mais il y a encore beaucoup de données se répartissant dans la cadre entre gamme 3-12.

La structure de jeux de données

Maintenant, je suis curieux du fréquence de la majorité ainsi que la minorité.

Donc au départ je vais vérifier la résumé de la jeux de données.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.831   2.916   2.921   3.042   2.926  12.110

Je trouve le valeur minimum, 1er quart, 3eme quart et la moyennage sont vraiment proches, alors ça me rappel que la minorité peut-être soit très clairsemée. on va la vérifier sur la histogram.

Mon conjecture se confirme par l’histogram. Mais sur cette histogram, la structure de le minorité n’est pas visible, donc il faut changer les indicateurs.

Evidement, les valeurs entre 2.5 et 3 sont la majorité, alors pour la majorité, on va faire une résumé.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.831   2.915   2.920   2.920   2.925   3.000

Les valeurs sont très proche selon le diagramme. maintenant on concerne le structure stationnaire de la majorité.

Heureusement, Dans l’ensemble, il a stabilisé à 2.90-2.95. Bien sûr, il est à noter que l'existence de bruit est autour de la régime stationnaire.

.

.

.

.

.