Mesnier Vincent, Hamdani Youcef et Eric Michel Fotsing

Approche experimental :

Question 1 : Ecrire un simulateur en R generant T en fonction de M

T: le nombre total de vignettes achetées pour avoir toute la collection M: places distincts dans l’album pour avoir la collection compléte= 300

l’idée : il faut generer de facon uniforme un nombre aleatoire entre 1 et 300 et arreter lorsque 300 valeurs ont été trouvé. Il faut trouver le nombre de fois que tu as besoin de generer un nombre afin de trouver les 300 cartes. Pour cela, on peut prendre un tableau de 300 cases à O Dés que je genere un nombre aleatoire je met l’indice,correspondand à la valeur generer precedamment, du tableau à 1 en incrementant un compteur. Il faut ensuite repeter cette operation tant que y’a une valeur à 0 dans le tableau

vignettes <- function(M= 300) {
  album=c()
  nbVi=0
  for(i in (1:M)) {
  album[i] = 0
  }
  while (mean(album)<1){
     v=sample(1:M,1)
     album[v]=1
     nbVi=nbVi+1
  }
 #data.frame(nbVi,M)
 return(nbVi)
}
vignettes()
## [1] 1857

Question 2 :

Etude experimental sur la valeur moyenne de T en fonction de M avec des echantillons de 1000 et des valeurs de M varient entre 10 et 200 On a choisit des valeur comme valeurs valeur pour M = (10,30,50,70,90,110,130,150,160,170,180,200)

total1=c()
total2=c()
total3=c()
total4=c()
total5=c()
total6=c()
total7=c()
total8=c()
total9=c()
total10=c()
total12=c()
total11=c()
M=c(10,30,50,70,90,110,130,150,160,170,180,200)
for (i in 1:100){
  total1[i]=vignettes(M[1])
  total2[i]=vignettes(M[2])
  total3[i]=vignettes(M[3])
  total4[i]=vignettes(M[4])
  total5[i]=vignettes(M[5])
  total6[i]=vignettes(M[6])
  total7[i]=vignettes(M[7])
  total8[i]=vignettes(M[8])
  total9[i]=vignettes(M[9])
  total10[i]=vignettes(M[10])
  total11[i]=vignettes(M[11])
  total12[i]=vignettes(M[12])
}

nbVignettes<-0
nbVignettes[M[1]]=mean(total1)
nbVignettes[M[2]]=mean(total2)
nbVignettes[M[3]]=mean(total3)
nbVignettes[M[4]]=mean(total4)
nbVignettes[M[5]]=mean(total5)
nbVignettes[M[6]]=mean(total6)
nbVignettes[M[7]]=mean(total7)
nbVignettes[M[8]]=mean(total8)
nbVignettes[M[9]]=mean(total9)
nbVignettes[M[10]]=mean(total10)
nbVignettes[M[11]]=mean(total11)
nbVignettes[M[12]]=mean(total12)  
plot(nbVignettes)

plot of chunk unnamed-chunk-2

On remarque que la courbe est de la forme Mlog(M) Plus M augmente plus le nb de vignettes qu’il faudra acheté sera grand. C’est une loi linéaire uniforme

Modelisation :

Question 3:

d’aprés l’enoncé les hypothéses statistiques sur la suite des variables Xn sont: indépendantes,identiquement distribuée(meme proportion pour chaque vignettes) et qu’elles suivent une lois uniforme sur 0…M.

Question 4 :

On a une epreuve de Bernoulli dont la probabilité de succés(c’est a dire d’avoir une carte qu’on a pas) est de p et celle d’echec q=1-p (obtenir une carte qu’on a déja) Dans notre cas nous allons renouveller (tant qu’il y a echec) Bernouilli de manière indépendante jusqu’a achat une nouvelle carte (succes)

D’aprés l’énoncé Yi est le nombre de vignettes à acheter pour avoir une vignettes qui n’est pas dans la collection (c’est à dire le nombre de fois où on renouvelle l’epreuve jusqu’au premier succés)

Donc la probabilité pour que Yi est k-1 fois d’echec (donc d’acheter une carte en double) et la K-iéme fois une succés (acheter une carte qu’il n’a pas) est de P(Yi=k)= q^(K-1) x p

avec p=(M-(i-1))/M et q=(i-1)/M

Justification de p :

pour simplifié, c’est la probabilité d’avoir une nouvelles vignettes au bout du Kieme achat Par exemple pour k=1 P(y1=1)=1 on a 100% de chance d’avoir une vignette qu’on a pas vu qu’on en posséde pas. la probabilité qu’au 2éme tirages on est une nouvelle carte est de 299/300 (pour M=300) vu qu’on en a deja une, cela enléve une possibilité. la probabilité qu’au 3eme tirage on est une nouvelle carte est de 298/300 On peut trouver une formule general p= (M-(i-1))/M avec i le numero du tirage Pour trouver q on fait simplment p=1-q

On éleve q à la puissance K-1 car on a k achat et que l’on s’arete dés que l’achat est une nouvelle carte donc on a K-1 echéc avant

On peut donc en déduire que c’est une lois géométrique.

On peut maintenant calculer l’esperance qui vaut 1/p pour une lois géométrique et la variance qui vaut q/(P^2)

E(Yi)= 1/p=M/(M-(i-1)) Var(Yi)=q/(p^2)=((i-1)/M) / ((M-(i-1))/M)^2

Les variables Yi sont indépendantes car à la base on considère une épreuve de Bernoulli dont la probabilité de succès est p et celle d’échec puis on renouvelle cette épreuve de manière indépendante jusqu’au premier succès

Pour l’esperence : E(T)= E * ∑(i=1->300)[Yi] on peut utiliser la linéarité de l’esperence E(T)= E(Y1) + E(Y2) + … +E(Yn)= (M/M) + (M/M-1) + … +M/1 . (on peut ensuite factoriser par M) Quand M est grand E(T)=M∗(log(M)+y)

Pour la variance : V(T)=V(∑(i=1->M)[Yi]) = ∑(i=1->M) [V(Yi)] + 2 ∗ ∑1≤iM) [V(Yi)] ≤ ∑(i=1->M) [(M2)/(M−(i−1))2] = M^2∗∑(i=1->M)[1/(M−(i−1))^2]

Quand M est très grand alors V(T) tend vers : (M^2) ∗ (π/6)

Synthése :

Question 5:

Simulation de E(T)

Esp <- function(M=300){
  ey=0
  r=c()
  for (j in 1:M){
    ey=0
    for (i in 1:j){
        ey=ey+(j/(j-(i-1)))
        }
    r[i]=ey
  }
  plot(r)
  }


Esp()

plot of chunk unnamed-chunk-3

Simulation de V(T)

Var <- function(M=300){
  vy=0
  r=c()
  for (j in 1:M){
    vy=0
    for (i in 1:j){
        vy=vy+(j*(i-1))/((j-i+1)^2)
        }
    r[i]=vy
  }
  plot(r)
  }

Var()

plot of chunk unnamed-chunk-4

Question 6:

esperenceT <- function (M=300){
  E=0
  for (i in 1:M){
    E=E+(1/i)
    
  }
  E=E*M
  return(E)
}
esperenceT()
## [1] 1885

On trouve 1884.799 vignettes. Il faut arrondir a la dizaine au dessus car les cartes se vendent par 10 donc on obtient 1890 que l’on divise par 10 pour avoir le nombre de paquet et qu’on multiplit par 2 pour avoir le cout total moyen (1890/10)*2=378 euros.

Question 7

Avec une probabilité d’obtenir la carte i est pi=1/ai avec a=somme de K=1 à M de 1/k

#pour calcul chaque proba de chaque carte
ProbaNonUniforme <- function(M=300,i){
  a=0
  p=0
  for(k in 1:M){
        a=a+(1/k)
      }
  p=1/(a*i)
  return(p)
}

vignettesNonUni<- function(M= 300) {
  p=c()
  for(k in 1:M){
        p[k]= ProbaNonUniforme(300,k)
      }
  album=c()
  nbVi=0
  for(i in (1:M)) {
  album[i] = 0
  }
  while (mean(album)<1){
     album[sample(seq(1,300),1,prob=p)]=1
     nbVi=nbVi+1
  }
  return(nbVi)
}


res=c()
for (i in 1:100){
  res[i]=vignettesNonUni()
  }
plot(res)

plot of chunk unnamed-chunk-6

mean(res)
## [1] 8107

On peut remarquer, grace notamment avec le graphique, qu’il y a un ecart type élévé (cela va de 3000 a plus de 15 000 achats de vignettes)

Avec une probabilité d’obtenir la carte i est pi=1/a(i^2) avec a=somme de K=1 à M de 1/k^2

#pour calcul chaque proba de chaque carte
ProbaNonUniforme2 <- function(M=300,i){
  a=0
  p=0
  for(k in 1:M){
        a=a+(1/(k*k))
      }
  p=1/(a*i*i)
  return(p)
}

vignettesNonUni2<- function(M= 300) {
  p2=c()
  for(k in 1:M){
        p2[k]= ProbaNonUniforme2(M,k)
      }
  album2=c()
  nbVi=0
  for(i in (1:M)) {
  album2[i] = 0
  }
  while (mean(album2)<1){
     album2[sample(seq(1,M),1,prob=p2)]=1
     nbVi=nbVi+1
  }
  return(nbVi)
}


res2=c()
for (i in 1:100){
  res2[i]=vignettesNonUni2(50)
  }
plot(res2)

plot of chunk unnamed-chunk-7

mean(res2)
## [1] 10251

Avec ces probabilité, on peut voir que la moyenne a nettement augmenté par rapport à precedemment

Grace a ces simulateurs, on peut voir qu’il est plus difficile de trouver l’ensemble des vignettes si celle ci n’ont pas les même probabilité d’apparition

Question 8: