# Projet à rendre (option 2) : Évolution d'un indice de popularité

**Groupe: Prenom,Nom1 -- Prenom,Nom2**
## Consignes 
Le projet est à rendre pour le jeudi 13 avril 20h (par groupe de deux maximum), par mail à nicolas.gast@imag.fr. 

Merci de ne rendre:
* votre notebook ipython 
* un export de votre notebook en html 

Pendant la mini-soutenance, il vous sera demandé de commenter ce que vous avez fait, de refaire tourner votre code et d'expliquer vos résultats. 

In [4]:
import numpy as np
import matplotlib.pylab as plt
%matplotlib inline

## Exercice 1

L'objectif de ce projet est d'étudier un modèle d'évolution de la
popularité de contenu sur le web. En particulier, on s'intéresse au comportement limite du système en simulant le modèle.

Le choix des contenus visionnés un internaute est influencé par la
popularité de objets en question (pages web, films, musiques,...).
Une des façon de mesure la popularité d'un objet est en calculant le
nombre total de visites ce contenu. Cette popularité évolue au cours
du temps est est utilisée par différents acteurs économiques
(annonceurs, gestionnaires de site).
Dans la plupart des systèmes actuels, la popularité est donnée à
l'internaute en même temps que l'objet (sous forme d'étoiles, de
niveau de popularité,...). Cette connaissance de la popularité par
l'internaute influence donc son choix: un internaute va plus
facilement cliquer sur une vidéo ayant un million de vues que sur une
vidéo visionnée 11 fois.

Dans ce TP, on cherche à analyser comment évolue la popularité
relative de deux objets $A$ et $B$. On définit la popularité relative
de l'objet $A$ par:
$$
 \text{Popularite relative de $A$} = \frac{\text{nombre de vues de $A$}}{
    \text{nombre de vues de $A$} + \text{nombre de vues de $B$}}
$$

Pour simplifier l'analyse, on suppose que lorsqu'un internaute
choisit de visionner un objet, il choisit cet objet avec une
probabilité proportionnelle aux nombre de vues. Par exemple, si $10$
personnes ont déjà visionnées la vidéo $A$ et $20$ personnes la
vidéos $B$, alors la prochaine vidéo $A$ ou $B$ visionnée est $A$
avec probabilité $1/3$ et $B$ avec probabilité $2/3$. Autrement dit,
$A$ est choisit avec la probabilité ``popularité relative de $A$''.




## Question 0: Décrire votre intuition

Avant de vous lancer dans la simulation, faite vous une intuition sur la
manière dont va évoluer la popularité au fil des visites. Pensez-vous
qu'elle va se stabiliser, vers quelle limite,...

Décrire votre intuition a
uniquement pour but que vous commenciez à réfléchir au problème et de
réaliser à quel point sa propre intuition peut être correcte ou pas.
Vous analyserez en fin de TP cette intuition au vu des résultats
statistiques observés.




## Question 1: Observation de la dynamique

On note $n$ le nombre total de vues des objets $A$ et $B$ et on
s'intéresse dans un premier temps à l'évolution de la popularité
$popularite(n)$ à l'instant $n$ en partant d'une popularité initiale de
$\frac 12$ (chaque vidéo a été vue une fois). Voici une fonction 
qui simule pop(n):


Tracer sur un même graphe, 10 trajectoires de $pop(n)$ pour $n$ allant de $1$ à $T$ (pour
un $T$ qui sera justifié). Commenter le graphe. Que dire de la
convergence de $pop(n)$?



In [5]:
def popularite(n):
    x = [.5]
    for k in range(n):
        if (np.random.rand() <= x[k]):
            x.append(x[k] + x[k]*(k+1))/(k+2)
        else:
            x.append(x[k]*(k+1))/(k+2)
    return(x)



## Question 2: Loi statistique de la limite

On s'intéresse maintenant à la variable aléatoire
$\lim_{n\to\infty} pop(n)$ (si tant est que cette limite existe) et
notamment à sa loi statistique. Afin d'avoir une idée de son allure,
tracer l'histogramme de la valeur limite de $pop(n)$ pour au moins un
millier de trajectoires. Quelle est la loi de la valeur limite ?
Justifier votre réponse.



## Question 3: Influence de la répartition initiale

Il est très probable que l'état initial ait une influence sur la loi
de la limite de $pop(n)$. Pour comprendre l'influence de la
répartition initiale, tracer les histogrammes des limites des
trajectoires correspondant aux configurations initiales
\begin{array}{l|llllll}
  \text{nombre initial de visites de $A$} & 2 & 3 & 10 & 20 \\ 
  \hline
  \text{nombre initial de visites de $B$} & 1 & 1 & 10 & 10 
\end{array}
Commenter vos observations.



## Question 4: Analyse théorique

On note $X_n$ le nombre de "Like" pour $n$ visites. En reprenant les hypothèses de la
question 1 et 2, on part de $X_2=1$. Calculer par récurrence la loi de
$X_n$, puis la loi de $pop(n)=\frac {X_n} n$ et en déduire la loi de la
limite de $pop(n)$.



## Question 5: Avez-vous changé d'avis ?

Au delà des aspects purement techniques de la chose que ce devoir a pu
vous apprendre, le résultat de cette étude est-il conforme à votre
intuition initiale ? Pensez-vous à d'autres hypothèses que vous
pourriez tester ?



# Exercice 2

On étudie maintenant un modèle de popularité différent. On considère qu'une population de $N$ individus qui peuvent être fans soit de l'équipe A, soit de l'équipe B. A chaque pas de temps, on choisit un fan au hazard. 
* Avec probabilité 1/2, celui-ci change d'avis et devient fan de l'autre équipe
* Avec probabilité 1/2, celui-ci devient fan de l'équipe A. 
On note $X_n$ le nombre de fans de l'équipe A. 

## Question 1 
$X_n$ est-elle une chaîne de Markov? Si oui décrire sa matrice de transition. 

## Question 2
On pose $N=10$. Calculer la mesure stationnaire de $X_n$. En régime stationnaire 
* Combien l'équipe $A$ a-t-elle de fans? 
* Quelle est la probabilité que l'équipe $A$ n'a aucune fan? 



# Exercice bonus (le Yam's)

On dispose de 5 dés à 6 faces. Au premier tour, on lance les 5 dés. On peut ensuite effectuer jusqu'à 2 jets de dé supplémentaires (à chaque jet de dé, on peut choisir lesquels parmi les 5 dés seront relancés). 

* On cherche à maximiser (en moyenne) la somme totale de nos 5 dés. 
    * Calculer une stratégie optimale. 
    * Quelle est le score moyen? 
* On cherche à maximiser la probabilité d'avoir au moins $n$ dés identiques. 
    * Calculer une stratégie optimale et donner la probabilité d'obtenir $n=3$ dés. 
    * Calculer une stratégie optimale et donner la probabilité d'obtenir $n=4$ dés. 
    * Calculer une stratégie optimale et donner la probabilité d'obtenir $n=5$ dés. 
    
