RICM4: Probabilité et Simulation

Table of Contents

Sitemap

---> misc
| ---> 2016
| ---> 2015
| ---> 2014
| ---> 2013
| ---> 2012
`--> Agenda

Informations Générales

Jean-Marc Vincent est chargé des cours et Arnaud Legrand s'occupe des TDs.

Le planning avec les salles de cours est disponible et et probablement ailleurs dans ADE car curieusement des séances des vendredi à 13h30 n'apparaissent pas… Ça va se stabiliser..

La page de l'an dernier était maintenue par Florence Perronnin et est disponible ici.

Programme du cours

Devoirs

Dynamique de Population

Voici le sujet. Votre travail est à rendre sur Rpubs pour le 25 novembre. Et voici ma "correction". Voici maintenant les retours des étudiants avec un mini commentaire:

Corentin Ricou & William Bobo: http://rpubs.com/will421/10006

  • Sympa, la table des matières avec les onglets en haut. Vous vous l'êtes faite à la main ? Je veux bien voir le code… :)
  • Q0:
    1. Sur les première observation de la dynamique, vos explications sont claires à ceci près que je ne comprends absolument pas d'où sort ce logarithme et ce que vous voulez dire par là…
    2. Mmmh, une loi binomiale a un support discret donc j'ai un peu du mal à voir le lien…
    3. Clair, RAS.
  • Q1:
    • Les courbes se situent soit plus proche de 0 soit plus proche de 1 dans une certaine limite. Mmmh, pas bien clair comme commentaire. J'ai du mal à voir ce que vous voulez dire là.
  • Q2:
    • Je ne suis pas sûr que forcer breaks à 100 ait été une très bonne idée. Premièrement, hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible.
    • En effet, d'aprés l'histogramme, les fréquences d'apparition de chaque valeur de la limite sont similaires. Bof, il y a parfois un facteur 2 entre le count de deux bins. C'est plutôt le fait qu'aucune zone ne semble particulièrement favorisée par rapport à une autre.
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
    • L'on se rapproche d'une loi normal centré sur 0.5. Oui et non. Ça a une forme de courbe en cloche, effectivement mais son support est borné, ce qui n'est pas le cas d'une Gaussienne. Ça ne doit donc pas être tout à fait ça…
    • En augmentant encore la population initial pour les deux villes, la loi normale augmente en amplitude en reduisant sa periode. Euh… amplitude, période. Ce sont des termes de traitement du signal qui n'ont pas de sens ici. Vous vouliez probablement dire que la variance diminuait…
  • Q4:
    • Dans l'ensemble, les résultats obtenus lors de ce tp sont conformes à notre intuitions initiale. Nous pensions que la valeur de P(t) allait ateindre 1 ou 0 ou ½ mais il semblerai que les ecarts soient plus subtils. En effet, les valeurs obtenues sont plus proches de 0.7 ou de 0.2. HEIN ? Mais vous m'avez répondu en Q2 que vous observiez une loi uniforme! Auriez-vous du mal à admettre que ce que vous avez observé n'est absolument pas conforme à vos intuitions initiales ? :)

David Levayer: http://rpubs.com/levayerd/dm1

  • Q0: RAS, vos intuitions sont clairement présentées et argumentées.
  • Q1: pareil, votre analyse est clairement présentée. La discussion sur l'impact de \(n\) sur la convergence de \(P(t)\) est intéressante.
  • Q2: Très bonne analyse. Augmenter le nombre d'échantillons pour confirmer votre hypothèse était un bon réflexe.
  • Q3: Encore une fois, l'analyse est claire et bonne. Petite critique concernant les histogrammes:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
  • Q4:
    • Il est amusant que ça ne soit pas l'histogramme qui vous ait permit de conclure à l'uniformité de la loi mais un "sequence plot". Est-ce juste que "chronologiquement", vous avez utilisé plot avant hist, ou bien trouvez vous que plot est effectivement plus parlant que hist ?…

Arthur Clerc-Gherardi & Clément Valentin: http://rpubs.com/clercgha/10004

  • Q0:
    1. Je vois ce que vous voulez dire mais ça manque d'une conclusion pour la question 1 du genre, "on pense donc que la limite va donc être 0, 1 ou proche de 1/2".
    2. Je n'ai pas compris ce que vous voulez dire. Je ne suis pas sûr que ça soit clair pour vous non plus.
    3. OK, ce commentaire là était clair.
  • Q1: On peut également remarquer que les limites ont tendance à se rapprocher du ratio 1/2. Vraiment ?… Alors, cous avez plus foi en ce que vous croyez qu'en ce que vous voyez… ;) Il y a quand même deux trajectoires qui sont proches de 0.05 et les autres sont entre 0.3 et 0.7.
  • Q2:
    • Je ne suis pas sûr que forcer breaks à 50 ait été une très bonne idée. Premièrement, hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible.
    • On se rend compte que notre intuition était bonne. Hein ? Mais de quelle intuition parlez vous ? Certainement pas celle de Q0. Le terme "uniforme" ou "similaire" n'apparaît jamais avant.
    • Il faudrait faire le tests sur 100 000 évolutions de population pour avoir quelque chose qui soit presque égal de partout. Bonne idée si vous pensez que l'histogramme précédent n'est pas assez parlant. L'avez vous fait ?
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
  • Q4:
    • Principalement, l'étude grâce à l'informatique de ce problème n'a fait que confirmer nos pensées. Ah ? Ça n'était pas si évident pour moi en lisant vos réponses pour Q0. Vous aviez raison pour l'impact de la répartition initiale sur la limite mais pour le reste, je ne crois pas que vous ayez intuité que la répartition serait uniforme en partant de (1,1). Auriez-vous du mal à admettre que ce que vous avez observé n'est pas conforme à vos intuitions initiales ? :)

Jérôme Barbier & Augustin Husson: http://rpubs.com/AHusson/10017

  • Q0: Votre intuition est clairement expliquée. RAS.
  • Q1: Bien dans l'ensemble
    • on peut voir qu'aucune courbes ne se chevauchent. Je ne suis pas d'accord, certains courbes se croisent. Par contre, elles sont effectivement plutôt réparties à la différence de ce qui était intuité en Q0.
  • Q2: Nickel. RAS.
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim et le ylim afin de faciliter la comparaison des histogrammes. Par exemple la différence entre valfinal(1,10) et valfinal(1,100) n'est pas flagrante sur ces histogrammes. Il faut bien regarder les échelles pour en prendre conscience…
    • Je ne suis pas sûr que les couleurs des histogrammes apportent grand chose…
  • Q4: RAS.

Adji Sambe & Mehdi Nait-Sidous: http://rpubs.com/MehdiNS/dmProbaStat

  • Q0:
    1. Votre intuition est clairement expliquée.
    2. Hésitation entre loi de Poisson et loi Binomiale. Le support de ces lois est discret. Comment est-ce que ça pourrait correspondre à une loi dont le support est [0,1] ?
  • Q1: RAS, c'est clairement expliqué.
  • Q2:
    • On constate que la valeur limite tend vers 0.5 (on peut le vérifier avec mean()). Euh… je ne suis pas sûr de comprendre comment je dois interpréter ça. Quel sens donnez-vous à la moyenne des échantillons des limites ? Qu'espériez-vous en déduire ?
    • Pourquoi avez-vous forcé la taille des bins à 0.1 ? hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas par exemple où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair.
    • Pour I et J des sous intervalles de [0,n], P(I) = P(J)). Vous vouliez dire des sous-intervalles de [0,1] j'imagine.
  • Q3:
    • Même remarque que précédemment à propos du nombre de bins des histogrammes.
    • Très bonne idée de s'assurer que les échelles en x soient les même.
    • La distribution est symétrique donc la valeur limite suit une loi qui s'assimile à une loi Normale. Mmh, peut-être… ou pas. Ça a une forme de courbe en cloche, effectivement mais son support est borné, ce qui n'est pas le cas d'une Gaussienne. Ça ne doit donc pas être tout à fait ça…
    • Donc elle suit une loi qui s'approche de la loi de Poisson. Attention, une fois encore, c'est une loi discrète alors que vous observez une limite à valeur dans [0,1]…
  • Q4:
    • Comme prévu, nous avons retrouvé la loi de Poisson quand il y un déséquilibre au départ de la simulation. A l'inverse, on ne s'attendait pas à obtenir une loi Normale quand les villes ont la même population initiale. Je ne suis pas super convaincu par le comme prévu.
    • Dans Q0, vous avez écrit Loi de la limite : soit vers 0, soit vers 1 soit vers 0.5. et ça ne correspond absolument pas à ce que vous avez observé. Pourtant vous n'en parlez pas dans votre bilan… Auriez-vous du mal à admettre/réaliser que ce que vous avez observé n'est pas conforme à vos intuitions initiales ?

Labat Paul et Fréby Rodolphe: http://rpubs.com/silvernast/10018

  • Q0: Les commentaires sont à peu près clairs mais manquent un peu d'une conclusion et d'un message clair.
  • Q1:
    • La discussion sur le choix de \(n\) est intéressante.
    • Ça ne vous a pas dérangé de tracer 10 trajectoires et de n'en voir que 5 ?… Vous auriez du préciser un ylim lors du premier plot sans quoi, il cadre l'échelle sur la première trajectoire et vous loupez les autres.
    • En plus vous fixes la graine dans votre appel de fonction en utilisant la longueur de la trajectoire ?!? Quelle drôle d'idée?!? À proscrire!
  • Q2:
    • Pourquoi fixer le nombre de bins ? hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible.
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
    • le nombre de tirage va influencer la répartition, plus nous effectuons des tirages dans le cadre de villes équilibrées, moins l'écart se creuse. Euh… je ne suis pas sûr de voir ce que vous voulez dire là…
    • Le nombre de trajet est également important. Vous vouliez dire tirages j'imagine.
  • Q4:
    • vous ne revenez pas sur vos intuitions initiales. C'est dommage…
    • Augmenter le nombre de villes me semble effectivement être une idée intéressante.

Patrick Perea & Paul Mariage: http://rpubs.com/p-mariage/10021

  • Q0: RAS, intuition clairement expliquée.
  • Q1:
    • Code très bien écrit et expliqué. Il n'est pas clair pour moi que ce que vous observez corresponde vraiment à ce que vous avez décrit avant. Je ne vois pas particulièrement trois situations distinctes.
    • Vous devriez utiliser factor(numtraj) plutôt que numtraj afin d'éviter un dégradé de bleu sans signification particulière…
  • Q2: RAS. Clair et bien expliqué.
  • Q3: Bien expliqué. Ceci dit, le support de la loi étant [0,1], vous auriez pu forcer le xlim afin de faciliter la comparaison des histogrammes.
  • Q4:
    • Notre intuition s'est dans un premier temps vérifiée à la question 2, lorsque nous avons observé l'apparition des 3 cas que nous avions imaginés. Elle s'est finalement confirmée lors de la question 3 […]. Aerm… Je suis désolé mais vos observations vous indiquent une loi uniforme. Ça ne correspond pas, selon moi, à la description de votre intuition initiale… De plus, vous ne parliez pas vraiment de Q3 dans Q0. Auriez-vous du mal à admettre que ce que vous avez observé n'est pas vraiment conforme à vos intuitions initiales ? :)

El Hadji Malick Fall & Flavien Peyre: http://rpubs.com/falle/10022

  • Q0:
    1. OK, intuition clairement expliquée.
    2. La loi de Poisson (avec un "P"), je ne vois absolument pas d'où ça sort…
  • Q1:
    • Vous devriez écrire des fonctions. D'autre part, si votre code était bien indenté, vous n'auriez pas besoin de préciser quelle boucle vos accolades ferment.
    • Vous devriez utiliser factor(numtraj) plutôt que numtraj afin d'éviter un dégradé de bleu sans signification particulière…
    • nous obtenons 4 cas où la probabilité d’aller dans une des deux villes est égale à environ 0,6 Hein ?! Où ça ?
    • Vous auriez du fixer votre échelle en y à [0,1]. C'est une des raisons pour lesquelles vous n'arrivez pas à lire votre graphe.
    • On remarque également un cas vérifiant notre hypothèse que si une ville croit au début beaucoup plus vite que l’autre, on obtient au final une valeur de probabilité d’aller dans cette ville proche de 1(0,9). Mouaip, je ne trouve pas ça flagrant moi… Vous avez la foi.
  • Q2:
    • Berk l'affreux copier coller source d'erreurs. Comme quoi les fonctions, c'est utile. Dans ce genre de devoir, je ne pense pas qu'il soit intéressant de montrer votre version intermédiaire et tant qu'à faire, vous auriez donc plutôt du écrire la fonction directement en Q1.
    • Que vous apporte mean(vl) ? Doit on en conclure quoi que ça soit ?
    • On remarque cependant une plus forte apparition d’une probabilité limite de P(t) comprise entre 0,55-0,6 et 0,80-0,85 pour la ville 1. Et alors, c'est toujours le cas ? Si vous recommenciez, ça serait encore vrai ? Est-ce donc pertinant ? En particuler car vous concluez à une loi uniforme juste après…
  • Q3:
    • Je ne suis pas sûr que les couleurs des histogrammes apportent grand chose…
    • Bon réflexe d'avoir fixé le xlim à [0,1] et d'avoir combiné les histogrammes car ça permet de comparer plus facilement.
    • Dommage d'avoir imposé le nombre de bins. En effet, hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. En même temps, en laissant hist choisir pour 3 échantillons, vous vous exposiez au risque qu'il choisisse un nombre de bins différent pour chaque situation, ce qui est susceptible de gêner la comparaison.
    • Ça a une forme de courbe en cloche, effectivement mais son support est borné, ce qui n'est pas le cas d'une Gaussienne. Ça ne doit donc pas être tout à fait ça…
    • Ce qui nous emmene à considérer que la loi de sa limite suit une loi de Poisson. Attention, Poisson est une loi discrète alors que vous observez une limite à valeur dans [0,1]…
  • Q4:
    • Je suis surpris que vous n'insistiez pas plus sur le fait que vous n'aviez absolument pas anticipé la loi uniforme…

XIA Ye (Xavier) & Tao Xinxiu (Isabelle): http://rpubs.com/XavierXia/10026a

  • Q0: OK. Vous envisagez donc une distribution discrète avec deux pic en 0 et en 1, de même probabilité.
  • Q1:
    • Bonne idée de changer la durée de la trajectoire.
    • C'est évident que p(t) n'est pas bien stable entre 0 et 5000 Vous avez raison. La plupart du temps, les gens se content d'aller jusqu'à 1000 et c'est probablement une approximation un peu grossière.
  • Q2: Bien expliqué. RAS. Par contre, pourquoi recopier votre code de génération ? Faites-en une fonction, ça vous évitera des erreurs. Pareil pour la suite des questions.
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
    • Globalement, ça manque un peu d'analyse…
  • Q4: Vous avez reconnu que votre intuition était erronée. C'est bien! :)

Pierre-Henri GINOUX: http://rpubs.com/ph-g/dm-proba1

  • Q0: RAS. Votre intuition est clairement expliquée
  • Q1:
    • Y'a-t-il une raison particulière pour laquelle vous fixez la graine dans votre appel de fonction ?
    • Vous auriez-du fixer le ylim à [0,1] puisque c'est l'intervalle de définition de votre ratio.
    • Ce qui s'explique par la perte de l'importance d'une personne dans la modification de la probabilité à fur et a mesure que le nombre d'habitants progresse. Bonne explication!
  • Q2:
    • Si j'étais vous, j'éviterais d'utiliser un outil que vous ne maîtrisez pas (la densité). En particulier, le fait que la densité puisse être définie pour des ratios négatifs ou supérieurs à 1 aurait du vous gêner…
    • Pourquoi fixer le nombre de bins à 100 ? hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible. Enfin, c'est sans compter sur le fait qu'à 100, avec des barres en blanc, c'est super difficile à lire et ça fait mal à mes pauvres yeux…
  • Q3:
    • Encore une fois, la densité crée des artefacts bizarres… Vous ne trouvez pas ?
    • En ce qui concerne la loi normale, peut-être… ou pas. Ça a une forme de courbe en cloche, effectivement mais son support est borné, ce qui n'est pas le cas d'une Gaussienne. Ça ne doit donc pas être tout à fait ça…
  • Q4:
    • Par contre, la surprise se situe au niveau de la loi normale qui fait son apparition lorsque l'on augmente de manière équivalent la population de départ des 2 villes. Effectivement, si tant est que ça soit une loi normale. Ceci dit, cette loi apparaît effectivement souvent en raison du Théorème central limite.
    • Par contre, l'apparition de la loi uniforme est bien plus surprenante à mon avis et ce que vous avez écrit en Q0 me laisse penser que vous ne l'aviez pas anticipé du tout. Curieux que vous n'en parliez pas…

Adam Tiamou & Radhoane BEN YOUNES: http://rpubs.com/tiamiou/10029

  • Q0. RAS, votre intuition est à peu près claire.
  • Q1:
    • On remarque aussi, que certaines courbes tendent vers une valeur autour de ½ sans jamais être proche " Je me demande ce que ça peut vouloir dire… :)
    • la plupart tendent vers des valeurs plus proche de 0. Vraiment ? On ne doit pas voir la même courbe…
    • Vous auriez-du fixer le ylim à [0,1] puisque c'est l'intervalle de définition de votre ratio. Ça vous aurait permis de voir que vos trajectoires sont aussi proches de 0 que de 1 alors que vous avez l'air de regretter qu'il n'y en ai pas un peu plus qui se rapprochent de 1.
  • Q2:
    • Pourquoi fixer le nombre de bins ? hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible.
  • Q3:
    • Drôle d'idée de charger une librairie dans une fonction.
    • Je ne suis pas sûr que les couleurs des histogrammes apportent grand chose.
    • Grouper les histogrammes pour les comparer, c'est bien mais vous auriez du forcer le xlim à [0,1] afin de faciliter la comparaison des histogrammes.
  • Q4: Vous avez reconnu que votre intuition était erronée. C'est bien! :)

Perruche Benoit & Legros Jules: http://rpubs.com/Benoit/10031

  • Autant il y en a qui n'écrivent pas assez de fonctions autant vous, c'est l'inverse… Trois fonctions pour définir une trajectoire, je trouve que c'est un peu overkill.
  • Q0: Vos intuitions sont généralement très peu décrites. Difficile de savoir ce que vous aviez en tête…
  • Q1: RAS
  • Q2:
    • On remarque que la loi de probabilité est bien uniforme, les valeurs de fin sont bien uniformement réparties. Le "bien" est de trop puisque ça n'était pas attendu…:)
    • ce qui est loin de notre intuition première, où nous avions fait une erreur d'interprétation. Peut-on parler d'erreur d'interprétation là ? Vous n'aviez pas la bonne intuition, ce n'est pas grave.
    • Je ne suis pas sûr que forcer breaks à 50 ait été une très bonne idée. Premièrement, hist a sa propre méthode pour calculer le nombre de bins en fonction de la taille de l'échantillon et de sa variance empirique. En l'absence d'informations particulières sur la distribution, il est donc bon d'utiliser la valeur par défaut et, dans le cas où l'on sait qu'il y a un pic particulièrement important ou des valeurs extrêmes, on change le nombre de breaks pour y voir plus clair. D'autre part, avec un nombre de breaks plus faible, l'uniformité de la distribution serait bien plus visible sans avoir besoin de simuler autant de trajectoires.
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.

SUN Xuan & ZHANG Zhengmeng: http://rpubs.com/sunxgiving/10032

  • Q0:
    1. Donc, ça converge vers 1 ou vers 0 selon vous
    2. Car n1=n2=1, je pense que c'est une distribution normale , le plus proche de 0.5 , la possibilité est plus haute. Euh… d'où sors la distribution normale là ? Et donc maintenant, contrairement à la question précédente, vous pensez que 0.5 est le plus probable ? Vous changez vite d'avis…
    3. OK
  • Q1: OK. RAS.
  • Q2:
    • Pourquoi ne pas définir limit à partir de la fonction trace au lieu de dupliquer du code ?
    • Et l'interprétation ?… Vous ne m'avez pas indiqué que la distribution semblait uniforme.
  • Q3: Il faut rédiger vos observations et vos conclusions!
  • Q4: Il faut développer. Vous ne pouvez vous contenter de si peu de conclusion.

Lionel Boey & Guo Tianming: http://rpubs.com/umpri5450/10044

  • Q1: Ça manque un peu de commentaires et de justifications sur le choix de 1000 et expliquant pourquoi ça se comporte comme ça. Vous l'avez fait un peu dans Q3.
  • Q2: Vous conservez 2000 comme valeur du nombre d'immigrants. Vous aviez pourtant 1000 à la question précédente. Pourquoi changer ?
  • Q3:
    • Le support de la loi étant [0,1], vous auriez du forcer le xlim afin de faciliter la comparaison des histogrammes.
    • Dir que la fréquence la plus importante est 0.5 est incorrect. La densité de probabilité se resserre autour de 0.5.

Guo Kai: http://rpubs.com/GUOKAI/10045

  • Q0: Ce que vous dites n'est pas très clair ni très argumenté…
  • Q1:
    • Vous avez des variables globales qui ont le même nom que des variables locales à des fonctions. Ça n'aide pas à la lisibilité.
    • Vous devriez parler de taille de population plutôt que de nombre de population.
    • "accoissante" ?
    • Votre seul commentaire est d'après la résultat obtenue, je me permets de conclure que la probabilité que l'immigration à certaine ville se passerait presque la même en supposant que la population initiale des deux villes expérimentées part du nombre 1.. J'ai beau retourner la phrase dans tous les sens, je n'arrive pas à voir ce que vous voulez dire…
  • Q2: C'est tout faux. Vous avez oublié de réinitialiser n1 et n2 dans votre boucle imbriquée… Cette erreur est due à deux choses:
    1. Votre code est mal structuré, ce qui favorise ce genre d'erreur.
    2. Vous n'avez pas eu de regard critique et cherché à vérifier que votre code était correct. Si au lieu de faire un histogramme, vous aviez fait plot vous l'auriez vu immédiatement.
  • Q3: Du coup c'est également tout faux.
  • Q4: Voila les résultats observées nous prouve que mon assertion est quasiment correct. Hem. C'est bien flou tout ça: une intuition peu détaillée, un code complètement faux, et une conclusion "quasiment" certaine…

À propos de l'utilisation de R

Dans ce cours, nous illustrerons l'intégralité de nos exemples et de nos études avec R. Voici donc quelques informations à toutes fins utiles…

Installation de R et de Rstudio

Here is how to proceed on debian-based distributions:

sudo apt-get install r-base r-cran-ggplot2 r-cran-reshape 

Rstudio and knitr are unfortunately not packaged within debian so the easiest is to download the corresponding debian package on the Rstudio webpage and then to install it manually.

wget http://download1.rstudio.org/rstudio-0.97.551-amd64.deb
sudo dpkg -i rstudio-0.97.551-amd64.deb
sudo apt-get -f install # to fix possibly missing dependencies

You will also need to install knitr. To this end, you should simply run R (or Rstudio) and use the following command.

install.packages("knitr")

If r-cran-ggplot2 or r-cran-reshape could not be installed for some reason, you can also install it through R by doing:

install.packages("ggplot2")
install.packages("reshape")

Producing documents

The easiest way to go is probably to use R+Markdown (Rmd files) in Rstudio and to export them via Rpubs to make available whatever you want.

We can roughly distinguish between three kinds of documents:

  1. Lab notebook (with everything you try and that is meant mainly for yourself)
  2. Experimental report (selected results and explanations with enough details to discuss with your advisor)
  3. Result description (rather short with only the main point and, which could be embedded in an article)

We expect you to provide us the last two ones and to make them publicly available so as to allow others to comment on them.

Documentation

For a quick start, you may want to look at R for Beginners (French version). A probably more entertaining way to go is to follow a good online lecture providing an introduction to R and to data analysis such as this one: https://www.coursera.org/course/compdata

Bibliographie