doku:αΩ « Wikidd »

des 𝞹-pes, du sudo maso & la main sur l'hacker !

User Tools

Site Tools


physique:marche-aleatoire

Marche aléatoire

Le principe est une particule19) qui se déplace selon un axe unique, dans un sens ou dans l'autre. Cette particule possède un degré de liberté qui est l'axe qu'elle peut parcourir, l'axe $O_x$.

Le modèle discret

On découpe l'axe $0_x$ en segments de longueur $dx$ constante selon la formulation suivante :

$$ x_i = i.dx $$

Avec $$ \begin{array} \{ i \in [0,N] \\ x_i \in [x_0,x_N] \end{array} $$

C'est une façon de représenter la trajectoire du marcheur20) et on peut ainsi désigner la position $x_i$ de la particule par l'entier $i$ associé :

Schéma de principe

Ici la particule est représentée en $x_i$ et les flèches représentent le fait qu'elle peut se déplacer vers le côté droit avec une probabilité p et vers le côté gauche avec une probabilité q21). Si on considère qu'à chaque instant (ie, unité de temps), la particule doit se déplacer d'un côté ou de l'autre alors on peut écrire :

$$ p+q=1 $$

À ce stade, le problème est bien défini en terme de probabilité d’événement : l'ensemble des événements est normalisé localement.

:!: On peut remarquer que cette équation de normalisation nous donne $q=1-p$ par complémentarité. Dans ce type de problème, on a besoin de poser p pour connaître q et vice-versa. Ils ne sont pas indépendants l'un de l'autre.

Ce modèle général nous permet de planter le décor en terme de transport stochastique à une dimension.

On s'intéresse au cas $p=q=\frac{1}{2}$, le seul cas possible $p=q$ pour $p+q=1$. C'est le cas de la marche aléatoire, dite marche brownienne. Le nom vient du botaniste Robert Brown qui a observé le mouvement aléatoire des particules de pollen dans un solvant :

Le schéma montre grossièrement quelques particules qui ont une trajectoire discontinue avec a priori aucun ordre ni répétition (figure de gauche). Pareil lorsqu'on observe une seule particule (figure de droite). Bien que le mouvement des particules de pollen soit compliqué, on pourra assimiler le changement de direction d'un grain de pollen au changement de sens de notre marcheur 1D. Les grains de pollen sont agités par les molécules du solvant qui les bousculent constamment : c'est l'agitation thermique, que l'on utilisera comme variable aléatoire.

:!: En réduisant la dimension du problème, on pourrait perdre l'essentiel du phénomène physique qui se cache derrière le mouvement de ces molécules « agitées thermiquement ». Et bien non. On simplifie le problème mais on ne retire aucun ingrédient fondamental !

Si bien qu'on peut utiliser le modèle du marcheur 1D plus haut pour retrouver l'équation fondamentale qui décrit exactement le phénomène qui anime ces grains de pollen. Si si.

Pas à pas & énumérations

Pour formaliser la dynamique de notre marcheur, il faut commencer par prendre des notations. On peut, par exemple, lister les pas à droite par un p et les pas à gauche par un q. On peut donc noter ppq une séquence de 3 pas (2 pas à droite, un pas à gauche). On appelle $N$ le nombre de pas au total et $n$ le nombre de pas à droite. Dans le cas de la séquence ppq, on a $N=3$ et $n=2$.

On peut se demander quelles sont toutes les possibilités pour un nombre de pas $N=3$ ? Le marcheur pourra par exemple faire la séquence donnée précédemment mais aussi la séquence ppp avec 3 pas à droite. On peut énumérer toutes les séquences possibles comme suit :

ppp
qpp pqp ppq
qqp qpq pqq
qqq

Évidemment, ces séquences ne sont pas équivalentes : le marcheur ne finit pas toujours au même endroit et ne fait pas forcément le même nombre $n$ de pas à droite. D'ailleurs, la notation n'est pas innocente :

ppp            n=3
qpp pqp ppq    n=2
qqp qpq pqq    n=1 
qqq            n=0

Pour mieux comprendre ce que représente ces séquences en terme de probabilité, il faut résumer le sens d'une séquence : avec la séquence pp, on a un pas à droite ET un pas à droite. Le terme ET est une multiplication en terme de probabilité donc on peut écrire la séquence pp comme le produit $p.p=p^2$. La multiplication exprime la succession des événements dont on multiplie les probabilités. $p^2$ est la probabilité de faire un pas à droite ET un pas à droite successivement. Cela va changer les écritures et permettre d'avancer.

$$ p.p.p = p^3 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ n=3 $$ $$ q.p.p = p.q.p = p.p.q = qp^2 ~~~~~~ n=2 $$ $$ q.q.p = q.p.q = p.q.q = pq^2 ~~~~~~ n=1 $$ $$ q.q.q = q^3 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ n=0 $$

On peut remarquer que le premier cas n'a qu'une seule façon de se produire : il n'y a effectivement qu'une seule façon de faire 3 pas à droite pour 3 pas en tout. Ceci nous amène à écrire que la probabilité de faire $n=3$ pas à droite étant donné $N=3$ pas en tout peut se formuler compte tenu des informations que l'on vient de décrire :

$$ P(n=3,N=3) = p^3 $$

Par exemple, pour le cas brownien ou $p=q=\frac{1}{2}$, on a :

$$ P(n=3,N=3) = (\frac{1}{2})^3 = \frac{1}{2^3} = \frac{1}{8} $$

Passons au cas ou $n=2$ avec toujours $N=3$, c'est la seconde ligne des énumérations : il y a 3 possibilités différentes pour faire 2 pas à droite avec 3 pas en tout, on les a énuméré plus haut. Maintenant pour écrire la probabilité de suivre un tel processus, il faut prendre en compte ces 3 possibilités :

$$ P(n=2,N=3) = q.p.p + p.q.p + p.p.q = 3.q.p^2 $$

Cette fois, on peut lire que la probabilité de faire 2 pas à droite pour 3 pas en tout c'est la probabilité de faire 1 pas à gauche et 2 pas à droite (qpp) OU la probabilité d’alterner droite, gauche, droite (pqp) OU la probabilité de faire 2 pas à droite et 1 pas à gauche (ppq). Le OU est l'opération d'addition en probabilité.

Il est important de noter que si les expressions $ppq$ et $pqp$ sont égales mathématiquement, elle ne correspondent pas au même processus physique et c'est pour ça qu'on doit les additionner pour obtenir la probabilité qui nous intéresse.

On peut passer au cas avec $n=1$ :

$$ P(n=1,N=3) = q.q.p + q.p.q + p.q.q = 3.p.q^2 $$

De la même façon que le cas précédent, on additionne les probabilités des séquences avec le bon nombre de pas à droite. L'opération d'addition formule une alternative possible entre tous les termes présents. Un seul terme est réalisé à chaque événement. Cela nous permet de mieux comprendre la contrainte $p+q=1$ qui ne dit rien d'autre que : “un pas à droite OU un pas à gauche est toujours vrai à chaque instant”.

Enfin, le dernier cas, avec aucun pas à droite ($n=0$) :

$$ P(n=0,N=3) = q.q.q = q^3 $$

Si on a correctement énuméré tous les cas possibles, alors on doit pouvoir additionner les valeurs $P(n,N=3)$ pour obtenir la probabilité que le marcheur fasse 3 pas sachant qu'il en fait 3. Si le problème est bien posé, cette probabilité doit être égale à 1 : on est sûr de faire 3 pas si on fait 3 pas. Il n'y a aucun doute la-dessus et ça doit nous permettre de vérifier la normalisation du processus de façon globale cette fois.

:!: Cette notion est très importante : tous les ensembles probabilistes doivent êtres correctement normalisés !

On peut écrire mathématiquement l'idée énoncée ci-dessus :

$$ P(N=3) = P(0,3) + P(1,3) + P(2,3) + P(3,3) = \sum_{n=0}^N P(n,N=3) $$ $$ P(N=3) = p^3 + 3p^2q + 3pq^2 + q^3 $$

Si on calcule numériquement le résultat pour $p \in [0,1]$ et $q=1-p$, on trouve que cette somme fait effectivement 1.

Les plus matheux d'entre nous auront remarqué que cette formulation de $P(N)$ n'est rien d'autre qu'un développement binomial :

Le développement binomial de $(a+b)^2$ est $a^2+2ab+b^2$ et on a de la même façon :

$$ (a+b)^3 = a^3 + 3a^2b + 3ab^2 + b^3 $$

Remplaçons $a$ et $b$ par $p$ et $q$ et on y voit que du feu ! C'est intéressant car on peut reformuler $P(N=3)$ :

$$ P(N=3) = (p+q)^3 $$

Et on sait - car on l'a choisi - que $p+q=1$ donc on obtient finalement que $P(N=3)=1$. L'ensemble des événements est correctement normalisé, la formulation est valide.

Vous pouvez vous convaincre que les coefficients que l'on trouve en énumérant les séquences pour $N=4,5,6,\ldots$ nous donnent bel et bien les coefficients binomiaux. Il faut de la même façon énumérer les possibilités pour $N=4$ avec $n=0,1,2,3,4$ et ainsi de suite. Ces coefficients sont également appelés coefficients du binôme de Newton et sont accessibles soit par un développement brute des expressions $(a+b)^n$ ou alors par le « triangle de Pascal », un algorithme qui permet de les calculer rapidement :

1                    (a+b)^0   
1 1                  (a+b)^1 = a+b -> 1 et 1 sont les coefficients associés à chaque terme
1 2 1                (a+b)^2 = a^2 + 2ab + b^2 -> 1,2,1 sont les coefficients
1 3 3 1
1 4 6 4 1            Chaque case est la somme de la case au dessus avec la case au-dessus à gauche
1 5 10 10 5 1                                                                   
1 . .. .. .. . 1     --> il manque 5 valeurs à cette ligne pour (a+b)^6

Ces fameux coefficients ont une notation particulière, on écrit le nombre de combinaisons de $n$ événements dans $N$ tirages comme $ C_{N}^n $ et on peut les formuler mathématiquement de la façon suivante :

$$ C_N^n = \frac{N!}{n!(N-n)!} $$

On peut vérifier que $C_3^3=C_N^N=1$ quelque soit $N$ en fait. On peut, grâce à ce calcul, retrouver tous les coefficients donnés plus haut.

Ceci nous amène, finalement, à exprimer la probabilité de faire $n$ pas à droite sachant que l'on fait $N$ pas comme :

$$ P(n,N) = p^n.q^{N-n} . C_N^n $$

Ceci est la loi binomiale et dans le cas brownien, on peut écrire cette probabilité comme :

$$ P(n,N) = \frac{1}{2^N} . C_N^n $$

On peut remarquer que les variables sont discrètes avec $n$ qui fait référence à la position du marcheur et $N$ à la durée de la marche22). De cette façon on va passer d'une fonction de probabilité $P(n,N)$ discrète à une fonction $P(x,t)$ continue.

Valeur moyenne

Maintenant que l'on dispose de la loi de probabilité associée à la dynamique du marcheur, on peut obtenir certaines informations comme la position moyenne du marcheur :

$$ \bar{n} = \sum_{n=0}^N n P(n,N) = \sum_{n=0}^N n p^n q^{N-n} C_N^n $$

Par définition, on calcule la moyenne $\bar n$ de $n$ en faisant le produit de $n$ et de sa fonction de densité de probabilité $P$, pour toutes les possibilités de $n$ dans l'intervalle défini par $N$.

Dans cette égalité on peut transformer le terme $n p^n$ par $p\frac{d}{dp}p^n$ :

$$ \bar{n} = \sum_{n=0}^N p\frac{d}{dp}p^n q^{N-n} C_N^n $$

Et on peut faire sortir le terme en $p$ qui ne change pas la somme sur $n$:

$$ \bar{n} = p\frac{d}{dp} \sum_{n=0}^Np^n q^{N-n} C_N^n $$

Qui se réécrit d'après la normalisation vue précédemment :

$$ \bar{n} = p\frac{d}{dp} (p+q)^N $$

D’où :

$$ \bar{n} = Np (p+q)^{N-1} = Np $$

Pour avoir le moment suivant, $\bar{n^2}$ (le moment quadratique), on refait de la même façon :

$$ \bar{n^2} = \sum_{n=0}^N n^2 p^n q^{N-n} C_N^n $$ $$ \bar{n^2} = (p\frac{d}{dp})^2 (p+q)^N = Npq + N^2 p^2$$

Passage au modèle continu

De la loi binômiale à une fonction continue

On connaît la fonction de densité de probabilité discrète $P(n,N) = p^n . q^{N-n} . C_N^n $ et on souhaite trouver un équivalent avec des variables continues. On doit faire pour cela… une approximation ! l'approximation de Stirling ; qui nous permet de se débarrasser de ces vilaines factorielles.

D'abord, on prend le logarithme de l'équation :

$$ ln(P_n^N) = ln(p^n) + ln( q^{N-n}) + ln(\frac{N!}{n!(N-n)!}) $$

Approximation de Stirling :
$$ ln(x!) \approx x(ln(x)-1) + \frac{1}{2}ln(2\pi x)$$

On applique l'approximation (qui tend vers l'égalité lorsque $n,N \rightarrow \infty$) :

$$ ln(P_n^N)=nln(p)+(N-n)ln(q)+N(ln(N)-1)-n(ln(n)-1)-(N-n)(ln(N-n)-1) $$

Qui se simplifie :

$$ ln(P_n^N) = nln(p) + (N-n)ln(q) + Nln(N) - nln(n) - (N-n)ln(N-n) $$

On prend pour hypothèse que l'ensemble est bien défini pour la variable $n$ que l'on suppose maintenant continue sur $\mathbb{R}$ et on se permet de dériver l'équation par rapport à $n$ :

$$ \frac{d}{dn} ln(P_n^N) = ln(p) - ln(q) - ln(n) - 1 + ln(N-n) + 1 $$

$$ \frac{d}{dn} ln(P_n^N) = ln(\frac{p}{q}) + ln(\frac{N-n}{n}) $$

$$ \frac{d^2}{dn^2} ln(P_n^N) = -\frac{1}{n} - \frac{1}{N-n} = -\frac{N}{n(N-n)} $$

On connaît maintenant les deux premières dérivées de la fonction $ln(P)$ et les deux premiers moments ($\bar n$ et $\bar{n^2}$), ce qui nous permet d'établir un développement limité de cette fonction autour de la valeur moyenne $\bar n$:

$$ ln(P_n^N) \approx ln(P_{\bar n}^N) + \frac{d}{dn}ln(P_n^N)|_{\bar n}(n-\bar n) + \frac{d^2}{dn^2}ln(P_n^N)|_{\bar n} \frac{(n-\bar n)^2}{2} $$

Avec $ \frac{d}{dn}ln(P_n^N)|_{\bar n} = 0 $, on a :

$$ ln(P_n^N) \approx ln(P_{\bar n}^N) + \frac{d^2}{dn^2}ln(P_n^N)|_{\bar n} \frac{(n-\bar n)^2}{2} $$

$$ ln(P_n^N) \approx ln(P_{\bar n}^N) - \frac{N}{\bar{n}(N-\bar{n})} \frac{(n-\bar n)^2}{2} $$

Et on commence à voir poindre la fonction qui se cache sous cette distribution :

$$ P_n^N \approx P_{\bar n}^N exp(- \frac{N}{\bar{n}(N-\bar{n})} \frac{(n-\bar n)^2}{2}) $$

Avec $\bar n = Np$, on obtient que $- \frac{N}{\bar{n}(N-\bar{n})} = -\frac{1}{Npq}$.

$$ P_n^N \approx P_{\bar n}^N exp(- \frac{(n-\bar n)^2}{2Npq}) = P_{\bar n}^N exp(\frac{1}{2Npq}) exp(- (n-\bar n)^2) $$

Avec $Npq = \bar{n^2}-\bar{n}^2$, la variance de $n$ qui augmente avec $N$, la durée de la marche.

Dans la limite ou $N \gg n$ avec $n \gg 1$ et $N \rightarrow \infty$, on peut considérer la distribution comme continue. On passe symboliquement aux variables $x$ et $t$ pour remplacer $n$ et $N$ respectivement :

$$ P(x,t) = P(\bar{x} ,t)exp(\frac{1}{2\sigma^2}) exp(- (x-\bar{x})^2) $$

On trouve que la distribution spatiale est une gaussienne sous sa forme continue, ce qui est typique des phénomènes de diffusion ! À partir d'un phénomène simple en 1D, le marcheur stochastique, on est passé à une fonction de probabilité continue qui est cohérente avec le phénomène physique impliqué : une diffusion aléatoire. Le problème peut être étendu à trois dimensions grâce aux fonctions $P(x,t),P(y,t),P(z,t)$ en prenant pour hypothèse que le processus de diffusion de chaque dimension est indépendant des autres.

Pour définir les constantes, on peut utiliser la normalisation qui impose :

$$ \int_{-\infty}^{+\infty} P(x,t) dx = 1 $$

Donc : $$ \int_{-\infty}^{+\infty} P(x,t) dx = P(\bar x,t) \int_{-\infty}^{+\infty} exp(\frac{-(x-\bar x)^2}{2\sigma^2}) dx = P(\bar x,t) \sqrt{2 \pi \sigma^2} $$

D'où :

$$ P(\bar x,t) = \frac{1}{\sqrt{2 \pi \sigma^2}} $$

$$ P(x,t) = \frac{1}{\sqrt{2 \pi \sigma^2}}exp(\frac{- (x-\bar x)^2}{2\sigma^2}) $$

On voit en fait qu'il manque la variable $t$ dans le terme de droite :-). C'est que $\sigma^2=Npq$ et contient donc le temps !

Dans le cas de la marche aléatoire 1D, on a la relation $\sigma^2=2Dt$ pour une relation continue qui introduit le coefficient de diffusion $D$, indispensable pour traduire la diffusion d'un élément dans un milieu. Il traduit la surface moyenne parcourue par unité de temps de marche.

$$ P(x,t) = \frac{1}{\sqrt{4 \pi D t}}exp(\frac{- (x-\bar x)^2}{4Dt}) $$
Ceci n'est autre que la solution à l'équation de la diffusion (ou équation de la chaleur) :
$$ \frac{\partial C}{\partial t}(\vec x,t) = D \Delta C(\vec x,t) $$

Avec $x$ la position, $t$ le temps, $C(x,t)$ la “concentration en marcheur” ou en molécules, $D$ le coefficient de diffusion du “marcheur” ou des molécules dans le milieu ambiant (l'air, un solvant liquide, etc…) et $\Delta$ l'opérateur de dérivée seconde dans l'espace. La concentration en molécules étant fortement liée à leur probabilité de présence, on peut écrire que $C(x,t)=C_0 P(x,t)$ et avoir finalement l'équation selon la fonction de densité de probabilité $P(r,t)$ :

$$ \frac{\partial P}{\partial t}(\vec x,t) = D \Delta P(\vec x,t) $$

Qui peut aussi s'écrire, pour une dimension spatiale :

$$ \frac{\partial P}{\partial t}(x,t) = D \frac{\partial^2 P}{\partial x^2}(x,t) $$

Avec $C_0=cte$23) qui se simplifie de part et d'autre de l'équation.

19)
c'est un nom générique : une personne, un point mathématique, etc…
20)
sur un axe infini
21)
pour être plus précis, des probabilités par unité de temps
22)
dans l'hypothèse que la vitesse du marcheur est constante dans le temps ;-)
23)
$C_0$ est une constante
/home/duke/www/dukeart/wiki/data/pages/physique/marche-aleatoire.txt · Last modified: 2020/11/16 18:45 (external edit)