Index: Théorie spectrale des processus

Théorèmes de Herglotz et Bochner

On rappelle la notation \framebox{ $\gamma _x(y)=\gamma _y(x)=e^{-2i\pi
xy}$\ }

Définition 3.8   (Transformées de Fourier des mesures bornées sur $ {\mathbb{T}}$ et $ {\mathbb{R}}$)

On peut remarquer que ces définitions sont compatibles avec le calcul des fonctions caractéristiques et les définitions du premier chapitre si la mesure $ \mu$ est une probabilité, dans le sens que $ \phi_\mu(t)=\hat\mu(\frac t{2\pi})$.

Proposition 3.9   On a les propriétés suivantes:
  1. L'application $ \mu\to \hat\mu$ est injective.
  2. La transformée de Fourier d'une mesure positive (finie dans le cas de $ {\mathbb{R}}$) est une fonction de type positif (uniformément continue dans le cas de $ {\mathbb{R}}$).
  3. La suite de probabilités $ \mu_n$ converge étroitement vers la probabilité $ \mu$ si et seulement si $ \widehat {\mu}_n (t)$ converge vers $ \widehat {\mu} (t)$ pour tout $ t\in T$.

Démonstration. Le cas du Tore
(1) L'application $ f\to \mu(f)$ est continue sur $ C({\mathbb{T}})$. Par conséquent si pour deux mesures $ \mu$ et $ \nu$ les formes linéaires $ \mu(f)$ et $ \nu(f)$ coïncident sur les exponentielles complexes elles sont égales sur $ C({\mathbb{T}})$ puisque les combinaisons linéaires d'exponentielles sont denses dans $ C({\mathbb{T}})$.
(2) Soit $ (z_1,z_2,\ldots,z_n)$ des nombres complexes. On a alors:

$\displaystyle \sum _{r=1}^n \sum _{l=1}^n z_r\overline{z}_l\hat\mu(r-l)
=
\int ...
...int\Big ( \Big\vert\sum _{r=1}^n z_r\gamma _{-r}\Big\vert^2 \Big )\,d\mu\geq
0
$

(3) La partie ``seulement si'' est évidente. Soit $ f\in C({\mathbb{T}})$ et $ \epsilon>0$. Il existe une combinaison linéaire d'exponentielle $ g$ telle que la norme de $ f-g$ dans $ C({\mathbb{T}})$ soit inférieure à $ \epsilon/4$. D'où:

$\displaystyle \vert\mu_n(f)-\mu(f)\vert\leq
\vert\mu_n(f)-\mu_n(g)\vert+\vert\m...
...\mu(g)\vert+\vert\mu(g)-\mu(f)\vert \leq
\epsilon/2+ \vert\mu_n(g)-\mu(g)\vert
$

et il suffit d'appliquer la convergence de $ \mu_n(g)$ vers $ \mu(g)$.
Dans le cas de $ {\mathbb{R}}$ seule la continuité uniforme de $ \hat\mu(t)$ n'a pas été prouvée. Elle résulte de:

$\displaystyle \vert\hat\mu(t+h)-\hat\mu(t)\vert\leq \int \vert\gamma _h(x)-1\vert\,d\mu(x)
$

et d'une application du théorème de Lebesgue. $ \qedsymbol$


On voit maintenant que certaines propriétés des fonctions de covariance, en réalité ce sont des propriétés de toute fonction de type positif.

Proposition 3.10   Soit $ c$ une fonction de type positif sur $ T$ alors :
  1. $ c(0)\geq 0$, $ c(-t)=\overline{c(t)}$, $ \vert c(t)\vert\leq c(0)$
  2. Dans le cas $ T={\mathbb{R}}$, si $ c$ est continue à l'origine alors $ c$ est uniformément continue.

Démonstration. (1) On écrit la propriété de type positif (2) On écrit que le déterminant

\begin{displaymath}
\begin{array}{c} \left \vert \begin{array}{lll}
c(0)& c(t)&c...
...^2+\vert c(t)\vert^2\big)+
2\big\{c(t)c(h)c(-t-h)\}
\end{array}\end{displaymath}

est positif d'où, si on rajoute et on soustrait $ 2c(0)\Re e\{c(t)c(t+h)\}$, on trouve

$\displaystyle c(0)\vert c(t+h)-c(t)\vert^2\leq c(0)( c(0)^2-\vert c(h)\vert^2)+ 2\Re e\big\{
\overline{c(t+h)}c(t)(c(h)-c(0))\big\}
$

or $ \big\vert\Re e\big\{ \overline{c(t+h)}c(t)(c(h)-c(0))\big\}\big\vert\leq
c(0)^2\vert c(h)-c(0)\vert$ et donc lorsque $ h\to 0$ la différence $ c(t+h)-c(t)$ tend vers 0 uniformément en $ t$.$ \qedsymbol$


Nous allons utiliser le théorème suivant de Paul Lévy. On pourra remarquer que 3. de la Proposition 3.9 en est un cas particulier.

Proposition 3.11   (Paul Lévy) Soit $ (\mu_n)_n$ une suite de mesures (positives), de masse finie sur $ {\mathbb{R}}$ (resp. sur $ {\mathbb{T}}$) telle que pour tout $ t\in{\mathbb{R}}$ (resp. $ t\in{\mathbb{Z}}$) on ait $ \lim_n\widehat{\mu}_n(t)=\varphi(t)$, la fonction $ \varphi(t)$ étant continue à l'origine dans le cas de $ {\mathbb{R}}$. Alors $ \varphi(t)$ est la transformée de Fourier d'une probabilité $ \mu$ sur $ {\mathbb{R}}$ (resp. sur $ {\mathbb{T}}$) (et donc la suite $ \mu_n$ converge étroitement vers $ \mu$).

Théorème 3.12   (Herglotz) Soit $ c$ une fonction de type positif sur $ {\mathbb{Z}}$ alors il existe une unique mesure (positive) sur $ {\mathbb{T}}$ soit $ \mu$ telle que:

$\displaystyle c(n)=\int_{\hbox{{$\scriptstyle\mathbb{T}$}}}\gamma _n(t)\,d\mu(t)=\widehat{\mu} (-n),\ \ \forall
n\in{\mathbb{Z}}
$

Si $ c$ est sommable, alors la mesure $ \mu$ a une densité $ f$ par rapport à la mesure de Lebesgue sur $ {\mathbb{T}}$ donnée par la série uniformèment convergente

$\displaystyle f(t)=\sum_{{\hbox{$\scriptstyle\mathbb{Z}$}}} c(n) \gamma _{-n}(t)=\hat c(t)$ (3.1)

Démonstration. Pour un entier positif $ N$ on pose

$\displaystyle g_N(t)=\frac{\displaystyle 1}{\displaystyle N}\sum_{n=1}^{N} \sum...
...=\sum_{k=-N+1}^{N-1}(1-{\textstyle\frac{ \vert k\vert}{N}})c(k)\gamma _{-k}(t)
$

Puisque $ c$ est de type positif et $ \gamma _n(-t)=\overline{\gamma _n(t)}$, la fonction $ g_N(t)$ est positive et si l'on note $ \mu_N$ la mesure positive de densité $ g_N(t)$ par rapport à la mesure de Lebesgue sur $ {\mathbb{T}}$ on a

$\displaystyle \widehat{\mu}_N(p)=\int_{\hbox{{$\scriptstyle\mathbb{T}$}}}
g_N(t...
...gamma _{-k},
\gamma _{p}\rangle
=(1-{\textstyle\frac{ \vert p\vert}{ N}})c(-p)
$

pour $ \vert p\vert< N$ et $ \widehat{\mu}_N(p)=0$ pour $ \vert p\vert\ge N$. Évidemment on a $ \lim_N\widehat{\mu}_N(-p)=c(p)$. Par le théorème de Paul Lévy la suite $ (\widehat{\mu}_N)_N$ converge étroitement vers une mesure $ \mu$, et par conséquent $ \hat\mu(p)=c(-p)$ pour tout $ p$. Si $ c\in\hbox{$\ell^1(\mathbb{Z})$\ }$ alors la série dans 3.1 converge dans $ \hbox{$L^1(\mathbb{T},dx)$\ }$ et on intégre terme à terme pour vérifier que $ \hat f(p)=c(-p)=\hat \mu(p)$ $ \qedsymbol$

Théorème 3.13   (Bochner) Soit $ c$ une fonction de type positif sur $ {\mathbb{R}}$ et continue à l'origine. Alors il existe une unique mesure (positive, finie) $ \mu$ sur $ {\mathbb{R}}$ telle que:

$\displaystyle c(t)=\int_{\hbox{$\scriptstyle\mathbb{R}$}}
\gamma _t(x)\,d\mu(x)=\widehat{\mu} (-t),\ \ \forall t\in{\mathbb{R}}
$

Si $ c$ est sommable, alors la mesure $ \mu$ a une densité $ f$ par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}$ donnée par

$\displaystyle f(t)=\int_{{\hbox{$\scriptstyle\mathbb{R}$}}} c(x) \gamma _{-t}(x)\,dx =\hat c(t)$ (3.2)

Démonstration. Pour $ T$ réel positif on définit la fonction positive continue et à support compact $ h_T(t)=(1-\frac{\vert t\vert}{ T})^+$. Pour un entier positif $ N$ on pose

$\displaystyle g_N(t)=\frac{\displaystyle 1}{\displaystyle N}\int_{0}^{N} \int_{...
...dx\,dy =\int_{{\hbox{$\scriptstyle\mathbb{R}$}}} h_N(u)c(u)\gamma _{-t}(u)\,du
$

Comme pour le théorème de Herglotz, on veut calculer sa transformée de Fourier et montrer qu'elle converge vers une fonction limite et appliquer le théorème de Paul Lévy. À la différence dela démonstration du théorème de Herglotz on ne peut pas appliquer le théorème de Fubini, car la fonction $ t\to \gamma _{-t}(u)$ n'est pas intégrable sur $ {\mathbb{R}}$. On calcule alors

$\displaystyle \int_{{\hbox{$\scriptstyle\mathbb{R}$}}} g_N(t)h_T(t)\gamma _u(t)\,dt=\int_{{\hbox{$\scriptstyle\mathbb{R}$}}}
h_N(v)c(v)K_T(u-v)\,dv
$

$ K_T$ désigne le noyau de Féjer (définition 1.47. La fonction $ v\to h_N(v)c(v)$ est continue et intégrable et donc, d'après les propriétés du noyau de Féjer (lemme 1.49),

$\displaystyle \lim_{T\to\infty} \int_{{\hbox{$\scriptstyle\mathbb{R}$}}}
g_N(t)...
...y} \int_{{\hbox{$\scriptstyle\mathbb{R}$}}}
h_N(v)c(v)K_T(u-v)\,dv =c(u)h_N(u)
$

En faisant $ u=0$ le théorème de convergence monotone implique

$\displaystyle \int_{{\hbox{$\scriptstyle\mathbb{R}$}}} g_N(t)\, dt=\lim_{T\to\infty} \int_{{\hbox{$\scriptstyle\mathbb{R}$}}} g_N(t)h_T(t)\,dt=c(0)
$

et donc $ g_N$ est intégrable et son intégrale ne dépend pas de $ n$ (et vaut donc $ c(0)$). Par conséquent les mesures positives $ \mu_N$ de densité $ g_N$ par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}$ ont toutes pour masse totale $ c(0)$. Le théorème de Lebesgue donne maintenant

$\displaystyle \hat \mu_N(u)=\hat g_N(u)=\lim_{T\to\infty} \int_{{\hbox{$\scriptstyle\mathbb{R}$}}}
g_N(t)h_T(t)\gamma _{-u}(t)\,dt=c(-u)h_N(-u),
$

d'où

$\displaystyle \lim_{N\to\infty}\hat \mu_N(u)=c(-u)
$

La fonction $ u\to c(-u)$ étant continue à l'origine, le théorème de Paul Lévy permet d'affirmer qu'il existe une mesure positive $ \mu$ de masse totale $ c(0)$ telle que $ c(-u)=\hat\mu(u)$. Si $ c$ est sommable, alors les fonctions $ g_N$ sont uniformément bornées par $ \Vert c\Vert _1$ et convergent ponctuellement vers $ f$. Par conséquent si $ \varphi$ est une fonction continue à support compact on peut appliquer le théorème de Lebesgue, d'où

$\displaystyle \mu(\varphi)=\lim_{N\to\infty} \mu_N(\varphi)=\lim \int g_N
(t)\varphi(t)\,dt= \int f(t)\varphi(t)\,dx
$

et la preuve est complète.$ \qedsymbol$

Définition 3.14   Soit $ X$ un p.s.c. (continu en m.q. si $ T=\mathbb{R}$) de fonction de covariance $ c_X$. On dira alors que la mesure $ \mu_X$ donnée par les théorèmes d'Herglotz ou de Bochner est la mesure spectrale de $ X$.

On remarquera que l'on a $ \hat\mu_X(t)=c_X(-t)$ et non $ c_X(t)$... En fait on a choisi cette convention de telle sorte que dans les cas usuels où la fonction de covariance est sommable, on obtienne la densité spectrale par une transformation de Fourier.

Par ailleurs, si le processus $ (X_t)_t$ est réel, la fonction de covariance $ c$ est réelle et donc symétrique. On a donc aussi, dans ce cas, $ \hat\mu_X(t)=c_X(t)$. En général si on définit $ \widetilde{\mu}_X(A)={\mu}_X(-A)$, on vérifie tout de suite que $ \widehat{\widetilde{\mu}}_X(t)=\hat\mu_X(-t)$ et donc $ \widehat{\widetilde{\mu}}_X(t)=c(t)$.


Ceux qui connaissent la théorie spectrale des opérateurs unitaires se convaincront facilement que dans le cas du tore, $ \mu_X$ est la mesure spectrale de l'opérateur unitaire $ {\cal
T}$ calculée sur un vecteur $ X_k$ (quel que soit $ k\in{\mathbb{Z}}$) puisque:

$\displaystyle c_X(n)=\int_{\hbox{{$\scriptstyle\mathbb{T}$}}}\gamma _n(t)\,d\mu_X(t)=\langle {\cal T}^n X_k,X_k\rangle ,\qquad
\forall n,k \in{\mathbb{Z}}
$

Exemple 3.15   Quelle est la mesure spéctrale d'un bruit blanc de variance $ \sigma^2$? Dans ce cas on a $ c(0)=\sigma^2$, $ c(k)=0$ pour tout $ k\not=0$. La relation (3.2), donne $ f(t)=\sigma^2$. Donc la mesure spectrale a une densité constante égale à $ \sigma^2$.

On a la ``réciproque'' suivante qui est une conséquence immédiate de 2.36 :

Remarque 3.16   Soit $ \mu$ une mesure positive finie sur $ {\mathbb{T}}$ (resp sur $ {\mathbb{R}}$) alors il existe au moins un p.s.c. de mesure spectrale $ \mu$. (On peut même le choisir gaussien).

Exemple 3.17   (P.s.c. à spectre discret) Soit $ {\mathbb{T}}=]-\frac 12,\frac 12]$ et $ -\frac 12<\lambda_1<\dots<\lambda_m\leq\frac
12$. Soit $ A(1),\dots,A(m)$ une famille de v.a. complexes, centrées, de carré intégrable, deux à deux orthogonales, avec $ \hbox{\rm Var}(A_j)= \sigma^2_j$. On pose

$\displaystyle X_n=\sum_{j=1}^mA(j)\gamma_{\lambda_j}(n)=\sum_{j=1}^mA(j)e^{-2\pi i n\lambda_j}$ (3.3)

Montrons que $ (X_n)_{n\in{\mathbb{Z}}}$ est un p.s.c. En effet $ X_n\in L^2$ et

$\displaystyle {\mathbb{E}}[X_{k+r}\overline{X}_r]=\sum_{j,\ell=1}^m{\mathbb{E}}...
...\gamma_{\lambda_\ell}(r)}=
\sum_{j=1}^m\sigma^2_j\gamma_{\lambda_j}(k):=c_X(k)
$

Cette dernière quantité ne dépendant pas de $ r$, $ (X_n)_{n\in{\mathbb{Z}}}$ est un p.s.c. Quelle est sa mesure spectrale? Si l'on pose $ \mu=\sum_{j=1}^m\sigma^2_j\delta_{\lambda_j}$ (où $ \delta_{\lambda_j}$ est la masse de Dirac en $ \lambda_j$), alors

$\displaystyle c_X(k)=\sum_{j=1}^m\sigma^2_j\gamma_{\lambda_j}(k)= \int_{\mathbb{T}}\gamma_t(k)\, d\mu(t)$ (3.4)

Donc $ \mu$ est la mesure spectrale de $ X$ soit $ \mu_X$. En général le processus $ (X_n)_{n\in{\mathbb{Z}}}$ défini par (3.3) est complexe. Sin on veut cnstruire un processus réel, on supposera alors que:

$\displaystyle \lambda_{m+1-j}=-\lambda_j,\qquad\qquad
A(-j)=\overline{A(j)}
$

On peut remarquer que la condition $ A(-j)=\overline{A(j)}$ n'est pas incompatible avec l'orthogonalité de $ A(-j)$ et $ {A(j)}$ car si l'on pose $ A(j)=C(j)+iD(j)$, cette condition est équivalente à $ {\mathbb{E}}(C(j))^2)={\mathbb{E}}(D(j))^2$ et $ {\mathbb{E}}(C(j)D(j))=0$ (et alors $ \sigma_j^2=\sigma_{-j}^2={\mathbb{E}}(C(j))^2)+{\mathbb{E}}(D(j))^2$). On impose donc que la mesure spectrale $ \mu_X$ soit symétrique. De plus, les relations précédentes impliquent que si 0 est l'un des valeurs $ \lambda_j$, alors la v.a. $ A(0)$ est réelle. Il est immédiat de vérifier que, dans ces conditions, le processus $ (X_n)_{n\in{\mathbb{Z}}}$ est réel. En supposant, par exemple, $ m$ pair soit $ m=2r$, et en numérotant les $ \lambda$ et les v.a. $ A$ sous la forme $ \pm\lambda_j\;;\;A_{\pm j}\;;\;j=1,\ldots,r$ on obtient

$\displaystyle X_n=2\sum_{j=1}^r\big\{C(j)\cos (2\pi n\lambda_j ) -D(j)\sin(2\pi n\lambda_j )\big\}$ (3.5)

Si on reprend (3.4), la fonction de covariance de ce processus vaut donc

$\displaystyle c_X(k)=2\sum_{j=1}^r\sigma^2_j\cos(2\pi k\lambda_j)
$

On voit donc que la fonction de covariance $ c_X$ apparaît comme une superposition de cosinus de fréquences différentes, chacune avec un poids $ \sigma^2_j$. Les calculs effectués autour de ce modèle simple nous permettent de faire quelques considérations qui peuvent éclairer la signification intuitive des objets qui ont été introduits dans les derniers paragraphes. Puisque la fonction $ t\to\cos(2\pi t\lambda_j)$ a une période égale à $ t_j=\lambda_j^{-1}$, les grandes valeurs de $ \sigma^2_j$ correspondent à la présence dans la fonction de covariance $ c_X$ de composantes importantes ayant une période $ t_j$. Plus précisement, supposons que $ \sigma_\ell^2$, soit significativement plus grand que les autres $ \sigma^2_j$. Si on pose $ \sigma^2=2\sum_{j=1}^r\sigma^2_j$, le quotient $ {\sigma^2_j}/\sigma^2$ sera proche de $ 1$ pour $ j=\ell$ et proche de 0 sinon. En se rappelant que $ \sigma^2=c_X(0)=\hbox{\rm Var}(X_n)$ pour tout $ n$, le coefficient de corrélation entre $ X_n$ et $ X_{n+k}$ vaut

$\displaystyle \rho(k)=\frac {c_X(k)}{c_X(0)}=
\sum_{j=1}^r \frac {\sigma^2_j}{\sigma^2}\cos(2\pi k\lambda_j)\sim \cos(2\pi
k\lambda_\ell)
$

Cette quantité qui oscille entre $ \pm 1$ indique donc une forte corrélation périodique (positive ou négative) entre $ X_{n}$ et $ X_{n+k}$

De même, en considérant la représentation 3.5, le processus $ (X_n)_{n\in{\mathbb{Z}}}$ devrait donc présenter une périodicité de période $ \lambda_\ell^{-1}$. De façon plus générale, si la mesure spectrale $ \mu_X$ a une densité $ f_X$ par rapport à la mesure de Lebesgue, la relation

$\displaystyle c_X(k)=\int_{\mathbb{T}}\gamma_t(k)f_X(t)\, dt
$

peut être vue comme une décomposition de la fonction $ c_X$ comme une superposition des exponentielles complexes $ \gamma _t$, chacune avec un poids `` $ f_X(t)\, dt$". Les valeurs $ t\not=0$ des fréquences où $ f_X$ a un maximum indiqueront donc la présence de périodicités de l'ordre de $ \frac 1t$ du processus $ (X_n)_{n\in{\mathbb{Z}}}$. Donc la recherche de périodicités dans le comportement d'un p.s.c. se fait de façon naturelle avec l'étude de la mesure spectrale.

Exemple 3.18   (P.s.c. à temps continu)

Soit $ U$ et $ V$ des variables aléatoires indépendantes, $ U$ suivant une loi uniforme sur $ [-1,\ +1]$ , $ V$ suivant une loi $ \mu$ sur $ {\mathbb{R}}$. Pour $ t\in{\mathbb{R}}$ on pose $ X_t=U\gamma _t(V)$. Alors $ X_t$ est centré puisque $ {\mathbb{E}}(X_t)={\mathbb{E}}(U){\mathbb{E}}(\gamma _t(V))$ et $ {\mathbb{E}}(U)=0$. D'autre part:

$\displaystyle {\mathbb{E}}(X_{t+h}\bar X_h)= {\mathbb{E}}(U^2){\mathbb{E}}(\gamma _{t+h}(V)\gamma _{-h}(V))
= \frac{1}{3}{\mathbb{E}}(\gamma _{t}(V))
$

On en déduit que $ X_t$ est stationnaire et que $ c_X(t)=\frac{1}{3}\int\gamma _t(x)d\mu(x)
$ et par conséquent la mesure spectrale $ \mu_x$ est égale à $ \mu/3$.

On peut aussi considérer le processus $ X_t$ défini par la formule $ X_t=\exp(-2i\pi(tV+U))$, où $ U$ et $ V$ sont des variables aléatoires indépendantes, $ U$ suivant une loi uniforme sur $ [0\ 1]$ et $ V$ suivant une loi $ \mu$. Alors $ X_t$ est centré puisque $ {\mathbb{E}}(X_t)={\mathbb{E}}(\gamma _1(U)){\mathbb{E}}(\gamma _t(V))$ et $ {\mathbb{E}}(\gamma _1(U))=\int_0^1\gamma _1(u)\,du=0$. D'autre part:

$\displaystyle {\mathbb{E}}(X_{t+h}\bar X_h)= {\mathbb{E}}(\vert\gamma _1(U\vert^2){\mathbb{E}}(\gamma _{t+h}(V)\gamma _{-h}(V))
= {\mathbb{E}}(\gamma _{t}(V))
$

On en déduit que $ X_t$ est stationnaire et que $ c_X(t)=\int\gamma _t(x)d\mu(x)
$ et par conséquent la mesure spectrale $ \mu_x$ est égale à $ \mu$.



Retour Index: Théorie spectrale des processus