Product Type Dynamical Systems: variational principle

janeiro 16, 2012
(English Below)

Este é um resumo do seminário que vou apresentar dia 26 de janeiro de 2012 no Imperial College London.

This is the abstract of a seminar I am about to present on 26 January of 2012 at the Imperial College London DynamIC Seminars. The slides will be upload to this page as soon as they are available.

Comments are very welcome, and can be made at the end of this page.

Abstract

Inspired by the Kolmogorov-Sinai entropy (KS-entropy) for a measure-preserving dynamical system, Adler, Konheim and McAndrew developed a purely topological concept of entropy (AKM-entropy) for topological dynamical systems over compact phase spaces. The AKM-entropy relates to the KS-entropy trough the so called Variational Principle: h(T)    =    \sup_\mu h_\mu(T),  where h(T) is the AKM-entropy and h_\mu(T) is the KS-entropy for the dynamical system T. The supremum is taken over all possible Borel measures.

Since then, many attempts to generalise this to non-compact spaces have been made. But not always the Variational Principle holds for this new concept. Bowen did it for metrizable systems. For a definition that uses some heavy machinery under the umbrella of topological pressure, Pesin and Pitskel’ have proved that the Variational Principle holds under some (hard to verify) hypothesis. In this Seminar, I will present a new concept of entropy which is surprisingly close to the AKM-entropy, and for which the Variational Princilpe still holds for a wide range of spaces. We have called those, Product Type Dynamical Systems.

Downloads

Anúncios

Princípio variacional

janeiro 11, 2011
Atenção: A demonstração do teorema 2 está incorreta! Provavelmente o teorema nem vale. 😦

No estudo de sistemas dinâmicos topológicos, o princípio variacional nos permite utilizar conceitos topológicos para concluir fatos relacionados com teoria da medida e vice-versa.

O professor Mauro Patrão formulou e eu aperfeiçoei uma definição de entropia topológica na qual o princípio variacional continua valendo quando o espaço em questão é um espaço topológico de Hausdorff localmente compacto. O teorema deve ir pra minha tese de doutrorado :-). Queremos que seja Hausdorff localmente compacto para utilizarmos o teorema de Banach-Alaoglu e o teorema de representação de Riesz. Também queremos que seja Hausdorff localmente compacto para que seja um espaço de Tychonoff.

Definição: Dada uma família \mathcal{F} de subconjuntos de X que o cobre (ou seja, X = \bigcup_{F \in \mathcal{F}} F), denotamos por

\displaystyle N(\mathcal{F})

o ínfimo das cardinalidades das subcoberturas de \mathcal{F}. Se \mathcal{F} é uma partição, então N(\mathcal{F}) é simplesmente o número de conjuntos (não vazios) na partição.


Definição: Um sistema dinâmico topológico, é um espaço topológico X munido de uma transformação contínua T: X \rightarrow X.


Atenção: As definições abaixo que se referem a espaços de probabilidade estão também bem-definidas quando tratamos de espaços de medida com medida finita.

Definição: Dado um espaço de probabilidade (X, \mathcal{F}, \mu), um sistema dinâmico no espaço de probabilidade X é uma aplicação mensurável T: X \rightarrow X que preserva a medida de probabilidade \mu. Ou seja,

\displaystyle \mu \circ T^{-1} = \mu.

Também dizemos que \mu é T-invariante.


Dado um sistema dinâmico topológico (X, T), se considerarmos os borelianos \mathcal{B} de X, ou seja, a \sigma-álgebra gerada pelos abertos de X, como T é mensurável, podemos considerar T como sendo um sistema dinâmico no espaço do probabilidade de uma medida de Radon qualquer definida em \mathcal{B} (se é que existe alguma). As medidas de probabilidade de Radon são aquelas tais que todo conjunto mensurável pode ser aproximado internamente por um conjunto compacto. Ou seja, para todo E \in \mathcal{B} e todo \varepsilon > 0, existe um compacto K \subset E tal que

\displaystyle \mu(E \setminus K) \leq \varepsilon.

Definição (entropia de uma partição): Dado um espaço de probabilidade (X, \mathcal{F}, \mu) e uma partição mensurável de X \mathcal{C} = \{C_1, \dotsc, C_k\}, a entropia de \mathcal{C} com respeito a \mu é

\displaystyle H_\mu(\mathcal{C}) = \sum_{C \in \mathcal{C}} \mu(C) \log \frac{1}{\mu(C)}.

Definição (entropia topológica de uma partição): Dado um espaço topológico X e uma cobertura \mathcal{A} de X formada por abertos, tal que ao menos um elemento dessa cobertura tem complemento compacto (chamaremos essas de coberturas admissíveis), a entropia topológica da cobertura \mathcal{A} é

\displaystyle H(\mathcal{A}) = \log N(\mathcal{A}).

Note que a presença de um elemento com complemento compacto na cobertura implica que N(\mathcal{A}) é finito.


Definição (família iterada): Dada uma transformação T: X \rightarrow X e uma família qualquer \mathcal{F} de subconjuntos de X, definimos

\displaystyle \mathcal{F}^n = \mathcal{F}_T^n = \{ F_0 \cap \dotsb \cap F_{n-1}: F_j \in T^{-j}(\mathcal{F}) \}.

No caso de T mensurável, quando \mathcal{F} é uma partição mensurável de X — no caso de T contínua, quando é uma cobertura admissível de X\mathcal{F}^n também será.


Definição (entropia de T com respeito a uma partição/cobertura): Dado um sistema dinâmico T no espaço de probabilidade (X, \mu) e uma partição mensurável \mathcal{C}, definimos

\displaystyle h_\mu(\mathcal{C}) = h_\mu(T | \mathcal{C}) = \lim \frac{1}{n} H_\mu(\mathcal{C}^n).

Se T é um sistema dinâmico topológico e \mathcal{A} uma cobertura admissível, definimos

\displaystyle h(\mathcal{A}) = h(T | \mathcal{A}) = \lim \frac{1}{n} H(\mathcal{A}^n).

Definição (entropia de T): Dado um sistema dinâmico T no espaço de probabilidade (X, \mu), definimos

\displaystyle h_\mu(T) = \sup_{\mathcal{C} \text{: particao mensuravel finita}} h_\mu(\mathcal{C}^n).

Se T é um sistema dinâmico topológico, definimos

\displaystyle h(T) = \sup_{\mathcal{A} \text{: cobertura admissivel}} h(\mathcal{A}^n).

Note que poderíamos ter restringido o cálculo de h(T) às coberturas admissíveis finitas.


Finalmente, após esse tanto de definições, queremos mostrar a primeira desigualdade do princípio variacional. Para tanto, vamos começar com um lema.

Lema 1.1: Se \eta = \{B_0, \dotsc, B_k\} tal que para 1 \leq j \leq k, B_j \subset A_j é uma partição, então \beta = \{B_0 \cup B_1, \dotsc, B_0 \cup B_k\} é uma cobertura e vale que

\displaystyle N(\eta^n) \leq 2^n N(\beta^n).

Demonstração:

Seja \Lambda \subset \{1, \dotsc, k\}^n um conjunto com \lvert \Lambda \rvert = N(\beta^n) tal que

\displaystyle X = \bigcup_{\lambda \in \Lambda} (T^0(C_{\lambda_0} \cup C_0) \cap \dotsb \cap T^{-(n-1)}(C_{\lambda_{n-1}} \cup C_0)).

Seja

\displaystyle f: \Lambda \times \{0, 1\}^n \rightarrow \eta^n

a aplicação tal que f(\lambda, x) é o conjunto Y_0 \cap \dotsb \cap Y_{n-1}, onde Y_j = T^{-j}(C_{\lambda_j}) quando x_j = 1, e Y_j = T^{-j}(C_0) quando x_j = 0.
Como,

\displaystyle X = \bigcup_{\lambda \in \Lambda} (T^0(C_{\lambda_0} \cup C_0) \cap \dotsb \cap T^{-(n-1)}(C_{\lambda_{n-1}} \cup C_0)) =\\= \bigcup f(\Lambda \times \{0, \dotsc, 2^n -1\}),

e \eta^n é uma partição, temos que a imagem de f contém todos os conjuntos não vazios de \eta^n. Assim,

\displaystyle N(\eta^n) \leq 2^n \lvert \Lambda \rvert.

Lema 1.2: Para todo k > 0,

\displaystyle h(T^k) = k h(T)

e, para uma medida de Radon \mu T-invariante,

\displaystyle h_\mu(T^k) = k h_\mu(T).

Demonstração:

A demonstração das duas igualdades é a mesma. Basta substituir cobertura por partição mensurável finita. (veja o teorema 4.13 do Walters)

Considere uma cobertura \mathcal{A}. Sabemos que (\mathcal{A}^k)_{T^k}^n = \mathcal{A}_T^{nk}. Assim,

\displaystyle k\frac{1}{kn} H(\mathcal{A}_T^{kn}) = \frac{1}{n} H((\mathcal{A}^k)_{T^k}^n).

E portanto, tomando limite para n \rightarrow \infty temos

\displaystyle k h(T | \mathcal{A}) = h(T^k | \mathcal{A}^k).

Tomando o supremo para todas as coberturas admissíveis \mathcal{A}, temos que k h(T) \leq h(T^k).
Por outro lado,

\displaystyle h(T^k | \mathcal{A}) \leq h(T^k | \mathcal{A}^k) = k h(T | \mathcal{A}).

Lema 1.3: Se \mu é uma medida T-invariante finita, então para 0 \leq \alpha \leq 1,

\displaystyle h_{\alpha \mu}(T) \leq h_\mu (T).

Demonstração:

Podemos assumir que \alpha \neq 0, pois h_0(T) = 0.

Seja \mathcal{C} uma partição mensurável finita qualquer. Então,

\displaystyle \frac{1}{n} \sum_{C \in \mathcal{C}^n} \alpha \mu(C) \log \frac{1}{\alpha \mu(C)} \leq \frac{1}{n} \sum_{C \in \mathcal{C}^n} \mu(C) \log \frac{1}{\alpha \mu(C)} = \\ = \frac{1}{n} \left(\sum_{C \in \mathcal{C}^n} \mu(C) \log \frac{1}{\mu(C)}\right) + \frac{1}{n} \log \frac{1}{\alpha}.

Basta agora fazer n \rightarrow \infty.


No teorema a seguir, vou usar a mesma notação que o Walters para facilitar a comparação entre as demonstrações.

Teorema 1 (princípio variacional – primeira desigualdade): Seja T: X \rightarrow X um sistema dinâmico topológico e \mu uma medida de Radon T-invariante em X tal que \mu(X) \leq 1, então vale que

\displaystyle h_\mu(T) \leq h(T).

Demonstração:
Pelo lema 1.3 é suficiente considerar o caso \mu(X) = 1.

Seja \xi = \{A_1, \dotsc, A_k\} uma partição mensurável. Precisamos mostrar que existe uma cobertura admissível \beta tal que h_\mu(\xi) \leq h(\beta).

Como \mu pode ser aproximada internamente por compactos, segue a seguinte afirmação.

Afirmação 1: Existe uma família \eta = \{B_0, \dotsc, B_k\} tal que para 1 \leq j \leq k, B_j \subset A_j é compacto e \mu(A_j \setminus B_j) \leq k e B_0 = \left(B_1 \cup \dotsb \cup B_k\right)^c. Em particular, \mu(B_0) \leq k \varepsilon

Por preguiça de definir entropia condicional e demonstrar suas propriedades, para a demonstração da afirmação seguinte, vou pedir ao leitor que veja o início da demonstração do teorema 8.6 do Walters. Se alguém realmente quiser, pode solicitar nos comentários que eu tento colocar aqui.

Afirmação 2: Se escolhermos \varepsilon \leq \frac{1}{k \log k}, então

\displaystyle h_\mu(\xi) \leq h_\mu(\eta) + 1.

Defina, \beta = \{B_0 \cup B_1, \dotsc, B_0 \cup B_k\}. Vamos demonstrar que vale a seguinte relação entre as entropias topológica e de medida.

Afirmação 3: Vale que, para todo n,

\displaystyle H_\mu(\eta^n) \leq \log 2 + H(\beta^n).

Basta aplicar o lema 1.1, e mais o conhecido fato (corolário 4.2.1) de que

\displaystyle H_\mu(\eta^n) \leq \log N(\eta^n).

Novamente, juntando todas as afirmações, temos que

\displaystyle h_\mu(\xi) \leq h(\beta) + 1 + \log 2.

Como a partição \xi era arbitrária, podemos tomar o supremo e concluir que

\displaystyle h_\mu(T) \leq h(T) + 1 + \log 2.

Agora é só continuar copiando a demonstração do livro. Ou seja, basta observar que h_\mu(T^n) = n h_\mu(T) e que h(T^n) = n h(T), e então notar que a desigualdade vale para T^n:

\displaystyle h_\mu(T^n) \leq h(T^n) + 1 + \log 2.

Assim,

\displaystyle n h_\mu(T^n) \leq n h(T^n) + 1 + \log 2.

Dividindo por n e fazendo n \rightarrow \infty, temos o resultado desejado.

CQD


O próximo teorema é a desigualdade inversa. Vamos precisar que X seja um espaço de Tychonoff para demonstrar o seguinte lema. (veja o lema 8.5 do Walters)

Lema 2.1: Se X é Hausdorff localmente compacto, então, dada uma cobertura admissível \mathcal{A} e uma medida de Radon \mu, então existe uma cobertura admissível finita \hat{\mathcal{A}} tal que:

  1. \hat{\mathcal{A}} refina \mathcal{A}. Ou seja, se \hat{A} \in \hat{\mathcal{A}}, então existe A \in \mathcal{A} que contém \hat{A}. (isso implica, que N(\mathcal{A}) \leq N(\hat{\mathcal{A}}), e em particular, que para um sistema dinâmico topológico T, H(\mathcal{A}^n) \leq H(\hat{\mathcal{A}}^n))
  2. Para todo \hat{A} \in \hat{\mathcal{A}}, \mu(\partial \hat{A}) = 0.

Demonstração:

Para cada A \in \mathcal{A} e cada x \in A, escolha uma função de Tychonoff f: X \rightarrow [0,1] (contínua, tal que f|_{A^c} = 1) e f(x) = 0. Então, f^{-1}([0,\varepsilon)) é aberto com bordo contido em f^{-1}(\varepsilon). Como f^{-1}(\varepsilon) são todos disjuntos e em quantidade não enumerável, existem \varepsilon_2 > \varepsilon_1 > 0 tais que

\displaystyle B_{x,A} = f^{-1}([0,\varepsilon_2)) \subset A

e

\displaystyle D_{x,A} = f^{-1}([0,\varepsilon_1]) \subset B_{x,A},

onde ambos tem bordo com medida nula. Como o espaço é localmente compacto, podemos ainda fazer a escolha de modo que D_{x,A} é compacto.

Seja K \subset X compacto tal que K^c \in \mathcal{A}.
Tome uma sequencia finita D_1, \dotsc, D_m de conjuntos da forma D_{x,A} cujos interiores cobrem K, e tome os conjuntos B_1, \dotsc, B_m correspondentes. Então,

\displaystyle B_1, \dotsc, B_m, \left(D_1 \cup \dotsb \cup D_m\right)^c

é uma cobertura admissível finita de X que refina \mathcal{A}, onde todos os elementos tem bordo com medida nula.


Lema 2.2: Seja uma medida de Radon \mu. Dada uma cobertura admissível finita \mathcal{A} cujos elementos possuem bordo de medida nula, então existe uma partição mensurável finita \mathcal{C} que refina \mathcal{A} tal que para todo C \in \mathcal{C}, \mu(\partial C) = 0. Também vale que para todo n,

\displaystyle N(\mathcal{A}^n) \leq N(\mathcal{C}^n).

Demonstração:

Seja A_1, \dotsc, A_m os elementos de \mathcal{A}. Faça

\displaystyle C_j = A_j \setminus \bigcup_{k = 1}^{j-1} A_k.

Esses conjuntos formam (eliminando os vazios) uma partição \mathcal{C} que refina \mathcal{A}.

Em particular, \mathcal{C}^n refina \mathcal{A}^n e portanto temos que N(\mathcal{A}^n) \leq N(\mathcal{C}^n).

Falta apenas mostrar que os elementos de \mathcal{C} possuem bordo com medida nula. Suponha que x \in \partial C_j \setminus \partial A_j. Primeiramente, temos que

x \in A_j, (*)

já que é evidente que x \in \overline{A_j}. Além disso,

x \not \in A_1 \cup \dotsb \cup A_{j-1}, (**)

pois este é um aberto que não intersepta C_j. Por outro lado,

x \not \in {\rm int}(C_j) \subset A_0 \setminus (\overline{A_1} \cup \dotsb \cup \overline{A_{j-1}}). (***)

Temos então, juntando (*) e (***), que

x \in \overline{A_1} \cup \dotsb \cup \overline{A_{j-1}}. (****)

Juntando (**) e (****), temos que para algum k = 1, \dotsc, j-1,

x \in \overline{A_k} \setminus A_k = \partial A_k.

Ou seja, \partial C_j tem medida nula, pois

\partial C_j \subset \bigcup_{k=1}^j \partial A_k,

e todos os \partial A_k tem medida nula.


Lema 2.3: O conjunto das medidas (sem sinal) finitas é fechado na topologia fraco-*. Em particular, no caso de o espaço em questão ser Hausdorff localmente compacto, o conjunto das medidas (sem sinal) com medida total menor ou igual a 1 é compacto na topologia fraco-*.
Demonstração:
Vamos escrever \mu(f) para a integral de f com respeito a \mu.

Seja \mu_n \rightarrow \mu. Em particular, para f \geq 0 em C_0(X),

\displaystyle \mu(f) = \lim \mu_n(f) \geq 0.

Isso implica que \mu é um funcional positivo. Ou seja, \mu é uma medida (sem sinal).

A segunda afirmação segue do teorema de representação de Riesz e do teorema de Banach-Alaoglu.


Teorema 2 (princípio variacional): Seja T: X \rightarrow X um sistema dinâmico topológico Hausdorff localmente compacto, então vale que

\displaystyle h(T) = \sup_{\substack{\mu \text{: T-invariante} \\ \mu(X) \leq 1}} h_\mu(T).

Demonstração:

Seja \mathcal{A} uma cobertura admissível qualquer. Vamos mostrar que existe \mu de radon, T-invariante com \mu(X) \leq 1, tal que

\displaystyle h_\mu(T) \geq h(T | \mathcal{A}).

Para cada n \in \mathbb{N}, seja \mathcal{A}_n \subset \mathcal{A}^n uma subcobertura de cardinalidade N(\mathcal{A}^n). Escolha um ponto x_A^n para cada A \in \mathcal{A}_n que não pertence a nenhum outro membro de \mathcal{A}_n. Isso é possível pois \mathcal{A}_n não possui subcobertura própria. Defina

\displaystyle \sigma_n = \frac{1}{N(\mathcal{A}^n)} \sum_{A \in \mathcal{A}_n} \delta_{x_A}.

Defina também a sequência

\displaystyle \mu_n = \frac{1}{n} \sum_{j = 0}^{n-1} \sigma_j \circ T^{-j}.

Pelo lema 2.3, existe uma medida \mu com medida total entre 0 e 1 que é limite fraco de uma subsequência de \mu_n.

Pelo lema 2.2, existe uma partição \mathcal{C}, que refina \mathcal{A}, e cujos elementos possuem bordo com medida \mu nula.

É a afirmação a seguir que está incorreta!!!

Note que H_{\sigma_n}(\mathcal{C}^n) = \log N(\mathcal{A}^n) = H(\mathcal{A}^n), pois cada elemento de \mathcal{C} possui medida 0 ou \frac{1}{N(\mathcal{A}^n)}, já que cada elemento de \mathcal{C}^n pode conter no máximo um dos x_A^n.

Agora, basta imitar o final da demonstração do teorema 8.6 do Walters, lembrando que

  1. Deve-se substituir \log s_n(\varepsilon, X) do Walters por H(\mathcal{A}^n).
  2. Os bordos dos elementos de \mathcal{C}^n tem medida nula.

CQD.

Corolário: Se não existir uma medida de probabilidade T-invariante, então a entropia topológica será 0.


Pontos Extremos e Medidas Ergódicas

dezembro 8, 2009

Definição: Seja M um subconjunto convexo de um espaço vetorial. Dizemos que x \in M é um ponto extremo de M quando não for combinação convexa (não trivial) de nenhum ponto de M.


Dado um espaço mensurável (X, \sigma). O conjunto M(X) = M(X, \sigma) das medidas finitas sobre (X, \sigma) é um espaço vetorial. O conjuntos das medidas de probabilidade P(X) = P(X, \sigma) é um subconjunto convexo. E, fixada uma transformação T: (X, \sigma) \to (X, \sigma) mensurável, o conjunto P(T) das medidas de probabilidade invariantes por T também é um subconjunto convexo de M(X).

Se \mu \in P(T) não é T-ergódica, é fácil ver que não é um ponto extremo de P(T). De fato, se E \subset X é um conjunto invariante com 0 < \mu(E) < 1, então, fazendo F = E^\complement,
\mu = \frac{1}{\mu(E)} \mu_E + \frac{1}{\mu(F)} \mu_F,
onde \mu_E(A) = \mu(E \cap A), é uma combinação convexa não trivial de elementos de P(T).

O objetivo desse post é mostrar que a recíproca também vale. Ou seja, se \mu \in P(T) for um ponto extremo, então será uma medida T-ergódica.

Teorema: Uma medida \mu \in P(T) é T-ergódica se, e somente se, \mu é um ponto extremo de P(T).

Demonstração:
Pelos comentários anteriores, basta mostrar que se \mu é T-ergódica, então toda combinação convexa
\mu = \alpha \nu + \beta \nu',
onde \nu, \nu' \in P(T), é trivial. Ou seja, assumindo sem perda de generalidade que \alpha \neq 0, vamos mostrar que \mu = \nu.

Note que \nu \ll \mu.

Afirmação 1: \nu é T-ergódica.

Tome E \subset X invariante. Então \mu(E) = 0 ou \mu(E^\complement) = 0. Pela continuidade absoluta temos que \nu(E) = 0 ou \nu(E^\complement) = 0.

Afirmação 2: Se \nu \ll \mu e ambas são T-ergódicas, então \nu = \mu.

Pelo teorema ergódico de Birkhoff, sabemos que existe um conjunto E \subset X, com \mu(E^\complement) = 0 tal que para todo x \in E, e todo A \in \sigma,
\frac{1}{n} \sum_{j=0}^{n-1} \chi_A(x) \circ T \rightarrow \mu(A).

Do mesmo modo, existe F \subset X, com \nu(F^\complement) = 0 tal que o mesmo vale para \nu.

Observe que \mu(E^\complement) = 0 \Rightarrow \nu(E^\complement) = 0. Assim, \nu(E^\complement \cup F^\complement) = 0. E em particular, E \cap F \neq \emptyset. Tome então x \in E \cap F. Sabemos que para todo A \in \sigma,
\nu(A) = \lim \frac{1}{n} \sum_{j=0}^{n-1} \chi_A(x) \circ T = \mu(A).

Segue da afirmação 2 que \nu = \mu. E portanto, \mu é um ponto extremo de P(T).


Rotação Ergódica

novembro 18, 2009

Todas as medidas consideradas são de probabilidade.

Observação: Toda medida nos borelianos de um grupo topológico compacto é de Radon. (Teorema 6.1 do livro An Introduction to Ergodic Theory do professor Peter Walters, usando o fato de que todo fechado é G_\delta)

Teorema: Seja G um grupo topológico compacto, a \in G e \mu a medida de Haar sobre G. Então, a transformação (rotação) Tx = ax é ergódica se, e somente se, o subgrupo A = \{a^n | n \in \mathbb{Z}\} é denso. Em particular, se alguma rotação é ergódica, G é abeliano.

Demonstração:
(\bar{A} = G \Rightarrow T é ergódica)
O que vamos mostrar, é que no caso \bar{A} = G, a única medida de Radon onde T é invariante é a medida de Haar. Em um outro post, mostramos que os “pontos extremos” do conjunto das medidas de Radon invariantes por T são ergódicos. Como neste caso, a medida de Haar é a única medida de Radon invariante, então é “ponto extremal” e portanto, ergódica. (de fato, unicamente ergódica)

Seja então \nu uma medida de Radon invariante por T. Queremos mostrar que para todo conjunto mensurável B e todo g \in G, \nu(B) = \nu(gB). Se mostrarmos essa propriedade para os conjuntos abertos V, teremos que
\nu(B) = \inf_{B \subset V} \nu(V) = \inf_{B \subset V} \nu(gV) =\\= \inf_{gB \subset gV} \nu(gV) = \inf_{gB \subset U} \nu(U) = \nu(gB).

Sabemos por hipótese, que \nu é invariante pela multiplicação a esquerda por elementos do conjunto enumerável denso A. Dado g \in G, tome uma sequência a_n \rightarrow g, com a_n \in A.

Afirmação: gV \subset \liminf a_n V.

De fato, tome gv \in gV. Existe uma vizinhança da identidade simétrica W, tal que Wv \subset V. E existe N tal que para todo n \geq N, a_n \in gW. Como W é simétrico, temos que para todo n \geq N, g \in a_n W. Ou seja, para todo n \geq N, gv \in a_n Wv \subset a_n V. Assim,
gv \in \bigcap_{n=N}^\infty a_n V \subset \liminf a_n V.

Usando a afirmação, \nu(gV) \leq \nu(\liminf a_n V) =\\= \lim_{n \rightarrow \infty} \nu(\inf_{j \geq n} a_n V) \leq \liminf_{n \rightarrow \infty} \nu(a_n V) = \nu(V).
Onde a última igualdade vem da invariância de \nu pelo produto com elementos de A. Concluímos que para todo g \in G e todo aberto V \subset G, \nu(g V) \leq \nu(V).

Fazendo h = g^{-1} e U = gV, temos pelo parágrafo anterior que \nu(V) = \nu(hU) \leq \nu(U) = \nu(gV). Mostramos que a medida dos abertos é invariante pela ação de G, concluindo a demonstração de que \nu = \mu.

(\bar{A} \neq G \Rightarrow T não é ergódica)
Suponha que H = \bar{A} \neq G. Vamos assumir que já sabemos que o fecho de um subgrupo é um subgrupo, e que portanto, H é um subgrupo (fechado) de G. Sendo assim, o espaço H \backslash G, com a topologia quociente é um espaço de Hausdorff que contém ao menos dois pontos Hg, H. A imagem inversa HV, HU de vizinhanças abertas disjuntas desses dois pontos, são abertos disjuntos em G que, como toda imagem inversa da projeção, são uniões de classes laterais Ha, que são conjuntos invariantes. A medida de Haar é positiva em todo conjunto aberto (basta notar que dado um aberto W, G é coberto por um número finito de g_kW, e todos tem medida igual à de W). Assim, ambos os conjuntos HV e HU têm medida positiva e são disjuntos. Segue que 0 < \mu(HV) \leq 1 - \mu(HU) < 1, mostrando que, neste caso, a rotação não é ergódica.

Se Tx = ax ergódica, então, como A é abeliano, e o fecho de um subgrupo abeliano é abeliano, temos que G = \bar{A} é abeliano.


Recorrência de Poincaré e a TACA

outubro 9, 2009

O princípio da TACA contra-ataca!! 🙂

Uma transformação T: \Omega \rightarrow \Omega de um espaço de probabilidade (\Omega, \sigma, \mu) é chamada ergódica se:

  1. Preserva a medida: \mu = \mu \circ T^{-1}.
  2. Os conjuntos invariantes tem medida total ou nula: A = T^{-1}A \Rightarrow \mu(A) = 0 \text{ ou } 1.

Mesmo que considerássemos uma transformação que ao invés de preservar a medida, fosse apenas incompressível, i.e.:

T^{-1}A \subset A \Rightarrow \mu(A) = \mu(T^{-1}A),
ou equivalentemente,
T^{-1}A \subset A \Rightarrow \mu(A \setminus T^{-1}A) = 0,

o princípio da TACA continuaria valendo. Tomando limites, poderíamos enunciar o princípio assim:

T^{-1}A \subset A \Rightarrow \mu(A \setminus \lim T^{-1}A) = 0.

Portanto, as equivalências demonstradas no post “Caracterizações de ergodicidade (1)” também continuariam valendo. Acho que até a implicação de (3) em (4) continuaria valendo, mas não tenho certeza. 😉

A essência das demonstrações onde utilizamos o princípio da TACA é:

  1. Para A \in \sigma, B = \bigcup_{j=n}^\infty T^{-j}A é tal que T^{-1}B \subset B.
  2. Para A \in \sigma, B = \bigcup_{j=n}^\infty T^{-j}A, temos que \limsup T^{-n}A = \lim T^{-n}B.

A conclusão é que quando a transformação é incompressível,

\mu(\bigcup_{j=0}^\infty T^{-j}A) = \mu(\limsup T^{-n}A).
Ou,
\mu(\bigcup_{j=0}^\infty T^{-j}A \setminus \limsup T^{-n}A) = 0.

Vamos usar isso para demonstrar a parte mais difícil do teorema de Recorrência de Poincaré:

Teorema (recorrência de Poincaré): Seja T: \Omega \rightarrow \Omega uma transformação incompressível de um espaço de medida finito (\Omega, \sigma, \mu). Então, dado A \in \sigma, quase todo ponto de A é recorrente. Ou seja, o conjunto dos pontos x \in A tais que T^{n}x não está em A um “número infinito de vezes” tem medida nula.

Demonstração:
O conjunto dos pontos de A que não são recorrentes são exatamente A \setminus \limsup T^{-n}A. Pelo exposto acima, \mu(\bigcup_{j=0}^\infty T^{-j}A \setminus \limsup T^{-n}A) = 0. Em particular, como A \subset \bigcup_{j=0}^\infty T^{-j}A, temos que \mu(A \setminus \limsup T^{-n}A) = 0.


Caracterizações de ergodicidade (1)

outubro 6, 2009

No meu post passado, mostrei uma caracterização para ergodicidade. Vou usar essa caracterização e também o post sobre diferenças simétricas para demonstrar as seguintes equivalências: (adaptação de parte do teorema 1.5 do livro An Introduction to Ergodic Theory do professor Peter Walters)

  1. T é ergódica.
  2. Para todo A \in \sigma com \mu(A) > 0 temos que \mu(\limsup T^{-n}A) = 1
  3. Para todo A \in \sigma com \mu(A) > 0 temos que \mu\left(\bigcup_{j=n}^\infty T^{-j}A\right) = 1 para qualquer n \in \mathbb{N}.
  4. Se A \in \sigma e \mu(A \bigtriangleup T^{-1}A) = 0, então \mu(A) = 0 ou \mu(A) = 1.

É trivial que (2) e que (3) implicam em (1), pois quando A = T^{-1}A, temos que A = \bigcup_{j=n}^\infty T^{-j}A = \limsup T^{-n}A.

O fato de (1) implicar em (2) segue se observarmos que o conjunto B_n = \bigcup_{j=n}^\infty T^{-j}A satisfaz o princípio da TACA, pois temos que T^{-1}B_n = B_{n+1} \subset B_n.

O item (2) implica em (3), pois B_n \downarrow \limsup T^{-n}A implica que 1 = \mu(B_n) \downarrow \mu(\limsup T^{n}A).

É óbvio que se A = T^{-1}A, então \mu(A \bigtriangleup T^{-1}A) = \mu(\emptyset) = 0, e portanto, (4) implica em (1). Basta agora mostrar que (3) implica em (4). Vou deixar para um próximo post.


O princípio da TACA

setembro 22, 2009

Novamente, vou falar da demonstração do teorema 1.5 do livro An Introduction to Ergodic Theory do professor Peter Walters.

Primeiro, vamos dar nome aos bois…

Seja (\Omega, \sigma, \mu) um espaço de medida de probabilidade, e T: \Omega \to \Omega uma transformação que preserva a medida. Ou seja, mensurável, tal que \mu = \mu \circ T^{-1}. Dizemos que T é ergódica quando os conjuntos A \in \sigma (mensuráveis) que satisfazem A = T^{-1}A (ditos invariantes) têm necessariamente medida 0 ou 1.

Vou mostrar que a transformação é ergódica se, e somente se, os conjuntos mensuráveis que satisfazem T^{-1} A \subset A (daí o nome… princípio da TACA ;-)) tiverem medida 0 ou 1. É trivial que esta condição é mais forte que a ergodicidade, já que T^{-1} A = A \Rightarrow T^{-1} A \subset A. Vamos ver, então, que ergodicidade implica nesta nova condição.

Suponha que T^{-1} A \subset A. Aplicando T^{-1} a ambos os lados repetidamente, temos que A \supset T^{-1}A \supset T^{-2}A \supset \dotsb. Esta sequência de conjuntos decresce (converge) para \lim T^{-n}A, que é um conjunto invariante. Portanto, \mu(A) = \mu(T^{-n}A) \rightarrow \mu(\lim T^{-n}A), onde a igualdade vem da invariância de T, e a segunda parte é a continuidade da medida (de probabilidade). Assim, a medida de A deve ser igual à medida de um conjunto invariante, que por hipótese é 0 ou 1.

O mesmo vale para A \subset T^{-1}A. A demonstração do teorema 1.5 utilizando essa caracterização é bem mais elegante ;-).

André Caldas.