Princípio variacional

Atenção: A demonstração do teorema 2 está incorreta! Provavelmente o teorema nem vale.😦

No estudo de sistemas dinâmicos topológicos, o princípio variacional nos permite utilizar conceitos topológicos para concluir fatos relacionados com teoria da medida e vice-versa.

O professor Mauro Patrão formulou e eu aperfeiçoei uma definição de entropia topológica na qual o princípio variacional continua valendo quando o espaço em questão é um espaço topológico de Hausdorff localmente compacto. O teorema deve ir pra minha tese de doutrorado🙂. Queremos que seja Hausdorff localmente compacto para utilizarmos o teorema de Banach-Alaoglu e o teorema de representação de Riesz. Também queremos que seja Hausdorff localmente compacto para que seja um espaço de Tychonoff.

Definição: Dada uma família \mathcal{F} de subconjuntos de X que o cobre (ou seja, X = \bigcup_{F \in \mathcal{F}} F), denotamos por

\displaystyle N(\mathcal{F})

o ínfimo das cardinalidades das subcoberturas de \mathcal{F}. Se \mathcal{F} é uma partição, então N(\mathcal{F}) é simplesmente o número de conjuntos (não vazios) na partição.


Definição: Um sistema dinâmico topológico, é um espaço topológico X munido de uma transformação contínua T: X \rightarrow X.


Atenção: As definições abaixo que se referem a espaços de probabilidade estão também bem-definidas quando tratamos de espaços de medida com medida finita.

Definição: Dado um espaço de probabilidade (X, \mathcal{F}, \mu), um sistema dinâmico no espaço de probabilidade X é uma aplicação mensurável T: X \rightarrow X que preserva a medida de probabilidade \mu. Ou seja,

\displaystyle \mu \circ T^{-1} = \mu.

Também dizemos que \mu é T-invariante.


Dado um sistema dinâmico topológico (X, T), se considerarmos os borelianos \mathcal{B} de X, ou seja, a \sigma-álgebra gerada pelos abertos de X, como T é mensurável, podemos considerar T como sendo um sistema dinâmico no espaço do probabilidade de uma medida de Radon qualquer definida em \mathcal{B} (se é que existe alguma). As medidas de probabilidade de Radon são aquelas tais que todo conjunto mensurável pode ser aproximado internamente por um conjunto compacto. Ou seja, para todo E \in \mathcal{B} e todo \varepsilon > 0, existe um compacto K \subset E tal que

\displaystyle \mu(E \setminus K) \leq \varepsilon.

Definição (entropia de uma partição): Dado um espaço de probabilidade (X, \mathcal{F}, \mu) e uma partição mensurável de X \mathcal{C} = \{C_1, \dotsc, C_k\}, a entropia de \mathcal{C} com respeito a \mu é

\displaystyle H_\mu(\mathcal{C}) = \sum_{C \in \mathcal{C}} \mu(C) \log \frac{1}{\mu(C)}.

Definição (entropia topológica de uma partição): Dado um espaço topológico X e uma cobertura \mathcal{A} de X formada por abertos, tal que ao menos um elemento dessa cobertura tem complemento compacto (chamaremos essas de coberturas admissíveis), a entropia topológica da cobertura \mathcal{A} é

\displaystyle H(\mathcal{A}) = \log N(\mathcal{A}).

Note que a presença de um elemento com complemento compacto na cobertura implica que N(\mathcal{A}) é finito.


Definição (família iterada): Dada uma transformação T: X \rightarrow X e uma família qualquer \mathcal{F} de subconjuntos de X, definimos

\displaystyle \mathcal{F}^n = \mathcal{F}_T^n = \{ F_0 \cap \dotsb \cap F_{n-1}: F_j \in T^{-j}(\mathcal{F}) \}.

No caso de T mensurável, quando \mathcal{F} é uma partição mensurável de X — no caso de T contínua, quando é uma cobertura admissível de X\mathcal{F}^n também será.


Definição (entropia de T com respeito a uma partição/cobertura): Dado um sistema dinâmico T no espaço de probabilidade (X, \mu) e uma partição mensurável \mathcal{C}, definimos

\displaystyle h_\mu(\mathcal{C}) = h_\mu(T | \mathcal{C}) = \lim \frac{1}{n} H_\mu(\mathcal{C}^n).

Se T é um sistema dinâmico topológico e \mathcal{A} uma cobertura admissível, definimos

\displaystyle h(\mathcal{A}) = h(T | \mathcal{A}) = \lim \frac{1}{n} H(\mathcal{A}^n).

Definição (entropia de T): Dado um sistema dinâmico T no espaço de probabilidade (X, \mu), definimos

\displaystyle h_\mu(T) = \sup_{\mathcal{C} \text{: particao mensuravel finita}} h_\mu(\mathcal{C}^n).

Se T é um sistema dinâmico topológico, definimos

\displaystyle h(T) = \sup_{\mathcal{A} \text{: cobertura admissivel}} h(\mathcal{A}^n).

Note que poderíamos ter restringido o cálculo de h(T) às coberturas admissíveis finitas.


Finalmente, após esse tanto de definições, queremos mostrar a primeira desigualdade do princípio variacional. Para tanto, vamos começar com um lema.

Lema 1.1: Se \eta = \{B_0, \dotsc, B_k\} tal que para 1 \leq j \leq k, B_j \subset A_j é uma partição, então \beta = \{B_0 \cup B_1, \dotsc, B_0 \cup B_k\} é uma cobertura e vale que

\displaystyle N(\eta^n) \leq 2^n N(\beta^n).

Demonstração:

Seja \Lambda \subset \{1, \dotsc, k\}^n um conjunto com \lvert \Lambda \rvert = N(\beta^n) tal que

\displaystyle X = \bigcup_{\lambda \in \Lambda} (T^0(C_{\lambda_0} \cup C_0) \cap \dotsb \cap T^{-(n-1)}(C_{\lambda_{n-1}} \cup C_0)).

Seja

\displaystyle f: \Lambda \times \{0, 1\}^n \rightarrow \eta^n

a aplicação tal que f(\lambda, x) é o conjunto Y_0 \cap \dotsb \cap Y_{n-1}, onde Y_j = T^{-j}(C_{\lambda_j}) quando x_j = 1, e Y_j = T^{-j}(C_0) quando x_j = 0.
Como,

\displaystyle X = \bigcup_{\lambda \in \Lambda} (T^0(C_{\lambda_0} \cup C_0) \cap \dotsb \cap T^{-(n-1)}(C_{\lambda_{n-1}} \cup C_0)) =\\= \bigcup f(\Lambda \times \{0, \dotsc, 2^n -1\}),

e \eta^n é uma partição, temos que a imagem de f contém todos os conjuntos não vazios de \eta^n. Assim,

\displaystyle N(\eta^n) \leq 2^n \lvert \Lambda \rvert.

Lema 1.2: Para todo k > 0,

\displaystyle h(T^k) = k h(T)

e, para uma medida de Radon \mu T-invariante,

\displaystyle h_\mu(T^k) = k h_\mu(T).

Demonstração:

A demonstração das duas igualdades é a mesma. Basta substituir cobertura por partição mensurável finita. (veja o teorema 4.13 do Walters)

Considere uma cobertura \mathcal{A}. Sabemos que (\mathcal{A}^k)_{T^k}^n = \mathcal{A}_T^{nk}. Assim,

\displaystyle k\frac{1}{kn} H(\mathcal{A}_T^{kn}) = \frac{1}{n} H((\mathcal{A}^k)_{T^k}^n).

E portanto, tomando limite para n \rightarrow \infty temos

\displaystyle k h(T | \mathcal{A}) = h(T^k | \mathcal{A}^k).

Tomando o supremo para todas as coberturas admissíveis \mathcal{A}, temos que k h(T) \leq h(T^k).
Por outro lado,

\displaystyle h(T^k | \mathcal{A}) \leq h(T^k | \mathcal{A}^k) = k h(T | \mathcal{A}).

Lema 1.3: Se \mu é uma medida T-invariante finita, então para 0 \leq \alpha \leq 1,

\displaystyle h_{\alpha \mu}(T) \leq h_\mu (T).

Demonstração:

Podemos assumir que \alpha \neq 0, pois h_0(T) = 0.

Seja \mathcal{C} uma partição mensurável finita qualquer. Então,

\displaystyle \frac{1}{n} \sum_{C \in \mathcal{C}^n} \alpha \mu(C) \log \frac{1}{\alpha \mu(C)} \leq \frac{1}{n} \sum_{C \in \mathcal{C}^n} \mu(C) \log \frac{1}{\alpha \mu(C)} = \\ = \frac{1}{n} \left(\sum_{C \in \mathcal{C}^n} \mu(C) \log \frac{1}{\mu(C)}\right) + \frac{1}{n} \log \frac{1}{\alpha}.

Basta agora fazer n \rightarrow \infty.


No teorema a seguir, vou usar a mesma notação que o Walters para facilitar a comparação entre as demonstrações.

Teorema 1 (princípio variacional – primeira desigualdade): Seja T: X \rightarrow X um sistema dinâmico topológico e \mu uma medida de Radon T-invariante em X tal que \mu(X) \leq 1, então vale que

\displaystyle h_\mu(T) \leq h(T).

Demonstração:
Pelo lema 1.3 é suficiente considerar o caso \mu(X) = 1.

Seja \xi = \{A_1, \dotsc, A_k\} uma partição mensurável. Precisamos mostrar que existe uma cobertura admissível \beta tal que h_\mu(\xi) \leq h(\beta).

Como \mu pode ser aproximada internamente por compactos, segue a seguinte afirmação.

Afirmação 1: Existe uma família \eta = \{B_0, \dotsc, B_k\} tal que para 1 \leq j \leq k, B_j \subset A_j é compacto e \mu(A_j \setminus B_j) \leq k e B_0 = \left(B_1 \cup \dotsb \cup B_k\right)^c. Em particular, \mu(B_0) \leq k \varepsilon

Por preguiça de definir entropia condicional e demonstrar suas propriedades, para a demonstração da afirmação seguinte, vou pedir ao leitor que veja o início da demonstração do teorema 8.6 do Walters. Se alguém realmente quiser, pode solicitar nos comentários que eu tento colocar aqui.

Afirmação 2: Se escolhermos \varepsilon \leq \frac{1}{k \log k}, então

\displaystyle h_\mu(\xi) \leq h_\mu(\eta) + 1.

Defina, \beta = \{B_0 \cup B_1, \dotsc, B_0 \cup B_k\}. Vamos demonstrar que vale a seguinte relação entre as entropias topológica e de medida.

Afirmação 3: Vale que, para todo n,

\displaystyle H_\mu(\eta^n) \leq \log 2 + H(\beta^n).

Basta aplicar o lema 1.1, e mais o conhecido fato (corolário 4.2.1) de que

\displaystyle H_\mu(\eta^n) \leq \log N(\eta^n).

Novamente, juntando todas as afirmações, temos que

\displaystyle h_\mu(\xi) \leq h(\beta) + 1 + \log 2.

Como a partição \xi era arbitrária, podemos tomar o supremo e concluir que

\displaystyle h_\mu(T) \leq h(T) + 1 + \log 2.

Agora é só continuar copiando a demonstração do livro. Ou seja, basta observar que h_\mu(T^n) = n h_\mu(T) e que h(T^n) = n h(T), e então notar que a desigualdade vale para T^n:

\displaystyle h_\mu(T^n) \leq h(T^n) + 1 + \log 2.

Assim,

\displaystyle n h_\mu(T^n) \leq n h(T^n) + 1 + \log 2.

Dividindo por n e fazendo n \rightarrow \infty, temos o resultado desejado.

CQD


O próximo teorema é a desigualdade inversa. Vamos precisar que X seja um espaço de Tychonoff para demonstrar o seguinte lema. (veja o lema 8.5 do Walters)

Lema 2.1: Se X é Hausdorff localmente compacto, então, dada uma cobertura admissível \mathcal{A} e uma medida de Radon \mu, então existe uma cobertura admissível finita \hat{\mathcal{A}} tal que:

  1. \hat{\mathcal{A}} refina \mathcal{A}. Ou seja, se \hat{A} \in \hat{\mathcal{A}}, então existe A \in \mathcal{A} que contém \hat{A}. (isso implica, que N(\mathcal{A}) \leq N(\hat{\mathcal{A}}), e em particular, que para um sistema dinâmico topológico T, H(\mathcal{A}^n) \leq H(\hat{\mathcal{A}}^n))
  2. Para todo \hat{A} \in \hat{\mathcal{A}}, \mu(\partial \hat{A}) = 0.

Demonstração:

Para cada A \in \mathcal{A} e cada x \in A, escolha uma função de Tychonoff f: X \rightarrow [0,1] (contínua, tal que f|_{A^c} = 1) e f(x) = 0. Então, f^{-1}([0,\varepsilon)) é aberto com bordo contido em f^{-1}(\varepsilon). Como f^{-1}(\varepsilon) são todos disjuntos e em quantidade não enumerável, existem \varepsilon_2 > \varepsilon_1 > 0 tais que

\displaystyle B_{x,A} = f^{-1}([0,\varepsilon_2)) \subset A

e

\displaystyle D_{x,A} = f^{-1}([0,\varepsilon_1]) \subset B_{x,A},

onde ambos tem bordo com medida nula. Como o espaço é localmente compacto, podemos ainda fazer a escolha de modo que D_{x,A} é compacto.

Seja K \subset X compacto tal que K^c \in \mathcal{A}.
Tome uma sequencia finita D_1, \dotsc, D_m de conjuntos da forma D_{x,A} cujos interiores cobrem K, e tome os conjuntos B_1, \dotsc, B_m correspondentes. Então,

\displaystyle B_1, \dotsc, B_m, \left(D_1 \cup \dotsb \cup D_m\right)^c

é uma cobertura admissível finita de X que refina \mathcal{A}, onde todos os elementos tem bordo com medida nula.


Lema 2.2: Seja uma medida de Radon \mu. Dada uma cobertura admissível finita \mathcal{A} cujos elementos possuem bordo de medida nula, então existe uma partição mensurável finita \mathcal{C} que refina \mathcal{A} tal que para todo C \in \mathcal{C}, \mu(\partial C) = 0. Também vale que para todo n,

\displaystyle N(\mathcal{A}^n) \leq N(\mathcal{C}^n).

Demonstração:

Seja A_1, \dotsc, A_m os elementos de \mathcal{A}. Faça

\displaystyle C_j = A_j \setminus \bigcup_{k = 1}^{j-1} A_k.

Esses conjuntos formam (eliminando os vazios) uma partição \mathcal{C} que refina \mathcal{A}.

Em particular, \mathcal{C}^n refina \mathcal{A}^n e portanto temos que N(\mathcal{A}^n) \leq N(\mathcal{C}^n).

Falta apenas mostrar que os elementos de \mathcal{C} possuem bordo com medida nula. Suponha que x \in \partial C_j \setminus \partial A_j. Primeiramente, temos que

x \in A_j, (*)

já que é evidente que x \in \overline{A_j}. Além disso,

x \not \in A_1 \cup \dotsb \cup A_{j-1}, (**)

pois este é um aberto que não intersepta C_j. Por outro lado,

x \not \in {\rm int}(C_j) \subset A_0 \setminus (\overline{A_1} \cup \dotsb \cup \overline{A_{j-1}}). (***)

Temos então, juntando (*) e (***), que

x \in \overline{A_1} \cup \dotsb \cup \overline{A_{j-1}}. (****)

Juntando (**) e (****), temos que para algum k = 1, \dotsc, j-1,

x \in \overline{A_k} \setminus A_k = \partial A_k.

Ou seja, \partial C_j tem medida nula, pois

\partial C_j \subset \bigcup_{k=1}^j \partial A_k,

e todos os \partial A_k tem medida nula.


Lema 2.3: O conjunto das medidas (sem sinal) finitas é fechado na topologia fraco-*. Em particular, no caso de o espaço em questão ser Hausdorff localmente compacto, o conjunto das medidas (sem sinal) com medida total menor ou igual a 1 é compacto na topologia fraco-*.
Demonstração:
Vamos escrever \mu(f) para a integral de f com respeito a \mu.

Seja \mu_n \rightarrow \mu. Em particular, para f \geq 0 em C_0(X),

\displaystyle \mu(f) = \lim \mu_n(f) \geq 0.

Isso implica que \mu é um funcional positivo. Ou seja, \mu é uma medida (sem sinal).

A segunda afirmação segue do teorema de representação de Riesz e do teorema de Banach-Alaoglu.


Teorema 2 (princípio variacional): Seja T: X \rightarrow X um sistema dinâmico topológico Hausdorff localmente compacto, então vale que

\displaystyle h(T) = \sup_{\substack{\mu \text{: T-invariante} \\ \mu(X) \leq 1}} h_\mu(T).

Demonstração:

Seja \mathcal{A} uma cobertura admissível qualquer. Vamos mostrar que existe \mu de radon, T-invariante com \mu(X) \leq 1, tal que

\displaystyle h_\mu(T) \geq h(T | \mathcal{A}).

Para cada n \in \mathbb{N}, seja \mathcal{A}_n \subset \mathcal{A}^n uma subcobertura de cardinalidade N(\mathcal{A}^n). Escolha um ponto x_A^n para cada A \in \mathcal{A}_n que não pertence a nenhum outro membro de \mathcal{A}_n. Isso é possível pois \mathcal{A}_n não possui subcobertura própria. Defina

\displaystyle \sigma_n = \frac{1}{N(\mathcal{A}^n)} \sum_{A \in \mathcal{A}_n} \delta_{x_A}.

Defina também a sequência

\displaystyle \mu_n = \frac{1}{n} \sum_{j = 0}^{n-1} \sigma_j \circ T^{-j}.

Pelo lema 2.3, existe uma medida \mu com medida total entre 0 e 1 que é limite fraco de uma subsequência de \mu_n.

Pelo lema 2.2, existe uma partição \mathcal{C}, que refina \mathcal{A}, e cujos elementos possuem bordo com medida \mu nula.

É a afirmação a seguir que está incorreta!!!

Note que H_{\sigma_n}(\mathcal{C}^n) = \log N(\mathcal{A}^n) = H(\mathcal{A}^n), pois cada elemento de \mathcal{C} possui medida 0 ou \frac{1}{N(\mathcal{A}^n)}, já que cada elemento de \mathcal{C}^n pode conter no máximo um dos x_A^n.

Agora, basta imitar o final da demonstração do teorema 8.6 do Walters, lembrando que

  1. Deve-se substituir \log s_n(\varepsilon, X) do Walters por H(\mathcal{A}^n).
  2. Os bordos dos elementos de \mathcal{C}^n tem medida nula.

CQD.

Corolário: Se não existir uma medida de probabilidade T-invariante, então a entropia topológica será 0.

Uma resposta para Princípio variacional

  1. André Caldas disse:

    Tem um erro no teorema 2. Não se pode escolher o bordo com medida 0 antes de escolher \mu… não tenho tempo agora, depois eu dou um jeito de corrigir…

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: