Ponto Fixo de Banach

fevereiro 28, 2010

Um dos meus grandes interesses é em teoremas sobre pontos fixos. Parte do interesse nisso vem da grande aplicabilidade dos resultados. Um dos teoremas mais elementares sobre ponto fixo é o teorema de Banach. Será feito uma breve exposição desse teorema e de algumas de suas importantes aplicações: como o teorema da função inversa e um teorema de existência e unicidade de soluções para sistemas de EDO’s.

Seja M um espaço métrico. Uma contração é uma aplicação f:M\to M Lipschitziana, com constante  de Lipschitz no intervalo \left[ 0,1\right) . Ou seja, existe c\in \left[ 0 ,1\right) tal que

d(f(x),f(y) )\leq c\cdot d(x,y) .

Teorema 1 (Teorema do Ponto fixo de Banach): Seja \displaystyle M um espaço métrico completo. Toda contração \displaystyle f: M\to M possui um único ponto fixo (e ele é atrator).

Demonstração: Com efeito, seja \displaystyle M completo. Se \displaystyle f: M\to M é uma contração, toma-se \displaystyle \displaystyle x\in M e define-se \displaystyle \displaystyle y_n = f^n(x) .

Tem-se que \displaystyle d(y_1 , y_2) = d(f(x),f^2(x))\leq c\cdot d(x,f(x)) , onde \displaystyle c\in \left[0,1\right) .

Prova-se, então, por indução que \displaystyle \displaystyle d(y_n,y_{n+1} ) \leq c^n\cdot d(x, f(x)) .

Supondo por indução que \displaystyle d(y_n,y_{n+1} ) \leq c^n\cdot d(x, f(x)) , segue que

\displaystyle d(y_{n+1},y_{n+2} ) \leq c\cdot d(y_n,y_{n+1} ) \leq c^{n+1}\cdot d(x, f(x)) . Isso completa a prova por indução.

Portanto, dados \displaystyle n,p\in\mathbb{N} , tem-se que

\displaystyle d(y_n , y_{n+p} )\leq \sum_{i=1}^p d(y_{n+i-1}, y_{n+i})\leq \sum_{i=1}^p c^{n+i-1}\cdot d(x,f(x) )

\leq c^n\cdot d(x,f(x)) \sum_{i=1}^p c^{i-1}\leq c^n d(x,f(x)) \sum_{i=1}^p c^{i-1} .

Como \displaystyle \sum c^i é monótona crescente e, por \displaystyle c\in \left[ 0, 1 \right) , também é convergente, tem-se que \displaystyle \sum_{i=1}^p c^{i-1} é menor ou igual ao seu limite \displaystyle \frac{1}{1-c} . Portanto

\displaystyle d(y_n , y_{n+p} )\leq c^n d(x,f(x)) \sum_{i=1}^p c^{i-1} \displaystyle \leq d(x,f(x))\cdot \frac{c^n}{1-c} .

Como \displaystyle lim c^n =0 , segue que, dado \displaystyle \varepsilon > 0 , consegue-se tomar \displaystyle n_0\in\mathbb{N} tal que \displaystyle n> n_0 e \displaystyle p\in \mathbb{N}   implique

\displaystyle d(y_n , y_{n+p} )\leq c^n d(x,f(x)) \sum_{i=1}^p c^{i-1}\leq d(x,f(x))\cdot \frac{c^n}{1-c}\leq \varepsilon .

Ou seja, provamos que \displaystyle (y_n) é de Cauchy. Por \displaystyle M ser completo, isso implica que \displaystyle (y_n) converge.

Note que \displaystyle (f(y_n)) =(y_{n+1}) . Tem-se que \displaystyle lim f(y_n) = lim (y_n) .  Mas, por outro lado, por \displaystyle f ser contínua, tem-se que

\displaystyle lim f(y_n)=f(lim (y_n) ) . Portanto, pelo teorema da unicidade de limites (por M ser um espaço métrico), segue que  \displaystyle lim (y_n) = f(y_n)=f(lim (y_n) ) , id est, \displaystyle lim (y_n) é ponto fixo.

Isso provou a existência. Resta provar a unicidade. Basta ver que, se \displaystyle z,w\in M são pontos fixos distintos, tem-se que \displaystyle d(f(z),f(w))\leq c d(z,w) , ou seja, em particular, por \displaystyle c\in \left[0,1\right) ,

\displaystyle d(f(z),f(w)) < d(z,w) . Absurdo. Logo deveríamos ter \displaystyle z= w .

CQD


Leminha: Seja \displaystyle f: M\to M uma contração com constante de contração c . Se

\displaystyle r\geq\frac{d(a,f(a))}{1-c} , então a bola fechada \displaystyle B_a =B\left[ a; r\right] é invariante por f . Em particular, se M é completo, o ponto fixo de f está em B_a .

Demonstração: Com efeito, se \displaystyle f: M\to M é uma aplicação com constante de contração c . Dado a\in M , toma-se \displaystyle B_a =B\left[ a; r\right] . Dado x\in B_a , segue que

\displaystyle d(f(x), a)\leq d(f(a),a)+d(f(a),f(x))\leq d(f(a),a)+c\cdot d(a,x)

\displaystyle\leq d(f(a),a)+c\cdot\frac{d(a,f(a))}{1-c} = \frac{d(a,f(a))}{1-c} .

Isso provou que f(B)\subset B .

Em particular, se M é completo, tem-se que, pelo teorema de Banach, que f possui um único ponto fixo g\in M e, além disso, ele é atrator. Dado x\in B_a , toma-se a seqüência y_n = f^n(x) tem-se que (y_n) converge para esse ponto fixo g . Como B_a é fechado, segue que g\in B_a .

CQD


Lema 2 (Perturbação da identidade 1): Sejam E um espaço de Banach e \phi : E\to E uma contração. Segue que a aplicação f: E\to E , onde f(x)=x+\phi (x) , é um homeomorfismo.

Demonstração: Com efeito, primeiramente prova-se a sobrejetividade. Dado z\in E , segue que g: E\to E , g(x)=z-\phi (x) , é uma contração. Pelo teorema de Banach g possui um único ponto fixo. Ou seja, existe um único x_z\in E tal que x_z = z-\phi (x_z) , e isso quer dizer que existe um único x_z\in E tal que

f(x_z)=z=x_z+ \phi (x_z) .

Isso provou a sobrejetividade e injetividade de f .

Tem-se que, dados f(x), f(y)\in E ,

\left| f(x)-f(y)\right| \geq \left|x-y\right| - \left| \phi (x) - \phi (y)\right|

\geq \left| x-y\right| - c\left| x-y\right| = (1-c)\left| x-y\right| .

Isso prova a continuidade da inversa.

CQD


Lema 3 (Perturbação da identidade 2): Sejam E um espaço de Banach, U\subset E um aberto e \phi : U\to E uma contração. Segue que a aplicação f: U\to E , onde f(x)=x+\phi (x) , é um homeomorfismo sobre um aberto V\subset E .

Demonstração: Seja c uma constante de contração. Tem-se que, dados f(x), f(y)\in f(U) ,

\left| f(x)-f(y)\right| \geq \left|x-y\right| - \left| \phi (x) - \phi (y)\right|

\geq \left| x-y\right| - c\left| x-y\right| = (1-c)\left| x-y\right| .

Isso provou a injetividade e a continuidade da inversa. Ou seja, procou que f é um homeomorfismo sobre f(U) . Resta provar que f(U) é aberto em E .

Dado f(a)\in f(U) , segue que existe r>0 tal que B= B\left[ a;r\right]\subset U (por U ser aberto). Provemos que B( f(a); (1-c) r )\subset f(U) .

Dado y\in B(f(a); (1-c)r ) , segue que T_y : B\to E , onde T_y(x)=y-\phi (x) , é uma contração. Como B é fechado de um espaço de Banach, segue que é completo.   Tem-se que

\left|a-T_y(a)\right| = \left| a+\phi (a ) -y\right| = \left| y-f(a) \right| < (1-c)\cdot r .

Portanto, pelo leminha, segue que T_y (B )\subset B . Logo, pelo teorema do ponto fixo de Banach, T_y possui um único ponto fixo. Disso segue que existe x_y\in B tal que f(x_y) = y . Ou seja, y\in f(U) . Isso completou a prova de que B(f(a); (1-c)r )\subset f(U) . E isso, por sua vez, completou a prova de que f(U) é aberto.

CQD

Corolário do lema 3: Sejam U\subset\mathbb{R} ^m um aberto e f:U\to\mathbb{R}^m uma aplicação da forma f(x) = T\cdot x + \phi (x) , onde T:\mathbb{R}^m\to\mathbb{R}^m é um isomorfismo de espaços vetoriais e \phi : U\to\mathbb{R}^m é lipschitziana. Se a constante k de Lipschitz de \phi   é tal que \left\| T^{-1} \right\|\cdot k <1 , segue qye f é um homeomorfismo de U sobre um aberto f(U)\subset\mathbb{R}^m .

Demonstração: Com efeito, dados x,y\in U , tem-se que

\left| T^{-1}\cdot \phi (x)-T^{-1}\cdot \phi (y)\right| \leq

\left\| T^{-1}\right\| \left| \phi (x)-\phi (y)\right|\leq \left\| T^{-1}\right\|\cdot k\cdot \left| x-y\right| .

Isso provou que T^{-1}\cdot f é uma perturbação da identidade, pois

T^{-1}\cdot f (x) = x + T^{-1}\cdot \phi (x) . Logo, pelo lema demonstrado, T^{-1}\cdot f é um homeomorfismo de U sobre o aberto T^{-1} f(U)\subset\mathbb{R}^m . Como T é um isomorfismo de espaços vetoriais, segue que f é um homeomorfismo de U sobre o aberto f(U) .

CQD

Teorema 4 (Teorema da Função Inversa): Sejam U\subset \mathbb{R}^m um aberto e f: U\to\mathbb{R}^m de classe C^k tal que, em um ponto x_0\in U , f''(x_0) é um isomorfismo. Então f é um difeomorfismo de classe C^k de uma vizinhança V de x_0 sobre uma vizinhança U de f(x_0) .

Demonstração: Apenas para facilitar notação, sem perda de generalidade, supomos f'(0) é um isomorfismo e f(0)=0 . Segue que f(x) = f'(0)\cdot x + r(x) .

Note que r(x) = f(x)- f'(0)\cdot x é de classe C^k . Além disso, r'(0) = 0 . Seja \lambda < \frac{1}{\left| f'(0)\right| } . Segue que existe uma bola aberta V centrada em 0 tal que:

1) \left| r'(x)\right| <\lambda   para todo x\in V (basta usar a continuidade de r' );

2)f'(x) é um ismorfismo para todo x\in V (basta usar a continuidade de f' ).

Pela desigualdade do valor médio, \left| r(x)-r(y)\right| \leq \lambda \left| x-y\right| para todo x,y\in V . O corolário acima nos diz que f|_V é um homeomorfismo sobre um aberto f(V)= U\subset\mathbb{R}^m (vizinhança de f(0) ).

Provemos que g=f^{-1}: W\to V é diferenciável. Para isso, devemos provar que \displaystyle\frac{s(k)}{ \left| k\right| } = 0 , onde g(y+k) = g(y)+(f'(x))^{-1}\cdot k + s(k) .

.. .. ..

Teorema 6 (Teorema da Existência e Unicidade): Seja E um espaço de Banach. Suponha que f: L\times B\to E , onde B\subset E é uma bola fechada centrada em x_0 (com raio \beta ) e L\subset\mathbb{R} é um intervalo fechado centrado em t_0 (com raio \alpha ), é uma aplicação contínua limitada por M cumprindo a condição de Lipschitz \left| f(t, x) - f(t,y)\right|\leq c\cdot\left| x-y\right| para todo (t,x), (t,y) \in L\times B . Segue que existe uma única aplicação \phi: I\to E , onde I é centrado em t_0 (com raio min\left\{ \alpha , \frac{\beta }{M}\right\} ), diferenciável (de fato, C^1 ) que cumpre \phi ' (t) =f(t, \phi (t) ) e \phi (t_0)=x_0 .

Demonstração:

Anúncios

Completude dos Espaços L^p

fevereiro 21, 2010

Considere uma medida \mu. É um tanto quanto fácil mostrar que o espaço normado (L^\infty(\mu), \| \cdot \|_\infty) é completo. O primeiro passo é mostrar que dada uma sequência de Cauchy f_n, esta sequência converge pontualmente para uma função f. É fácil ver que f \in L^\infty. Aí então, mostramos que \|f_n - f\|_\infty \rightarrow 0.

O caso 1 \leq p < \infty é semelhante. No entanto, neste caso, exibir o limite pontual de f_n não é tão simples. Vamos começar com um lema que, como sempre, poderia estar simplesmente embutido/escondido na demonstração.

Lema: Seja (X, \|\cdot\|) um espaço normado. Para que seja um espaço de Banach, é suficiente que toda série absolutamente convergente (\sum \|x_n\| < \infty) seja convergente.

Demonstração:
Seja y_n uma sequência de Cauchy. Podemos assumir que y_0 = 0. Faça N(0) = 0. E, para todo k > 0, escolha N = N(k) > N(k-1) tal que n \geq N \Rightarrow \|y_N - y_n\| \leq \frac{1}{2^k}. Assim, para k > 0, a série dada por x_k = y_{N(k)} - y_{N(k-1)} é absolutamente convergente. Por hipótese, a sub-sequência y_{N(k)} = \sum_{n=1}^{N(k)} x_n converge. Basta então notar que toda sequência de Cauchy que possui sub-sequência convergente converge para o mesmo limite.


Teorema: O espaço normado (L^p, \|\cdot\|_p), 1 \leq p < \infty é completo.

Demonstração:
Pelo lema anterior, basta mostrar que uma série absolutamente convergente dada pelos termos h_n é convergente. Dizer que a série dada por h_n é absolutamente convergente é o mesmo que dizer que existe M tal que \sum_{j=1}^n \|h_j\|_p \uparrow M.

Seja f_n = \sum_{j=1}^n h_j e g_n = \sum_{j=1}^n |h_j|.

Por ser crescente, g_n possui limite pontual (que pode ser infinito) g.

Afirmação 1: g \in L^p.

Pelo teorema da convergência monótona, como |g_n|^p \uparrow |g|^p, temos que \|g_n\|_p \rightarrow \|g\|_p. Então, \|g_n\|_p \leq \sum_{j=1}^n \|h_j\|_p \uparrow M, e em particular temos que g \in L^p.

Como g \in L^p, temos que o conjunto dos pontos onde g é infinito tem medida nula. Ou seja, a série h_n(x) converge absolutamente qtp. Em particular, f_n possui limite f qtp.

Afirmação 2: f \in L^p.

Temos que |f_n| \leq g_n \leq g. Ou seja, |f_n|^p \leq g_n^p \leq g^p \in L^1. Pelo teorema da convergência dominada, \|f\|_p = \lim \|f_n\|_p \leq \|g\|_p.

Afirmação 3: \|f_n - f\|_p \rightarrow 0.

Sabemos que f_n - f \rightarrow 0 pontualmente. Também é verdade que |f_n - f| \leq 2g. Novamente, pelo teorema da convergência dominada, \int |f_n - f|^p \rightarrow \int \lim |f_n - f|^p = \int 0 = 0.

A afirmação 3 concluí a demonstração.


O lema poderia de fato ter sido embutido na demonstração do teorema. Para isso, poderíamos por exemplo, bastava ter construído a série h_k = f_{N(k)} - f_{N(k-1)} a partir da sequência f_n, assumindo f_0 = 0.


Funcional de Minkowski

fevereiro 5, 2010

Neste post, vamos tratar apenas os espaços vetoriais reais.

Em análise funcional, o teorema de extensão de Hahn-Banach é uma ferramenta que nos garante a existência de uma gama de funcionais lineares em um espaço de Banach. Na verdade, vamos mostrar que não precisamos que o espaço seja de Banach. Em geral, estamos considerando um espaço vetorial topológico. Que é simplesmente um espaço vetorial dotado de uma topologia de Hausdorff (dependendo do autor a topologia não precisa ser Hausdorff) onde as operações do espaço vetorial são contínuas. Vamos então, fazer algumas observações sobre os espaços vetoriais topológicos. Nosso objetivo final é esclarecer o papel desempenhado pelo chamado funcional de Minkowski.

Definição: Um espaço vetorial X dotado de uma topologia de Hausdorff \tau é um espaço vetorial topológico quando as operações (x,y) \mapsto x+y e (\alpha,x) \mapsto \alpha x, onde \alpha \in \mathbb{R} e x,y \in X são contínuas quando consideramos a topologia produto nos espaços \mathbb{R} \times X e X \times X.

Proposição: Seja (X, \tau) um espaço vetorial topológico. Então,
1. Para todo \alpha \neq 0, x \mapsto \alpha x é um homeomorfismo.
2. Para todo a \in X, x \mapsto x+a é um homeomorfismo.

Demonstração:
As aplicações, além de contínuas, são inversíveis e suas inversas são contínuas. (Não falei nada além da definição de homeomorfismo aqui! :-P)


O item 2 da proposição acima mostra que a topologia \tau é completamente determinada se conhecermos o sistema de vizinhanças de um ponto. Claro que na maioria das vezes, esse ponto será o 0. Ou seja, se V(0) for a família de todas as vizinhanças da origem, então x + V(0) será a família de todas as vizinhanças de x. De modo mais conciso: V(x) = x + V(0). Observe que essa afirmação não considera o produto por escalar, e portanto vale para grupos topológicos em geral.

No caso de espaços vetoriais normados, bastava conhecermos uma vizinhança limitada de um ponto x para determinarmos todas as vizinhanças de x. De fato, fica como exercício completar o argumento, mas se U é uma vizinhança limitada de x, então V = U - x é uma vizinhança limitada de 0 e \frac{1}{n}V é uma base de vizinhanças para V(0). Este não é o caso para espaços vetoriais topológicos em geral. No entanto, mostramos a seguir, uma construção parecida.

Construção: Sejam X um espaço vetorial e V \subset X que contenha a origem. Podemos construir a menor topologia em X tal que V seja vizinhança da origem e as operações do espaço vetorial sejam contínuas. De fato, basta fazer de x + \frac{1}{n}V uma base para V(x). Não fosse pela falta de garantia de que esse espaço é de Hausdorff, teríamos um espaço vetorial topológico. Essa construção é útil, pois muito do que demonstramos para espaços vetoriais topológicos não exige o axioma de separação de Hausdorff. Poderíamos também, estender esta construção para uma família V_\lambda que contenha 0.

As duas formas mais conhecidas do teorema de extensão — deve haver mais 😉 — são as chamadas forma analítica e forma geométrica. A forma analítica se utiliza do chamado funcional de Minkowski, e a geométrica de subconjuntos convexos. O funcional de Minkowski fornece um certo controle sobre a extensão que será construída. Alguns exemplos de restrições que podemos querer impor à extensão de um funcional linear f definido em um sub-espaço de X:
1. Se X é um espaço normado, podemos querer estender f a \tilde{f}, de modo que \|f\| = \|\tilde{f}\|.
2. Dados dois pontos x,y, podemos querer um funcional linear f que separe ambos. Ou seja, f(x) \neq f(y).
3. Dados dois sub-conjuntos A,B, podemos querer, se possível, um funcional linear f que separe ambos. Ou seja, tal que \sup f(A) \leq \inf f(B).
4. Se (X, \tau) é um espaço vetorial topológico, podemos querer que a extensão seja contínua.

O item 1 é o mais simples. Já temos que f satisfaz |f(x)| \leq \|f\| \|x\|. O lado direito é o caso mais simples de funcional de Minkowski.

Para o item 4, note que assim como fizemos em um post anterior, para que um funcional linear seja contínuo basta que a imagem inversa de algum conjunto limitado tenha interior.

Definição: Dado um espaço vetorial X, um funcional de Minkowski é uma aplicação m: X \rightarrow \mathbb{R} que satisfaz:
1. Para todo \alpha \geq 0, m(\alpha x) = \alpha m(x).
2. Desigualdade triangular: m(x+y) \leq m(x) + m(y).

Ao contrário de uma norma, o funcional de Minkowski pode ser negativo! Por exemplo, todo funcional linear é um funcional de Minkowski. Mas em todas as aplicações que eu já vi, o funcional de Minkowski é positivo. Em muitas ocasiões, o funcional de Minkowski será simplesmente uma semi-norma. Um exemplo de uma semi-norma: o valor absoluto de um funcional linear f. Ou seja, m(x) = |f(x)|.

Antes de falar mais sobre o funcional de Minkowski, vamos enunciar a forma analítica do teorema de extensão.

Teorema (extensão de Hanh-Banach — forma analítica): Sejam X um espaço vetorial, Y \subset X um subespaço, f: Y \rightarrow \mathbb{R} um funcional linear e m: X \rightarrow \mathbb{R} um funcional de Minkowski tais que f \leq m|_Y. Então existe um funcional linear \tilde{f}: X \rightarrow \mathbb{R} tal que \tilde{f}|_Y = f e \tilde{f} \leq m.

A demonstração usa o lema de Zorn associado ao fato de que se x \not \in Y podemos sempre extender f ao espaço gerado por Y e x.

É interessante notar que o teorema não faz referência direta a nenhuma topologia em X. No entanto, se m \geq 0, então o fato de f \leq m implica que f é contínuo na topologia construída, conforme mencionado anteriormente, a partir do conjunto convexo V = \{ x \in X: m(x) < 1 \}. Em particular, se (X, \tau) for um espaço vetorial topológico e V \in \tau, então f será um funcional contínuo, pois f^{-1}(-1,1) conterá V que possui interior. (veja diversas caracterizações de continuidade aqui.)

O parágrafo anterior sugere uma relação entre os funcionais de Minkowski e os conjuntos convexos abertos que contém a origem. O fato, que nos levará à versão geométrica do teorema, é que dado um conjunto convexo aberto V, vizinhança da origem de um espaço vetorial topológico (X, \tau), podemos construir um funcional de Minkowski m_V, tal que V = \{ x \in X: m_V(x) < 1 \}. Pelas observações do parágrafo anterior, qualquer funcional linear f que satisfaça f \leq m_V será contínuo com relação a \tau. Novamente, não precisamos em momento algum que a topologia seja gerada por uma norma!

Proposição: Seja (X, \tau) um espaço vetorial topológico e V \in V(0) aberto e convexo. Então, a função m_V(x) = \inf \{ s \in \mathbb{R_+}: x \in sV \} é um funcional de Minkowski. Também vale que V = \{ x \in X: m_V(x) < 1 \}.

Demonstração: Como V tem interior, sabemos que para todo x \in X, existe s tal que x \in sV. Portanto, para todo x \in X temos que m_V(x) < \infty. (Desafio: Demonstre a primeira afirmação! Lembre-se que X não é um espaço normado. Dica: A continuidade do produto por escalar implica que \frac{1}{n}x \rightarrow 0.)

Se \alpha \geq 0, então, x \in sV \Leftrightarrow \alpha x \in \alpha s V. Portanto, m_V(\alpha x) = \alpha m_V(x). (Pergunta: onde foi usado que \alpha \geq 0?)

Para a desigualdade triangular, note que se x \in sV e y \in tV, então x+y \in sV + tV. Em geral, (s+t)V \subset sV + tV. Mas pode ser que sV + tV \not \subset (s+t)V. No entanto, como V é convexo, temos que para s,t \geq 0, sV + tV = (s+t)\left(\frac{s}{s+t}V + \frac{t}{s+t}V\right) = (s+t)V.

A última afirmação é imediata. Note que precisamos que V seja aberto apenas para essa última afirmação. Para que m_V seja um funcional de Minkowski, bastava que V \in V(0). Neste caso, teríamos V \subset \{ x \in X: m_V(x) \leq 1 \}.


Se aplicarmos a forma analítica do teorema da extensão para um espaço vetorial topológico X, utilizando como funcional de Minkowski m_V para alguma vizinhança convexa da origem (se é que existe uma), teremos que o funcional linear resultante \tilde{f} será contínuo, haja visto que f \leq m_V implica que V \subset \tilde{f}^{-1}[-1,1]. Ou seja, \tilde{f}^{-1}[-1,1] é vizinhança da origem. Novamente, enfatizamos, que a topologia em X pode não ser dada por uma norma. Basta que X seja um espaço vetorial topológico. (Nem mesmo precisa ser Hausdorff.)

Teorema (extensão de Hanh-Banach — forma geométrica): Sejam X um espaço vetorial topológico e A,B \subset X convexos e disjuntos, com A aberto. Então existe um número real \gamma e um funcional linear f: X \rightarrow \mathbb{R} tais que f(x) < \gamma \leq f(y) para todo x \in A e y \in B.

Demonstração:
Tome a \in A e b \in B e faça z = b-a.

Afirmação 1: O conjunto V = A - B + z é uma vizinhança convexa e aberta da origem.

Soma de convexos dá um conjunto convexo. Produto por escalar e translação de convexos também dá um conjunto convexo. Como -z = a-b \in A-B, temos que 0 = -z + z \in V. Para ver que V é aberto, basta notar que é uma união de abertos: V = \bigcup_{y \in B}(A - y + z).

Agora, pela afirmação 1, podemos considerar o funcional de Minkowski m_V.

Afirmação 2: m_V(z) \geq 1.

Basta notar que como A \cap B = \emptyset, então 0 \not \in A-B. Portanto, z \not \in A-B+z = V. No entanto, sabemos que m_V(x) < 1 \Leftrightarrow x \in V.

Defina então, f(\alpha z) = \alpha.

Afirmação 3: f \leq m_V.

De fato, pela afirmação 2, para \alpha \geq 0, f(\alpha z) = \alpha \leq m_V(\alpha z); e para \alpha < 0, f(\alpha z) = \alpha < 0 \leq m_V.

Então, pela versão analítica do teorema de extensão, existe \tilde{f}: X \rightarrow \mathbb{R} tal que \tilde{f}(z) = 1 e \tilde{f} \leq m_V. Resta agora mostrar que somos sortudos o suficiente para que \tilde{f} seja exatamente o funcional que estamos procurando.

Afirmação 4: \sup \tilde{f}(A) \leq \inf \tilde{f}(B).

Note que para x \in A e y \in B, como x-y+z \in V, temos que \tilde{f}(x-y+z) \leq m_V(x-y+z) < 1. Assim, \tilde{f}(x) - \tilde{f}(y) + 1 < 1. Ou seja, \tilde{f}(x) < \tilde{f}(y).

Faça então \gamma = \sup \tilde{f}(A). Resta então mostrar que para nenhum x \in A podemos ter \tilde{f}(x) = \gamma.

Afirmação 5: O conjunto \tilde{f}(A) não possui máximo.

Seja x \in A. Pela continuidade do produto por escalar e da soma, como A é aberto, existe \varepsilon > 0 tal que x + \varepsilon z \in A. Assim, \tilde{f}(x + \varepsilon z) = \tilde{f}(x) + \varepsilon \in \tilde{f}(A). Ou seja, x não é ponto de máximo.


Uma coisa que fica faltando, é mostrar a importância de se considerar espaços vetoriais topológicos de um modo geral, ao invés de considerar somente os espaços normados. Os espaços vetoriais normados podem ser dotados de outras topologias, como a topologia fraca induzida pelo espaço dual; ou, também, no caso do dual, a topologia fraca-*, induzida pela identificação natural do espaço normado como um subespaço do seu bi-dual. Em particular, o dual de um espaço normado possui ao menos três topologias importantes (que podem coincidir): a topologia da norma de operadores, a topologia induzida pelo bi-dual (topologia fraca) e a topologia fraca-*.

Por exemplo, seja X um espaço normado. Pela forma geométrica do teorema de extensão, é evidente que dados dois conjuntos convexos A,B \subset X^* disjuntos, onde A é aberto, podem ser separados por um elemento do espaço bi-dual. No entanto, é verdade que podem ser separados por um elemento x \in X? A resposta é afirmativa no caso de A ser aberto na topologia fraco-*.

Proposição: Seja X um espaço normado e A,B \subset X^* dois subconjuntos do espaço dual. Se A é fraco-* aberto, então existem \gamma \in \mathbb{R} e x \in X tais que para todo \phi \in A e todo \psi \in B, \phi(x) < \gamma \leq \psi(x).

Demonstração:
Sabemos que existem \gamma \in \mathbb{R} e um elemento J \in X^{**} que é contínuo na topologia fraco-* e que para todo \phi \in A e todo \psi \in B, satisfaz J(\phi) < \gamma \leq J(\psi).

Não é difícil mostrar, mas não faremos aqui porque o negócio já tá muito longo, que todo elemento J \in X^{**} que é fraco-* contínuo, é da forma J_x: \phi \mapsto \phi(x), o que concluí a demonstração.


Observação:
Onde eu vi, m_V era definido como ínfimo dentre os s \in \mathbb{R_+} tais que s^{-1}x \in V. Eu achei que fazer x \in sV é bem mais visual por causa da imagem do conjunto V crescendo (ou encolhendo) para conter (e ainda assim, contendo) x.

Fonte: Analysis Now de Gert K. Pedersen.


Teorema do Gráfico Fechado e Teorema da Aplicação Aberta

janeiro 18, 2010

O gráfico de uma aplicação contínua com contra-domínio de Hausdorff é fechado. A recíproca, em geral, não é válida. Vamos mostrar que no entanto, se estivermos falando sobre uma aplicação linear T: X \rightarrow Y entre espaços de Banach, então se o gráfico de T em X \times Y (com a topologia produto) for fechado, a aplicação será contínua. Alternativamente, se T não for contínua, seu gráfico não será fechado.

Observação: Se T não é contínua, então poderemos exibir uma sequência x_n \rightarrow x tal que Tx_n \not \rightarrow Tx. A parte difícil do teorema do gráfico fechado é encontrar uma sequência x_n convergente, tal que Tx_n também seja convergente, mas que T(\lim x_n) \neq \lim Tx_n. Para isso, vamos precisar do teorema de Baire e da completude de X e Y. As caracterizações de aplicações lineares contínuas ou abertas que foram apresentadas anteriormente simplificam um pouco a demonstração.

Definição: Seja T: X \rightarrow Y uma aplicação entre os conjuntos X e Y. O gráfico de T é o conjunto G(T) = \{ (x, Tx) \in X \times Y: x \in X \}. Se X e Y são espaços topológicos, dizemos que o gráfico de T for fechado quando o conjunto G(T) for um subconjunto fechado de X \times Y equipado com a topologia produto.

Teorema do Gráfico Fechado: Seja T: X \rightarrow Y uma aplicação linear entre espaços de Banach. Então, o gráfico de T é fechado se, e somente se, T for uma aplicação contínua.

Demonstração:
Se T é contínua e (x, y) um ponto de acumulação de seu gráfico, então existe uma sequência (x_n, Tx_n) \rightarrow (x, y). Assim, x_n \rightarrow x e Tx_n \rightarrow y. Pela continuidade de T, temos também que Tx_n \rightarrow Tx. O fato de o contra-domínio Y ser espaço de Hausdorff implica que o limite de Tx_n é único e portanto, Tx = y. Ou seja, (x, y) pertence ao gráfico de T, que é portanto, fechado.

Vamos supor agora que T não seja contínua. Nossa estratégia será exibir uma sequência x_n \rightarrow x tal que Tx_n \not \rightarrow Tx, mas que no entanto, Tx_n seja convergente (ou seja, de Cauchy). Para construir T_x de Cauchy, vamos escrever x_n como uma série x_n = \sum_{j=0}^n y_n tal que:
1. Para n > 0, \|Ty_n\| < \frac{1}{2^n}.
2. \|Ty_0\| < 1.
Em particular, teremos que \limsup Tx_n < 2. Assim, para que Tx_n \not \rightarrow Tx, tomaremos x tal que \| Tx \| \geq 2.

Vamos denotar por B_\varepsilon a bola aberta de raio \varepsilon > 0 tanto em X quanto em Y. Pela caracterização de aplicações lineares contínuas, T^{-1}B_\varepsilon não possui interior para nenhum \varepsilon > 0. Mas pelo teorema de Baire, \overline{T^{-1}B_\varepsilon} tem interior para algum (e por linearidade, para todo) \varepsilon > 0.

Afirmação 1: Existe um \beta > 0, tal que para todo \varepsilon > 0, B_{\beta \varepsilon} \subset \overline{T^{-1}B_\varepsilon}.

Basta mostrar para \varepsilon = 2, pois os demais casos seguem por linearidade de T. Seja v ponto interior de \overline{T^{-1}B_1}. Sabemos que \overline{T^{-1}B_2} = \overline{T^{-1}B_1 - T^{-1}B_1} = \overline{T^{-1}B_1} - \overline{T^{-1}B_1}. Portanto, \overline{T^{-1}B_2} é vizinhança de v - v = 0. Ou seja, existe \beta > 0 tal que B_{2 \beta} \subset \overline{T^{-1}B_2}.

Tome x \in \overline{T^{-1}B_\frac{1}{2}} \setminus T^{-1}B_2. Note que x existe, pois o conjunto da esquerda tem interior e o da direita, não. Note também que \|Tx\| \geq 2. Vamos construir a sequência y_n.

Escolha y_0 \in x + B_\beta. Por simetria, x - y_1 \in B_\frac{\beta}{2}. Escolhido y_n \in B_\frac{\beta}{2^n} tal que x - \sum_{j=0}^n y_j \in B_\frac{\beta}{2^n}, escolha y_{n+1} \in B_\frac{\beta}{2^n} tal que x - \sum_{j=0}^{n+1} y_j \in B_\frac{\beta}{2^{n+1}}. Para ver que isso é possível, basta notar que (x + B_\frac{\beta}{2^{n+1}}) \cap (\sum_{j=0}^{n} y_j + B_\frac{\beta}{2^n}) é não vazio (faça um desenho). É evidente que:
1. x_n = \sum_{j=0}^n y_j \rightarrow x.
2. Pela afirmação 1, Ty_n \in B_\frac{1}{2^n}. Ou seja, Tx_n = \sum_{j=0}^n Ty_n é de Cauchy.
3. \|\lim T x_n\| = \lim \|\sum_{j=0}^n Ty_n\| \leq \\ \leq \sum_{j=0}^\infty \|Ty_n\| < \sum_{j=0}^\infty \frac{1}{2^n} \leq 2.

Portanto, (x, \sum Ty_n) = \lim (x_n, Tx_n) é ponto de acumulação do gráfico de T, mas não pertence ao gráfico, pois \|\lim T x_n\| < 2 \leq \|T x\|. Concluindo a demonstração.


A partir do teorema do gráfico fechado, podemos demonstrar o seguinte teorema, chamado de teorema da aplicação aberta.

Teorema da Aplicação Aberta: Seja T: X \rightarrow Y uma aplicação linear sobrejetiva entre espaços de Banach. Então, T é contínua se, e somente se, é uma aplicação aberta.

Demonstração:
Vamos primeiro assumir que T é bijetiva. Neste caso, T^{-1}: Y \rightarrow X é uma aplicação linear cujo gráfico, que é a transposição do gráfico de T, é fechado! Portanto, T^{-1} é contínua. Ou seja, T é aberta.

O caso geral é feito considerando-se o espaço quociente \tilde{X} = X / \ker T. Não vou detalhar a construção, mas este espaço quociente é um espaço de Banach com norma \|x + \ker T\| = \inf_{n \in \ker T} \|x + n\|, pois, pela continuidade de T, \ker T é fechado. Esta construção pode ser vista no livro Analysis Now de Gert K. Pedersen.

É um fato simples de álgebra, que T pode ser fatorado em T = \tilde{T} \circ \pi, onde \pi: X \rightarrow \tilde{X} é a projeção natural (que é aberta, como toda projeção de quocientes de grupos topológicos) e \tilde{T}: \tilde{X} \rightarrow Y é contínua e bijetiva. Pela primeira parte da demonstração, \tilde{T} é uma aplicação aberta e portanto, T, como uma composição de aplicações abertas, é também aberta.

Observação: De fato, mostramos que o teorema da aplicação aberta é consequencia do seguinte teorema:
Teorema da Inversa Limitada: Seja T: X \rightarrow Y uma aplicação linear bijetiva entre espaços de Banach. Se T é contínua, então é um homeomorfismo.

Como este teorema é um caso particular do teorema da aplicação aberta, temos que os dois são equivalentes. A demonstração acima mostra essa equivalência (a parte não trivial) e o fato de que o teorema da inversa limitada é consequência imediata do teorema do gráfico fechado.

Observação: Parece ser mais comum que se demonstre o teorema da aplicação aberta como consequência do teorema de Baire e o teorema do gráfico fechado como consequência do da aplicação aberta. Escolhi um caminho alternativo e provavelmente mais complicado só pra exercitar. 🙂


O Teorema de Baire

janeiro 13, 2010

No post Aplicações Lineares em Espaços Normados, podemos perceber que para resolver questões como a “limitação uniforme” de uma família de aplicações lineares, ou para saber se determinada aplicação linear é aberta, é importante saber se determinados conjuntos possuem interior. Um resultado que garante que certos conjuntos possuem interior é o Teorema de Baire.

Em analogia com os espaços de medida, se a união enumerável de uma família de conjuntos mensuráveis tiver medida estritamente positiva, então ao menos um elemento dessa família também tem medida não nula. A união enumerável de uma família de conjuntos de medida nula é necessariamente um conjunto de medida nula. No Teorema de Baire, o análogo aos conjuntos de medida nula, são os conjuntos fechados com interior vazio. (ou então conjuntos cujo fecho tem interior vazio). Mostraremos que em espaços métricos completos, a união enumerável de fechados com o interior vazio também tem interior vazio. Espaços que possuem essa propriedade são chamados Espaços de Baire.

Definição: Um espaço topológico onde a união enumerável de fechados com interior vazio também tem necessariamente interior vazio é chamado de Espaço de Baire.

Exemplo: Em \mathbb{R}^3, por exemplo, nenhuma bola pode ser escrita como uma união enumerável de fechados com interior vazio. Em particular, nenhuma bola é uma união enumerável de esferas. As esferas são conjuntos que não possuem volume, enquanto que a bola possui.

Contra-exemplo: Os números reais são a união dos racionais e os irracionais. Ambos tem interior vazio. No entanto, nenhum dos dois é fechado.

Lema: São equivalentes as afirmações a respeito de um espaço topológico X:
1. A união enumerável de fechados com interior vazio tem interior vazio. (ou seja, X é Espaço de Baire)
2. A união enumerável de conjuntos cujo fecho tem interior vazio é um conjunto com interior vazio.
3. A interseção enumerável de abertos densos é densa.

Demonstração: A parte mais difícil é o item 3. Basta notar que um conjunto é fechado com interior vazio exatamente quando seu complemento é aberto denso.


Teorema de Baire: Um espaço métrico completo X é um espaço de Baire. Em particular, um espaço de Banach é um espaço de Baire.

Demonstração:
Deu uma preguiça enorme!!! Mas na Wikipedia tem. 🙂


Princípio da Limitação Uniforme: Sejam X um espaço de Banach e Y um espaço normado. E seja T_\lambda: X \rightarrow Y uma família de aplicações lineares contínuas tais que para todo x \in X existe M_x \in \mathbb{R} tal que T_\lambda x \leq M_x para todo \lambda. Então a família T_\lambda é uniformemente limitada.

Demonstração:
Por hipótese,
X = \bigcup_{N \in \mathbb{N}} \bigcap_\lambda T_\lambda^{-1}(\overline{B_N}).
Pelo teorema de Baire, existe N \in \mathbb{N} tal que \bigcap_\lambda T_\lambda^{-1}(\overline{B_N}) tem interior.

Pelo post Aplicações Lineares em Espaços Normados, proposição 3, item 8, segue que a família T_\lambda é uniformemente limitada.

Corolário: Se X é um espaço de Banach e Y um espaço normado. E se T_n: X \rightarrow Y uma família de aplicações lineares contínuas tais que T_n converge pontualmente para uma aplicação T: X \rightarrow Y, então T é uma aplicação linear contínua.

Demonstração: É fácil ver que T é linear. Para ver que T é limitada, basta notar que \|T\| \leq \sup \|T_n\|. Mas este supremo é finito pelo princípio da limitação uniforme acima, pois a convergência pontual implica que T_n x é limitada para todo x \in X.



Aplicações Lineares em Espaços Normados

janeiro 11, 2010

O objetivo deste artigo é discutir as várias interpretações que caracterizam a condição de uma aplicação linear ser limitada (definição a seguir). Devido ao fato de a métrica induzida por uma norma qualquer ser invariante por translações, temos a continuidade de uma aplicação linear ser equivalente à continuidade em um ponto qualquer. Em geral, tomamos a origem. 😉

Já a propriedade \|\alpha x\| = |\alpha| \|x\| implica na equivalência entre a continuidade na origem e a limitação da aplicação linear. A equivalência entre continuidade, continuidade em um ponto e limitação de uma aplicação linear é bastante conhecida.

Definição: uma aplicação linear T: X \rightarrow Y entre espaços normados é limitada quando T(B_1) for um conjunto limitado em Y. Onde B_\alpha é a bola de raio \alpha. Usamos a mesma notação para bolas em X ou Y.

Proposição 1: Seja T: X \rightarrow Y uma aplicação linear entre espaços normados. São equivalentes:
1. T é contínua.
2. T é contínua em um ponto.
3. T é contínua na origem.

4. T é limitada.
5. A imagem de toda bola é limitada.
6. A imagem de alguma bola é limitada.
7. A imagem de alguma vizinhança da origem é limitada.
8. A imagem de todo conjunto limitado é limitada.

9. A imagem de algum aberto é limitada.

10. A imagem inversa por T de algum conjunto limitado tem interior.
11. O conjunto T^{-1}(B_\alpha) tem interior para algum \alpha > 0.
12. O conjunto T^{-1}(B_\alpha) tem interior para todo \alpha > 0.
13. O conjunto T^{-1}(B_1) tem interior.

Demonstração:
A equivalência entre os quatro primeiros itens já foi comentada nos primeiros parágrafos.

A equivalência entre 4, 5, 6, 7 e 8 segue do fato T(B_\alpha) = \alpha T(B_1)

É fácil ver que 4 implica em 9, basta tomar a imagem de B_1. Por outro lado, se V \subset X é aberto com imagem limitada, então V - V é vizinhança da origem com imagem limitada. Ou seja, 9 implica em 7.

É trivial que 1 implica em 10, e que 10 implica em 11.
Também é fácil ver que 11, 12 e 13 são equivalentes, pois B_\alpha = \alpha B_1.

Para ver que 13 implica em 9, basta tomar A como sendo o interior (não vazio) de T^{-1}(B_1). Então, a imagem do aberto A é limitada!


A essas alturas, quem não se cansou e desistiu de ler todas as equivalências acima está provavelmente criando suas próprias variações. 🙂

Algo que não é exatamente uma variação, mas que funciona da mesma forma, é a caracterização de aplicações abertas. As aplicações lineares abertas são necessariamente sobrejetivas. Assim como na proposição anterior, temos a equivalência:

Proposição 2: Seja T: X \rightarrow Y uma aplicação linear sobrejetiva entre espaços normados. São equivalentes:
1. T é aberta.
2. T é aberta em um ponto. (a imagem de toda vizinhança do ponto é vizinhança da imagem do ponto)
3. T é aberta na origem. (a imagem de toda vizinhança de 0 é vizinhança de 0)

5. A imagem inversa de toda bola é limitada.
6. A imagem inversa de alguma bola é limitada.
7. A imagem inversa de alguma vizinhança da origem é limitada.
8. A imagem inversa de todo conjunto limitada é limitada.

9. A imagem inversa de algum aberto é limitada.

10. A imagem de algum conjunto limitado tem interior.
11. O conjunto T(B_\alpha) tem interior para algum \alpha > 0.
12. O conjunto T(B_\alpha) tem interior para todo \alpha > 0.
13. O conjunto T(B_1) tem interior.


Podemos ir um pouco mais fundo e pensar sobre uma família de aplicações lineares que sejam uniformemente limitadas.

Definição: dada uma aplicação linear T: X \rightarrow Y entre espaços normados limitada, definimos a norma de T, por \|T\| = \sup_{x \in B_1} \|T(x)\|.

Definição: dizemos que uma família T_\lambda: X \rightarrow Y de aplicações lineares é uniformemente limitada se é tal que \sup_\lambda \|T_\lambda\| < M para algum M.

Vejamos algumas caracterizações de limitação uniforme.
Proposição 3: Seja T_\lambda: X \rightarrow Y uma família de aplicações lineares entre espaços normados. São equivalentes:
1. T_\lambda é uniformemente limitada.
2. \bigcap T_\lambda^{-1}(B_1) é vizinhança da origem.
3. Para algum \alpha > 0, \bigcap T_\lambda^{-1}(B_\alpha) é vizinhança da origem.

4. Para algum \alpha > 0, \bigcap T_\lambda^{-1}(B_\alpha) tem interior.
5. Para todo \alpha > 0, \bigcap T_\lambda^{-1}(B_\alpha) tem interior.
6. O conjunto \bigcap T_\lambda^{-1}(B_1) tem interior.

7. Para algum conjunto limitado B, \bigcap T_\lambda^{-1}(B) tem interior.
8. Para algum \alpha > 0, \bigcap T_\lambda^{-1}(\overline{B_\alpha}) tem interior.

Demonstração:
A equivalência entre 1, 2 e 3 é exatamente como nas proposições anteriores. A equivalência entre 4, 5, 6, 7 e 8 também é imediata. E é óbvio que 2 implica em 6.

Suponha 6. Então, \bigcap T_\lambda^{-1}(B_2) = \bigcap T_\lambda^{-1}(B_1 - B_1) = \bigcap (T_\lambda^{-1}(B_1) - T_\lambda^{-1}(B_1)) é vizinhança da origem. Ou seja, 6 implica em 3.


As caracterizações apresentadas acima são utilizadas em teoremas como o teorema da aplicação aberta e o princípio da limitação uniforme, mas em geral ficam ocultas dentro da demonstração.


Complemento Ortogonal

dezembro 15, 2009

Seja (H, \langle \cdot,\cdot \rangle) um espaço de Hilbert e M \subset H um subespaço fechado. Vou mostrar neste post que H = M \oplus M^\bot, onde M^\bot é o conjunto (subespaço fechado) dos vetores ortogonais a M. As funções norma \lVert \cdot \rVert e distância d(\cdot,\cdot) são definidas da maneira usual.

Nesta demonstração, tentei evitar tudo o que tenho aversão. Uma dessas coisas é a lei do paralelogramo. A demonstração ficou mais longa, mas se o leitor fizer alguns desenhos (principalmente no final do teorema), verá que é bem geométrica. O lema utilizado para subsituir a lei do paralelogramo é o seguinte.

Lema 1: Dado a \in H, se d(a,x_1) = d(a,x_2), com x_1 \neq x_2. Faça v = \frac{x_1-x_2}{\lVert x_1-x_2 \rVert}.
Então x = \frac{x_1+x_2}{2} é o ponto da reta r(\lambda) = x_1 + \lambda v que tem a menor distância de a. Também vale que \langle a-x,v \rangle = 0, ou seja, a-x é ortogonal à reta r(\lambda).

Demonstração:
Primeiramente, faça um desenho. 🙂

Basta notar que
d(x + \lambda v, a)^2 = d(\lambda v, a - x)^2 = \lambda^2 + 2 \lambda \langle v, a-x \rangle + \lVert a-x \rVert^2
é uma parábola simétrica em relação ao eixo das abcissas. Portanto, o (único) ponto de mínimo é em \lambda = 0.

Seja agora, \alpha = \langle a-x,v \rangle. Então, \langle a-x-\alpha v, v \rangle = 0. Portanto,
\lVert a - x \rVert^2 = \lVert a - x - \alpha v \rVert^2 + \lVert \alpha v \rVert^2 = \lVert a - x - \alpha v \rVert^2 + \alpha^2. Pela minimalidade de \lVert a - x \rVert, temos que \alpha = 0.


Lema 2: Dado a \in H, então m \in M é tal que a - m \in M^\bot se, e somente se, d(a,m) = d(a,M). Onde d(a, M) = \inf_{x \in M} \lVert a -x \rVert.

Demonstração

Suponha que a - m \in M^\bot. Tome x \in M. Basta então notar que
d(a,x)^2 = \lVert a - m + (m-x) \rVert^2 = \lVert a-m \rVert^2 + \lVert m-x \rVert^2 \geq \\ \geq \lVert a-m \rVert^2 = d(a,m)^2.

Por outro lado, se a - m \not \in M^\bot, então existe z \in M, de norma 1, tal que \langle z, a-m \rangle = \alpha > 0. Fazendo x = m + \alpha z, temos que a-x \in \{z\}^\bot e, portanto,
\lVert a-m \rVert^2 = \lVert a-x + \alpha z \rVert^2 = \lVert a-x \rVert^2 + \alpha^2 > \lVert a-x \rVert^2.
Assim, d(a,m) não é mínimo.


Teorema: Todo a \in H pode ser decomposto em a = m_a + a_\bot, onde m_a \in M e a_\bot \in M^\bot. Esta decomposição é única. Ou seja, H = M \oplus M^\bot.

Demonstração:
A unicidade segue diretamente de H \cap H^\bot = \{0\}.

Pelo lema 2, basta mostrar que existe m_a \in M tal que d(a,m_a) = d(a,M). Tome m_n \in M com d(a,m_n) \downarrow d(a,M). Vamos mostrar que m_n é uma sequência de Cauchy.

Suponha que não. Então, existe \varepsilon > 0 tal que para todo N podemos escolher j > k > N tais que d(m_j,m_k) > \varepsilon. Como d_j < d_k, pelo teorema do valor intermediário, “saindo” de m_j, e “indo na direção oposta” a m_k, existe um ponto m_k' (diferente de m_k) tal que d(a,m_k') = d_k. Note que d(m_k,m_k') \geq d(m_k,m_j) > \varepsilon. Faça um desenho… 😉

Pelo lema 1, m = \frac{m_k-m_k'}{2} é tal que a-m é ortogonal á reta r(\lambda) = m_k + \lambda (m_k-m_k'). Pelo desenho que você fez,
d(a, m_k)^2 = d(a,m)^2 + d(m,m_k)^2 \geq \\ \geq d(a,m)^2 + \left( \frac{\varepsilon}{2} \right)^2 \geq d(a,M)^2 + \left( \frac{\varepsilon}{2} \right)^2.
Tomando o limite quando N \rightarrow \infty, temos a seguinte contradição:
d(a,M)^2 \geq d(a,M)^2 + \frac{\varepsilon^2}{4}.

Portanto, m_n é de Cauchy, e existe m_a com m_n \rightarrow m_a. Pela continuidade de d(\cdot,\cdot), temos que d(a,m_a) = d(a,M), concluindo a demonstração.