analisi 3 - unimi.it€¦ · this work is licensed under a creative commons...

118

Upload: others

Post on 27-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

ANALISI 3

Anno 2019/2020

Giuseppe Molteni

versione 4.4

Page 2: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2

Questi sono gli appunti relativi al corso che ho tenuto negli Anni Accademici 2017'20presi e redatti da Manuel Luigi Trezzi sulla base delle note che avevo messo a disposizionedegli studenti quale traccia delle lezioni. In seguito ho provveduto ad integrarli espandendoalcune sezioni e vericandone la coerenza generale. Ritengo siano abbastanza accurati peressere utilizzati nello studio dei contenuti del corso, ma potrebbero esserci ancora refusied imprecisioni, che, se presenti, sono da imputarsi solo a me. Ringrazio Luca Perone edEmma Albertelli per avermi segnalato alcune imprecisioni. Ringrazio n da ora anche tutticoloro che volessero segnalarmi eventuali ulteriori carenze ancora presenti nel testo.

Giuseppe Molteni

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) You must giveappropriate credit, provide a link to the license, and indicate if changes were made. Youmay do so in any reasonable manner, but not in any way that suggests the licensor endorsesyou or your use. (NonCommercial) You may not use the material for commercial purposes.(NoDerivatives) If you remix, transform, or build upon the material, you may not distributethe modied material.

Page 3: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Indice

1 Successioni e serie di funzioni 5

1.1 Successioni di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.1.1 Convergenza puntuale . . . . . . . . . . . . . . . . . . . . . . . . . . 51.1.2 Convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 71.1.3 Proprietà della convergenza uniforme . . . . . . . . . . . . . . . . . . 81.1.4 Il teorema di densità di Weierstrass . . . . . . . . . . . . . . . . . . . 14

1.2 Serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2.1 Convergenza di una serie di funzioni . . . . . . . . . . . . . . . . . . 161.2.2 La funzione di Takagi . . . . . . . . . . . . . . . . . . . . . . . . . . 191.2.3 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2 Funzioni implicite 31

2.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Teorema di Dini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.3 Contrazioni e Teorema del punto sso . . . . . . . . . . . . . . . . . . . . . 362.4 Teorema di invertibilità locale . . . . . . . . . . . . . . . . . . . . . . . . . . 392.5 Teorema di Dini multidimensionale . . . . . . . . . . . . . . . . . . . . . . . 452.6 Estremi vincolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3 Equazioni Dierenziali 53

3.1 Equazioni di forma speciale . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.1.1 Equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . . . 553.1.2 Equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . . . 563.1.3 Equazioni di Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2 Standardizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593.2.1 Da equazione di ordine k a equazione del primo ordine . . . . . . . . 593.2.2 Passaggio alla formulazione integrale . . . . . . . . . . . . . . . . . . 60

3.3 Teoremi di esistenza e unicità . . . . . . . . . . . . . . . . . . . . . . . . . . 613.4 Stabilità rispetto al modello e ai dati iniziali . . . . . . . . . . . . . . . . . . 663.5 Equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.5.1 Costruzione di una base . . . . . . . . . . . . . . . . . . . . . . . . . 693.5.2 Matrice Wronskiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 703.5.3 Costruzione di una soluzione . . . . . . . . . . . . . . . . . . . . . . 723.5.4 Equazioni lineari a coecienti costanti: descrizione del nucleo . . . . 75

3.6 Alcuni esempi interessanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783.7 Soluzione particolare per le lineari a coecienti costanti . . . . . . . . . . . 79

3.7.1 Generalizzare l'esponenziale . . . . . . . . . . . . . . . . . . . . . . . 82

3

Page 4: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4 INDICE

4 Curve, campi vettoriali, forme dierenziali 89

4.1 Curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.1.1 Classe di equivalenza e orientazione . . . . . . . . . . . . . . . . . . . 904.1.2 Concatenazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

4.2 Campi vettoriali e forme dierenziali . . . . . . . . . . . . . . . . . . . . . . 944.2.1 Notazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 964.2.2 Integrazione di forme/campi lungo curve . . . . . . . . . . . . . . . . 974.2.3 Condizioni di esattezza . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.3 Omotopìe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1054.4 Divagazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

5 Bibliograa 115

6 Indice dei nomi 117

Page 5: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 1

Successioni e serie di funzioni

1.1 Successioni di funzioni

1.1.1 Convergenza puntuale

Denizione 1.1.1. Sia X un insieme qualunque e sia fnn∈N una successione di funzionifn : X → R. Diciamo che la successione converge puntualmente (o semplicemente) in Xalla funzione f : X → R se e solo se per ogni x0 ∈ X si ha che:

limn→∞

fn(x0) esiste e vale f(x0).

Equivalentemente possiamo dire che:

∀x0 ∈ X e ∀ε > 0 ∃N = N(x0, ε) tale che se n ≥ N =⇒ |fn(x0)− f(x0)| ≤ ε.

Osservazione 1.1.2.

• L'eventuale struttura diX non ha ruolo, ovvero non ha importanza si tratti di un insiemedi numeri, uno spazio metrico od un insieme dotato di topologia: perché la denizioneabbia senso basta che esso sia un qualunque insieme di oggetti.

• Il punto x0 svolge il ruolo di parametro che resta ssato durante il processo di limite, ilquale coinvolge solo la sequenza numerica fn(x0)n∈N ed il numero f(x0). La relazionelimn→∞ fn(x0) = f(x0) è quindi quella per successioni in R.

• R è uno spazio metrico quindi rispetta la proprietà di Hausdor (punti distinti sonoseparati da aperti disgiunti). Questo garantisce che il limite se esiste è unico. La funzionef è quindi univocamente determinata dalla relazione secondo cui

f(x0) := limn→∞

fn(x0).

• Nella denizione si può sostituire R con Rn o un qualsiasi altro spazio metrico o unqualunque altro spazio topologico Y : basterà tenere conto di come debba essere intesal'operazione di limite per successioni a valori in Y .

I seguenti esempi mostrano che per quanto sia di facile comprensione, la convergenzapuntuale non preserva proprietà importanti quali: limitatezza, continuità, integrabilità ederivabilità.

5

Page 6: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

6 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Esempio 1.1.3. fn(x)→ f(x) con fn limitata per ogni n non implica che f sia limitata.fn(x) = min(|x|, n), ogni fn è limitata ma la successione converge puntualmente a f(x) =|x| che non è limitata.

x

y f

f1

f2

1 2−1−2

Esempio 1.1.4. fn → f puntualmente con fn continua per ogni n non implica che f siacontinua.fn(x) : [0, 1]→ R, fn(x) = xn. Le fn sono continue in tutti i punti di [0, 1] ma la successioneconverge puntualmente a

f(x) =

1 se x = 1

0 se x ∈ [0, 1)che non è continua in 1.

x

y

f1f2

f3

1

Esempio 1.1.5. fn → f puntualmente con fn integrabile per ogni n non implica che f siaintegrabile.fn(x) : [0, 1]→ R con

fn(x) =

1 se x = a

2n , a ∈ N0 altrimenti.

Ogni fn ha un numero nito di discontinuità e quindi è Riemann integrabile. La successioneconverge puntualmente a

f(x) =

1 se x = a

2b, a, b ∈ N

0 altrimenti.

Questa funzione non è Riemann integrabile poiché sia l'insieme a2b, a, b ∈ N (i numeri

diadici) che il suo complementare sono densi in [0, 1] (e quindi in ogni intervallo I coninterno non vuoto si ha supx∈I f(x) = 1 ed infx∈I f(x) = 0).

Page 7: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.1. SUCCESSIONI DI FUNZIONI 7

Esempio 1.1.6. fn → f puntualmente con fn derivabile per ogni n non implica che f siaderivabile.fn(x) : Ω ⊆ R → R con Ω aperto fn(x) =

√x2 + 1

n , tutte le fn sono derivabili ma la

successione converge puntualmente a f(x) = |x| che non è derivabile.

x

y

f

1.1.2 Convergenza uniforme

Denizione 1.1.7. Sia X un insieme qualunque e sia fnn∈N una successione di funzionifn : X → R. Diciamo che fn converge uniformemente in X alla funzione f : X → R se:

∀ε > 0 ∃N = N(ε) tale che se n ≥ N =⇒ |fn(x0)− f(x0)| ≤ ε ∀x0 ∈ X.

Si osservi che la convergenza uniforme si dierenzia dalla convergenza puntuale per ilfatto ora si chiede l'indipendenza (ovvero uniformità) di N dal punto di convergenza.Gracamente, la convergenza uniforme corrisponde a richiedere che per ogni ε esista un Ntale per cui il graco di fn con n ≥ N sia interamente nell'intorno tubolare f ± ε.

x

y

ff + ε

f − ε

Denizione 1.1.8. Data g : X → R deniamo ‖g‖∞,X := supx∈X |g(x)|.

Vedremo in seguito perché questa quantità sia indicata con il simbolo di norma. Utilizzandoquesto nuovo concetto, la denizione di convergenza uniforme può essere formulata in unoqualunque dei modi seguenti:

∀ε > 0 ∃N = N(ε) tale che se n ≥ N =⇒ ‖fn − f‖∞,X ≤ ε;

ovvero che:n ≥ N ⇒ sup

x∈X|fn(x)− f(x)| ≤ ε;

ovvero che:limn→∞

supx∈X|fn(x)− f(x)| = 0;

ovvero che:limn→∞

‖fn − f‖∞,X = 0.

Page 8: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

8 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Proposizione 1.1.9. Siano fnn∈N, f : X → R e supponiamo che fn converga ad funiformemente in X. Allora la successione fn converge ad f anche puntualmente X. Inparticolare, quindi, anche il limite uniforme è necessariamente unico.

Questo fatto consente di vedere la convergenza uniforme come una (possibile) caratteristicadella convergenza puntuale.

Dimostrazione. Fissiamo x0 ∈ X. Dalla stima

|fn(x0)− f(x0)| ≤ supx∈X|fn(x)− f(x)| = ‖fn − f‖∞,X

segue immediatamente che se limn→∞ ‖fn − f‖∞,X = 0 allora anche limn→∞ |fn(x0) −f(x0)| = 0, ovvero che la convergenza uniforme implica la convergenza puntuale allamedesima funzione.

1.1.3 Proprietà della convergenza uniforme

Teorema 1.1.10. Siano fnn∈N, f : X → R e supponiamo che fn converga uniformemen-te a f in X. Supponiamo che ogni fn sia limitata. Allora anche f è limitata e la sequenzafnn∈N è equi-limitata (ovvero esiste M ∈ R tale che ‖fn‖∞,X ≤M per ogni n).

Dimostrazione. Sia ε = 1. Dalla denizione di convergenza uniforme deduciamo l'esistenzadi un indice N con la proprietà secondo cui |fn(x) − f(x)| ≤ 1, comunque si prendanox ∈ X ed n ≥ N .Dalla disuguaglianza triangolare segue che

|f(x)| = |f(x)− fN (x) + fN (x)| ≤ |f(x)− fN (x)|+ |fN (x)| ∀x ∈ X,

e questo è ≤ 1 + ‖fN‖∞,X per come abbiamo scelto N .Dall'ipotesi di limitatezza si ha che ‖fN‖∞,X < ∞, così dalla relazione precedente dedu-ciamo che

supX|f(x)| ≤ 1 + ‖fN‖∞,X <∞,

che dimostra la limitatezza di f .Per la seconda tesi procediamo in modo analogo. Supponiamo n ≥ N , ed osserviamo che

|fn(x)| = |fn(x)− f(x) + f(x)| ≤ |fn(x)− f(x)|+ |f(x)| ≤ 1 + ‖f‖∞,X < +∞

(poiché sappiamo che f è limitata). visto che il lato destro della relazione è indipendenteda x, questa disuguaglianza dimostra che

‖fn‖∞,X ≤ 1 + ‖f‖∞,X

quando n ≥ N . Per ipotesi ogni fn è limitata, quindi la quantità

M := max‖f1‖∞,X , ‖f2‖∞,X , . . . , ‖fN‖∞,X , 1 + ‖f‖∞,X

è una quantità nita e per costruzione garantisce la stima ‖fn‖∞,X ≤ M per ogni n ∈N.

Page 9: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.1. SUCCESSIONI DI FUNZIONI 9

Teorema 1.1.11. Siano fnn∈N, f : X ⊆ R → R e supponiamo che fn → f uniforme-mente in X. Sia x0 ∈ X e supponiamo che ogni fn sia continua in x0. Allora anche f ècontinua in x0 e la sequenza fnn∈N è equi-continua in x0 (ovvero il modulo di continuitàδ di fn può essere scelto in modo da essere indipendente da n).

Dimostrazione. Nei punti isolati tutte le funzioni risultano continue, quindi per dimostrarela tesi possiamo assumere che x0 sia d'accumulazione perX. Fissiamo ε > 0. Dalla ipotesi diconvergenza uniforme segue l'esistenza di N = N(ε) tale che se n ≥ N allora ‖fn−f‖∞,X ≤ε. Dalla disuguaglianza triangolare in R, segue che comunque si scelga x si ha:

|f(x)− f(x0)| = |f(x)− fN (x) + fN (x)− fN (x0) + fN (x0)− f(x0)|≤ |f(x)− fN (x)|+ |fN (x)− fN (x0)|+ |fN (x0)− f(x0)|.

Il primo e il terzo addendo sono ciascuno minori di ε, perciò:

|f(x)− f(x0)| ≤ 2ε+ |fN (x)− fN (x0)|.

Questa relazione vale comunque venga scelto x, e per la sua validità non abbiamo ancorautilizzato l'ipotesi di continuità delle fn, che invece interviene ora. Dalla ipotesi secondocui fN è continua in x0 deduciamo l'esistenza di δ = δ(ε) tale che se |x − x0| ≤ δ allora|fN (x)−fN (x0)| ≤ ε. Per tali x quindi la stima precedente di f diventa |f(x)−f(x0)| ≤ 3ε,che dimostra la continuità di f .La seconda parte della tesi è dimostrata in modo analogo, osservando che se n ≥ N , allora

|fn(x)− fn(x0)| = |fn(x)− f(x) + f(x)− f(x0) + f(x0)− fn(x0)|≤ |fn(x)− f(x)|+|f(x)− f(x0)|+|f(x0)− fn(x0)| ≤ 2ε+|f(x)− f(x0)|.

Ma f è continua in x0, quindi esiste δ = δ(ε) tale che se |x−x0| ≤ δ allora |f(x)−f(x0)| ≤ ε.Per tali x quindi la stima precedente diventa |fn(x)−fn(x0)| ≤ 3ε, indipendentemente dallascelta di n, purché sia ≥ N .Visto che per ipotesi ogni elemento della successione è continuo in x0, esistono poi anche lequantità δ1, δ2, . . . , δN tali per cui se |x− x0| ≤ δj allora |fj(x)− fj(x0)| ≤ ε, per ciascunodei j = 1, 2, . . . , N . Fissando quindi

δ′ := minδ1, δ2, . . . , δN , δ

(che non è 0, essendo il minimo tra quantità positive) si deduce che

|x− x0| ≤ δ′ =⇒ |fn(x)− fn(x0)| ≤ ε ∀n ∈ N,

ovvero la equicontinuità della famiglia di funzioni fn nel punto x0.

Denizione 1.1.12. Deniamo B(X,R) := f : X → R, ‖f‖∞,X < ∞, che quindi èl'insieme delle funzioni limitate da X in R.

Osservazione 1.1.13. L'insieme B(X,R) è uno spazio vettoriale. Infatti

|(f + g)(x)| = |f(x) + g(x)| ≤ |f(x)|+ |g(x)| ≤ ‖f‖∞,X + ‖g‖∞,X <∞,

che dimostra che la somma di due funzioni limitate è limitata. Passando al sup in x questastessa disuguaglianza mostra anche che

‖(f + g)‖∞,X ≤ ‖f‖∞,X + ‖g‖∞,X .

Page 10: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

10 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Analogamente, se si moltiplica per uno scalare si ha

|(λf)(x)| = |λ| · |f(x)| ≤ |λ| · ‖f‖∞,X ,

che dimostra come anche λf sia una funzione limitata, e che

‖λf‖∞,X ≤ |λ| · ‖f‖∞,X .

Osservazione 1.1.14. ‖f‖∞,X è una norma su B(X,R). Infatti

• ‖f‖∞,X ≥ 0 e ‖f‖∞,X = 0 ⇐⇒ f ≡ 0,

• rispetta la disuguaglianza triangolare (si veda sopra),

• ‖λf‖∞,X = |λ| · ‖f‖∞,X

Dimostrazione. Qui sopra abbiamo vericato che ‖λf‖∞,X ≤ |λ| · ‖f‖∞,X . Per dimo-strare la disuguaglianza opposta basta osservare che la tesi è sicuramente vera se λ = 0,e che se λ 6= 0 allora quella stessa stima dà che |λ| · ‖f‖∞,X = |λ| · ‖ 1

λλf‖∞,X ≤|λ| · 1

|λ| · ‖λf‖∞,X = ‖λf‖∞,X .

Proposizione 1.1.15. B(X,R) dotato della norma ‖f‖∞,X è uno spazio normato com-pleto (è quindi uno spazio di Banach).

Dimostrazione. Vogliamo dimostrare che ogni sequenza di Cauchy è convergente.Sia fnn∈N una successione di Cauchy. In base alla denizione questo signica che perogni ε > 0 esiste N = N(ε) tale che se n,m ≥ N allora ‖fn − fm‖∞,X ≤ ε.Fissiamo dunque ε > 0 e sia N come sopra. Sia poi x0 ∈ X arbitrariamente preso. Alloraper m,n ≥ N si ha

|fn(x0)− fm(x0)| ≤ supx∈X|fn(x)− fm(x)| = ‖fn − fm‖∞,X ≤ ε.

Quindi la successione fn(x0)n∈N è di Cauchy in R. Dalla completezza di R segue cheessa converge a qualche elemento di R. Visto che questo argomento vale qualunque sia lascelta di x0, deduciamo che limn→∞ fn(x0) esiste per ogni x0 ∈ X. Questo mostra sia che lafunzione f(x) := limn→∞ fn(x) è ben denita in X, sia che fn converge ad f puntualmente.Verichiamo ora che la convergenza è in realtà uniforme. Infatti, sappiamo che la sceltadi N garantisce che se n,m ≥ N allora |fn(x) − fm(x)| ≤ ε, per ogni x ∈ X. Una voltassato, mandando m all'innito in questa stima deduciamo che |fn(x)− f(x)| ≤ ε. Ma x èarbitrario e N non dipende da esso, quindi la stima precedente implica che ‖fn−f‖∞,X ≤ ε,che dimostra la convergenza uniforme.Inne, osserviamo che la funzione f è limitata, per il Teorema 1.1.10, visto che è limiteuniforme di funzioni limitate.

Denizione 1.1.16. Sia Ω ⊆ R aperto, e sia C(Ω,R) := f : Ω → R, f continua. Indi-chiamo con BC(Ω,R) l'intersezione B(Ω,R)∩C(Ω,R) =: BC(Ω,R), ovvero l'insieme dellefunzioni continue e limitate in Ω.

Proposizione 1.1.17. BC(Ω,R) dotato della norma ‖ · ‖∞,Ω è uno spazio di Banach.

Page 11: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.1. SUCCESSIONI DI FUNZIONI 11

Dimostrazione. L'insieme BC(Ω,R) è un sottoinsieme di B(Ω,R), che è completo per laproposizione precedente. Per dimostrare la tesi basta quindi dimostrare che BC(Ω,R) èun sottoinsieme chiuso di B(Ω,R). Di fatto questo è immediato poiché sappiamo che sefnn∈N ⊆ BC(Ω,R) converge uniformemente a f ∈ B(Ω,R), allora f stessa è continuaper il Teorema 1.1.11, visto che è limite uniforme di funzioni continue.

Teorema 1.1.18. Siano fnn∈N, f : [a, b] ⊂ R → R con fn → f uniformemente. Sefn ∈ R([a, b]) per ogni n, allora anche f ∈ R([a, b]) ed inoltre∣∣∣ ∫ b

afn(x) dx−

∫ b

af(x) dx

∣∣∣ ≤ (b− a) · ‖fn − f‖∞,X

quindi

limn→∞

∫ b

afn(x) dx =

∫ b

af(x) dx

ovvero

limn→∞

∫ b

afn(x) dx =

∫ b

alimn→∞

fn(x) dx.

Dimostrazione. Fissiamo ε > 0. Per l'ipotesi di convergenza uniforme sappiamo che esisteN = N(ε) tale che se n ≥ N allora ‖fn − f‖∞,[a,b] ≤ ε. Siccome fN ∈ R([a, b]), sappiamoche esiste una partizione P := a = x0 ≤ x1 ≤ · · · ≤ xk = b per la quale:

k∑j=1

(Mj,N − mj,N ) · (xj − xj−1) ≤ ε,

dove Mj,N := sup[xj−1,xj ] fN (x) e mj,N := inf [xj−1,xj ] fN (x).Osserviamo che f(x) = fN (x) + f(x)− fN (x) da cui:

f(x) ≤ fN (x) + |f(x)− fN (x)| ≤ fN (x) + ‖fN − f‖∞,[a,b] ≤ fN (x) + ε.

Quindi se x ∈ [xj−1, xj ] si ha f(x) ≤ sup[xj−1,xj ] fN (x) + ε = Mj,N + ε e perciò

Mj := sup[xj−1,xj ]

f(x) ≤ Mj,N + ε.

Analogamente si ha f(x) ≥ fN (x)−|f(x)−fN (x)| ≥ fN (x)−‖fN −f‖ ≥ fN (x)− ε quindise x ∈ [xj−1, xj ] si ha f(x) ≥ inf [xj−1,xj ] fN (x)− ε = mj,N − ε e perciò

mj := inf[xj−1,xj ]

f(x) ≥ mj,N − ε.

Da queste stime segue che:

k∑j=1

(Mj −mj)(xj − xj−1) ≤k∑j=1

(Mj,N − mj,N + 2ε) · (xj − xj−1)

=

k∑j=1

(Mj,N − mj,N ) · (xj − xj−1) + 2ε

k∑j=1

(xj − xj−1) ≤ ε+ 2ε(b− a)

Page 12: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

12 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

che conclude la dimostrazione della prima tesi. Per la seconda basta osservare che∣∣∣ ∫ b

afn(x) dx−

∫ b

af(x) dx

∣∣∣ =∣∣∣ ∫ b

a(fn(x)− f(x)) dx

∣∣∣≤∫ b

a

∣∣fn(x)− f(x)∣∣dx ≤ ∫ b

a‖fn − f‖∞,[a,b] dx = ‖fn − f‖∞,[a,b](b− a).

Osservazione 1.1.19. Abbiamo già visto che la sola convergenza puntuale non garantisce laRiemann integrabilità della funzione limite. Il seguente esempio mostra che anche nel casoin cui la funzione limite sia comunque Riemann integrabile, non è comunque detto che ilsuo integrale sia pari al limite degli integrali delle funzioni della successione. Prendiamo

fn(x) =

n se x ∈ ( 1

n ,2n)

0 altrimenti

È chiaro che fn(x) → 0 per ogni scelta di x, ovvero che la successione converge (pun-tualmente) alla funzione identicamente nulla. Quindi

∫ 10 limn→∞ fn(x) dx =

∫ 10 f(x) dx =∫ 1

0 0 dx = 0. Tuttavia∫ 1

0 fn(x) dx = 1 per ogni n quindi limn→∞∫ 1

0 fn(x) dx = 1.

Osservazione 1.1.20. La tesi del teorema non è estendibile agli integrali di Riemann im-propri, neppure in presenza di convergenza uniforme su R. Ad esempio, prendiamo

fn(x) =

1n se x ∈ (−n, n)

0 se |x| ≥ n.

Visto che supR |fn(x)| = 1n → 0, deduciamo che la sequenza fn converge uniformemen-

te in R alla funzione f identicamente nulla. Ciononostante∫R fn(x) dx = 2 e quindi

limn→∞∫R fn(x) dx = 2 6= 0 =

∫R 0 dx =

∫R f(x) dx.

Osservazione 1.1.21. La convergenza uniforme non preserva la derivabilità. Si consideril'Esempio 1.1.6 e si osservi che in quel caso fn → f uniformemente in R, visto che

|fn(x)− f(x)| = |√x2 + 1/n− |x|| = 1/n√

x2 + 1/n+ |x|≤ 1/n√

1/n=

1√n

e che quindi ‖fn − f‖∞,R ≤ 1√n→ 0.

Teorema 1.1.22. Sia fnn∈N : (a, b) ⊆ R → R. Supponiamo che esista un punto x0 ∈(a, b) tale per cui la sequenza numerica fn(x0)n∈N converga a un numero `. Assumiamoinoltre che ogni fn sia derivabile in (a, b) e che esista g : (a, b)→ R tale che f ′nn∈N → guniformemente in (a, b). Allora:

• esiste f : (a, b)→ R tale che fn → f puntualmente in (a, b),

• la convergenza è uniforme sui compatti contenuti in (a, b),

• f è derivabile e f ′(x) = g(x) per ogni x ∈ (a, b), ovvero

d

dx

(limn→∞

fn

)(x) =

(limn→∞

d

dxfn

)(x).

Page 13: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.1. SUCCESSIONI DI FUNZIONI 13

Dimostrazione. Dimostriamo la tesi sotto l'ipotesi che le funzioni f ′n siano continue ∀n;questo consente di semplicare notevolmente la dimostrazione della tesi (che tuttavia èvalida anche senza questa assunzione).Dal teorema fondamentale del calcolo integrale sappiamo che sotto quella ipotesi si ha chefn(x) = fn(x0) +

∫ xx0f ′n(u) du. La funzione g è per ipotesi il limite uniforme delle f ′nn∈N

che sono continue, quindi anche g è continua. Questo suggerisce di porre

f(x) := `+

∫ x

x0

g(u) du.

Infatti, da quanto detto su g segue che f è ben denita in (a, b), è derivabile in (a, b) conderivata g continua, e quindi f ∈ C1((a, b)).Sottraendo le due relazioni abbiamo l'uguaglianza fn(x)− f(x) = fn(x0)− `+

∫ xx0

(f ′n(u)−g(u)) du, che per la disuguaglianza triangolare dà:

|fn(x)− f(x)| ≤ |fn(x0)− `|+∣∣∣ ∫ x

x0

|(f ′n(u)− g(u))| du∣∣∣

≤ |fn(x0)− `|+∣∣∣ ∫ x

x0

‖f ′n − g‖∞,(a,b) du∣∣∣

= |fn(x0)− `|+ |x− x0| · ‖f ′n − g‖∞,(a,b).

Sia K un qualunque compatto in (a, b) che senza ledere di generalità possiamo immaginarecontenga x0 (altrimenti basta considerare x0∪K che è ancora un compatto di (a, b)). Sia-no α, β ∈ R scelti in modo da garantire che K ⊆ [α, β] ⊆ (a, b). Allora dalla disuguaglianzaprecedente e per ogni x ∈ K si ha:

|fn(x)− f(x)| ≤ |fn(x0)− `|+ (β − α)‖f ′n − g‖∞,(a,b).

(Nell'ultimo passaggio si è usato il fatto che dovendo x ed x0 essere in K si ha per certo|x− x0| ≤ β − α).Abbiamo quindi ottenuto la stima secondo cui

‖fn − f‖∞,K ≤ |fn(x0)− `|+ (β − α)‖f ′n − g‖∞,(a,b),

ma entrambi gli addendi per ipotesi tendono a zero quando n diverge, quindi ‖fn− f‖∞,Kstessa tende a zero. Questo dimostra la convergenza uniforme di fn ad f sul compatto K.Visto che K è del tutto arbitrario, da questo segue poi che la convergenza è certa in ognipunto di (a, b), ovvero la convergenza puntuale di fn ad f è vera in (a, b).

Esercizio 1.1.23. Sia BC1((a, b),R) := f : (a, b) → R, f ∈ C1, f, f ′ limitate. Vericareche è uno spazio vettoriale e che posto ‖|f‖|1 := ‖f‖∞,(a,b) + ‖f ′‖∞,(a,b), questa è unanorma in BC1. Vericare poi che BC1 con questa norma è uno spazio di Banach.

Esercizio 1.1.24. Sia BC1((a, b),R) := f : (a, b) → R, f ∈ C1, f, f ′ limitate. Sia x0 ∈(a, b) ssato e sia ‖|f‖|2 := |f(x0)|+ ‖f ′‖∞,(a,b). Vericare che anche ‖| · ‖|2 è una normain BC1((a, b),R). Vericare poi che

1

b− a+ 1‖|f‖|1 ≤ ‖|f‖|2 ≤ ‖|f‖|1

per ogni f ∈ BC1((a, b),R). Osservare che questo dimostra che le due norme sono equiva-lenti e che quindi BC1 è uno spazio di Banach anche con la norma ‖| · ‖|2.

Page 14: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

14 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

1.1.4 Il teorema di densità di Weierstrass

Nel 1885 Weierstrass1 mostrò che nonostante i polinomi siano una famiglia di funzionidecisamente speciali, essi sono però sucientemente numerosi da riuscire ad approssimarein ogni intervallo compatto ed in norma sup ogni funzione continua. Ecco il suo risultato:

Teorema 1.1.25. L'insieme dei polinomi a coecienti reali è denso in C([0, 1],R), innorma sup. Ciò signica che dato una qualunque f : [0, 1] → R, continua, per ogni sceltadi ε > 0 esiste un polinomio q ∈ R[x] tale che ‖f − q‖∞,[0,1] ≤ ε.

In seguito tale risultato fu rivisto e notevolmente generalizzato, individuando nella compat-tezza del dominio e nel fatto che i polinomi siano una sotto-algebra separante ed invarianteper coniugio, le proprietà chiave che rendono possibile questo risultato2. La generalizzazio-ne è nota con il nome di teorema di StoneWeierstrass.Di seguito esponiamo la dimostrazione che Bernstein3 diede nel 1912 del teorema nella ver-sione originale di Weierstrass. Questa dimostrazione non solo unisce semplicità e profondità,ma è pure costruttiva.

Dimostrazione. Per ogni coppia di interi k, n con 0 ≤ k ≤ n, sia

Bk,n(x) :=

(n

k

)xk(1− x)n−k.

Tracciare un graco di questi polinomi è istruttivo: ognuno di essi è un polinomio a valorinon negativi con un unico massimo (su [0, 1]) in k/n, con gran parte della loro massaconcentrata attorno al loro punto di massimo k/n. In un certo senso quindi sono delleversioni polinomiali delle delta di Dirac nei punti razionali k/n. Osserviamo che

n∑k=0

Bk,n(x) = 1,n∑k=0

kBk,n(x) = nx,n∑k=0

k(k − 1)Bk,n(x) = n(n− 1)x2.

Queste relazioni possono essere dimostrate in vari modi; il più veloce è però attraverso lafunzione generatrice

R(y) :=

n∑k=0

ekyBk,n(x) =

n∑k=0

(n

k

)(xey)k(1− x)n−k = (xey + 1− x)n,

1in Über die analytische Darstellbarkeit sogenannter willkürlicher Functionen einer reellen Veränderli-chen, Verl. d. Kgl. Akad. d. Wiss. Berlin, vol. 2 (1885) p. 633639.

2Sotto-algebra signica che possono essere sommati, moltiplicati per costanti ma anche moltiplicati traloro, senza uscire dalla loro classe di funzioni; separante signica che dati due qualunque punti distintiesiste sempre un elemento della sotto-algebra che assume in quei due punti valori diversi e che quindili distingue, ed invariante per coniugio signica che se un elemento g è nella sotto-algebra allora anchel'elemento g i cui valori sono dati da g(x) := g(x) appartiene alla sotto-algebra.

3in Démonstration du théorème de Weierstrass fondée sur le calcul des probabilités, Communications ofthe Kharkov Mathematical Society, Vol. XIII (1912/13), p. 12.

Page 15: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.1. SUCCESSIONI DI FUNZIONI 15

identità che segue dallo sviluppo del binomio. Le uguaglianze precedenti allora diventano:

n∑k=0

Bk,n(x) = R(0) = 1,

n∑k=0

kBk,n(x) = R′(0) = nxey(xey + 1− x)n−1∣∣y=0

= nx,

n∑k=0

k2Bk,n(x) = R′′(0) = nxey(xey + 1− x)n−1∣∣y=0

+ n(n− 1)x2e2y(xey + 1− x)n−2∣∣y=0

= nx+ n(n− 1)x2.

Da queste identità segue che

n∑k=0

(k − nx)2Bk,n(x) =n∑k=0

(k2 − 2nkx+ n2x2)Bk,n(x)

= n(n− 1)x2 + nx− 2nx · nx+ n2x2 = nx− nx2 = nx(1− x) ≤ n

4.

Sia ora f ∈ C([0, 1]) e sia

qn(x) :=

n∑k=0

f(kn

)Bk,n(x),

quindi una combinazione lineare dei polinomi Bk,n, con i valori di f nei punti k/n (i massimidei Bk,n) quali coecienti. Sia ε > 0 scelto ad arbitrio e sia δ = δ(ε) > 0 una costante conla proprietà per cui ogni qual volta |u− v| ≤ δ vale la stima |f(u)− f(v)| ≤ ε: tale valoreesiste per la uniforme continuità di f (che è continua su compatto). Allora

|qn(x)− f(x)| =∣∣∣ n∑k=0

f(kn

)Bk,n(x)− f(x)

n∑k=0

Bk,n(x)∣∣∣ =

∣∣∣ n∑k=0

(f(kn

)− f(x)

)Bk,n(x)

∣∣∣≤

n∑k=0

∣∣∣f(kn

)− f(x)

∣∣∣Bk,n(x),

dove si è usato il fatto che i Bk,n(x) sono non negativi, si sommano a 1, e la disuguaglianzatriangolare. Spezziamo la somma in due parti, quella sui termini in cui k/n è vicino a x egli altri (dove per vicino si intende a distanza inferiore di δ). Si ottiene:

=

n∑k=0

|k/n−x|≤δ

∣∣∣f(kn

)− f(x)

∣∣∣Bk,n(x) +

n∑k=0

|k/n−x|>δ

∣∣∣f(kn

)− f(x)

∣∣∣Bk,n(x).

Nella prima somma il termine∣∣f( kn) − f(x)

∣∣ è inferiore ad ε, perché per quei terminila distanza | kn − x| è inferiore a δ. Nella seconda questa stima non è più garantita, macomunque quel termine è dominato da 2‖f‖∞. Questo dà:

≤ εn∑k=0

|k/n−x|≤δ

Bk,n(x) + 2‖f‖∞n∑k=0

|k/n−x|>δ

Bk,n(x).

Page 16: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

16 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

La prima somma è dominata da 1 (ancora perché i Bk,n sono non negativi e si sommanoa 1), mentre nella seconda introduciamo il peso quadratico (|k/n− x|/δ)2 che è maggioredi 1, ottenendo:

≤ ε+2‖f‖∞δ2

n∑k=0

|k/n−x|>δ

(kn− x)2Bk,n(x) = ε+

2‖f‖∞n2δ2

n∑k=0

|k/n−x|>δ

(k − nx)2Bk,n(x)

≤ ε+2‖f‖∞n2δ2

n

4= ε+

‖f‖∞2nδ2

,

dove per la seconda somma si è usato la stima dimostrata precedentemente. Scegliendo nabbastanza grande possiamo fare in modo che anche il secondo termine sia ≤ ε, così chequesto dimostra che ‖qn − f‖∞,[0,1] ≤ 2ε.

La parte più innovativa della procedura è l'idea di introdurre il peso quadratico. Bernsteinconcepì questa dimostrazione ragionando in termini probabilistici; infatti, se X1, . . . , Xn

sono variabili aleatorie indipendenti ognuna delle quali assume solo i valori 1 ed 0 conprobabilità rispettivamente x ed 1−x, allora la variabile S := X1 + · · ·+Xn assume i valorik = 1, . . . , n con probabilità p([S = k]) = Bk,n(x); le varie identità trovate sono legate allamedia ed alla varianza di S (e la R è legata alla funzione generatrice dei momenti di S)e l'introduzione del peso quadratico corrisponde all'uso della disuguaglianza di Chebyshevche stima la probabilità di un evento in termini della varianza.

1.2 Serie di funzioni

1.2.1 Convergenza di una serie di funzioni

Siano date fkk∈N : X → R, con le quali costruiamo∑∞

k=0 fk come limite (in qualche sen-so) della successione delle somme parziali Sn :=

∑nk=0 fk. In particolare ogni aermazione

fatta sulla serie riceve signicato dalla sua interpretazione attraverso le somme parziali.Quindi, ad esempio, la frase

La∑∞

k=1 fk converge uniformemente in X

è da intendersi come

La successione Sn :=∑n

k=1 fk converge uniformemente in X.

Osservazione 1.2.1. Questa denizione identica le serie come caso particolare delle suc-cessioni. In realtà è possibile anche l'approccio opposto, visto che ogni successione fnn∈Nè scrivibile come

fn = fn − f−1 =n∑k=0

(fk − fk−1)

(dove si è introdotta la funzione f−1(x) := 0 per ogni x ∈ X), e quindi come sequenzadelle somme parziali di una serie. È quindi solo per una certa maggior semplicità notazio-nale che tradizionalmente si studiano prima le successioni: dal punto di vista strettamentematematico i due linguaggi sono del tutto equivalenti.

Page 17: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 17

Osservazione 1.2.2. Si faccia attenzione a questo fatto: no a che la convergenza della serienon sia stata indagata, il simbolo

∑∞k=0 fk indica unicamente la successione delle somme

parziali (più precisamente indica una domanda: tale successione converge?); una voltastabilita la sua convergenza lo stesso simbolo passa ad indicare il limite della successione.

Proposizione 1.2.3 (Criterio di c.u.). Siano fkk∈N : X → R una successione di funzionilimitate. Allora la serie

∑∞k=0 fk converge uniformemente in X se e solo se

∀ε > 0 ∃N = N(ε) tale che se m > n ≥ N =⇒∥∥∥ m∑k=n+1

fk

∥∥∥∞,X

≤ ε.

Dimostrazione. Per ipotesi le funzioni fk sono limitate; questo garantisce che anche lesomme parziali Sn :=

∑nk=0 fk lo sono. In particolare sia le fk che le Sn sono funzioni

in B(X,R). Per denizione, la serie è detta convergere uniformemente in X quando lasuccessione Snn∈N converge uniformemente. Dalla completezza di B(X,R) segue chequesto accade se e solo se Snn∈N ha la proprietà di Cauchy, ovvero se e solo se

∀ε > 0 ∃N = N(ε) tale che se m > n ≥ N =⇒∥∥Sm − Sn∥∥∞,X ≤ ε.

La tesi segue immediatamente per il fatto che

∥∥Sm − Sn∥∥∞,X =∥∥∥ m∑k=0

fk −n∑k=0

fk

∥∥∥∞,X

=∥∥∥ m∑k=n+1

fk

∥∥∥∞,X

.

Corollario 1.2.4. Sia fkk∈N : X → R una successione di funzioni limitate. Se∑∞

k=0 fkconverge uniformemente in X allora ‖fk‖∞,X → 0 al divergere di k.

Dimostrazione. Basta prendere m = n + 1 nel criterio di convergenza uniforme (Proposi-zione 1.2.3).

Si osservi che il corollario esprime solo una condizione necessaria: non basta che ‖fk‖∞,Xtenda a zero perché la serie converga. Tuttavia se opportunamente raorzata, questacondizione è in grado di garantire la convergenza della serie. Ecco come.

Corollario 1.2.5 (Test di Weierstrass). Se∑∞

k=0 ‖fk‖∞,X converge allora∑∞

k=0 fk con-verge uniformemente in X.

Dimostrazione. Fissiamo ε > 0. Per ipotesi la serie∑∞

k=0 ‖fk‖∞,X numerica converge,quindi esiste N = N(ε) tale che se m > n ≥ N allora

∑mk=n+1 ‖fk‖∞,X ≤ ε. Ma allora

dalla disuguaglianza triangolare segue che∥∥∥ m∑k=n+1

fk

∥∥∥∞,X

≤m∑

k=n+1

∥∥fk∥∥∞,X ≤ ε,e quindi la serie

∑∞k=0 fk soddisfa il criterio di convergenza uniforme.

Osservazione 1.2.6. Il valore di∑∞

k=0 ‖fk‖∞,X non ha alcun ruolo, quindi per poter appli-care il test basta stabilire la sua esistenza come numero in R e per fare questo non servecalcolare il valore esatto di ‖fk‖∞,X ma basta avere una sua stima per eccesso.

Page 18: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

18 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Esempio 1.2.7. Vericare che∑∞

k=1sin kxk2+ekx

converge uniformemente in R.Poniamo fk := sin(kx)

k2+ekx, ed osserviamo che

|fk(x)| ≤ 1

k2 + ekx≤ 1

k2

comunque si scelga x ∈ R. Quindi ‖fk‖∞,R ≤ 1k2, così che

∞∑k=1

‖fk‖∞,R ≤∞∑k=1

1

k2<∞.

In base al test di Weierstrass questo è suciente per dimostrare la convergenza uniformein R della serie.

Vista l'importanza del test, si è introdotto un termine specico per indicare le serie difunzioni che lo soddisfano:

Denizione 1.2.8. Se∑∞

k=0 ‖fk‖∞,X <∞ allora diciamo che la serie converge totalmen-te in X: il test di Weierstrass mostra che la terminologia è corretta, ovvero che si trattaeettivamente di una convergenza della serie di funzioni (e non solo della convergenza diuna serie numerica ad essa collegata).

Osservazione 1.2.9. Dal fatto che ‖fk‖∞,X = ‖ |fk| ‖∞,X segue che la convergenza totaleimplica anche la convergenza della serie

∑∞k=0 |fk(x0)|, ovvero la convergenza puntuale

assoluta della serie data.

Non vale però il viceversa, ovvero una serie di funzioni che converga sia uniformemente esia puntualmente assolutamente non è detto che converga totalmente, come mostrato dalseguente esempio.

Esempio 1.2.10. Per ogni k ∈ N, k ≥ 1, sia fk(x) := 1xχ[k,k+1)(x). Allora le somme parziali

sono le funzioni

Sn(x) :=n∑k=1

fk(x) =n∑k=1

1

xχ[k,k+1)(x) =

1

x

n∑k=1

χ[k,k+1)(x) =1

xχ[1,n+1)(x)

ed è chiaro che tali funzioni convergono assolutamente alla funzione f(x) := 1xχ[1,+∞)(x).

Inoltre si ha

Sn(x)− f(x) =1

xχ[1,n+1)(x)− 1

xχ[1,+∞)(x) =

1

xχ[n+1,+∞)(x)

quindi

‖Sn − f‖∞,R = supx∈R

1

xχ[n+1,+∞)(x) =

1

n+ 1

per cui la convergenza è uniforme in R. D'altra parte ‖fk‖∞,R = ‖ 1xχ[k,k+1)(x)‖∞,R = 1

k ,quindi

∞∑k=1

‖fk‖∞,R =

∞∑k=1

1

k= +∞

per cui la serie non converge totalmente.

Page 19: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 19

Esercizio 1.2.11. Dimostrare che la serie∑∞

k=1(−1)k

k+x converge uniformemente in [0,+∞)ma non totalmente.

Proposizione 1.2.12. Sia fkk∈N : Ω ⊆ R→ R e sia x0 ∈ Ω. Supponiamo che le fk sianocontinue in x0 e che la serie

∑∞k=0 fk converga uniformemente in Ω. Allora la funzione

F :=∑∞

k=0 fk è continua in x0.

Dimostrazione. Per ipotesi le somme parziali sono continue in x0 (perché somme delle fkche lo sono) e convergono uniformemente ad F , quindi la tesi segue dal Teorema 1.1.11.

Proposizione 1.2.13. Sia fkk∈N : [a, b] ⊆ R→ R. Supponiamo che fk ∈ R([a, b]) e chela serie

∑∞k=0 fk converga uniformemente in [a, b]. Allora anche la funzione F :=

∑∞k=0 fk

è in R([a, b]) e inoltre:∫ b

a

∞∑k=0

fk(x) dx =

∫ b

aF (x) dx =

∞∑k=0

∫ b

afk(x) dx.

Dimostrazione. Per ipotesi le somme parziali sono Riemann integrabili (perché sommedelle fk che lo sono) e convergono uniformemente ad F , quindi dal Teorema 1.1.18 e dallalinearità dell'integrale segue che∫ b

aF (x) dx =

∫ b

alimn→∞

Sn(x) dx = limn→∞

∫ b

aSn(x) dx = lim

n→∞

∫ b

a

n∑k=0

fk(x) dx

= limn→∞

n∑k=0

∫ b

afk(x) dx =

∞∑k=0

∫ b

afk(x) dx.

Proposizione 1.2.14. fkk∈N : (a, b) ⊆ R→ R con ogni fk è derivabile in (a, b) ed esistex0 ∈ (a, b) tale che

∑∞k=0 fk(x0) converge. Supponiamo che

∑∞k=0 f

′k converge uniforme-

mente in (a, b). Allora la serie∑∞

k=0 fk converge semplicemente in (a, b), la convergenza èuniforme su ogni compatto contenuto in (a, b) e la funzione F (x) =

∑∞k=0 fk è derivabile

con F ′(x) =∑∞

k=0 f′k ovvero:

( d

dx

∞∑k=0

fk

)(x) =

∞∑k=0

dfkdx

(x).

1.2.2 La funzione di Takagi

Sia ϕ : R → R la funzione denita da ϕ(x) := min|x − n|, n ∈ Z, ovvero la funzioneche in x assume la minima distanza di x dagli interi. Dalla denizione stessa segue subitoche ϕ(1 + x) = ϕ(x) (quindi è 1-periodica), a valori in [0, 1/2], lineare a tratti, e continua,ma non derivabile in 1/2 (e quindi in tutti i punti Z + 1/2), dove presenta un puntoangoloso. Inoltre, il suo valore può essere calcolato anche usando l'espressione ϕ(x) =minx − bxc , dxe − x (che è computazionalmente vantaggiosa visto che richiede un soloconfronto). Tramite ϕ costruiamo una nuova funzione, nel modo seguente:

Φ(x) :=∞∑n=0

1

2nϕ(2nx)

Page 20: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

20 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Visto che ϕ assume valori in [0, 1/2], si vede subito che ‖ 12nϕ(2nx)‖∞,R = 1

2n+1 , che èevidentemente il termine generale di una serie convergente: la serie converge quindi to-talmente in R e la funzione Φ risultante è certamente continua (perché limite uniformedi continue.) A dispetto della sua costruzione dall'aria innocente, il graco di Φ appareinvece estremamente elaborato.Un calcolo semplice basta per mostrare la non derivabilità di Φ in 0. Infatti, osserviamoche ϕ(x) vale zero negli interi, e coincide con x quando x ∈ [0, 1/2]. Prendiamo allora lasequenza di punti 1/2k, ed osserviamo che questo fatto implica le seguenti uguaglianze:

Φ(1/2k)− Φ(0) = Φ(1/2k) =∞∑n=0

1

2nϕ(2n · 1/2k) =

k−1∑n=0

1

2nϕ(2n · 1/2k) =

k−1∑n=0

1

2k=

k

2k.

Di conseguenza il rapporto incrementale vale

Φ(1/2k)− Φ(0)

1/2k − 0= 2k(Φ(1/2k)− Φ(0)) = k

e quindi diverge per k →∞. Questo basta a dimostrare che Φ′(0) non esiste, almeno noncome quantità nita. In eetti si può dimostrare che Φ non è derivabile in alcun punto. Ilfatto di essere una funzione di semplice denizione, continua ovunque e mai derivabile nefa una importante fonte di esempi e controesempi in analisi. Ad esempio, si dimostra chesoddisfa la relazione Φ(x) = ϕ(x) + 1

2Φ(2x) che, insieme alla relazione Φ(1 + x) = Φ(x) diperiodicità, è responsabile dell'aspetto di autosimiliarità del suo graco e la connette agliinsiemi frattali. Oltre a non essere derivabile, in realtà non è di tipo Lipschitz (ma è ditipo α-Hölder per ogni α ∈ [0, 1)) ma il suo graco ha dimensione di Hausdor 1 (comeuna normale curva C1 nel piano).

x

y

0 1/2 10

1/2

2/3

La funzione di Takagi.

Esercizio 1.2.15. Sia Lip([0, 1]) l'insieme delle funzioni f : [0, 1]→ R che sono Lipcontinue,ovvero per le quali

sup |f(x)− f(y)|

|x− y|, x, y ∈ [0, 1], x 6= y

=: Lf

è una quantità nita. Sia ‖f‖L := |f(0)|+ Lf . Vericare le seguenti proprietà:

i. Lip([0, 1]) è uno spazio vettoriale reale, e ‖ · ‖L è una norma in tale spazio.

Page 21: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 21

ii. Vericare che per ogni f ∈ Lip([0, 1]) si ha |f(x)| ≤ |f(0)|+ Lf · |x| e che quindi

‖f‖∞,[0,1] ≤ ‖f‖L.

iii. Sia fnnN ∈ Lip([0, 1]), una sequenza di Cauchy rispetto alla norma ‖ ·‖L; vericareche la sequenza di numeri ‖fn‖Ln∈N è una sequenza limitata.Suggerimento: Questo è in realtà un fatto generale: le norme di una sequenza diCauchy sono sempre un insieme limitato.

iv. Usando ii. e iii., vericare che Lip([0, 1]) con la norma ‖ · ‖L è di Banach.Suggerimento: usare ii. per dimostrare l'esistenza della funzione limite, ed usareiii. per dimostrare che essa è di tipo Lip.

v. Sia ι : Lip([0, 1]) → C([0, 1]) la mappa di inclusione, ovvero la mappa secondo cuiι(f) = f . Si prenda Lip([0, 1]) normato con la norma ‖ · ‖L ed C([0, 1]) con la norma‖ · ‖∞,[0,1]: vericare che ι è continua.Suggerimento: cosa dice ii.?

vi. Vericare che ι(Lip([0, 1])) non è un sottoinsieme chiuso in C([0, 1]).Suggerimento: considerare le somme parziali della serie che denisce la funzione Φdi Takagi.

Esercizio 1.2.16. Siano Lip([0, 1]), Lf ed ‖f‖L come nel precedente esercizio. Vericare iseguenti fatti:

i. Se f è in C1([0, 1]), allora Lf = ‖f ′‖∞,[0,1], ovvero la costante di Lipschitz di fcoincide con il sup della sua derivata.

ii. Sia ι : C1([0, 1]) → Lip([0, 1]) la mappa di inclusione, ovvero la mappa secondo cuiι(f) = f . Si prenda C1([0, 1]) normato con la norma ‖ · ‖2 data da ‖|f‖|2 := |f(0)|+‖f ′‖∞,[0,1] (vedasi Esercizio 1.1.24) ed Lip([0, 1]) con la norma ‖ · ‖L: vericare che ιè continua.Suggerimento: cosa dice i.?

iii. Vericare che ι(C1([0, 1])) è un sottoinsieme chiuso in Lip([0, 1]).

1.2.3 Serie di potenze

Denizione 1.2.17. Chiamiamo serie di potenze ogni serie che abbia la struttura:

∞∑k=0

ak(x− x0)k,

con akk∈N successione numerica e x0 ∈ R. Il numero x0 è detto centro della serie.

Osservazione 1.2.18. Per lo sviluppo di buona parte della teoria delle serie di potenze èsuciente restringersi al caso in cui il centro della serie è lo 0. Questo perché ogni serie∑∞

k=0 ak(x− x0)k di centro x0 è ricondotta ad una di centro zero semplicemente mediantela traslazione w := x− x0 alla serie

∑∞k=0 akw

k che ha centro 0.

Data una serie di potenze anzitutto cerchiamo di caratterizzarne il dominio di convergenza,ovvero di determinare l'insieme D := x ∈ R :

∑∞k=0 akx

k converge.

Page 22: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

22 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Osservazione 1.2.19. Il dominio non è mai vuoto, infatti 0 ∈ D.

Lemma 1.2.20. Se la serie converge in w allora converge puntualmente in (−|w|, |w|) ela convergenza è totale nei compatti K contenuti in (−|w|, |w|).

Dimostrazione. Sia w un punto di convergenza. Se w = 0 allora la tesi è certamente vera,quindi possiamo supporre w 6= 0. Per ipotesi

∑∞k=0 akw

k è una serie numerica convergente,perciò la quantità akwk tende a 0. Questa sequenza quindi è limitata ovvero esiste c taleche |akwk| < c per ogni k. Quindi

|akxk| =∣∣∣akwk · ( x

w

)k∣∣∣ ≤ c · ( |x||w|)k.Per ogni compatto K ∈ (−|w|, |w|) esiste un numero α con 0 < α < |w| tale che

K ⊆ [−α, α]. Quindi quando x ∈ K si ha |akxk| ≤ c(α|w|)k

e quindi∑∞

k=0 ‖akxk‖ ≤c∑∞

k=0

(α|w|)k

e questa è una serie convergente, visto che α/|w| < 1. Questo dimostra chela serie data converge totalmente in K.

Denizione 1.2.21. Chiamiamo raggio di convergenza la quantità ρ := sup|x| : x ∈ D.Dal lemma precedente e dalla denizione di raggio di convergenza seguono immediatamentele inclusioni

(−ρ, ρ) ⊆ D ⊆ [−ρ, ρ],

che nel caso ρ sia innito vanno intese come D = R.

Proposizione 1.2.22 (Criterio di CauchyHadamard). Sia l := lim supk→∞k√|ak|. Allora

ρ = 1l (con la convenzione che se l =∞ allora ρ = 0 e se l = 0 allora ρ = +∞).

Proposizione 1.2.23 (Criterio di d'Alembert). Supponiamo che ak 6= 0 per ogni k e chel := limk→∞

∣∣ak+1

ak

∣∣ esista in R (quindi con +∞ ammesso tra i possibili valori). Allora

ρ = 1l (con la convenzione che se l = +∞ allora ρ = 0 e se l = 0 allora ρ = +∞).

Dimostrazione. Entrambi i criteri seguono immediatamente dal criterio della radice e diquello del confronto per le serie numeriche.

Osservazione 1.2.24. Consideriamo la serie∑∞

k=0 akxk con ak = 1 se k è pari, e ak = 2

se k è dispari. In tale situazione il criterio della radice mostra immediatamente che ρ = 1,mentre quello del quoziente non dà alcuna indicazione visto che |ak+1|/|ak| = 2 per kdispari e |ak+1|/|ak| = 1/2 per k pari, per cui il limite non esiste.Per questa serie inoltre si ha lim supk→∞ |ak+1|/|ak| = 2, che non è l'inverso del suo raggiodi convergenza. Questo esempio mostra che quindi in generale si può calcolare il raggiodi convergenza a partire dalla successione dei quozienti successivi solo se questa ammetteun limite. Con il criterio della radice invece il calcolo è sempre possibile, visto che peresso basta il limite superiore e che esso esiste sempre. Per questo motivo il criterio diCauchyHadamard è sicuramente di maggior interesse e generalità.

Esempio 1.2.25. Alcuni esempi:

• sia∑∞

k=1xk

k2. Visto che

∣∣ak+1

ak

∣∣ = k2

(1+k)2→ 1 si deduce che ρ = 1. Inoltre la serie converge

sia in x = 1 e x = −1, quindi D = [−1, 1];

Page 23: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 23

• sia∑∞

k=0 k2xk. Come prima dal criterio del rapporto segue subito che ρ = 1. La serie

però non converge né in 1 né in −1, quindi in questo caso D = (−1, 1);

• la serie∑∞

k=1xk

k converge in D = [−1, 1);

• sia α ∈ R; la serie∑∞

k=1 kαxk ha sempre raggio 1. Inoltre D = (−1, 1) se α ≥ 0,

D = [−1, 1) se −1 ≤ α < 0 e D = [−1, 1] se α < −1;

• sia∑∞

k=0xk

k! . Allora∣∣ak+1

ak

∣∣ = 1k+1 → 0, quindi ρ =∞ e D = R;

• sia∑∞

k=0 k!xk. Allora∣∣ak+1

ak

∣∣ = k + 1→∞, quindi ρ = 0 e D = 0.

Teorema 1.2.26 (Abel). Se la serie∑∞

k=0 akxk converge in un punto w > 0 allora conver-

ge uniformemente in [0, w] (se invece converge in w < 0 allora la convergenza è uniformein [w, 0]).

Dimostrazione. Senza ledere la generalità della dimostrazione possiamo supporre w = 1(perché la serie

∑∞k=0 akx

k può anche essere scritta come∑∞

k=0 akwk(x/w)k che ponendo

z := x/w risulta convergente in z = 1) e che∑∞

k=0 ak = 0 (basta cambiare il terminecostante a0 con a0 −

∑∞k=0 ak).

Sia Ak :=∑

l≤k al (con A−1 := 0). Allora:

n∑k=0

akxk =

n∑k=0

(Ak −Ak−1)xk =

n∑k=0

Akxk −

n∑k=0

Ak−1xk =

n∑k=0

Akxk −

n−1∑k=0

Akxk+1

(questo perché abbiamo posto A−1 = 0), che possiamo riorganizzare come:

= Anxn −

n−1∑k=0

Ak(xk+1 − xk).

Da questo calcolo segue che se m > n allora

m∑k=n+1

akxk =

m∑k=0

akxk −

n∑k=0

akxk = Amx

m −Anxn −m−1∑k=n

Ak(xk+1 − xk).

Sia ε > 0 ssato ad arbitrio. Per ipotesi∑∞

k=0 ak = 0, ovvero Ak → 0 per k →∞. Quindiesiste N tale che |Ak| ≤ ε per ogni k ≥ N . Assumendo m > n ≥ N , dalla uguaglianzaprecedente deduciamo che∣∣∣ m∑

k=n+1

akxk∣∣∣ ≤ ε|x|m + ε|x|n + ε

m−1∑k=n

|xk+1 − xk|. (1.1)

Se inoltre x ∈ [0, 1], allora |xk+1 − xk| = xk − xk+1 così che

m−1∑k=n

|xk+1 − xk| =m−1∑k=n

(xk − xk+1) = xn − xm ≤ xn ≤ 1,

e la (1.1) dà ∣∣∣ m∑k=n+1

akxk∣∣∣ ≤ 3ε ∀x ∈ [0, 1],

Page 24: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

24 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

ovvero ∥∥∥ m∑k=n+1

akxk∥∥∥∞,[0,1]

≤ 3ε.

Questo mostra che il criterio per la convergenza uniforme in [0, 1] è soddisfatto.

Corollario 1.2.27. Sia data una serie di potenze di centro 0 e raggio di convergenza ρ > 0.Se la serie converge nel punto x = ρ allora essa converge uniformemente nei compatti di(−ρ, ρ].

Dimostrazione. Ogni compatto K di (−ρ, ρ] è unione di due compatti, K0 e K1, con K0 ⊆(−ρ, 0] e K1 ⊆ [0, ρ]. La serie converge uniformemente sia in K0 (per il Lemma 1.2.20)sia in K1 (per il Teorema 1.2.26), quindi converge uniformemente anche nella loro unione,ovvero in K.

Teorema 1.2.28. Sia∑∞

k=0 akxk una serie di potenze con raggio ρ > 0. La funzione

f : (−ρ, ρ)→ R i cui valori sono f(x) =∑∞

k=0 akxk è una funzione in C∞((−ρ, ρ)). Inoltre:

i. La derivata `-esima di f è calcolabile nel modo seguente:

f (`) =

∞∑k=0

ak·k(k − 1) · · · (k − `+ 1)︸ ︷︷ ︸` fattori

·xk−`=∞∑k=0

ak+`·(k + `)(k + `− 1) · · · (k + 1)︸ ︷︷ ︸` fattori

·xk,

in particolare anche le derivate sono serie di potenze;

ii. il raggio di convergenza di f (`) è ancora ρ;

iii. f (`)(0) = `!a` e quindi a` = f (`)(0)`! .

Dimostrazione. Osserviamo che f è per ipotesi scritta come una serie di funzioni dellaforma akxk che quindi sono certamente funzioni di classe C1 (in quanto polinomi). D'altraparte la serie delle derivate è

∞∑k=0

akkxk−1 = a1 + 2a2x+ 3a3x

2 + · · · =∞∑k=0

ak+1(k + 1)xk

che è ancora una serie di potenze. Sia ρ′ il suo raggio di convergenza. Osserviamo che laserie derivata può anche essere scritta come

∞∑k=0

akkxk−1 =

1

x

∞∑k=0

akkxk

e che quindi l'insieme di convergenza della serie derivata coincide con quello della serie adestra (a parte il punto x = 0 che è un punto di convergenza per la serie a sinistra ed inveceun punto di discontinuità eliminabile per l'espressione a destra). In particolare il raggiodi convergenza ρ′ della serie derivata coincide con il raggio ρ della serie

∑∞k=0 akkx

k. Dalcriterio di Hadamard sul raggio di convergenza segue allora che

1/ρ′ = 1/ρ = lim supk→∞

k√k|ak| =

(limk→∞

k√k)

lim supk→∞

k√|ak| = lim sup

k→∞

k√|ak| = 1/ρ

Page 25: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 25

(si noti che in un passo intermedio si è usato il fatto che limk→∞ k1/k = 1), e questo

dimostra che appunto che ρ′ = ρ. In particolare la serie delle derivate converge in (−ρ, ρ),totalmente nei compatti. Ma allora su ciascun aperto (a, b) con −ρ < a < 0 < b < ρvalgono le ipotesi del teorema di derivazione (Proposizione 1.2.14, con 0 quale punto x0

di convergenza). Questo dimostra che f è C1 con f ′(x) =∑∞

k=0 akkxk−1 in tutto (a, b),

e quindi in (−ρ, ρ). Iterando il processo (cosa possibile perché la derivata è una serie dipotenze) si ha la tesi.

Osservazione 1.2.29. La convergenza è totale (quindi uniforme) nei compatti contenuti in(−ρ, ρ), perciò∫ x

0

( ∞∑k=0

akuk)

du =

∞∑k=0

ak

∫ x

0uk du =

∞∑k=0

akxk+1

k + 1∀x ∈ (−ρ, ρ).

Osservazione 1.2.30. Dal teorema di Abel segue che se∑∞

k=0 akρk converge allora l'ugua-

glianza ∫ x

0

( ∞∑k=0

akuk)

du =

∞∑k=0

akxk+1

k + 1

vale anche per x = ρ (perché allora la convergenza è uniforme nei compatti di (−ρ, ρ]).

Osservazione 1.2.31. Sia S0 l'insieme delle serie di potenze formali di centro 0. Ovvero

S0 = ∞∑k=0

akxk, ak ∈ R, ∀k

.

L'aggettivo formale deriva dal fatto che non valutiamo questa serie per alcun valore di x,ma usiamo xk solo come segnaposto del posto k-esimo. Il suo unico ruolo è quindi quello didistinguere i vari numeri ak che compongono la serie. Siano dati due serie di potenze in S0:∑

1 :=∑∞

k=0 akxk e∑

2 :=∑∞

k=0 bkxk, e un numero reale λ. Deniamo la serie somma, la

serie prodotto per lo scalare λ e la serie prodotto come:

•∑

1 +∑

2 :=∑∞

k=0(ak + bk)xk,

• λ∑

1 :=∑∞

k=0 λakxk,

•∑

1 ·∑

2 :=∑∞

k=0(∑

u,v≥0u+v=k

aubv)xk.

Con queste denizioni l'insieme S0 acquista la struttura di algebra reale commutativa conunità. (che il prodotto sia commutativo è evidente dalla sua denizione, così come il fattoche la serie E(x) :=

∑∞k=0 ekx

k con e0 = 1 ed ek = 0 per ogni k ≥ 1 è l'unità moltiplicativa).È interessante vericare che un elemento

∑∞k=0 akx

k è invertibile in S0 se e solo se a0 6= 0.

Osservazione 1.2.32. Date due serie di potenze:∑

1 :=∑∞

k=0 akxk e

∑2 :=

∑∞k=0 bkx

k diraggio rispettivamente ρ1 e ρ2. Deniamo la serie somma e la serie prodotto come fatto inS0, ovvero ponendo:

•∑

1 +∑

2 :=∑∞

k=0(ak + bk)xk,

•∑

1 ·∑

2 :=∑∞

k=0(∑

u,v≥0u+v=k

aubv)xk.

Allora si hanno le seguenti proprietà (da vericare)

Page 26: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

26 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

i. ρ(∑

1 +∑

2) e ρ(∑

1 ·∑

2) sono entrambi ≥ minρ1, ρ2;

ii. (∑

1 +∑

2)(x) =∑

1(x) +∑

2(x) se |x| < minρ1, ρ2;

iii. (∑

1 ·∑

2)(x) =∑

1(x) ·∑

2(x) se |x| < minρ1, ρ2;

iv. Se ρ1 6= ρ2 allora ρ(∑

1 +∑

2) = minρ1, ρ2.

Esercizio 1.2.33. Sia α ∈ R ssato. Sia(α

k

):=

1k!α(α− 1) · · · (α− k + 1) se k ≥ 1

1 se k = 0.

Si osservi che per α ∈ N questa funzione coincide con l'usuale coeciente binomiale, mal'espressione data ha perfettamente senso per ogni α ∈ R.

i. Sia fα(x) :=∑∞

k=0

(αk

)xk. Vericare che il raggio di convergenza di fα è 1 per α ∈ R\N

ed ∞ per α ∈ N.

ii. Vericare chefα(x) = (1 + x)α |x| < 1.

(questo è un po' dicile, ma può essere fatto in vari modi; ad esempio usando losviluppo noto di Taylor della funzione (1+x)α. In alternativa si può osservare che siafα(x) che (1 +x)α soddisfano l'equazione dierenziale (1 +x)y′ = αy con condizioneiniziale y(0) = 1. Dal teorema di esistenza ed unicità della soluzioni di questo tipo diequazioni (che dimostreremo in seguito) segue allora l'uguaglianza fα(x) = (1+x)α).

iii. Osservare che f1/2(x) ·f1/2(x) = 1+x e che quindi il raggio di convergenza della serieprodotto è ∞, mentre i raggi di convergenza dei fattori sono entrambi 1. Ciò mostrache la stima ρ(

∑1 ·

∑2) ≥ minρ1, ρ2 può di fatto essere una disuguaglianza stretta.

Osservazione 1.2.34. L'insieme ∑∞

k=0 akxk, ρ ≥ 1 gode di buone proprietà algebriche (è

un'algebra reale commutativa con unità di cui l'insieme dei polinomi è una sottoalgebra)ed analitiche (i suoi elementi sono di classe C∞ e contiene sia le loro derivate che le loroprimitive, ovvero è un'algebra dierenziale).

Il teorema precedente mostra che se una funzione f è esprimibile come serie di potenze dicentro x0 allora essa è di classe C∞ e la serie di potenze che la rappresenta è necessariamentela sua serie di Taylor di centro x0, ovvero la serie

∞∑k=0

f (`)(x0)

`!(x− x0)k.

Il seguente esempio mostra che però non ogni funzione di classe C∞ ammette una talerappresentazione.

Esempio 1.2.35. Sia f : R→ R la funzione i cui valori sono

f(x) =

e−1/x2 x 6= 0

0 x = 0.

Page 27: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 27

La funzione f è C∞(R), con derivate date da

f (`)(x) =

P`(

1x)e−1/x2 x 6= 0

0 x = 0∀` ∈ N,

dove P` è un polinomio (questo può essere dimostrato per induzione su `. Volendo si puòanche ricavare la formula P`+1(u) = u2(2P`(u) − P ′`(u)) che con la condizione P0(u) = 1consente di determinare i polinomi per ricorsione). Ma allora se f fosse rappresentabilecome serie di potenze di centro 0, la sua rappresentazione dovrebbe essere la serie

∞∑k=0

f (`)(0)

`!xk =

∞∑k=0

0 · xk = 0

la quale certamente converge ovunque, ma rappresenta la funzione identicamente 0 e nonla f .

Denizione 1.2.36. Sia Ω ⊆ R un aperto. Indichiamo con Cω(Ω) l'insieme di funzionif : Ω→ R, f ∈ C∞(Ω)| tali che ∀x0 ∈ Ω la serie di Taylor di f in x0

converge ad f in un opportuno U(x0) aperto

.

Le funzioni di Cω(Ω) sono dette analitiche in Ω e l'Esempio 1.2.35 mostra che l'inclusioneCω(Ω) ⊆ C∞(Ω) è stretta.

Proposizione 1.2.37 (Analiticità delle serie di potenze). Sia∑∞

k=0 akxk una serie di

potenze con ρ > 0. Allora la funzione f : (−ρ, ρ) → R i cui valori sono deniti da f(x) =∑∞k=0 akx

k è analitica in (−ρ, ρ).

Dimostrazione. Sia x0 ∈ (−ρ, ρ) ssato ad arbitrio. Per dimostrare la tesi dobbiamo dimo-

strare che la serie di Taylor∑∞

`=0f (`)

`! (x− x0)` converge ad f(x) in un opportuno intornoaperto del punto x0. Dal Teorema 1.2.28 sappiamo che

f (`)(x0) =∞∑k=`

akk!

(k − `)!xk−`0 ∀`,

quindi la serie di Taylor di f con centro x0 è la serie

∞∑`=0

f (`)(x0)

`!(x− x0)` =

∞∑`=0

∞∑k=`

akk!

(k − `)!`!xk−`0 (x− x0)` =

∞∑`=0

∞∑k=`

ak

(k

`

)xk−`0 (x− x0)`.

In eetti, supponiamo di poter scambiare le due serie senza modicare il valore. Facendolootteniamo

=

∞∑k=0

ak

k∑`=0

(k

`

)xk−`0 (x− x0)`

(si osservi il nuovo range per k ed `). Per il teorema del binomiale la somma interna èsemplicemente (x0 + x− x0)k = xk, quindi la serie è

=

∞∑k=0

akxk

Page 28: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

28 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

che è appunto f(x). Perché l'argomento sia completo dobbiamo però ancora giustica-re lo scambio delle due serie. Il teorema generale sulle serie doppie garantisce che se∑∞

m=0

∑∞n=0 |am,n| < ∞, allora vale l'uguaglianza

∑∞m=0

∑∞n=0 am,n =

∑∞n=0

∑∞m=0 am,n

(ovvero, se la serie doppia converge assolutamente, allora le serie possono essere commu-tate). Quindi verichiamo che quel passaggio è corretto mostrando che

∞∑`=0

∞∑k=`

|ak|(k

`

)|x0|k−`|x− x0|` < +∞. (1.2)

Sappiamo anche che le serie a termini reali nonnegativi possono essere sempre commutate,senza modicare il valore (che però potrebbe essere +∞). Quindi non sappiamo ancorase (1.2) sia eettivamente corretta, ma sicuramente si ha

∞∑`=0

∞∑k=`

|ak|(k

`

)|x0|k−`|x− x0|` =

∞∑k=0

k∑`=0

|ak|(k

`

)|x0|k−`|x− x0|`

=∞∑k=0

|ak|(|x0|+ |x− x0|)k

(per l'ultimo passo si è usato ancora il teorema del binomiale). Per concludere basta alloraosservare che questa serie è sicuramente convergente se |x0|+ |x−x0| < ρ (perché sappiamoche la serie di potenze originaria converge assolutamente in (−ρ, ρ)). Visto che |x0| < ρper ipotesi, basta quindi prendere x in modo che |x− x0| < ρ− |x0|: questa disuguaglian-za denisce un intorno aperto di x0 e i calcoli precedenti sono quindi giusticati pur diprendere x in questo aperto. La tesi è quindi dimostrata.

In base alla sua denizione, essere analitico in Ω signica essere localmente rappresentabilecome serie di potenze. La Proposizione 1.2.37 precedente mostra che se una funzione èglobalmente rappresentabile in serie di potenze in (−ρ, ρ), allora lo è anche localmente. Laproposizione quindi esprime una situazione in cui la proprietà globale implica la presenzadella analoga proprietà locale in ogni punto. Altri concetti hanno la medesima interpreta-zione, ad esempio la continuità, l'invertibilità (lo vedremo fra poco), l'integrabilità, nonchécontesti algebrici in cui ad esempio l'esistenza di soluzioni in interi o in razionali dell'equa-zione P (x) = 0 con P ∈ Z[x] è messa in relazione alla sua risolubilità in R e nei campiniti Z/pZ (principio di Hasse). Come spesso accade, non è vero il contrario, ovvero il fattoche una funzione sia localmente sempre rappresentabile in serie di potenze di per sé nongarantisce che quella funzione sia globalmente rappresentabile in serie di potenze (ovveroche esista una serie di potenze che la rappresenta su tutto il suo dominio). Un esempio diquesto fenomeno è la funzione f(x) = 1/(1 + x2), che è analitica in R ma non ammettealcuna rappresentazione in serie di potenze convergente su R.Abbiamo già visto che se una funzione f è rappresentabile come serie di potenze di centrox0 in un intorno di x0 allora tale serie deve essere quella associata al suo sviluppo di Taylorcentrato in x0, ma l'esempio precedente mostra anche che non sempre tale sviluppo eet-tivamente converge o converge ad f . La seguente proposizione mostra però che sotto unaopportuna condizione uniforme di crescita sulle derivate si ha eettivamente la convergenzadella serie ad f .

Proposizione 1.2.38. Sia f : (−r, r) ⊆ R → R di classe C∞ in (−r, r). Supponiamo che‖f (k)‖∞,(−r,r) k!

rkper k → ∞. Allora f è rappresentata in (−r, r) dalla sua serie di

Taylor di centro 0.

Page 29: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

1.2. SERIE DI FUNZIONI 29

È possibile dimostrare che la stima enunciata nella proposizione è di fatto anche condizionenecessaria per la convergenza ad f della serie di Taylor; la dimostrazione di questo fattoperò pertiene all'analisi complessa e non sarà discussa in queste note.

Dimostrazione. Fissato x ∈ (−r, r) valutiamo la dierenza f(x)−∑N−1

k=0f (k)(0)k! xk e veri-

chiamo che tende a 0. Il secondo termine della dierenza è il polinomio di Taylor arrestatoall'ordine N − 1. Dal teorema di Lagrange sappiamo che esiste ξ tra 0 ed x tale per cui la

dierenza considerata sopra è uguale a f (N)(ξ)N ! xN . Visto che |ξ| ≤ |x| < r, abbiamo

∣∣∣f(x)−N−1∑k=0

f (k)(0)

k!xk∣∣∣ =

∣∣∣f (N)(ξ)

N !xN∣∣∣ ≤ ‖f (N)‖∞,(−r,r) ·

|x|N

N !

N !

rN· |x|

N

N !=( |x|r

)N→ 0 per N →∞ (con x ed r ssati)

poiché |x| < r.

Teorema 1.2.39. Per ogni x ∈ R valgono le uguaglianze

ex =∞∑k=0

xk

k!, sinx =

∞∑k=0

(−1)k

(2k + 1)!x2k+1 e cosx =

∞∑k=0

(−1)k

(2k)!x2k.

Dimostrazione. Sia f(x) := ex e sia r un qualunque reale positivo ssato. Per ogni k ∈ Nsi ha f (k)(x) = ex, così che ‖f (k)‖∞,(−r,r) = er. Questa quantità è k!

rkpoiché il rapporto

errk

k! tende a 0 (al divergere di k, con r ssato). Questo dimostra che ‖f (k)‖∞,(−r,r) k!rk,

che per la Proposizione 1.2.37 garantisce la rappresentabilità di ex tramite la sua seriedi potenze nell'insieme (−r, r). Visto che r è arbitrario, la rappresentabilità di fatto èdimostrata in R.Le altre identità sono dimostrate in modo analogo.

Queste identità presuppongono l'aver denito ex (risp. sinx, cosx) come quella funzioneche soddisfa l'equazione dierenziale y′ − y = 0 (risp. y′′ + y = 0) con condizione inizialey(0) = 1 (risp. y(0) = 0, y′(0) = 1 per il seno e y(0) = 1, y′(0) = 0 per il coseno). In realtàsarebbe del tutto logico usare l'identità per denire le funzioni e ritrovare a posteriori leusuali proprietà di queste funzioni a partire da queste rappresentazioni in serie di potenze.Questo modo di procedere ha il vantaggio di essere completamente analitico (senza l'uso adesempio della circonferenza goniometrica o di altri artici geometrici). L'unico punto di unaqualche complessità è dimostrare l'esistenza di π, ovvero di un numero in cui sinπ = 0, e la2π periodicità di seno e coseno. La cosa è però perfettamente possibile e chi è interessatopuò trovare questa trattazione nelle prime pagine di [R1].

Esercizio 1.2.40. Utilizzando la loro rappresentazione in serie di potenze, vericare leidentità seguenti:

i. ex · ey = ex+y,

ii. sin(x+ y) = sinx cos y − cosx sin y,

iii. eix = cosx+ i sinx.

Page 30: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

30 CAPITOLO 1. SUCCESSIONI E SERIE DI FUNZIONI

Osservazione 1.2.41. A stretto rigore l'ultima identità esula dalla nostra trattazione delleserie di potenze, poiché abbiamo sempre assunto che le funzioni oggetto della trattazionefossero di variabile reale e a valori reali. Un momento di riessione mostra però che di Rabbiamo sempre e solo usato la struttura di campo e la completezza come spazio metrico. Inparticolare tutti i teoremi dimostrati restano validi se i coecienti akk∈N e la variabilex che appaiono in

∑∞k=0 akx

k sono presi in C: l'unica dierenza è che ora la regione diconvergenza individuata dal raggio sarà il disco aperto x ∈ C : |x| < ρ, anziché il solosegmento (−ρ, ρ). In particolare, le identità del Teorema 1.2.39 risultano valide anchequando le funzioni sono immaginate di variabile complessa. È a tale estensione che siriferisce l'identità (iii.) dell'esercizio.

Page 31: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 2

Funzioni implicite

2.1 Premessa

Supponiamo sia data una funzione f : Ω ⊆ Rm → R, chiamiamo luogo degli zeri di fl'insieme

Zf := x ∈ Ω: f(x) = 0.L'obiettivo di questo capitolo è fornire risultati che consentano di descrive Zf per opportuneclassi di funzioni.

Osservazione 2.1.1.

i. L'unione (anche molteplice) e l'intersezione di luoghi di zeri sono a loro volta luogo dizeri: infatti, se Zf = x : f(x) = 0 e Zg = x : g(x) = 0 allora Zf ∪ Zg = Zf ·g eZf ∩ Zg = Zf2+g2 .

ii. Ogni graco di funzione è il luogo degli zeri di una qualche funzione; infatti, data lafunzione g, la funzione f(x, y) := y − g(x) ha per luogo degli zeri proprio il graco di g.

iii. In generale i luoghi di zeri non sono graci di funzioni, ad esempio la circonferenza dicentro (0, 0) e raggio 1 è il luogo degli zeri di x2 + y2 − 1 ma non è il graco di alcunafunzione.

L'obiettivo dei prossimi teoremi è dimostrare che se f è abbastanza buona allora Zf èlocalmente il graco di una funzione. Per esempio:

x

y

La porzione a tratto continuo è il graco diy =√

1− x2.

x

y

La porzione a tratto continuo è il graco dix =

√1− y2.

31

Page 32: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

32 CAPITOLO 2. FUNZIONI IMPLICITE

In seguito vedremo che senso dare all'espressione informale funzione buona. Possiamoperò anticipare già ora che esso non si riferisce alla sola regolarità di f : esistono funzionif di classe C∞ o addirittura analitiche, quindi decisamente regolari, che però non sonosucientemente buone.Il seguente risultato è decisamente elementare, tuttavia esso è di facile implementazionepoiché consente di determinare l'esistenza degli zeri sotto ipotesi molto deboli.

Proposizione 2.1.2. Data f : [a, b]× [c, d]→ R supponiamo:

1. ∀x ∈ [a, b], f(x, ·) : [c, d]→ R è continua e f(x, c) · f(x, d) < 0;

2. ∀x ∈ [a, b], f(x, ·) : [c, d]→ R è strettamente monotona.

Allora l'insieme degli zeri di f in [a, b] × [c, d] coincide con il graco di una funzioneφ : [a, b]→ [c, d].

Dimostrazione. Sia x0 ∈ [a, b] ssato. Dalla prima ipotesi (via il teorema degli zeri) segueche esiste almeno un punto in cui la funzione f(x0, ·) : [c, d]→ R si annulla, dalla secondaipotesi segue che esso è unico. Poiché questo vale per ogni x0 ∈ [a, b] si ha la tesi.

2.2 Teorema di Dini

Una volta stabilita l'esistenza della funzione φ vorremmo conoscerne la regolarità. Questainformazione è esattamente quanto fornito dal risultato seguente.

Teorema 2.2.1 (Dini monodimensionale). Sia f : Ω ⊆ R2 → R, con Ω aperto e f ∈ C1(Ω).Sia poi (x0, y0) ∈ Ω tale che:

i. f(x0, y0) = 0,

ii. ∂yf(x0, y0) 6= 0.

Allora esistono un rettangolo aperto (a, b)×(c, d) con (x0, y0) ∈ (a, b)×(c, d) e [a, b]×[c, d] ⊆Ω ed una funzione φ : (a, b)→ (c, d) tali che:

iii. il luogo degli zeri di f in (a, b)× (c, d) coincide con il graco di φ,

iv. la funzione φ è in C1((a, b)) ed

φ′(x) = −∂xf∂yf

(x, φ(x)) ∀x ∈ (a, b).

Dimostrazione. Assumiamo ∂yf(x0, y0) > 0 (altrimenti basta cambiare f con −f , cosache modica il segno della derivata senza modicare il luogo degli zeri). Visto che ∂yf ècontinua e che Ω è aperto, esiste [a′, b′] × [c, d] ⊆ Ω contenente il punto (x0, y0) in cui∂yf > 0.

Page 33: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.2. TEOREMA DI DINI 33

Ω

x

y

a′ b′

d

c

(x0, y0)

Consideriamo la restrizione di f lungo la retta x = x0, ovvero la mappa f(x0, ·) : [c, d]→ R.Essa vale 0 in y0 ed è strettamente crescente, quindi f(x0, c) < 0 e f(x0, d) > 0. Ma f ècontinua perciò esiste U((x0, c)) dove f < 0 ed esiste U((x0, d)) dove f > 0. Allora esiste[a, b] con a′ ≤ a < x0 < b ≤ b′ in cui f(x, c) < 0 e f(x, d) > 0 per ogni x ∈ [a, b].

a′ b′

d

c

(x0, y0)

+

a′ b′

d

c

(x0, y0)

+

a′ b′

d

c

a b

(x0, y0)

−−−

+ + +

Ristretta ad [a, b] × [c, d] la funzione f soddisfa le ipotesi della Proposizione 2.1.2, perciòesiste φ : [a, b]→ [c, d] tale che il luogo degli zeri di f in [a, b]× [c, d] coincide con il gracodi φ. Si osservi che non vi sono zeri sui lati [a, b] × c e [a, b] × d del rettangolo, cosìche la mappa φ è in realtà a valori in (c, d). È quindi possibile considerare φ come mappada (a, b) in (c, d) (in questo modo sia il dominio che il codominio sono aperti, cosa chesemplica la dimostrazione della regolarità di φ).Dimostriamo ora la regolarità della funzione φ. Sia x ∈ (a, b) ssato e sia h 6= 0 maabbastanza piccolo perché si abbia comunque x+h ∈ (a, b). La funzione f si annulla sia in(x, φ(x)) che in (x+ h, φ(x+ h)) (per come è stata costruita φ), e inoltre è C1(Ω), quindiper il teorema di Lagrange si ha

0 = f(x+ h, φ(x+ h))− f(x, φ(x)) = 〈∇f(α, β), (h, φ(x+ h)− φ(x))〉,

dove (α, β) è un punto opportuno sul segmento congiungente (x, φ(x)) e (x+ h, φ(x+ h)).

(x, φ(x))

(x+ h, φ(x+ h))

(α, β)

Perciò:(φ(x+ h)− φ(x)) · ∂yf(α, β) + h∂xf(α, β) = 0

Page 34: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

34 CAPITOLO 2. FUNZIONI IMPLICITE

ovvero

φ(x+ h)− φ(x) = −∂xf∂yf

(α, β) · h (2.1)

(questa relazione è corretta perché sappiamo che ∂yf(α, β) 6= 0 visto che (α, β) ∈ [a, b] ×[c, d] e che ∂yf non si annulla in questo rettangolo). Ma ∂xf

∂yfè continua in [a, b] × [c, d]

(quoziente di funzioni continue e denominatore diverso da zero) e [a, b]×[c, d] è un compatto.Questo garantisce l'esistenza del numeroM := ‖∂xf∂yf

‖∞,[a,b]×[c,d], e visto che (α, β) ∈ [a, b]×[c, d] da (2.1) segue che

|φ(x+ h)− φ(x)| ≤M · |h|.

Questa relazione mostra che φ è lipschitziana in x e quindi in particolare che è continua.Questo implica che se h→ 0 allora (α, β)→ (x, φ(x)). Insieme alla continuità di ∂xf∂yf questo

garantisce che limh→0∂xf∂yf (α, β) esiste e vale ∂xf

∂yf(x, φ(x)). Così

φ(x+ h)− φ(x)

h= −∂xf

∂yf(α, β)→ −∂xf

∂yf(x, φ(x)),

che dimostra sia la derivabilità di φ in x sia la formula φ′(x) = −∂xf∂yf

(x, φ(x)). Poiché x èstato scelto ad arbitrio in (a, b), di fatto la formula è valida in tutto (a, b). L'uguaglianzaallora mostra anche che φ′ è continua, perché la funzione−∂xf

∂yf(x, φ(x)) risulta composizione

di mappe continue.

Corollario 2.2.2. Supponiamo valide le ipotesi e le notazioni del teorema precedente. Sepoi f ∈ Ck(Ω), allora φ è di classe Ck((a, b)).

Dimostrazione. La dimostrazione è per induzione su k. La tesi vale per k = 1 in virtù delteorema. Sia inoltre k > 1, e che la la tesi sia già stata dimostrata per tutti gli ordini noa k − 1. consideriamo la relazione

φ′(x) = −∂xf∂yf

(x, φ(x)),

il cui lato destro esprime una funzione di classe Ck−1, poiché composizione delle derivateparziali di f (che sono di classe Ck−1) e della φ (che è di classe Ck−1 per ipotesi induttiva).Ma allora φ′ è di classe Ck−1, ovvero φ è di classe Ck.

Osservazione 2.2.3. Il Teorema 2.2.1 assume (tra le altre cose) che ∂yf(x0, y0) 6= 0, maè facilmente adattabile alla situazione in cui si abbia invece ∂xf(x0, y0) 6= 0: in tal casoinfatti basta scambiare il ruolo delle coordinate x ed y e concludere che sotto la nuovaipotesi risulta garantita l'esistenza di una funzione ψ : (c, d)→ (a, b) per la quale l'insiemex = ψ(y) coincide localmente col luogo degli zeri di f . In sostanza, quindi, il teorema diDini fornisce informazioni sul luogo degli zeri ogni qual volta almeno una delle derivateparziali è diversa da zero (e lo descriverà come graco di una y funzione di x quando∂yf(x0, y0) 6= 0, di x funzione di y quando ∂xf(x0, y0) 6= 0, ed in entrambi i modi quandoentrambe le derivate sono diverse da zero). Ciò porta a denire critici quei punti che oltread essere zeri di f sono anche zeri del gradiente di f : sono questi i punti in cui il luogodegli zeri non può essere studiato con il teorema di Dini.

Page 35: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.2. TEOREMA DI DINI 35

Esempio 2.2.4.

• Sia f(x, y) = x2 − y2. Allora f(0, 0) = 0 ma ∇f(0, 0) = (0, 0). In questo caso l'insiemedegli zeri di f è l'unione delle rette y = x e y = −x che in un intorno di (0, 0) non è ilgraco di una funzione.

x

y

• Sia f(x, y) = x2 + y2. Allora f(0, 0) = 0 ma ∇f(0, 0) = (0, 0). In questo caso il luogodegli zeri di f è il solo punto (0, 0) che non è un graco di una qualche funzione (che siadenita in un aperto).

• Sia f(x, y) = y2 − x2(x + 1). Allora f(0, 0) = 0 ma ∇f(0, 0) = (0, 0). Anche in questocaso il luogo degli zeri non è il graco di alcuna funzione in un intorno aperto di (0, 0).

x

y

Osserviamo che la dimostrazione precedente può essere facilmente estesa al caso in cuif : Ω ⊆ Rm × R → R, ovvero al caso in cui la variabile x varia nello spazio vettoriale Rmanziché nel campo scalare R. Essa non può invece essere (facilmente) adattata al caso incui anche la variabile y vari nello spazio vettoriale Rn (con n > 1). Infatti, l'argomentoche abbiamo usato utilizza il fatto che (sotto certe ipotesi) le restrizioni verticali f(x, ·)assumono valori di segno opposto e che quindi (per la continuità) debba esistere uno zero inmezzo. Questa aermazione ha senso in R perché in R gli unici connessi sono gli intervalli,e questo fatto collega la relazione d'ordine (che ci consente di dare senso al termine inmezzo) alla proprietà topologica di connessione. In Rn con n > 1, invece, questo legameviene meno (gli intervalli non sono gli unici connessi di Rn se n > 1) e la dimostrazione nonè più possibile. Il teorema di Dini è però comunque valido anche nella forma più generale:questo è appunto la tesi contenuta nel Teorema 2.5.1 che dimostreremo più avanti seguendoperò un approccio diverso.

Page 36: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

36 CAPITOLO 2. FUNZIONI IMPLICITE

2.3 Contrazioni e Teorema del punto sso

Ora ci prendiamo una pausa dal tema principale della sezione per discutere un importanterisultato negli spazi metrici completi. Con questo strumento riusciremo sia a generalizzare ilteorema di Dini sia, in seguito, a dimostrare l'esistenza ed unicità di soluzioni dei problemidi Cauchy.

Denizione 2.3.1. Sia (X, d) uno spazio metrico completo e T una mappa T : X → X.Diciamo che T è una contrazione se esiste λ < 1 tale che d(Tx, Ty) ≤ λd(x, y) per ognix, y ∈ X (ovvero se T è lipschitziana con costante di Lipschitz < 1).

Esercizio 2.3.2. Sia f : (a, b) ⊆ R → (a, b), di classe C1. Vericare che f è lipschitziana see solo se ‖f ′‖∞,(a,b) < +∞, ed è una contrazione se e solo se ‖f ′‖∞,(a,b) < 1.

Teorema 2.3.3 (BanachCaccioppoli). Sia (X, d) uno spazio metrico completo e T : X →X una contrazione. Allora l'equazione Tx = x ha una e una sola soluzione.

Dimostrazione. Sia x0 ∈ X scelto ad arbitrio ma ssato. Sia xnn∈N la successione denitaper ricorrenza ponendo xn+1 = Txn per ogni n ≥ 1, ovvero la successione

xn = T . . . T︸ ︷︷ ︸n volte

x0.

Dalla disuguaglianza triangolare e dalla ipotesi secondo cui T è una contrazione segue che

d(x, y) ≤ d(x, Tx) + d(Tx, Ty) + d(Ty, y) ≤ d(x, Tx) + λd(x, y) + d(Ty, y),

e quindi che

d(x, y) ≤ 1

1− λ(d(x, Tx) + d(y, Ty)). (2.2)

Osserviamo inoltre che iterando la denizione di contrazione si ha la stima

d(xn+1, xn) = d(Txn, Txn−1) ≤ λd(xn, xn−1) ≤ · · · ≤ λnd(x1, x0). (2.3)

Applicando quindi (2.2) ed (2.3) ai punti xn e xm otteniamo che

d(xn, xm) ≤ 1

1− λ(d(xn, Txn) + d(xm, Txm)) ≤ λn + λm

1− λd(x1, x0). (2.4)

Fissiamo ε > 0, e sia N : λN ≤ ε (tale N esiste, visto che λ < 1). Allora se m,n ≥ N si ha

d(xn, xm) ≤ ε · 2d(x1, x0)

1− λ

che dimostra che xnn∈N è una successione di Cauchy. La successione quindi converge,perché per ipotesi siamo in uno spazio metrico completo. Sia x∞ := limn→∞ xn. Allora

T (x∞) = T ( limn→∞

xn) = limn→∞

Txn = limn→∞

xn+1 = x∞

(al secondo passo abbiamo usato la continuità di T ) che mostra come x∞ sia un puntosso per T .Verichiamo ora l'unicità del punto sso. Siano x e y punti ssi. Allora dalla (2.2) si deduceche d(x, y) ≤ 1

1−λ(d(x, x) + d(y, y)) = 0 (in quanto Tx = x e Ty = y) e questo implica ched(x, y) = 0, ovvero che x = y.

Page 37: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.3. CONTRAZIONI E TEOREMA DEL PUNTO FISSO 37

Osservazione 2.3.4. È importante ricordare che la dimostrazione contiene un metodo co-struttivo per individuare x∞. Infatti, passando al limite nella (2.4) si deduce che

d(xn, x∞) = d(xn, limm→∞

xm) = limm→∞

d(xn, xm) ≤ λn

1− λd(x1, x0),

che dà una stima esplicita per la distanza di xn da x∞, in funzione dei dati. Nelle ap-plicazioni si può quindi generare una sequenza xnn∈N a partire da un x0 scelto a caso,ssare un parametro ε > 0 che rappresenta la precisione del calcolo, individuare un indiceN = N(ε) in corrispondenza del quale λN ≤ ε 1−λ

d(Tx0,x0) , ed usare xN come approssimazionedel punto sso x∞: il calcolo precedente mostra che xN dista da x∞ meno di ε.

Il teorema può essere generalizzato nel modo seguente.

Corollario 2.3.5. Sia (X, d) uno spazio metrico completo e T : X → X. Supponiamo cheesista k tale che T (k) = T . . . T (k volte) sia una contrazione. Allora T ha uno ed unsolo punto sso.

Dimostrazione. Sia x∞ il punto sso per T (k) (che esiste per via del Teorema 2.3.3). Allora

T (k)(Tx∞) = (T T · · · T︸ ︷︷ ︸k volte

)(Tx∞) = T (k+1)x∞ = T (T (k)x∞) = Tx∞,

perciò Tx∞ è un punto sso per T (k). Ma T (k) ha x∞ come unico punto sso quindiTx∞ = x∞, ovvero x∞ è punto sso per T . Inoltre, è evidente che ogni punto ssato da Tè ssato anche da T (k), quindi quello trovato è in eetti l'unico punto sso di T .

Osservazione 2.3.6. Se T è contrazione allora anche T (2) (mappa iterata due volte) ècontrazione visto che

d(T (2)(x), T (2)(y)) = d(T (Tx), T (Ty)) ≤ λd(Tx, Ty) ≤ λ2d(x, y),

e λ2 < λ < 1. Lo stesso vale per le iterate successive. La funzione T : R → R con T (x) =cosx è un esempio di mappa che non è contrattiva ma per la quale esiste una sua iterazione(nel suo caso basta T (2)(x) = cos(cosx)) che lo è. Questo esempio mostra che il corollarioprecedente non è banale perché eettivamente esistono mappe non contrattive con iteratacontrattiva.

Esempio 2.3.7. Il metodo di Newton è un algoritmo per determinare gli zeri di una funzionef : R→ R. L'idea di base è la seguente: dato un punto x0 scelto a caso sull'ascissa, si trovala tangente al graco nel punto (x0, f(x0)). L'intersezione della tangente con l'asse delleascisse darà un nuovo punto che sarà l'elemento x1 della successione che stiamo costruendo.Si ripete la costruzione precedente a partire da x1.

x

y

xnxn+1

Retta tangente al graco di f nel punto(xn, f(xn)): y = f ′(xn)(x − xn) + f(xn).Punto sulla tangente ad ordinata nulla: 0 =f ′(xn)(xn+1 − xn) + f(xn) ovvero

xn+1 = xn −f(xn)

f ′(xn).

Page 38: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

38 CAPITOLO 2. FUNZIONI IMPLICITE

Sotto opportune ipotesi su f (sostanzialmente che essa è di classe C2 e localmente stret-tamente monotona) e sulla scelta di x0 (sucientemente vicino ad x∞) si dimostra che lasuccessione xnn∈N eettivamente converge al punto x∞ in cui f si annulla.

Esercizio 2.3.8. Vogliamo trovare una soluzione di f(x) = 0 con f(x) = x3 + 2x − 1,utilizzando il metodo di Newton. Sia

T (x) := x− f(x)

f ′(x)= x− x3 + 2x− 1

3x2 + 2=

2x3 + 1

3x2 + 2.

La mappa T è eettivamente una contrazione come mappa da R→ R, ma la dimostrazionedi questa aermazione è complicata (in eetti la sua costante di Lipschitz vale 0.9732 . . .che essendo molto vicina ad 1 richiede una analisi molto accurata per essere determinata).Osserviamo però che T : [0, 1]→ [0, 1] e che in questo sottointervallo

T ′(x) =6x4+12x2−6x

(3x2 + 2)2=

1

2− 4+12x−12x2−3x4

2(3x2 + 2)2=

1

2− (4−3x4)+12x(1−x)

2(3x2 + 2)2≤ 1

2

T ′(x) = −1

2+

4−12x+36x2+21x4

2(3x2 + 2)2≥ −1

2+

4−12x+36x2

2(3x2 + 2)2≥ −1

2

quindi |T ′(x)| ≤ 12 .

Da Lagrange sappiamo che |T (x) − T (y)| = |T ′(ξ)| · |x − y| ≤ 12 |x − y| perciò T è una

contrazione come mappa [0, 1] → [0, 1]. Esiste quindi ed è unico il punto sso di T in[0, 1], ovvero la soluzione in [0, 1] di Tx = x, ovvero di f(x) = 0. Inoltre, sappiamo chese x0 è scelto a caso ed xnn∈N è la successione generata per induzione secondo la leggexn = Txn−1, allora si ha:

|xn − x∞| ≤(

12

)n1− 1

2

|x1 − x0| =1

2n−1

∣∣∣2x30 + 1

3x20 + 2

− x0

∣∣∣.Scegliendo x0 = 0 si ha:

x0 = 0 x1 = T (x0) = 0.5 x2 = T (x1) = 0.45454545 . . .

x3 = T (x2) = 0.45339833 . . . x4 = T (x3) = 0.45339765 . . . x5 = T (x4) = 0.45339765 . . .

La successione sembra convergere più velocemente di quanto stimato. Ciò però non è dovutaad una stima ineciente di T ′(x): in eetti sup[0,1] |T ′(x)| = T ′(1) = 12

25 = 0.48, moltovicino alla nostra stima di 0.5. Il vero motivo è invece il seguente. Sia x∞ la radice cercata;dalla denizione ricorsiva di xn+1, dal fatto che x∞ è una radice di f e sviluppando f alsecondo ordine si ottiene che

xn+1 − x∞ = (xn − x∞)− f(xn)− f(x∞)

f ′(xn)= − f ′′(ζ)

2f ′(xn)(xn − x∞)2

dove ζ è un qualche punto tra xn ed x∞, ed in particolare è in [0, 1]. Visto che f(x) =x3 + 2x− 1, questa relazione diventa

|xn+1 − x∞| ≤∣∣∣ 6ζ

2(3x2n + 2)

∣∣∣(xn − x∞)2 ≤ 3

2(xn − x∞)2.

Iterando la disuguaglianza (o per induzione), si ricava che

|xn+1 − x∞| ≤2

3

∣∣∣32

(x1 − x∞)∣∣∣2n ∀n.

Page 39: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.4. TEOREMA DI INVERTIBILITÀ LOCALE 39

La sequenza precedente ha x1 = 1/2 e x∞ ∈ [0, 1], quindi per essa si ha |x1 − x∞| ≤ 1/2,e così la disuguaglianza precedente fornisce la stima:

|xn+1 − x∞| ≤2

3

(3

4

)2n

∀n.

Questa stima dimostra che la convergenza è di fatto sovra-esponenziale.Il fatto che la convergenza sia sovra esponenziale è sostanzialmente merito della sceltadella mappa T fatta nel metodo di Newton e in particolare sarà possibile in un opportunointorno della radice x∞ di ogni funzione f che sia di classe C2 ed abbia f ′(x∞) 6= 0. Lascioai colleghi del corso di Analisi Numerica il piacere di tramutare questa osservazione in uneettivo teorema.

Esercizio 2.3.9. Cercare le soluzioni di f(x) = 0, dove f(x) = x5 + 4x− 4.

2.4 Teorema di invertibilità locale

Prima di enunciare e dimostrare il teorema è bene ricordare un paio di lemmi. Il primodimostra la proprietà di sub-moltiplicatività della norma euclidea di una matrice.

Lemma 2.4.1. Siano A = (ai,j)m,n ∈M(m× n,R) e sia

‖A‖2 := ‖(ai,j)‖2 :=( m∑i=1

n∑j=1

a2i,j

)1/2.

Allora ‖ · ‖2 è una norma in M(m × n,R) rispetto alla quale questo spazio è di Banach.Inoltre se poi B = (aj,l)n,k ∈M(n× k,R) (e quindi AB ∈M(m× k,R)) si ha

‖AB‖2 ≤ ‖A‖2 · ‖B‖2.

Ne segue che rispetto a quella norma lo spazioM(m×m,R) (le matrici quadrate) acquisiscela struttura di algebra di Banach.

Si osservi che nel caso n = 1 lo spazio M(m × 1,R) coincide (in realtà è isomorfo) conquello dei vettori di Rm e la norma di A ∈ M(n× 1,R) come matrice coincide con la suanorma euclidea come vettore.

Dimostrazione. È evidente che ‖ · ‖2 è nonnegativa e che si annulla solo per la matricenulla. Anche la omogeneità di ‖ · ‖2 è chiara. Per la subadditività osserviamo che dalladisuguaglianza di CauchySchwarz (usata in Rmn) segue che

‖A+A′‖22 = ‖(ai,j) + (a′i,j)‖22 = ‖(ai,j + a′i,j)‖22 =

m∑i=1

n∑j=1

(ai,j + a′i,j)2

= ‖A‖22 + 2

m∑i=1

n∑j=1

ai,ja′i,j + ‖A′‖22

≤ ‖A‖22 + 2[ m∑i=1

n∑j=1

a2i,j

]1/2[ m∑i=1

n∑j=1

a′2i,j

]1/2+ ‖A′‖22

= ‖A‖22 + 2‖A‖2‖A′‖2 + ‖A′‖22 =(‖A‖2 + ‖A′‖2

)2,

Page 40: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

40 CAPITOLO 2. FUNZIONI IMPLICITE

che è equivalente alla tesi.La completezza di M(m × n,R) con questa norma deriva immediatamente dal fatto cheM(m × n,R) è uno spazio vettoriale reale nito dimensionale, e che in tali spazi tutte lenorme sono equivalenti (per cui quella appena denita è equivalente ad esempio alla normadel sup).Analogamente, dalla disuguaglianza di CauchySchwarz (in Rn) segue che

‖AB‖22 =∥∥∥(

n∑j=1

ai,jbj,l)i,l

∥∥∥2

2=

m∑i=1

k∑l=1

∣∣∣ n∑j=1

ai,jbj,l

∣∣∣2 ≤ m∑i=1

k∑l=1

[ n∑j=1

a2i,j

][ n∑j=1

b2j,l

]

=[ m∑i=1

n∑j=1

a2i,j

][ k∑l=1

n∑j=1

b2j,l

]= ‖A‖22 · ‖B‖22.

Il secondo lemma mostra una proprietà simile, ma per funzioni a valori matriciali.

Lemma 2.4.2. Sia F : X →M(m× n,R). Poniamo

‖|F‖|2,∞,X :=( m∑i=1

n∑j=1

‖Fij‖2∞,X)1/2

.

Sia poi f : Ω ⊆ Rm → Rn con Ω aperto, di classe C1(Ω), e sia X ⊆ Ω un convesso. Allora

‖f(x)− f(w)‖2 ≤ ‖|Jf‖|2,∞,X · ‖x− w‖2 ∀x,w ∈ X.

Dimostrazione. Siano x,w ssati in X. Siano fj : Ω ⊆ Rm → R con j = 1, . . . , n le nfunzioni che danno le coordinate della funzione f , ovvero tali per cui f = (f1, f2, . . . , fn).Ogni fj è a valori scalari, e per il teorema di Lagrange fj(x) − fj(w) = 〈∇fj(α), x− w〉dove α sta nel segmento che congiunge x e w (qui si usa il fatto cheX è per ipotesi convesso,così il segmento è eettivamente tutto in X). Per CauchySchwarz:

|fj(x)− fj(w)|2 ≤ ‖∇fj(α)‖22 · ‖x− w‖22

e quindi

|fj(x)− fj(w)|2 ≤( m∑i=1

∥∥∥∂fj∂xi

∥∥∥2

∞,X

)· ‖x− w‖22.

Questo risultato vale per ogni j = 1, . . . , n e sommando le varie disuguaglianze al variaredi j otteniamo la tesi.

Teorema 2.4.3 (Invertibilità locale). Sia f : Ω ⊆ Rn → Rn, Ω aperto. Supponiamo f ∈C1(Ω) e sia x0 ∈ Ω con Jf(x0) invertibile. Allora esiste un intorno U(x0) e un intornoV(f(x0)) aperti tali che f |U(x0) : U(x0) → V(f(x0)) è biunivoca con f−1 ∈ C1(V(f(x0))).Inoltre

(Jf−1)(f(x)) = [(Jf)(x)]−1 ∀x ∈ U(x0).

L'aperto V(f(x0)) può essere preso in modo da essere una bolla di centro f(x0).

Dimostrazione. La dimostrazione è un'applicazione del teorema di punto sso. Consideria-mo la funzione

f(x) := ((Jf)(x0))−1 · (f(x0 + x)− f(x0)),

Page 41: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.4. TEOREMA DI INVERTIBILITÀ LOCALE 41

che è ben denita in Ω := Ω − x0 (che è il traslato di Ω della quantità x0), perché((Jf)(x0))−1 esiste per ipotesi. Osserviamo che f(0) = 0 e che

(Jf)(0) = ((Jf)(x0))−1 · (Jf)(x0) = I.

D'altra partef(x) = (Jf)(x0) · f(x− x0) + f(x0),

e questa relazione evidenzia che f è invertibile in U(x0) se e solo se f è invertibile inU(x0)− x0. La relazione tra f e f può essere formalizzata scrivendo che

f = A f A′,

dove A è la mappa ane con Av := (Jf)(x0) · v + f(x0), e A′ è la mappa ane A′v :=v − x0. Sia A che A′ sono certamente invertibili, quindi f lo è se e solo se lo è f , conf−1 = A′−1 f−1 A−1.Procediamo anzitutto studiando f e vericando che essa è invertibile con inversa die-renziabile tra opportuni intorni di 0. Per seguire la dimostrazione si tenga presente ildiagramma seguente

U V := A−1(V)

U := A′−1(U) V

A′−1

f

AA′

f

A−1

in cui appaiono già i vari insiemi che andremo via via a denire. Ricordiamo che la mappaf soddisfa le proprietà: f(0) = 0 e (Jf)(0) = I. Sia

H(x) := x− f(x).

Si tratta di una funzione in C1(Ω), conH(0) = 0 e (JH)(0) = I−I = 0. Visto che le funzioniche forniscono le componenti della matrice JH sono continue, esiste ε > 0 sucientementepiccolo perché si abbia

‖|JH‖|2,∞,Bε ≤1

2,

dove Bε := x : ‖x‖ ≤ ε (bolla chiusa). Inoltre visto che det Jf è una funzione continua eche det Jf(0) = det I = 1, possiamo scegliere ε in modo che oltre alla relazione precedentesi abbia anche det Jf(x) 6= 0 per ogni x in Bε (su questo punto vedasi anche la Osserva-zione 2.4.4 successiva).Dato che ‖|JH‖|2,∞,Bε ≤

12 , dal Lemma 2.4.2 ricaviamo che:

‖H(x)−H(w)‖ ≤ 1

2· ‖x− w‖ ∀x,w ∈ Bε (2.5)

e così:

‖f(x)− f(w)‖ = ‖x− w − (H(x)−H(w))‖ ≥ ‖x− w‖ − ‖H(x)−H(w)‖

≥ ‖x− w‖ − 1

2‖x− w‖ =

1

2‖x− w‖

Page 42: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

42 CAPITOLO 2. FUNZIONI IMPLICITE

e quindi‖x− w‖ ≤ 2‖f(x)− f(w)‖ ∀x,w ∈ Bε. (2.6)

Questo mostra che f è iniettiva in Bε perché se f(x) = f(w) da (2.6) segue subito ‖x−w‖ ≤2 · 0 e quindi che x = w.Sia y ssato in Bε/2, ovvero con ‖y‖ ≤ ε

2 , e poniamo Hy(x) := y +H(x). Osserviamo che

‖Hy(x)‖ = ‖y +H(x)‖ ≤ ‖y‖+ ‖H(x)‖ = ‖y‖+ ‖H(x)−H(0)‖,

poiché H(0) = 0. Assumiamo ora che x ∈ Bε. Siccome ‖y‖ ≤ ε2 , dalla disuguaglianza

precedente e da (2.5) segue che

‖Hy(x)‖ ≤ ε

2+

1

2‖x− 0‖ ≤ ε

2+ε

2= ε.

Questo dimostra che Hy : Bε → Bε. Inoltre

Hy(x)−Hy(w) = y +H(x)− y −H(w) = H(x)−H(w)

e così da (2.5) segue che

‖Hy(x)−Hy(w)‖ = ‖H(x)−H(w)‖ ≤ 1

2‖x− w‖.

Questo dimostra che Hy è una contrazione su Bε, il quale è uno spazio di Banach rispettoalla metrica euclidea (perché Rn lo è ed Bε è un chiuso in Rn). Per il teorema di BanachCaccioppoli allora Hy ha in Bε un (unico) punto sso. Ovvero esiste un (unico) x ∈ Bε

tale che:

Hy(x) = x ⇔ y +H(x) = x ⇔ y + x− f(x) = x ⇔ y = f(x).

Questo dimostra che ogni y ∈ Bε/2 è immagine di un (e uno solo) punto x ∈ Bε. Per poterprocedere occorre anzitutto vericare che la stessa tesi vale anche tra le rispettive bolleaperte. In eetti osserviamo che se x e y sono come sopra, allora

‖x‖ = ‖y + x− f(x)‖ = ‖y +H(x)‖ ≤ ‖y‖+ ‖H(x)‖ ≤ ‖y‖+1

2‖x‖. (2.7)

Questo mostra che ‖x‖ ≤ 2‖y‖. In particolare se y ∈ Bε/2 (aperto), ovvero se ‖y‖ < ε2 ,

allora ‖x‖ < ε, così che ogni punto y dell'aperto Bε/2 ha una controimmagine x nell'aperto

Bε. Questo non è ancora suciente (purtroppo!), perché non è detto che f(Bε) ⊆ Bε/2,ma si può gestire quest'ultima dicoltà abbastanza facilmente. Sia V una bolla aperta,centrata in f(x0) e di raggio suciente piccolo perché l'insieme V := A−1(V) sia contenutoin Bε/2. Una tale bolla esiste sicuramente visto che A−1 è anch'essa una mappa ane (e

quindi manda bolle in ellissoidi) e manda f(x0) in 0. L'insieme V contiene 0 ed è anch'essoun aperto, visto che è l'immagine di un aperto tramite una mappa ane invertibile. SiaU := Bε ∩ f−1(V). L'insieme U è aperto (intersezione di aperti), 0 ∈ U (perché f(0) = 0quindi 0 è nella controimmagine di 0 tramite f), f è iniettiva su U (perché lo è su Bε), fmanda U in V (evidente) ed è suriettiva su V (perché sappiamo che per ogni y ∈ Bε/2 esisteun x ∈ Bε tale che f(x) = y). Quindi abbiamo trovato due aperti U e V tali che f : U → Vè biunivoca, e se poniamo U := A′−1U , allora di fatto abbiamo trovato gli aperti U e V taliche f : U → V è biunivoca. Si osservi che con questa scelta V è una bolla aperta (mentre

Page 43: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.4. TEOREMA DI INVERTIBILITÀ LOCALE 43

V è un ellissoide aperto).Sia f−1 : V → U l'inversa di f tra questi insiemi. Allora (2.6) dice che in V, posto x :=f−1(y) e w := f−1(z), vale:

‖f−1(y)− f−1(z)‖ ≤ 2‖y − z‖ (2.8)

ovvero che f−1 è lipschitziana. Mostriamo che f−1 è in realtà dierenziabile e che J(f−1) =(Jf)−1. Dal fatto che f è dierenziabile in x ∈ Ω segue che:

f(w)− f(x) = (Jf)(x) · (w − x) +R(w, x) (2.9)

con‖R(w, x)‖‖w − x‖

→ 0 per w → x. (2.10)

Da (2.9) segue che

f−1(z)− f−1(y) = w − x = (Jf(x))−1 · (z − y)− (Jf(x))−1 ·R(w, x), (2.11)

perché Jf(x) è invertibile quando x ∈ Bε. Supponiamo z → y. Allora w = f−1(z) →f−1(y) = x perché (2.8) dice che f−1 è continua. Inoltre:

‖R(w, x)‖‖z − y‖

=‖R(w, x)‖‖w − x‖

· ‖w − x‖‖z − y‖

=‖R(w, x)‖‖w − x‖

· ‖f−1(z)− f−1(y)‖‖z − y‖

.

Per la (2.8) il secondo fattore è limitato da 2, quindi

‖R(w, x)‖‖z − y‖

≤ 2‖R(w, x)‖‖w − x‖

→ 0

per la (2.10). Ma allora (usando la sub-moltiplicatività della norma, ovvero Lemma 2.4.1)

‖(Jf(x))−1 ·R(w, x)‖‖z − y‖

≤ ‖(Jf(x))−1‖2 ·‖R(w, x)‖‖z − y‖

ed il secondo fattore tende a zero quando z → y per quanto appena vericato (mentre ilprimo fattore resta costante). Questo e (2.11) mostrano che f−1 è dierenziabile in y con(J(f−1))(y) = ((Jf)(x))−1 = ((Jf)(f−1(y)))−1.Osserviamo che le funzioni che compongono Jf sono continue e il suo determinante èdiverso da 0 quindi gli elementi della matrice (Jf)−1(x) sono certamente funzioni continuedi x. Visto che x = f−1(y) e che f−1 è continua ne segue che (J(f−1))(y) = (Jf)−1(f−1(y))è funzione continua di y.Inne, dal fatto che f = A′fA′ con A e A′ ani e invertibili, segue che anche f

∣∣U : U → V

è invertibile con inversa di classe C1, e la formula per lo jacobiano di f−1 indicata nelteorema segue immediatamente dall'uguaglianza J(f−1) = (Jf)−1 appena dimostrata.

Osservazione 2.4.4. Nella dimostrazione precedente abbiamo chiesto che ε sia abbastanzapiccola da garantire sia che ‖|JH‖|2,∞,Bε ≤

12 , sia l'invertibilità della matrice Jf(x) per

ogni x ∈ Bε. In realtà la seconda richiesta è automaticamente soddisfatta una volta che siasoddisfatta la prima. Questo accade perché Jf(x) = I−JH(x), e quindi è una matrice dellaforma I−A con ‖A‖2 ≤ 1

2 . La norma che abbiamo introdotto nella matrici M(n× n,R) è

Page 44: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

44 CAPITOLO 2. FUNZIONI IMPLICITE

una norma sub-moltiplicativa (vd. 2.4.1) così ‖Ak‖2 ≤ ‖A‖k2 per ogni intero k, e nel casoin cui ‖A‖2 ≤ 1

2 , si ha∞∑k=0

‖Ak‖2 ≤∞∑k=0

‖A‖k2 ≤∞∑k=0

1

2k= 2.

Per il test di Weierstrass questo basta a dimostrare la convergenza della serie∑∞

k=0Ak

(perché sappiamo cheM(n×n,R) con quella norma risulta essere un'algebra reale normatae di Banach). Ma allora dalla identità

(I−A)∞∑k=0

Ak =∞∑k=0

Ak −∞∑k=0

Ak+1 =∞∑k=0

Ak −∞∑k=1

Ak = I

deduciamo il fatto che I−A è eettivamente invertibile, con∑∞

k=0Ak quale inversa.

Corollario 2.4.5. Sia f : Ω ⊆ Rn → Rn, Ω aperto e f ∈ C1(Ω). Supponiamo che Jf(x)sia invertibile per ogni x ∈ Ω. Allora f è una mappa aperta, ovvero l'immagine f(A) diogni insieme aperto A è un insieme aperto.

Dimostrazione. Per il teorema f è localmente invertibile in ogni punto con inversa continua,e questo dà la tesi.

Osservazione 2.4.6. Il teorema dimostra che se F : Ω ⊆ Rn → Rn è di classe C1 con JFinvertibile in un punto x0, allora F è localmente biunivoca con inversa C1 e J(F−1) =(JF )−1. Viceversa, supponiamo che F sia di classe C1, localmente biunivoca in x0 e coninversa locale di classe C1. Allora dierenziando le identità

(F−1 F )(x) = Id(x) = x (F F−1)(y) = Id(y) = y

si ottieneJ(F−1)(F (x)) · JF (x) = I JF (x) · J(F−1)(F (x)) = I

che dimostrano che JF (x0) è invertibile con inversa J(F−1)(F (x0)). In altre parole, ilteorema mostra che per mappe di classe C1 l'invertibilità locale è equivalente all'invertibilitàpuntuale della matrice jacobiana.

Osservazione 2.4.7. L'invertibilità locale in tutti i punti di per sé non implica l'invertibilitàglobale. Ad esempio si consideri la mappa

f : R2\0 → R2\0, f(x, y) :=

[x2 − y2

2xy

].

Questa funzione non è globalmente invertibile perché f(−x,−y)=f(x, y), ma è localmenteinvertibile in ogni punto di R2\0 visto che Jf(x, y) =

[ 2x −2y2y 2x

]ha determinante diverso

da 0 in ogni punto di R2\0.Quali ipotesi aggiungere a quella di avere Jf invertibile in ogni punto, per passare dallainvertibilità locale a quella globale? Il teorema di Hadamard e Caccioppoli aerma che nelcaso in cui f : X → Y con X ed Y spazi metrici connessi ed Y è semplicemente connesso edf è continua, localmente invertibile allora f è globalmente invertibile con inversa continuase e solo se è propria (ovvero f−1(K) è compatto per ogni compatto K). Tale risultato fudimostrato da Hadamard in Rn e successivamente esteso da Caccioppoli agli spazi metrici;tale estensione ha fatto di questo risultato uno degli strumenti di base per la risoluzionedi vari problemi dierenziali (vd. [AP] e [DeMGZ]).

Page 45: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.5. TEOREMA DI DINI MULTIDIMENSIONALE 45

2.5 Teorema di Dini multidimensionale

Teorema 2.5.1 (Dini). Sia f : Ω ⊆ Rm × Rn → Rn, con Ω aperto e f ∈ C1(Ω). Sia poi(x0, y0) ∈ Ω (con x0 ∈ Rm ed y0 ∈ Rn) tale che

i. f(x0, y0) = 0,

ii. la matrice (Jyf)(x0, y0) (che è la sottomatrice quadrata di ordine n × n della matri-ce Jacobiana di f ottenuta considerando le derivate di f rispetto alle variabili y) èinvertibile.

Allora esistono due intorni aperti U(x0) e V(y0) con U(x0)× V(y0) ⊆ Ω tali che

iii. l'insieme degli zeri che f ha in U(x0) × V(y0) coincide con il graco di una funzioneφ : U(x0)→ V(y0),

iv. φ è di classe C1(U(x0)) e

Jφ(x) = −[(Jyf)−1 · (Jxf)

](x,φ(x))

per ogni x ∈ U(x0).

Ricordiamo che per ogni matrice quadrata della forma M :=[I 0A B

]con B quadrata, si

ha detM = det I · detB, così che M è invertibile se e solo se B è invertibile. In tal casol'inversa è M−1 =

[ I 0−B−1A B−1

].

Dimostrazione. Sia F : Ω ⊆ Rm × Rn → Rm × Rn denita come

F (x, y) :=

[x

f(x, y)

].

Osserviamo che F ∈ C1(Ω), che F (x0, y0) =[ x0

0

]e che

JF =

[I 0Jxf Jyf

].

In particolare

(JF )(x0, y0) =

[I 0

Jxf(x0, y0) Jyf(x0, y0)

]è invertibile per ipotesi. Quindi per il Teorema 2.4.3 F è localmente invertibile in (x0, y0),ovvero esistono due intorni aperti W(x0, y0) e S(x0, 0) tra i quali F agisce come un dieo-morsmo, con S(x0, 0) che di fatto è una bolla aperta di centro (x0, 0).Sia U un intorno aperto di x0 in Rm per il quale esiste un intorno aperto R di 0 in Rntali che U × R ⊆ S (gli intorni U ed R esistono, visto che S è una bolla aperta). Siai : Rm → Rm × Rn, i(x) :=

[x0

](immersione) e sia pry : Rm × Rn → Rn, pry

([ xy

]):= y

(proiezione). Inne sia V la proiezione sulle y di W: Anche V è un aperto perché la proie-zione è una mappa aperta.Costruiamo la mappa φ nel modo seguente:

φ : U −→ V,

x 7→ φ(x) := (pry F−1 i)(x).

Il diagramma seguente visualizza la costruzione di φ:

Page 46: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

46 CAPITOLO 2. FUNZIONI IMPLICITE

W

(x0, y0)

pry

V

S

U ×R(x0, 0)

i

U

F

F−1

φ

Osserviamo che φ è di classe C1 (perché pry e i lo sono in quanto lineari, e F−1 lo è per ilteorema di invertibilità locale) e con

Jφ = (J pry) · (JF−1) · (Ji) =[0 I

]· (JF )−1 ·

[I0

]=[0 I

]·[

I 0−(Jyf)−1Jxf (Jyf)−1

] [I0

]= −(Jyf)−1Jxf.

Osserviamo che F è l'identità sulle prime m coordinate, quindi x = prx(F−1([

x0

])). Così

F (x, φ(x)) = F(

prx

(F−1

([x0

])),pry

(F−1

([x0

])))= F

(F−1

([x0

]))=

[x0

]e quindi

f(x, φ(x)) = pry(F (x, φ(x))) = pry

([x0

])= 0,

ovvero il graco di φ è contenuto negli zeri di f .D'altra parte, sia (x, y) ∈ U × V uno zero di f . Allora x ∈ U ed

i(x) =

[x0

]=

[x

f(x, y)

]= F (x, y).

Visto che x ∈ U , dalla denizione di U e di R segue che i(x) ∈ S. Possiamo quindi applicareF−1 a questa relazione, ottenendo

φ(x) = (pry F−1 i)(x) = pry((F−1 i)(x)) = pry((F

−1(F (x, y))) = pry(x, y) = y

che dimostra come lo zero sia sul graco di φ.

Osservazione 2.5.2. Nella formulazione del teorema si assume che una volta decomposto lospazio di partenza Rm+n come Rm×Rn, lo jacobiano di f relativo alle ultime n coordinate(quindi una matrice n × n) sia invertibile. In realtà il teorema può essere generalizzatoassumendo solo che Jf(x0, y0) sia di rango massimo (quindi n, visto che Jf(x0, y0) èuna matrice (m + n) × n): questa ipotesi infatti garantisce l'esistenza in Jf(x0, y0) diuna sottomatrice n × n invertibile, ed il teorema dimostra la possibilità di esprimere le ncoordinate che corrispondo alle colonne di questa sottomatrice come funzione delle altre m.Per la dimostrazione di questa generalizzazione basta osservare che essa segue dal teoremacosì come è stato formulato, applicandola non ad f ma ad f composta una opportunapermutazione delle coordinate dello spazio di partenza Rm+n.

Page 47: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.6. ESTREMI VINCOLATI 47

Come già mostrato nel caso scalare, anche nel caso generale dalla formula per lo Jacobianoenunciata al punto iv. del Teorema 2.5.1 discende il seguente risultato di regolarità.

Corollario 2.5.3. Supponiamo valide le ipotesi e le notazioni del teorema precedente. Sepoi f ∈ Ck(Ω), allora φ è di classe Ck(U).

2.6 Estremi vincolati

Data f : Ω ⊆ Rm → R e Σ ⊆ Ω una regione. Sia p ∈ Σ e supponiamo che f(p) =maxf(x) : x ∈ Σ ∩ U(p). In tal caso diciamo che p è un punto di massimo locale per fvincolata a Σ. Analoga denizione per il minimo locale vincolato.

Ω

Σ

p U

Sappiamo già come individuare un tale punto qualora Σ∩U(p) sia un insieme aperto in Rm:in questo caso infatti se f è in C1Ω allora p è tra gli zeri di ∇f . La situazione è però nuovaqualora Σ∩U(p) non sia un aperto: in questo caso infatti in genere ∇f(p) 6= 0 nonostantep e la ricerca degli estremanti di f ristretta a Σ è quindi in tal caso un obiettivo per laquale al momento non abbiamo alcuna procedura e se arontato con questa generalità difatto è destinato a restare insoluto.Il problema può però essere validamente risolto qualora Σ sia il graco di una qualchefunzione, procedendo nel modo seguente. Per ssare le idee supponiamo che f : Ω ⊆ R2 →R, con Ω aperto e f ∈ C1(Ω), e che Σ = Γφ sia il graco di φ con φ : (α, β) → (γ, δ)anch'essa di classe C1. Allora la restrizione di f a Σ, è f |Γφ(x) = f(x, φ(x)) che è C1((α, β)).Se p = (xp, yp) è estremante per f |Γφ allora xp è estremante per x 7→ f(x, φ(x)), quindi

∂f

∂x+∂f

∂y

∂φ

∂x=

d

dxf(x, φ(x)) = 0 in xp.

Ponendo λ := −∂f∂y (xp, yp) questa relazione diventa

∂f∂x = λ∂φ∂x∂f∂y = λ · (−1).

Se dunque introduciamo la funzione g(x, y) := φ(x)− y, allora Γφ è il luogo degli zeri di ge il sistema diventa

∇f = λ∇gg(x, y) = 0.

È in questa forma che il problema si generalizza.

Page 48: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

48 CAPITOLO 2. FUNZIONI IMPLICITE

Teorema 2.6.1 (Moltiplicatori di Lagrange). Sia f : Ω ⊆ Rm → R, con Ω aperto ef ∈ C1(Ω). Sia Σ il luogo degli zeri di g : Ω→ Rn (con m > n) e g ∈ C1(Ω). Sia p ∈ Σ unpunto di massimo/minimo locale vincolato a Σ per f e supponiamo che il rango di Jg(p),lo jacobiano di g, sia massimo (e quindi uguale ad n). Allora esistono λ1, . . . , λn ∈ R taliche

∇f(p) = λ1∇g1(p) + · · ·+ λn∇gn(p) ← m equazioni scalari

g1(p) = 0... ← n equazioni scalari

gn(p) = 0

dove g =: (g1, . . . , gn). Si osservi che il sistema ha m+ n equazioni in m+ n incognite: lem coordinate di p più le n coordinate di λ.

Dimostrazione. Per ipotesi rk(Jg(p)) = n quindi esiste in Jg(p) una sottomatrice di ordinen×n invertibile. Senza perdita di generalità possiamo supporre che questa sottomatrice siaquella relativa alle ultime n coordinate, ovvero che Rm sia decomposto come Rm−nx × Rnye che Jyg(p) sia invertibile in quanto di rango n. Per Dini esistono gli intorni aperti U(xp)e V(yp) e una mappa φ : U(xp)→ V(yp) il cui graco coincide con Σ ∩ (U(xp)× V(yp)).Ma allora f |Σ∩U(p) coincide con x 7→ f(x, φ(x)), e questa è denita in U(xp) che è aperto.Questa mappa è C1 (per Dini) e ha un estremo in xp, quindi

∇(f(·, φ(·)))(xp) = 0. (2.12)

D'altra parte dalla formula di derivazione per le funzioni composte si ha

∇(f(·, φ(·))) = ∇f[IJφ

]= (∇xf,∇yf) ·

[I

−(Jyg)−1(Jxg)

]= (∇xf)− (∇yf)(Jyg)−1Jxg

(per semplicità a destra lo abbiamo omesso, ma comunque si ricordi che tutte le funzionisono valutate in (x, φ(x))), che valutata in xp e tenuto conto di (2.12) produce l'uguaglianza

(∇xf)(p) = (∇yf)(p)(Jyg)−1(p)(Jxg)(p). (2.13)

Poniamo(∇yf)(p)(Jyg)−1(p) =: (λ1, . . . , λn). (2.14)

Allora (2.13) diventa

∇xf(p) = λ1∇xg1(p) + · · ·+ λn∇xgn(p).

e la (2.14) moltiplicata a destra per Jyg dà

∇yf(p) = λ1∇yg1(p) + · · ·+ λn∇ygn(p).

Unendo queste due relazioni otteniamo il sistema della tesi.

Osservazione 2.6.2. In termini della funzione L : Ω × Rn → R denita da L(x, λ) :=f(x)− 〈λ, g(x)〉 il sistema può essere riscritto come

∇xL = 0

∇λL = 0ovvero ∇L = 0.

Page 49: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.6. ESTREMI VINCOLATI 49

Quindi il problema originale (cercare estremi vincolati per f) è diventato cercare estremiliberi per L. La funzione L è detta Lagrangiana del problema, ed assume un ruolo fonda-mentale nella descrizione della dinamica dei corpi poiché consente di formulare equazionidi moto che prescindono dal sistema di riferimento (ma questa è tutta un'altra storia,indubbiamente, e lascio ai colleghi sici-matematici il divertimento di insegnarvi questecose).

Osservazione 2.6.3. Il teorema fornisce solo un criterio necessario: non è detto che i puntitrovati risolvendo il sistema siano eettivamente estremanti. Per stabilirlo si possono usareconsiderazioni sulla compattezza del dominio (se il dominio è compatto, e si sono trovatidue soli punti stazionari vincolati, allora questi devono essere per forza il massimo ed ilminimo di f). In alternativa si può usare un'analisi al secondo ordine locale sulla restrizione;questa porta però a formulare criteri che solo persone decisamente motivate (o sull'orlo delladisperazione matematica) possono eettivamente prendere in considerazione.

Osservazione 2.6.4. C'è un altro modo di interpretare il teorema dei moltiplicatori, e cheè basato su semplici nozioni di geometria dierenziale.

i. Sia p ∈ Rm e siaEp := frecce uscenti da p.

L'insieme Ep, con la somma vettoriale data dalla regola del parallelogramma e il pro-dotto per uno scalare inteso come dilatazione, è uno spazio vettoriale di dimensionem.

p

u

v

u+ v

pu

3u

−2u

Esso supporta anche un prodotto scalare 〈·, ·〉p denito ponendo

〈u, v〉p := ‖u‖ · ‖v‖ ·

lunghezza (con segno) della proiezionedi u/‖u‖ su v/‖v‖, presa con segno +se la proiezione è equiversa con v/‖v‖ econ segno − altrimenti.

che risulta essere denito positivo.

ii. Sia g : Ω ⊆ Rm → Rn, con Ω aperto, m > n, e g ∈ C1(Ω). Sia poi p ∈ Ω con g(p) = 0e Jg(p) di rango n (quindi massimo). Sia Σ il luogo degli zeri di g e sia

TpΣ := spanv ∈ Ep che sono derivate in p di qualche cammino su Σ,

ovvero lo span delle frecce v per le quali esiste ε > 0 e

ψ : (−ε, ε)→ Σ di classe C1 e tale che ψ(0) = p, ψ′(0) = v.

TpΣ è lo spazio tangente a Σ in p e per costruzione è un sottospazio di Ep.

Page 50: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

50 CAPITOLO 2. FUNZIONI IMPLICITE

x y

z

Σp = ψ(0)

−εt

ε0

ψ

Si osservi che la denizione di TpΣ data non aerma che esso è l'insieme dalle frecceψ′(0), ma che esso è lo spazio generato dalle frecce ψ′(0). Questo perché dati duecammini ψ1 e ψ2 entrambi passanti per p ed entrambi in Σ, non è facile dimostrarel'esistenza di un cammino ψ anch'esso in Σ e passante per p con ψ′(0) = ψ′1(0)+ψ′2(0).Quindi se denissimo TpΣ come insieme non riusciremmo a dimostrare che esso è unospazio vettoriale. In realtà, anche se è complicato, è comunque possibile dimostrarel'esistenza ψ con quelle proprietà, e vericare quindi che l'insieme delle velocità deicammini in Σ e passanti per p è eettivamente uno spazio vettoriale. Per le nostreesigenze però possiamo permetterci di aggirare questa dicoltà e scoprire che TpΣ èuno spazio vettoriale perché è denito come lo span di una famiglia di vettori.

iii. Mostriamo che dalle ipotesi fatte su g segue che dimTpΣ ≥ m−n. Infatti tali ipotesiconsentono di utilizzare il teorema di Dini e di descrivere Σ localmente in p come gra-co di una funzione che a meno di riordinare le variabili possiamo immaginare dia lecoordinate xm−n+1, . . . , xn in funzione delle x1, . . . , xm−n. Per comodità di scritturaponiamo x := (x1, . . . , xm−n), e con φ la mappa che fornisce le xm−n+1, . . . , xn. Cor-rispondentemente siano xp ∈ Rm−n e yp ∈ Rn le coordinate di p decomposte in modocoerente con questa descrizione (così che yp = φ(xp)). Inne, per ogni j = 1, . . . ,m−nsia

ej := (0, . . . , 0,

j∨1, 0, . . . , 0)︸ ︷︷ ︸

m−n

il j-esimo versore di Rm−n. Osserviamo che le curve

ψj : t → (xp + tej , φ(xp + tej)) j = 1, . . . ,m− n

risultano ben denite in U(0), sono di classe C1, passano per p al tempo t = 0 e lofanno con velocità

ψ′j(0) = (ej , ∂xjφ(xp)),

che quindi è un vettore di TpΣ. Al variare di j questi sono m−n vettori linearmenteindipendenti (perché le loro prime m − n coordinate sono gli e1, e2, . . . , em−n, chesono indipendenti), e questo mostra che dimTpΣ ≥ m− n.

iv. Sia ora ψ : (−ε, ε) una curva su Σ di classe C1 e ψ(0) = p. Siano g1, . . . , gn le nfunzioni scalari che danno le coordinate di g. Visto che la curva è su Σ si ha che(g1 ψ)(t) = 0 per ogni t. In particolare

0 =d(g1 ψ)

dt(0) = 〈∇g1(p), ψ′(0)〉

Page 51: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

2.6. ESTREMI VINCOLATI 51

ovvero ∇g1(p) è ortogonale a ψ′(0). Visto che ogni vettore di TpΣ è combinazionelineare di vettori di questo tipo ne segue che ∇g1(p) ∈ (TpΣ)⊥. Questo può essereripetuto per g2, . . . , gn, ottenendo quindi n vettori in (TpΣ)⊥. La richiesta secondocui Jg(p) ha rango n garantisce che questi n vettori sono linearmente indipendenti,quindi abbiamo vericato che dim(TpΣ)⊥ ≥ n.

v. Visto che dim(TpΣ)+dim(TpΣ)⊥ = dimEp = n, da dimTpΣ ≥ m−n e dim(TpΣ)⊥ ≥n, segue che dimTpΣ = m − n e dim(TpΣ)⊥ = n. Abbiamo quindi determinato ladimensione di questi spazi ed inoltre abbiamo scoperto che (TpΣ)⊥ è generato daivettori ∇gj(p) con j = 1, . . . , n.

Ora veniamo all'interpretazione del teorema dei moltiplicatori. Ricordiamo che per funzionif : Ω ⊆ Rm → R, in C1(Ω) la derivata direzionale in p nella direzione v è data da Dvf(p) =〈∇f(p), v〉, e che da questa formula segue il fatto che ∇f(p) indica la direzione di massimacrescita per f . Ma allora se Σ è dato come sopra si ha che p ∈ Σ è un estremante localeper f vincolato a Σ se e solo se la proiezione ortogonale di ∇f(p) su TpΣ è 0, e questoaccade se e solo se ∇f(p) ∈ (TpΣ)⊥ ovvero se e solo se ∇f(p) ∈ span∇g1(p), . . . ,∇gn(p),e questo è appunto il teorema dei moltiplicatori.

Page 52: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

52 CAPITOLO 2. FUNZIONI IMPLICITE

Page 53: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 3

Equazioni Dierenziali

Viene chiamata equazione dierenziale ogni equazione che esprima una relazione che sivuole venga soddisfatta tra x ed il valore che in x assumono la funzione incognita φ edalcune sue derivate, per tutti i valori di x in un intervallo. In modo meno vago, unaequazione dierenziale è generata da una funzione f : Ω ⊆ R × Rk+1 → R ed ha persoluzione una funzione ϕ : (α, β)→ R di classe Ck((α, β)) tale che

f(x, ϕ(x), ϕ′(x), . . . , ϕ(k)(x)) = 0 ∀x ∈ (α, β).

Una tale equazione è detta di ordine k.

Osservazione 3.0.1. Per quanto possa apparire diversamente, questa famiglia di equazioninon è tanto generale da contenere ogni equazione che coinvolga le derivate di una funzioneincognita. Ad esempio l'equazione

ϕ′(x)− ϕ(x+ 1) = 0

non è una equazione dierenziale, almeno non nel senso con cui intendiamo qui questotermine, perché il legame che si vorrebbe soddisfatto tra ϕ e ϕ′ non è nel medesimo punto.

Se k = 0 l'equazione è di tipo implicito che è già stato tratta nel Capitolo 2. D'ora in poipossiamo quindi assumere k ≥ 1.La teoria delle equazioni dierenziali è abbastanza sviluppata nel caso l'equazione siascrivibile nella forma speciale

ϕ(k)(x) = f(x, ϕ(x), ϕ′(x), . . . , ϕ(k−1)(x)),

in cui la derivata di ordine massimo è esplicitata. Queste equazioni sono dette essere informa normale.Le equazioni in forma normale possono essere generalizzate a equazioni vettoriali, ovveroequazioni dove l'incognita cercata ϕ : (α, β)→ Rn di classe Ck((α, β)) è in realtà appuntovettoriale, e l'equazione assume allora la forma

ϕ(k)(x) = f(x, ϕ(x), ϕ′(x), . . . , ϕ(k−1)(x)) (3.1)

per ogni x ∈ (α, β), dove f : Ω ⊆ R× (Rn)k → Rn, Ω aperto.

Osservazione 3.0.2. In genere un'equazione dierenziale ha più di una soluzione. Ad esem-pio:

53

Page 54: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

54 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

• l'equazione y′′ = −y ha ϕa,x0(x) = a sin(x − x0) come soluzione, comunque si scelganoa e x0 in R;

• l'equazione y′ = f(x) (con f continua) ha la funzione ϕx0,y0(x) = y0 +∫ xx0f(u) du come

soluzione, comunque si scelgano x0 ed y0 (ma la coppia (x0, y0) e la coppia (x0, y0 +∫ x0x0f(u) du) individuano la medesima soluzione. Come vedremo in seguito questo accade

perché le soluzioni di un'equazione del primo ordine dipendono da un solo parametroscalare `libero').

La struttura dell'equazione normale (3.1) suggerisce però che la soluzione sia unica qualorasi aggiunga una condizione iniziale della forma:

(ϕ(x0), ϕ′(x0), . . . , ϕ(k−1)(x0)) = (y0, y1, y2, . . . , yk−1)

con x0 e yj con j = 0, . . . , k − 1 assegnati. Questo perché la (3.1) valutata in x0 diventa

ϕ(k)(x0) = f(x0, ϕ(x0), ϕ′(x0), . . . , ϕ(k−1)(x0))

che a seguito delle condizioni iniziali diventa

ϕ(k)(x0) = f(x0, y0, y1, . . . , yk−1)

che quindi determina in modo univoco il numero ϕ(k)(x0).Inoltre per derivazione di (3.1) (sempre che tali derivate esistano) si ha

ϕ(k+1)(x) =d

dxϕ(k)(x) =

d

dxf(x, ϕ(x), ϕ′(x), . . . , ϕ(k−1)(x))

e chiamando x, y0, y1, . . . , yk−1 gli argomenti di f questo è:

=∂f

∂x

∣∣∣(x,ϕ(x),...,ϕ(k−1)(x))

+∂f

∂y0

∣∣∣(x,ϕ(x),...,ϕ(k−1)(x))

·ϕ′(x)+· · ·+ ∂f

∂yk−1

∣∣∣(x,ϕ(x),...,ϕ(k−1)(x))

·ϕ(k)(x).

Quando questa espressione è valutata in x0 essa produce una identità in cui tutti i terminia destra risultano noti (si osservi che eettivamente anche ϕ(k)(x0) è noto, poiché è statocalcolato al passo precedente), quindi l'identità determina il valore di ϕ(k+1)(x0).Il processo può formalmente proseguire ad ogni ordine (se f è C∞) e determina ϕ(j)(x0) perogni j in modo iterativo. Quindi il processo riesce a determinare lo sviluppo di Taylor in x0

di ϕ e se questa serie converge a ϕ, allora di fatto abbiamo scoperto che ϕ è univocamentedeterminata da quelle condizioni. Tutto questo è al momento del tutto formale: molti sonoi se che abbiamo supposto e quindi molte le criticità (f potrebbe non essere C∞, la seriedi Taylor potrebbe non convergere, se anche convergesse potrebbe non farlo a ϕ, . . . ).L'argomento però ha il pregio di mostrare che è ragionevole supporre che la coppia

y(k) = f(x, y, y′, . . . , y(k−1)) ← equazione di. in forma normale

y(x0) = y0

y′(x0) = y1

...

y(k−1)(x0) = yk−1

← k condizioni tutte nel medesimo punto(3.2)

abbia una sola soluzione. Buona parte della teoria che stiamo per esporre serve proprio adindividuare le condizioni sotto cui questo principio è valido.

Page 55: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.1. EQUAZIONI DI FORMA SPECIALE 55

Denizione 3.0.3. Sia f : Ω ⊆ R × (Rn)k → Rn, Ω aperto e f ∈ C(Ω); sia inoltre(x0, y0, y1, . . . , yk−1) ∈ Ω. Il sistema di richieste in (3.2) è detto problema di Cauchy.Chiamiamo soluzione di (3.2) una funzione ϕ : (α, β)→ Rn con le seguenti proprietà:

i. x0 ∈ (α, β);

ii. ϕ ∈ Ck((α, β));

iii. ϕ (e le sue derivate) hanno valori tali per cui (3.2) vale per ogni x ∈ (α, β).

Si usa chiamare soluzione globale una soluzione per la quale (α, β) sia noto ed esplicitato,e invece soluzione locale una soluzione per la quale (α, β) sia noto esistere ma non vengadeterminato esplicitamente.

Osservazione 3.0.4. Si osservi che il dominio di una soluzione è (α, β), in particolare è unintervallo aperto, e che ϕ per denizione deve essere di classe Ck((α, β)), dove k è l'ordinedell'equazione.

3.1 Equazioni di forma speciale

Per certe funzioni f esistono procedure capaci di dare una formula esplicita della soluzionedel problema di Cauchy. Vediamone alcune.

3.1.1 Equazioni lineari del primo ordiney′ + p(x)y = q(x)

y(x0) = y0

dove p e q ∈ C((α, β)), x0 ∈ (α, β)e y0 ∈ R qualunque.

Sia H(x) una (qualunque) primitiva di p(x), ad esempio: H(x) =∫ xx0p(u) du (esiste perché

p è continua e H ′ = p in (α, β)). Moltiplicando per eH(x) si ottiene

q(x)eH(x) = y′(x)eH(x) + p(x)eH(x)y(x) = y′(x)eH(x) +H ′(x)eH(x)y(x) =d

dx(y(x)eH(x)).

Ma allora y(x)eH(x) è una primitiva per q(x)eH(x), che è continua visto che q lo è per ipotesi(e che H lo è per costruzione), per cui per il teorema fondamentale del calcolo integrale siha che

y(x)eH(x) − y(x0)eH(x0) =

∫ x

x0

q(v)eH(v) dv.

Siccome y(x0) = y0, per la condizione iniziale, e visto che eH(x0) = 1, si ha che

y(x) = e−H(x)[y0 +

∫ x

x0

q(v)eH(v) dv]

è soluzione su (α, β) e la procedura dimostra che quella trovata è l'unica soluzione delproblema di Cauchy assegnato.

Esempio 3.1.1. Si consideri il problema di Cauchy:y′ = 2xy + ex

2−x

y(0) = 3.

In questo caso H(x) =∫ x

0 −2udu = −x2 mentre∫ x

0 eu2−ue−u

2du =

∫ x0 e−u du = 1 − e−x

perciò la soluzione (unica su R) è la funzione ϕ(x) = ex2(4− e−x).

Page 56: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

56 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Esempio 3.1.2. Si consideri il problema di Cauchy:y′ = − y

x + cosx

y(1) = 2.

La formula dà la funzione φ(x) = 1x(2 + x sinx + cosx − sin 1 − cos 1) quale soluzione su

(0,+∞).

3.1.2 Equazioni a variabili separabiliy′ = h(x)g(y)

y(x0) = y0

con h ∈ C((α, β)), g ∈ C((γ, δ)),x0 ∈ (α, β) e y0 ∈ (γ, δ).

Anzitutto osserviamo che se g(y0) = 0, allora y(x) = y0 per ogni x ∈ (α, β) (funzionecostante) è soluzione. Tale soluzione non è però necessariamente unica (su questo puntotorneremo in seguito).Supponiamo che invece g(y0) 6= 0. Allora esiste U(y0) in cui g è diverso da 0, in tal casol'equazione può essere scritta come

y′(x)

g(y(x))= h(x)

che per integrazione diventa ∫ y(x)

y0

du

g(u)=

∫ x

x0

h(v) dv. (3.3)

La (3.3) è un'equazione implicita per y(x), della forma F (x, y) = 0 con

F (x, y) :=

∫ y

y0

du

g(u)−∫ x

x0

h(v) dv.

Visto che ∂F∂y = 1

g(y) 6= 0, la (3.3) denisce implicitamente una ed una sola funzione φ conF (x, φ(x)) = 0 per ogni x ∈ U(x0), e il ragionamento che ci ha portato alla (3.3) mostrache la soluzione del problema di Cauchy e la soluzione di F (x, y) = 0 coincidono no adove è lecito dividere per g(y), ovvero no a che φ(x) non assume valori in corrispondenzadei quali g(φ(x)) = 0. La soluzione appena individuata esiste ed è unica sul più ampiointervallo su cui la procedura che l'ha individuata è corretta.Nel caso invece in cui g(y0) = 0, oltre alla soluzione costante y(x) = y0 potrebbero esservialtre soluzioni locali. La loro (eventuale) esistenza va indagata cercando se tra le soluzionidei problemi di Cauchy con condizioni iniziali generiche y(x0) = y0 con g(y0) 6= 0 ve nesiano di prolungabili no a x0 con valore in questo punto uguale a y0 (su questo puntovedasi l'Esempio 3.1.4 seguente).

Esempio 3.1.3. Si consideri il problema di Cauchy:y′ = −8x3√yy(0) = 256.

L'equazione dierenziale ha la funzione costante y(x) = 0 quale soluzione, ma questa nonsoddisfa la condizione iniziale e quindi non risolve il problema di Cauchy. Procediamo

Page 57: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.1. EQUAZIONI DI FORMA SPECIALE 57

quindi nella separazione delle variabili, scrivendo l'equazione come y′

2√y = −4x3 che per

integrazione dà∫ y

256du

2√u

=∫ x

0 −4v3 dv, ovvero√y −√

256 = −x4. La funzione ϕ(x) =

(16− x4)2 è quindi la soluzione almeno localmente. Essa di fatto lo è su tutto l'intervallo(−2, 2), che è il più ampio intervallo contenente 0 su cui la funzione trovata è di classe C1

e non assume il valore 0.

Esempio 3.1.4. Si consideri il problema di Cauchy:y′ = 3y2/3

y(0) = 0.

L'equazione dierenziale ha la funzione costante y(x) = 0 quale soluzione. La soluzionedel generico problema di Cauchy y(x0) = y0 (con x0 ∈ R qualunque ed y0 6= 0) è invece

y(x) = (x−x0+y1/30 )3, ottenuta per separazione delle variabili. Tra queste vi è la y(x) = x3

che, lo si verica immediatamente, soddisfa il problema di Cauchy originalmente proposto.La condizione y(0) = 0 ha quindi almeno due soluzioni locali: la y(x) = 0 costante e lay(x) = x3 (in realtà ve ne sono anche altre: quali?).

3.1.3 Equazioni di Bernoulliy′ + p(x)y = q(x)yγ

y(x0) = y0

con p e q in C((α, β)), γ ∈ R, x0 ∈ (α, β)e y0 ∈ R è tale che yγ0 è ben denita.

Quando γ = 0 o γ = 1 l'equazione è lineare e sappiamo già come trattarla. Possiamo quindiassumere γ 6= 0, 1.Se γ > 0 tra le soluzioni dell'equazione c'è la funzione costante y(x) = 0 per ogni x (chesoddisfa il problema di Cauchy nel caso y0 = 0). Supponiamo sia y0 6= 0. Allora possiamodividere per yγ almeno localmente, ottenendo

y′

yγ+ p(x)

1

yγ−1= q(x).

Poniamo z(x) := y1−γ . Allora z′(x) = (1− γ) y′

yγ e quindi z soddisfa il problema di Cauchyz′

1−γ + p(x)z = q(x)

z(x0) = y1−γ0

ovvero

z′ + (1− γ)p(x)z = (1− γ)q(x)

z(x0) = y1−γ0 .

L'equazione per z è quindi lineare. Risolto il problema di Cauchy per z si ottiene la yinvertendo la soluzione z(x) = y(x)1−γ (ma prestando attenzione a dove questa relazionesia invertibile in modo C1!). L'algoritmo illustrato può essere invertito ad ogni passo sey0 6= 0, quindi quella così trovata è l'unica soluzione locale sotto questa ipotesi.

Esempio 3.1.5. Si consideri il problema di Cauchy:y′ = xy − 3y2/3

y(0) = α,α ∈ R.

Si tratta di una equazione di tipo Bernoulli, y′+p(x)y = q(x)yγ , con p(x) := −x, q(x) := −3ed γ = 2/3. La funzione identicamente nulla risolve l'equazione (ed il P.C., qualora α = 0).

Page 58: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

58 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Supponiamo α 6= 0. Allora almeno localmente si ha y(x) 6= 0, quindi possiamo scriverel'equazione come

y′

y2/3= xy1/3 − 3

che in termini della nuova funzione z = z(x) := y1/3 (che quindi soddisfa z′ = y′

3y2/3),

fornisce il P.C. z′ − x

3z = −1

z(0) = α1/3,α 6= 0,

che come previsto è lineare. Applicando il metodo risolutivo per queste equazioni si ottiene

z(x) = ex2/6[α1/3 −

∫ x

0e−v

2/6 dv].

Invertendo la relazione z = y1/3 (cosa lecita in modo C1 ntanto che z 6= 0) si ottiene

y(x) = ex2/2[α1/3 −

∫ x

0e−v

2/6 dv]3

che quindi risolve il P.C. assegnato sul più ampio intervallo contenente 0 e su cui α1/3 −∫ x0 e−v2/6 dv 6= 0. L'ampiezza di tale intervallo dipende dalle soluzioni dell'equazione∫ x

0e−v

2/6 dv = α1/3.

Poniamo F (x) :=∫ x

0 e−v2/6 dv. È facile rendersi conto che essa è una funzione strettamente

crescente, dispari, e che tende ad un valore nito per x → +∞. Chiamiamo F (+∞) talevalore. L'equazione precedente ha quindi soluzioni in x se e solo se |α|1/3 < F (+∞).L'intervallo sui cui la funzione y(x) trovata è soluzione è quindi: R se |α| ≥ F (+∞)3,(−∞, xα) con xα soluzione di

∫ x0 e−v2/6 dv = α1/3 quando 0 < α < F (+∞)3 e (xα,+∞)

con xα soluzione di∫ x

0 e−v2/6 dv = α1/3 quando F (+∞)3 < α < 0.

Il valore F (+∞) è noto, esso è il numero√

3π/2.

Page 59: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.2. STANDARDIZZAZIONE 59

3.2 Standardizzazione

Proseguiamo ora nello studio delle generiche equazioni dierenziali.

3.2.1 Da equazione di ordine k a equazione del primo ordine

Da un certo punto di vista basta studiare le equazioni del primo ordine, purché vettoriali,perché ogni equazione di ordine k e per una incognita vettoriale di dimensione n puòsempre essere scritta come equazione del primo ordine vettoriale di dimensione kn. Infattisupponiamo sia dato il P.C.

y(k) = f(x, y, y′, . . . , y(k−1))

y(j)(x0) = yj

j = 0, . . . , k − 1,

con f : Ω ⊆ R × (Rn)k → Rn, Ω aperto,f ∈ C(Ω) e (x0, y0

, . . . , yk−1

) ∈ Ω, (3.4)

e supponiamo che ϕ ne sia una soluzione (quindi una funzione di classe Ck). Introduciamouna nuova funzione che chiamiamo ψ e che in termini della ϕ è

ψ(x) :=

ϕ(x)

ϕ′(x)...

ϕ(k−1)(x)

=:

ψ

1(x)

ψ2(x)...

ψk(x)

.Derivando le componenti di ψ (cosa che è possibile poiché ϕ ∈ Ck) troviamo che

ψ′(x)=

ϕ′(x)

ϕ′′(x)...

ϕ(k)(x)

=

ϕ′(x)

ϕ′′(x)...

f(x, ϕ(x), ϕ′(x), . . . , ϕ(k−1)(x))

=

ψ2(x)

...ψk(x)

f(x, ψ1(x), ψ

2(x), . . . , ψ

k(x))

.Introduciamo dunque la funzione

F : Ω ⊆ R× (Rn)k → Rkn , F (x, z) :=

z2...zk

f(x, z1, z2, . . . , zk)

,dove z =: (z1, . . . , zk) ed ogni zj appartiene a Rn. Osserviamo che tale funzione è in C(Ω)(perché tale è f). Il calcolo precedente ha dunque mostrato che ψ è una funzione di classeC1 che risolve il problema di Cauchy

z′ = F (x, z)

z(x0) = (y0, y

1, . . . , y

k−1).

(3.5)

Viceversa, supponiamo che ψ sia una soluzione del P.C. (3.5), quindi una funzione di classeC1. Sia ϕ la funzione che dà le prime n coordinate di ψ. Questa è sicuramente di classeC1 (perché ψ lo è), ma in realtà è di classe Ck. Infatti il P.C. (3.5) con quella funzioneF stabilisce che il primo blocco di n variabili (ovvero la ϕ) abbia per derivata il secondoblocco di n variabili, le quali sono di classe C1 (perché ψ lo è), e quindi le funzioni del

Page 60: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

60 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

primo blocco sono di classe C2. Questo argomento, iterato k volte, dimostra che ϕ è diclasse Ck. Inne, i vari passi nei calcoli precedenti possono essere invertiti e dimostrano cheϕ soddisfa il P.C. (3.4).Questo argomento dimostra quindi che i P.C. (3.4) ed (3.5) sono equivalenti, nel sensoche da ogni soluzione di uno di essi si ricava una (unica) soluzione dell'altro. L'utilitàdella procedura sta nel fatto che l'equazione che appare nel P.C. (3.5) è del primo ordine.Ovviamente non ci sono pasti gratis, e paghiamo questa semplicazione con l'aumento delladimensione del problema che prima era n ed ora è kn (quindi vettoriale anche qualora inorigine ci fosse n = 1 e fosse quindi scalare).Per sviluppare la teoria generale potremo quindi limitarci allo studio di problemi di Cauchyvettoriali ma del primo ordine.

3.2.2 Passaggio alla formulazione integrale

Sia dato il problema di Cauchyy′ = f(x, y)

y(x0) = y0,

con f : Ω ⊆ R×Rn → Rn, Ω aperto,f ∈ C(Ω) e (x0, y0) ∈ Ω.

(3.6)

Supponiamo che ϕ sia una soluzione del problema di Cauchy (quindi in particolare è diclasse C1 su un intervallo (α, β)). Integrando l'equazione tra x0 e x si ha

ϕ(x) = y0 +

∫ x

x0

f(u, ϕ(u)) du per x ∈ (α, β).

Deniamo l'operatore T come quella mappa che data una funzione buona φ la trasformanella funzione Tφ i cui valori sono deniti ponendo

(Tφ)(x) := y0 +

∫ x

x0

f(u, φ(u)) du.

Il calcolo precedente mostra che se ϕ è soluzione di (3.6) su (α, β) (quindi ϕ ∈ C1) alloraTϕ è ben denito e Tϕ = ϕ ovvero ϕ è punto sso per T .Viceversa, supponiamo che ϕ sia in C((α, β)) e sia ssata da T . Questo signica che

ϕ(x) = (Tϕ)(x) = y0 +

∫ x

x0

f(u, ϕ(u)) du ∀x ∈ (α, β). (3.7)

La mappa u 7→ f(u, ϕ(u)) è continua (perché composizione di funzioni continue), quindila mappa x 7→

∫ xx0f(u, ϕ(u)) du è C1 (perché è integrale di una continua). Ma allora

ϕ ∈ C1((α, β)) per la (3.7). Valutando in x0 la (3.7) si ha ϕ(x0) = y0 e derivando la (3.7)si ha ϕ′(x) = f(x, ϕ(x)). Quindi ϕ soddisfa il P.C. (3.6).Abbiamo così dimostrato che il problema di Cauchy equivale ad un problema di puntosso per l'operatore T . Questo tipo di equazioni è chiamato problema integrale di Volterra.L'equivalenza del problema di Cauchy con uno di Volterra si rivela utile per il fatto chementre il primo è formulato in C1((α, β)), il secondo lo è in C((α, β)). Il passaggio allo spazioC((α, β)) semplica la ricerca delle soluzioni perché esso è più grande (molto semplicementeperché più il dominio in cui la si cerca è grande, e più è facile trovare in esso una soluzione).

Page 61: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.3. TEOREMI DI ESISTENZA E UNICITÀ 61

3.3 Teoremi di esistenza e unicità

Basandosi su questa equivalenza si può dimostrare il seguente teorema.

Teorema 3.3.1 (Peano). Sia f : Ω ⊆ R×Rn → Rn, Ω aperto e f ∈ C(Ω). Sia (x0, y0) ∈ Ω.Allora il problema di Cauchy

y′ = f(x, y)

y(x0) = y0

ha una soluzione locale.

Si tratta di un risultato estremamente importante, presentato da Peano nel 1886 per laversione scalare e nel 1890 per quella a valori vettoriali. Purtroppo la sua prima esposizionerisultò lacunosa in un punto fondamentale della dimostrazione, e la verità delle tesi restòin forse per qualche anno, no a che altri (Mie, Osgood, Perron) ne diedero dimostrazionisu base diverse. Oggi esso viene solitamente dedotto usando due profondi risultati; uno èil teorema di Ascoli ed Arzelà, che aerma che nello spazio C([a, b]) (le continue su [a, b],con la norma del sup) gli insiemi relativamente compatti (ovvero a chiusura compatta),coincidono con gli insiemi che sono equilimitati ed equicontinui (le proprietà che abbiamodiscusso a proposito dei Teoremi 1.1.10 ed 1.1.11). L'altro è un teorema di punto ssodovuto a Schauder e diverso da quello che abbiamo discusso in queste note, che garantiscel'esistenza (non l'unicità) di tali punti per mappe continue da uno spazio metrico convessoe compatto in sé. Purtroppo la dimostrazione di questi risultati richiede troppe risorse enon può essere arontata in queste note. Una esposizione particolarmente accessibile diquesti risultati è contenuta nel Capitolo 7 di [Sh].Concludiamo osservando che però recentemente è stato messo in luce in [GM] come l'argo-mento originale di Peano sia emendabile e possa eettivamente essere usato per dare unadimostrazione corretta ed elementare, almeno negli strumenti, del suo risultato.

Osserviamo che il teorema aerma l'esistenza della soluzione ma non la sua unicità. Ineetti la sola ipotesi di continuità non basta per ottenere anche l'unicità della soluzione,come illustrato dal seguente semplice esempio.

Esempio 3.3.2. Il problema di Cauchyy′ = 3y2/3

y(0) = 0

ha sia y(x) ≡ 0 sia y(x) = x3 come soluzioni.

Introduciamo ora una proprietà aggiuntiva che si rivela adatta per garantire l'unicità dellasoluzione.

Denizione 3.3.3. Sia data f : Ω ⊆ R×Rn → Rn, con Ω aperto, e sia dato (x0, y0) ∈ Ω;f è detta localmente lipschitziana nelle y uniformemente nelle x nel punto (x0, y0) quandoesistono i numeri d, δ, L positivi e tali che

x ∈ [x0 − d, x0 + d]

y1, y2 ∈ Bδ(y0)

=⇒ ‖f(x, y1)− f(x, y2)‖2 ≤ L‖y1 − y2‖2. (3.8)

Osservazione 3.3.4. Si osservi che questa condizione esprime una regolarità di f , ma solonelle coordinate y, non in tutte le variabili di f . Ad esempio f(x, y) := bxc + y (bxc è laparte intera di x) ha la proprietà appena denita, ma globalmente non è neppure continua.

Page 62: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

62 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Osservazione 3.3.5. Se f ∈ C1(Ω) allora sicuramente ha quella proprietà in tutti i punti diΩ (perché le derivate parziali di f sono continue quindi limitate sui compatti).

Teorema 3.3.6 (Esistenza ed unicità locale). Sia data f : Ω ⊆ R × Rn → Rn, Ω aper-to, f ∈ C(Ω), e sia (x0, y0) ∈ Ω. Supponiamo che f sia localmente lipschitziana nelle yuniformemente nelle x in (x0, y0). Allora il problema di Cauchy

y′ = f(x, y)

y(x0) = y0

ha una e una sola soluzione locale.

Dimostrazione. Siano d, δ, L come nella denizione di locale lipshitzianità. Sia

M := max‖f(x, y)‖2 : (x, y) ∈ [x0 − d, x0 + d]×Bδ(y0),

Tale quantità esiste perché [x0 − d, x0 + d] × Bδ(y0) è compatto e f è continua. Sia d′ :=min(d, δM ,

12L) e sia

X := C([x0 − d′, x0 + d′], Bδ(y0)),

l'insieme delle funzioni continue da [x0 − d′, x0 + d′] a Bδ(y0). L'insieme X è uno spaziometrico completo rispetto alla metrica

d(ϕ,ψ) := ‖ϕ− ψ‖∞,[x0−d′,x0+d′] = supx∈[x0−d′,x0+d′]

‖ϕ(x)− ψ(x)‖2

(perché il limite uniforme di funzioni continue è continuo e Bδ(y0) è un insieme chiuso).Sia T l'operatore integrale di Volterra associato al P.C., ovvero l'operatore che trasformauna data funzione ϕ nella funzione Tϕ i cui valori sono

(Tϕ)(x) := y0 +

∫ x

x0

f(u, ϕ(u)) du.

i. Verichiamo che T è una mappa X → X . Infatti è chiaro che se ϕ ∈ X allora Tϕ ècontinua su [x0 − d′, x0 + d′] (qui si usa la continuità di f e di ϕ) e inoltre:

‖(Tϕ)(x)− y0‖2 =∥∥∥∫ x

x0

f(u, ϕ(u)) du∥∥∥

2≤∣∣∣ ∫ x

x0

‖f(u, ϕ(u))‖2 du∣∣∣

≤M |x− x0| ≤Md′ ≤ δ

(perché il graco di ϕ è per ipotesi in [x0− d′, x0 + d′]×Bδ(y0) e qui f è limitata daM . Il fatto che Md′ sia stimato da δ deriva dalla denizione di d′). Questo dimostrache (Tϕ)(x) ∈ Bδ(y0), per ogni x ∈ [x0 − d′, x0 + d′].

ii. Verichiamo che T è una contrazione. Infatti se ϕ,ψ ∈ X abbiamo

‖(Tϕ)(x)− (Tψ)(x)‖2 =∥∥∥∫ x

x0

(f(u, ϕ(u))− f(u, ψ(u))

)du∥∥∥

2

≤∣∣∣ ∫ x

x0

‖f(u, ϕ(u))− f(u, ψ(u))‖2 du∣∣∣.

Page 63: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.3. TEOREMI DI ESISTENZA E UNICITÀ 63

Ma f è localmente lipschitziana nelle y uniformemente nelle x, ovvero soddisfa lastima (3.8), quindi questa è

≤∣∣∣ ∫ x

x0

L‖ϕ(u)− ψ(u)‖2 du∣∣∣ ≤ L‖ϕ− ψ‖∞,[x0−d′,x0+d′] · |x− x0|

≤ d′L · ‖ϕ− ψ‖∞,[x0−d′,x0+d′].

Questo vale per ogni x ∈ [x0 − d′, x0 + d′], perciò abbiamo vericato che

‖Tϕ− Tψ‖∞,[x0−d′,x0+d′] ≤ d′L · ‖ϕ− ψ‖∞,[x0−d′,x0+d′].

Ma d′L ≤ 12 , quindi T è una contrazione.

iii. Visto che T è una contrazione e X è completo, dal teorema di BanachCaccioppolisappiamo che esiste ed è unico il punto sso per T , ovvero una mappa ϕ ∈ X taleche Tϕ = ϕ. Abbiamo già visto che l'esistenza e unicità della soluzione del problemadi Volterra equivale all'esistenza e unicità del problema di Cauchy.

Nella dimostrazione precedente si è posto d′ := min(d, δM ,1

2L). In particolare il valore di d′

risente del valore di L. Visto che d′ è sostanzialmente il parametro che denisce il dominiosu cui siamo riusciti a dimostrare l'esistenza della soluzione, di fatto questa denizione fadipendere il dominio dal valore di L. In realtà un argomento un po' più elaborato riescea vericare la tesi già con d′ := min(d, δM ), che quindi risulta indipendente da L. Il nuovoargomento consiste nell'osservare che nonostante ora d′ sia probabilmente maggiore delvalore scelto precedentemente, è comunque possibile trovare k in modo che T (k) (iteratak-esima) sia una contrazione. Fatto ciò la tesi allora seguirà dall'estensione del Teorema diBanachCaccioppoli (Corollario 2.3.5). In eetti, abbiamo visto che la stima di Lipschitzdi base consente la disuguaglianza

‖(Tϕ)(x)− (Tψ)(x)‖2 ≤ L∣∣∣ ∫ x

x0

‖ϕ(u)− ψ(u)‖2 du∣∣∣.

Iterandola si ottiene

‖(T (2)ϕ)(x)− (T (2)ψ)(x)‖2 ≤ L∣∣∣ ∫ x

x0

‖(Tϕ)(u)− (Tψ)(u)‖2 du∣∣∣

≤ L2∣∣∣ ∫ x

x0

∫ u

x0

‖ϕ(u1)− ψ(u1)‖2 du1 du∣∣∣.

Quindi (per induzione su k), se la mappa è iterata k volte si ha

‖(T (k)ϕ)(x)− (T (k)ψ)(x)‖2 ≤ Lk∣∣∣ ∫ x

x0

∫ u

x0

· · ·∫ uk−2

x0

‖ϕ(uk−1)− ψ(uk−1)‖2 duk−1· · · du1 du∣∣∣,

dove appaiono k integrali iterati. Inserendo la stima ‖ϕ(uk−1) − ψ(uk−1)‖2 ≤ ‖ϕ − ψ‖∞questa diventa

‖(T (k)ϕ)(x)− (T (k)ψ)(x)‖2 ≤ Lk‖ϕ− ψ‖∞∣∣∣ ∫ x

x0

∫ u

x0

· · ·∫ uk−2

x0

1 duk−1 · · · du1 du∣∣∣.

Page 64: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

64 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Il valore dell'integrale è pari a (x−x0)k

k! (dimostrato per induzione su k), quindi la stimadiventa

‖(T (k)ϕ)(x)− (T (k)ψ)(x)‖2 ≤Lk

k!|x− x0|k‖ϕ− ψ‖∞ ≤

(Ld′)k

k!‖ϕ− ψ‖∞.

Visto che limk→∞(Ld′)k

k! = 0, esiste sicuramente un valore di k in corrispondenza del quale

si ha (Ld′)k

k! ≤ 12 (il fatto di aver preso d′ = min(d, δM ) anziché d′ = min(d, δM ,

12L) solo

forza k ad essere probabilmente > 1). Con quel valore di k l'iterata T (k) risulta quindicontrattiva.

Esercizio 3.3.7. Si consideri il problema di Cauchyy′ = y

y(0) = 1.

Il teorema precedente garantisce l'esistenza ed unicità della soluzione, e lo fa tramite ilteorema di BanachCaccioppoli applicato alla mappa T denita dalla identità (Tϕ)(x) :=1 +

∫ x0 ϕ(u) du per le ϕ in C[−d, d] per un opportuno d ∈ R. In particolare la sequenza

delle iterate di T converge necessariamente ad una soluzione. Nel caso in esame l'azionedi T è abbastanza semplice, quindi si può vericare direttamente questa convergenza.Come funzione iniziale ϕ0 si prenda la funzione identicamente nulla, e dato ϕn si deniscaϕn+1(x) := (Tϕn)(x) = 1 +

∫ x0 ϕn(u) du.

i. Calcolare ϕ1, ϕ2, ϕ3, ϕ4;

ii. Determinare ϕn esplicitamente ∀n (per induzione);

iii. Vericare che ϕn(x)→ exp(x) per ogni x ∈ R e vericare che eettivamente exp(x)soddisfa il problema di Cauchy.

Riassumendo, abbiamo quindi vericato che, dato un problema di Cauchy nella forma delteorema, se f è continua allora esso ha almeno una soluzione locale (Peano), e che se inoltref è di classe C1 allora la soluzione è anche unica. Questo mostra che l'esistenza e unicitàlocale sono legate alla regolarità di f . L'esempio seguente mostra che invece non è così perl'esistenza/unicità di tipo globale.

Esempio 3.3.8. Si consideri il P.C.y′ = y2

y(0) = α,α ∈ R.

Esso ammette come soluzione y(x) = α1−αx negli intervalli (−∞, 1

α) se α > 0, ( 1α ,+∞)

se α < 0 e R se α = 0. In particolare non esiste un intervallo aperto comune su cuile soluzioni siano denite indipendentemente dalla scelta di α. Ciò succede nonostantel'equazione abbia la forma y′ = f(x, y) con f(x, y) ∈ C∞(R×R). In eetti, come vedremo,l'esistenza e unicità globale è infatti sensibile non solo alla regolarità di f ma anche allasua crescita come funzione di y.

Page 65: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.3. TEOREMI DI ESISTENZA E UNICITÀ 65

Teorema 3.3.9 (Esistenza ed unicità globale (striscia)). Sia data f : S := [a, b]×Rn → Rn,con f ∈ C(S). Supponiamo che f sia lipschitziana nelle y uniformemente nelle x in S,ovvero che esista L > 0 tale che

x ∈ [a, b]y1, y2 ∈ Rn

=⇒ ‖f(x, y1)− f(x, y2)‖2 ≤ L‖y1 − y2‖2. (3.9)

Allora ogni problema di Cauchy y′ = f(x, y)

y(x0) = y0

con (x0, y0) ∈ S ha un'unica soluzione su [a, b].

Osservazione 3.3.10. La condizione (3.9) dice (tra le altre cose) che f cresce al più linear-mente nelle y. Infatti da essa segue che

‖f(x, y)‖2 ≤ ‖f(x, 0)‖2 + ‖f(x, y)− f(x, 0)‖2 ≤ A+ L‖y‖2,

dove A := max‖f(x, 0)‖2, x ∈ [a, b], che esiste per la continuità di f .

Dimostrazione. Sia X := C([a, b],Rn), considerato come spazio di Banach rispetto allanorma dell'estremo superiore. Sia ϕ ∈ X e sia

(Tϕ)(x) = y0 +

∫ x

x0

f(u, ϕ(u)) du.

È chiaro che Tϕ è una funzione continua, e questo basta a concludere che T : X → X .Come detto, X è completo rispetto a ‖ · ‖∞,[a,b], ma noi introduciamo una norma diversa,anche se equivalente a questa. Fissiamo (per il momento ad arbitrio) λ > 0, e poniamo

‖ϕ‖λ := supx∈[a,b]

‖e−λ|x−x0|ϕ(x)‖2.

Osserviamo che e−λ(b−a) ≤ e−λ|x−x0| ≤ 1 per x ∈ [a, b], e che quindi

e−λ(b−a)‖ϕ‖∞,[a,b] ≤ ‖ϕ‖λ ≤ ‖ϕ‖∞,[a,b].

Questo dimostra che ‖ · ‖∞,[a,b] e ‖ · ‖λ sono norme equivalenti così che X è completoanche rispetto a ‖ · ‖λ. Come fatto per il teorema locale, proseguiamo nella dimostrazioneosservando che

‖Tϕ(x)− Tψ(x)‖2 =∥∥∥∫ x

x0

(f(u, ϕ(u))− f(u, ψ(u))

)du∥∥∥

2

≤∣∣∣ ∫ x

x0

‖f(u, ϕ(u))− f(u, ψ(u))‖2 du∣∣∣,

e che dalla stima di lipschitzianità di f segue che questa espressione è

≤ L∣∣∣ ∫ x

x0

‖ϕ(u)− ψ(u)‖2 du∣∣∣.

Page 66: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

66 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Ora introduciamo la nuova norma. Dalla denizione di ‖ · ‖λ segue che ‖ϕ(u)− ψ(u)‖2 ≤eλ|u−x0|‖ϕ − ψ‖λ quando u ∈ [a, b]. Visto che x ∈ [a, b], e che quindi anche u ∈ [a, b],l'integrale precedente è stimato da

≤ L‖ϕ− ψ‖λ∣∣∣ ∫ x

x0

eλ|u−x0| du∣∣∣.

Osserviamo che

se x > x0,∣∣∣ ∫ x

x0

eλ|u−x0| du∣∣∣=∫ x

x0

eλ(u−x0) du=1

λ

(eλ(x−x0)−1

)≤ 1

λeλ(x−x0) =

1

λeλ|x−x0|,

se x ≤ x0,∣∣∣ ∫ x

x0

eλ|u−x0| du∣∣∣=−∫ x

x0

eλ(x0−u) du=1

λ

(eλ(x0−x)−1

)≤ 1

λeλ(x0−x) =

1

λeλ|x−x0|,

così che dalla stima precedente segue che

e−λ|x−x0|‖Tϕ(x)− Tψ(x)‖2 ≤L

λ‖ϕ− ψ‖λ, x ∈ [a, b].

Passando all'estremo superiore in x ∈ [a, b] abbiamo quindi

‖Tϕ− Tψ‖λ ≤L

λ‖ϕ− ψ‖λ.

Scegliendo λ > L otteniamo dunque una norma rispetto alla quale T è una contrazione.La conclusione allora segue dal teorema di BanachCaccioppoli e dalla equivalenza delproblema di Cauchy con il corrispondente problema di Volterra.

3.4 Stabilità rispetto al modello e ai dati iniziali

Teorema 3.4.1. Siano f, g : [a, b] × B → Rn dove B è un aperto di Rn. Assumiamo iseguenti due fatti:

i. esiste L con ‖f(x, y)− f(x, z)‖ ≤ L‖y − z‖ per ogni scelta di x ∈ [a, b] e y, z ∈ B,

ii. esiste R : [a, b] → R continua con ‖f(x, y) − g(x, y)‖ ≤ R(x) per ogni x ∈ [a, b] edy ∈ B.

Siano α, β ∈ B e siano ϕ e ψ : [a, b]→ B funzioni di classe C1([a, b]) che soddisfano

ϕ :

ϕ′(x) = f(x, ϕ(x))

ϕ(a) = αψ :

ψ′(x) = g(x, ψ(x))

ψ(a) = β.

Allora

‖ϕ(x)− ψ(x)‖2 ≤ eL(x−a)‖α− β‖2 + eL(x−a)

∫ x

ae−L(s−a)R(s) ds.

Dimostrazione. Consideriamo la funzione ‖ϕ(x)−ψ(x)‖2. Questa è una mappa [a, b]→ Rcontinua che in tutti i punti in cui ϕ(x) 6= ψ(x) soddisfa

d

dx‖ϕ(x)− ψ(x)‖2 =

d

dx

[ n∑i=1

(ϕi(x)− ψi(x))2]1/2

=〈ϕ(x)− ψ(x), ϕ′(x)− ψ′(x)〉

‖ϕ(x)− ψ(x)‖2

Page 67: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.4. STABILITÀ RISPETTO AL MODELLO E AI DATI INIZIALI 67

e quindi per la disuguaglianza di CauchySchwarz è stimata da

≤ ‖ϕ(x)− ψ(x)‖2 · ‖ϕ′(x)− ψ′(x)‖2‖ϕ(x)− ψ(x)‖2

= ‖ϕ′(x)− ψ′(x)‖2.

Dalle equazioni dierenziali risolte da ϕ e ψ ed usando la disuguaglianza triangolarericaviamo che questo è

= ‖f(x, ϕ(x))− g(x, ψ(x))‖2 ≤ ‖f(x, ϕ(x))− f(x, ψ(x))‖2 + ‖f(x, ψ(x))− g(x, ψ(x))‖2

che per le ipotesi su f e g produce la stima

d

dx‖ϕ(x)− ψ(x)‖2 ≤ L‖ϕ(x)− ψ(x)‖2 +R(x).

Moltiplichiamo la disuguaglianza per e−Lx, ottenendo

e−Lxd

dx‖ϕ(x)− ψ(x)‖2 − Le−Lx‖ϕ(x)− ψ(x)‖2 ≤ e−LxR(x),

ovverod

dx

(e−Lx‖ϕ(x)− ψ(x)‖2

)≤ e−LxR(x).

Integrando questa relazione su [a, x] abbiamo

e−Lx‖ϕ(x)− ψ(x)‖2 − e−La‖α− β‖2 ≤∫ x

ae−LsR(s) ds.

Quindi

‖ϕ(x)− ψ(x)‖2 ≤ eL(x−a)‖α− β‖2 + eLx∫ x

ae−LsR(s) ds,

che è la tesi. Questa però è stata ottenuta supponendo ϕ(x) 6= ψ(x) nell'intervallo diintegrazione (o almeno nella sua parte aperta). La tesi in generale è ottenuta incollandoquesti risultati (cosa che è possibile perché ‖ϕ(x)− ψ(x)‖2 è continua su [a, b]). (Nota: siosservi che questa osservazione è inutile qualora R sia identicamente nulla. In questo casoinfatti le ϕ e ψ risolvono la medesima equazione dierenziale per cui possiamo supporreche certamente ϕ(x) 6= ψ(x) in [a, b]: infatti, se mai esistesse un punto in cui ϕ(x) = ψ(x),allora le due funzioni sarebbero identiche (per il teorema di esistenza ed unicità locale) ela tesi sarebbe certamente soddisfatta).

Questo risultato è noto col nome di Lemma di Grönwall. Esso dà una stima di quantovelocemente cambia la soluzione al variare della condizione iniziale (α od β) e della formadell'equazione (f o g). La stima in sé non è però molto buona per via del termine eL(x−a)

(esponenziale); d'altra parte sotto le ipotesi date non è possibile fare meglio di quanto giàaermato1. Questo risultato è il più semplice all'interno di una vasta famiglia di risultatisulla dipendenza continua delle soluzioni dai parametri del problema di Cauchy.

1Basta considerare i problemi di Cauchy con la stessa equazione y′ = y e condizioni iniziali y(0) = α edy(0) = β. Le due soluzioni sono rispettivamente ϕ(x) = αex ed ψ(x) = βex, e per loro la stima del teoremadi fatto vale come uguaglianza.

Page 68: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

68 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

3.5 Equazioni lineari

Sono equazioni della forma

y(n) + a1(x)y(n−1) + · · ·+ an−1(x)y′ + an(x)y = f(x) (3.10)

dove le funzioni a1, . . . , an ed f : [a, b] → R sono assunte continue in [a, b]. Il seguenterisultato è lo strumento che governa lo studio di questo tipo di equazioni. Esso discendedirettamente dal teorema di esistenza ed unicità globale.

Teorema 3.5.1. Per ogni scelta di x0 ∈ [a, b] e di y0, . . . , yn−1 ∈ R il problema di Cauchyy(n) + a1(x)y(n−1) + · · ·+ an−1(x)y′ + an(x)y = f(x)

y(j)(x0) = yj j = 0, . . . , n− 1

ha una e una sola soluzione su [a, b].

Dimostrazione. Formuliamo il problema di Cauchy come problema del primo ordine (indimensione n)

z′ = F (x, z)

zj(x0) = yj−1 j = 1, . . . , n,

dove

z :=

yy′

...y(n−1)

e F (x, z) :=

z2

z3...

f(x)−∑n

j=1 an−j+1(x)zj

.Osserviamo che F : [a, b]× Rn → Rn è continua, e che

‖F (x, z)− F (x,w)‖22 = (z2 − w2)2 + · · ·+ (zn − wn)2 +( n∑j=1

an−j+1(x)(zj − wj))2

≤ ‖z − w‖22 +( n∑j=1

(an−j+1(x))2)‖z − w‖22 =

(1 +

n∑j=1

(aj(x))2)‖z − w‖22.

Visto che le aj sono continue su [a, b], la funzione [1 +∑n

j=1(aj(x))2]1/2 ha un massimo su[a, b] che chiamiamo L. Il calcolo precedente mostra così che

‖F (x, z)− F (x,w)‖2 ≤ L‖z − w‖2 ∀z, w ∈ Rn,

uniformemente in [a, b]. Quindi F ha tutte le proprietà richieste per poter applicare ilteorema di esistenza e unicità globale.

La struttura dell'equazione lineare ne consente la seguente importante riscrittura. Sianoa1, . . . , an e f continue in [a, b], e sia

L : Cn([a, b]) −→ C([a, b]),

ϕ 7→ (Lϕ)(x) := ϕ(n)(x) +∑n

j=1 aj(x)ϕ(n−j)(x).

Page 69: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.5. EQUAZIONI LINEARI 69

Si osservi che eettivamente Lϕ ∈ C([a, b]).Tramite l'operatore2 dierenziale3 L l'equazione (3.10) è scritta come

Lϕ = f.

Risolvere l'equazione quindi equivale a trovare la contro immagine di f tramite L. Questainterpretazione è utile poiché L è un operatore lineare: in eetti L(λϕ + ψ) = λLϕ + Lψper ogni λ ∈ R e ϕ,ψ ∈ Cn([a, b]). Il seguente risultato è una immediata conseguenza diquesto fatto.

Teorema 3.5.2. Sia L l'operatore dierenziale appena denito. Allora:

i. l'insieme V := kerL = y : Ly = 0 è uno spazio vettoriale;

ii. sia ϕ0 una qualunque funzione tale che Lϕ0 = f . Allora

ϕ : Lϕ = f = V + ϕ0.

La seconda tesi può essere enunciata dicendo che l'insieme delle soluzioni di Ly = f è unospazio ane.

Dimostrazione. Il fatto che V sia vettoriale discende immediatamente dal fatto che essoè il nucleo di un operatore lineare. Per la seconda tesi osserviamo che se ϕ ∈ V , alloraL(ϕ+ ϕ0) = Lϕ+ Lϕ0 = 0 + f = f : questo mostra l'inclusione: V + ϕ0 ⊆ ϕ : Lϕ = f.D'altra parte, se ψ è tale che Lψ = f allora ψ = (ψ−ϕ0) +ϕ0 e L(ψ−ϕ0) = Lψ−Lϕ0 =f − f = 0, quindi ψ − ϕ0 ∈ V : questo dimostra l'inclusione: V + ϕ0 ⊇ ϕ : Lϕ = f.

3.5.1 Costruzione di una base

La seguente proposizione esprime un fatto centrale di questa teoria.

Teorema 3.5.3. Sia L come sopra e sia V := kerL = ϕ ∈ Cn([a, b]) : Lϕ = 0. AlloradimV = n.

Dimostrazione. Sia x0 ∈ [a, b] ssato. Consideriamo i seguenti n problemi di Cauchy:

Ly = 0

y(x0) = 1

y′(x0) = 0

y′′(x0) = 0...

y(n−1)(x0) = 0

,

Ly = 0

y(x0) = 0

y′(x0) = 1

y′′(x0) = 0...

y(n−1)(x0) = 0

, . . . ,

Ly = 0

y(x0) = 0

y′(x0) = 0

y′′(x0) = 0...

y(n−1)(x0) = 1.

Per il Teorema 3.5.1 ognuno di essi ha una e una sola soluzione, che chiamiamo rispettiva-mente ϕ1, ϕ2, . . . , ϕn.

2Tradizione vuole che siano chiamate funzioni quelle mappe che trasformano punti in punti, ed operatoriquelle mappe che trasformano funzioni in funzioni. Chiaramente da un punto di vista più moderno itermini mappa/funzione/operatore sono in realtà interscambiabili, indicando essi semplicemente funzionitra insiemi: è solo una certa tradizione che preferisce l'uso di un termine o l'altro a seconda della naturadi questi insiemi.

3È così chiamato perché agisce attraverso derivate.

Page 70: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

70 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Verichiamo che dimV ≥ n. Lo facciamo dimostrando che le ϕj sono linearmente indipen-denti su R. Infatti supponiamo che α1, α2, . . . , αn ∈ R siano tali che

∑nj=1 αjϕj =: ψ sia la

funzione identicamente nulla. Allora ψ(k)(x0) = 0 per ogni k, ma dalle condizioni inizialisegue che:

ψ(k)(x) =n∑j=1

αjϕ(k)j (x) =⇒ 0 = ψ(k)(x0) =

n∑j=1

αjϕ(k)j (x0) =

n∑j=1

αjδj,k+1 = αk+1

quindi ogni αk = 0.Verichiamo che dimV ≤ n. Sia h ∈ V . Allora h ∈ Cn([a, b]) e in particolare i numerih(j)(x0) con j = 0, . . . , n − 1 sono ben deniti. Sia ψ :=

∑nj=1 h

(j−1)(x0)ϕj . Osserviamoche ψ ∈ Cn([a, b]) e Lψ = 0 (perché Lϕj = 0 per ogni j ed L è lineare). Inoltre con lostesso conto di prima mostriamo che

ψ(k)(x0) =

n∑j=1

h(j−1)(x0)ϕ(k)j (x0) =

n∑j=1

h(j−1)(x0)δj,k+1 = h(k)(x0), k = 0, . . . , n− 1.

Quindi sia h che ψ sono soluzioni del problema di CauchyLy = 0

y(j)(x0) = h(j)(x0) ∀j = 0, . . . , n− 1.

Sappiamo però che il problema di Cauchy ha un'unica soluzione, quindi

h = ψ =

n∑j=1

h(j−1)(x0)ϕj ,

ovvero h è combinazione lineare delle ϕj .

Osservazione 3.5.4. La dimostrazione del teorema mostra che le ϕj costituiscono una baseper V . Non solo quindi conosciamo la dimensione dello spazio, ma sappiamo che possiamoanche ottenerne una base costruendo le soluzioni di n problemi di Cauchy con quellecondizioni iniziali. In realtà è semplice vericare che la costruzione del teorema produceuna base anche per condizioni iniziali diverse, basta che siano linearmente indipendenti (siveda il Corollario 3.5.7 seguente).

3.5.2 Matrice Wronskiana

Denizione 3.5.5. Siano ϕ1, . . . , ϕn, n soluzioni di Ly = 0 (non necessariamente quelledel Teorema 3.5.2 e neppure necessariamente indipendenti). Chiamiamo matrice Wron-skiana la matrice n× n

W :=

ϕ1 ϕ2 . . . ϕnϕ′1 ϕ′2 . . . ϕ′n...

.... . .

...

ϕ(n−1)1 ϕ

(n−1)2 . . . ϕ

(n−1)n

e Wronskiano la funzione detW : x 7→ det(W (x)).

Page 71: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.5. EQUAZIONI LINEARI 71

Proposizione 3.5.6. Sia W come sopra. Allora (detW )′(x) = −a1(x)(detW )(x) in [a, b],e quindi

(detW )(x) = (detW )(x0) · exp(−∫ x

x0

a1(u) du)

∀x ∈ [a, b].

In particolare (detW )(x) = 0 per qualche x se e solo se (detW )(x) = 0 per ogni x.

Dimostrazione. La formula di Leibniz esprime detW come somma sulle permutazioni (consegno) di prodotti degli elementi della matrice. Da ciò segue che (detW )′ è la somma (consegno) delle derivate dei prodotti, ciascuna delle quali è a sua volta somma di n termini incui la derivata è eseguita volta per volta su ciascun fattore. Questo implica che

(detW )′(x)

=det

ϕ′1 . . . ϕ′nϕ′1 . . . ϕ′n...

. . ....

ϕ(n−1)1 . . . ϕ

(n−1)n

+ det

ϕ1 . . . ϕnϕ′′1 . . . ϕ′′nϕ′′1 . . . ϕ′′n...

. . ....

ϕ(n−1)1 . . . ϕ

(n−1)n

+ · · ·+ det

ϕ1 . . . ϕnϕ′1 . . . ϕ′n...

. . ....

ϕ(n−2)1 . . . ϕ

(n−2)n

ϕ(n)1 . . . ϕ

(n)n

.

I primi n − 1 determinanti della sommatoria sono in realtà nulli poiché hanno due righeuguali. Abbiamo quindi

(detW )′(x) = det

ϕ1 . . . ϕn...

. . ....

ϕ(n−2)1 . . . ϕ

(n−2)n

ϕ(n)1 . . . ϕ

(n)n

.Inoltre, ogni ϕj soddisfa la relazione Lϕj = 0, ovvero ϕ(n)

j = −∑n

k=1 ak(x)ϕ(n−k)j ; sosti-

tuendo questa identità si ha:

(detW )′(x) = det

ϕ1 . . . ϕn...

. . ....

ϕ(n−2)1 . . . ϕ

(n−2)n

−∑n

k=1 ak(x)ϕ(n−k)1 . . . −

∑nk=1 ak(x)ϕ

(n−k)n

= −n∑k=1

ak(x) det

ϕ1 . . . ϕn...

. . ....

ϕ(n−2)1 . . . ϕ

(n−2)n

ϕ(n−k)1 . . . ϕ

(n−k)n

,dove per l'ultima uguaglianza si è usata la linearità del determinante rispetto alle sue righe.Le matrici che appaiono nei termini con indice k ≥ 2 hanno due righe uguali e quindi hannodeterminante nullo. Resta quindi solo il termine con k = 1 che dà

= −a1(x) det

ϕ1 . . . ϕn...

. . ....

ϕ(n−1)1 . . . ϕ

(n−1)n

= −a1(x)(detW )(x)

che è l'equazione data. Le altre formule sono immediate conseguenze.

Page 72: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

72 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Corollario 3.5.7. Siano ϕ1, . . . , ϕn, funzioni nel nucleo di L, ovvero soluzioni di Ly = 0.Siano Φj con j = 1, . . . , n le funzioni a valori vettoriali denite da:

Φj := (ϕj , ϕ′j , ϕ′′j , . . . , ϕ

(n−1)j ).

Allora:

• le funzioni ϕ1, . . . , ϕn sono una base del nucleo se e solo se esiste x0 ∈ [a, b] in corri-spondenza del quale i vettori Φj(x0) con j = 1, . . . , n sono linearmente indipendenti;

• esiste un x0 ∈ [a, b] in corrispondenza del quale i vettori Φj(x0) con j = 1, . . . , n sonolinearmente indipendenti se e solo se i vettori Φj(x0) con j = 1, . . . , n sono linearmenteindipendenti per ogni x0 ∈ [a, b].

Dimostrazione. La tesi segue dal fatto che i vettori Φj sono le colonne della matrice wron-skiana, e quindi essi sono linearmente indipendenti se e solo se il determinante della matriceè diverso da zero. La Proposizione 3.5.6 mostra che questo accade in un punto se e solo seaccade in ogni punto.

La prima parte del corollario precedente mostra come costruire una base per il nucleo:basta prendere le soluzioni di n Problemi di Cauchy con condizioni iniziali linearmenteindipendenti.

3.5.3 Costruzione di una soluzione

Supponiamo sia stata assegnata una funzione f ∈ C([a, b]), e cerchiamo ora di costruireuna soluzione di Ly = f nota una base di Ly = 0 costituita dalle funzioni ϕ1, . . . , ϕn. Inparticolare cerchiamo una soluzione di Ly = f che sia della forma

ψ(x) =

n∑j=1

Aj(x)ϕj(x)

con A1, . . . , An funzioni incognite da determinare, che immaginiamo in C1([a, b]). Osser-viamo che

ψ = 〈ϕ,A〉

dove A := (A1, . . . , An) e ϕ := (ϕ1, . . . , ϕn) (ovvero che ψ può essere vista come prodottoscalare tra le funzioni a valori vettoriali A ed ϕ). Con questa notazione possiamo scriverein forma compatta che

ψ′ = 〈ϕ,A′〉+ 〈ϕ′, A〉.

Se quindi imponiamo la condizione 〈ϕ,A′〉 = 0 si ha:

ψ′ = 〈ϕ′, A〉.

Ripetendo il procedimento otteniamo

ψ′′ = 〈ϕ′, A′〉+ 〈ϕ′′, A〉,

e se imponiamo 〈ϕ′, A′〉 = 0 otteniamo

ψ′′ = 〈ϕ′′, A〉.

Page 73: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.5. EQUAZIONI LINEARI 73

Proseguiamo in questo modo n− 1 volte, no ad ottenere il seguente sistema di identitàψ′ = 〈ϕ′, A〉ψ′′ = 〈ϕ′′, A〉

...

ψ(n−1) = 〈ϕ(n−1), A〉

sotto le condizioni

〈ϕ,A′〉 = 0

〈ϕ′, A′〉 = 0...

〈ϕ(n−2), A′〉 = 0.

(3.11)

Una ulteriore derivazione produce l'uguaglianza

ψ(n) = 〈ϕ(n−1), A′〉+ 〈ϕ(n), A〉.

Ma allora:

Lψ = ψ(n) +

n−1∑j=0

an−jψ(j) = 〈ϕ(n−1), A′〉+ 〈ϕ(n), A〉+

n−1∑j=0

an−j〈ϕ(j), A〉

= 〈ϕ(n−1), A′〉+ 〈Lϕ,A〉,

dove Lϕ := (Lϕ1, . . . ,Lϕn). Ma ϕ1, . . . , ϕn sono nel nucleo, quindi Lϕ = 0, e così

Lψ = 〈ϕ(n−1), A′〉. (3.12)

Da (3.11) ed (3.12) segue che anché ψ soddis l'equazione Lψ = f basta che le A1, . . . , Ansoddisno

〈ϕ,A′〉 = 0

〈ϕ′, A′〉 = 0...

〈ϕ(n−2), A′〉 = 0

〈ϕ(n−1), A′〉 = f

ovvero W

A′1...

A′n−1

A′n

=

0...0f

dove W è la matrice Wronskiana associata alle ϕ1, . . . , ϕn.Sappiamo che detW (x) 6= 0 per ogni x, quindi il sistema nelle A′1, . . . , A

′n può sempre

essere risolto, e una volta fattolo si trovano le Aj integrando le A′j trovate. In una formula:A′1...

A′n−1

A′n

= W−1

0...0f

e quindi

A1(x)

...An−1(x)An(x)

=

∫ x

x0

W−1(u)

0...0

f(u)

du

e così

ψ(x) =n∑j=1

Aj(x)ϕj(x) = [ϕ1(x), . . . , ϕn(x)] ·

A1(x)...

An(x)

=[ϕ1(x) . . . ϕn(x)

] ∫ x

x0

W−1(u)

0...0

f(u)

du.

Page 74: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

74 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Volendo si può ulteriormente rielaborare questa formula. Infatti, la matrice inversa ècalcolabile come

W−1(u) =1

det(W (u))· [Wc]

t(u),

dove Wc(u) è la matrice dei cofattori di W (u) 4, ed il simbolo t indica la trasposizione.Inoltre il prodotto [Wc]

t(u) · [0, 0, . . . , f(u)]t di fatto seleziona l'ultima colonna di [Wc]t(u)

e la moltiplica per f(u), così

W−1(u) · [0, 0, . . . , f(u)]t = [Ultima colonna di [Wc]t(u)] · f(u)

det(W (u)),

che, tenuto conto della trasposizione, diventa

= [Ultima riga di Wc(u)]t · f(u)

det(W (u)).

Ora osserviamo che la variabile di integrazione è u, non x, quindi le quantità ϕ1(x), . . .,ϕn(x) sono di fatto costanti ai ni dell'integrazione e possono quindi essere portate al suointerno. Facendolo si ottiene l'identità

ψ(x) =

∫ x

x0

[ϕ1(x), ϕ2(x), . . . , ϕn(x)] · [Ultima riga di Wc(u)]t · f(u)

det(W (u))du.

Ora osserviamo che nel calcolo di

[ϕ1(x), ϕ2(x), . . . , ϕn(x)] · [Ultima riga di Wc(u)]t

di fatto ϕ1(x) moltiplica il primo termine dell'ultima riga di Wc(u) (che è (−1)n−1· de-terminante del minore di W ottenuto eliminando l'ultima riga e la prima colonna), ϕ2(x)moltiplica il secondo termine dell'ultima riga di Wc(u) (che è (−1)n−2· determinante delminore di W ottenuto eliminando l'ultima riga e la seconda colonna), e così via. Quindi

[ϕ1(x), ϕ2(x), . . . , ϕn(x)] · [Ultima riga di Wc(u)]t = det

ϕ1(u) . . . ϕn(u)

.... . .

...

ϕ(n−2)1 (u) . . . ϕ

(n−2)n (u)

ϕ1(x) . . . ϕn(x)

perché è esattamente quanto ci si trova a fare quando si svolge il calcolo di questo deter-minante sviluppandolo rispetto alla sua ultima riga. Abbiamo così scoperto che

ψ(x) =

∫ x

x0

det

ϕ1(u) . . . ϕn(u)

.... . .

...

ϕ(n−2)1 (u) . . . ϕ

(n−2)n (u)

ϕ1(x) . . . ϕn(x)

det

ϕ1(u) . . . ϕn(u)

.... . .

...

ϕ(n−2)1 (u) . . . ϕ

(n−2)n (u)

ϕ(n−1)1 (u) . . . ϕ

(n−1)n (u)

f(u) du. (3.13)

4ovvero la matrice che in posizione (i, j) (con i indice di riga, j indice di colonna) ha il prodotto di(−1)i−j per il determinante della sottomatrice di W (u) ottenuta cancellando la i-esima riga e la j-esimacolonna

Page 75: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.5. EQUAZIONI LINEARI 75

Si noti che nell'ultima riga del numeratore la variabile è x (non u come invece in tutte lealtre righe), e che il denominatore è sempre diverso da 0 perché è il Wronskiano.

3.5.4 Equazioni lineari a coecienti costanti: descrizione del nucleo

La formula precedente presuppone la conoscenza di una base per kerL e il Corollario 3.5.7contiene una ricetta per costruire una base: risolvere n problemi di Cauchy con condizioniindipendenti. Purtroppo questo è dicile da fare concretamente. Tuttavia questo può esserefatto in modo eciente qualora i coecienti aj dell'equazione siano costanti. Ecco come.Sia:

Ly = y(n) + a1y(n−1) + · · ·+ an−1y

(1) + any(0)

con aj ∈ R (costanti). Sia P ∈ R[z] il polinomio di grado n associato ad L denito da

P (z) := zn + a1zn−1 + · · ·+ an−1z + an.

Esso è detto polinomio caratteristico dell'equazione. Osserviamo che se y(x) = eλx, con λcostante, allora y′(x) = λeλx, y′′(x) = λ2eλx ed in generale y(j)(x) = λjeλx. Ne segue che

L(eλx) = P (λ)eλx.

Da questa relazione segue che se λ è una radice di P , ovvero se P (λ) = 0, allora

L(eλx) = P (λ)eλx = 0,

e quindi eλx ∈ kerL. Possiamo perciò costruire funzioni del nucleo prendendo eλx al variaredi λ tra le radici di P .

Esercizio 3.5.8. Sia data l'equazione: y′′ − 3y′ + 2y = 0, quindi con Ly = y′′ − 3y′ + 2y.Il polinomio caratteristico è P (z) = z2 − 3z + 2. Esso ha le radici 1 e 2, quindi ex ee2x sono nel nucleo. È chiaro che queste funzioni sono linearmente indipendenti, quindikerL = spanR(ex, e2x).

Vi sono però due problemi, illustrati dai due esempi seguenti.

Esempio 3.5.9. (radici multiple.) Si consideri: y′′ − 2y′ + y = 0. Il polinomio caratteristicoP (z) = z2 − 2z + 1 = (z − 1)2 ha una sola radice, l' 1; la procedura costruisce la solafunzione ex ma il nucleo ha dimensione due quindi manca un secondo elemento per avereuna base.

Esempio 3.5.10. (radici non reali.) Si consideri: y′′+2y′+5y = 0. Il polinomio caratteristicoha radici −1 + 2i e −1 − 2i non reali. Le funzioni e(−1+2i)x e e(−1−2i)x non sono a valorireali e quindi non sono nel kerL reale.

Entrambi i problemi posso però essere risolti. Ricordiamo che se λ ∈ C è una radice di unpolinomio P ∈ C[z], allora la molteplicità µ di λ è il massimo esponente intero tale che(z − λ)µ divide P (z) in C[z]. Quindi se λ1, . . . , λk sono le radici distinte in C di P e seµ1, . . . , µk le loro molteplicità e P è monico5 dal teorema fondamentale dell'algebra segueche

P (z) = (z − λ1)µ1 · · · (z − λk)µk .

Se poi P ∈ R[z] (quindi è a coecienti reali) e se λ ∈ C è una radice di P , allora anche λè radice di P (perché il fatto che P abbia coecienti reali fa sì che P (λ) = P (λ) = 0 = 0)e le molteplicità di λ e λ sono uguali.

5Ovvero il coeciente del termine di grado massimo è 1.

Page 76: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

76 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Teorema 3.5.11. Sia L a coecienti costanti e P il suo polinomio caratteristico. Ad ogniλ preso nell'insieme delle radici reali di P ed ad ogni coppia (λ, λ) di radici complesse nonreali associamo le seguenti funzioni:

• a λ ∈ R, detta µ la molteplicità di λ, associamo

eλx, xeλx, x2eλx, . . . , xµ−1eλx µ funzioni;

• alla coppia (λ, λ) ∈ C\R, detta µ la molteplicità di λ e posto λ =: u + iv, u, v ∈ R,associamo:

eux cos(vx), xeux cos(vx), . . . , xµ−1eux cos(vx)eux sin(vx), xeux sin(vx), . . . , xµ−1eux sin(vx)

µ+ µ funzioni.

Le n funzioni costruite in questo modo sono nel kerL e sono linearmente indipendenti.Esse quindi ne sono una base perché dim kerL = n.

Dimostrazione. Sia λ radice di molteplicità µ. Allora P (z) = Q(z)(z−λ)µ con Q(z) ∈ C[z].Osserviamo che L = P ( d

dx), ovvero L è l'operatore dierenziale associato al polinomio Pdalla sostituzione

zj 7→ d

dx · · · d

dx︸ ︷︷ ︸j volte

=dj

dxj.

L'operatore ddx e l'operatore λ· (quello che moltiplica per lo scalare λ) commutano, ovvero

ddx(λ(f(x)) = λ( d

dx(f(x))) perché λ è costante. Ne segue che

L = P( d

dx

)= Q

( d

dx

)( d

dx− λ

)µ. (3.14)

Osserviamo che ( d

dx− λ

)(eλx) = λeλx − λeλx = 0

e che ( d

dx− λ)

(xleλx) = lxl−1eλx + λxleλx − λxleλx = lxl−1eλx.

Quindi iterando si ha( d

dx− λ)µ

(xleλx) = l(l − 1)(l − 2) · · · (l − µ+ 1)xl−µeλx,

che è identicamente 0 quando l < µ, perché in tal caso si annulla il coeciente l(l −1) . . . (l − µ+ 1). Questo dimostra che

L(xleλx) = P( d

dx

)(xleλx) = Q

( d

dx

)( d

dx− λ

)µ(xleλx) = 0

se l < µ, ovvero che eλx, xeλx, . . . , xµ−1eλx appartengono al nucleo di L. Si osservi che ilcalcolo vale anche se λ ∈ C.Ora mostriamo che le funzioni elencate nel teorema sono linearmente indipendenti. Bastafarlo per la famiglia di funzioni

eλx, xeλx, . . . , xµ−1eλx (3.15)

Page 77: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.5. EQUAZIONI LINEARI 77

perché la famiglia eux cos(vx), eux sin(vx), . . . è combinazione lineare (complessa) di quellaesponenziale.Siano λ1, . . . , λk le radici in C distinte e siano µ1, . . . , µk le loro molteplicità. La genericacombinazione lineare delle (3.15) corrisponde ad una somma della forma

k∑j=1

pj(x)eλjx,

dove ogni pj è un polinomio a coecienti complessi di grado strettamente minore di µj .Dimostriamo la tesi mostrando che se tale combinazione è la funzione identicamente nullaallora sono nulli tutti i pj . Supponiamo dunque che

k∑j=1

pj(x)eλjx = 0 ∀x. (3.16)

Possiamo escludere dalla somma quei pj che fossero identicamente nulli, quindi possiamoassumere che per assurdo ogni pj nella (3.16) sia diverso dal polinomio nullo. Per derivazioneda (3.16) segue che

k∑j=1

(p′j(x) + λjpj(x))eλjx = 0.

Ripetendo la derivazione otteniamo

k∑j=1

(p′′j (x) + 2λjp′j(x) + λ2

jpj(x))eλjx = 0,

e procedendo in questo modo k − 1 volte otteniamo il sistema di k equazionip1 p2 . . . pk

p′1 + λ1p1 p′2 + λ2p2 . . . p′k + λkpkp′′1 + 2λ1p

′1 + λ2

1p1 p′′2 + 2λ2p′2 + λ2

2p2 . . . p′′k + 2λkp′k + λ2

kpk...

.... . .

...

eλ1x

eλ2x

...eλkx

= 0.

Sia M la matrice k× k che appare a sinistra nella identità precedente. Visto che il vettore[eλ1x, . . . , eλkx] non è il vettore nullo qualunque sia il valore di x, il determinante diM deveessere nullo identicamente in x. Osserviamo che il grado di p′1 è sempre minore di quello dip1 quindi se p1(x) = a1x

deg p1+ termini di grado minore, allora

l∑j=0

(l

j

)λj1p

(l−j)1 = λl1a1x

deg p1 + termini di grado minore

e quindi

0 = detM

= a1a2 · · · ak det

1 1 . . . 1λ1 λ2 . . . λk...

.... . .

...λk−1

1 λk−12 . . . λk−1

k

xdeg p1+deg p2+···+deg pk + termini grado minore

= a1a2 · · · ak∏

1≤i<j≤k(λj − λi)xdeg p1+deg p2+···+deg pk + termini grado minore

Page 78: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

78 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

(l'ultima uguaglianza è l'identità di Van der Monde). Ma questo è impossibile perchéa1, . . . , ak sono 6= 0 e i λj sono due a due distinti. Siamo dunque arrivati a un assurdo chenasce dall'ipotesi che i pj non siano il polinomio nullo.

3.6 Alcuni esempi interessanti

Sia y′′ + 4y = 0. Le radici del polinomio caratteristico sono ±2i e quindi lo spazio dellesoluzioni è spanR(cos(2x), sin(2x)). Se poi imponiamo le condizioni

y′′ + 4y = 0

y(0) = a

y′(0) = b

la soluzione del P.C. è a cos(2x) + b2 sin(2x).

Sia Ex la mappa che manda

[y(0)y′(0)

]7→[y(x)y′(x)

](evoluzione al punto x).

E0

y

y′

Ex

y

y′

x

Allora:

Ex

([ab

])=

[a cos(2x) + b

2 sin(2x)−2a sin(2x) + b cos(2x)

]=

[cos(2x) 1

2 sin(2x)−2 sin(2x) cos(2x)

] [ab

].

quindi Ex è una mappa lineare, che può essere decomposta come[1√2

0

0√

2

] [cos(2x) sin(2x)− sin(2x) cos(2x)

][√2 0

0 1√2

].

Si noti che la matrice centrale Rx rappresenta una rotazione.

Osservazione 3.6.1. Come Ex trasforma una regione del piano? Proviamo con un quadrato:

y

y′

[√2 00 1√

2

]

y

y′[

cos 2x sin 2x− sin 2x cos 2x

]y

y′

[ 1√2

0

0√

2

]

y

y′

Page 79: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.7. SOLUZIONE PARTICOLARE PER LE LINEARI A COEFFICIENTI COSTANTI79

Si osservi che Ex ha conservato l'area. Questo deriva dal fatto che detEx = 1 e questoa sua volta accade perché la matrice Ex è la Wronskiana del sistema (con base cos(2x)e 1

2 sin(2x)) e sappiamo che (detW )′ = −a1 detW dove a1 è il coecienti dell'equazioney′′ + a1y

′ + a2y = 0. In questo caso a1 = 0, quindi detW è costante e così detEx =detW (x) = detW (0) = 1.

Osservazione 3.6.2. Per ogni x, z ∈ R, si ha Ex · Ez = Ex+z. Infatti

Ex · Ez =

[1√2

0

0√

2

]Rx

[√2 0

0 1√2

][1√2

0

0√

2

]Rz

[√2 0

0 1√2

]

=

[1√2

0

0√

2

]RxRz

[√2 0

0 1√2

]=

[1√2

0

0√

2

]Rx+z

[√2 0

0 1√2

]= Ex+z.

Quindi l'insieme degli Ex : x ∈ R è un gruppo abeliano di trasformazioni del piano (difatto un sottogruppo di SL(2,R)). Anche questo fenomeno ha una spiegazione generale maillustrarla ci porterebbe troppo lontano. . .

3.7 Soluzione particolare per le lineari a coecienti costanti

Consideriamo ora l'equazione non omogenea

y(n) + a1y(n−1) + · · ·+ any = f(x), f(x) ∈ C([a, b]).

Visto che conosciamo una base esplicita per il nucleo, possiamo trovare una soluzioneparticolare usando la formula generale (3.13). Questo è in eetti tutto quello che si puòdire per una generica funzione. Tuttavia per certe f di forma speciale si può trovare unasoluzione seguendo una strada puramente algebrica.

Teorema 3.7.1. Sia f(x) = q(x)eλx con q ∈ R[x] e λ ∈ R. Sia µ la molteplicità di λ comeradice del polinomio caratteristico dell'equazione (con µ = 0 se λ non è radice). Alloraesiste r(x) ∈ R[x] con deg r = deg q tale che

L(xµr(x)eλx) = q(x)eλx.

Ovvero l'equazione Ly = q(x)eλx ha xµr(x)eλx come soluzione particolare. Questo consentedi trovare r per via algebrica.

Dimostrazione. Per ogni scelta di interi k e d e di λ ∈ R consideriamo l'insieme di funzioni

V(k,λ)d := ϕ(x) : ϕ(x) = r(x)xkeλx con r ∈ R[x] e grado di r ≤ d.

Osserviamo che V (k,λ)d è uno spazio R−vettoriale di dimensione d + 1 perché k e λ so-

no ssati quindi gli stessi per tutti gli elementi. La dimostrazione consiste nel vericareseparatamente due cose. Precisamente

i. cheL : V

(µ,λ)d → V

(0,λ)d ,

ovvero L manda elementi della forma r(x)xµeλx dove µ è la molteplicità di λ e gradodi r ≤ d, in elementi della forma q(x)eλx con grado q ≤ d);

Page 80: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

80 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

ii. che L è iniettiva.

Fatto ciò, visto che dimV(µ,λ)d = d + 1 = dimV

(0,λ)d , ne segue che L è anche suriettiva,

ovvero la tesi. Entrambi i fatti discendono da questo calcolo:

∀λ ∈ C si ha( d

dx− λ)

(xmeλx) = (mxm−1 + (λ− λ)xm)eλx.

In particolare il risultato ha grado strettamente minore di m se e solo se λ = λ. Comenel testo del teorema, sia ora µ la molteplicità di λ come radice del polinomio caratteri-stico P (con µ = 0 qualora λ non sia radice). Fattorizzando completamente P in C, laformula (3.14) per l'operatore L può anche essere scritta come

L = P( d

dx

)=∏j

( d

dx− λj

)( d

dx− λ

)µ,

dove le λj sono le radici (in C) di P diverse da λ (ma eventualmente uguali tra loro).Si osservi che questa scrittura ha senso anche nel caso in cui µ = 0 (ovvero λ non è unaradice), oppure in cui non ci sono radici λj 6= λ (in tal caso il prodotto in j è vuoto ed èposto uguale a 1). Di conseguenza, in particolare, si ha

L(xµ+deλx) =∏j

( d

dx− λj

)( d

dx− λ)µ

(xµ+deλx).

Il calcolo precedente mostra che ogni applicazione di ddx − λ su xµ+deλx ne fa diminuire il

grado in x di una (ed una sola) unità, mentre gli altri operatori ddx − λj non ne mutano il

grado. Questo dimostra che

L(xµ+deλx) ∈ V (0,λ)d \V (0,λ)

d−1 .

Il fatto che l'immagine sia in V (0,λ)d dimostra i., perché ogni elemento di V (µ,λ)

d è somma ditermini della forma xµ+d′eλx con d′ ≤ d, ed il calcolo mostra che essi sono tutti mandantiin V (0,λ)

d′ che è contenuto in V (0,λ)d .

Il fatto che l'immagine non sia in V (0,λ)d−1 dimostra invece ii. Infatti supponiamo che il nucleo

di L in V(µ,λ)d non sia banale e che quindi esista un elemento xµw(x)eλx con degw ≤ d

mandato dal L in 0, nonostante w non sia zero (quindi degw 6= −∞). Sia w(x) = axdegw+w(x), dove w(x) ha grado strettamente inferiore. Il calcolo precedente mostra che

0 = L(xµw(x)eλx) = L(xµ(axdegw + w(x))eλx) = aL(xµ+degweλx) + L(xµw(x)eλx)

ovveroL(xµw(x)eλx) = −aL(xµ+degweλx)

ma questo è assurdo poiché il lato sinistro è in V (0,λ)degw−1 mentre il lato destro non appartiene

a questo spazio.

Osservazione 3.7.2. Il teorema è applicabile a ogni λ ∈ R quindi anche quando λ = 0,ovvero quando f(x) = q(x) e quindi quando f è un polinomio.

Page 81: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.7. SOLUZIONE PARTICOLARE PER LE LINEARI A COEFFICIENTI COSTANTI81

Osservazione 3.7.3. Il teorema è applicabile anche se la radice λ è complessa. In tal casoperò si dovrà tener conto del fatto che anche l'esponenziale eλx è a valori complessi e nonreali.

Esempio 3.7.4. Sia y′′ − 4y = (x+ 2)ex. Il polinomio caratteristico è z2 − 4 e ha radici ±2con molteplicità uno.La funzione f(x) := (x + 2)ex è della forma prevista con λ = 1 di molteplicità zero(non è radice) e q(x) := x + 2. Allora esiste una soluzione della forma xµr(x)eλx ovverox0(ax+b)ex = (ax+b)ex con a e b opportuni. Per trovarli osserviamo che se y = (ax+b)ex

alloray′ = (ax+ a+ b)ex , y′′ = (ax+ 2a+ b)ex.

Così

(x+ 2)ex = y′′ − 4y =(ax+ 2a+ b− 4(ax+ b)

)ex = (−3ax+ 2a− 3b)ex.

Ma allora x+ 2 = −3ax+ 2a− 3b da cui si ricava−3a = 1

2a− 3b = 2=⇒ a = −1

3, b = −8

9.

La soluzione generale è quindi αe2x + βe−2x − (13x+ 8

9)ex con α, β ∈ R.Esempio 3.7.5. Sia y′′ − 4y = (x+ 2)e2x. Come prima il polinomio caratteristico è z2 − 4e ha radici ±2 con molteplicità uno.La funzione f(x) := (x + 2)e2x è della forma prevista con λ = 2 di molteplicità uno eq(x) := x + 2. Allora esiste una soluzione della forma xµr(x)eλx ovvero x1(ax + b)e2x =(ax2 + bx)e2x con a e b opportuni. Per trovarli osserviamo che se y = (ax2 + bx)e2x allora

y′ = (2ax2 + (2a+ 2b)x+ b)e2x , y′′ = (4ax2 + (8a+ 4b)x+ 2a+ 4b)e2x.

Così

(x+ 2)e2x = y′′ − 4y =(4ax2 + (8a+ 4b)x+ 2a+ 4b− 4(2ax2 + (2a+ 2b)x+ b)

)e2x

= (8ax+ 2a+ 4b)e2x.

Ma allora x+ 2 = 8ax+ 2a+ 4b da cui si ricava8a = 1

2a+ 4b = 2=⇒ a =

1

8, b =

7

16.

La soluzione generale è quindi αe2x + βe−2x + (18x+ 7

16)e2x con α, β ∈ R.

Usando le formule cosx = 12(eix + e−ix) e sinx = 1

2(eix − e−ix) (e le inverse eix = cosx+i sinx, e−ix = cosx− i sinx) si dimostra la seguente variante. Sia,

f(x) = q(x)eux cos(vx),

con q ∈ R[x] ed u, v ∈ R. Sia µ la molteplicità di u + iv come radice del polinomiocaratteristico. Allora esistono due polinomi r1 e r2 in R[x] con grado entrambi ≤ deg q taliche

L(xµ(r1(x) cos(vx) + r2(x) sin(vx))eux) = q(x)eux cos(vx),

ovvero l'equazione Ly = f ha xµ(r1(x) cos(vx) + r2(x) sin(vx))eux quale soluzione.

Page 82: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

82 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Osservazione 3.7.6. In generale r1 e r2 sono entrambi 6= 0, ovvero la soluzione contiene siacos(vx), sia sin(vx) anche se in f(x) appare solo cos(vx).

Osservazione 3.7.7. Il fatto che il grado di r1 e r2 sia minore o uguale di quello di q consentedi individuare r1 e r2 per via algebrica.

Osservazione 3.7.8. La stessa conclusione vale anche nel caso in cui f(x) = q(x)eux sin(vx).

Esercizio 3.7.9. Si supponga che il polinomio caratteristico P dell'equazione dierenzialelineare a coecienti costanti Ly = f abbia radici distinte (complesse o reali non importa,comunque se si vuole si può assumere che siano in R), λ1, . . . , λn. Vericare che allora laformula (3.13) che dà una soluzione particolare dell'equazione assume la forma∫ x

x0

n∑j=1

eλj(x−u)

P ′(λj)f(u) du.

Come diventa questa formula qualora vi siano radici coincidenti? Usate questa formula perdare una dimostrazione alternativa della tesi del Teorema 3.7.1.

Osservazione 3.7.10. Si osservi che l'espressione trovata nell'esercizio precedente è dellaforma ∫ x

x0

K(x− u) f(u) du

per una opportuna funzione K ∈ C∞(R). Integrali di questo tipo godono di varie proprietàspeciali e sono chiamati integrali di convoluzione. La loro comparsa in questa formula èlegata al fatto che l'operatore dierenziale L è a coecienti costanti, ovvero indipendentida x: questo fa sì che l'operatore L commuti con ogni operatore di traslazione τs, ovverosi abbiano le identità

τsL = Lτs, ∀s ∈ R

dove τs è quell'operatore che trasforma la generica funzione g nella funzione (τsg)(x) :=g(x−s)). Si osservi che l'insieme τs : s ∈ R è un gruppo continuo e abeliano. Si dimostrache g ∈ kerL se e solo se τsg ∈ kerL per ogni s. Come vedrete in seguito, il Teorema diNoether è una generalizzazione di questa osservazione e mostra l'esistenza di un profondolegame tra invarianza dell'equazione dierenziale, esistenza di un usso ad un parametroche agisce sulle soluzioni, ed esistenza di una legge di conservazione.

3.7.1 Generalizzare l'esponenziale

La funzione esponenziale exp(x) può essere denita come l'unica soluzione dell'equazionedierenziale y′ = y che soddis la condizione y(0) = 1. Anche le funzioni iperboliche hannouna caratterizzazione simile: cosh(x) e sinh(x) sono le soluzioni dell'equazione dierenzialey′′ = y che soddisfano rispettivamente le condizioni y(0) = 1, y′(0) = 0 (per il cosenoiperbolico) ed y(0) = 0, y′(0) = 1 (per il seno iperbolico).Visto che questi problemi di Cauchy individuano univocamente tali funzioni, tutte le pro-prietà che le rendono utili6 in realtà sono già codicate in essi. In questa sezione vogliamosia evidenziare questo fatto sia generalizzarlo ulteriormente.

6Tipicamente l'identità cosh2(x)− sinh2(x) = 1 e le formule di addizione

exp(x+ y) = exp(x) exp(y),

cosh(x+ y) = cosh(x) cosh(y) + sinh(x) sinh(y), sinh(x+ y) = sinh(x) cosh(y) + cosh(x) sinh(y).

Page 83: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.7. SOLUZIONE PARTICOLARE PER LE LINEARI A COEFFICIENTI COSTANTI83

Fissiamo dunque un ordine k e consideriamo l'equazione dierenziale y(k) = y. Si tratta diuna equazione lineare a coecienti costanti. Possiamo quindi già concludere che ogni pro-blema di Cauchy con questa equazione ammette una ed una sola soluzione su R, e che ognisoluzione è in realtà di classe C∞(R) (per la regolarità basta osservare che ogni funzione ϕche sia soluzione dell'equazione deve essere di tipo Ck(R), dopo di che essendo ϕ(k) = ϕ,deve avere ϕ(k) ∈ Ck(R). Iterando questa osservazione si conclude che ϕ ∈ C∞(R)).Osserviamo inoltre che se ϕ è una soluzione dell'equazione, allora anche tutte le sue deri-vate lo sono. Questo è un eetto della particolare struttura dell'equazione che permette leseguenti uguaglianze(

ϕ(j))(k)

= ϕ(j+k) =(ϕ(k)

)(j)= ϕ(j) ∀j ∈ N.

Per ogni n = 0, . . . , k − 1, sia ϕn la soluzione del problema di Cauchyy(k) = y

y(j)(0) = δj,n ∀j = 0, . . . , k − 1,

dove δj,n := 1 se j = n e 0 altrimenti. Sappiamo che queste k funzioni sono una base perlo spazio delle soluzioni dell'equazione. In realtà sono tutte legate tra loro da una semplicerelazione dierenziale. Per formularla facilmente conviene estendere l'insieme degli indiciin modo k-periodico, ovvero porre

ϕn+`k := ϕn ∀n = 0, . . . , k − 1, ∀` ∈ Z.

Si osservi che le funzioni ϕ0, . . . , ϕk−1 sono tutte distinte, ma che per eetto della estensioneesistono anche ϕk, ϕ−1, ϕk+1, che di fatto coincidono rispettivamente con ϕ0, ϕk−1 e ϕ1.Con questa notazione, la funzione ϕn risulta essere l'unica soluzione del problema di Cauchy

ϕ(k)n = ϕn

y(j)(0) = δn=j (mod k) ∀j = 0, . . . , k − 1

(dove ora δn=j (mod k) rappresenta la funzione che vale 1 quando n = j (mod k) e 0 altri-menti). Da questo discende subito che

ϕ(j)n = ϕn−j ∀n, j ∈ Z, (3.17)

ovvero che non solo la derivata j-esima di una soluzione è anch'essa una soluzione, madi fatto la derivata j-esima della soluzione numero n è la soluzione numero n − j. Siosservi che questo fatto generalizza le relazioni exp′(x) = exp(x) ed cosh′(x) = sinh(x),sinh′(x) = cosh(x).Veniamo ora alle formule di addizione. Fissiamo z ∈ R, e consideriamo le funzioni

ψn,z(x) := ϕn(x+ z) e φn,z(x) :=

k−1∑`=0

ϕ`(x)ϕn−`(z).

Entrambe soddisfano l'equazione dierenziale y(k) = y (si ricordi che le derivate sonoprese rispetto ad x; la quantità z è vista come parametro reale arbitrario ma ssato): laprima per calcolo immediato, la seconda perché è combinazione lineare (con coecientiche dipendono da z, ma che comunque sono costanti essendo z ssato) di funzioni che

Page 84: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

84 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

soddisfano tale equazione. D'altra parte, è chiaro che per ogni indice di derivazione j si hasia

ψ(j)n,z(0) = ϕ(j)

n (z),

sia

φ(j)n,z(0) =

k−1∑`=0

ϕ(j)` (0)ϕn−`(z) =

k−1∑`=0

δ`−j (mod k)ϕn−`(z) = ϕn−j(z) = ϕ(j)n (z).

Le funzioni ψn,z e φn,z quindi devono coincidere, poiché risolvono il medesimo problema diCauchy. Questo fornisce l'identità

ϕn(x+ z) = ψn,z(x) = φn,z(x) =k−1∑`=0

ϕ`(x)ϕn−`(z).

Visto che questa è stata vericata per ogni z ssato e per ogni x ∈ R, di fatto abbiamovericato la formula di addizione

ϕn(x+ z) =

k−1∑`=0

ϕ`(x)ϕn−`(z), ∀x, z ∈ R. (3.18)

Si osservi che queste identità nel caso k = 1 e nel caso k = 2 sono le formule di addizioneper exp e per la coppia di funzioni cosh, sinh:

k = 1 ϕ0(x+ z) = ϕ0(x)ϕ0(z) ovvero exp(x+ z) = exp(x) exp(z);

ed

k = 2

ϕ0(x+ z) = ϕ0(x)ϕ0(z) + ϕ1(x)ϕ−1(z)

ϕ1(x+ z) = ϕ0(x)ϕ1(z) + ϕ1(x)ϕ0(z),

ovvero

cosh(x+ z) = cosh(x) cosh(z) + sinh(x) sinh(z)

sinh(x+ z) = cosh(x) sinh(z) + sinh(x) cosh(z).

Un modo forse migliore di esprimere queste identità è però il seguente. Sia

W := W (ϕ0, ϕ1, . . . , ϕk−1) :=

ϕ0 ϕ1 . . . ϕk−1

ϕ′0 ϕ′1 . . . ϕ′k−1...

... . . ....

ϕ(k−1)0 ϕ

(k−1)1 . . . ϕ

(k−1)k−1

la matrice wronskiana associata alle funzioni ϕ0, ϕ1, . . . , ϕk−1, prese in questo ordine. Pervia delle identità in (3.17) questa matrice è costante sulle diagonali (quindi è una matricedi Toeplitz) e anzi è addirittura circolante (ovvero ogni riga è ottenuta per shift a destradella riga che la precede), e coincide con

E :=

ϕ0 ϕ1 . . . ϕk−1

ϕk−1 ϕ0 . . . ϕk−2...

... . . ....

ϕ1 ϕ2 . . . ϕ0

. (3.19)

Page 85: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.7. SOLUZIONE PARTICOLARE PER LE LINEARI A COEFFICIENTI COSTANTI85

In termini di E (e quindi di W , visto che sono uguali), le formule di addizione (3.18)diventano

E(x+ z) = E(x) · E(z) ∀x, z ∈ R.

Da questo segue immediatamente che l'insieme delle matrici E(x) : x ∈ R costituisce unsottogruppo abeliano in GL(k,R) e che la mappa R → GL(k,R) che manda x 7→ E(x) èuna rappresentazione di R in Rk.Supponiamo ora che k sia almeno 2. Allora l'equazione dierenziale y(k) = y scritta nellaforma standard (3.10) manca del termine di ordine k − 1, ovvero il suo coeciente a1 èzero. Per la Proposizione 3.5.6 questo implica che il determinante diW è in realtà costante,così che

(detE)(x) = (detW )(x) = (detW )(0) = (detE)(0) = 1 ∀x ∈ R.

Questa relazione generalizza l'identità cosh2(x)− sinh2(x) = 1 ad ogni k ≥ 2 (e non ha unanalogo in k = 1, ovvero per l'esponenziale).Le funzioni ϕn ammettono anche due descrizioni abbastanza esplicite, entrambe importanti.La prima fornisce lo sviluppo in serie di potenze, ed è

ϕn(x) =+∞∑`=0

`=n (mod k)

x`

`!. (3.20)

Si noti come la somma sia di fatto solo sugli interi che sono congruenti a n modulo k, ecome questa espressione generalizzi gli sviluppi di exp, cosh e sinh, visto che

k = 1; ϕ0(x) =

+∞∑`=0

`=0 (mod 1)

x`

`!=

+∞∑`=0

x`

`!= exp(x)

e che

k = 2;

ϕ0(x) =

+∞∑`=0

`=0 (mod 2)

x`

`!=

+∞∑`=0` even

x`

`!= cosh(x)

ϕ1(x) =+∞∑`=0

`=1 (mod 2)

x`

`!=

+∞∑`=0` odd

x`

`!= sinh(x).

La validità di (3.20) può essere vericata anzitutto constatando che la serie di potenze haraggio innito e quindi converge in tutto R. Poi osservando che il teorema di derivazionedelle serie di potenze garantisce che per ogni indice j ∈ N si ha

[ +∞∑`=0

`=n (mod k)

x`

`!

](j)=

+∞∑`=j

`=n (mod k)

` · (`− 1) · · · (`− j + 1)x`−j

`!

=+∞∑l=0

l=n−j (mod k)

(l + j) · (l + j − 1) · · · (l + 1)xl

(l + j)!=

+∞∑l=0

l=n−j (mod k)

xl

l!.

Page 86: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

86 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Usando queste identità si vede subito che la serie di potenze in (3.20) soddisfa il medesimoproblema di Cauchy risolto da ϕn, e ciò basta per dimostrare che essa coincide con ϕn.La seconda rappresentazione è invece come somma di opportuni esponenziali complessi,ed è determinato ad esempio nel modo seguente. Il polinomio caratteristico dell'equazioney(k) = y è λk − 1. Le radici caratteristiche sono quindi le soluzioni di λk = 1, ovvero lek-esime radici (complesse) dell'unità. Ogni ϕn deve quindi essere esprimibile come sommadelle funzioni exp(x), exp(ζkx), exp(ζ2

kx), . . . , exp(ζk−1k x), dove ζk := exp(2πi/k). Questa

rappresentazione può essere dedotta dal seguente calcolo. Osserviamo anzitutto che

k−1∑j=0

ζ`jk =k−1∑j=0

(ζ`k)j e se k non divide ` allora è

ζ`kk −1

ζ`k−1= 0,

se invece k divide ` allora è k.

Quindi

1

k

k−1∑j=0

ζ`jk = δ`=0 (mod k). (3.21)

Da questo e dalla uguaglianza in (3.20) segue che

ϕn(x) =

+∞∑`=0

`=n (mod k)

x`

`!=

+∞∑`=0

δ`−n=0 (mod k)x`

`!=

+∞∑`=0

1

k

k−1∑j=0

ζ(`−n)jk

x`

`!

=1

k

k−1∑j=0

+∞∑`=0

ζ(`−n)jk

x`

`!=

1

k

k−1∑j=0

ζ−njk

+∞∑`=0

ζ`jkx`

`!=

1

k

k−1∑j=0

ζ−njk

+∞∑`=0

1

`!

(ζjkx)`.

La serie interna è una nostra vecchia conoscenza: essa rappresenta l'esponenziale (comples-so) calcolato in ζjkx. Abbiamo quindi dimostrato che

ϕn(x) =1

k

k−1∑j=0

ζ−njk exp(ζjkx)

x ∈ R, ∀n ∈ N, (3.22)

che eettivamente esprime ϕn(x) come combinazione lineare delle exp(ζjkx). Il calcolo che

abbiamo appena svolto ha una lunga storia, ed è di fatto un esempio di analisi/sintesi diFourier (qui sul gruppo ciclico di k elementi). Per ora questo è poco più di un nome, ma neicorsi successivi avrete sicuramente modo di generalizzare questa procedura e di riconoscerein essa uno strumento fondamentale di indagine.Per k = 2 questa formula fornisce le consuete identità

cosh(x) = ϕ0(x) =1

2

(exp(x) + exp(−x)

), sinh(x) = ϕ1(x) =

1

2

(exp(x)− exp(−x)

).

Anche le rappresentazioni (3.22) possono essere meglio espresse se organizzate in matrice.Infatti, sia Mk la matrice di M(k × k,C) data da

Mk :=1√k

(ζnjk )k−1n,j=0.

Allora l'identità (3.21) aerma che

Mk ·M∗k = M∗k ·Mk = I (3.23)

Page 87: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

3.7. SOLUZIONE PARTICOLARE PER LE LINEARI A COEFFICIENTI COSTANTI87

(la matrice M∗k è per denizione l'aggiunta di Mk, cioè la sua trasposta coniugata) ovveroche Mk è unitaria, e le varie identità in (3.22) per n = 0, . . . , k−1 possono essere riassuntescrivendo che[

ϕ0, ϕ1, · · · , ϕk−1

]=

1√k

[exp(x), exp

(ζkx), · · · , exp

(ζk−1k x

)]·M∗k

(l'uguaglianza è da intendersi come uguaglianza tra matrici, in particolare quello a destraè un prodotto riga per colonne). Anche la matrice E può essere riscritta usando questanuova base. Infatti un breve calcolo basato sulla (3.22) mostra che

E(x) = M∗k ·D(x) ·Mk,

dove D(x) := diag(exp(x), exp(ζkx), . . . , exp(ζk−1k x)). Si osservi che questa formula e

la (3.23) consentono di ridimostrare la (3.19). Infatti l'identità D(x) ·D(z) = D(x + z) èevidente, e così si ha

E(x)E(z) = M∗kD(x)Mk ·M∗kD(z)Mk = M∗kD(x) ·D(z)Mk = M∗kD(x+ z)Mk = E(x+ z).

Vi sarebbero molte altre cose da discutere, ma forse è meglio fermarsi qui.

Page 88: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

88 CAPITOLO 3. EQUAZIONI DIFFERENZIALI

Page 89: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 4

Curve, campi vettoriali, forme

dierenziali

4.1 Curve

Denizione 4.1.1. Sia Ω ⊆ Rn, aperto. Chiamiamo curva in Ω qualunque mappa con-tinua ϕ : [a, b] ⊆ R → Ω. L'immagine γ di ϕ è detto sostegno della curva e ϕ è dettaparametrizzazione di γ.

ba

ϕp qγ

Osservazione 4.1.2. Il dato geometrico è codicato in γ, quindi capiterà spesso di chiamarecurva quello che è (solo) il sostegno di una data curva.

Denizione 4.1.3. La curva è detta:

• Chiusa quando ϕ(a) = ϕ(b).

p = q p = q

• Semplice quando ϕ è iniettiva in [a, b) e in (a, b].

Curve non semplici

• Regolare quando ϕ è C1 e ϕ′(t) 6= 0 per ogni t ∈ [a, b].

• Regolare a tratti quando esistono a = t0 < t1 < · · · < tn = b tali che ϕ è regolare inogni tratto [tj , tj+1].

89

Page 90: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

90 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

t0 t1 t2 t3

a b

ϕ

Osservazione 4.1.4. La denizione di regolarità è probabilmente strana. Il fatto è che sivuole che l'oggetto non solo sia regolare dal punto di vista analitico (ovvero ϕ ∈ C1) mache lo sia anche dal punto di vista geometrico (ovvero ϕ′(t) 6= 0 per ogni t). La condizione

ϕ′(t) 6= 0 consente infatti di denire un versore tangente τ(t) := ϕ′(t)‖ϕ′(t)‖ in ogni punto. Si

osservi che ‖τ(t)‖ = 1 per ogni t.

p

τ

4.1.1 Classe di equivalenza e orientazione

Sia ϕ : [a, b] → Rn una curva, sia poi f : [a′, b′] → [a, b] una mappa biunivoca e bidieren-ziale (quindi f e f−1 entrambi C1, ovvero f è un dieomorsmo). Allora

ϕ := ϕ f : [a′, b′]→ Rn

è una nuova curva con lo stesso sostegno di ϕ. Inoltre ϕ sarà chiusa/ regolare/ regolare atratti/ semplice se e solo se ϕ ha le medesime proprietà.Sotto molti punti di vista quindi ϕ e ϕ sono la stessa cosa; ciò suggerisce di introdurre unarelazione di equivalenza, che denoteremo con ∼, in base alla quale ϕ e ϕ sono equivalentiquando esiste un dieomorsmo f tale che ϕ = ϕ f (e scriveremo ϕ ∼ ϕ, appunto). Sitratta eettivamente di una relazione di equivalenza. Inoltre le informazioni geometrichesono legate non tanto alla curva (cioè a ϕ) quanto alla classe di equivalenza [ϕ]/∼ .Per dimostrare che qualche concetto è quindi geometrico nonostante sia denito usandouna specica ϕ si dovrà vericare che esso dipende solo dalla classe di equivalenza [ϕ]/∼ .Ad esempio:

Denizione 4.1.5. Data ϕ : [a, b] → Rn regolare a tratti, chiamiamo lunghezza (delsostegno γ) della curva ϕ il numero

`(γ) :=

∫ b

a‖ϕ′(t)‖ dt.

In eetti l'integrale esiste ed il suo valore non cambia quando si utilizza una diversa ϕ cheè equivalente a ϕ.

Dimostrazione. Se ϕ = ϕ f con f : [a′, b′]→ [a, b] dieomorsmo. La derivata di f non siannulla in alcun punto, poiché f è un dieomorsmo. Quindi essa è o sempre negativa osempre positiva. Supponiamo f ′ > 0. Allora a = f(a′) e b = f(b′) e si ha∫ b

a‖ϕ′(t)‖ dt =

∫ b′

a′‖ϕ′(f(u))‖f ′(u) du =

∫ b′

a′‖ϕ′(f(u))f ′(u)‖du =

∫ b′

a′‖ϕ′(u)‖ du.

Page 91: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.1. CURVE 91

Se invece si suppone f ′ < 0, e allora a = f(b′) e b = f(a′), si ha∫ b

a‖ϕ′(t)‖dt =

∫ a′

b′‖ϕ′(f(u))‖f ′(u) du =

∫ b′

a′‖ϕ′(f(u))f ′(u)‖du =

∫ b′

a′‖ϕ′(u)‖ du.

In queste note, per semplicità, abbiamo deciso di assumere la formula precedente comedenizione di lunghezza di una curva. Per quanto sia un approccio corretto dal punto divista logico, la sua ragionevolezza va però in qualche modo spiegata. A tal ne è utilevericare anzitutto che se applicata ad una curva poligonale (ovvero una concatenazionedi segmenti), la formula fornisce lo stesso valore che ci si aspetta dalla geometria euclidea,ovvero la somma delle lunghezze (euclidee) dei segmenti che la compongono. Inoltre, peruna curva generica γ è ragionevole pensare alla sua lunghezza come al sup delle lunghezzedelle spezzate interpolanti

`(γ) := suplunghezza delle spezzate con vertici in γ.

γ

a b

e se γ è regolare a tratti allora si può dimostrare che questo estremo superiore è unaquantità nita che, appunto, coincide con l'integrale dato nella Denizione 4.1.5.

Sia poi ϕ una curva regolare semplice. Per denizione ϕ′(t) 6= 0 per ogni t. Sia p :=ϕ(t0). L'insieme dei vettori 〈λϕ′(t0)〉λ∈R è un sottospazio di Ep di dimensione 1. Sia oraϕ = ϕ f una diversa parametrizzazione della medesima curva, e sia t0 := f(u0), cosìche p = ϕ(u0). Con la nuova parametrizzazione il vettore derivato (calcolato ancora in p)cambia in ϕ′(u0) = ϕ′(f(u0))f ′(u0) = ϕ′(t0)f ′(u0). Lo span di ϕ′(u0) è però lo stesso diϕ′(t0). Questo mostra così che lo spazio vettoriale spanϕ′(t0)R pur denito usando ϕ, èin realtà invariante sotto relazione di equivalenza ∼: esso è quindi un oggetto geometrico,e infatti è lo spazio tangente a γ in p.Il versore τ invece non è invariante: se ϕ = ϕ f con t0 = f(u0), si ha

τ(u0) =ϕ′(u0)

‖ϕ′(u0)‖=

ϕ′(t0)f ′(t0)

‖ϕ′(t0)f ′(t0)‖=

ϕ′(t0)

‖ϕ′(t0)‖· f′(t0)

|f ′(t0)|= τ(t0) · sgn(f ′(t0)).

Questo mostra che il nuovo versore τ coincide con il vecchio versore se e solo f ′ > 0 (ovverof è crescente), altrimenti è il suo opposto.Ciò suggerisce di introdurre una nuova (e più ne) relazione di equivalenza: ϕ

.∼ ϕ quandoesiste f biunivoca, bidierenziabile e crescente tale che ϕ = ϕf . Anche .∼ è una relazionedi equivalenza e ogni classe di equivalenza è chiamata curva orientata.Per le curve orientate ha senso sostenere che un dato punto delle curva venga prima/dopoun secondo punto, almeno se la curva è semplice e non chiusa.Data una curva ϕ : [a, b]→ Rn con sostegno γ si indica con −γ la curva ϕ : [a, b]→ Rn conϕ(t) := ϕ(a+ b− t). Allora ϕ e ϕ non sono

.∼ equivalenti anche se sono ∼ equivalenti; ogniϕ che sia ∼ ϕ è di fatto

.∼ equivalente a ϕ o a ϕ. Questo corrisponde a dire che

Page 92: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

92 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

• se ϕ.∼ ϕ allora ϕ ∼ ϕ;

• la classe di equivalenza [ϕ]/∼ si spezza in due classi di.∼ equivalenza.

p

q

=

p

q

∪p

q

Da ciò segue che τ non è ben denito in [ϕ]/∼ ma lo è in [ϕ]/ .∼.

4.1.2 Concatenazione

Se γ1 è sostegno di una curva da p a q e γ2 di una da q a s allora è possibile concatenareγ1 con γ2 in ciò che denotiamo con γ1 + γ2 a dare una curva che connette p con s. Ancheγ1 + γ2 è il sostegno di una curva: se ϕ1 : [a1, b1] ha sostegno γ1 e ϕ2 : [a2, b2] ha sostegnoγ2 allora ϕ : [0, 1]→ Rn con

ϕ(t) =

ϕ1(a1 + (b1 − a1)2t) t ∈ [0, 1

2 ]

ϕ2(a2 + (b2 − a2)(2t− 1)) t ∈ [12 , 1]

parametrizza γ1 + γ2. Si osservi che ϕ è ben denita perché ϕ1(b1) = q = ϕ2(a2), così cheϕ è sicuramente continua. Inoltre ϕ è regolare a tratti se ϕ1 e ϕ2 lo sono, ma in generaleϕ non è regolare perché in q le derivate di ϕ1 e ϕ2 possono non coincidere.

p

qγ1

q

s

γ2

p

q

s

γ1 + γ2

Denizione 4.1.6. Dato Ω ⊆ Rn, Ω è detto connesso per archi (semplici/ regolari/. . . )quando per ogni coppia di punti in Ω esiste una curva (di quel tipo) con sostegno in Ω cheli connette.

Teorema 4.1.7. Sia Ω ⊆ Rn un aperto connesso, allora Ω è anche connesso per archi(che si possono prendere poligonali, semplici o anche regolari semplici, ed orientati).

Dimostrazione. Sia w un qualunque punto di Ω, ssato. Sia

A := q ∈ Ω: per i quali esiste una curva che connette w con q.

Osserviamo che:

• A non è vuoto. Infatti esiste una bolla aperta di centro w e tutta in Ω (perché Ω èaperto) e ogni punto della bolla è connesso a w dal raggio che passa per quel punto.Quindi la bolla è contenuta in A.

• A è aperto. Infatti sia q ∈ A. Visto che Ω è aperto, esiste una bolla aperta centrata in qtutta in Ω. Ogni elemento r della bolla è connesso a q dal raggio che passa per r e q loè a w (perché q ∈ A), quindi r è connesso a w (dalla concatenazione) perciò r ∈ A.

Page 93: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.1. CURVE 93

• A è chiuso in Ω ovvero Ac ∩ Ω è aperto. Infatti sia q ∈ Ac. Se non esistesse una bollaaperta di centro q tutta in Ac allora la bolla aperta di centro q e tutta in Ω (che esisteperché Ω è aperto) avrebbe almeno un punto r in A, ovvero connesso a w. Ma allorar sarebbe connesso a q dal raggio e quindi w sarebbe connesso a q, contro l'ipotesi.L'assurdo dimostra che Ac è aperto.

Ma allora A 6= ∅ e sia A che Ac∩Ω sono aperti. Visto che Ω è connesso, segue che Ac∩Ω = ∅ovvero che A = Ω. In altre parole, abbiamo dimostrato che ogni punto di Ω è connessoa w da una curva (che se vogliamo possiamo assumere essere regolare a tratti). La tesisegue osservando che due punti qualunque p e q in Ω sono allora connessi tra loro dallaconcatenazione delle curve pγ1w e qγ2w che li connettono a w (e la concatenazione saràregolare a tratti se esse lo sono). Questo basta per dimostrare la tesi nella versione in cui siaerma l'esistenza di curve di connessione che siano solo regolari a tratti ed orientate. Perdimostrare la possibilità di avere cammini poligonali si può procedere così: siano p e q puntidistinti e ssati e ϕ : [a, b] → Ω la curva che li connette in Ω, la cui esistenza è appenastata dimostrata. Il sostegno γ della curva è un compatto (perché immagine tramite lamappa ϕ continua di un segmento compatto), ed Ω è un aperto, quindi la distanza tra γed Ωc è positiva1. Sia η > 0 e minore di tale distanza: dalla denizione segue che tutti ipunti che distano da un qualunque punto di γ meno di η di fatto sono in Ω. La mappa ϕ ècontinua sul compatto [0, 1], quindi è uniformemente continua: esiste quindi una partizionet0 = a < t1 < · · · < tk = b tale che ‖ϕ(ti+i)−ϕ(ti)‖ ≤ η per ogni i = 0, . . . , k. Come curvapoligonale possiamo quindi prendere quella che interpola i punti (ti, ϕ(ti)) con i = 0, . . . , k,(perché ogni punto del segmento tra (ti, ϕ(ti)) e (ti+1, ϕ(ti+1)) dista da (ti, ϕ(ti)) al piùη e quindi sono in Ω). Inoltre, visto che le poligonali sono composte da segmenti che inquanto tali hanno solo un numero nito di direzioni possibili, è chiaro che esse contengonosolo un numero nito di cicli, che possono essere esclusi dalla poligonale, producendo cosìuna poligonale di tipo semplice. Inne, è possibile convertire questa poligonale semplice inuna curva semplice e regolare modicandola in prossimità dei punti di vertice, ad esempioaggiungendo un arco di circonferenza tangente ai due segmenti concorrenti in esso e diraggio sucientemente piccolo per non intersecare gli altri segmenti.

Osservazione 4.1.8. Vale anche il viceversa: se Ω ⊆ Rn è aperto e connesso per archi, alloraè anche connesso. Infatti, supponiamo non lo sia, e che quindi esistano due aperti A,B ⊆ Ωnon vuoti e tali che A ∪ B = Ω. Prendiamo un p ∈ A ed un q ∈ B. Per ipotesi esiste unacurva ϕ : [0, 1]→ Ω con ϕ(0) = p e ϕ(1) = q. Essendo una curva, la funzione ϕ è continua,quindi gli insiemi ϕ(A)−1 e ϕ(B)−1 (le controimmagini di A e B) sono aperti. Essi sonoanche non vuoti (perché contengono rispettivamente 0 e 1), e la loro unione è [0, 1] vistoche ϕ è a valori in Ω = A∪B. Ma allora abbiamo scomposto [0, 1] in unione di due apertinon vuoti disgiunti, cosa che è impossibile perché sappiamo che [0, 1] è connesso.

Osservazione 4.1.9. L'equivalenza di connessione e connessione per archi può cadere sel'insieme non è aperto. Ad esempio l'insieme

Ω := (x, y) ∈ R2 : x ∈ (0, 1], y = sin(1/x) ∪ (0, y) ∈ R2 : y ∈ [−1, 1]

è connesso ma non connesso per archi.

1La distanza tra due insiemi U, V ⊆ Rn è denita come inf‖u− v‖ : u ∈ U, v ∈ V ; è noto che qualoraessi disgiunti con U compatto e V chiuso allora la distanza è positiva.

Page 94: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

94 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Osservazione 4.1.10. I convessi sono connessi per archi (si scelga il segmento che uniscedue punti).

Denizione 4.1.11. Ω è detto stellato quando esiste p ∈ Ω con la seguente proprietà:comunque si prenda q ∈ Ω, il segmento pq ∈ Ω.

p

In tal caso p è detto centro di Ω. In base alle rispettive denizioni quindi si ha che ogniconvesso è anche stellato ed ogni stellato è anche connesso per archi, ovvero

Convessi ⊆ Stellati ⊆ Connessi per archi.

Esempio 4.1.12. Esistono domini che sono aperti, stellati ed hanno un unico centro. Adesempio Ω := R2\[(x, 0) ∈ R2, |x| ≥ 1 ∪ (0, y) ∈ R2, |y| ≥ 1] ha come unico centro ilpunto (0, 0).

×

Curiosità: Se Ω è stellato l'insieme dei suoi centri è convesso.

4.2 Campi vettoriali e forme dierenziali

Sia Ω ⊆ Rn un aperto. Ad ogni p ∈ Ω è associato lo spazio Ep (delle frecce uscenti da p) elo spazio E∗p : il duale vettoriale di Ep (ovvero l'insieme dei funzionali lineari su Ep).

Denizione 4.2.1. Chiamiamo campo vettoriale su Ω ogni mappa che associa ad ognix ∈ Ω un elemento di Ex; chiamiamo forma dierenziale su Ω ogni mappa che associa adx ∈ Ω un elemento di E∗x.

Ω

Per ogni scelta del punto p, lo spazio Ep è euclideo, ovvero supporta un prodotto scalare〈·, ·〉 denito positivo. Ciò signica che dato un campo vettoriale F si può sempre costruire

Page 95: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.2. CAMPI VETTORIALI E FORME DIFFERENZIALI 95

una forma dierenziale prendendo in ogni p il prodotto scalare (in Ep) con il vettore F (p),secondo la formula

F → ωF ωF (p) := 〈F (p), ·〉p ∀p ∈ Ω.

Il fatto che il prodotto scalare sia denito positivo consente di procedere anche nell'altradirezione. L'isomorsmo di Riesz2 tra E∗p ed Ep consente infatti di associare ad ogni fun-zionale in E∗p un vettore di Ep così che data una forma dierenziale ω esiste un campo Ftale che

ω → Fω Fω tale che ω(p) = 〈Fω(p), ·〉p ∀p ∈ Ω.

Le due costruzioni inoltre sono inverse una dell'altra. Usare campi o forme è quindi deltutto equivalente3.C'è un modo canonico per produrre un campo vettoriale e una forma dierenziale apartire da una funzione f : Ω→ R di classe C1.Sia x ∈ Ω ssato. La mappa v ∈ Ex → (Dvf)(x) che associa ad ogni v ∈ Ex la derivata dif in x lungo v dipende da v linearmente, poiché f è per ipotesi dierenziabile in x. Essaquindi è un elemento di E∗x e viene solitamente indicata con il simbolo ( df)(x). Al variaredi x ∈ Ω questa denisce quindi una forma dierenziale su Ω che è chiamata il dierenzialedi f .Il campo vettoriale associato a questa forma (tramite l'isomorsmo di Riesz di cui sopra)è per denizione quel campo vettoriale F che in x ∈ Ω dà quel vettore F (x) di Ex chegarantisce l'identità 〈F (x), v〉 = ( df)(x)(v) = (Dvf)(x). Visto che f è per ipotesi C1 ilvettore F (x) è di fatto (∇f)(x), il gradiente di f in x.Le forme dierenziali ed i campi vettoriali appena costruiti sono più che dei semplici esempi,e anzi costituiscono un punto fondamentale per la teoria che stiamo indagando. Non stupiràquindi l'esistenza di una nomenclatura specica per questa situazione.

Denizione 4.2.2. Un campo vettoriale F è detto conservativo su Ω se esiste f : Ω→ Rdi classe C1 con F = ∇f . Una forma dierenziale ω è detta esatta su Ω se esiste f : Ω→ Rdi classe C1 con ω = df . In entrambi i casi f è detto potenziale (o primitiva) per F (oper ω).

Osservazione 4.2.3. Il potenziale può non esistere, ma quando esiste non è mai unico:questo accade perché qualunque sia il valore di una costante c ∈ R si ha ∇(f + c) = ∇f (e

2Si tratta di un importante teorema che aerma l'esistenza di un isomorsmo canonico tra uno spaziovettoriale ed il suo duale quando lo spazio supporta un prodotto scalare non degenere. Per spazi nitidimensionali esso discende dal seguente argomento. Sia V uno spazio vettoriale reale nito dimensionalee sia V ∗ il suo duale. Supponiamo che in V sia denito una mappa 〈·, ·〉 : V × V → R che sia bilineare(ovvero lineare in ogni argomento) e non degenere nel primo argomento, ovvero tale che l'unico v ∈ V peril quale si abbia 〈v, w〉 = 0 per ogni w ∈ V è lo 0. Allora ad ogni v ∈ V si può associare il funzionaleϕv ∈ V ∗ denito da ϕv(w) := 〈v, w〉. Che si tratti di un funzionale discende dal fatto che la mappa 〈·, ·〉 èper ipotesi lineare nel secondo argomento. La mappa v 7→ ϕv è quindi una mappa da V a V ∗. Tale mappaè a sua volta lineare (questa volta perché 〈·, ·〉 è lineare nella prima variabile). Questa mappa è iniettiva,in conseguenza della ipotesi di non degenericità dei 〈·, ·〉. Visto che V e V ∗ hanno la stessa dimensione, nesegue che di fatto la mappa è anche suriettiva, ovvero che ogni funzionale φ è della forma ϕv per qualchev ∈ V . Nel caso degli spazi Ep si può usare il prodotto scalare quale mappa 〈·, ·〉: il fatto che sia nondegenere segue immediatamente dal fatto che in tal caso 〈v, v〉 = ‖v‖2.

3Ma solo nella situazione attuale in cui Ω è un aperto di Rn. Quando queste costruzioni verrannoestese a varietà dierenziali si troverà che non sempre è possibile procedere a questa identicazione, poichénon sempre esiste un prodotto scalare euclideo sullo spazio tangente, o non sempre questo dipende concontinuità dal punto.

Page 96: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

96 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

d(f + c) = df). D'altra parte è evidente che se f e f sono due potenziali per il medesimocampo allora ∇(f − f) = 0. Quindi i potenziali sono unici a meno di funzioni C1(Ω) agradiente identicamente 0. Ciò porta a studiare l'insieme

V0(Ω) := g ∈ C1(Ω): ∇g = 0.

Rispetto alle operazioni puntuali esso è evidentemente uno spazio vettoriale su R, di cuivogliamo calcolare la dimensione. L'insieme Ω è aperto, così le sue componenti connessesono esse stesse aperte e in quantità al più numerabile4. Il fatto di avere gradiente nullo forzaogni funzione di V0(Ω) ad essere costante sulle componenti connesse di Ω5. Sia Cjj∈Jl'elenco delle componenti connesse di Ω. Sia g ∈ V0(Ω). Allora esistono numeri cj (unoper ogni componente connessa) tali che g(x) =

∑j∈J cjχCj (x), dove χCj è la funzione

caratteristica di Cj . Si osservi che questa rappresentazione è corretta anche qualora esistanoinnite componenti connesse e quindi la somma sia in realtà una serie, perché per ognivalore ssato di x esiste al più un solo addendo della serie che è diverso da 0. D'altra partele funzioni χCj sono esse stesse funzioni di V0(Ω), tra loro linearmente indipendenti. Questodimostra che la dimensione di V0(Ω) è uguale a J , ovvero che

dimV0(Ω) = #Componenti connesse in Ω.

4.2.1 Notazione

Per Ω ⊆ Rn indichiamo con:

• ∂xi (o ∂i) il campo vettoriale denito da ∂xi := versore ei di Ep che è parallelo ad ei diRn

x

y

p∂1(p)

e1e2

• dxi la forma dierenziale ottenuta dierenziando la funzione che dà la i-esima coordinata(quindi il dierenziale della proiezione sulla i-esima direzione). Le forme dxi con i =

4Per la dimostrazione di questa tesi rimandiamo ai testi di topologia generale.5Detto in altri termini, sia f : D ⊆ Rn → R, D aperto e connesso, e f in C1(D) con ∇f = 0. Allora f è

costante.

Dimostrazione. Prendiamo x0 ∈ D scelto ad arbitrio ma ssato. Sia A := x ∈ D : f(x) = f(x0).Chiaramente A non è vuoto, visto che x0 gli appartiene. Dimostriamo che A è aperto. Infatti, sia y in Ae sia Bε(y) la bolla aperta di centro y e raggio ε > 0 sucientemente piccolo perché si abbia Bε(y) ⊆ D:tale bolla esiste perché D è aperto. La bolla Bε(y) è un insieme convesso ed ∇f = 0 per ipotesi, quindiper il teorema di Lagrange (usato lungo i raggi) la funzione f è costante in Bε(y). Questo dimostra cheBε(y) ⊆ A, ovvero che A è eettivamente aperto. D'altra parte anche D\A è aperto. Infatti questo èx ∈ D : f(x) 6= f(x0) = f−1(R\f(x0)) che è aperto visto che f è continua. Dunque A ed D\A sonoentrambi aperti, ed A è non vuoto: visto che D è connesso concludiamo che A = D, ovvero che f è costantein D.

Page 97: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.2. CAMPI VETTORIALI E FORME DIFFERENZIALI 97

1, . . . , n ed i campi ∂xi con i = 1, . . . , n quando vengono valutati in un punto p dannobasi di E∗p ed Ep che sono duali una dell'altra, poiché esse soddisfano la relazione

( dxi)(p)(∂j(p)) =

1 se j = i

0 se j 6= i.

Il generico campo vettoriale sarà quindi scritto

F = a1∂1 + a2∂2 + · · ·+ an∂n,

la generica forma dierenziale sarà

ω = a1 dx1 + a2 dx2 + · · ·+ an dxn,

per opportune funzioni a1 . . . , an : Ω → R. Se così rappresentato, F (o ω) è poi detto diclasse Ck(Ω) quando a1, . . . , an sono Ck(Ω).

Esempio 4.2.4. In R2 prendiamo il campo F (x, y) := (3x− y)∂x + (7x2− 9y)∂y e la formaω(x, y)=(4−2x) dx+(5−xy) dy. Allora ω(x, y)(F (x, y))=(4−2x)(3x−y)+(5−xy)(7x2−9y).

Inoltre F è conservativa (in Ω) se e solo se esiste f ∈ C1(Ω) tale che∂f∂x1

(x) = a1(x)...

∂f∂xn

(x) = an(x)

∀x ∈ Ω.

Analogamente ω è esatta se e solo se esiste f ∈ C1(Ω) tale che∂f∂x1

(x) = a1(x)...

∂f∂xn

(x) = an(x)

∀x ∈ Ω.

4.2.2 Integrazione di forme/campi lungo curve

Sia ω = a1 dx1+a2 dx2+· · ·+an dxn una forma dierenziale continua su Ω, sia ϕ : [a, b]→ Ωuna curva in Ω regolare a tratti, orientata e con sostegno γ. Si pone∫

γω :=

∫γ

n∑i=1

ai(x) dxi :=

∫ b

a

n∑i=1

ai(ϕ(t)) · ϕ′i(t) dt.

Se F = a1∂1 + a2∂2 + · · ·+ an∂n è un campo vettoriale analogamente si pone∫γF ·ds :=

∫γ〈F, ds〉 :=

∫ b

a

n∑i=1

ai(ϕ(t)) · ϕ′i(t) dt.

Osservazione 4.2.5. L'integrale∫γ F ·ds è anche chiamato lavoro di F lungo il cammino γ.

Osservazione 4.2.6. Le due denizioni sono coerenti, nel senso che se ω è la forma associataad F (o viceversa) allora

∫γ ω =

∫γ F · ds.

Page 98: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

98 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Osservazione 4.2.7. L'integrale appena denito è.∼ invariante: se ϕ è una diversa parame-

trizzazione di γ (ma con la stessa orientazione), l'integrale calcolato con ϕ o con ϕ dannolo stesso valore. Tuttavia non è ∼ invariante, infatti∫

−γω = −

∫γω,

ovvero cambiando l'orientazione l'integrale inverte il segno.

Osservazione 4.2.8. L'integrale è γ-additivo ovvero vale la seguente identità∫γ1+γ2

ω =

∫γ1

ω +

∫γ2

ω

purché γ1 + γ2 sia denito, orientato e C1 a tratti.

4.2.3 Condizioni di esattezza

La seguente proposizione spiega perché la nozione di campo conservativo / forma esattasia interessante, e quale sia il legame con l'integrale denito.

Proposizione 4.2.9. Sia Ω aperto connesso e ω = a1 dx1 + a2 dx2 + · · · + an dxn unaforma dierenziale continua in Ω. Allora le seguenti proprietà sono equivalenti:

i. ω è esatta;

ii. Siano p e q punti qualunque in Ω, allora l'integrale∫pγq ω, dove γ è (il sostegno di)

una qualunque curva regolare a tratti e orientata da p a q, non dipende dalla sceltadi γ;

iii. Per ogni curva γ in Ω che sia regolare a tratti e chiusa si ha∫γ ω = 0.

Osservazione 4.2.10. L'ipotesi di Ω aperto e connesso garantisce Ω connesso per archi, cosìdati p e q esiste sicuramente almeno una curva (regolare a tratti) pγq che li connette.

Osservazione 4.2.11. La proposizione mostra che l'esattezza di ω equivale alla possibilitàdi calcolare

∫pγq ω con p e q ssati senza dover scegliere quale sia la curva γ che li connette:

è questa proprietà che rende particolarmente utile la nozione di esattezza anche in contestipuramente applicativi.

Osservazione 4.2.12. La Proposizione 4.2.9 è formulata in termini di forme dierenziali; intermini di campi vettoriali essa suona così: un campo vettoriale F continuo è conservativoin Ω se e solo se il lavoro di F da p e q lungo ogni cammino γ in Ω non dipende da γ.

Dimostrazione.i. =⇒ ii. Supponiamo che ω sia esatta e che quindi ω sia df con f ∈ C1(Ω). Allora seϕ : [a, b]→ Ω è la curva (C1 a tratti, orientata) da p a q si ha∫

pγqω =

∫ b

a

n∑i=1

ai(ϕ(t))ϕ′i(t) dt =

∫ b

a

n∑i=1

∂f

∂xi(ϕ(t))ϕ′i(t) dt =

∫ b

a

d

dt

(f(ϕ(t))

)dt

= f(ϕ(b))− f(ϕ(a)) = f(q)− f(p)

che quindi non dipende da γ.ii. =⇒ iii. Sia γ una curva chiusa orientata. Prendiamo p e q su γ e spezziamo γ come

Page 99: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.2. CAMPI VETTORIALI E FORME DIFFERENZIALI 99

γ1 + γ2 dove γ1 va da p a q e γ2 da q a p, scegliendo una orientazione compatibile conquella di γ. Allora∫

γω =

∫γ1+γ2

ω =

∫γ1

ω +

∫γ2

ω =

∫γ1

ω −∫−γ2

ω = 0

perché sia γ1 sia −γ2 vanno da p a q e stiamo assumendo ii.iii. =⇒ ii. Se γ1 a γ2 vanno da p a q allora γ1 + (−γ2) è chiusa ed orientata, quindi∫

γ1

ω −∫γ2

ω =

∫γ1

ω +

∫−γ2

ω =

∫γ1+(−γ2)

ω = 0.

ii. =⇒ i. Sia p ∈ Ω ssato (ad arbitrio, ma ssato). Sia f(x) :=∫pγx ω dove γ è una

qualunque curva (regolare a tratti, orientata) che collega p ad x in Ω: γ esiste perché Ω èconnesso per archi. La funzione f è ben denita in Ω, perché ii. mostra che f(x) dipendesolo da x e non dalla scelta di γ. Mostriamo che f è un potenziale per ω: questo implicache ω è esatta.Sia x0 ∈ Ω preso ad arbitrio ma ssato. Sia h 6= 0 e abbastanza piccolo perché x0 + he1

sia anch'esso in Ω (ciò è possibile perché Ω è aperto). Allora f(x0 + he1) è per denizionel'integrale lungo qualunque cammino che colleghi p con x0 + he1 ∈ Ω. Come camminoprendiamo γ+ il segmento [x0, x0 + he1].

Ω

p

x

γ

Ω

p

x

γ

he1

Così

1

h

(f(x0 + he1)− f(x0)

)=

1

h

(∫pγx0

ω +

∫[x0,x0+he1]

ω −∫pγx0

ω)

=1

h

∫[x0,x0+he1]

ω.

Come parametrizzazione del segmento prendiamo

ϕ(t) = x0 + te1 t : 0→ h.

Allora ϕ′(t) = e1 quindi

1

h

∫[x0,x0+he1]

n∑i=1

ai(w) dwi =1

h

∫ 1

0

n∑i=1

ai(x0 + te1) · (e1)i dt =1

h

∫ h

0a1(x0 + te1) dt.

Ma a1 è continua, quindi per il teorema del valor medio integrale questo è

= a1(x0 + ξe1)

per un certo ξ tra 0 ed h. Se h → 0 allora ξ → 0 ed a1(x0 + ξe1) → a1(x0) perché a1 ècontinua, quindi

limh→0

1

h

(f(x0 + he1)− f(x0)

)esiste e vale a1(x0).

Page 100: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

100 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Visto che x0 è arbitrario, questo dimostra che ∂f∂x1

f(x) esiste in ogni x ∈ Ω e coincide cona1(x), ed è una funzione continua di x, poiché a1 lo è per ipotesi. Lo stesso argomento puòessere ripetuto per ogni altra direzione, quindi f ∈ C1(Ω) e il suo dierenziale coincide conω.

Proposizione 4.2.13. Sia Ω aperto connesso e ω = a1 dx1 + a2 dx2 + · · · + an dxn unaforma dierenziale continua in Ω. Allora ω è esatta se e solo se per ogni curva semplice γin Ω che sia regolare a tratti e chiusa si ha

∫γ ω = 0.

La tesi di questa proposizione è molto simile alla precedente, ma ora le curve su cui si esegueil test sono solo quelle semplici: in seguito incontreremo una situazione in cui questo fattocostituisce una notevole semplicazione.Supponiamo che ω sia esatta. Dalla proposizione 4.2.9 sappiamo che questo garantisce che∫γ ω = 0 per ogni curva regolare (a tratti) e chiusa, quindi, e a maggior ragione, lo stesso vale

anche per le curve che oltre a ciò sono pure semplici. Viceversa, supponiamo che∫γ ω = 0

per ogni curva chiusa, semplice e regolare a tratti. Se riuscissimo a dimostrare che da ciòsegue l'analoga tesi per tutte le curve chiuse e regolari a tratti, allora potremmo dedurrela esattezza di ω dalla 4.2.9[iii]. Purtroppo una dimostrazione diretta di questo fatto èparecchio complicata, poiché essa è possibile solo se si dispone di un qualche strumentoche consenta di dimostrare che ogni curva chiusa è decomponibile in un numero nito dicurve chiuse semplici: l'intuizione è in eetti corretta se per decomposizione si intende`concatenazione di curve a meno di omotopia' (vd. la denizione di omotopia data nellasezione seguente), ma questa via si rivela più complessa del necessario. Dati gli strumentidi cui disponiamo conviene invece procedere nel modo seguente.

Dimostrazione. Sia p ∈ Ω ssato (ad arbitrio, ma ssato). Sia x anch'esso in Ω. DalTeorema 4.1.7 sappiamo di poter connettere p con x con una poligonale semplice. Sianopγ1x e pγ2x due di tali poligonali. La curva chiusa pγ1x+pγ2x è quindi anch'essa poligonaleed è facile rendersi conto che ogni poligonale chiusa è scrivibile come concatenazione dipoligonali chiuse e semplici (è appunto questo il motivo per cui ora scegliamo camminipoligonali). Dalla ipotesi di nullità dell'integrale lungo curve semplici e chiuse ed allaadditività dell'integrale lungo curve regolari a tratti, si deduce che∫

pγ1x+pγ2xω = 0

ovvero che ∫pγ1x

ω =

∫pγ2x

ω.

Questo mostra che la funzione f(x) :=∫pγx ω dove γ è una qualunque poligonale che collega

p ad x in Ω è ben denita. Ora che questo scoglio è superato, si procedere dimostrando chef è un potenziale per ω con gli stessi identici passaggi già impiegati nella dimostrazionedella implicazione ii. =⇒ i. della Proposizione 4.2.9.

Le tesi appena dimostrate spiegano l'interesse per la proprietà di conservatività del campovettoriale (o esattezza della forma), ma forniscono uno strumento decisamente poco agevoleper dimostrare queste proprietà: in eetti, come possiamo realmente vericare che

∫γ ω = 0

per ogni curva chiusa od anche solo ogni curva chiusa semplice? La seguente proprietàmostra una conseguenza della esattezza e quindi è un utile criterio necessario.

Page 101: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.2. CAMPI VETTORIALI E FORME DIFFERENZIALI 101

Denizione 4.2.14. Sia Ω un aperto in Rn. Sia F = a1∂1 +· · ·+an∂n un campo vettorialesu Ω, di classe C1(Ω). Il campo F è detto irrotazionale in Ω quando

∂aj∂xi

(x) =∂ai∂xj

(x) ∀x ∈ Ω, ∀i, j = 1, . . . , n.

Analogamente, sia data una forma dierenziale ω = a1 dx1 + · · ·+ an dxn su Ω e di classeC1(Ω). La forma ω è detta chiusa in Ω quando

∂aj∂xi

(x) =∂ai∂xj

(x) ∀x ∈ Ω, ∀i, j = 1, . . . , n.

Teorema 4.2.15. Sia Ω aperto e F campo vettoriale su Ω di classe C1(Ω). Se F è con-servativo allora F è irrotazionale. Analogamente sia ω una forma dierenziale di classeC1(Ω); se ω è esatta allora è chiusa.

Dimostrazione. Diamo la dimostrazione della tesi per i campi; quella per le forme è dimo-strata in modo analogo. Per ipotesi F = a1∂1 + · · · + an∂n con aj ∈ C1(Ω) e F è, sempreper ipotesi, esatta. Quindi esiste f : Ω→ R, f ∈ C1(Ω) con F = ∇f . Così

aj =∂f

∂xj∀j.

Visto che aj ∈ C1(Ω) allora f ∈ C2(Ω), e così le derivate seconde di f possono esserescambiate, dando l'identità

∂aj∂xi

=∂

∂xi

∂f

∂xj=

∂xj

∂f

∂xi=∂ai∂xj

.

Esempio 4.2.16. (vortice) Sia F (x, y) := −yx2+y2

∂x + xx2+y2

∂y, cui è associata la formadierenziale equivalente

ω(x, y) :=1

x2 + y2(−y dx+ x dy).

Tale campo è irrotazionale (ovvero la forma è chiusa) perché

∂y

( −yx2 + y2

)=

y2 − x2

(x2 + y2)2=

∂x

( x

x2 + y2

).

Il campo F non è però conservativo (ovvero la forma non è esatta): infatti se con γindichiamo la circonferenza di raggio 1 percorsa in senso antiorario, si ha

ϕ(t) = (cos t, sin t) t : 0→ 2π∫γω =

∫γ

−y dx+ x dy

x2 + y2=

∫ 2π

0

(− sin t d(cos t) + cos t d(sin t)

)=

∫ 2π

01 dt = 2π.

Se F fosse conservativo l'integrale appena calcolato dovrebbe però valere 0, visto che γ ècurva regolare e chiusa.

Page 102: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

102 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

x

y

Il lavoro del campo vettoriale −yx2+y2

∂x+ xx2+y2

∂ylungo una circonferenza attorno a (0, 0) non ènullo visto che il campo stesso ruota attorno talepunto.

La irrotazionalità per campi vettoriali o la chiusura per le forme dierenziali non sonoquindi condizioni sucienti per l'essere conservativi o esatte. Dato Ω aperto siano:

V c1 (Ω) := forme ω ∈ C1(Ω), chiuse,V e

1 (Ω) := forme ω ∈ C1(Ω), esatte.

V c1 (Ω) è spazio vettoriale, perché se ω e ω sono forme chiuse e λ ∈ R, anche ω + λω lo è

visto che∂

∂xj(ai + λai) =

∂ai∂xj

+ λ∂ai∂xj

.

Anche V e1 (Ω) è uno spazio vettoriale perché se ω = df e ω = df e λ ∈ R, allora

ω + λω = d(f + λf).Inoltre il Teorema 4.2.15 mostra che V e

1 (Ω) è un sottoinsieme di V c1 (Ω), e visto che le ope-

razioni che eseguiamo su V e1 (Ω) sono le stesse di quelle che esso eredita come sottoinsieme

di V c1 (Ω), di fatto V e

1 (Ω) è un sottospazio di V c1 (Ω). Questo suggerisce l'introduzione dello

spazio quoziente:

V1(Ω) := V c1 (Ω)V e

1 (Ω).

Esso misura quanto l'insieme delle forme chiuse disti da quello delle esatte, visto che ogniforma chiusa è anche esatta se e solo se il quoziente V c

1 (Ω) coincide con V e1 (Ω), ovvero se

e solo se V1(Ω) è banale (e quindi ha dimensione 0).L'esempio del vortice mostra che per Ω = R2\(0, 0) si ha V c

1 (Ω) 6= V e1 (Ω), ovvero in

questo caso il loro quoziente V1(Ω) non è banale e quindi ha dimensione ≥ 1. Con l'aiutodel (dicile) Teorema 4.3.13 di Jordan vericheremo nel Teorema 4.3.15 che la dimensioneè proprio 1.Ovviamente le stesse considerazioni possono essere fatte per l'insieme dei campi irrotazio-nali e conservativi.

Il Teorema 4.2.18 seguente è fondamentale, ma per dimostrarlo abbiamo prima bisogno delseguente risultato.

Lemma 4.2.17 (Derivazione sotto segno di integrale). Sia f : Ω× [a, b]→ R, con Ω apertodi R. Sia x0 ∈ Ω e supponiamo che esista U(x0), intorno aperto di x0, tale che:

• f è continua in U(x0)× [a, b],

• ∂f∂x esiste in U(x0)× [a, b] ed è continua in U(x0)× [a, b].

Page 103: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.2. CAMPI VETTORIALI E FORME DIFFERENZIALI 103

Allora la funzione

F (x) :=

∫ b

af(x, t) dt

è derivabile in x0 edF

dx(x0) =

∫ b

a

∂f

∂x(x0, t) dt.

Dimostrazione. Sia h 6= 0 e sucientemente piccolo perché x0 + h sia comunque in U(x0).Allora

1

h[F (x0+h)−F (x0)] =

1

h

[ ∫ b

af(x0+h, t) dt−

∫ b

af(x0, t) dt

]=

∫ b

a

1

h

[f(x0+h, t)−f(x0, t)

]dt.

Per dimostrare la tesi basta dimostrare che è lecito scrivere che

limh→0

∫ b

a

1

h

[f(x0 + h, t)− f(x0, t)

]dt =

∫ b

alimh→0

1

h

[f(x0 + h, t)− f(x0, t)

]dt (4.1)

perché se questa identità è corretta, allora si ha

limh→0

1

h[F (x0 + h)− F (x0)] =

∫ b

alimh→0

1

h

[f(x0 + h, t)− f(x0, t)

]dt

e per ipotesi il lato destro coincide con∫ ba∂f∂x (x0, t) dt, vericando così sia l'esistenza del

limite a sinistra (quindi la derivabilità di F in x0), sia la formula per la derivata.Per dimostrare la (4.1) basta dimostrare la tesi sulle sequenze innitesime, ovvero che perogni sequenza hn che tende a 0 si ha

limn→∞

∫ b

a

1

hn

[f(x0 + hn, t)− f(x0, t)

]dt =

∫ b

alimn→∞

1

hn

[f(x0 + hn, t)− f(x0, t)

]dt; (4.2)

questo perché in R (in realtà negli spazi metrici) la convergenza equivale alla convergenzaper successioni. Per dimostrare la (4.2) poniamo

gn(t) :=1

hn

[f(x0 + hn, t)− f(x0, t)

]ed osserviamo che la successione gn tende puntualmente in [a, b] alla funzione ∂f

∂x (x0, ·),ovvero che

limn→∞

gn(t) =∂f

∂x(x0, t) ∀t ∈ [a, b].

La (4.2) quindi seguirà immediatamente dai soliti teoremi di passaggio al limite sotto ilsegno integrale se riusciremo a dimostrare che la convergenza di gn a quella funzione è inrealtà uniforme in [a, b]. Questo è appunto ciò che ci accingiamo a fare. Come vedremo,essa è conseguenza della ipotesi di continuità di ∂f∂x in U(x0)× [a, b].Sia η > 0 abbastanza piccolo perché [x0−η, x0+η] ⊆ U(x0). L'insieme [x0−η, x0+η]×[a, b]è un compatto e la funzione ∂f

∂x è continua, quindi è qui uniformemente continua. Così perogni ε > 0 esiste δ = δ(ε) > 0 tale che‖(x1, t1)− (x2, t2)‖2 ≤ δ(x1, t1), (x2, t2) ∈ [x0 − η, x0 + η]× [a, b]

=⇒∣∣∣∂f∂x

(x1, t1)− ∂f

∂x(x2, t2)

∣∣∣ ≤ ε. (4.3)

Page 104: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

104 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Sia allora ε > 0 ssato, e sia δ come sopra. Per il teorema di Lagrange applicato allafunzione f(·, t) esiste θ = θ(n, ε, δ, t) tale che

gn(t) =1

hn

[f(x0 + hn, t)− f(x0, t)

]=∂f

∂x(x0 + θ, t),

con θ che sta tra 0 ed hn (quindi θ cambia valore al variare di n, ε, δ e t, ma semprerestando |θ| ≤ |hn|).Sia N = N(ε) > 0 abbastanza grande perché sia |hn| ≤ min(η, δ) per n ≥ N : tale Nesiste sicuramente visto che per ipotesi hn → 0 quando n diverge. Per questi n allora si ha|θ| ≤ |hn| ≤ min(η, δ), e quindi i punti (x0 + θ, t) ed (x0, t) soddisfano le ipotesi di (4.3)per qualunque scelta di t ∈ [a, b], quindi da (4.3) si ha∣∣∣gn(t)− ∂f

∂x(x0, t)

∣∣∣ =∣∣∣∂f∂x

(x0 + θ, t)− ∂f

∂x(x0, t)

∣∣∣ ≤ ε ∀t ∈ [a, b].

Ovvero, prendendo l'estremo superiore di questa espressione, concludiamo che∥∥∥gn − ∂f

∂x(x0, ·)

∥∥∥∞,[a,b]

≤ ε.

Abbiamo quindi dimostrato che per ogni ε > 0 esiste un N = N(ε) tale che se n ≥ Nallora

∥∥gn − ∂f∂x (x0, ·)

∥∥∞,[a,b] ≤ ε, ovvero che la convergenza di gn ad ∂f

∂x (x0, ·) è uniforme

in [a, b].

Teorema 4.2.18 (Lemma di Poincaré). Sia Ω ⊆ Rn aperto e stellato. Sia poi ω una formadierenziale di classe C1(Ω). Se ω è chiusa in Ω allora è anche esatta in Ω.

Osservazione 4.2.19. Ovviamente esiste il teorema gemello per i campi vettoriali.

Osservazione 4.2.20. Il teorema mostra che un'informazione sulla topologia di Ω rende lachiusura una condizione suciente per l'esattezza.

Osservazione 4.2.21. Ogni bolla aperta è convessa quindi stellata. Ne segue che le formechiuse sono sempre localmente esatte (ma purtroppo l'esattezza locale non implica quellaglobale, come sappiamo dall'esistenza della forma `vortice').

Osservazione 4.2.22. Il teorema può essere enunciato anche dicendo che se Ω è stellatoallora V c

1 (Ω) = V e1 (Ω) ovvero il loro quoziente V1(Ω) è banale.

Dimostrazione. Sia ω =∑n

j=1 aj dxj la scrittura di ω. Ω è stellato per ipotesi, sia quindip uno dei suoi centri (quale non importa). Sia x ∈ Ω. Il segmento px giace interamente inΩ. Il segmento è parametrizzato da ϕ : [0, 1], ϕ(t) = p+ t(x− p) con t che varia da 0 ad 1per rispettare l'orientazione sul segmento, che vogliamo sia da p ad x. Sia

f(x) :=

∫pxω =

∫px

n∑j=1

aj(x) dxj =

∫ 1

0

n∑j=1

aj(p+ t(x− p))(xj − pj) dt.

La funzione f è ben denita perché il segmento px è in Ω e le aj sono continue (si osserviche si è usato ϕ′j = (x− p)j = coordinata j-esima di x− p = xj − pj).

Page 105: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.3. OMOTOPÌE 105

Dimostriamo la tesi mostrando che f è un potenziale per ω. Infatti consideriamo ∂f∂x1

: peril lemma di derivazione sotto il segno di integrale abbiamo

∂f

∂x1=

∂x1

∫ 1

0

n∑j=1

aj(p+ t(x− p))(xj − pj) dt

=

∫ 1

0

∂x1

[ n∑j=1

aj(p+ t(x− p))(xj − pj)]

dt

=

∫ 1

0

[tn∑j=1

∂aj∂x1

(p+ t(x− p))(xj − pj) + a1(p+ t(x− p))]

dt.

Per ipotesi ω è chiusa, quindi ∂aj∂x1

= ∂a1∂xj

per ogni j così che questa espressione è ancheuguale a

=

∫ 1

0

[tn∑j=1

∂a1

∂xj(p+ t(x− p))(xj − pj) + a1(p+ t(x− p))

]dt

=

∫ 1

0

d

dt

(t · a1(p+ t(x− p))

)dt = t · a1(p+ t(x− p))

∣∣∣t=1

t=0= a1(x).

Lo stesso calcolo può essere ripetuto per ∂f∂x2

, . . . , ∂f∂xn , vericando così che ω = df (con fdi classe C1 visto che ω è continua) ovvero che ω è esatta e che f ne è un potenziale.

In base al lemma precedente, quindi, se Ω è stellato si ha V e1 (Ω) = V c

1 (Ω) così che lo spazioquoziente

V1(Ω) = V c1 (Ω)V e

1 (Ω)

è in questo caso banale.

4.3 Omotopìe

Ricordiamo la denizione di omotopìa (tra curve in aperti di Rn).

Denizione 4.3.1. Sia Ω aperto in Rn. Siano p e q ∈ Ω e siano γ0 e γ1 i sostegni di duecurve (regolari a tratti, orientate) da p a q.γ0 e γ1 sono dette omòtope in Ω con punti p, q ssati se esiste una mappa ψ : [0, 1]×[0, 1]→Ω, continua, tale che:

i. ψ(0, t), t ∈ [0, 1] parametrizza γ0,

ii. ψ(1, t), t ∈ [0, 1] parametrizza γ1,

iii. ψ(s, 0) = p per ogni s, e ψ(s, 1) = q per ogni s.

In pratica, γ0 e γ1 sono omòtope in Ω quando è possibile passare da γ0 a γ1 con continuitàrestando in Ω mantenendo ssati i punti estremi p e q.

Page 106: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

106 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Ω

p

q

γ0

γ1

Ω

p

q

γ0

γ1

Nel caso illustrato dal disegno precedente, la presenza del buco tra le due curve impedisceloro di essere omòtope (a estremi ssi).

Osservazione 4.3.2. La relazione di omotopìa è una relazione di equivalenza.

Teorema 4.3.3 (Invarianza Omotòpica). Sia Ω ⊆ Rn aperto, sia ω =∑n

j=1 aj dxj una

forma dierenziale chiusa (quindi con ogni aj ∈ C1) su Ω. Siano p e q ∈ Ω (qualunque)e siano γ0 e γ1 sostegni di curve (regolari a tratti, orientate) da p a q. Se γ0 e γ1 sonoomòtope in Ω con estremi p e q ssi, allora∫

γ0

ω =

∫γ1

ω.

Osservazione 4.3.4. Il teorema non aerma che l'integrale sia 0, neppure nel caso p = q(curva chiusa), ma solo che il valore dell'integrale non cambia quando il cammino èdeformato per omotopìa.

Dimostrazione. Nelle generalità con cui lo abbiamo enunciato il teorema ha una dimostra-zione abbastanza complicata, con vari passaggi intermedi ed approssimazioni successive,per le quali demandiamo ai testi di topologia algebrica / geometria dierenziale (ad esem-pio [GH], [M] ed [Sp]). Noi ne diamo una dimostrazione sotto ipotesi più forti sulla mappadi omotopìa ψ. Precisamente assumiamo che

i. ψ : Ω# → Ω dove Ω# è un aperto che contiene il quadrato [0, 1]× [0, 1],

ii. ψ è C2(Ω#) (quindi non solo continua),

iii. ψ(0, t) : [0, 1]→ Ω parametrizza γ0,

iv. ψ(1, t) : [0, 1]→ Ω parametrizza γ1,

v. ψ(s, 0) = p per ogni s, e ψ(s, 1) = q per ogni s.

Le ipotesi che abbiamo raorzato sono le prime due, chiaramente. Introduciamo la forma

ω#(s, t) :=

n∑j=1

aj(ψ(s, t))(∂ψj∂s

ds+∂ψj∂t

dt)

=( n∑j=1

aj(ψ(s, t))∂ψj∂s

)ds+

( n∑j=1

aj(ψ(s, t))∂ψj∂t

)dt.

Osserviamo che ω# è una forma dierenziale su Ω#, di classe C1 (perché la ψ è C2). Senzaledere di generalità possiamo supporre che Ω# sia convesso (perché Ω# per noi è solo unospazio ausiliario, quindi possiamo rimpicciolirlo per averlo convesso, e questo è semprepossibile).

Page 107: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.3. OMOTOPÌE 107

Ω]

Verichiamo che ω# è chiusa. Infatti

∂t

[ n∑j=1

aj(ψ(s, t))∂ψj∂s

]=

n∑j=1

∂t

[aj(ψ(s, t))

∂ψj∂s

]=

n∑j=1

n∑i=1

∂aj∂xi

(ψ(s, t))∂ψi∂t

∂ψj∂s

+n∑j=1

aj(ψ(s, t))∂2ψj∂t∂s

.

Ora rinominiamo i e j nel primo addendo e visto che ψ è di classe C2 possiamo scambiare∂∂s e ∂

∂t nel secondo termine, ottenendo

=n∑i=1

n∑j=1

∂ai∂xj

(ψ(s, t))∂ψj∂t

∂ψi∂s

+n∑j=1

aj(ψ(s, t))∂2ψj∂s∂t

.

Per ipotesi ω è una forma chiusa, quindi ∂ai∂xj=

∂aj∂xi

per ogni coppia di indici i e j, quindi

=n∑i=1

n∑j=1

∂aj∂xi

(ψ(s, t))∂ψj∂t

∂ψi∂s

+n∑j=1

aj(ψ(s, t))∂2ψj∂s∂t

=∂

∂s

[ n∑j=1

aj(ψ(s, t))∂ψj∂t

].

Per costruzione Ω# è convesso quindi ω# è esatta in Ω#, perciò∫γ ω

# = 0 per ogni camminochiuso γ. In particolare scegliamo come cammino il quadrato [0, 1]× [0, 1] orientato in sensoantiorario. Valutiamo l'integrale sui quattro lati tenendo conto che∫

→ω# +

∫↑ω# +

∫←ω# +

∫↓ω# = 0.

Calcolo di∫→ ω

#. Come parametrizzazione del segmento inferiore scegliamo t : 0 7→ 1 es = 0 (quindi ds = 0), così abbiamo:∫

→ω# =

∫ 1

0

n∑j=1

aj(ψ(0, t))∂ψj∂t

(0, t) dt =

∫γ0

ω.

Un conto analogo mostra che∫←ω# =

∫ 0

1

n∑j=1

aj(ψ(1, t))∂ψj∂t

(1, t) dt = −∫γ1

ω.

Page 108: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

108 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Calcolo di∫↑ ω

#. Parametrizziamo con s : 0 7→ 1 e t = 1, ottenendo∫↑ω# =

∫ 1

0

n∑j=1

aj(ψ(s, 1))∂ψj∂s

(s, 1) ds.

Ma ψ(s, 1) = q per ogni s, quindi ∂ψ∂s (s, 1) = 0 per ogni s. Questo implica che l'integraleprecedente è in realtà 0, per cui ∫

↑ω# = 0.

Analogo conto per l'altro segmento verticale ↓. Visto che la somma dei quattro integralideve valere 0, i calcoli precedenti mostrano che

0 =

∫→ω# +

∫↑ω# +

∫←ω# +

∫↓ω# =

∫γ0

ω + 0−∫γ1

ω + 0 =

∫γ0

ω −∫γ1

ω,

che è la tesi.

Denizione 4.3.5. Dato Ω ⊆ Rn aperto, dato p ∈ Ω e dato γ sostegno di una curva da pa p (quindi chiusa), regolare a tratti in Ω, diciamo che γ è nulla omòtopa in Ω quando èomòtopa in Ω alla curva costante di sostegno p.

Osservazione 4.3.6. Sia γ il sostegno di una curva chiusa e sia p un qualunque punto di γ.Allora γ può essere sempre intesa come curva da p a p e se la curva non è costante esistonoquindi molte scelte possibili per il punto p. Questo fa sorgere la seguente domanda: èpossibile che γ sia nullo omòtopa rispetto ad un suo punto p e invece non lo sia rispetto aqualche altro punto p′? In altre parole, la nozione di curva nullo omòtopa, che per essereformulata necessita della scelta di un punto p, dipende o no da tale scelta? La risposta ènegativa: se γ è nullo omòtopa rispetto ad un suo punto allora lo è rispetto a qualunquealtro suo punto. La nozione di nullo omotopia quindi è una proprietà della sola curva, nondella coppia (curva, punto). In realtà vale una proprietà ancora più forte, che tornerà utilein seguito, nella Osservazione 4.3.10. Sia γ il sostegno di una curva chiusa e sia p un puntoin γ ssato. Sia poi q un punto in Ω (non necessariamente in γ) e supponiamo che esso siaconnesso a p da una curva ρ che immaginiamo vada da q a p. La curva ρ+γ+ρ è una curvachiusa da q a q. Accade che γ è nullo omòtopa alla curva costante in p se e solo ρ+ γ + ρè nullo omòtopa alla curva costante in q. Lo verichiamo costruendo esplicitamente unaomotopia per la seconda in curva usando una omotopia per la prima. Sia dunque ϕ : [0, 1]una parametrizzazione di ρ e sia ψ : [0, 1]×[0, 1] la mappa che realizza l'omotopìa (a estremicostanti, quindi con ψ(s, 0) = ψ(1) = p per ogni s) tra γ (per s = 0) e la curva costante disostegno p (per s = 1). Prendiamo la mappa

ψ(s, t) :=

ϕ(4t) s ∈ [0, 1/2], t ∈ [0, 1/4]

ψ(2s, 2(t− 1/4)) s ∈ [0, 1/2], t ∈ [1/4, 3/4]

ϕ(4(1− t)) s ∈ [0, 1/2], t ∈ [3/4, 1]

ϕ(8(s− 1)t(1− t)) s ∈ [1/2, 1], t ∈ [0, 1]

È facile vericare che ψ(0, ·) parametrizza ρ + γ + ρ (rispettivamente per t ∈ [0, 1/4],t ∈ [1/4, 3/4] e t ∈ [3/4, 1]), che ψ(1, ·) parametrizza invece la curva costante di sostegnoq, che ψ(s, 0) = ψ(s, 1) = q per ogni s. La continuità ψ in [0, 1] × [0, 1] segue poi dalle

Page 109: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.3. OMOTOPÌE 109

continuità di ψ e di ρ (più qualche momento di riessione).Qualora q sia un altro punto di γ, quanto appena vericato di fatto implica l'asseritaindipendenza della proprietà di nullo-omotopìa di γ dalla scelta del punto p.

Purtroppo le curve costanti non sono curve regolari a tratti (almeno, non secondo la nostradenizione di curva regolare, secondo cui una curva è regolare a tratti se e solo se ammetteuna parametrizzazione di classe C1 a tratti con derivata diversa da 0: le costanti nonsoddisfano questa ultima condizione). Per procedere abbiamo quindi bisogno della seguenteproprietà.

Proposizione 4.3.7. Dato Ω ⊆ Rn aperto, dato p ∈ Ω e dato γ sostegno di una curva dap a p (chiusa), regolare a tratti in Ω. La curva γ è nulla omòtopa in Ω a p se e solo se perogni ε > 0 e sucientemente piccolo la curva γ è omòtopa ad una circonferenza passanteper p e di raggio al più ε.

La tesi della proposizione è ragionevolmente intuitiva, ed in eetti la sua dimostrazioneformale non è complicata: basta osservare che esiste una bolla B aperta di centro p in Ω(perché Ω è aperto), che B è stellato con centro p, che usando le omotetìe di centro p èpossibile costruire omotopìe tra le circonferenze di B passanti per p e la curva costante inp.

Proposizione 4.3.8. Dato Ω ⊆ Rn aperto, sia p ∈ Ω e sia γ una curva chiusa regolarea tratti, passante per p e nullo omòtopa. Sia poi ω una forma dierenziale chiusa in Ω.Allora ∫

γω = 0.

Dimostrazione. Il punto p è in Ω che è un aperto. La bolla aperta Bη(p) di centro p eraggio η > 0 è quindi contenuta in Ω pur di prendere η sucientemente piccolo. Sia oraε > 0 e minore di η/2. Per ipotesi la curva γ è nullo-omòtopa a p, e per la proposizioneprecedente questo implica che essa è omòtopa ad una circonferenza Cε passante per p e diraggio ε. Dal teorema di invarianza omotopica sappiamo che∫

γω =

∫Cε

ω.

Ma ω è una forma chiusa in Ω, e quindi lo è anche in Bη(p). D'altra parte Bη(p) è unabolla, e quindi è un insieme convesso. La forma è quindi esatta in Bη(p) (ma non è dettolo sia in Ω), per il lemma di Poincaré. La curva Cε è chiusa ed è in Bη(p) (poiché abbiamoassunto ε < η/2), quindi ∫

ω = 0.

Unito alla uguaglianza precedente questo fatto dà la tesi.

Denizione 4.3.9. Sia Ω aperto connesso. Ω è detto semplicemente connesso quando ilsostegno di ogni curva chiusa in Ω è nulla omòtopa rispetto a qualche punto p della curva(quindi eventualmente diverso da curva a curva).

Osservazione 4.3.10. Se Ω è stellato allora è semplicemente connesso. Per vericarlo bastatener presente quanto aermato nella Osservazione 4.3.6, prendendo quale punto q il centrodell'insieme stellato e quale curva ρ il segmento qp.

Page 110: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

110 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Non vale il viceversa, ovvero non tutti gli aperti connessi e semplicemente connessi sonoper forza stellati, ad esempio questo è ciò che capita all'insieme Ω := R3\(0, 0, 0) (chesia semplicemente connesso è reso evidente dal fatto che non si può legare un pallone!).

Corollario 4.3.11. Sia Ω aperto, connesso, semplicemente connesso, in Rn. Se ω è chiusain Ω allora è esatta.

Dimostrazione. Per denizione di semplice connessione ogni curva chiusa è nullo-omotòpa.Inoltre ω è chiusa, per ipotesi. Dalla Proposizione 4.3.8 sappiamo che allora

∫γ ω = 0 per

ogni tale curva γ. Dal Proposizione 4.2.9 deduciamo che allora ω è esatta.

Corollario 4.3.12. Sia Ω aperto, connesso, semplicemente connesso. Allora

V1(Ω) = V c1 (Ω)V e

1 (Ω) = 0,

ovvero lo spazio quoziente è banale.

Teorema 4.3.13 (Jordan). Sia γ in R2 il sostegno di una curva chiusa e semplice. Al-lora γ divide R2 in due componenti connesse: una limitata (l'interno) e una non limitata(l'esterno).

γ

I

E

Inoltre, se γ è C1 a tratti si ha che:

i. p è interno quando la generica semiretta uscente da p interseca γ un numero disparidi volte,

ii. p è esterno quando la generica semiretta uscente da p interseca γ un numero paridi volte.

γ

I

E

pq

Le semirette per p intersecano γ unnumero dispari di volte: p è interno.Le semirette per q intersecano γ unnumero pari di volte: q è esterno.

Osservazione 4.3.14. Il teorema ha una dimostrazione abbastanza complessa (Vd. ad esem-pio [Ro]). La nozione di semiretta generica è vaga e andrebbe precisata, ma non si puòpretendere che la tesi valga per ogni semiretta: in eetti è facile costruire esempi per i qualiesistono semirette che intersecano γ lungo segmenti o col numero sbagliato di punti.

Page 111: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.4. DIVAGAZIONI 111

γ

IE

p

γ

IE

p

Teorema 4.3.15. Sia Ω = R2\(0, 0) allora dim(V1(Ω)) = 1.

Dimostrazione. (Sketch). Sia ω una forma chiusa in Ω = R2\(0, 0), sia α := 12π

∫ ω dove

è la circonferenza di centro 0 e raggio 1 percorsa in senso antiorario. Sia poi

ω0 :=−y dx+ x dy

x2 + y2(il vortice),

e sia ω := ω − αω0. Allora ω è chiusa (perché ω e ω0 lo sono). Mostriamo che in realtà ωè esatta. Lo facciamo vericando che

∫γ ω = 0 per ogni curva γ che sia chiusa e semplice,

e deducendo la tesi dalla Proposizione 4.2.13.Infatti sia γ chiusa (regolare e semplice) allora (per Jordan) γ divide R2 in due connessi:I (interno) e E (esterno). Ci sono quindi due soli casi:

i. 0 ∈ E. In tal caso γ è nulla omòtopa e perciò∫γ ω = 0.

ii. 0 ∈ I. L'interno è aperto, allora contiene un aperto B di centro 0 che contiene Cr,circonferenza di raggio r > 0 e centro 0, sucientemente piccola e antioraria. Ma γ èomòtopa a Cr, quindi

∫γ ω =

∫Crω e Cr è omòtopa a C1, quindi

∫Crω =

∫C1ω. Così∫

γω =

∫C1

ω =

∫C1

(ω − αω0) =

∫C1

ω − α∫C1

ω0 =

∫C1

ω − 2πα = 0

per la denizione di α.

Quindi∫γ ω = 0 per ogni curva chiusa regolare e semplice γ, e questo garantisce che ω

è esatta (Proposizione 4.2.13). Ma allora la scrittura ω = αω0 + ω mostra che ω coin-cide con αω0 a meno di forme esatte (la ω). Questo equivale ad aermare che V1(Ω) =V c

1 (Ω)V e1 (Ω) = 〈ω0〉R, che quindi ha dimensione 1.

4.4 Divagazioni

Sia Ω ⊆ R aperto sia p ∈ Ω ssato ad arbitrio. Consideriamo tutte le curve γ chiuse da pin p. Tra queste curve abbiamo un'operazione di addizione: la concatenazione.

γ1

p

+γ2

p

=γ1 + γ2

p

Page 112: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

112 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

Tale operazione è associativa: γ1 + (γ2 + γ3) = (γ1 + γ2) + γ3 (i.e. è un semigruppo) conelemento neutro 0 dato dalla curva costante ϕ(t) = p per ogni t ∈ [0, 1]. In questo semi-gruppo però gli elementi non nulli sono privi di inverso visto che se γ non è costante, lacurva γ + η non potrò essere costante qualunque sia la curva η.Tuttavia l'omotopìa è una relazione di equivalenza e questa si comporta bene rispettoalla concatenazione: se γ1 ≈ γ1 e γ2 ≈ γ2 (dove ≈ è la relazione di omotopìa) alloraγ1 + γ2 ≈ γ1 + γ2.Inoltre a meno di omotopìa la curva −γ si comporta da inversa di γ rispetto alla con-catenazione, ovvero γ + (−γ) ≈ 0 qualunque sia la curva γ. Infatti sia ϕ : [0, 1] → Ω laparametrizzazione di γ (quindi ϕ è continua e ϕ(0) = ϕ(1) = p). Sia ψ : [0, 1]× [0, 1]→ Ωla funzione

ψ(s, t) := ϕ(4st(1− t)).

È immediato vericare che eettivamente essa è continua, che ψ(0, t) parametrizza la co-stante, che ψ(1, t) parametrizza γ + (−γ) (percorre γ quando t ∈ [0, 1/2] e −γ quandot ∈ [1/2, 1]), e che ψ(s, 0) = ψ(s, 1) = p per ogni s, e che quindi ψ è una omotopia traγ + (−γ) e la curva costante.Ne segue che:

π1(Ω, p) := Classi di omotopìa delle curve chiuse di Ω passanti per p

con l'operazione + di concatenazione è un gruppo. Esso è detto primo gruppo di omotopìa(primo perché ce ne sono altri. . . ).Supponiamo che Ω sia un aperto connesso (quindi connesso per archi). Allora dati p e qesiste una curva ρ che li congiunge e il cammino (−ρ) + γ + ρ parte da q e arriva in q.Viceversa: se γ è una curva da q a q allora ρ+ γ + (−ρ) va da p in p. L'applicazione di ρpassa alle classi di omotopìa, quello appena indicato è quindi un isomorsmo tra π1(Ω, p)e π1(Ω, q). Possiamo quindi parlare semplicemente di π1(Ω). Così

i. se Ω è semplicemente connesso allora π1(Ω) = 0 (facile);

ii. se Ω = R2\(0, 0) allora π1(Ω) ∼ Z, ovvero gruppo libero con un generatore (nonfacile).

In generale π1(Ω) non è abeliano: per mostrarlo evidenziamo che talvolta esiste un commu-tatore non banale. Sia ad esempio Ω := R2\a, b (ovvero R2 privato di due punti). Sianoγa e γb come in gura

p

a

γa

b

γb

Allora γa + γb + (−γa) + (−γb) è omòtopa in Ω a

Page 113: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

4.4. DIVAGAZIONI 113

p

a b

ma questa non è omòtopa in Ω alla curva costante in p. Quindi in π1(Ω) si ha [γa + γb +(−γa) + (γb)] 6= [0]. (In eetti per Ω = R2\a, b si dimostra che π1(Ω) è il gruppo liberogenerato da [γa] e [γb]).Consideriamo π′1(Ω) il gruppo generato dai commutatori di π1(Ω) (quindi dagli elementi[γ + ρ + (−γ) + (−ρ)] al variare di γ e ρ in π1(Ω)). Questo è un sottogruppo normale diπ1(Ω), quindi è possibile denire il gruppo quoziente

πab(Ω) := π1(Ω)π′1(Ω),

che è detto l'abelianizzato di π1(Ω). Esso è in eetti commutativo, per costruzione. Questogruppo è anche uno Z-modulo (perché per ogni intero n ed ogni curva γ, nγ può essereintesa come la curva di sostegno γ percorsa |n| volte nello stesso senso se n è positivo e insenso opposto se n è negativo). Come Z-modulo non ha torsione (ovvero nγ = 0, a meno diomotopìa, se e solo se n = 0 oppure γ è la curva 0); si può allora estendere lo Z-moduload un R-modulo tensorizzandolo con R, ottenendo

πab(Ω)⊗Z R.

Concretamente, questo corrisponde a prendere una Z-base di πab(Ω) e considerare l'insiemedelle loro combinazioni lineari a coecienti in R.Ma allora πab(Ω) ⊗Z R è un R-modulo libero ovvero uno spazio vettoriale. A cosa servetutto ciò?Osserviamo che anche se [γ + ρ+ (−γ) + (−ρ)] 6= [0] si ha comunque che∫

γ+ρ+(−γ)+(−ρ)ω =

∫γω +

∫ρω +

∫−γω +

∫−ρω =

∫γω +

∫ρω −

∫γω −

∫ρω = 0,

quindi l'integrazione di una forma chiusa non solo non distingue tra curve omòtope ma èpure banale sui commutatori.Questa osservazione consente di vedere

∫γ ω come una mappa bilineare

V1(Ω)× πab(Ω)⊗Z R −→ R,

(ω, γ) 7→ 〈ω, γ〉 :=∫γ ω.

La mappa 〈·, ·〉 è ben denita perché l'integrale delle forme esatte fa sempre 0 visto chele curve sono chiuse e che inoltre il suo valore non cambia per omotopìa e vale 0 suicommutatori.Questa mappa è bilineare per costruzione, ma ciò che la rende utile è il fatto che essa ènon degenere in entrambi gli argomenti, ovvero:

i. Se ω è tale che 〈ω, γ〉 = 0 ∀γ, allora ω è 0 (in V1(Ω)),

Page 114: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

114 CAPITOLO 4. CURVE, CAMPI VETTORIALI, FORME DIFFERENZIALI

ii. Se γ è tale che 〈ω, γ〉 = 0 ∀ω, allora γ è 0 (in πab(Ω)⊗Z R).

La prima tesi è esattamente il teorema di esattezza che abbiamo studiato: se∫γ ω = 0 per

ogni γ allora ω è esatta (e quindi ω = 0 in V1(Ω)). La seconda tesi è invece nuova e piùdicile: per dimostrarla occorre vericare che se γ non è omòtopa a 0 allora esiste unaforma chiusa e non esatta ω con

∫γ ω 6= 0; intuitivamente il fatto che γ sia non 0-omòtopa

signica che γ circonda qualche punto che non sta in Ω, e così una possibile scelta per ωè la forma vortice centrata su quel punto, ma i dettagli necessari per rendere operativaquesta intuizione sono parecchio complicati. . .Una volta dimostrati questi due fatti, da essi segue6 che

V c1 (Ω)V e

1 (Ω) = V1(Ω) è isomorfo a πab(Ω)⊗Z R (come spazi vettoriali).

Credo che questo sia un buon punto per terminare il corso. . .

6Vale il teorema seguente: Se V eW sono R-spazi vettoriale nito dimensionali ed esiste 〈·, ·〉 : V ×W →R bilineare e non degenere in entrambi gli argomenti allora V e W sono isomor.

Dimostrazione. Le ipotesi infatti implicano che la mappa W → V ∗ che associa ad ogni elemento w ∈W ilfunzionale 〈·, w〉 è iniettiva, e lo stesso vale per la analoga mappa V →W ∗. Ma allora dim(V ) ≤ dim(W ∗) =dim(W ) ≤ dim(V ∗) = dim(V ) e quindi dim(V ) = dim(W ).

Page 115: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 5

Bibliograa

Testi usati come riferimento principale per il corso:

[R1 ] W. Rudin: Real and complex analysis, McGraw-Hill Book Co., New York, 1987.

[R2 ] W. Rudin: Principles of mathematical analysis, McGraw-Hill Inc., New York, 1974.

Testi di approfondimento:

[AP ] A. Ambrosetti, G. Prodi: A primer of nonlinear analysis, Cambridge Studies in AdvancedMathematics, 34, Cambridge University Press, Cambridge, 1995.

[DeMGZ ] G. De Marco, G. Gorni, G. Zampieri: Global inversion of functions: an introduction,NoDEA Nonlinear Dierential Equations Appl. 1(3), 1994, 229248.

[GD ] A. Granas, J. Dugundji: Fixed point theory, Springer Monographs in Mathematics, Springer-Verlag, New York, 2003.

[GH ] V. Guillemin and P. Haine: Dierential forms, World Scientic Publishing Co. Pte. Ltd.,Hackensack, NJ, 2019.

[GM ] G. H. Greco and S. Mazzucchi: Peano's 1886 existence theorem on rst-order scalar die-

rential equations: a review, Boll. Unione Mat. Ital. 9(3) pg. 375389, 2016.

[KP ] S. G. Krantz and H. R. Parks: The implicit function theorem, Modern Birkhäuser Classics,Birkhäuser/Springer, New York, 2013.

[M ] J. R. Munkres: Analysis on manifolds, Addison-Wesley publishing Company, 1991.

[Ro ] J. Roe: Winding around. The winding number in topology, geometry, and analysis, StudentMathematical Library 76, AMS, 2015.

[Sh ] J. H. Shapiro: A xed-point farrago, Universitext, Springer, 2016.

[Sp ] M. Spivak: Calculus on manifolds. A modern approach to classical theorems of advanced

calculus, W. A. Benjamin, Inc., New York-Amsterdam, 1965.

115

Page 116: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

116 CAPITOLO 5. BIBLIOGRAFIA

Page 117: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

Capitolo 6

Indice dei nomi

• Niels Henrik Abel. Frindöe (Norway) 5-8-1802, Froland (Norway) 6-4-1829.

• Cesare Arzelà. Santo Stefano di Magra, La Spezia (now Italy) 6-3-1847, 15-3-1912.

• Guido Ascoli. Livorno (Italy) 12-12-1887, Turin 10-5-1957.

• Stefan Banach. Cracow 30-3-1892, Lvov (Ucraina) 31-8-1945.

• Sergei Bernstein. Odessa (Ukraine) 5-3-1880, Moscow 26-10-1968.

• Renato Caccioppoli. Naples 20-1-1904, Naples 8-5-1959.

• Augustin Louis Cauchy. Paris 21-8-1789, Sceaux (France) 23-5-1857.

• Jean Le Rond d'Alembert. Paris 17-11-1717, Paris 29-10-1783.

• Ulisse Dini. Pisa 14-11-1845, Pisa 28-10-1918.

• Jean Baptiste Joseph Fourier. Auxerre (France) 21-3-1768, Paris 16-5-1830.

• Thomas Hakon Grönwall. Dylta bruk (Sweden) 16-1-1877, New York 9-5-1932.

• Jacques Salomon Hadamard. Versailles 8-12-1865, Paris 17-10-1963.

• Felix Hausdor. Breslau Prussia (now Wroclaw, Poland) 8-11-1868, Bonn 26-01-1942.

• Helmut Hasse. Kassel (Germany) 25-08-1898, Ahrensburg (Germany) 26-12-1979.

• Otto Ludwig Hölder. Stuttgart 22-12-1859, Leipzig 29-8-1937.

• Marie Ennemond Camille Jordan. La Croix-Rousse (France) 5-1-1838, Paris 22-1-1922.

• Joseph Louis Lagrange. Turin 25-1-1736, Paris 10-4-1813.

• Gottfried Wilhelm von Leibniz. Lipsia 1-7-1646, Hannover 14-11-1716.

• Rudolf Otto Lipschitz. Königsberg Prussia (now Kaliningrad, Russia) 14-5-1832, Bonn 7-10-1903.

• Gustav Adolf Fedor Wilhelm Ludwig Mie. Rostock (Germany) 1868, Fribourg (Germany) 1957.

• Amalie Emmy Noether. Erlangen (Germany) 23-3-1882, Bryn Mawr, Pennsylvania 14-4-1935.

• William Fogg Osgood. Boston 10-5-1864, Belmont 22-7-1943.

• Giuseppe Peano. Spinetta (Italia) 27-8-1858, Turin 20-4-1932.

• Oskar Perron. Frankenthal (Germany) 7-5-1880, Munich 22-2-1975.

• Jules Henri Poincaré. Nancy (France) 29-4-1854, 17-7-1912.

• Frigyes Riesz. Györ (Hungary) 20-1-1880, Budapest 28-2-1956.

• Georg Friedrich Bernhard Riemann. Breselenz (Germany) 17-9-1826, Selasca (Italy) 20-6-1866.

• Juliusz Pawel Schauder. Lemberg (now Lviv, Ukraine) 21-9-1899, Lwow, Poland (now Ukraine) 9-1943.

• Hermann Amandus Schwarz. Hermsdorf, Silesia (now Poland) 25-1-1843, Berlin 30-11-1921.

• Marshall Harvey Stone. New York 8-4-1903, Madras (India) 9-1-1989.

• Teiji Takagi. Kazuya Village (near Gifu, Japan) 21-4-1875, Tokyo 29-02-1960.

117

Page 118: ANALISI 3 - unimi.it€¦ · This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License. This means that: (Attribution) ouY must

118 CAPITOLO 6. INDICE DEI NOMI

• Brook Taylor. Edmonton (Great Britain) 18-8-1685, London 29-12-1731.

• Otto Toeplitz. Breslau (Germany, now Wrocªaw, Poland) 8-8-1881, Jerusalem 15-2-1940.

• Vito Volterra. Ancona 3-5-1860, Rome 11-10-1940.

• Karl Theodor Wilhelm Weierstrass. Ostenfelde (Germany) 31-10-1815, Berlin 19-2-1897.