mecanica cuantica: notas de clase

663
Mec´ anica Cu´ antica: Notas de Clase Rodolfo Alexander Diaz Sanchez Universidad Nacional de Colombia Departamento de F´ ısica Bogot´ a, Colombia 23 de agosto de 2015

Upload: others

Post on 16-Oct-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Mecanica Cuantica: Notas de Clase

Mecanica Cuantica: Notas de Clase

Rodolfo Alexander Diaz SanchezUniversidad Nacional de Colombia

Departamento de FısicaBogota, Colombia

23 de agosto de 2015

Page 2: Mecanica Cuantica: Notas de Clase

Indice general

1. Linear or vector spaces 14

1.1. Definition of a linear vector space . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2. Algebraic properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3. Vector subspaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.4. Dimension and bases in vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.5. Mappings and transformations in vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.6. Linear transformations of a vector space into itself . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.6.1. Projection operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.7. Normed vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.7.1. Convergent sequences, cauchy sequences and completeness . . . . . . . . . . . . . . . . . . . 23

1.7.2. The importance of completeness in quantum mechanics . . . . . . . . . . . . . . . . . . . . 24

1.7.3. The concept of continuity and its importance in Physics . . . . . . . . . . . . . . . . . . . . 24

1.8. Banach Spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.8.1. Continuous linear transformations of a Banach space into scalars . . . . . . . . . . . . . . . 25

1.8.2. Continuous linear transformations of a Banach space into itself . . . . . . . . . . . . . . . . 25

1.9. Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.9.1. Orthonormal sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.9.2. The conjugate space H∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.9.3. The conjugate and the adjoint of an operator . . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.10. Normal operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

1.11. Self-Adjoint operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.12. Unitary operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1.13. Projections on Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

1.14. Theory of representations in finite-dimensional vector spaces . . . . . . . . . . . . . . . . . . . . . . 37

1.14.1. Representation of vectors and operators in a given basis . . . . . . . . . . . . . . . . . . . . 37

1.14.2. Change of coordinates of vectors under a change of basis . . . . . . . . . . . . . . . . . . . . 40

1.14.3. Change of the matrix representative of linear transformations under a change of basis . . . 41

1.15. Active and passive transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

1.16. Theory of representations on finite dimensional Hilbert spaces . . . . . . . . . . . . . . . . . . . . . 42

1.16.1. Linear operators in finite dimensional Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . 44

1.17. Determinants and traces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

1.18. Rectangular matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

1.19. The eigenvalue problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

1.19.1. Matrix representative of the eigenvalue problem . . . . . . . . . . . . . . . . . . . . . . . . . 49

1.19.2. Eigenvectors and the canonical problem of matrices . . . . . . . . . . . . . . . . . . . . . . 50

1.20. Normal operators and the spectral theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

1.20.1. A qualitative discussion of the spectral theorem in infinite dimensional Hilbert spaces . . . 55

1.21. The concept of “hyperbasis” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2

Page 3: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 3

1.22. Definition of an observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.23. Complete sets of commuting observables (C.S.C.O.) . . . . . . . . . . . . . . . . . . . . . . . . . . 59

1.24. Some terminology concerning quantum mechanics . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611.25. The Hilbert Space L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

1.25.1. The wave function space . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

1.26. Discrete orthonormal basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

1.26.1. Funcion delta de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641.27. Closure relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

1.28. Introduction of hyperbases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

1.29. Closure relation with hyperbases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

1.30. Inner product and norm in terms of a hyperbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671.31. Some specific continuous bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

1.31.1. Plane waves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

1.31.2. “Delta functions” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691.32. Tensor products of vector spaces, definition and properties . . . . . . . . . . . . . . . . . . . . . . . 70

1.32.1. Scalar products in tensor product spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

1.32.2. Tensor product of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

1.32.3. The eigenvalue problem in tensor product spaces . . . . . . . . . . . . . . . . . . . . . . . . 721.32.4. Complete sets of commuting observables in tensor product spaces . . . . . . . . . . . . . . . 74

1.33. Restrictions of an operator to a subspace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

1.34. Functions of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

1.34.1. Some commutators involving functions of operators . . . . . . . . . . . . . . . . . . . . . . . 761.35. Differentiation of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1.35.1. Some useful formulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

1.36. State space and Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

1.37. Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 801.37.1. Elements of the dual or conjugate space E∗

r . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

1.37.2. The correspondence between bras and kets with hyperbases . . . . . . . . . . . . . . . . . . 81

1.38. The action of linear operators in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

1.38.1. Projectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 831.39. Hermitian conjugation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

1.39.1. The adjoint operator A† in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

1.39.2. Mathematical objects and hermitian conjugation in Dirac notation . . . . . . . . . . . . . . 86

1.40. Theory of representations of E in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 881.40.1. Orthonormalization and closure relation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

1.40.2. Representation of operators in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . 91

1.41. Change of representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

1.41.1. Transformation of the coordinates of a ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . 941.41.2. Transformation of the coordinates of a bra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

1.41.3. Transformation of the matrix elements of an operator . . . . . . . . . . . . . . . . . . . . . 95

1.42. Representation of the eigenvalue problem in Dirac notation . . . . . . . . . . . . . . . . . . . . . . 95

1.42.1. C.S.C.O. in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 951.43. The continuous bases |r〉 and |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

1.43.1. Orthonormalization and closure relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

1.43.2. Coordinates of kets and bras in |r〉 and |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . 97

1.43.3. Changing from the |r〉 representation to |p〉 representation and vice versa . . . . . . . . 981.43.4. The R and P operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

1.43.5. The eigenvalue problem for R and P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

1.43.6. Some properties of Fourier transforms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

Page 4: Mecanica Cuantica: Notas de Clase

4 INDICE GENERAL

1.44. General properties of two conjugate observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

1.44.1. The eigenvalue problem of Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

1.44.2. The action of Q,P and S (λ) in the |q〉 basis . . . . . . . . . . . . . . . . . . . . . . . . . 105

1.44.3. Representation in the |p〉 basis and the symmetrical role of P and Q . . . . . . . . . . . . 106

1.45. Diagonalization of a 2× 2 hermitian matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

1.45.1. Formulation of the problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

1.45.2. Eigenvalues and eigenvectors of K . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

1.45.3. Eigenvalues and eigenvectors of H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

2. Construccion fenomenologica de los postulados 111

2.1. La radiacion del cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

2.2. El efecto fotoelectrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

2.3. El efecto compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

2.4. Espectroscopıa, estabilidad del atomo y teorıa de Bohr . . . . . . . . . . . . . . . . . . . . . . . . . 115

2.4.1. La teorıa de Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

2.4.2. Predicciones de la teorıa de Bohr para atomos con un electron . . . . . . . . . . . . . . . . 117

2.5. Las reglas de cuantizacion de Wilson y Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.5.1. El atomo de Bohr bajo las reglas de Wilson y Sommerfeld . . . . . . . . . . . . . . . . . . . 119

2.5.2. Cuantizacion de Planck con las reglas de Wilson y Sommerfeld . . . . . . . . . . . . . . . . 120

2.5.3. La teorıa relativista de Sommerfeld y la estructura fina del atomo de Hidrogeno . . . . . . . 121

2.6. Los postulados de De Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

2.6.1. Propiedades de las ondas piloto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

2.6.2. Corroboracion experimental de los postulados de De Broglie . . . . . . . . . . . . . . . . . . 125

2.6.3. Las reglas de cuantizacion de Bohr a la luz de los postulados de De Broglie . . . . . . . . . 125

2.7. Sıntesis de los resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

2.8. El experimento de Young de la doble rendija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

2.8.1. Interpretacion mecano-cuantica de la dualidad onda partıcula . . . . . . . . . . . . . . . . . 131

2.9. Medicion y preparacion de un sistema: Descomposicion espectral . . . . . . . . . . . . . . . . . . . 132

2.10. Dualidad onda partıcula para la materia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

2.11. Aspectos ondulatorios de una partıcula material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

2.11.1. Estados cuanticos arbitrarios como superposicion de ondas planas . . . . . . . . . . . . . . 138

2.11.2. Perfil instantaneo del paquete de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

2.11.3. El principio de incertidumbre de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

2.12. El principio de complementariedad para la dualidad onda partıcula y su relacion con el principiode incertidumbre de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

2.13. Evolucion temporal de paquetes de ondas libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

2.14. Caracterizacion de paquetes de onda gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

2.14.1. Integrales basicas para paquetes gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

2.14.2. Perfiles de paquetes de onda gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

2.14.3. Relaciones de incertidumbre para paquetes gaussianos . . . . . . . . . . . . . . . . . . . . . 151

2.15. Evolucion temporal de paquetes de onda gaussianos (opcional) . . . . . . . . . . . . . . . . . . . . 151

2.15.1. Dispersion del paquete de onda gaussiano (opcional) . . . . . . . . . . . . . . . . . . . . . . 152

3. Ecuacion de Schrodinger y sus propiedades 155

3.1. Plausibilidad de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

3.2. Ecuacion de Schrodinger con potencial escalar independiente del tiempo . . . . . . . . . . . . . . . 158

3.3. Propiedades generales de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . 160

3.3.1. Determinismo en las soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

3.3.2. Principio de superposicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

Page 5: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 5

3.3.3. Conservacion de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

3.3.4. La ecuacion de continuidad para la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 162

3.3.5. Expresion polar de la corriente de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 164

3.4. Aplicacion de la ecuacion de Schrodinger a potenciales discontınuos . . . . . . . . . . . . . . . . . 165

3.5. Potenciales rectangulares, analogo optico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

3.5.1. Estrategia de solucion para potenciales acotados con discontinuidades de salto . . . . . . . 167

3.5.2. Expresion para la corriente en regiones de potencial constante . . . . . . . . . . . . . . . . . 168

3.6. El potencial escalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

3.6.1. E > V0, reflexion parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

3.6.2. E < V0; reflexion total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

3.7. Barrera de potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

3.7.1. E > V0, resonancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

3.7.2. Caso E < V0: Efecto tunel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

3.8. Pozo de potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

3.8.1. Partıcula con energıa −V0 < E < 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

3.8.2. Partıcula con energıa E > 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

4. Enunciado matematico de los postulados 192

4.1. Los fenomenos clasicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

4.2. Los fenomenos cuanticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

4.3. Establecimiento de los postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

4.3.1. Descripcion de los estados y las cantidades fısicas . . . . . . . . . . . . . . . . . . . . . . . . 195

4.3.2. El proceso de medicion y la distribucion de probabilidad . . . . . . . . . . . . . . . . . . . . 196

4.3.3. Relevancia fısica de las fases en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . . 199

4.3.4. El proceso de medida y la reduccion del paquete de onda . . . . . . . . . . . . . . . . . . . 200

4.3.5. Evolucion fısica de los sistemas cuanticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

4.3.6. Reglas de cuantizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

5. Consecuencias fenomenologicas de los postulados 205

5.1. Consideraciones estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

5.1.1. Valor medio de un observable para un sistema en un estado dado . . . . . . . . . . . . . . . 206

5.1.2. Valor esperado para los observables X,P . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

5.1.3. Valor esperado para el commutador de dos observables . . . . . . . . . . . . . . . . . . . . . 209

5.1.4. La desviacion media cuadratica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

5.2. Observables compatibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

5.3. Observables no compatibles e incertidumbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

5.4. Desviacion media cuadratica y principio de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . 215

5.4.1. Paquetes de mınima incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

5.5. Preparacion de un estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

5.6. Propiedades adicionales de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . 220

5.6.1. Aspectos adicionales sobre la conservacion de la probabilidad (opcional) . . . . . . . . . . . 220

5.7. Evolucion temporal del valor esperado de un observable . . . . . . . . . . . . . . . . . . . . . . . . 221

5.7.1. Evolucion temporal de los valores esperados de R, P: Teorema de Ehrenfest . . . . . . . . 222

5.8. Ecuacion de Schrodinger para sistemas conservativos . . . . . . . . . . . . . . . . . . . . . . . . . . 225

5.8.1. Estados estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

5.8.2. Constantes de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

5.8.3. Frecuencias de Bohr de un sistema y reglas de seleccion . . . . . . . . . . . . . . . . . . . . 228

5.8.4. Relacion de incertidumbre entre tiempo y energıa para sistemas conservativos . . . . . . . . 229

5.8.5. Cuarta relacion de incertidumbre para un paquete de onda unidimensional . . . . . . . . . 231

Page 6: Mecanica Cuantica: Notas de Clase

6 INDICE GENERAL

5.9. Consecuencias fısicas del principio de superposicion . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

5.9.1. Diferencia entre superposicion lineal y mezcla estadıstica . . . . . . . . . . . . . . . . . . . . 232

5.9.2. Efectos de interferencia en fotones polarizados . . . . . . . . . . . . . . . . . . . . . . . . . 234

5.9.3. Suma sobre los estados intermedios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

5.10. Principio de superposicion con varios estados asociados a una medida . . . . . . . . . . . . . . . . 237

5.10.1. El principio de superposicion para valores propios degenerados . . . . . . . . . . . . . . . . 237

5.10.2. Aparatos insuficientemente selectivos en la medida . . . . . . . . . . . . . . . . . . . . . . . 238

5.11. Discusion general sobre el fenomeno de interferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 240

5.12. Medicion insuficiente de espectros contınuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

5.13. Reduccion del paquete de onda para espectro continuo . . . . . . . . . . . . . . . . . . . . . . . . . 242

6. Aplicacion de los postulados con informacion parcial 244

6.1. Aplicacion de los postulados al medir sobre un subsistema . . . . . . . . . . . . . . . . . . . . . . . 244

6.1.1. Interpretacion fısica de los estados que son productos tensoriales . . . . . . . . . . . . . . . 245

6.1.2. Significado fısico de estados que no son productos tensoriales . . . . . . . . . . . . . . . . . 247

6.2. Operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

6.2.1. El concepto de mezcla estadıstica de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 248

6.2.2. Estados puros y operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

6.2.3. Mezcla estadıstica de estados: estados no puros . . . . . . . . . . . . . . . . . . . . . . . . . 251

6.2.4. Propiedades generales del operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . 252

6.2.5. Populaciones y coherencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

6.3. Aplicaciones del operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

6.3.1. Sistema en equilibrio termodinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

6.3.2. Descripcion de subsistemas con base en observables globales de un sistema: el concepto detraza parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

6.3.3. Traza parcial y operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257

7. Formulaciones alternativas de la mecanica cuantica 260

7.1. Operador evolucion temporal: definicion y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . 260

7.1.1. Operador evolucion temporal para sistemas conservativos . . . . . . . . . . . . . . . . . . . 262

7.1.2. Observaciones adicionales sobre el operador evolucion temporal (opcional) . . . . . . . . . . 262

7.2. Bras, kets y observables equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

7.2.1. La transformada de un operador y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . 264

7.3. La imagen de Schrodinger y la imagen de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . 265

7.3.1. Algunos sistemas simples en la imagen de Heisenberg . . . . . . . . . . . . . . . . . . . . . . 266

7.4. La imagen de interaccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

8. El oscilador armonico cuantico 270

8.1. Propiedades generales del oscilador armonico cuantico unidimensional . . . . . . . . . . . . . . . . 270

8.2. El problema de valores propios del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

8.3. Determinacion del espectro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273

8.3.1. Interpretacion de los operadores a, a† y N . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

8.3.2. Estudio de la degeneracion del espectro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

8.4. Estados propios del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

8.4.1. Construccion de los kets propios con base en el ket del estado base . . . . . . . . . . . . . . 277

8.4.2. Ortonormalidad de los kets propios (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . 278

8.4.3. Accion de los operadores creacion y destruccion sobre los autoestados del Hamiltoniano . . 280

8.5. Funciones propias asociadas a los estados estacionarios en la base |x〉 . . . . . . . . . . . . . . . 281

8.6. Valores esperados y dispersion en un estado estacionario del oscilador . . . . . . . . . . . . . . . . 283

Page 7: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 7

8.7. Propiedades del estado base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286

8.8. Evolucion temporal de los observables del oscilador armonico . . . . . . . . . . . . . . . . . . . . . 287

8.9. Oscilador armonico cargado en un campo electrico uniforme (Opcional) . . . . . . . . . . . . . . . 289

8.9.1. Solucion utilizando el operador traslacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

9. Estados cuasi-clasicos del oscilador armonico 293

9.1. Parametrizacion del oscilador clasico con parametros cuanticos . . . . . . . . . . . . . . . . . . . . 293

9.2. Construccion de los estados coherentes o cuasi-clasicos . . . . . . . . . . . . . . . . . . . . . . . . . 294

9.3. Propiedades de los estados |α〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

9.3.1. Valores permitidos de la energıa para un estado coherente |α〉 . . . . . . . . . . . . . . . . . 298

9.3.2. Calculo de los observables X,P en el estado |α〉 . . . . . . . . . . . . . . . . . . . . . . . . . 300

9.4. Generador y funcion de onda de los estados coherentes . . . . . . . . . . . . . . . . . . . . . . . . . 300

9.5. Los estados coherentes son completos pero no ortogonales . . . . . . . . . . . . . . . . . . . . . . . 303

9.6. Evolucion temporal de los estados coherentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

9.7. Tratamiento mecano-cuantico de un oscilador armonico macroscopico . . . . . . . . . . . . . . . . . 307

10.Teorıa general del momento angular en mecanica cuantica 308

10.1. Definicion de momento angular por sus propiedades de conmutacion . . . . . . . . . . . . . . . . . 309

10.1.1. Cuantizacion del momento angular orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309

10.1.2. Definicion de momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310

10.2. Propiedades algebraicas del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310

10.2.1. Algebra de los operadores J2, J3, J+, J− . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

10.3. Estructura de valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

10.3.1. Notacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

10.3.2. Caracterısticas generales de los valores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . 312

10.3.3. Determinacion de los valores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . 314

10.4. Propiedades de los vectores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

10.4.1. Generacion de autoestados por medio de los operadores J+ y J− . . . . . . . . . . . . . . . 317

10.5. Construccion de una base estandar con base en un C.S.C.O . . . . . . . . . . . . . . . . . . . . . . 319

10.5.1. Descomposicion de E en subespacios del tipo E (j, k) . . . . . . . . . . . . . . . . . . . . . . 320

10.6. Representaciones matriciales de los operadores momento angular . . . . . . . . . . . . . . . . . . . 321

10.6.1. Representaciones matriciales del tipo (Ji)(j) en la base estandar para j arbitrario . . . . . . 322

10.6.2. Representaciones matriciales en la base estandar para j = 0 . . . . . . . . . . . . . . . . . . 323

10.6.3. Representaciones matriciales en la base estandar para j = 1/2 . . . . . . . . . . . . . . . . . 323

10.6.4. Representaciones matriciales en la base estandar para j = 1 . . . . . . . . . . . . . . . . . . 325

11.Propiedades de los momentos angulares orbitales 326

11.1. Momentos angulares orbitales como operadores diferenciales . . . . . . . . . . . . . . . . . . . . . . 329

11.2. Valores permitidos de l y m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330

11.3. Propiedades fundamentales de los armonicos esfericos . . . . . . . . . . . . . . . . . . . . . . . . . . 331

11.3.1. Ortonormalidad y completez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332

11.3.2. Propiedades de paridad y conjugacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332

11.3.3. Armonicos esfericos de la forma Yl,0 (θ) y polinomios de Legendre . . . . . . . . . . . . . . . 333

11.3.4. Teorema de adicion de los armonicos esfericos . . . . . . . . . . . . . . . . . . . . . . . . . . 333

11.4. Bases estandar de una funcion de onda sin espın . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

11.5. Valores esperados y dispersion para sistemas en un estado |l,m, k〉 . . . . . . . . . . . . . . . . . . 335

11.6. Probabilidades asociadas a la medida de L2 y L3 en un estado arbitrario . . . . . . . . . . . . . . . 337

11.7. Ejemplos de calculos de probabilidad para L2 y L3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

11.7.1. Funcion de onda parcialmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

Page 8: Mecanica Cuantica: Notas de Clase

8 INDICE GENERAL

11.7.2. Funcion de onda totalmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34111.7.3. Comportamiento de la probabilidad con θ y ϕ . . . . . . . . . . . . . . . . . . . . . . . . . . 341

12.Interacciones centrales en mecanica cuantica 34312.1. El problema de dos cuerpos en Mecanica clasica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34312.2. Reduccion del problema de dos cuerpos en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . 346

12.2.1. Autovalores y autofunciones del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . 347

12.3. El problema clasico de una partıcula sometida a una fuerza central . . . . . . . . . . . . . . . . . . 34812.4. Hamiltoniano cuantico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35012.5. Solucion general del problema de valores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350

12.5.1. La ecuacion radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35112.5.2. Comportamiento de la solucion radial en el origen . . . . . . . . . . . . . . . . . . . . . . . 352

12.6. Estados estacionarios de una partıcula en un potencial central . . . . . . . . . . . . . . . . . . . . . 35312.6.1. Degeneracion de los niveles de energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354

13.Atomos hidrogenoides 356

13.1. El atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35613.2. Problema de valores propios del atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . 35713.3. Solucion de la ecuacion radial por series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 359

13.3.1. Serie de potencias radial y relaciones de recurrencia . . . . . . . . . . . . . . . . . . . . . . 35913.3.2. Condicion asintotica ρ→ ∞ y truncamiento de la serie . . . . . . . . . . . . . . . . . . . . . 361

13.3.3. Coeficientes del polinomio radial en terminos de c0 . . . . . . . . . . . . . . . . . . . . . . . 36213.3.4. Calculo de c0 y de la funcion radial para l = 0, k = 1 . . . . . . . . . . . . . . . . . . . . . 36313.3.5. Calculo de c0 y de la funcion radial para l = 0, k = 2 . . . . . . . . . . . . . . . . . . . . . 36413.3.6. Calculo de c0 y de la funcion radial para l = k = 1 . . . . . . . . . . . . . . . . . . . . . . . 365

13.3.7. Estructura de los niveles de energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36613.4. Parametros atomicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36613.5. Resumen de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36713.6. Discusion de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368

13.6.1. Dependencia angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369

14.Corrientes de probabilidad y acoples magneticos en atomos 37214.1. Corrientes de probabilidad para el atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . 372

14.1.1. Efecto sobre la corriente debido a la introduccion de un campo magnetico . . . . . . . . . . 373

14.2. Atomo de hidrogeno en un campo magnetico uniforme . . . . . . . . . . . . . . . . . . . . . . . . . 37514.2.1. Hamiltoniano del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37514.2.2. Estimacion numerica de las contribuciones H0, H1 y H2 . . . . . . . . . . . . . . . . . . . . 37714.2.3. Termino diamagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37814.2.4. Termino paramagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379

14.3. Efecto Zeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38014.3.1. Corrimiento de los niveles atomicos con la correccion paramagnetica . . . . . . . . . . . . . 38014.3.2. Oscilaciones dipolares electricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38114.3.3. Frecuencia y polarizacion de la radiacion emitida . . . . . . . . . . . . . . . . . . . . . . . . 382

15.Momento angular intrınseco 38415.1. Comportamiento clasico de atomos paramagneticos inmersos en un campo magnetico . . . . . . . . 38415.2. Experimento de Stern-Gerlach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38515.3. Resultados del experimento y el momento angular intrınseco . . . . . . . . . . . . . . . . . . . . . . 386

15.4. Evidencia experimental del momento angular intrınseco del electron . . . . . . . . . . . . . . . . . 38815.4.1. Estructura fina de las lıneas espectrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388

Page 9: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 9

15.4.2. Efecto Zeeman anomalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388

15.5. Momento angular intrınseco en la cuantica no-relativista . . . . . . . . . . . . . . . . . . . . . . . . 389

15.6. Propiedades de un momento angular 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391

15.6.1. Resumen de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393

15.6.2. Representacion matricial de los observables de espın . . . . . . . . . . . . . . . . . . . . . . 394

15.7. Descripcion no-relativista de partıculas con espın 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . 395

15.7.1. Construccion de los estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

15.7.2. Construccion de operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

15.8. Representacion en la base |p, ε〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

15.9. Calculos de probabilidad para estados de espın 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

16.Adicion de momentos angulares 404

16.1. El problema clasico de la adicion del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . 404

16.2. Momento angular total en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404

16.2.1. Dos partıculas sin espın bajo una interaccion central . . . . . . . . . . . . . . . . . . . . . . 404

16.2.2. Una partıcula con espın bajo una interaccion central . . . . . . . . . . . . . . . . . . . . . . 406

16.2.3. Analisis general de dos momentos angulares asociados a una fuerza central . . . . . . . . . 407

16.3. La adicion de dos momentos angulares es otro momento angular . . . . . . . . . . . . . . . . . . . 408

16.4. Adicion de dos momentos angulares con j(1) = j(2) = 1/2 . . . . . . . . . . . . . . . . . . . . . . . . 409

16.4.1. Autovalores de J3 y su degeneracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410

16.4.2. Diagonalizacion de J2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411

16.4.3. Autoestados de J2 y J3: singlete y triplete . . . . . . . . . . . . . . . . . . . . . . . . . . . 412

16.5. Metodo general de adicion de dos momentos angulares arbitrarios . . . . . . . . . . . . . . . . . . . 413

16.5.1. Formacion del sistema a partir de dos subsistemas . . . . . . . . . . . . . . . . . . . . . . . 414

16.5.2. Momento angular total y sus relaciones de conmutacion . . . . . . . . . . . . . . . . . . . . 415

16.5.3. Cambio de base a realizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415

16.5.4. Autovalores de J2 y J3 : Caso de dos espines j1 = j2 = 1/2. . . . . . . . . . . . . . . . . . . 416

16.5.5. Autovalores de J3 y su degeneracion: Caso general . . . . . . . . . . . . . . . . . . . . . . . 417

16.5.6. Autovalores de J2 : caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419

16.6. Autovectores comunes de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421

16.6.1. Caso especial j1 = j2 = 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421

16.7. Autovectores de J2 y J3 : Caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423

16.7.1. Determinacion de los vectores |JM〉 del subespacio E (j1 + j2) . . . . . . . . . . . . . . . . . 423

16.7.2. Determinacion de los vectores |JM〉 en los otros subespacios . . . . . . . . . . . . . . . . . 424

16.8. Transformacion de la base desacoplada a la base acoplada . . . . . . . . . . . . . . . . . . . . . . . 425

17.Propiedades generales de los sistemas de dos estados 428

17.1. Formulacion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428

17.2. Efecto del acople sobre la energıa y los estados estacionarios . . . . . . . . . . . . . . . . . . . . . . 429

17.2.1. Efecto del acople sobre los estados estacionarios del sistema . . . . . . . . . . . . . . . . . . 429

17.2.2. Efecto de un acople debil sobre los niveles de energıa y estados estacionarios . . . . . . . . 431

17.2.3. Efecto de un acople fuerte sobre los niveles de energıa y estados estacionarios . . . . . . . . 432

17.3. Evolucion del vector de estado: oscilacion entre dos estados . . . . . . . . . . . . . . . . . . . . . . 432

18.Teorıa cuantica de la dispersion 436

18.1. Teorıa clasica de la dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436

18.2. Diferentes tipos de colisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439

18.3. Ejemplos de dispersion en mecanica clasica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440

18.3.1. Dispersion elastica por esfera rıgida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440

Page 10: Mecanica Cuantica: Notas de Clase

10 INDICE GENERAL

18.3.2. Dispersion de Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

18.4. Teorıa cuantica de la dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442

18.5. Estados estacionarios de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

18.5.1. Condiciones fısicas sobre el paquete de ondas . . . . . . . . . . . . . . . . . . . . . . . . . . 445

18.6. Calculo de la seccion eficaz usando corrientes de probabilidad . . . . . . . . . . . . . . . . . . . . . 448

18.7. Ecuacion integral de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450

18.7.1. Ecuacion integral y funcion de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450

18.7.2. Determinacion de la funcion de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452

18.7.3. Solucion de la ecuacion integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453

18.8. Aproximacion de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455

18.8.1. Rango de validez de la aproximacion de Born . . . . . . . . . . . . . . . . . . . . . . . . . . 457

18.8.2. Aproximacion de Born para el potencial de Yukawa . . . . . . . . . . . . . . . . . . . . . . 458

19.Teorıa cuantica de la dispersion II: Ondas parciales 461

19.1. Estados estacionarios de partıcula libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462

19.2. Estados estacionarios de partıcula libre con momento bien definido: Ondas planas . . . . . . . . . . 462

19.3. Estados estacionarios de partıcula libre con momento angular bien definido: Ondas esfericas libres. 463

19.4. Caracterizacion de las ondas esfericas libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464

19.4.1. Algebra de generadores de ondas esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464

19.4.2. Relaciones de recurrencia para las ondas esfericas libres . . . . . . . . . . . . . . . . . . . . 465

19.4.3. Solucion de la ecuacion radial para l = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466

19.4.4. Generacion de ondas esfericas libres con l 6= 0, a traves de P+ y L± . . . . . . . . . . . . . . 468

19.4.5. Ondas esfericas libres normalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469

19.4.6. Ortonormalidad de las funciones esfericas libres . . . . . . . . . . . . . . . . . . . . . . . . . 471

19.4.7. Comportamiento asintotico de las ondas esfericas libres . . . . . . . . . . . . . . . . . . . . 474

19.4.8. Relacion entre las ondas esfericas libres y las planas . . . . . . . . . . . . . . . . . . . . . . 476

19.4.9. Interpretacion fısica de las ondas esferica libres . . . . . . . . . . . . . . . . . . . . . . . . . 479

19.5. Ondas parciales en el potencial V (r) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481

19.5.1. Ondas parciales en potenciales de rango finito . . . . . . . . . . . . . . . . . . . . . . . . . . 483

19.5.2. Seccion eficaz en terminos de los corrimientos de fase δl . . . . . . . . . . . . . . . . . . . . 484

19.5.3. Dispersion por esfera rıgida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487

19.6. Colisiones con absorcion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488

19.6.1. Seccion eficaz en procesos absortivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489

19.6.2. Teorema optico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493

20.Teorıa estacionaria de perturbaciones 495

20.1. Descripcion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495

20.2. Solucion aproximada para los valores propios de H (λ) . . . . . . . . . . . . . . . . . . . . . . . . . 497

20.3. Perturbacion de un nivel no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500

20.3.1. Correccion de primer orden para la energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . 501

20.3.2. Correccion de primer orden para el autovector . . . . . . . . . . . . . . . . . . . . . . . . . 501

20.3.3. Correccion de segundo orden para la energıa . . . . . . . . . . . . . . . . . . . . . . . . . . 502

20.3.4. Correccion de segundo orden para el estado . . . . . . . . . . . . . . . . . . . . . . . . . . . 503

20.3.5. Cota superior para ε2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503

20.4. Perturbacion de un nivel degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504

20.4.1. Comportamiento de subniveles degenerados a mas alto orden en perturbaciones . . . . . . . 505

20.5. Consideraciones generales sobre teorıa estacionaria de perturbaciones . . . . . . . . . . . . . . . . . 506

20.6. Perturbaciones estacionarias sobre el oscilador armonico . . . . . . . . . . . . . . . . . . . . . . . . 507

20.6.1. Orden de magnitud de los observables no perturbados . . . . . . . . . . . . . . . . . . . . . 507

Page 11: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 11

20.6.2. Parametrizacion de la perturbacion al oscilador con potencial lineal adicional . . . . . . . . 508

20.6.3. Perturbacion al oscilador armonico con potencial cuadratico . . . . . . . . . . . . . . . . . . 510

20.6.4. Perturbacion del oscilador armonico por un potencial cubico . . . . . . . . . . . . . . . . . 511

21.Metodo variacional 515

21.1. Descripcion del metodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515

21.2. Implementacion del metodo variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515

21.3. Funciones de prueba restringidas a un subespacio de E . . . . . . . . . . . . . . . . . . . . . . . . . 518

21.4. Espectro del oscilador armonico por metodos variacionales . . . . . . . . . . . . . . . . . . . . . . . 519

21.4.1. Estimacion del estado base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519

21.4.2. Estimacion del primer estado excitado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520

21.5. Espectro del oscilador armonico con otras funciones de prueba . . . . . . . . . . . . . . . . . . . . 521

22.Teorıa de perturbaciones dependiente del tiempo 522

22.1. Solucion perturbativa de la ecuacion de Schrodinger dependiente del tiempo . . . . . . . . . . . . . 523

22.1.1. Estado del sistema a primer orden en λ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525

22.1.2. Probabilidad de transicion a segundo orden en λ . . . . . . . . . . . . . . . . . . . . . . . . 526

22.2. Perturbaciones sinusoidales y constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527

22.3. Perturbacion senoidal entre dos estados discretos: resonancias . . . . . . . . . . . . . . . . . . . . . 528

22.3.1. Ancho de resonancia e incertidumbre energıa tiempo . . . . . . . . . . . . . . . . . . . . . . 529

22.3.2. Condiciones para la validez del metodo perturbativo . . . . . . . . . . . . . . . . . . . . . . 530

22.4. Acoplamientos con estados del espectro contınuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 533

22.4.1. El caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534

22.4.2. Regla de oro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534

22.4.3. Probabilidad de transicion hacia el contınuo para perturbacion senoidal . . . . . . . . . . . 536

22.4.4. Dispersion y regla de oro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536

23.Estructura fina e hiperfina del atomo de Hidrogeno 538

23.1. El Hamiltoniano de estructura fina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 538

23.1.1. Orden de Magnitud de H0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 539

23.1.2. Termino de correccion cinetica Wmv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540

23.1.3. Acoplamiento espın-orbita WSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540

23.1.4. Termino de Darwin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541

23.2. Estructura hiperfina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543

23.2.1. Interpretacion de los terminos en la estructura hiperfina . . . . . . . . . . . . . . . . . . . . 543

23.3. Estructura fina del nivel n = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544

23.4. Representacion matricial de la estructura fina para el nivel n = 2 . . . . . . . . . . . . . . . . . . . 545

23.5. Calculo de los terminos cinetico y de Darwin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 546

23.5.1. Calculo de 〈1/R〉 ,⟨1/R2

⟩y⟨1/R3

⟩. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548

23.5.2. Calculo de 〈Wmv〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550

23.5.3. El valor medio 〈WD〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550

23.6. Calculo del termino de espın-orbita WSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551

23.6.1. Calculo del termino espın-angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551

23.6.2. Calculo del termino radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553

23.6.3. Contribucion espın-orbita completa para la subcapa 2p . . . . . . . . . . . . . . . . . . . . . 553

23.7. Sıntesis de resultados sobre la estructura fina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554

23.8. La estructura fina para n = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556

23.9. Estructura hiperfina para n = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556

23.9.1. Calculo del factor orbital R para Whf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558

Page 12: Mecanica Cuantica: Notas de Clase

12 INDICE GENERAL

23.9.2. Calculo del factor de espın para Whf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558

23.9.3. Espectro hiperfino del nivel 1s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559

24.Campos externos sobre el atomo de Hidrogeno 561

24.1. Efecto Zeeman de la estructura hiperfina del estado base 1s . . . . . . . . . . . . . . . . . . . . . . 561

24.1.1. Efecto Zeeman de campo debil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562

24.1.2. El efecto Zeeman para campo fuerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566

24.1.3. El efecto Zeeman para campo intermedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 569

24.2. Efecto Stark para el atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572

24.2.1. El efecto Stark sobre el nivel n = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572

24.2.2. Efecto Stark sobre el nivel n = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574

25.Moleculas diatomicas 576

25.1. Estados de momento angular cero (l = 0) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578

25.2. Estados de momento angular no nulo (l 6= 0) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 579

25.3. Espectro de moleculas diatomicas heteropolares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581

25.3.1. Espectro puramente rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582

25.3.2. Espectro vibracional-rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583

25.4. Correcciones a la estructura espectral (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584

25.4.1. Correccion a las funciones de onda y los niveles de energıa . . . . . . . . . . . . . . . . . . . 587

25.4.2. Distorsion centrıfuga de la molecula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587

25.4.3. Acople vibracional-rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587

25.5. Espectro de moleculas diatomicas homopolares: efecto Raman . . . . . . . . . . . . . . . . . . . . . 589

26.Sistemas cuanticos de partıculas identicas 590

26.1. Partıculas identicas en mecanica clasica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590

26.2. Partıculas identicas en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 591

26.3. Degeneracion de intercambio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592

26.3.1. Degeneracion de intercambio para un sistema de dos partıculas de espın 1/2 . . . . . . . . . 593

26.3.2. Degeneracion de intercambio para un sistema arbitrario . . . . . . . . . . . . . . . . . . . . 594

26.4. Operadores de permutacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595

26.4.1. Permutaciones en sistemas de dos partıculas . . . . . . . . . . . . . . . . . . . . . . . . . . . 595

26.4.2. Simetrizadores y antisimetrizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 596

26.4.3. Transformacion de los observables por medio de las permutaciones . . . . . . . . . . . . . . 597

26.4.4. Permutacion de un conjunto arbitrario de partıculas . . . . . . . . . . . . . . . . . . . . . . 598

26.5. Postulado de simetrizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601

26.5.1. Aplicacion del postulado a partıculas compuestas . . . . . . . . . . . . . . . . . . . . . . . . 602

26.5.2. Solucion de la degeneracion de intercambio . . . . . . . . . . . . . . . . . . . . . . . . . . . 602

26.6. Aplicacion del postulado de simetrizacion para N = 2 . . . . . . . . . . . . . . . . . . . . . . . . . 603

26.7. Postulado de simetrizacion para N arbitrario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604

26.7.1. Postulado de simetrizacion para bosones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604

26.7.2. Postulado de simetrizacion para fermiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605

26.8. Construccion de una base de estados fısicos de partıculas identicas . . . . . . . . . . . . . . . . . . 606

26.8.1. Propiedades de los kets de ocupacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608

26.9. Consistencia del postulado de simetrizacion con los otros postulados . . . . . . . . . . . . . . . . . 609

26.9.1. Postulado de simetrizacion y el proceso de medida . . . . . . . . . . . . . . . . . . . . . . . 609

26.9.2. Postulado de simetrizacion y evolucion temporal . . . . . . . . . . . . . . . . . . . . . . . . 610

26.10.Consecuencias fenomenologicas del postulado de simetrizacion . . . . . . . . . . . . . . . . . . . . . 611

26.10.1.Diferencias entre fermiones y bosones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611

Page 13: Mecanica Cuantica: Notas de Clase

INDICE GENERAL 13

26.10.2.Estado base de un sistema de partıculas identicas independientes . . . . . . . . . . . . . . . 61126.11.Predicciones fısicas del postulado de simetrizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 613

26.11.1.Predicciones sobre partıculas aparentemente identicas . . . . . . . . . . . . . . . . . . . . . 61526.11.2.Colision elastica de dos partıculas identicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 616

26.12.Situaciones en las cuales se puede ignorar el postulado de simetrizacion . . . . . . . . . . . . . . . 61726.12.1.Partıculas identicas ubicadas en regiones espaciales distintas . . . . . . . . . . . . . . . . . . 61726.12.2.Identificacion de partıculas por su direccion de espın . . . . . . . . . . . . . . . . . . . . . . 619

27.Atomos de muchos electrones y aproximacion de campo central 62027.1. Aproximacion de campo central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62127.2. Configuraciones electronicas de los atomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624

28.El atomo de Helio 62628.1. Configuraciones del atomo de Helio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626

28.1.1. Degeneracion de las configuraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62728.2. Efecto de la repulsion electrostatica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 629

28.2.1. Base de E (n, l;n′, l′) adaptada a las simetrıas de W . . . . . . . . . . . . . . . . . . . . . . 62928.2.2. Restricciones impuestas por el postulado de simetrizacion . . . . . . . . . . . . . . . . . . . 63128.2.3. Terminos espectrales generados por la repulsion electrostatica . . . . . . . . . . . . . . . . . 633

28.3. Terminos espectrales que surgen de la configuracion 1s, 2s . . . . . . . . . . . . . . . . . . . . . . . 63428.3.1. La integral de intercambio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63628.3.2. Analisis del papel del postulado de simetrizacion . . . . . . . . . . . . . . . . . . . . . . . . 63728.3.3. Hamiltoniano efectivo dependiente del espın . . . . . . . . . . . . . . . . . . . . . . . . . . . 638

28.4. Terminos espectrales que surgen de otras configuraciones excitadas . . . . . . . . . . . . . . . . . . 64028.5. Validez del tratamiento perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64028.6. Estructura fina del atomo de helio y multipletes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641

29.Metodo de Hartree-Fock 64429.1. Producto interno entre determinantes de Slater y un operador simetrico . . . . . . . . . . . . . . . 646

29.1.1. Ejemplo de aplicacion para N = 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64829.2. Valor esperado de la energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649

29.2.1. Valor esperado de H(0) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65029.2.2. Valor esperado de H(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65129.2.3. Valor esperado de H = H(0) +H(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65329.2.4. Interpretacion fısica de los terminos directo y de intercambio . . . . . . . . . . . . . . . . . 653

29.3. Metodo de Hartree-Fock para una capa cerrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65429.3.1. Minimizacion de E [D] con ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65529.3.2. Calculo de δF [ψ,ψ∗] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656

29.4. Operadores de Hartree-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65829.5. Interpretacion de la ecuacion de Hartree-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65929.6. Solucion por iteracion de la ecuacion de HF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65929.7. Determinacion del valor Fısico de la energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660

Page 14: Mecanica Cuantica: Notas de Clase

Capıtulo 1

Linear or vector spaces

We shall describe the most important properties of linear or vector spaces. This treatment is not rigorous at all,and only some simple proofs are shown. Our aim limits to provide a framework for our subsequent developments.

1.1. Definition of a linear vector space

Any non-empty set of objects V = xi form a linear space (or a vector space) if there is a “sum” operationdefined between the elements, and a “multiplication” by scalars (i.e. the system of real or complex numbers) suchthat

1. If xi ∈ V , and α is a scalar, then αxi ∈ V

2. If xi,xj ∈ V , then xi + xj ∈ V

3. xi + xj = xj + xi, ∀xi,xj ∈ V

4. xi + (xj + xk) = (xi + xj) + xk, ∀xi,xj ,xk ∈ V

5. (α+ β)xi = αxi + βxi ; ∀xi ∈ V

6. α (xi + xj) = αxi + αxj , ∀xi,xj ∈ V

7. (αβ)xi = α (βxi) ; ∀xi ∈ V

8. 1xi = xi ; ∀xi ∈ V

9. ∃ an element 0 ∈ V such that xi + 0 = xi, ∀xi ∈ V

10. ∀xi ∈ V , ∃ an element in V denoted by −xi such that xi + (−xi) = 0

The element 0 is usually called the null vector or the origin. The element −x is called the additive inverse of x.We should distinguish the symbols 0 (scalar) and 0 (vector). The two operations defined here (sum and productby scalars) are called linear operations. A linear space is real (complex) if we consider the scalars as the set of real(complex) numbers.

Let us see some simple examples

Example 1.1 The set of all real (complex) numbers with ordinary addition and multiplication taken as the linearoperations. This is a real (complex) linear space.

14

Page 15: Mecanica Cuantica: Notas de Clase

1.2. ALGEBRAIC PROPERTIES 15

Example 1.2 The set Rn (Cn) of all n-tuples of real (complex) numbers is a real (complex) linear space underthe following linear operations

x ≡ (x1, x2, . . . , xn) ; y ≡ (y1, y2, . . . , yn)

αx ≡ (αx1, αx2, , αxn) ; x+ y ≡ (x1 + y1, x2 + y2, . . . , xn + yn)

Example 1.3 The set of all bounded continuous real functions defined on a given interval [a, b] of the real line,with the linear operations defined pointwise as

(f + g) (x) = f (x) + g (x) ; (αf) (x) = αf (x) ; x ∈ [a, b]

We can see that a linear or vector space forms an abelian group whose elements are the vectors, and withaddition as the law of combination. However, the vector space introduce an additional structure by consideringmultiplication by scalars which is not a group property.

Some very important kinds of vector spaces are the ones containing certain sets of functions with some specificproperties. We can consider for example, the set of functions defined on certain interval with some condition ofcontinuity integrability etc. For instance, in quantum mechanics we use a vector space of functions.

1.2. Algebraic properties

Some algebraic properties arise from the axioms:The origin or identity 0 must be unique. Assuming another identity 0′ we have that x + 0′ = 0′ + x = x for

all x ∈ V. Then 0′ = 0′ + 0 = 0. Hence 0′ = 0.The additive inverse of any vector x is unique. Assume that x′ is another inverse of x then

x′ = x′ + 0 = x′ + (x+(−x)) =(x′ + x

)+(−x) = 0+ (−x) = −x

⇒ x′ = −x

xi + xk = xj + xk ⇒ xi = xj to see it, we simply add −xk on both sides. This property is usually called therearrangement lemma.

α · 0 = 0 we see it from α · 0+ αx = α · (0+ x) = αx = 0+ αx and applying the rearrangement lemma.0 · x = 0 it proceeds from 0 · x+ αx = (0 + α)x = αx = 0+ αx and using the rearrangement lemma.(−1)x = −x we see it from x+(−1)x = 1 · x + (−1)x = (1 + (−1))x = 0x = 0 = x+(−x) and the

rearrangement lemma.αx = 0 then α = 0 or x = 0; for if α 6= 0 we can multiply both sides of the equation by α−1 to give

α−1 (αx) = α−10 ⇒(α−1α

)x = 0 ⇒ 1x = 0 ⇒ x = 0. If x 6= 0 we prove that α = 0 by assuming α 6= 0 and

finding a contradiction. This is inmediate from the above procedure that shows that starting with α 6= 0 we arriveto x = 0.

It is customary to simplify the notation in x+(−y) and write it as x−y. The operation is called substraction.

1.3. Vector subspaces

Definition 1.1 A non-empty subset M of V is a vector subspace of V if M is a vector space on its own rightwith respect to the linear operations defined in V .

This is equivalent to the condition that M contains all sums, negatives and scalar multiples. The other pro-perties are derived directly from the superset V . Further, since −x = (−1)x it reduces to say that M must beclosed under addition and scalar multiplication.

When M is a proper subset of V it is called a proper subspace of V . The zero space 0 and the full space Vitself are trivial subspaces of V .

The following concept is useful to study the structure of vector subspaces of a given vector space,

Page 16: Mecanica Cuantica: Notas de Clase

16 CAPITULO 1. LINEAR OR VECTOR SPACES

Definition 1.2 Let S = x1, ..,xn be a non-empty finite subset of V , then the vector

x = α1x1 + α2x2 + . . .+ αnxn (1.1)

is called a linear combination of the vectors in S.

We can redefine a vector subspace by saying that a non-empty subsetM of V is a linear subspace if it is closedunder the formation of linear combinations. If S is a subset of V we can see that the set of all linear combinationsof vectors in S is a vector subspace of V , we denote this subspace as [S] and call it the vector subspace spanned byS. It is clear that [S] is the smallest subspace of V that contains S. Similarly, for a given subspaceM a non-emptysubset S of M is said to span M if [S] = M . Note that the closure of a vector space under an arbitrary linearcombination can be proved by induction from the closure property of vector spaces under linear operations. Noticeadditionally, that the proof of induction only guarantees the closure under any finite sum of terms, if we have aninfinite sum of terms (e.g. a series) we cannot ensure that the result is an element of the space, this is the reasonto define linear combinations as finite sums. If we want a property of closure under some infinite sums additionalstructure should be added as we shall see later.

Suppose now that M and N are subspaces of V . Consider the set M +N of all sums of the form x+ y withx ∈M and y ∈ N . SinceM and N are subspaces, this sum is the subspace spanned by the union of both subspacesM +N = [M ∪N ]. It could happen that M +N = V in this case we say that V is the sum of M and N . In turnit means that every vector in V is expressible as a sum of a vector in M plus a vector in N . Further, in some casesany element z of V is expressible in a unique way as such a sum, in this case we say that V is the direct sum ofM and N and it is denoted by

V =M ⊕N

we shall establish the conditions for a sum to become a direct sum

Theorem 1.1 Let a vector space V be the sum of two of its subspaces V =M+N . Then V =M⊕N ⇔M ∩N =0

Proof: Assume first that V = M ⊕ N , we shall suppose that ∃ z 6= 0 with z ∈ M ∩ N , and deduce acontradiction from it. We can express z in two different ways z = z+ 0 with z ∈M and 0 ∈ N or z = 0+ z with0 ∈M and z ∈ N . This contradicts the definition of a direct sum.

Now assume M ∩ N = 0, by hypothesis V = M + N so that any z ∈ V can be expressed by z = x1 + y1

with x1 ∈ M and y1 ∈ N . Suppose that there is another decomposition z = x2 + y2 with x2 ∈ M and y2 ∈ N .Hence x1+y1 = x2+y2 ⇒ x1−x2 = y1−y2; but x1−x2 ∈M and y1−y2 ∈ N . Since they are equal, then bothbelong to the intersection so x1 − x2 = y1 − y2 = 0 then x1 = x2 and y1 = y2 showing that the decompositionmust be unique. QED.

When two vector subspaces of a given space have only the zero vector in common, it is customary to call themdisjoint subspaces. It is understood that it does not correspond to disjointness in the set-theoretical sense, after alltwo subspaces of a given space cannot be disjoint as sets, since any subspace must contain 0. Thus no confusionarises from this practice.

The concept of direct sum can be generalized when more subspaces are involved. We say that V is the directsum of a collection of subspaces M1, ..,Mn and denote it as

V =M1 ⊕M2 ⊕ . . .⊕Mn

when each z ∈ V can be expressed uniquely in the form

z = x1 + x2 + . . .+ xn ; xi ∈Mi

In this case if V =M1+ ..+Mn, this sum becomes a direct sum if and only if each Mi is disjoint from the subspacespanned by the others. To see it, it is enough to realize that

V =M1 +M2 + ..+Mn =M1 + [M2 + ..+Mn] =M1 + [∪ni=2Mi]

Page 17: Mecanica Cuantica: Notas de Clase

1.4. DIMENSION AND BASES IN VECTOR SPACES 17

then V = M1 ⊕ [M2 + ..+Mn] if and only if M1 ∩ [∪ni=2Mi] = 0, proceeding similarly for the other M ′is we

arrive at the condition above. Note that this condition is stronger than the condition that any given Mi is disjointfrom each of the others.

The previous facts can be illustrated by a simple example. The most general non-zero proper subspaces of R3

are lines or planes that passes through the origin. Thus let us define

M1 = (x1, 0, 0) , M2 = (0, x2, 0) , M3 = (0, 0, x3)M4 = (0, x2, x3) , M5 = (x1, 0, x3) , M6 = (x1, x2, 0)

M1,M2,M3 are the coordinate axes of R3 andM4,M5,M6 are its coordinate planes. R

3 can be expressed by directsums of these spaces in several ways

R3 =M1 ⊕M2 ⊕M3 =M1 ⊕M4 =M2 ⊕M5 =M3 ⊕M6

for the case of R3 =M1⊕M2⊕M3 we see that the subspace spanned byM2 andM3 i.e.M2+M3 = [M2 ∪M3] =M4

is disjoint fromM1. SimilarlyM2∩ [M1 ∪M3] = 0 =M3∩ [M1 ∪M2]. It is because of this, that we have a directsum.

Now let us take M3, M6 and M ′ defined as a line on the plane M4 that passes through the origin making anangle θ with the axis x3 such that 0 < θ < π/2, since R3 =M3 +M6 it is clear that

R3 =M3 +M6 +M ′ ; M3 ∩M6 =M3 ∩M ′ =M6 ∩M ′ = 0 (1.2)

however this is not a direct sum because M3 +M6 = R3 so that M ′ ∩ (M3 +M6) 6= 0. Despite each subspaceis disjoint from each other, there is at least one subspace that is not disjoint from the subspace spanned by theothers. Let us show that there are many decompositions for a given vector z ∈ R3 when we use the sum in (1.2).Since R3 =M3+M6 a possible decomposition is z = x+y+0 with x ∈M3, y ∈M6, 0 ∈M ′. Now let us take anarbitrary non-zero element w ofM ′; clearlyM3+M6 = R3 contains M ′ so that w = x′+y′with x′ ∈M3, y

′ ∈M6.Now we write z = x+ y = (x− x′) + (y − y′) + x′ + y′ then z = (x− x′) + (y − y′) +w. We see that (x− x′) isin M3 and (y − y′) is in M6. Now, since w ∈M ′ and w 6= 0 this is clearly a different decomposition with respectto the original one. An infinite number of different decompositions are possible since w is arbitrary.

Finally, it can be proved that for any given subspaceM in V it is always possible to find another subspace N inV such that V =M ⊕N . Nevertheless, for a given M the subspace N is not neccesarily unique. A simple exampleis the following, in R2 any line crossing the origin is a subspace M and we can define N as any line crossing theorigin as long as it is not collinear with M ; for any N accomplishing this condition we have V =M ⊕N .

1.4. Dimension and bases in vector spaces

Definition 1.3 Let V be a vector space and S = x1, ..,xn a finite non-empty subset of V . S is defined aslinearly dependent if there is a set of scalars α1, .., αn not all of them zero such that

α1x1 + α2x2 + ..+ αnxn = 0 (1.3)

if S is not linearly dependent we say that it is linearly independent, this means that in Eq. (1.3) all coefficients αimust be zero. Thus linear independence of S means that the only solution for Eq. (1.3) is the trivial one. Whennon-trivial solutions exists the set is linearly dependent.

¿What is the utility of the concept of linear independence of a given set S? to see it, let us examine a givenvector x in [S], each of these vectors arise from linear combinations of vectors in S

x = α1x1 + α2x2 + ..+ αnxn ; xi ∈ S (1.4)

Page 18: Mecanica Cuantica: Notas de Clase

18 CAPITULO 1. LINEAR OR VECTOR SPACES

we shall see that for the ordered set S = x1, ..,xn the corresponding ordered set α1, .., αn associated with xby Eq. (1.4) is unique. Suppose there is another decomposition of x as a linear combination of elements of S

x = β1x1 + β2x2 + ..+ βnxn ; xi ∈ S (1.5)

substracting (1.4) and (1.5) we have

0 = (α1 − β1)x1 + (α2 − β2)x2 + ..+ (αn − βn)xn

but linear independence require that only the trivial solution exists, thus αi = βi and the ordered set of coefficientsis unique. This is very important for the theory of representations of vector spaces. The discussion above permitsto define linearly independence for an arbitrary (not necessarily finite) non-empty set S

Definition 1.4 An arbitrary non-empty subset S ⊆ V is linearly independent if every finite non-empty subset ofS is linearly independent in the sense previously established.

As before, an arbitrary non-empty set S is linearly independent if and only if any vector x ∈ [S] can be writtenin a unique way as a linear combination of vectors in S.

The most important linearly independent sets are those that span the whole space i.e. [S] = V this linearlyindependent sets are called bases. It can be checked that S is a basis if and only if it is a maximal linearlyindependent set, in the sense that any proper superset of S must be linearly dependent. We shall establishwithout proof a very important theorem concerning bases of vector spaces

Theorem 1.2 If S is a linearly independent set of vectors in a vector space V , there exists a basis B in V suchthat S ⊆ B.

In words, given a linearly independent set, it is always possible to add some elements to S for it to becomea basis. A linearly independent set is non-empty by definition and cannot contain the null vector. Hence, we seethat if V = 0 it does not contain any basis, but if V 6= 0 and we can take a non-zero element x of V , the setx is linearly independent and the previous theorem guarantees that V has a basis that contains x, it meansthat

Theorem 1.3 Every non-zero vector space has a basis

Now, since any set consisting of a single non-zero vector can be enlarged to become a basis it is clear that anynon-zero vector space contains an infinite number of bases. It worths looking for general features shared by allbases of a given linear space. Tne first theorem in such a direction is the following

Theorem 1.4 Let S = x1, x2, .., xn be a finite, odered, non-empty subset of the linear space V . If n = 1 thenS is linearly dependent⇔ x1 = 0. If n > 1 and x1 6= 0 then S is linearly dependent if and only if some one of thevectors x2, ..., xn is a linear combination of the vectors in the ordered set S that precede it.

Proof: The first assertion is trivial. Then we settle n > 1 and x1 6= 0. Assuming that one of the vectors xi inthe set x2, ..., xn is a linear combination of the preceding ones we have

xi = α1x1 + ...+ αi−1xi−1 ⇒ α1x1 + ...+ αi−1xi−1 − 1 · xi = 0

since the coefficient of xi is 1, this is a non-trivial linear combination of elements of S that equals zero. Thus S islinearly dependent. We now assume that S is linearly dependent hence the equation

α1x1 + ...+ αnxn = 0

Page 19: Mecanica Cuantica: Notas de Clase

1.4. DIMENSION AND BASES IN VECTOR SPACES 19

has a solution with at least one non-zero coefficcient. Let us define αi as the last non zero coefficient, since x1 6= 0then i > 1 then we have

α1x1 + ...+ αixi + 0 · xi+1 + ...+ 0 · xn = 0 ⇒ xi =

(−α1

αi

)x1 + ...+

(−αi−1

αi

)xi−1

and xi is written as a linear combination of the vectors that precede it in the ordered set S. QED

The next theorem provides an important structural feature of the set of bases in certain linear spaces

Theorem 1.5 If a given non-zero linear space V has a finite basis B1 = e1, ..., en with n elements, then anyother basis B2 = fi of V must be finite and also with n elements.

The following theorem (that we give without proof) gives a complete structure to this part of the theory ofvector spaces

Theorem 1.6 Let V be a non-zero vector space. If B1 = ei and B2 = uj are two bases of the vector space,then B1 and B2 are sets with the same cardinality.

These theorem is valid even for sets with infinite cardinality. This result says that the cardinality of a basis isa universal attribute of the vector space since it does not depend on the particular basis used. Hence the followingare natural definitions

Definition 1.5 The dimension of a non-zero vector space is the cadinality of any of its basis. If V = 0 thedimension is defined to be zero.

Definition 1.6 A vector space is finite-dimensional if its dimension is a non negative integer. Otherwise, it isinfinite-dimensional.

As any abstract algebraic system, vector spaces requires a theory of representations in which the most abstractset is replaced by another set with more tangible objects. However, for the representation to preserve the abstractproperties of the vector space, set equivalence and linear operations must be preserved. This induces the followingdefinition

Definition 1.7 Let V and V ′ two vector spaces with the same system of scalars. An isomorphism of V onto V ′

is a one-to-one mapping f of V onto V ′ such that f (x+ y) = f (x) + f (y) and f (αx) = αf (x)

Definition 1.8 Two vector spaces with the same system of scalars are called isomorphic if there exists an iso-morphism of one onto the other.

To say that two vector spaces are isomorphic means that they are abstractly identical with respect to theirstructure as vector spaces.

Now let V be a non zero finite dimensional space. If n is its dimension, there exists a basis B = e1, .., enwhose elements are written in a definite order. Each vector x in V can be written uniquely in the form

x = α1e1 + ..+ αnen

so the n−tuple (α1, .., αn) is uniquely determined by x. If we define a mapping f by f (x) = (α1, .., αn) we seethat this is an isomorphism of V onto Rn or Cn depending on the system of scalars defined for V .

Theorem 1.7 Any real (complex) non-zero finite dimensional vector space of dimension n is isomorphic to Rn

(Cn).

Page 20: Mecanica Cuantica: Notas de Clase

20 CAPITULO 1. LINEAR OR VECTOR SPACES

Indeed, this theorem can be extended to vector spaces of arbitrary dimensions, we shall not discuss this topichere. By now, it suffices to realize that the isomorphism establishes here is not unique for it depends on the basischosen and even on the order of vectors in a given basis. It can be shown also that two vector spaces V and V ′

are isomorphic if and only if they have the same scalars and the same dimension.From the results above, we could then be tempted to say that the abstract concept of vector space is no

useful anymore. However, this is not true because on one hand the isomorphism depends on the basis chosen andmost results are desirable to be written in a basis independent way. But even more important, almost all vectorspaces studied in Mathematics and Physics posses some additional structure (topological or algebraic) that arenot neccesarily preserve by the previous isomorphisms.

1.5. Mappings and transformations in vector spaces

For two vector spaces V and V ′ with the same system of scalars we can define a mapping T of V into V ′ thatpreserves linear properties

T (x+ y) = T (x) + T (y) ; T (αx) = αT (x)

T is called a linear transformation. We can say that linear transformations are isomorphisms of V into V ′ sincelinear operations are preserved. T also preserves the origin and negatives

T (0) = T (0 · 0) = 0 · T (0) = 0 ; T (−x) = T ((−1)x) = (−1)T (x) = −T (x)

we shall see later that the states of our physical systems are vectors of a given vector space. Hence, the transfor-mations of these vectors are also important in Physics because they will represent transformations in the statesof our system. We shall see later that the set of all linear transformations are in turn vector spaces with their owninternal organization.

Let us now define some basic operations with linear transformations, a natural definition of the sum of twolinear transformations is of the form

(T + U) (x) ≡ T (x) + U (x) (1.6)

and a natural definition of multiplication by scalars is

(αT ) (x) ≡ αT (x) (1.7)

finally the zero and negative linear transformations are defined as

0 (x) ≡ 0 ; (−T ) (x) ≡ −T (x) (1.8)

with these definitions it is inmediate to establish the following

Theorem 1.8 Let V and V ′ be two vector spaces with the same system of scalars. The set of all linear transfor-mations of V into V ′ with the linear operations defined by Eqs. (1.6, 1.7, 1.8) is itself a vector space.

The most interesting cases are the linear transformations of V into itself and the linear transformations of Vinto the vector space of scalars (real or complex). We shall study now the first case.

1.6. Linear transformations of a vector space into itself

In this case we usually speak of linear transformations on V . The first inmediate consequence is the capabilityof defining the composition of operators (or product of operators)

(TU) (x) ≡ T (U (x)) (1.9)

Page 21: Mecanica Cuantica: Notas de Clase

1.6. LINEAR TRANSFORMATIONS OF A VECTOR SPACE INTO ITSELF 21

associativity and distributivity properties can easily be derived

T (UV ) = (TU)V ; T (U + V ) = TU + TV

(T + U)V = TV + UV ; α (TU) = (αT )U = T (αU)

we prove for instance

[(T + U)V ] (x) = (T + U) (V (x)) = T (V (x)) + U (V (x))

= (TV ) (x) + (UV ) (x) = (TV + UV ) (x)

commutativity does not hold in general. It is also possible for the product of two non-zero linear transformationsto be zero. An example of non commutativity is the following: we define on the space P of polynomials p (x) thelinear operators M and D

M (p) ≡ xp ; D (p) =dp

dx⇒ (MD) (p) =M (D (p)) = xD (p) = x

dp

dx

(DM) (p) = D (M (p)) = D (xp) = xdp

dx+ p

and MD 6= DM. Suppose now the linear transformations on R2 given by

Ta ((x1, x2)) = (x1, 0) ; Tb ((x1, x2)) = (0, x2) ⇒ TaTb = TbTa = 0

thus Ta 6= 0 and Tb 6= 0 but TaTb = TbTa = 0.

Another natural definition is the identity operator I

I (x) ≡ x

we see that I 6= 0 ⇔ V 6= 0. FurtherIT = TI = T

for every linear operator T on V . For any scalar α the operator αI is called scalar multiplication since

(αI) (x) = αI (x) = αx

it is well known that for a mapping of V into V ′ to admit an inverse of V ′ into V requires to be one-to-one andonto. In this context this induces the definition

Definition 1.9 A linear transformation T on V is non-singular if it is one-to-one and onto, and singular other-wise.

When T is non-singular its inverse can be defined so that

TT−1 = T−1T = I

it can be shown that when T is non-singular T−1 is also a non-singular linear transformation.

For future purposes the following theorem is highly relevant

Theorem 1.9 If T is a linear transformation on V , then T is non-singular⇔ T (B) is a basis for V whenever Bis.

Page 22: Mecanica Cuantica: Notas de Clase

22 CAPITULO 1. LINEAR OR VECTOR SPACES

1.6.1. Projection operators

We shall discuss some very important types of linear transformations. Let V be the direct sum of two subspacesV =M ⊕N it means that any vector z in V can be written in a unique way as z = x+y with x ∈M and y ∈ N .Since x is uniquely determined by z this decomposition induces a natural mapping of V onto M in the form

P (z) = x

it is easy to show that this transformation is linear and is called the projection onM along N . The most importantproperty of these transformations is that they are idempotent i.e. P 2 = P we can see it taking into account thatthe unique decomposition of x is x = x+ 0 so that

P 2 (z) = P (P (z)) = P (x) = x = P (z)

The opposite is also true i.e. a given linear idempotent linear transformation induces a decomposition of the spaceV in a direct sum of two subspaces

Theorem 1.10 If P is a linear transformation on a vector space V , P is idempotent⇔there exists subspaces Mand N in V such that V =M ⊕N and P is the projection on M along N .

Proof : We already showed that decomposition in a direct sum induces a projection, to prove the opposite letdefine M and N in the form

M ≡ P (z) : z ∈ V ; N = z : P (z) = 0M and N are vector subspaces and correspond to the range and the null space (or kernel) of the transformationP respectively. We show first that M +N = V , this follows from the identity

z = P (z) + (I − P ) (z) (1.10)

P (z) belongs to M by definition, now

P ((I − P ) (z)) = (P (I − P )) (z) =(P − P 2

)(z) = (P − P ) (z) = 0 (z) = 0

thus (I − P ) (z) belongs to the null space N so M +N = V . To prove that this is a direct sum we must show thatM and N are disjoint (theorem 1.1). For this, assume that we have a given element P (z) in M that is also in Nthen

P (P (z)) = 0 ⇒ P 2 (z) = P (z) = 0

thus the common element P (z) must be the zero element. Hence, M and N are disjoint and V =M ⊕N . Further,from (1.10) P is the projection on M along N .

Of course in z = x+ y with x ∈ M , y ∈ N we can define a projection P ′ (z) = y on N along M . In this caseV =M ⊕N = N ⊕M but now M is the null space and N is the range. It is easy to see that P ′ = I − P .

On the other hand, we have seen that for a given subspace M in V we can always find another subspace Nsuch that V = M ⊕N so for a given M we can find a projector with range M and null space N . However, N isnot unique so that different projections can be defined on M .

Finally, it is easy to see that the range of a projector P corresponds to the set of points fixed under P i.e.M = P (z) : z ∈ V = z : P (z) = z.

1.7. Normed vector spaces

Inspired in the vectors of Rn in which we define their lengths in a natural way, we can define lengths of vectorsin abstract vector spaces by assuming an additional structure

Page 23: Mecanica Cuantica: Notas de Clase

1.7. NORMED VECTOR SPACES 23

Definition 1.10 A normed vector space N is a vector space in which to each vector x there corresponds a realnumber denoted by ‖x‖ with the following properties: (1) ‖x‖ ≥ 0 and ‖x‖ = 0 ⇔ x = 0.(2) ‖x+ y‖ ≤ ‖x‖+ ‖y‖(3) ‖αx‖ = |α| ‖x‖

As well as allowing to define a length for vectors, the norm permits to define a distance between two vectorsx and y in the following way

d (x,y) ≡ ‖x− y‖it is easy to verify that this definition accomplishes the properties of a metric

d (x,y) ≥ 0 and d (x,y) = 0 ⇔ x = y

d (x,y) = d (y,x) ; d (x, z) ≤ d (x,y) + d (y, z)

in turn, the introduction of a metric permits to define two crucial concepts: (a) convergence of sequences, (b)continuity of functions of N into itself (or into any metric space).

We shall examine both concepts briefly

1.7.1. Convergent sequences, cauchy sequences and completeness

If X is a metric space with metric d a given sequence in X

xn = x1, .., xn, ...

is convergent if there exists a point x in X such that for each ε > 0, there exists a positive integer n0 such thatd (xn, x) < ε for all n ≥ n0. x is called the limit of the sequence. A very important fact in metric spaces is thatany convergent sequence has a unique limit.

Further, assume that x is the limit of a convergent sequence, it is clear that for each ε > 0 there exists n0 suchthat m,n ≥ n0 ⇒ d (x, xm) < ε/2 and d (x, xn) < ε/2 using the properties of the metric we have

m,n ≥ n0 ⇒ d (xm, xn) ≤ d (xm, x) + d (x, xn) <ε

2+ε

2= ε

a sequence with this property is called a cauchy sequence. Thus, any convergent sequence is a cauchy sequence.The opposite is not necessarily true. As an example let X be the interval (0, 1] the sequence xn = 1/n is a cauchysequence but is not convergent since the point 0 (which it wants to converge to) is not in X. Then, convergencedepends not only on the sequence itself, but also on the space in which it lies. Some authors call cauchy sequences“intrinsically convergent” sequences.

A complete metric space is a metric space in which any cauchy sequence is convergent. The space (0, 1] is notcomplete but it can be made complete by adding the point 0 to form [0, 1]. In fact, any non complete metric spacecan be completed by adjoining some appropiate points. It is a fundamental fact that the real line, the complexplane and Rn, Cn are complete metric spaces.

We define an open sphere of radius r centered at x0 as the set of points such that

Sr (x0) = x ∈ X : d (x, x0) < r

and an open set is a subset A of the metric space such that for any x ∈ A there exists an open sphere Sr (x) suchthat Sr (x) ⊆ A.

For a given subset A of X a point x in X is a limit point of A if each open sphere centered on x contains atleast one point of A different from x.

A subset A is a closed set if it contains all its limit points. There is an important theorem concerning closedmetric subspaces of a complete metric space

Theorem 1.11 Let X be a complete metric space and Y a metric subspace of X. Then Y is complete⇔it isclosed.

Page 24: Mecanica Cuantica: Notas de Clase

24 CAPITULO 1. LINEAR OR VECTOR SPACES

1.7.2. The importance of completeness in quantum mechanics

In quantum mechanics we work in an infinite dimensional vector space of functions in which we shall frequentlyencounter series of the form ∞∑

n=1

cnψn

with ψn being functions in our space that describe physical states and cn are some appropiate coefficients. For thisseries to have any physical sense, it must be convergent. To analyze convergence we should construct the sequenceof partial sums

1∑

n=1

cnψn,

2∑

n=1

cnψn,

3∑

n=1

cnψn, ...

if this series is “intrisically” convergent the corresponding sequence of partial sums should be a cauchy sequence.Any series that defines a cauchy sequence has a bounded norm

∥∥∥∥∥∞∑

n=1

cnψn

∥∥∥∥∥ <∞

it would then be desirable that an intrinsically convergent series given by a superposition of physical states ψnbe another physical state ψ. In other words, the limit of the partial sums should be within the vector space thatdescribe our physical states. To ensure this property we should demand completeness of the vector space thatdescribe the physical states of the system.

On the other hand, it would be usual to work with subspaces of the general physical space. If we want toguarantee for a series in a given subspace to be also convergent, we should require for the subspace to be completeby itself, and according to theorem 1.11 it is equivalent to require the subspace to be closed with respect to thetotal space. Therefore, closed subspaces of the general space of states would be particularly important in quantummechanics.

1.7.3. The concept of continuity and its importance in Physics

The concept of continuity arises naturally for mappings of a metric space into another metric space. Let f bea mapping of (X, d1) into (Y, d2) we say that f is continuous at x0 ∈ X if for each ε > 0 there exists δ > 0 suchthat d1 (x, x0) < δ ⇒ d2 (f (x) , f (x0)) < ε. This mapping is said to be continuous if it is continuous for each pointin its domain.

Continuity is also an essential property in Physics since for most of physical observables or states we requiresome kind of “smoothness” or “well behavior”. Continuity is perhaps the weakest condition of well behavior usuallyrequired in Physics.

We have previously defined isomorphisms as mappings that preserve all structure concerning a general vectorspace. It is then natural to characterize mappings that preserve the structure of a set as a metric space

Definition 1.11 If X,Y are two metric spaces with metrics d1 and d2 a mapping f of X into Y is an isometryif d1 (x,x

′) = d2 (f (x) , f (x′)) ∀x,x′ ∈ X. If there exists an isometry of X onto Y , we say that X is isometric to

Y .

It is clear that an isometry is necessarily one-to-one. If X is isometric to Y then the points of these spacescan be put in a one to one correspondence in such a way that the distance between pairs of corresponding pointsare the same. In that sense, isometric spaces are abstractly identical as metric spaces. For instance, if we endowa vector space V with a metric then another metric vector space V ′ will be identical to V as metric and vectorspace if and only if there is an isometric isomorphism between them. Isometry preserves metric (distances) whileisomorphism preserve vector structure (linear operations). Of course a norm-preserving mapping is an isometryfor the metric induced by such a norm. Thus for our purposes norm preserving mappings will be isometries.

Page 25: Mecanica Cuantica: Notas de Clase

1.8. BANACH SPACES 25

1.8. Banach Spaces

From our experience in classical mechanics we have seen that the concept of a vector space is useful especiallywhen we associate a length to the vectors, this induces the concept of normed vector spaces, the norm in turninduces a metric i.e. a natural concept of the distance between vectors. Metric structure in turn lead us to theconcepts of convergent sequences and continuity of functions. In particular, the previous discussion concerningcompleteness incline us in favor of spaces that are complete. Then we are directly led to normed and completelinear spaces

Definition 1.12 A banach space is a normed and complete vector space

As in any vector space, linear transformations are crucial in the characterization of Banach spaces. Since anotion of continuity is present in these spaces and continuity is associated with well behavior in Physics, it isnatural to concentrate our attention in continuous linear transformations of a banach space B into itself or intothe set of scalars. Transformations of B into itself will be useful when we want to study posible modifications ofthe vectors (for instance the time evolution of the vectors describing the state of the system). On the other hand,transformations of B into the scalars will be useful when we are interested in connecting the state of a system(represented by a vector) with a measurement (which is a number).

Before considering each specific type of continuous linear transformation, we should clarify what the meaningof continuity of a linear transformation is. Since continuity depends on the metric induced on the space, we shoulddefine for a given space of linear transformations on a Banach space B, a given metric. We shall do it by firstdefining a norm, specifically we shall define the following norm

‖T‖ = sup |T (x)| : ‖x‖ ≤ 1 (1.11)

We shall refer to the metric induce by this norm when we talk about the continuity of any linear transformationof a Banach space into itself or into the scalars. It can be shown that for this norm continuity is equivalent toboundedness.

1.8.1. Continuous linear transformations of a Banach space into scalars

Let us consider first the continuous linear transformations of B into the scalars. This induces the following

Definition 1.13 A real (or complex) functional is a continuous linear transformation of a real (or complex)normed linear space into R (or C).

Definition 1.14 The set of all functionals on a normed linear space N is called the conjugate space of N and isdenoted by N∗.

For the case of general normed spaces (and even for Banach spaces), the structure of their conjugate spacesis in general very intrincate. However we shall see that conjugate spaces are much simpler when an additionalstructure (inner product) is added to Banach spaces.

1.8.2. Continuous linear transformations of a Banach space into itself

Let us discuss now the continuous linear transformations of Banach spaces into themselves.

Definition 1.15 An operator is a continuous linear transformation of a normed space into itself.

A particularly useful result in quantum mechanics is the following

Theorem 1.12 If a one-to-one linear transformation T of a Banach space onto itself is continuous, then itsinverse is automatically continuous

Page 26: Mecanica Cuantica: Notas de Clase

26 CAPITULO 1. LINEAR OR VECTOR SPACES

Though we do not provide a proof, it is important to note that this result requires the explicit use of com-pleteness (it is not valid for a general normed space). We see then that completeness gives us another desirableproperty in Physics: if a given transformation is continuous and its inverse exist, this inverse transformation isalso continuous.

Let us now turn to projectors on Banach spaces. For general vector spaces projectors are defined as idempotentlinear transformations. For Banach spaces we will required an additional structure which is continuity

Definition 1.16 A projector in a Banach space B, is defined as an idempotent operator on B

The consequences of the additional structure of continuity for projectors in Banach spaces are of particularinterest in quantum mechanics

Theorem 1.13 If P is a projection on a Banach space B, and if M and N are its range and null space. ThenM and N are closed subspaces of B such that B =M ⊕N

The reciprocal is also true

Theorem 1.14 Let B be a banach space and let M and N be closed subspaces of B such that B = M ⊕ N . Ifz = x+ y is the unique representation of a vector z in B with x in M and y in N . Then the mapping P definedby P (z) = x is a projection on B whose range and null space are M and N respectively.

These properties are interesting in the sense that the subspaces generated by projectors are closed subspacesof a complete space, and then they are complete by themselves. We have already said that dealing with completesubspaces is particularly important in quantum mechanics.

There is an important limitation with Banach spaces. If a closed subspace M is given, though we can alwaysfind many subspaces N such that B =M ⊕N there is not guarantee that any of them be closed. So there is notguarantee that M alone generates a projection in our present sense. The solution of this inconvenience is anothermotivation to endow B with an additional structure (inner product).

Finally, the definition of the conjugate N∗ of a normed linear space N , induces to associate to each operatorin the normed linear space N and operator on N∗ in the following way. Let us form a complex number c0 withthree objects, an operator T on N , a functional f on N and an element x ∈ N , we take this procedure: we mapx in T (x) and then map this new element of N into the scalar c0 through the functional f

x → T (x) → f (T (x)) = c0

Now we get the same number with other set of three objects an operator T ∗ on N∗, a functional f on N (thesame functional of the previous procedure) and an element x ∈ N (the same element stated before), the steps arenow the following, we start with the functional f in N∗ and map it into another functional through T ∗, then weapply this new functional to the element x and produce the number c0. Schematically it is

f → T ∗ (f) → [T ∗ (f)] (x) = c0

with this we are defining an apropiate mapping f ′ such that f ′ (x) gives our number. In turn it induces an operatoron N∗ that maps f in f ′ and this is the newly defined operator T ∗ on N∗. In summary this definition reads

[T ∗ (f)] (x) ≡ f (T (x)) (1.12)

where f is a functional on N i.e. an element in N∗, T an operator on N and x an element of N . If for a givenT we have that Eq. (1.12) holds for f and x arbitrary, we have induced a new operator T ∗ on N∗ from T . It canbe shown that T ∗ is also linear and continuous i.e. an operator. When inner product is added to the structure,this operator becomes much simpler.

Page 27: Mecanica Cuantica: Notas de Clase

1.9. HILBERT SPACES 27

By using the norm (1.11) applied to operators on B∗ we have

‖T ∗‖ = sup ‖T ∗ (f)‖ : ‖f‖ ≤ 1

it can be proved that‖T ∗‖ = ‖T‖ (1.13)

such that the mapping T → T ∗ is norm preserving and therefore an isometry, we can also see that

(αT1 + βT2)∗ = αT ∗

1 + βT ∗2 ; I∗ = I ; (T1T2)

∗ = T ∗2 T

∗1 (1.14)

since linear operations are preserved the mapping T → T ∗ is an isometric isomorphism. However, the productis reversed under the mappping, this shows that the spaces ß(T ) and ß(T ∗) are equivalent as metric and vectorspaces but they are not equivalent as algebras (the spaces are not isomorphic as algebras).

1.9. Hilbert spaces

In R3 it is customary to define a set of three ortonormal vectors ui such that any vector in R3 can be writtenas x = αiui sum over repeated indices. The dot product is defined such that

x · y ≡ ‖x‖ ‖y‖ cos θ (1.15)

the dot product is a good mathematical tool for many purposes in solid analytic geometry. If we accept thestatement that the zero vector is orthogonal to every vector we can say that the dot product is null if and only ifboth vectors are orthogonal. Let vi be a given basis (not necessarily orthonormal) of R3; any two vectors in R3

are expressed in the formx = αivi ; y = βjvj (1.16)

the dot product and the norm of these two vectors can be written

x · y = (αivi) · (βjvj) = αiβjvi · vj ≡ αiβjmij

x · x = ‖x‖2 = (αivi) · (αjvj) = αiαjvi · vj ≡ αiαjmij

These expressions can be in general complicated. Notice that these and other algebraic operations with dotproducts become much easier when an orthonormal basis is used since in this case we have mij = δij so thatx · y = αiβi and x · x = αiαi. These facts put orthonormal basis in a privileged position among other bases.

Further, an attempt of extension of these ideas to C3 permits to define the inner product in this space in thefollowing way, given the vectors (1.16) where α and β are complex we define

(x,y) = (α∗ivi) · (βjvj) = α∗

i βjmij

the conjugate on α appears to obtain the norm of a complex vectors with the inner product of such a vector withitself, as can be seen by using an orthonormal basis in which mij = δij

(x,x) = ‖x‖2 = α∗iαi = |αi| |αi|

the simplification above comes from the extension of the concept of orthogonality to complex vectors, they areorthogonal if and only if (x,y) = 0.

In both the real and complex cases, the concept of orthogonality was very important not only because of thegeometry but also because of the algebra. We observe for instance, that no angle like the one in (1.15) can bedefined in the complex case, but the algebra of inner products continues being simple and useful. On the sameground, we were able to talk about orthogonality in the complex case via the inner product and exploit theadvantages of orthonormal sets, although two vectors of the complex plane are not “perpendicular”.

Page 28: Mecanica Cuantica: Notas de Clase

28 CAPITULO 1. LINEAR OR VECTOR SPACES

In the same way, in abstract vector spaces is not so clear how to use the concept of orthogonality in ageometrical way, but from the discussion above it is clear that the extension of the concept would represent greatsimplifications from the algebraic sense. Notwithstanding, we shall see that the extension of the concept of innerproduct will also provide some geometrical interpretations.

As always in mathematics, a natural extension should come from the extrapolation of the essential propertiesof the concept in the restricted way, the inner product in the complex and real spaces has the following properties

(x, αy + βz) = α (x,y) + β (x, z) ; (x,y) = (y,x)∗ ; (x,x) = ‖x‖2

we are led to the following

Definition 1.17 A Hilbert space is a real or complex Banach space whose norm arises from an inner product,which in turn is defined as a complex function (x,y) of the vectors x and y with the following properties

(x, αy + βz) = α (x,y) + β (x, z)

(x,y) = (y,x)∗

(x,x) = ‖x‖2

Definition 1.18 Two vectors x,y in a Hilbert space are said to be orthogonal if (x,y) = 0, we denote it as x ⊥ y.A vector is said to be normal or unitary if (x,x) = 1.

From the definition the following properties hold

|(x,y)| ≤ ‖x‖ ‖y‖ (1.17)

‖x+ y‖2 + ‖x− y‖2 = 2 ‖x‖2 + 2 ‖y‖2 (1.18)

4 (x,y) = ‖x+ y‖2 − ‖x− y‖2 + i ‖x+ iy‖2 − i ‖x− iy‖2 (1.19)

x ⊥ y ⇒‖x+ y‖2 = ‖x− y‖2 = ‖x‖2 + ‖y‖2 (1.20)

Eq. (1.17) is known as the Schwarz inequality. Eq. (1.18) is known as the paralelogram law because in planegeometry it reduces to the theorem which says that the sum of the squares of the sides of a paralelogram equalsthe sum of the squares of its diagonals. As well as its geometrical interpretation, this law says that only certainBanach spaces can be converted into Hilbert spaces, only those normed complete spaces in which the norm obeysthe paralelogram law can become a Hilbert space. Further, if for a given norm, the paralelogram law is satisfied,then Eq. (1.19), gives us the recipe to define an inner product from such a norm. Finally, for reasons easy tovisualize Eq. (1.20) is called the pithagorean theorem.

As a matter of illustration let us prove the paralelogram law Eq. (1.18)

‖x+ y‖2 + ‖x− y‖2 = (x+ y,x+ y) + (x− y,x− y) = (x,x+ y) + (y,x + y) + (x,x− y)− (y,x − y)

= (x,x) + (x,y) + (y,x) + (y,y) + (x,x)− (x,y) − (y,x) + (y,y)

= (x,x) + (y,y) + (x,x) + (y,y) = 2 ‖x‖2 + 2 ‖y‖2

A vector x is said to be orthogonal to a non empty set S, if x ⊥ y for all y ∈ S. The orthogonal complementof S is the set of all vectors orthogonal to S, it is denoted as S⊥. Two non empty sets M and N are orthogonalif x ⊥ y for all x ∈ M and for all y ∈ N ; this is denoted as M ⊥ N . If M is a closed vector subspace of H thenM⊥ is also closed. The following theorems are important for physical purposes

Theorem 1.15 If M and N are closed vector subspaces of a Hilbert space H such that M ⊥ N , then the linearsubspace M +N is also closed

Theorem 1.16 If M is a closed linear subspace of a Hilbert space H, then H =M ⊕M⊥

Page 29: Mecanica Cuantica: Notas de Clase

1.9. HILBERT SPACES 29

Thus we see that the expansion of the union of closed subspaces preserves the closure property and so thecompleteness property too. In addition, theorem 1.16 says that given a closed subspace of H we can always finda closed subspace to generate H by direct sum. Besides, the closed space that makes the work is the orthogonalcomplement. It means that for any given closed subspace M we can define a projection with range M and nullspace M⊥. Contrast this with the problem arising in Banach spaces in which we cannot guarantee the closure ofthe complementary space.

1.9.1. Orthonormal sets

An orthonormal set ei in H is a non empty subset of H such that if i 6= j then ei ⊥ ej and ‖ei‖ = 1 forall i. this set could be of any cardinality (non necessarily countable). The zero Hilbert space has no orthonormalsets. The following theorems are of great practical interest

Theorem 1.17 Let e1, .., en be a finite orthonormal set in H. If x is a vector in H we have

n∑

i=1

|(ei,x)|2 ≤ ‖x‖2 (1.21)

x−n∑

i=1

(ei,x) ei ⊥ ej ; j = 1, .., n (1.22)

We can give the following interpretation of this theorem: Eq. (1.21) says that the sum of the components of avector in the various orthogonal directions defined by the ortonormal set, cannot exceed the length of the vector.Similarly, Eq. (1.22) says that if we substract from a vector its components in several perpendicular directions theresultant has no components left in those directions.

The following theorem shows that the coefficients obtained for a given vector from an orthonormal set are notarbitrary

Theorem 1.18 If ei is an orthonormal set in a Hilbert space H, and if x is any vector in H, the set S =ei : |(ei,x)|2 6= 0

is either empty or countable.

These results permit to extend theorem 1.17 for arbitrary orthonormal sets

Theorem 1.19 Let ei be an arbitrary orthonormal set in H. If x is a vector in H we have

∑|(ei,x)|2 ≤ ‖x‖2 (1.23)

x−∑

(ei,x) ei ⊥ ej ; j = 1, .., n (1.24)

where the symbol of sum means the following, defining the set S =ei : |(ei,x)|2 6= 0

, we define the sum to be

zero (number or vector) when S is empty. If S is finite, the definitions in (1.24, 1.23) coincide with the ones in(1.21, 1.22), if S is countably infinite, the sums become series

∑∞n=1 for a given order of the set S = e1, .., ei, ..,

in this case the limit of the series is independent of the order chosen for S.

Definition 1.19 An orthonormal set in H is said to be complete if it is maximal, that is, if it is impossible toadd an element e to the set while preserving the orthonormality in the new set.

Theorem 1.20 Every orthonormal set in a Hilbert space is contained in a complete orthonormal set

Theorem 1.21 Every non-zero Hilbert space contains a complete orthonormal set

Page 30: Mecanica Cuantica: Notas de Clase

30 CAPITULO 1. LINEAR OR VECTOR SPACES

Theorem 1.22 Every orthonormal set is linearly independent

Theorem 1.23 Let H be a Hilbert space and ei an orthonormal set in H. The following conditions are equi-valent to one another

ei is complete (1.25)

x ⊥ ei ⇒ x = 0 (1.26)

∀ x ∈ H ⇒ x =∑

(ei,x) ei (1.27)

∀ x ∈ H ⇒ ‖x‖2 =∑

|(ei,x)|2 (1.28)

This is perhaps the most important theorem in terms of applications in Physics, and in particular quantummechanics. It is convenient to discuss some terminology related with it. The numbers (x, ei) are called the Fouriercoeeficients of x and Eq. (1.27) is its Fourier expansion. Eq. (1.28) is called Parseval’s equation. All these equationsrefer to a given complete orthonormal set.

This sequence of theorems are similar to the ones explained in the general theory of vector spaces in whichcomplete orthonormal sets replaced the concept of bases, and fourier expansions replaced linear combinations.

It is clear that for finite dimensional spaces Fourier expansions become linear combinations. On the otherhand, since orthonormal sets are linearly independent (Theorem 1.22), it is easy to see that in the case of finitedimensional spaces complete orthonormal sets are linearly independent sets that generate any vector by linearcombinations. Hence, complete orthonormal sets are bases.

For infinite dimensional spaces there is a different story. If we remember that linear combinations are finite bydefinition, we see that in this case Fourier expansions are not linear combinations. For a given linearly independentset to be a basis, it is necessary for any vector of the space to be written as a linear combination of such a set,basis certainly exists for Hilbert spaces according to theorem 1.3 but complete orthonormal sets are NOT basesin the sense defined for the general theory of vector spaces.

Moreover theorem 1.18 shows that the Fourier expansion given in Eq. (1.27) is always countable, this is aremarkable result because it means that the fourier expansion for a given complete orthonormal set is always aseries, even if the cardinality of the complete orthonormal set is higher than the aleph (cardinality of the integers).

The informal discussion above can be formally proved to produce the following statement

Theorem 1.24 A Hilbert space is finite dimensional if and only if every complete orthonormal set is a basis.

However, owing to the analogy between bases and complete orthonormal sets the following theorem is quiteexpected

Theorem 1.25 Any two complete orthonormal sets of a given Hilbert space have the same cardinality.

And this fact induces a natural definition

Definition 1.20 The orthogonal dimension of a Hilbert space H is the cardinality of any complete orthonormalset in H.

It is important to keep in mind the difference between the dimension and the orthogonal dimension of a Hilbertspace of infinite dimension.

Page 31: Mecanica Cuantica: Notas de Clase

1.9. HILBERT SPACES 31

1.9.2. The conjugate space H∗

We have defined the conjugate space of a Banach space B as the set of all functionals in B i.e. of all linearcontinuous mappings of B into the scalars. We said however that the structure of the conjugate spaces of anarbitrary Banach space is very complex. Fortunately, this is not the case for Hilbert spaces in which the innerproduct provides a natural association between H and H∗.

Let y be a fixed vector in H and consider the function fy defined by

fy (x) ≡ (y,x) (1.29)

it is easy to prove linearity

fy (αx1 + βx2) = (y, αx1 + βx2) = α (y,x1) + β (y,x2)

fy (αx1 + βx2) = αfy (x1) + βfy (x2)

continuity comes from the Schwarz inequality

|fy (x)| = |(x,y)| ≤ ‖x‖ ‖y‖ ⇒ |fy (x)| ≤ ‖y‖

then fy is bounded and so continuous. Indeed it can be shown that |fy (x)| = ‖y‖. We then have found analgorithm to generate some functionals from the mapping

y → fy (1.30)

described above, this is a norm preserving mapping of H into H∗. However, it can be shown that indeed this is amapping of H onto H∗ as stated in this

Theorem 1.26 Let H be a Hilbert space, and f an arbitrary functional in H∗. Then there exists a unique vectory ∈ H such that

f (x) = (y,x) ∀x ∈ H

since the mapping (1.30) is norm preserving, we wonder whether it is linear, this is not the case because

fy1+y2 (x) = (y1 + y2,x) = (y1,x) + (y2,x) = fy1 (x) + fy2 (x)

fαy (x) = (αy,x) = α∗ (y,x) = α∗fy (x)

such that

fy1+y2 = fy1 + fy2 ; fαy = α∗fy (1.31)

however the mapping (1.30) is an isometry (it preserves metric) since

‖fx − fy‖ = ‖fx−y‖ = ‖x− y‖

we can characterize H∗ in the following way

Theorem 1.27 H∗ is a Hilbert space with respect to the inner product defined by (fx, fy) = (y,x).

Page 32: Mecanica Cuantica: Notas de Clase

32 CAPITULO 1. LINEAR OR VECTOR SPACES

1.9.3. The conjugate and the adjoint of an operator

A really crucial aspect of the theory of Hilbert spaces in Physics is the theory of operators (continuous lineartransformations of H into itself), we shall see later that observables in quantum mechanics appear as eigenvaluesof some of these operators.

We have defined the conjugate of an operator for Banach spaces but they are still too general to get a richstructural theory of operators. The natural correspondence between H and H∗ will provide a natural relationbetween a given operator on H and its corresponding conjugate operator on H∗.

Let T be an operator on a Banach space B. We defined an operator on B∗ denoted T ∗ and called the conjugateof T by Eq. (1.12)

[T ∗ (f)] (x) = f (T (x)) (1.32)

and Eqs. (1.13, 1.14) says that T → T ∗ is an isometric isomorphism (as vector spaces) between the spaces of linearoperators on H and H∗. We shall see that the natural correspondence between H and H∗ permits to induce inturn an operator T † in H from the operator T ∗ in H∗. The procedure is the following: starting from a vector y inH we map it into its corresponding functional fy, then we map fy by the operator T ∗ to get another functionalfz then we map this functional into its (unique) corresponding vector z in H the scheme reads

y → fy → T ∗fy = fz → z (1.33)

the whole process is a mapping of y to z i.e. of H into itself. We shall write it as a single mapping of H into itselfin the form

y → z ≡ T †y

the operator T † induced in this way from T ∗ is called the adjoint operator. Its action can be understood in thecontext of H only as we shall see. For every vector x ∈ H we use the definition of T ∗ Eq. (1.32) to write

[T ∗ (fy)] (x) = fy (T (x)) = (y, Tx)

[T ∗fy] (x) = fz (x) = (z,x) =(T †y,x

)

where we have used Eqs. (1.29, 1.33), so that

(y, Tx) =(T †y,x

)∀x,y ∈ H (1.34)

we can see that Eq. (1.34) defines T † uniquely and we can take it as an alternative definition of the adjoint operatorassociated with T . It can also be verified that T † is indeed an operator, i.e. that it is continuous and linear. Wecan also prove the following

Theorem 1.28 The adjoint operation T → T † is a one-to-one onto mapping with these properties

(T1 + T2)† = T †

1 + T †2 , (αT )† = α∗T † ,

(T †)†

= T

(T1T2)† = T †

2T†1 ;

∥∥∥T †∥∥∥ = ‖T‖ ;

∥∥∥T †T∥∥∥ =

∥∥∥TT †∥∥∥ = ‖T‖2

0∗ = 0 , I∗ = I (1.35)

If T is non-singular then T † is also non-singular and

(T †)−1

=(T−1

)†

Page 33: Mecanica Cuantica: Notas de Clase

1.10. NORMAL OPERATORS 33

Notice for instance that(T †)† = T implies that

(Ty,x) =(y, T †x

)∀x,y ∈ H (1.36)

We define the commutator of a couple of operators T1, T2 as

[T1, T2] ≡ T1T2 − T2T1

this operation has the following properties

[T1, T2] = − [T2, T1] (1.37)

[αT1 + βT2, T3] = α [T1, T3] + β [T2, T3] (1.38)

[T1, αT2 + βT3] = α [T1, T2] + β [T1, T3] (1.39)

[T1T2, T3] = T1 [T2, T3] + [T1, T3]T2 (1.40)

[T1, T2T3] = T2 [T1, T3] + [T1, T2]T3 (1.41)

[[T1, T2] , T3] + [[T3, T1] , T2] + [[T2, T3] , T1] = 0 (1.42)

such properties can be proved directly from the definition, Eq. (1.37) shows antisymmetry and Eqs. (1.38, 1.39)proves linearity. Finally, relation (1.42) is called the Jacobi identity.

It can be seen that the space of operators on a Hilbert space H (called ß(H)) is a Banach space and moregenerally a Banach Algebra. This organization permits an elegant theory of the operators on Hilbert spaces.

The theory of quantum mechanics works on a Hilbert space. In addition, the most important operators onthe Hilbert space in quantum mechanics are self-adjoint and unitary operators, which are precisely operators thathave a specific relation with their adjoints.

1.10. Normal operators

Definition 1.21 An operator on a Hilbert space H that commutes with its adjoint[N,N †] = 0 is called a normal

operator

There are two reasons to study normal operators (a) From the mathematical point of view they are the mostgeneral type of operators for which a simple structure theory is possible. (b) they contain as special cases the mostimportant operators in Physics: self-adjoint and unitary operators.

It is clear that if N is normal then αN is. Further, the limit N of any convergent sequence of normal operatorsNk is also normal

∥∥∥NN † −N †N∥∥∥ ≤

∥∥∥NN † −NkN†k

∥∥∥+∥∥∥NkN

†k −N †

kNk

∥∥∥+∥∥∥N †

kNk −N †N∥∥∥

=∥∥∥NN † −NkN

†k

∥∥∥+∥∥∥N †

kNk −N †N∥∥∥→ 0

then NN † −N †N = 0 and N is normal then we have proved

Theorem 1.29 The set of all normal operators on H is a closed subset of ß(H) that is closed under scalarmultiplication

It is natural to wonder whether the sum and product of normal operators is normal. They are not, but we canestablish some conditions for these closure relations to occur

Theorem 1.30 If N1 and N2 are normal operators on H with the property that either commutes with the adjointof the other, then N1 +N2 and N1N2 are normal.

Page 34: Mecanica Cuantica: Notas de Clase

34 CAPITULO 1. LINEAR OR VECTOR SPACES

The following are useful properties for the sake of calculations in quantum mechanics

Theorem 1.31 An operator N on H is normal ⇔ ‖Nx‖ =∥∥N †x

∥∥ ∀x ∈ H

Theorem 1.32 If N is a normal operator on H then∥∥N2

∥∥ = ‖N‖2

1.11. Self-Adjoint operators

We have said that the space of operators on a Hilbert space H (called ß(H)), is a special type of algebra (aBanach Algebra) which has an algebraic structure similar to the one of the complex numbers, except for the factthat the former is non-commutative. In particular, both are complex algebras with a natural mapping of the spaceinto itself of the form T → T † and z → z∗ respectively. The most important subsystem of the complex plane is thereal line defined by the relation z = z∗, the corresponding subsystem in ß(H) is therefore defined as T = T †, anoperator that accomplishes that condition is called a self-adjoint operator. This is the simplest relation that canbe established between an operator and its adjoint. It is clear that self-adjoint operators are normal. Further, wealready know that 0† = 0 and I† = I thus they are self-adjoint. A real linear combination of self-adjoint operatorsis also self-adjoint

(αT1 + βT2)† = α∗T †

1 + β∗T †2 = αT †

1 + βT †2

further, if Tn is a sequence of self adjoint operators that converges to a given operator T , then T is alsoself-adjoint

∥∥∥T − T †∥∥∥ ≤ ‖T − Tn‖+

∥∥∥Tn − T †n

∥∥∥+∥∥∥T †

n − T †∥∥∥ = ‖T − Tn‖+ ‖Tn − Tn‖+

∥∥∥T †n − T †

∥∥∥

= ‖T − Tn‖+∥∥∥(Tn − T )†

∥∥∥ = ‖T − Tn‖+ ‖(Tn − T )‖ = 2 ‖T − Tn‖ → 0

shows that T − T † = 0 so that T = T † this shows the following

Theorem 1.33 The self-adjoint operators in ß(H) are a closed real linear subspace of ß(H) and therefore a realBanach space which contains the identity transformation

Unfortunately, the product of self-adjoint operators is not necessarily self-adjoint hence they do not form analgebra. The only statement in that sense is the following

Theorem 1.34 If T1, T2 are self-adjoint operators on H, their product is self-adjoint if and only if [T1, T2] = 0

It can be easily proved that T = 0 ⇔ (x, Ty) = 0 ∀x,y ∈ H. It can be seen also that

Theorem 1.35 If T is an operator on a complex Hilbert space H then T = 0 ⇔ (x, Tx) = 0 ∀x ∈ H.

It should be emphasized that the proof makes explicit use of the fact that the scalars are complex numbersand not merely the real system.

The following theorem shows that the analogy between self-adjoint operators and real numbers goes beyondthe simple analogy from which the former arise

Theorem 1.36 An operator T on H is self-adjoint⇔ (x, Tx) is real ∀x ∈ H.

An special type of self-adjoint operators are the following ones

Theorem 1.37 A positive operator on H is a self-adjoint operator such that (x, Tx) ≥ 0, ∀x ∈ H. Further, if(x, Tx) ≥ 0, and (x, Tx) = 0 ⇔ x = 0 we say that the operator is positive-definite.

Page 35: Mecanica Cuantica: Notas de Clase

1.12. UNITARY OPERATORS 35

It is clear that the following operators are positive: 0, I, TT †, T †T note also that all the analoguous elementsin the complex plane are non-negative numbers 0, 1, zz∗ = z∗z = |z|2.

Theorem 1.38 If A is a positive operator then I +A is non-singular

Continuing the analogy between ß(H) and the algebra of complex numbers, we can see that a complex numbercan be written as its real and imaginary parts in the form

z = a1 + ia2 ; a1 ≡z + z∗

2, a2 ≡

z − z∗

2i

in a similar way we can decompose an arbitrary operator T on H in the form

T = A1 + iA2 ; A1 ≡T + T †

2; A2 ≡

T − T †

2i(1.43)

it is clear that A1 and A2 are self-adjoint so they can be called the “real” and “imaginary” components of theT operator. If T is self-adjoint its imaginary part is zero as expected. We can see that it is precisely because ofthe non commutativity of the self-adjoint operators that non-normal operators exist

Theorem 1.39 If T is an operator on H it is normal ⇔ its real and imaginary parts commute

1.12. Unitary operators

Perhaps the most important subsystem of the complex plane after the real line is the unit circle characterizedby the equation zz∗ = z∗z = |z|2 = 1. This leads to a natural definition of an special subset of the normal operators

Definition 1.22 An operator U on H which satisfies the equation UU † = U †U = I is said to be unitary

Unitary operators are thus the analogues of complex numbers of unitary absolute value. In words, unitaryoperators are those non-singular operators whose inverses equal their adjoints, they are thus mappings of H ontoitself. The geometric significance of these operators can be clarified with the following theorem

Theorem 1.40 If T is an operator on H, the following conditions are equivalent to one another

T †T = I (1.44)

(Tx, Ty) = (x,y) ∀x,y ∈ H (1.45)

‖T (x)‖ = ‖x‖ ∀x ∈ H (1.46)

In general an operator T with any of the properties (1.44-1.46), is an isometric isomorphism of H into itself,since T preserves linear operations, as well as the inner product and the norm (and thus the metric). For finite-dimensional spaces any of them are necessary and sufficient conditions for T to be unitary. Nevertheless, this isnot the case when we treat with infinite-dimensional spaces, let us see an example: consider the operator T in C∞

given by

T x1, x2, ... = 0, x1, x2, ...which preserves norms but has no inverse. The point is that this is an isometric isomorphism into H but not ontoH (the image does not contain any element of C∞ with a non-null first component). So in the case of infinitedimension, the condition to be onto must be added to the conditions (1.44-1.45) for an operator to be unitary.

Theorem 1.41 An operator on H is unitary⇔is an isometric isomorphism of H onto itself.

Page 36: Mecanica Cuantica: Notas de Clase

36 CAPITULO 1. LINEAR OR VECTOR SPACES

In words, unitary operators are those one-to-one and onto operators that preserve all structure relevant for aHilbert space: linear operations, inner products, norm and metric.

In practice, unitary operators usually appear in Physics as operations that keep the norm of the vectorsunaltered (like rotations in ordinary space), even this is usually the definition utilized in Physics books.

There is another theorem useful in the theory of representations for Hilbert spaces which is also used sometimesas the definition

Theorem 1.42 An operator T on H is unitary ⇔ T ei is a complete orthonormal set whenever ei is.

Another important characteristic for physical applications is the following

Theorem 1.43 The set of all unitary operators on H forms a group

1.13. Projections on Hilbert spaces

In Banach spaces we defined projections as idempotent continuous linear transformations or equivalently asidempotent operators. We also saw that a couple of closed subspaces such that B =M ⊕N induces a projectionand viceversa. We saw however that for a given closed subspace M of B there is not necessarily another closedsubspace such that B =M ⊕N .

In contrast, theorem 1.16 guarantees that for a given closed subspace M of a Hilbert space H there alwaysexists a decomposition with another closed subspace in the form H = M ⊕M⊥. Besides, in this decompositionthe closed complementary space is precisely the orthogonal complement of M . Since orthogonality is a veryimportant new concept that arises from Hilbert spaces, we shall concentrate on projections induced by thisparticular decomposition. It is then natural to look for the new features required by a given projection in orderto have M as its range and M⊥ as its null space

Theorem 1.44 If P is a projection (with the definition given for Banach spaces) on H with range M and nullspace N then M ⊥ N ⇔ P = P † and in this case N =M⊥.

A projection in which its range and null space are perpendicular is called an orthogonal projection. Indeed,orthogonal projections are the only ones that are relevant in the theory of operators on Hilbert spaces, then weshall redefine the concept of projection once again

Definition 1.23 A projection on a Hilbert space will be defined as an idempotent, continuous, and self-adjointlinear transformation. If idempotent, continuous, non-self adjoint linear transformations are of some use, we callthem non-orthogonal projections.

The following facts are easy to show, 0 and I are projections and they are distinct if and only if H 6= 0. Pis the projection on M ⇔ I − P is the projection on M⊥.

We can also see thatx ∈M ⇔ Px = x ⇔ ‖Px‖ = ‖x‖

it can also be seen that P is a positive operator and ‖P‖ ≤ 1.Sometimes occur in Physics that a given operator T on H maps a proper subspace M of H into itself. The

following chain of definitions permits to study this kind of operators

Definition 1.24 Let T be an operator on H, and M a closed vector subspace of H. M is said to be invariantunder T if T (M) ⊆M .

In this case the restriction of T to M can be regarded as an operator of M into itself. A more interestingsituation occurs when M and M⊥ are invariant under T

Page 37: Mecanica Cuantica: Notas de Clase

1.14. THEORY OF REPRESENTATIONS IN FINITE-DIMENSIONAL VECTOR SPACES 37

Definition 1.25 If both M and M⊥ are invariant under T , we say that M reduces T or that T is reduced by M .

This situation invites us to study T by restricting its domain to M and M⊥. The projections provide the mostrelevant information for these scenarios

Theorem 1.45 A closed vector subspace M is invariant under an operator T ⇔M⊥ is invariant under T †

Theorem 1.46 A closed vector subspace M reduces an operator T ⇔M is invariant under both T and T †

Theorem 1.47 If P is the projection on a closed vector subspace M of H, M is invariant under an operatorT ⇔ TP = PTP

Theorem 1.48 If P is the projection on a closed vector subspace M of H, M reduces an operator T ⇔ TP = PT

Theorem 1.49 If P and Q are projections on closed linear subspaces M and N then M ⊥ N ⇔ PQ = 0 ⇔QP = 0

We wonder whether the sum of projections in our present sense is also a projection. This is the case onlyunder certain conditions

Theorem 1.50 If P1, .., Pn are projections on closed subspaces M1, ..,Mn of a Hilbert space H, then the sumP = P1+ ..+Pn is a projection ⇔the P ′

is are pairwise orthogonal i.e. PiPj = δijPi, in that case P is the projectionon M =M1 + ..+Mn.

1.14. Basic theory of representations in a general finite dimensional vectorspace

In this section we intend to establish an equivalence between abstract objects such as elements of vector spacesand linear transformations, in a more tangible language suitable for explicit calculations. This is the gist of thetheory of representations for vector spaces

1.14.1. Representation of vectors and operators in a given basis

If n is the dimension of a finite-dimensional vector space V , a set of n linearly independent vectors in V , formsa basis for the vector space. Given a certain ordered basis u1, ..,un in a vector space V any vector can bewritten as a linear combination of such a basis, we shall use the convention of sum over repeated indices

x = xiui (1.47)

The coefficients xi are called the coordinates of the vector x, relative to the ordered basis ui. Linear inde-pendence ensures that the set of coordinates (x1, .., xn) is unique when the basis is ordered in a well-defined way.Therefore, this set of coordinates provides a representation of the vector x with respect to the ordered basis ui.

A mapping T of V into itself, associates each vector x with another vector y in V

y = Tx

if the mapping is one-to-one and onto it admits an inverse1

x = T−1y

1If the mapping is only one-to-one but not onto, the inverse still exist but restricted to the vector subspace in which all the vectorsx ∈ V are mapped.

Page 38: Mecanica Cuantica: Notas de Clase

38 CAPITULO 1. LINEAR OR VECTOR SPACES

if the transformation is linear we have

T (αx+βy) = αTx+ βTy ∀x,y ∈ V

where α and β are complex numbers. The definition of T is intrinsic and does not depend on the particular basischosen for the vector space. Notwithstanding, for many practical purposes we define a representation of boththe vectors and operators in a basis ui. In that case, we can describe the action of T by a transformation ofcoordinates (in the same basis)

yi = Ti (x1, x2, . . . , xn) i = 1, . . . , n

if Ti admits an inverse we getxi = T−1

i (y1, y2, . . . , yn) i = 1, . . . , n

the necessary and sufficient condition for the existence of the inverse is that the jacobian J ≡ ∂Ti/∂xj be differentfrom zero.

On the other hand, if we assume that T is a linear transformation we can write

y = Tx = T (xiui) = xiTui (1.48)

Eq. (1.48) says that y is a linear combination of the vectors Tui, and the coefficients of the combination(coordinates) coincide with the coordinates of x in the basis ui. The vectors Tui must be linear combinations ofuj and we denote the coefficients of these linear combinations as Tji

vi ≡ Tui = ujTji (1.49)

the real or complex coefficients Tji can be organized in a square arrangement of the form

T ≡

T11 T12 · · · T1nT21 T22 · · · T2n...

... · · · ...Tn1 Tn2 · · · Tnn

this square arrangement symbolized as T is called the matrix representative of the linear transformation T relativeto the ordered basis ui. Substituting in Eq. (1.48)

yjuj = ujTjixi

and since the uj are linearly independentyj = Tjixi

this operation is represented by the following notation

y1y2...yn

=

T11 T12 · · · T1nT21 T22 · · · T2n...

... · · · ...Tn1 Tn2 · · · Tnn

x1x2...xn

y1y2...yn

=

T11x1 + T12x2 + ..+ T1nxnT21x1 + T22x2 + ..+ T2nxn

...Tn1x1 + Tn2x2 + ..+ Tnnxn

and is usually written in the formy = Tx

Page 39: Mecanica Cuantica: Notas de Clase

1.14. THEORY OF REPRESENTATIONS IN FINITE-DIMENSIONAL VECTOR SPACES 39

the last equality appears in matrix notation where T is the matrix representative of the linear operator T in theordered basis ui. Similarly, x and y are the coordinate representatives of the intrinsic vectors in the same orderedbasis. Eq. (1.49) shows clearly how to construct the matrix T, i.e. applying the operator to each vector in thebasis, and writing the new vectors as linear combinations of the basis. The coefficient of the i − th new vectorassociated to the j − th element of the basis gives the element Tji in the associated matrix. Observe that for amatrix representative to be possible, the linearity was fundamental in the procedure.

On the other hand, since we are looking for an isomorphism among linear transformations on V and the setof matrices (as an algebra), we should define linear operations and product of matrices in such a way that theseoperations are preserved in the algebra of linear transformations. In other words, if we denote by [T ] the matrixrepresentative of T in a given ordered basis we should find operations with matrices such that

[T1 + T2] = [T1] + [T2] ; [αT ] = α [T ] ; [T1T2] = [T1] [T2]

we examine first the product by a scalar, according to the definition (1.7) we have

(αT ) (ui) = α (Tui) = α (ujTji) = uj (αTji) ⇒(αT ) (ui) = uj (αTji) ⇒ (uj) (αT )ji = uj (αTji)

using linear independence we obtain the algorithm for scalar multiplication

(αT )ji = αTji

Now for the sum we use the definition 1.6

(T + U)uj = Tuj + Uuj = uiTij + uiUij = ui (Tij + Uij) ⇒(T + U)uj = ui (Tij + Uij) ⇒ ui (T + U)ij = ui (Tij + Uij)

and along with linear independence it leads to

(T + U)ij = (Tij + Uij)

Moreover, for multiplication (composition) we use definition 1.9

(TU)ui = T (Uui) = T (ujUji) = UjiT (uj) = Uji (Tuj) = Uji (ukTkj) ⇒(TU)ui = (TkjUji)uk ⇒ uk (TU)ki = uk (TkjUji)

linear independence gives(TU)ki = TkjUji (1.50)

It can be easily shown that the matrix representations of the operators 0 and I are unique and equal in anybasis, they correspond to [0]ij = 0 and [I]ij = δij .

Finally, we can check from Eq. (1.49) that the mapping T → [T ] is one-to-one and onto. It completes the proofof the isomorphism between the set of linear transformations and the set of matrices as algebras.

On the other hand, owing to the one-to-one correspondence T ↔ [T ] and the preservation of all operations, wesee that non-singular linear transformations (i.e. invertible linear transformations) should correspond to invertiblematrices. We denote

[T−1

]the matrix representative of T−1, and our goal is to establish the algorithm for this

inverse matrix, the definition of the inverse of the linear transformation is

TT−1 = T−1T = I

since the representation of the identity is always [I]ij = δij , the corresponding matrix representation of thisequation is

[T ]ik[T−1

]kj

=[T−1

]ik[T ]kj = δij (1.51)

this equation can be considered as the definition of the inverse of a matrix if it exists. A natural definition is then

Page 40: Mecanica Cuantica: Notas de Clase

40 CAPITULO 1. LINEAR OR VECTOR SPACES

Definition 1.26 A matrix which does not admit an inverse is called a singular matrix. Otherwise, we call it anon-singular matrix.

Since T−1 is unique, the corresponding matrix is also unique, so the inverse of a matrix is unique when it exists.A necessary and sufficient condition for a matrix to have an inverse is that its determinant must be non-zero.

The algebra of matrices of dimension n×n is called the total matrix algebra An, the preceding discussion canbe summarized in the following

Theorem 1.51 if B = u1, ..,un is an ordered basis of a vector space V of dimension n, the mapping T → [T ]which assigns to every linear transformation on V its matrix relative to B, is an isomorphism of the algebra ofthe set of all linear transformations on V onto the total matrix algebra An.

Theorem 1.52 if B = u1, ..,un is an ordered basis of a vector space V of dimension n, and T a lineartransformation whose matrix relative to B is [aij ]. Then T is non-singular ⇔ [aij ] is non-singular and in this case[aij]

−1 =[T−1

].

1.14.2. Change of coordinates of vectors under a change of basis

We have already seen that any vector space has an infinite number of bases. Notwithstanding, once a givenbasis is obtained, any other one can be found by a linear transformation of the original basis.

Let uj be our “original” ordered basis andu′j

any other ordered basis. Each u′

i is a linear combination

of the original basisu′i = aijuj i = 1, . . . , n (1.52)

linear independence of ui ensures the uniqueness of the coefficients aij . The natural question is whether we

require any condition on the matrix representation aij in Eq. (1.52) to ensure that the setu′j

be linearly inde-

pendent. If we remember that there is a one-to-one correspondence between matrices and linear transformationswe see that aij must correspond to a (unique) linear transformation A. In this notation Eq. (1.52) becomes

u′i = Auj (1.53)

now appealing to theorem 1.9 we see thatu′j

is a basis if and only if A is non-singular, but A is non-singular

if and only if [A]ij = aij is a non-singular matrix. Thus Eq. (1.53) can be written in matrix notation as

u′ = Au (1.54)

the new set u′i is a basis if and only if the matrix A is non-singular. Any vector x can be written in both bases

x = xiui = x′iu′i = x′iaijuj = x′jajiui (1.55)

and owing to the linear independence of ui

xi = x′jaji = aijx′j ; aij ≡ aji

where aij ≡ aji indicates the transpose of the matrix A. In matrix form we have

u′ = Au , x = Ax′

(1.56)

and using Eq. (1.56) we get

x′ = A−1x (1.57)

Page 41: Mecanica Cuantica: Notas de Clase

1.14. THEORY OF REPRESENTATIONS IN FINITE-DIMENSIONAL VECTOR SPACES 41

observe that if the original basis transform to the new one by a non-singular matrix A (Eq. 1.54), the original

coordinates transform to the new ones by the matrix A−1 (Eq. 1.57). It is easy to show that A−1 = A−1 then Ais non-singular if and only if A is non-singular. Hence Eq. (1.57) makes sense whenever A is non-singular.

Defining the transpose of a column matrix as

x = (x1, x2, . . . , xn)

Equation (1.55) can be written asx = xu = x′u′

which gives a convenient notation for the coordinate-form of vectors in different basis.It is important to emphasize that the vector x has an intrinsic meaning while its coordinates depend on the

basis chosen.

1.14.3. Change of the matrix representative of linear transformations under a change ofbasis

Let us define an intrinsic equation for a linear transformation T of V into itself

y = Tx (1.58)

y and x denote here intrinsic vectors while y,x are their representation in coordinates under a given ordered basis.Starting with the ordered basis ui we write equation (1.58) in matrix form

y = Tx (1.59)

for any other ordered basis u′i the matrix and coordinate representatives are different and we write them as

y′ = T′x′ (1.60)

we remark that Eqs. (1.59) and (1.60) represents the same intrinsic Equation (1.58).Since we know the relation between the coordinate representatives given by Eq. (1.57), our goal here is to

know the relation between the matrix representatives of T . Using Eq. (1.57) we find

y′ = A−1y = A−1

Tx = A−1

TAA−1

x =(A−1TA

)(A−1x

)

y′ = T′x′ (1.61)

where we have definedT′ ≡ A−1TA (1.62)

from Eqs. (1.61, 1.62) we see that T′ is the representative matrix of the operator T in the new basis u′i where

the matrix A−1 gives the transformation between coordinates from the old basis to the new one Eq. (1.57). Weremember that A must be non-singular to represent a change of basis.

Definition 1.27 The transform of a matrix A (also called a similarity transformation) by a non singular matrixS, is defined as A′ = SAS−1. The matrices A′ and A are said to be equivalent.

Eq. (1.62) shows that the new matrix representation of T (i.e. T′), is equivalent2 to the old matrix represen-tation T, and the transform of T by A−1 is T′.

2Similarity transformations provides an equivalence relation between two matrices. Thus, the expression equivalent matrices becomeslogical. In addition, we see thatT andT′ describe the same mathematical object (though in different bases), so that the term equivalenceacquires more sense in this context.

Page 42: Mecanica Cuantica: Notas de Clase

42 CAPITULO 1. LINEAR OR VECTOR SPACES

We can also consider a transformation S from a vector space V into another V ′

x′ = Sx, x = S−1x′

For S−1 to be linear, it is necessary that V and V ′ be of the same dimensionality. If a linear operator T is definedin V , then T and S induce a linear operator in V ′ in the following way let map x′ of V ′ into y′ of V ′ in thefollowing way

x′ → x = S−1x′ → y = Tx = T(S−1x′)→ y′ = Sy = S

(T(S−1x′))

hence the mapping x′ → y′ has been performed as

x′ → y′ =(STS−1

) (x′)

or course, we can define a mapping T ′ of V ′ into itself that makes the work in a single step, thus

T ′ ≡ STS−1 ; y′ = T ′ (x′) (1.63)

The transformation given by (1.63) is also a similarity transformation. Although the transformations shown in(1.62) and (1.63) resembles, they have fundamental differences. In (1.62) we are representing the same mathemati-cal object by taking different bases, and is a matrix equation. By contrast, Eq. (1.63) expresses a relation betweentwo different mathematical transformations acting on different spaces3, and the equation is intrinsic, independentof the basis.

1.15. Active and passive transformations

In Physics, it is important to differentiate between two types of transformations, the passive ones and theactive ones. We can understand passive transformations by examining the transformations y → y′, x → x′ andT → T ′ to go from Eq. (1.59) to Eq. (1.60), if we remember that both are representatives of the same intrinsicequation (1.58) we realize that the mappings described above do not change the vectors or the transformation butonly their representatives. These mappings (called passive mappings) thus correspond to a change in the basisand not to a change on the mathematical objects by themselves.

In contrast, an active mapping or transformation transforms a mathematical object into another one. Forinstance, in the first of Eqs. (1.63) we map a linear transformation on V into a different linear transformationon V ′, the mathematical object itself has changed. Similarly the mapping x′ → y′ through T ′ described by thesecond of Eqs. (1.63) is an active transformation because x′ and y′ are two different vectors.

The difference between a passive and active mappings or transformations should be clear from the context.For instance Eqs. (1.62) and (1.63) are identical in form from the algebraic point of view, but (1.62) represents apassive transformation (a change of basis or a change of representation), while (1.63) represents an active one.

1.16. Theory of representations on finite dimensional Hilbert spaces

We shall study n−dimensional Hilbert spaces. We remember that an inner product is a mapping that takes anordered pair of vectors x,y in a vector space V, and associates to it a scalar α denoted by α = (x,y) such that

(x,y) = (y,x)∗ ; (x, βy) = β (x,y) ; (x1 + x2,y) = (x1,y) + (x2,y)

(x,x) ≥ 0, and (x,x) = 0 ⇔ x = 0

3It could be argued that both spaces are identical since they have the same dimensionality. This is true only for their properties asgeneral vector spaces, but not necessarily for any additional algebraic or topological structure on them.

Page 43: Mecanica Cuantica: Notas de Clase

1.16. THEORY OF REPRESENTATIONS ON FINITE DIMENSIONAL HILBERT SPACES 43

the definition of the inner product is intrinsic (basis independent). The norm of a vector is defined as ‖x‖2 ≡ (x,x).This in turn allows us to normalized the vectors, i.e. construct vectors with norm or “length” equal to one by therule

ui =xi√(x,x)

=xi‖xi‖

(1.64)

such that (ui,ui) = 1. Different inner products defined into the same vector space, lead to different Hilbert spaces.Another important concept that arises from the inner product is that of orthogonality. An orthonormal set is aset xi with xi ∈ H such that

(xi,xj) = δij

The theory of representations of a finite dimensional Hilbert space is particularly simple if we realize that in finitedimension, the Fourier expansion given by Eq. (1.27) becomes a linear combination, the series in (1.28) to calculatethe norm becomes a finite sum, and finally complete orthonormal sets become bases. These are the main ideasthat lead to the theory of representations in a Hilbert space

Our first goal is to find the way in which the coordinates of a given vector are obtained from the inner product.We first see the form of the coordinates when the basis consists of a complete orthonormal basis. Rewriting theFourier expansion (1.27) in finite dimension and using sum over repeated indices we have

x = (ui, x)ui = xiui

so the coordinate of a vector x associated with the normal vector ui is given by

xi = (ui, x)

Let us now see how an arbitrary inner product can be calculated using an orthonormal basis

(x, y) = (xiui, yjuj) = x∗i yj (ui,uj) = x∗i yjδij = x∗i yi (1.65)

the norm of a vector is also easily seen as

‖x‖2 = (x, x) = x∗ixi = |xi| |xi| (1.66)

if the basis vi is not an orthonormal set, we can express the scalar product by determining the numbers

mij ≡ (vi,vj) (1.67)

the properties of the inner product lead to mij = m∗ji. This numbers form a matrix that we shall call the metric

matrix. Defining (Aij)† ≡ A∗

ji (the adjoint or hermitian conjugate of the matrix A) we find that m = m†, from

the definition of the adjoint matrix we see that (AB)† = B†A†. A matrix that coincides with its adjoint is calledself-adjoint or hermitian. The metric matrix is hermitian. We shall see now that knowing the metric matrix in acertain basis, we can find any possible inner product

(x,y) = (xivi, yjvj) = x∗i yj (vi,vj) = x∗imijyj

(x,y) = x†my

and the norm becomes(x,x) = x∗imijxj = x†mx (1.68)

representing x as a one column matrix, x† is a one row matrix with the coordinates conjugated. The quantities ofthe form x†Ay, with A hermitian, are called hermitian forms. If additionally we impose that x†Ax ≥ 0, we havea positive definite hermitian form4.

4An inner product guarantees that the hermitian form constructed with the metric matrix are positive-definite. However, it is usualin relativity to define a pseudo-metric that leads to non positive definite hermitian forms. Observe that the metric tensor in relativityhas some negative diagonal elements which would be forbidden if they arose from an authentic inner product.

Page 44: Mecanica Cuantica: Notas de Clase

44 CAPITULO 1. LINEAR OR VECTOR SPACES

Gram-Schmidt process for orthonormalization of linearly independent sets

From the previous discussion, it is very clear that complete orthonormal sets posses many advantages withrespect to other sets of linearly independent vectors. It leads us to study the possibility of finding an orthonormal setfrom a given set of linearly independent vectors in a Hilbert space. The so-called Gram-Schmidt orthonormalizationprocess starts from an arbitrary set of independent vectors x1,x2, ..,xn, ... onH and exhibits a recipe to constructa corresponding orthonormal set u1,u2, ..,un, ... with the property that for each n the vector subspace spannedby u1,u2, ..,un is the same as the one spanned by x1,x2, ..,xn.

The gist of the procedure is based on Eqs. (1.24, 1.64). We start by normalizing the vector x1

u1 =x1

‖x1‖

now we substract from x2 its component along u1 to obtain x2 − (u1,x2)u1 and normalized it

u2 =x2 − (u1,x2)u1

‖x2 − (u1,x2)u1‖

it should be emphasized that x2 is not a scalar multiple of x1 so that the denominator above is non-zero. It isclear that u2 is a linear combination of x1,x2 and that x2 is a linear combination of u1,u2. Therefore, u1,u2spans the same subspace as x1,x2. The next step is to substract from x3 its components in the directions u1

and u2 to get a vector orthogonal to u1 and u2 according with Eq. (1.24). Then we normalize the result and find

u3 =x3 − (u1,x3)u1 − (u2,x3)u2

‖x3 − (u1,x3)u1 − (u2,x3)u2‖

once again u1,u2,u3 spans the same subspace as x1,x2,x3. Continuing this way we clearly obtain an ortho-normal set u1,u2, ..,un, ... with the stated properties.

Many important orthonormal sets arise from sequences of simple functions over which we apply the Gram-Schmidt process

In the space L2 of square integrable functions associated with the interval [−1, 1], the functions xn (n =0, 1, 2, ..) are linearly independent. Applying the Gram Schmidt procedure to this set we obtain the orthonormalset of the Legendre Polynomials.

In the space L2 of square integrable functions associated with the entire real line, the functions xne−x2/2

(n = 0, 1, 2, ..) are linearly independent. Applying the Gram Schmidt procedure to this set we obtain the normalizedHermite functions.

In the space L2 associated with the interval [0,+∞), the functions xne−x (n = 0, 1, 2, ..) are linearly indepen-dent. Orthonormalizing it we obtain the normalized Laguerre functions.

Each of these orthonormal sets described above can be shown to be complete in their corresponding Hilbertspaces.

1.16.1. Linear operators in finite dimensional Hilbert spaces

First of all let us see how to construct the matrix representation of a linear operator by making profit of theinner product. Eq. (1.49) shows us how to construct the matrix representation of T in a given basis by applyingthe operator to each element ui of such a basis

Tui = ujTji ⇒ (uk, Tui) = (uk,ujTji)

⇒ (uk, Tui) = Tjimkj

if the basis is orthonormal then mkj = δkj and

Tki = (uk, Tui) (1.69)

Page 45: Mecanica Cuantica: Notas de Clase

1.16. THEORY OF REPRESENTATIONS ON FINITE DIMENSIONAL HILBERT SPACES 45

Eq. (1.69) gives the way to construct an element of the matrix representative of an operator T on H through theinner product and using an orthonormal basis.

Now we turn to the problem of finding a relation between the matrix representative of an operator and thematrix representative of its adjoint. If we have a linear operator T on a Hilbert space, another operator called itsadjoint and denoted as T † exists such that

(Tx,y) =(x, T †y

)∀x,y ∈ V

the matrix representative of T † has a rather simple relation with the matrix representative of T when an ortho-normal basis is used

(T (xiui) , ykuk) = (xiT (ui) , ykuk) = x∗i yk (Tui, uk)

and using (1.49) we findx∗i yk (ujTji, uk) = x∗i ykT

∗jiδjk = x∗i ykT

∗ki = x∗i T

∗ikyk

on the other hand we have (x, T †y

)= x∗i

(T †)ikyk

and taking into account that x and y are arbitrary, we have

(T †)ik

= T ∗ik ⇒ T† = T∗ (1.70)

and so the matrix representative of T † is the conjugate transposed of the matrix representative of T . Once again,it is important to emphasize that it is only valid in an orthonormal basis, it can easily be proved that for anarbitrary basis described by the metric matrix m, the matrix representation of T † is m−1T∗m. Rememberingthat an operator is hermitian or self-adjoint if it coincides with its adjoint operator (T = T †) i.e. (Tx,y) =(x, Ty) , ∀x,y ∈ V, we conclude that in an orthonormal basis, hermitian operators are represented by hermitianmatrices.

In particular, the form to calculate the norm described in (1.66), is usually taken for granted and it is easy toforget that it only applies in orthonormal bases as we can see from (1.68). This is because the coordinates of avector with respect to vi are not given by Fourier coefficients of the form described in Eq. (1.27)

Now assume that we go from an orthonormal basis ui into another orthonormal basis u′i. We know from

theorem 1.42 that a linear operator is unitary if and only if it transforms a complete orthonormal set into anothercomplete orthonormal set, then if A is a unitary operator we have

δij = (Aui, Auj) =(u′i,u

′j

)= (ukaki,umamj) = a∗kiamj (uk,um) = a∗kiamjδkm

δij = a∗kiakj = a∗ikakj

so the matrix of transformation from ui into u′i accomplishes

A†A = 1

now, if we demand for the matrix to be non-singular it must have a unique inverse such that

A†A = AA† = 1

therefore a matrix that transform an orthonormal basis into another orthonormal basis must satisfy

A† = A−1

by theorem 1.51 these matrices are associated with unitary operators as long as we use an orthonormal basis, thusit is natural to call them unitary matrices.

Page 46: Mecanica Cuantica: Notas de Clase

46 CAPITULO 1. LINEAR OR VECTOR SPACES

1.17. Determinants and traces

A very important property of any matrix is its determinant denoted by |A| and is a real or complex numberassociated with the matrix. Its construction was primarily motivated by the study of simultaneous linear equations.We assume that the reader is familiarized with the concept and the calculation of this quantity. We have mentionedthat a matrix admits an inverse if and only if its determinant is non-null. This is because the inverse of a matrixA depends on |A|−1. The determinant of the transpose coincides with the determinant of the matrix

∣∣∣A∣∣∣ = |A| (1.71)

a for the conjugate matrix (in which we conjugate each of its elements) we get

|A∗| = |A|∗ (1.72)

Additionally it can be demostrated that the determinant of the product is the product of the determinants

|AB| = |A| · |B| (1.73)

and since the determinant of the identity is 1 we get

1 = |1| =∣∣AA−1

∣∣ = |A| ·∣∣A−1

∣∣

so that ∣∣A−1∣∣ = |A|−1 (1.74)

if any row or column is multiplied by a scalar α, the determinant is also multiplied by the scalar. For example inthree dimensions

∣∣∣∣∣∣

α a11 α a12 α a13a21 a22 a23a31 a32 a33

∣∣∣∣∣∣=

∣∣∣∣∣∣

a11 α a12 a13a21 α a22 a23a31 α a32 a33

∣∣∣∣∣∣= α

∣∣∣∣∣∣

a11 a12 a13a21 a22 a23a31 a32 a33

∣∣∣∣∣∣

(1.75)

so that if we multiply an n× n matrix by a scalar, the determinant is

|αA| = αn |A| (1.76)

in particular|−A| = (−1)n |A| (1.77)

another important property is the trace of the matrix defined as the sum of its diagonal elements

TrA = aii (1.78)

we emphasize the sum over repeated indices. We prove that

Tr [AB] = Tr [BA] (1.79)

in this wayTr [AB] = (AB)ii = aikbki = bkiaik = (BA)kk = Tr [BA]

it is important to see that the trace is cyclic invariant, i.e.

Tr[A(1)A(2) . . .A(n−2)A(n−1)A(n)

]= Tr

[A(n)A(1)A(2) . . .A(n−2)A(n−1)

]

= Tr[A(n−1)A(n)A(1)A(2) . . .A(n−2)

](1.80)

Page 47: Mecanica Cuantica: Notas de Clase

1.18. RECTANGULAR MATRICES 47

and so on. To prove it, we define

B ≡ A(1)A(2) . . .A(n−1)

so that

Tr[A(1)A(2) . . .A(n−2)A(n−1)A(n)

]= Tr

[BA(n)

]= Tr

[A(n)B

]= Tr

[A(n)A(1)A(2) . . .A(n−2)A(n−1)

]

and taking into account that the indices (1) , (2) , ... are dummy, any cyclic change is posible. It worths saying thatproperty (1.79) does not mean that the matrices can be commuted to calculate the trace, for instance for threeor more matrices the trace is not the same for any order of the matrices, only cyclic changes are possible. In thatsense, we should interpret (1.79) as a cyclic change and not as a commutation.

But the most important properties of the traces and determinants is that they are invariant under a similaritytransformation

∣∣A′∣∣ =∣∣BAB−1

∣∣ = |B| · |A| ·∣∣B−1

∣∣ = |B| · |A| · |B|−1

⇒∣∣A′∣∣ = |A|

where we have used (1.73) and (1.74). Now for the invariance of the trace

TrA′ = Tr[BAB−1

]=

n∑

i=1

(BAB−1

)ii=∑

ikl

bikaklbli =∑

ikl

blibikakl =∑

kl

δklakl =∑

k

akk = TrA

alternatively we can see it by using the cyclic invariance of the trace (see Eq. 1.80), such that

Tr[A′] = Tr

[BAB−1

]= Tr

[B−1BA

]= TrA

the invariance of determinants and traces under similarity transformations are facts of major importance becauseall representations of a given linear transformation are related each other by similarity transformations. It meansthat determinants and traces are intrinsic quantities that can be attributed to the linear transformations thus

Definition 1.28 We define the trace and the determinant of a given linear transformation of V into itself bycalculating the trace and determinant of the matrix representative of the linear transformation in any basis.

1.18. Rectangular matrices

A rectangular matrix is an arrangement of numbers consisting of m rows and n columns. In that case we saythat the matrix has dimensions m× n. The elements of such a matrix will be of the form

(A)ik = aik ; i = 1, . . . ,m ; k = 1, . . . , n

the transpose of this matrix would have dimensions n×m. A column vector arrangement (from now on, we shallcall it simply a “vector”, though it is not neccesarily a vector in all the sense of the word) is a rectangular matrixof dimension m× 1, its transpose (a row “vector”) is a rectangular matrix of dimensions 1×m.

Now, it would be desirable to extrapolate the algorithm of square matrices composition to calculate productsof rectangular matrices

cij ≡ aikbkj

It is observed that this extrapolation of the matrix product to the case of rectangular matrices C = AB, can bedefined consistently only if the number of columns of A coincides with the number of rows of B.

AB = C if A ≡ Am×n and B ≡ Bn×d ⇒ Cm×d

Page 48: Mecanica Cuantica: Notas de Clase

48 CAPITULO 1. LINEAR OR VECTOR SPACES

In particular, the product of a column vector (m × 1 matrix) with a m × m matrix in the form xA cannot bedefined. Nevertheless, the product of the transpose of the vector (row vector) and the matrix A in the form xAcan be defined. In a similar fashion, the product Ax cannot be defined but Ax can. From these considerationsthe quantities Ax and xA correspond to a new column vector and a new row vector respectively.

From the dimensions of the rectangular matrices we see that

Am×n ⇒ An×m and Bn×d ⇒ Bd×n

and the product AB is defined. However, their transposes can only be multiplied in the opposite order, i.e. in theorder BA. Indeed, it is easy to prove that, as in the case of square matrices, the transpose of a product is theproduct of the transpose of each matrix in the product, but with the product in the opposite order. Applying thisproperty it can be seen that

(Ax) = xA ; (xA) = Ax

where we have taken into account that the transpose of the transpose is the original matrix.

1.19. The eigenvalue problem

If T is a linear transformation on a vector space of finite dimension n, the simplest thing that the lineartransformation can do to a vector is to produce a “dilatation” or “contraction” on it, eventually changing the“sense” of the “arrow” but keeping its “direction”. In algebraic words, certain vectors can be transformed byT into a scalar multiple of itself. If x is a vector in H this operation is given by

Tx = λx (1.81)

a non-zero vector x such that Eq. (1.81) holds, is called an eigenvector of T , and the corresponding scalar λ iscalled an eigenvalue of T . Each eigenvalue has one or more eigenvectors associated with it and to each eigenvectorcorresponds a unique eigenvalue.

Let us assume for a moment that the set of eigenvalues for a given T is non-empty. For a given λ consider theset M of all its eigenvectors together with the vector 0 (which is not an eigenvector), we denote this vectors as

x(λ)i . M is a linear subspace of H, we see it by taking an arbitrary linear combination of vectors in M

T(αix

(λ)i

)= αiT

(x(λ)i

)= αiλx

(λ)i = λ

(αix

(λ)i

)⇒

T(αix

(λ)i

)= λ

(αix

(λ)i

)

such that a linear combination is also an eigenvector with the same eigenvalue. Indeed, for Hilbert spaces it canbe shown that M is a closed vector subspace of H. As any vector space, M has many basis and if H is finitedimensional, complete orthonormal sets are basis. The dimension of M is thus the maximum number of linearlyindependent eigenvectors associated with λ. M is called the vector eigenspace generated by the eigenvalue λ. Thisdiscussion induces the following

Definition 1.29 A given eigenvalue λ in Eq. (1.81) is called n−fold degenerate if n is the dimension of theeigenspace M of H generated by λ. In other words, n is the maximum number of linearly independent eigenvectorsof λ. If n = 1 we say that λ is non-degenerate.

Even for non-degenerate eigenvalues we always have an infinite number of eigenvectors, for if x(λ) is an eigen-vector, then αx(λ) is also an eigenvector for any scalar α. Eq. (1.81) can be written equivalently as

(T − λI)x = 0 (1.82)

Page 49: Mecanica Cuantica: Notas de Clase

1.19. THE EIGENVALUE PROBLEM 49

we return to the problem of the existence of eigenvalues, the operator T on C∞ given by

T x1, x2, ... = 0, x1, x2, ...

is an operator on a Hilbert space that has no eigenvalues. We confront then the problem of characterizing the typeof operators that admit eigenvalues. In the finite dimensional case, we shall see that the theory of representationsand the fundamental theorem of algebra ensures the existence of eigenvalues for an arbitrary operator.

1.19.1. Matrix representative of the eigenvalue problem

The one to one correspondence between matrices and operators in the finite dimensional case permits to makea matrix representation of the eigenvalue equation (1.81). Let T be the n×n matrix associated with the operatorT and x the column vector representative of x (an n× 1 matrix). Eq. (1.81) is written as

Tx = λx (1.83)

which is the eigenvalue equation associated with the matrix. The idea is trying to solve for the eigenvalues andeigenvectors in a given representation. The values λ are in general complex. According with our previous discussionthe eigenvalue is the “dilatation”or “contraction” factor, if it is a negative real number it “inverts the sense of thearrow”. Let us rewrite the eigenvalue equation as

(T− λ1)x = 0 (1.84)

for simplicity we shall use n = 3 but the arguments are valid for arbitrary finite dimensions. In three dimensionsthe explicit form of (1.84) becomes

(T11 − λ)X1 + T12X2 + T13X3 = 0

T21X1 + (T22 − λ)X2 + T23X3 = 0

T31X1 + T32X2 + (T33 − λ)X3 = 0 (1.85)

This set of homogeneous equations for X1,X2,X3 has non trivial solution only if the determinant of the systemis null, therefore

|T− λ1| =

∣∣∣∣∣∣

T11 − λ T12 T13T21 T22 − λ T23T31 T32 T33 − λ

∣∣∣∣∣∣= 0 (1.86)

this condition is known as the secular or characteristic equation of the matrix. The variables to be found arethe eigenvalues λ associated with the matrix. It worths saying that even if non-trivial solutions exist, the set ofhomogeneous equations (1.85) do not give us definite values for all the components of the eigenvectors but onlyfor the quotient among these components. This can be understood either from algebraic or geometric arguments.From the algebraic point of view, it is related with the fact that the product of the eigenvector x with anyscalar is also an eigenvector, this can be seen inmediately from (1.84)5. Geometrically, this implies that only the“direction” of the eigenvector is determined but not its “length” neither its “sense”. This is particularly apparentin three dimensions. Since T represents a linear transformation, it is clear that if T preserves the direction of xi.e. Tx = λx it also preserves the “direction” of the vector αx for α arbitrary.

When the determinant (1.86) is expanded, we observe that the solution of the secular equation reduces tofinding the roots of a polynomial of n degree. Appealing to the fundamental theorem of algebra we always haveexactly n complex roots, some of them could be repeated so that we could have fewer than n distinct roots. In

5Alternatively, this can be seen form the fact that the secular equation only has non-trivial solution when one or more of theequations is linearly dependent with the others. In such a case there are more variables than equations and hence an infinite numberof solutions.

Page 50: Mecanica Cuantica: Notas de Clase

50 CAPITULO 1. LINEAR OR VECTOR SPACES

general we can construct no more than n linearly independent vectors xk each one associated with an eigenvalueλk. By now, the set of eigenvalues are associated to a matrix, but in order to associate it to its correspondingoperator, we should be sure that the set of eigenvalues is the same for any representation of the operator i.e. thatall equivalent matrices have the same set of eigenvalues

Theorem 1.53 If two n×n matrices are equivalent i.e. T ′ = STS−1 then both have the same set of eigenvalues.

In summary, the fundamental theorem of Algebra together with the intrinsic meaning of the set of eigenvalues,solves the problem of the existence of eigenvalues for linear transformations on finite-dimensional vector spaces.

Definition 1.30 The set of eigenvalues of T is called its spectrum and is denoted by σ (T ).

Theorem 1.54 If T is an arbitrary linear transformation on a finite dimensional complex vector space, thespectrum of T constitute a non-empty finite subset of the complex plane. The number of elements in this subsetdoes not exceed the dimension n of the space.

Some other important theorems related with the set of eigenvalues are the following

Theorem 1.55 T is singular ⇔ 0 ∈ σ (T ).

Theorem 1.56 If T is non-singular, then λ ∈ σ (T ) ⇔ λ−1 ∈ σ(T−1

)

More information about the spectral resolution of some types of operators in a Hilbert space will be given bymeans of the spectral theorem. By now, we turn to the problem of the sets of eigenvectors and its relation withthe canonical problem of matrices.

1.19.2. Eigenvectors and the canonical problem of matrices

Since we can have many representations of a given operator by changing basis, many matrix representativescan be constructed. It is natural to wonder whether it is posible to choose the basis in such a way that the matrixrepresentative is as simple as possible. In practice, the simplest matrices are diagonal matrices i.e. matrices forwhich Tij = 0 for i 6= j. Thus, we are looking for a basis under which the matrix representative of a given operatorT is diagonal. Starting with a given basis ui we obtain a matrix representative of T (denoted by T), we wonderwhether there exists another basis u′

i for which the matrix representative T′ of T is diagonal. From Eqs. (1.54,1.62) we see that T and T′ are related by a similarity transformation that also gives us the transformation amongthe bases

u′ = Au ; T′ = A−1TA (1.87)

We shall see that for finite dimensional matrices, the canonical problem of matrices is intimately related withthe structure of its eigenvectors. Let us consider the representation Xk of the eigenvectors of T with respect to theoriginal basis ui. We denote the i−th coordinate of the k−th eigenvector in the form Xik (with respect to theoriginal basis). We are able to settle an square arrangement with this eigenvectors, putting them aside as columnvectors. In three dimensions, such an arrangement has the form

X ≡ (X1 X2 X3) =

X11 X12 X13

X21 X22 X23

X31 X32 X33

(1.88)

Eqs. (1.84) are written for each eigenvalue λk and its corresponding eigenvector Xk in the form

(T− λk1)Xk = 0 ⇒ TXk = λkXk no sum over k (1.89)

Page 51: Mecanica Cuantica: Notas de Clase

1.20. NORMAL OPERATORS AND THE SPECTRAL THEOREM 51

writing Eqs. (1.89) in components with respect to the basis ui we get (for n dimensions)

n∑

j=1

TijXjk = λkXik ⇒

n∑

j=1

TijXjk =n∑

j=1

Xijδjkλk (1.90)

in the two previous equations there is no sum over the repeated index k. The Xjk element is the j−th componentof the Xk vector. Now, the quantity δjkλk can be associated with a diagonal matrix, in three dimensions thismatrix is written as

λ ≡

λ1 0 00 λ2 00 0 λ3

(1.91)

in matrix form Eq. (1.90) reads

TX = Xλ

multiplying on left by X−1 we find

X−1TX = λ (1.92)

it corresponds to a similarity transformation acting on T. Note that the matrix X built from the eigenvectors isthe transformation matrix (comparing with 1.87 we have X ≡ A). We see then that matrix T is diagonalized byX by means of a similarity transformation and the elements of the diagonal correspond to the eigenvalues (λkassociated with the column vector Xk of the matrix X in Eq. 1.88). When there are some degenerate eigenvaluesi.e. some of them acquire the same value, it is not always possible to diagonalize the matrix T. It is because inthat case, the eigenvectors that form the matrix X are not necessarily linearly independent. If any given columnvector of the matrix is linearly dependent with the others, the determinant of X is zero and X−1 does not exist.

On the other hand, when diagonalization is possible, the determinant and the trace of T can be calculatedtaking into account that such quantities are invariant under a similarity transformation, therefore

detT = det[X−1TX

]= detλ = λ1λ2 . . . λn (1.93)

TrT = Tr[X−1TX

]= Trλ = λ1 + λ2 + . . .+ λn (1.94)

so that the determinant and the trace of a diagonalizable matrix are simply the product and sum of its eigenvaluesrespectively.

In summary, a canonical form of a given matrix can be obtained as long as the eigenvectors of the matrix forma basis, the question is now open for the conditions for the eigenvectors to form a basis, and this is part of theprogram of the spectral theorem.

1.20. Normal operators and the spectral theorem

Let T be an operator on a finite-dimensional Hilbert space H. By theorem 1.54 the spectrum σ (T ) is a non-empty finite set of complex numbers with cardinality less than or equal to the dimension n of H. Let λ1, .., λmbe the set of distinct eigenvalues; let M1, .., Mm be their corresponding eigenspaces; and let P1, .., Pm be theprojections on these eigenspaces. The spectral theorem is the assertion that the following three statements areequivalent to one another

I) The M ′is are pairwise orthogonal and H =M1 ⊕ ...⊕.Mm

II) The P ′is are pairwise orthogonal, I =

∑mi=1 Pi, and T =

∑mi=1 λiPi.

III) T is normal.

Page 52: Mecanica Cuantica: Notas de Clase

52 CAPITULO 1. LINEAR OR VECTOR SPACES

The assertion I) means that any vector x ∈ H can be expressed uniquely in the form

x = x1 + ..+ xm ; xi ∈Mi ; (xi, xj) = 0 for i 6= j (1.95)

applying T on both sides and using linearity

Tx = Tx1 + ..+ Txm = λ1x1 + ..+ λmxm (1.96)

this shows the action of T on each element of H in an apparent pattern from the geometrical point of view. It isconvenient to write it in terms of projections on each Mi. Taking into account that Mj ⊆ M⊥

i for each i and forevery j 6= i we obtain from Eq. (1.95) that

Pix = xi

from which it follows

Ix = x = x1 + ..+ xm = P1x+ ..+ Pmx

Ix = (P1 + ..+ Pm)x ; ∀x ∈ H

therefore

I =m∑

i=1

Pi (1.97)

and relation (1.96) gives

Tx = λ1x1 + ..+ λmxm = λ1P1x+ ..+ λmPmx

Tx = (λ1P1 + ..+ λmPm)x ; ∀x ∈ Hhence

T =m∑

i=1

λiPi (1.98)

Eq. (1.98) is called the spectral resolution of the operator T . In this resolution it is to be understood that all theλ′is are distinct and that the P ′

is are non-zero projections which are pairwise orthogonal and satisfy condition(1.97). It can be shown that the spectral resolution is unique when it exists.

Now, we look for the conditions that the operator must satisfies to be decomposed as Eq. (1.98). From Eq.(1.98) we see that

T † = λ∗1P1 + . . . + λ∗mPm (1.99)

and multiplying (1.98) with (1.99) and using the fact that the P ′i s are pairwise orthogonal we have

TT † =

(m∑

i=1

λiPi

)(m∑

k=1

λ∗kPk

)=

m∑

i=1

m∑

k=1

λiλ∗kPiPk =

m∑

i=1

m∑

k=1

λiλ∗kP

2i δik

TT † =

m∑

k=1

|λk|2 Pk (1.100)

and multiplying in the opposite order we obtain the same result

T †T =

m∑

k=1

|λk|2 Pk (1.101)

from which we see that [T, T †

]= 0

and the operator must be normal. We have proved that I)→II)→III). To complete the proof we should show thatIII)→I) i.e. that every normal operator T on H satisfies conditions I).

This task is accomplished by the following chain of theorems

Page 53: Mecanica Cuantica: Notas de Clase

1.20. NORMAL OPERATORS AND THE SPECTRAL THEOREM 53

Theorem 1.57 If T is normal, x is an eigenvector of T with eigenvalue λ ⇔ x is an eigenvector of T † witheigenvalue λ∗.

Theorem 1.58 If T is normal the M ′is are pairwise orthogonal

Theorem 1.59 If T is normal, each Mi reduces T .

Theorem 1.60 If T is normal, the M ′is span H.

For most of applications theorem 1.58 is rewritten as

Theorem 1.61 If T is normal, two eigenvectors of T corresponding to different eigenvalues are orthogonal. Inparticular this is valid for self-adjoint and unitary operators.

Assume that T = T †, since for a given eigenvector x there is a unique eigenvalue λ we see from theorem 1.57that λ = λ∗ so the corresponding eigenvalues are real. Now assume for a normal operator T that σ (T ) is a subsetof the real line, using the spectral resolution of T † Eq. (1.99) we find

T † = λ∗1P1 + . . .+ λ∗mPm = λ1P1 + . . .+ λmPm = T

we have the following

Theorem 1.62 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is self-adjoint ⇔each λi is real.

It is important to emphasize that the hypothesis of real eigenvalues leads to the self-adjointness of the operatoronly if normality is part of the hypothesis (because of the use of the spectral thoerem). It does not discard thepossibility of having non-normal operators with real spectrum, in that case such operators would not be self-adjoint. In addition, it worths remembering that self-adjoint operators where constructed as the analogous of “thereal line subset” in the algebra of operators. So the fact that its eigenvalues are all real is a quite expected result.

An special type of self-adjoint operators are the positive operators for which

(x, Tx) ≥ 0 ∀x ∈ H (1.102)

applying the spectral resolution of T on xi ∈Mi with xi 6= 0, we have

Txi =

m∑

k=1

λkPkxi =

m∑

k=1

λkxiδik = λixi

and using it in Eq. (1.102) we find

(xi, Txi) = (xi, λixi) = λi (xi, xi) ≥ 0 no sum over i

λi ‖xi‖2 ≥ 0 ⇒ λi ≥ 0

on the other hand, by assuming that a normal operator T has a real non-negative spectrum we obtain

(x, Tx) =

(x,

n∑

i=1

λiPix

)=

(n∑

k=1

xk,n∑

i=1

λixi

)=

n∑

k=1

n∑

i=1

λi (xk, xi) =n∑

k=1

n∑

i=1

λiδki ‖xk‖2

(x, Tx) =n∑

k=1

λk ‖xk‖2 ≥ 0

we see then that

Page 54: Mecanica Cuantica: Notas de Clase

54 CAPITULO 1. LINEAR OR VECTOR SPACES

Theorem 1.63 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is positive ⇔ λi ≥ 0.

Now, for a normal operator T , a necessary and sufficient condition for T to be unitary is that T †T = I (infinite dimension it is not necessary to show that TT † = I) using Eqs. (1.97, 1.100) the condition for unitarity is

T †T = I ⇒m∑

k=1

|λk|2 Pk = I ⇒m∑

k=1

|λk|2 Pk =

m∑

k=1

Pk

multiplying by Pi and using the pairwise orthogonality of projectors

m∑

k=1

|λk|2 PkPi =m∑

k=1

PkPi ⇒ |λi|2 P 2i = P 2

i ⇒ |λi|2 Pi = Pi

so that |λi| = 1. This procedure also shows that if T is a normal operator in which |λi| = 1 for each i, thenTT † = I and T is unitary, then we have

Theorem 1.64 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is unitary ⇔ |λi| = 1 for each i.

Now, remembering that unitary operators where constructed as the analogous of “the unitary circle subset”in the algebra of operators, the fact that its eigenvalues lie in the unitary circle of the complex plane is prettynatural.

Now we are prepared to discuss the canonical problem for normal matrices. We denote ni the dimension ofeach eigenspace Mi it is clear that

n1 + n2 + ...+ nm = n

Mi contains ni linearly independent vectorsxi1, .., x

ini

that can be orthonormalized by a Gram Schmidt process

to sayui1, .., u

ini

. If we do this for each Mi the set form by the union of these orthonormal sets

u ≡ ∪mi=1

ui1, .., u

ini

is clearly an orthonormal set because all vectors corresponding with different M ′is are orthogonal according to

theorem 1.58. In addition, since the M ′is span H according to theorem 1.60 this orthonormal set is complete and

hence a basis. Therefore, for any normal operator T of H we can always form an orthonormal complete set ofeigenvectors. If we use this orthonormal complete eigenvectors to form the matrix of diagonalization Eq. (1.88) wesee that the matrix obtained is a unitary matrix, it is clear that for this matrices the inverse always exists sinceλi 6= 0 for each i and therefore the diagonalization can be carried out. Then we have the following

Theorem 1.65 The diagonalization of a normal matrix T can be performed by a similarity transformation of theform T′ = UTU−1 where U is a unitary matrix.

This is of particular interest because it means that given a matrix representative of T in a basis consisting ofa complete orthonormal set, there exists another complete orthonormal set for which the matrix representative

Page 55: Mecanica Cuantica: Notas de Clase

1.20. NORMAL OPERATORS AND THE SPECTRAL THEOREM 55

acquires its canonical form. Further, it is easy to see that the canonical form of a normal matrix is given by

λ1. . .

λ1λ2

. . .

λ2. . .

λm. . .

λm

where the elements out of the diagonal are zero and each λi is repeated ni times (λi is ni−fold degenerate). It iseasily seen that the matrix representation of Pi in this orthonormal basis is

P1 =

(1n1×n1 0

0 0

); P2 =

0n1×n1 0 00 1n2×n2 00 0 0

; Pm =

(0 00 1nm×nm

)

and the matrix representation of the spectral decomposition becomes clear.

1.20.1. A qualitative discussion of the spectral theorem in infinite dimensional Hilbertspaces

The rigorous discussion of the infinite dimensional case for the spectral theorem is out of the scope of thissurvey. We shall only speak qualitatively about the difficulties that arises when we go to infinite dimension. Forsimplicity we assume that A is a self-adjoint operator, the spectral resolution is given by

A =

m∑

i=1

λiPi

since the eigenvalues are real we can order them in a natural way in the form λ1 < λ2 < .. < λm and we use theP ′i s to define new projections

Pλ0 = 0

Pλ1 = P1

Pλ2 = P1 + P2

....

Pλm = P1 + ...+ Pm = I

the spectral decomposition of the self-adjoint operator A can be written as

A = λ1P1 + λ2P2 + ...+ λmPm

= λ1 (Pλ1 − Pλ0) + λ2 (Pλ2 − Pλ1) + ...+ λm(Pλm − Pλm−1

)

A =m∑

i=1

λi(Pλi − Pλi−1

)

if we define∆Pλi ≡ Pλi − Pλi−1

Page 56: Mecanica Cuantica: Notas de Clase

56 CAPITULO 1. LINEAR OR VECTOR SPACES

we can rewrite the decomposition of A as

A =

m∑

i=1

λi∆Pλi

which suggest an integral representation

A =

∫λ dPλ (1.103)

in this form, the spectral decomposition of a self-adjoint operator is valid for infinite dimensional Hilbert spaces.For normal operators we have a similar pattern

N =

∫λ dPλ (1.104)

The first problem to carry out this generalization is that an operator on H need not have eigenvalues at all.In this general case the spectrum of T is defined as

σ (T ) = λ : T − λI is singular

when H is finite dimensional, σ (T ) consists entirely of eigenvalues. In the infinite dimensional case we only cansay that σ (T ) is non-empty, closed and bounded. Once this difficulty is overcome we should give a precise meaningto the integrals (1.103, 1.104) and prove the validity of those relations. We shall see later that an extension of thespectral theorem in its present form to infinite dimensions is obtained by using the concept of observable.

It worths emphasizing that the existence of eigenvalues in the finite dimensional case came from the fundamen-tal theorem of algebra, which in turn came from the fact that the characteristic equation of a finite dimensionalmatrix is a polynomial equation. An extension to infinite dimension clearly does not lead to a polynomial equation.

1.21. The concept of “hyperbasis”

Suppose that the vector space that concerns us is V , which is a proper subspace of a bigger vector space W .As any vector space, W has a basis wi that generates any vector in W by linear combinations. It is obvious thatany vector of V must be generated through linear combinations of wi. However, there are at least two reasonsfor which wi is not a basis for V (a) at least one element of the set wi is not in V , and one of the conditionsfor a given set S to be a basis of a given vector space V is that S ⊆ V . (b) given a basis vi of V we have thatwi and vi does not have in general the same cardinality, and we know that different bases must have the samecardinality.

Let us see a simple example: let us use an orthonormal basis of R3 given by

u1 ≡1√3(1, 1, 1) ; u2 ≡

1√26

(4,−1,−3) ; u3 =1√78

(−2, 7,−5)

to generate all vector of the XY plane. The coordinates of ui are written with respect to the ordinary cartesiancoordinates. Since these vectors generate R3 it is clear that they generate the XY plane which is a proper subsetof R3. Notwithstanding, none of the vectors ui lies in the XY plane, all the elements of this “hyperbasis” areoutside of the vector space we pretend to expand. Further, any basis of XY has two elements while our hyperbasishas three elements. Therefore, the cardinality of the hyperbasis is higher than the dimension of the space thatwe shall study. For our purposes however, what really matters is that any vector in XY can be generated as alinear combination of u1,u2,u3. For instance, the vector x of the XY plane represented by (3,−2, 0) in ordinary

Page 57: Mecanica Cuantica: Notas de Clase

1.22. DEFINITION OF AN OBSERVABLE 57

cartesian coordinates, is represented in this hyperbasis as

x = (u1,x)u1 + (u2,x)u2 + (u3,x)u3

=

[1√3(1, 1, 1) · (3,−2, 0)

]u1 +

[1√26

(4,−1,−3) · (3,−2, 0)

]u2 +

+

[1√78

(−2, 7,−5) · (3,−2, 0)

]u3

x =1√3u1 +

14√26

u2 −20√78

u3

note that in this case an element of the plane is given by a triple with respect to the hyperbasis, in this case

x =

(1√3,14√26,− 20√

78

)

in quantum mechanics we shall use a similar strategy but for orthogonal dimensions instead of dimensions. TheHilbert space L2 that concerns us is of infinite countable orthogonal dimension, but we shall use frequentlyorthogonal basis of a bigger space with infinite continuous orthogonal dimension. Therefore, we shall expand thevectors of L2 in terms of orthogonal hyperbases vx with continuous cardinality. In general, the elements vx ofthe bigger space will be outside of L2. However, as before a fourier expansion (instead of a linear combination)will be possible with this hyperbasis.

Notice that for any cardinality of the orthogonal dimension of a Hilbert space, we see that the Fourier expansionEq. (1.27) is always a series. This is by virtue of theorem 1.18 that says that the non-zero fourier coefficients ofany vector are always countable, even if the complete orthonormal set belongs to a higher cardinality. However,such a theorem is valid for complete orthonormal sets in which all the elements of the set lies in the space underconsideration. If we use a hyper orthonormal complete set the elements of this hyper orthogonal basis do not lieon the space that we are expanding, thus theorem 1.18 does not necessarily hold. Consequently, when continuoushyper orthonormal basis are used, we shall obtain integrals instead of series in our Fourier expansions. Does itmake any sense to replace series by integrals? it suffices to observe that it is in general easier to solve integrals ina closed form than series in a closed form.

1.22. Definition of an observable

Measurements in Physics are always real numbers. In quantum mechanics, such measurements are related witheigenvalues of some operators on a Hilber space. It is then natural to associate measurements with eigenvalues ofself-adjoint operators since their spectra are always real.

For any finite-dimensional Hilbert space it is always possible to form a complete orthonormal set with theeigenvectors of a normal operator, and in particular with the eigenvectors of a self-adjoint operator. However, ininfinite dimensional Hilbert spaces this is not necessarily the case. Therefore, we establish the following

Definition 1.31 A given self-adjoint operator A on H is called an observable, if there exists a complete ortho-normal set of eigenvectors of A.

The following sets of theorems are of central importance in quantum mechanics

Theorem 1.66 If two operators A and B commute and if x is an eigenvector of A, then Bx is also an eigenvectorof A with the same eigenvalue. If λ is non-degenerate x is also an eigenvector of B. If λ is n−fold degenerate, theeigensubspace Mλ is invariant under B.

Page 58: Mecanica Cuantica: Notas de Clase

58 CAPITULO 1. LINEAR OR VECTOR SPACES

Since x is an eigenvector of A we have

Ax = λx⇒ BAx = λBx⇒ ABx = λBx

where we have used the fact that A and B commutes, hence

A (Bx) = λ (Bx)

which proves that Bx is an eigenvector of A with eigenvalue λ. Observe that if λ is non-degenerate all its eigen-vectors are “colinear” hence Bx must be colinear with x i.e. Bx = cx and x is also an eigenvector of B.

On the other hand, if λ is n−fold degenerate, we can only say that Bx lies in the n dimensional eigensubspaceMλ of A. In other words, if x ∈Mλ then Bx ∈Mλ

Another way to express the previous theorem is

Theorem 1.67 If two operators A and B commute, every eigensubspace of A is invariant under B.

Of course, the roles of A and B can be interchanged.

Theorem 1.68 If two normal operators A and B commute, and if x1, x2 are two eigenvectors of A with differenteigenvalues, then (x1, Bx2) = 0.

By hypothesis we haveAx1 = λ1x1 ; Ax2 = λ2x2

but from theorem 1.66 Bx2 is an eigenvector of A with eigenvalue λ2. Now from theorem 1.61 since λ1 6= λ2 thenBx2 is orthogonal to x1 and the theorem is proved.

The previous theorems do not use the concept of observable6, but the following one does

Theorem 1.69 Let A and B be two observables in a Hilbert space H. Then A and B commute⇔one can constructa complete orthonormal set in H with eigenvectors common to A and B.

Assume that A and B commute, we shall define the normalized eigenvectors of A as uin

Auin = λnuin ; i = 1, .., gn

where gn is the degree of degeneration of λn. For n 6= n′ the eigenvectors are orthogonal and for n = n′ and i 6= i′

we can always orthonormalized the vectors in each eigensubspace of A, so that

(uin, u

jk

)= δnkδij

let us write H as a decomposition of the eigenspaces of A (taking into account that A is an observable)

H =M1 ⊕M2 ⊕M3 ⊕ ...

there are two cases. For each one dimensional Mk (each non-degenerate λk) all vectors in Mk are “colinear” andthey are also eigenvectors of B.

In the other case, gp > 1 then Mp is gp dimensional. We can only say that Mp is invariant under B. Considerthe restriction of A and B to the subspace Mp. Since the vectors uip in Mp are eigenvectors of A, the restriction

of A to Mp has a matrix representative A(p)ij of the form

A(p)ij =

(vip, Av

jp

)=(vip, λpv

jp

)= λp

(vip, v

jp

)= λpδij

6However, we assumed that the operators involved posses eigenvalues, and this fact cannot taken for granted in infinite dimensions.

Page 59: Mecanica Cuantica: Notas de Clase

1.23. COMPLETE SETS OF COMMUTING OBSERVABLES (C.S.C.O.) 59

thus the matrix representation of A(p) is λpI for any orthonormal set complete inMp (not neccesarily the original).Now let us see the matrix representative of the restriction B(p) of B on Mp, writing this representation in ouroriginal orthonormal set

B(p)ij =

(uip, Bu

jp

)

since B is a self-adjoint operator this matrix is self-adjoint, and according to theorem 1.65 they can always bediagonalized by a unitary transformation, which in turn means that there exists an orthonormal set

vipin Mp

for which the matrix representative of B(p) is diagonal, hence

B(p)ij =

(vip, Bv

jp

)= B

(p)i δij

which means that the new orthonormal set complete in Mp consists of eigenvectors of B

Bvip = B(p)i vip

and since Mp contains only eigenvectors of A, it is clear thatvipis an orthonormal set complete in Mp that

are common eigenvectors of A and B. Proceeding in this way with all eigensubspaces of A with more than onedimension, we obtain a complete orthonormal set in H in which the elements of the set are common eigenvectorsof A and B.

It is important to emphasize that for a given Mp the orthonormal set chosen a priori does not in general consistof eigenvectors of B, but it is always possible to obtain another orthonormal set that are eigenvectors of B andby definition they are also eigenvectors of A.

Now let us prove that if A and B are observables with a complete orthonormal set of common eigenvectorsthen they commute. Let us denote the complete orthonormal set of common eigenvectors as uin,p then

ABuin,p = bpAuin,p = anbpu

in,p

BAuin,p = anBuin,p = anbpu

in,p

therefore

[A,B] uin,p = 0

since uin,p form a complete orthonormal set, then [A,B] = 0.

It is also very simple to show that if A and B are commuting observables with eigenvalues an and bp and withcommon eigenvectors uin,p then

C = A+B

is also an observable with eigenvectors uin,p and eigenvalues cn,p = an + bp.

1.23. Complete sets of commuting observables (C.S.C.O.)

Consider an observable A and a complete orthonormal setuinof the Hilbert space that consists of eigenvectors

of A. If none of the eigenvalues of A are degenerate then the eigenvalues determine the eigenvectors in a uniqueway (within multiplicative constant factors). All the eigensubspaces Mi are one-dimensional and the completeorthonormal set is simply denoted by un. This means that there is only one complete orthonormal set (exceptfor multiplicative phase factors) associated with the eigenvectors of the observable A. We say that A constitutesby itself a C.S.C.O.

On the other hand, if some eigenvalues of A are degenerate, specifying an is not enough to determine acomplete orthonormal set for H because any orthonormal set in the eigensubspace Mn can be part of such acomplete orthonormal set. Thus the complete orthonormal set determined by the eigenvectors of A is not uniqueand it is not a C.S.C.O.

Page 60: Mecanica Cuantica: Notas de Clase

60 CAPITULO 1. LINEAR OR VECTOR SPACES

Now we add a second observable B that commutes with A, and construct a complete orthonormal set commonto A and B. By definition, A and B constitutes a C.S.C.O. if the complete orthonormal set common to both isunique (within constant phase factors for each of the vectors in the complete set). In other words, it means thatany pair of eigenvalues an, bp determines the associated common normalized eigenvector uniquely, except for aphase factor.

In theorem 1.69 we constructed the complete orthonormal set common to A and B by solving the eigenvalueequation of B within each eigensubspace defined by A. For A and B to constitute a C.S.C.O. it is necessary andsufficient that within each Mn the gn eigenvalues of B be distinct7. In this case, since all eigenvectors vin in each

Mn have the same eigenvalue an of A, they will be distinguished by the gn distinct eigenvalues b(n)i associated with

these eigenvectors of B. Note that it is not necessary that the eigenvalues of B be non-degenerate, we can havetwo (or more) equal eigenvalues of B associated with two (or more) distinct eigensubspaces Mn and Mk of A. Weonly require not to have degeneration of the eigenvalues of B within a given eigensubspace Mn of A. Indeed, if Bwere non-degenerate it would be a C.S.C.O. by itself.

On the other hand, if for at least one pair an, bp there exist two or more linearly independent eigenvectorscommon to A and B they are not a C.S.C.O.. Let us add a third observable C that commutes with both A andB, and proceeds as above. When to the pair an, bp corresponds only one eigenvector common to A and B, thenit is automatically an eigenvector of C as well. On the contrary, if the eigensubspace Mn,p is gn,p dimensional,we can construct within it, an orthonormal set of eigenvectors of C. Proceeding in this way with each Mn,p wecan construct a complete orthonormal set with eigenvectors common to A,B,C. These three observables are aC.S.C.O. if this complete orthonormal set is unique (except for multiplicative phase factors). Once again, if Mn,p

has the eigenvectors uin,p common to A and B this occurs if and only if all gn,p eigenvalues of C denoted as c(n,p)k are

distinct. As before, C can be degenerate, but as long as degenerate eigenvalues are not repeated within a singleeigenspace Mn,p of A and B. Therefore, a given triple of eigenvalues an, bp, ck of A,B,C has a unique commoneigenvector within a multiplicative factor. If two or more linearly independent eigenvectors common to A,B,Ccan be constructed for a given set an, bp, ck, we can add a fourth observable D that commute with those threeoperators and so on.

Definition 1.32 A set of observables A,B,C, .. is called a complete set of commuting observables (C.S.C.O.)if (i) All observables commute pairwise, (ii) specifying the set of eigenvalues an, bp, ck, .. of the observablesdetermines a unique (within phase factors) complete orthonormal set of eigenvectors common to all the observables.

An equivalent form is the following

Definition 1.33 A set of observables A,B,C, .. is called a complete set of commuting observables (C.S.C.O.)if there is a unique complete orthonormal set (within phase factors) of common eigenvectors.

It is obvious that if a given set is a C.S.C.O. we can add any observable that commutes with the observablesof the set and the new set is also a C.S.C.O. However, for most of our purposes we shall be interested in “minimalC.S.C.O.” in the sense that by removing any observable of the set, the new set is not complete.

If a given set A1, .., An of observables is a C.S.C.O., an eigenvector associated with a set ak1 , .., akn determinesa unique common normal eigenvector (within a phase factor) so it is natural to denote the vector as uak1 ,ak2 ,akn .We shall see later that in quantum mechanics a global phase has no Physical information. Therefore, all normalvectors associated with ak1 , .., akn have the same Physical information, this fact enhance the qualification of“unique” for these vectors, although they are not unique from the mathematical point of view.

7IfMn is one dimensional then an eigenvector of A inMn is automatically an eigenvector of B and it is clearly uniquely determined,except for multiplicative factors. Only the case in which Mn has more than one dimension is non-trivial.

Page 61: Mecanica Cuantica: Notas de Clase

1.24. SOME TERMINOLOGY CONCERNING QUANTUM MECHANICS 61

1.24. Some terminology concerning quantum mechanics

We have defined linear combinations as finite sums. A basis in a vector space is thus a set of linearly indepen-dent vectors for which any vector of the space can be written as a finite sum of elements of the basis (multipliedby the appropiate scalars). Notably, bases always exist even in an infinite-dimensional vector space. However, inpractice it is not easy to find a basis in an infinite dimensional Hilbert space. In this case, it is more usual toutilize complete orthonormal sets, they make a work similar to basis in the sense that they generate any vector,but the difference is that complete orthonormal sets expand a vector in a series (Fourier expansion) while basesdo it in finite sums.

In quantum mechanics we call a basis to mean a complete orthonormal set, and the series expansionis usually call a linear combination. Since we never use basis in the mathematical sense, there is no confusionwith this terminology. Self-adjoint operators are usually called hermitian operators. The conjugate space H∗

of H is usually call the dual space of H. The vectors in our Hilbert space are called kets, while the correpondingelements in the dual space (the functionals) are called bras.

In addition the Hilbert space we work with, is a separable space so that its dimension is countable (countablyinfinite). We shall resort however to some hyperbases which are of continuous cardinality, the elements of thesehyperbases do not belong to our Hilbert space. Consequently, the elements of the hyperbasis will not be physicalstates, but we shall call them continuous basis. Nevertheless, they will be very useful for practical calculations.

In addition there will be a change of notation to facilitate the mathematical calculations, it is called Diracnotation

1.25. The Hilbert Space L2

We shall see later that the information of a quantum particle is described by a function of the space and timedenoted as ψ (r, t) and called the wave function. The quantity, |ψ (r, t)|2 dx dy dz will be interpreted as theprobability of finding at time t, the particle in a volume dx dy dz. Since the particle must be somewhere in thespace, we must demand that the integral over the whole volume must be equal to unity

∫dV |ψ (r, t)|2 = 1

the integration extends over all space. However, in certain cases we could assume that the particle is in a givenconfined volume and the integral will be restricted to such a volume.

The discussion above leads to the fact that the space of Physical states of one particle should be described bya square-integrable wave function. The state space is then the Hilbert space L2 of the square-integrable functionsin a given volume. For a system of several particles we will have a space with similar features, but by now we willconcentrate on the space that describes a single particle.

For several reasons we cannot specified in general the state space of a particle. First of all, several physicalconsiderations can lead us to the fact that the particl is confined to a certain bounded volume. For instance,in one dimension it is not the same the space of functions that are square integrable in the whole real line, as(say) the space of functions that are square integrable in a bounded interval. In other words, different regions ofsquare integrability leads us to different L2 spaces. On the other hand, it is usual to demand as well as squareintegrability, that the functions accomplish additional features of regularity. For example, to be defined all alongthe interval, or to be continuous, derivable, etc. The specific conditions depend on the particular context, andthey are required to define the state space completely.

For example, it has no physical meaning to have a function that is discontinuous at a given point since noexperiment can measure a real phenomenon at scales below certain threshold. We could then be tempted to saythat we must demand the functions to be continuous. However, this is not necessarily the case since some non-physical functions could help us to figure out what is happening. Let us take some familiar examples in classicalmechanics, it is usual in electrostatics to assume the presence of a surface charge, which leads to a discontinuity

Page 62: Mecanica Cuantica: Notas de Clase

62 CAPITULO 1. LINEAR OR VECTOR SPACES

in the electric field, in the real world a charge is distributed in a very thin but finite layer and the discontinuityis replaced by a very slopy curve. Indeed, a surface charge is equivalent to an infinite volume density, but wehave seen that this assumption provides a simple picture of many electrostatic phenomena though it is not a realphysical state. Classical waves represented by a single plane wave in optics are other good examples, since it isnot possible to have a real wave being totally monochromatic (a physical state is always a superposition of severalplane waves), but many of the wave phenomena are easier to study with these non physical states, and indeedmany real physical phenomena such as the laws of geometric optics are predicted by using them.

In summary, depending on our purposes (and attitudes) we could demand to have only physical states orto decide to study some non-physical ones that are obtain when some physical parameters are settle at extremevalues. Quantum mechanics is not the exception for this strategy, and our assumptions on the functions to workwith, affects the definition of the Hilbert space of states that we should use as a framework.

Hence, given the volume V in which the particle can stay, we say that our space of states is a subspace of theHilbert space L2 of the square integrable functions in the volume V . We denote by the subspace of states inwhich ⊆ L2. For this subspace to be a Hilbert space, it must be closed (for completeness to be maintained).

1.25.1. The wave function space

According to the discussion above, we only can say that our wave function space that describe our physicalstates is a closed subspace of L2 for a volume determined by our physical conditions. What really matters is to besure whether the additional conditions imposed to our functions keeps as a closed vector space. For instance,if we assume continuity and/or derivability, it is easy to show that a finite linear combination preserves theseconditions. Less evident is to ensure that a series preserves these conditions (for the subspace to be closed in L2),but we are not be concern with this problem here, neither we shall discuss the aspects concerning the completenessof L2. We then limite ourselves to determine the vector space character of L2. Let ψ1, ψ2 ∈ L2, we show that

ψ (r) = λ1ψ1 (r) + λ2ψ2 (r)

is a square integrable function. For this, we expand |ψ (r)|2

|ψ (r)|2 = |λ1|2 |ψ1 (r)|2 + |λ2|2 |ψ2 (r)|2 + λ∗1λ2ψ∗1 (r)ψ2 (r) + λ1λ

∗2ψ1 (r)ψ

∗2 (r)

now for the last two terms we have

|λ∗1λ2ψ∗1 (r)ψ2 (r)| = |λ1λ∗2ψ1 (r)ψ

∗2 (r)| ≤ |λ1| |λ2|

[|ψ1 (r)|2 + |ψ2 (r)|2

]

hence|ψ (r)|2 ≤ |λ1|2 |ψ1 (r)|2 + |λ2|2 |ψ2 (r)|2 + 2 |λ1| |λ2|

[|ψ1 (r)|2 + |ψ2 (r)|2

]

and the integral of each of the functions on the right-hand side converges. Then the integral∫

|ψ (r)|2 dV

converges. So ψ is a square integrable function.The scalar product will be defined as

(ϕ,ψ) =

∫dV ϕ∗ (r)ψ (r)

it can be shown that this integral always converges if ϕ and ψ belong to L2. We should check that this definitionaccomplishes the properties of an inner product, the properties arise directly from the definition

(ϕ, λ1ψ1 + λ2ψ2) = λ1 (ϕ,ψ1) + λ2 (ϕ,ψ2) ; (λ1ϕ1 + λ2ϕ2, ψ) = λ∗1 (ϕ1, ψ) + λ∗2 (ϕ2, ψ)

(ϕ,ψ) = (ψ,ϕ)∗ ; (ψ,ψ) ≡ ‖ψ‖2 ≥ 0 and (ψ,ψ) = 0 ⇔ ψ = 0

Page 63: Mecanica Cuantica: Notas de Clase

1.26. DISCRETE ORTHONORMAL BASIS 63

let us mention some important linear oprators on functions ψ (r) ∈ .The parity opeartor defined as

Πψ (x, y, z) = ψ (−x,−y,−z)the product operator X defined as

Xψ (x, y, z) = xψ (x, y, z)

and the differentiation operator with respect to x denoted as Dx

Dxψ (x, y, z) =∂ψ (x, y, z)

∂x

it is important to notice that the operators X and Dx acting on a function ψ (r) ∈ , can transform it into afunction that is not square integrable. Thus it is not an operator of into nor onto . However, the non-physicalstates obtained are frequently useful for practical calculations.

The commutator of the product and differentiation operator is of central importance in quantum mechanics

[X,Dx]ψ (r) =

(x∂

∂x− ∂

∂xx

)ψ (r) = x

∂xψ (r)− ∂

∂x[xψ (r)]

= x∂

∂xψ (r)− x

∂xψ (r)− ψ (r)

[X,Dx]ψ (r) = −ψ (r) ∀ψ (r) ∈

therefore[X,Dx] = −I (1.105)

1.26. Discrete orthonormal basis

The Hilbert space L2 (and thus ) has a countable infinite dimension, so that any authentic basis of mustbe infinite but discrete. A discrete orthonormal basis ui (r) with ui (r) ∈ should follows the rules given insection 1.9.1. Thus orthonormality is characterized by

(ui, uj) =

∫d3r u∗i (r) uj (r) = δij

the expansion of any wave function (vector) of this space is given by the Fourier expansion described by Eq. (1.27)

ψ (r) =∑

i

ciui (r) ; ci = (ui, ψ) =

∫d3r u∗i (r) ψ (r) (1.106)

using the terminology for finite dimensional spaces we call the series a linear combination and ci are the componentsor coordinates, which correspond to the Fourier coefficients. Such coordinates provide the representation of ψ (r)in the basis ui (r). It is very important to emphasize that the expansion of a given ψ (r) must be unique forui to be a basis, in this case this is guranteen by the form of the Fourier coefficients.

Now if the Fourier expansion of two wave functions are

ϕ (r) =∑

j

bjuj (r) ; ψ (r) =∑

i

ciui (r)

The scalar product and the norm can be expressed in terms of the components or coordinates of the vectorsaccording with Eqs. (1.65, 1.66)

(ϕ,ψ) =∑

i

b∗i ci ; (ψ,ψ) =∑

i

|ci|2 (1.107)

and the matrix representation of an operator T in a given orthonormal basis ui is obtained from Eq. (1.69)

Tij ≡ (ui, Tuj)

Page 64: Mecanica Cuantica: Notas de Clase

64 CAPITULO 1. LINEAR OR VECTOR SPACES

1.26.1. Funcion delta de Dirac

Como veremos a continuacion la funcion delta de Dirac es un excelente instrumento para expresar el hechode que un conjunto ortonormal dado sea completo. Tambien es util para convertir densidades puntuales, linealesy superficiales, en densidades volumetricas equivalentes. Es importante enfatizar que la funcion delta de Diracmas que una funcion es una distribucion. En el lenguaje del analisis funcional, es una uno-forma que actua enespacios vectoriales de funciones, asignandole a cada elemento del espacio, un numero real de la siguiente forma:Sea V el espacio vectorial de las funciones definidas en el dominio (b, c) con ciertas propiedades de continuidad,derivabilidad, integrabilidad, etc. La distribucion delta de Dirac es un mapeo que asigna a cada elemento f (x) deV un numero real con el siguiente algoritmo8

∫ c

bf (x) δ (x− a) dx =

f (a) si a ∈ (b, c)0 si a /∈ [b, c]

mencionaremos incidentalmente que con esta distribucion es posible escribir una densidad de carga (o masa)puntual (ubicada en r0) como una densidad volumetrica equivalente

ρ (r) = qδ(r′ − r0

)(1.108)

esta densidad reproduce adecuadamente tanto la carga total como el potencial y el campo que genera, una vezque se hagan las integrales apropiadas.

Hay varias sucesiones de distribuciones que convergen a la funcion Delta de Dirac, una de las mas utilizadases la sucesion definida por

fn (x− a) =n√πe−n

2(x−a)2 (1.109)

se puede demostrar que al tomar el lımite cuando n→ ∞ se reproduce la definicion y todas las propiedades basicasde la distribucion delta de Dirac. Notese que todas las distribuciones gaussianas contenidas en esta sucesion tienenarea unidad y estan centradas en a. De otra parte, a medida que aumenta n las campanas gaussianas se vuelvenmas agudas y mas altas a fin de conservar el area, para valores n suficientemente altos, el area se concentra enuna vecindad cada vez mas pequena alrededor de a. En el lımite cuando n→ ∞, toda el area se concentra en unintervalo arbitrariamente pequeno alrededor de a.

Algunas propiedades basicas son las siguientes:

1.∫∞−∞ δ (x− a) dx = 1

2.∫∞−∞ f (x) ∇δ (r− r0) dV = − ∇f |r=r0

3. δ (ax) = 1|a|δ (x)

4. δ (r− r0) = δ (r0 − r)

5. xδ (x) = 0

6. δ(x2 − e2

)= 1

2|e| [δ (x+ e) + δ (x− e)]

Vale enfatizar que debido a su naturaleza de distribucion, la funcion delta de Dirac no tiene sentido por sı sola,sino unicamente dentro de una integral. Por ejemplo cuando decimos que δ (ax) = 1

|a|δ (x), no estamos hablando

8Es usual definir la “funcion” delta de Dirac como δ (r) =

∞ si r = 00 si r 6= 0

y∫δ (x) dx = 1. Esta definicion se basa en una

concepcion erronea de la distribucion delta de Dirac como una funcion. A pesar de ello, hablaremos de ahora en adelante de la funciondelta de Dirac para estar acorde con la literatura.

Page 65: Mecanica Cuantica: Notas de Clase

1.27. CLOSURE RELATIONS 65

de una coincidencia numerica entre ambos miembros, sino de una identidad que se debe aplicar al espacio vectorialde funciones en que estemos trabajando, es decir

∫ c

bf (x) δ (ax) dx =

∫ c

bf (x)

1

|a|δ (x) dx ∀ f (x) ∈ V y ∀ a ∈ R

Estrictamente, el mapeo tambien se puede hacer sobre los numeros complejos con propiedades analogas. En estemismo espıritu, es necesario aclarar que la densidad volumetrica equivalente de una carga puntual (y todas lasdensidades equivalentes que se pueden formar con la delta) es realmente una distribucion. Por ejemplo, la densidaddescrita por (1.108), solo tiene realmente sentido dentro de integrales que generan la carga total, el potencial o elcampo. Las densidades ordinarias son funciones, pero las densidades equivalentes son distribuciones. En sıntesis, loque se construye con la densidad volumetrica equivalente es una distribucion que me produzca el mapeo adecuadopara reproducir la carga total, el potencial y el campo.

En mas de una dimension la delta se convierte simplemente en productos de deltas unidimensionales, lapropiedad

∫δ(n) (x) dnx = 1, aplicada a n dimensiones, nos dice que la delta no es adimensional, sus dimensiones

son de x−n.De momento, el uso que le daremos a la delta estara relacionado con la completez del sistema orthonormal

que usemos. Notese que en dimension finita la completez se comprueba simplemente asegurandonos de tener igualnumero de vectores linealmente independientes que la dimension del espacio. En espacios de dimension infinitaen cambio podrıamos tener un conjunto infinito contable que no fuera completo y que se vuelve completo alagregarle otro conjunto finito o infinito contable, pues en tal caso la cardinalidad no cambia. En dimension infinitaun conjunto ortonormal puede tener la cardinalidad de la dimension ortogonal del espacio y sin embargo no sercompleto. Es por esto que la prueba de completez es particularmente importante.

1.27. Closure relations

Naturalmente, para que todo vector arbitrario ψ (r) de sea expandible en los vectores unitarios linealmenteindependientes ui (r), es necesario que el conjunto que define la base sea completo, la condicion de completezpuede obtenerse reemplazando los coeficientes de Fourier cn en la expansion de ψ (r)

ψ (r) =∑

n

cnun (r) =∑

n

(un, ψ) un (r) =∑

n

∫ B

A

u∗n(r′)ψ(r′)un (r) d

3r′

ψ (r) =

∫ B

A

ψ(r′)[∑

n

u∗n(r′)un (r)

]d3r′

donde la integral con lımites A y B significa una integral triple de volumen. Por otro lado

ψ (r) =

∫ B

A

ψ(r′)δ(r− r′

)d3r′

Igualando las dos ultimas expresiones, y teniendo en cuenta que ψ (r′) es arbitraria se obtiene

n

u∗n(r′)un (r) = δ

(r− r′

)(1.110)

retrocediendo en nuestros pasos vemos que la relacion anterior nos garantiza que cualquier funcion arbitrariadentro del espacio se puede expandir en terminos del conjunto un (r). A su vez vemos que la expansion parauna base ordenada dada un (r) es unica, lo cual se obtiene gracias a la independencia lineal del conjunto. Portanto a la Ec. (1.110), se le conoce como relacion de completez.

We shall study several complete sets that consequently accomplish property (1.110). The proof of completenessof these sets is however out of the scope of this manuscript.

Page 66: Mecanica Cuantica: Notas de Clase

66 CAPITULO 1. LINEAR OR VECTOR SPACES

1.28. Introduction of hyperbases

In the case of discrete basis each element ui (r) is square integrable and thus belong to L2 and in general to

as well. As explained before, it is sometimes convenient to use some hyperbases in which the elements of the basisdo not belong to either L2 or , but in terms of which a function in can be expanded, the hyperbasis u (k, r)will have in general a continuous cardinality with k denoting the continuous index that labels each vector in thehyperbasis. According to our previous discussions the Fourier expansions made with this hyperbasis are not seriesbut integrals, these integrals will be called continuous linear combinations.

1.29. Closure relation with hyperbases

In the hyperbasis u (k, r), k is a continuous index defined in a given interval [c, d]. Such an index makesthe role of the index n in discrete bases. We shall see that a consistent way of expressing orthonormality for thiscontinuous basis is9

(uk, uk′) =

∫ B

A

u∗ (k, r) u(k′, r

)d3r = δ

(k − k′

)(1.111)

we show it by reproducing the results obtained with discrete bases. Expanding an arbitrary function ψ (r) of ourHilbert space as a continuous linear combination of the basis gives

ψ (r) =

∫ d

cc (k) u (k, r) dk

then we have

(uk′ , ψ) =

(uk′ ,

∫ d

cc (k) u (k, r) dk

)=

∫ d

cc (k) (uk′ , uk) dk

=

∫ d

cc (k) δ

(k − k′

)dk = c

(k′)

from which the fourier coefficients of the continuous expansion are evaluated as

c(k′)= (uk′ , ψ) (1.112)

when the Fourier coefficients are associated with continuous linear combinations (integrals) they are usually calledFourier transforms. In this case, a vector is represented as a continuous set of coordinates or components, wherethe components or coordinates are precisely the Fourier transforms.

Therefore, in terms of the inner product, the calculation of the Fourier coefficients in a continuous basis(Fourier transforms) given by Eq. (1.112) coincides with the calculation of them with discrete bases Eq. (1.106).Eq. (1.112) in turn guarantees that the expansion for a given ordered continuous bases is unique10. Those factsin turn depends strongly on our definition of orthonormality in the continuous regime Eq. (1.111) showing theconsistency of such a definition. After all, we should remember that hyperbases are constructed as useful toolsand not as physical states, in that sense we should not expect a “truly orthonormality relation” between them11.

9From now on we shall say continuous bases, on the understanding that they are indeed hyperbases.10Remember that for a given set of vectors to constitute a basis, it is important not only to be able to expand any vector with

the elements of the set, it is also necessary for the expansion of each vector to be unique. In normal basis (not hyperbasis) this isguaranteed by the linear independence, in our continuous set it is guranteed by our definition of orthonormality in such a set.

11It is clear for example that with r = r′ the “orthonormality” relation diverge, so it is not a normalization in the mathematicalsense.

Page 67: Mecanica Cuantica: Notas de Clase

1.30. INNER PRODUCT AND NORM IN TERMS OF A HYPERBASIS 67

Let us see the closure relation

ψ (r) =

∫ d

cc (k) u (k, r) dk =

∫ d

c(uk, ψ) u (k, r) dk

ψ (r) =

∫ d

c

[∫ B

A

u∗(k, r′

)ψ(r′)d3r′

]u (k, r) dk

ψ (r) =

∫ B

A

[∫ d

cu∗(k, r′

)u (k, r) dk

]ψ(r′)d3r′

on the other hand

ψ (r) =

∫ B

A

δ(r− r′

)ψ(r′)d3r′

from which we find ∫ d

cu∗(k, r′

)u (k, r) dk = δ

(r− r′

)(1.113)

which defines us the closure relation for a continuous basis u (k, r).From the discussion above, the closure relations for discrete or continuous basis can be interpreted as “re-

presentations” of the Dirac delta function. Similar situation occurs with the orthonormality relation but only forcontinuous bases.

It worths emphasizing at this point that a given representation of the delta in a given space cannot beapplied to another space. For example, it is possible to have a r−dimensional vector space of functions V1 witha basis vn (r), that defines a closure relation

∑rn=1 v

∗n (r

′) vn (r) = δ1 (r− r′), let us think about another r + kdimensional vector space denoted by V2 and such that V2 ⊃ V1, such that a basis um of V2 includes the previousbasis plus other linearly independent vectors; the closure relation is:

∑r+kn=1 u

∗n (r

′) un (r) = δ2 (r− r′). What is thedifference between δ1 (r− r′) and δ2 (r− r′)?, the answer lies in the distribution nature of the badly called Diracdelta function; the fundamental property of this distribution tells us that for all functions ψ (r′) that belongsto V1 we have that

ψ (r) =

∫ B

A

ψ(r′)[∑

n

v∗n(r′)vn (r)

]d3r′ =

∫ B

A

ψ(r′)δ1(r− r′

)d3r′

however, if the function ψ (r) does not belong to V1 but it belongs to V2 then δ1 (r− r′) is not an adequatedistribution to represent this function. This is a general property of the distributions, since they are defined solelyby means of the way in which they map the functions of a specific vector space into the scalars. A representationof the Dirac delta (and in general of any distribution) is linked to a very specific vector space of functions.

1.30. Inner product and norm in terms of the components of a vector in ahyperbases

Let us take two vectors ϕ and ψ that belong to . Both can be expressed as continuous linear combinationsof a continuous basis uk

ψ (r) =

∫ d

cdk u (k, r) c (k) ; ϕ (r) =

∫ d

cdk′ u

(k′, r

)b(k′)

now the idea is to write the scalar product of them in terms of the continuous set of components of each vectori.e. in terms of their Fourier transforms c (k) and b (k′). The scalar product is

(ϕ,ψ) =

∫ B

A

d3r ϕ∗ (r) ψ (r) =

∫ d

cdk′

∫ d

cdk b∗

(k′)c (k)

∫ B

A

d3r u∗(k′, r

)u (k, r)

Page 68: Mecanica Cuantica: Notas de Clase

68 CAPITULO 1. LINEAR OR VECTOR SPACES

now using the orthonormality relation Eq. (1.111) we have

(ϕ,ψ) =

∫ B

A

d3r ϕ∗ (r) ψ (r) =

∫ d

cdk′

∫ d

cdk b∗

(k′)c (k) δ

(k − k′

)

(ϕ,ψ) =

∫ d

cdk b∗ (k) c (k) (1.114)

the norm is obtained simply by taking ϕ = ψ then

(ψ,ψ) = ‖ψ‖2 =∫ d

cdk |c (k)|2 (1.115)

Eqs. (1.114, 1.115) are clearly the continuous analogs of Eq. (1.107) for discrete basis.In summary, the basic relations obtained in discrete bases (inner products, norms, fourier coefficients, ortho-

normality, completeness etc.) possses the same structure in continuous bases but with the following replacements

i(discrete) ↔ k(continuous) ,∑

i

↔∫dk , δij ↔ δ

(k − k′

)

1.31. Some specific continuous bases

1.31.1. Plane waves

We shall use a continuous basis represented by the set

zeip·r/~

; z ≡

(1

2π~

)3/2

where p is the continuous index that labels the different vectors of the basis. Indeed, p represents three continuousindices px, py, pz. By now ~ is simply a mathematical constant, but it will become highly relevant in Physics. Weconsider the space of square integrable functions over the whole space, all integrals are undestood to be tripleintegrals. The continuous linear combination of a given square integrable function is given by

ψ (r) =

(1

2π~

)3/2 ∫ ∞

−∞d3p ψ (p) eip·r/~

it is clear thatψ (p)

provides the continuous set of coordinates of the vector ψ (r) under our continuous basis.

They are thus the Fourier transforms of ψ (r) with respect to the basis of plane waves. It is useful to define

vp (r) ≡ zeip·r/~ (1.116)

from which the fourier transforms can be calculated by Eq. (1.112)

c (k) = (uk, ψ) ⇒ ψ (p) = (vp, ψ) =

(1

2π~

)3/2 ∫ ∞

−∞d3r e−ip·r/~ ψ (r)

the basic relation in Fourier analysis1

(2π)3

∫ ∞

−∞d3k eik·u = δ3 (u) (1.117)

can be used by assigning k → zp and u → (r− r′) to show that

∫ ∞

−∞d3p v∗p

(r′)vp (r) =

1

(2π~)3

∫ ∞

−∞d3p ei

p

~(r−r′) = δ3

(r− r′

)(1.118)

Page 69: Mecanica Cuantica: Notas de Clase

1.31. SOME SPECIFIC CONTINUOUS BASES 69

by comparing it with Eq. (1.113), we see that (1.118) expresses the completeness relation for the continuous basisvp in the space of functions that are square-integrable in the whole physical space. The orthonormality relationcan also be obtained from the property (1.117) but with the assignments k → zr and u → p− p′

(vp, vp′

)=

1

(2π~)3

∫ ∞

−∞d3r e−i

r~(p−p′) = δ3

(p′ − p

)= δ3

(p− p′) (1.119)

by using p = p′ in Eq. (1.119) it is clear that ‖vp‖2 = (vp, vp) is divergent. Thus, the plane waves are not square-integrable in the whole space. Therefore, the elements of this continuous basis do not belong to the Hilbert spaceunder study.

1.31.2. “Delta functions”

We shall use a continuous basis of “highly improper” functions defined by

ξr0 (r) ≡ δ (r− r0) (1.120)

ξr0 (r) represents the set of delta functions centered at each of the points r0 of the whole space. These functionsare not square-integrable so ξr0 (r) /∈ . Nevertheless, the following relations are valid for functions that belongto

ψ (r) =

∫d3r0 ψ (r0) δ (r− r0)

ψ (r0) =

∫d3r ψ (r) δ (r0 − r)

rewritten them appropiately we have

ψ (r) =

∫d3r0 ψ (r0) ξr0 (r) (1.121)

ψ (r0) =

∫d3r ξ∗r0 (r) ψ (r) = (ξr0 , ψ) (1.122)

Eq. (1.121) gives ψ (r) ∈ as a continuous linear combination of the set ξr0, where ψ (r0) are the fouriertransforms. On the other hand, (1.122) indicates that the fourier transforms are evaluated as usual.

By using the properties of the Dirac delta function, it is possible to prove that the set ξr0 accomplishesorthonormality and completeness relations

(ξr0 , ξr′0

)=

∫d3r δ (r− r0) δ

(r− r′0

)= δ

(r0 − r′0

)

and ∫d3r0 ξ

∗r0

(r′)ξr0 (r) =

∫d3r0 δ

(r′ − r0

)δ (r− r0) = δ

(r− r′

)

note that the non-physical functions that constitute a continuous basis can usually be seen as limits in which oneor more parameters of a physically realizable state are taken at extreme (non-physical) values.

As an example the Dirac function can be taken as the limit of gaussians given by Eq. (1.109)

fn (x− a) =n√πe−n

2(x−a)2

for each value of n these functions are square integrable, continuous, and derivable, they could describe a physicalsystem. Notwithstanding, by taking n → ∞, the functions are no longer square-integrable and lose all propertiesof well-behavior.

Concerning plane waves, physical states (in both classical and quantummechanics) consists of a superposition ofplane waves with a finite width spectrum of frecuencies ∆ν, by taking the limit ∆ν → 0 we obtain a monochromatic(non-physical) wave, corresponding to a single plane wave.

Page 70: Mecanica Cuantica: Notas de Clase

70 CAPITULO 1. LINEAR OR VECTOR SPACES

1.32. Tensor products of vector spaces, definition and properties

Let V1 and V2 be two vector spaces of dimension n1 and n2. Vectors and operators on each of them will bedenoted by labels (1) and (2) respectively.

Definition 1.34 The vector space V is called the tensor product of V1 and V2

V ≡ V1 ⊗ V2

if there is associated with each pair of vectors x (1) ∈ V1 and y (2) ∈ V2 a vector in V denoted by x (1)⊗y (2) andcalled the tensor product of x (1) and y (2), and in which this correspondence satisfies the following conditions:(a) It is linear with respect to multiplication by a scalar

[αx (1)]⊗ y (2) = α [x (1)⊗ y (2)] ; x (1)⊗ [βy (2)] = β [x (1)⊗ y (2)] (1.123)

(b) It is distributive with respect to addition

[x (1) + x′ (1)

]⊗ y (2) = x (1)⊗ y (2) + x′ (1)⊗ y (2)

x (1)⊗[y (2) + y′ (2)

]= x (1)⊗ y (2) + x (1)⊗ y′ (2) (1.124)

(c) When a basis is chosen in each space, say ui (1) in V1 and vj (2) in V2, the set of vectors ui (1) ⊗ vj (2)constitutes a basis in V . If n1 and n2 are finite, the dimension of the tensor product space V is n1n2.

An arbitrary couple of vectors x (1), y (2) can be written in terms of the bases ui (1) and vj (2) respectively,in the form

x (1) =∑

i

aiui (1) ; y (2) =∑

j

bjvj (2)

Using Eqs. (1.123, 1.124) we see that the expansion of the tensor product is given by

x (1)⊗ y (2) =∑

i

j

aibjui (1)⊗ vj (2)

so that the components of the tensor product of two vectors are the products of the components of the two vectors ofthe product. It is clear that the tensor product is commutative i.e. V1⊗V2 = V2⊗V1 and x (1)⊗y (2) = y (2)⊗x (1)

On the other hand, it is important to emphasize that there exist in V some vectors that cannot be writtenas tensor products of a vector in V1 with a vector in V2. Nevertheless, since ui (1)⊗ vj (2) is a basis in V anyvector in V can be expanded in it

ψ =∑

i

j

cijui (1)⊗ vj (2) (1.125)

in other words, given a set of n1n2 coefficients of the form cij it is not always possible to write them as productsof the form aibj of n1 numbers ai and n2 numbers bj, we cannot find always a couple of vectors in V1 and V2 suchthat ψ = x (1)⊗ y (2).

1.32.1. Scalar products in tensor product spaces

If there are inner products defined in the spaces V1 and V2 we can define an inner product in the tensor productspace V . For a couple of vectors in V of the form x (1)⊗ y (2) the inner product can be written as

(x′ (1)⊗ y′ (2) ,x (1)⊗ y (2)

)=(x′ (1) ,x (1)

)(1)

(y′ (2) ,y (2)

)(2)

Page 71: Mecanica Cuantica: Notas de Clase

1.32. TENSOR PRODUCTS OF VECTOR SPACES, DEFINITION AND PROPERTIES 71

where the symbols (, )(1) and (, )(2) denote the inner product of each of the spaces of the product. From this, we cansee that if the bases ui (1) and vj (2) are orthonormal in V1 and V2 respectively, then the basis ui (1)⊗ vj (2)also is

(ui (1)⊗ vj (2) ,uk (1)⊗ vm (2)) = (ui (1) ,uk (1))(1) (vj (2) ,vm (2))(2) = δikδjm

Now, for an arbitrary vector in V , we use the expansion (1.125) and the basic properties of the inner product

(ψ, φ) =

i

j

cijui (1)⊗ vj (2) ,∑

k

m

bkmuk (1)⊗ vm (2)

=∑

i,j

c∗ij∑

k,m

bkm (ui (1)⊗ vj (2) , uk (1)⊗ vm (2)) =∑

i,j

c∗ij∑

k,m

bkmδikδjm

(ψ, φ) =∑

i,j

c∗ijbij

it is easy to show that with these definitions the new product accomplishes the axioms of an inner product.

1.32.2. Tensor product of operators

Consider a linear transformation A (1) defined in V1, we associate with it a linear operator A (1) acting on Vas follows: when A (1) is applied to a tensor of the type x (1)⊗ y (2) we define

A (1) [x (1)⊗ y (2)] = [A (1)x (1)]⊗ y (2)

when the operator is applied to an arbitrary vector in V , this definition is easily extended because of the linearityof the transformation

A (1)ψ = A (1)∑

i

j

cijui (1)⊗ vj (2) =∑

i

j

cijA (1) [ui (1)⊗ vj (2)]

A (1)ψ =∑

i

j

cij [A (1)ui (1)]⊗ vj (2) (1.126)

the extension B (2) of a linear transformation in V2 is obtained in a similar way

B (2)ψ =∑

i

j

cijui (1)⊗ [B (2)vj (2)]

finally, if we consider two operators A (1) , B (2) defined in V1 and V2 respectively, we can define their tensorproduct A (1)⊗B (2) as

[A (1)⊗B (2)]ψ =∑

i

j

cij [A (1)ui (1)]⊗ [B (2)vj (2)] (1.127)

it is easy to show that A (1) ⊗ B (2) is also a linear operator. From Eqs. (1.126, 1.127) we can realize that theextension of the operator A (1) on V1 to an operator A (1) on V can be seen as the tensor product of A (1) withthe identity operator I (2) on V2. A similar situation occurs with the extension B (2)

A (1) = A (1)⊗ I (2) ; B (2) = I (1)⊗B (2) (1.128)

Now let us put the operators A (1)⊗B (2) and A (1) B (2) to act on an arbitrary element of a basis ui (1)⊗ vj (2)of V

[A (1)⊗B (2)]ui (1)⊗ vj (2) = [A (1)ui (1)]⊗ [B (2)vj (2)][A (1) B (2)

]ui (1)⊗ vj (2) = A (1) ui (1)⊗ [B (2)vj (2)] = [A (1)ui (1)]⊗ [B (2)vj (2)]

Page 72: Mecanica Cuantica: Notas de Clase

72 CAPITULO 1. LINEAR OR VECTOR SPACES

therefore, the tensor product A (1) ⊗B (2) coincides with the ordinary product of two operators A (1) and B (2)on V

A (1)⊗B (2) = A (1) B (2)

additionally, it can be shown that operators of the form A (1) and B (2) commute in V . To see it, we put theirproducts in both orders to act on an arbitrary vector of a basis ui (1)⊗ vj (2) of V

[A (1) B (2)

]ui (1)⊗ vj (2) = A (1) ui (1)⊗ [B (2)vj (2)] = [A (1)ui (1)]⊗ [B (2)vj (2)]

[B (2) A (1)

]ui (1)⊗ vj (2) = B (2) [A (1)ui (1)]⊗ vj (2) = [A (1)ui (1)]⊗ [B (2)vj (2)]

therefore we have [A (1) , B (2)

]= 0 or A (1)⊗B (2) = B (2)⊗A (1)

an important special case of linear operators are the projectors, as any other linear operator, the projector in V isthe tensor product of the projectors in V1 and V2. Let M1 and N1 be the range and null space of a projector inV1 and M2, N2 the range and null space of a projector in V2

V1 = M1 ⊕N1 ; x (1) = xM (1) + xN (1) ; xM (1) ∈M1, xN (1) ∈ N1 ; P1 (x (1)) = xM (1)

V2 = M2 ⊕N2 ; y (2) = yM (2) + yN (2) ; yM (2) ∈M2, yN (2) ∈ N2 ; P2 (y (2)) = yM (2)

(P1 ⊗ P2) (x (1)⊗ y (2)) = [P1x (1)]⊗ [P2y (2)] = xM (1)⊗ yM (2)

for an arbitrary vector we have

(P1 ⊗ P2)ψ = (P1 ⊗ P2)∑

i

j

cijui (1)⊗ vj (2) =∑

i

j

cij [P1ui (1)]⊗ [P2vj (2)]

(P1 ⊗ P2)ψ =∑

i

j

cijui,M (1)⊗ vj,M (2)

finally, as in the case of vectors, there exists some operators on V that cannot be written as tensor products ofthe form A (1)⊗B (2).

1.32.3. The eigenvalue problem in tensor product spaces

Let us assume that we have solved the eigenvalue problem for an operator A (1) of V1. We want to seek forinformation concerning the eigenvalue problem for the extension of this operator to the tensor product space V .For simplicity, we shall assume a discrete spectrum

A (1)xin (1) = anxin (1) ; i = 1, 2, . . . , gn ; xin (1) ∈ V1

where gn is the degeneration associated with an. We want to solve the eigenvalue problem for the extension ofthis operator in V = V1 ⊗ V2

A (1)ψ = λψ ; ψ ∈ V1 ⊗ V2

from the definition of such an extension, we see that a vector of the form xin (1) ⊗ y (2) for any y (2) ∈ V2 is aneigenvector of A (1) with eigenvalue an

A (1)[xin (1)⊗ y (2)

]=

[A (1)xin (1)

]⊗ y (2) = anx

in (1)⊗ y (2) ⇒

A (1)[xin (1)⊗ y (2)

]= an

[xin (1)⊗ y (2)

]

Page 73: Mecanica Cuantica: Notas de Clase

1.32. TENSOR PRODUCTS OF VECTOR SPACES, DEFINITION AND PROPERTIES 73

it is natural to ask whether any eigenvector of A (1) can be generated in this way. We shall see that it is true ifA (1) is an observable in V1. Assuming it, the set of orthonormal eigenvectors

xin (1)

forms a basis in V1. If we

now take an orthonormal basis ym (2) in V2, then the set of vectors

ψi,mn

≡xin (1)⊗ ym (2)

forms an orthonormal basis in V . It is clear that the setψi,mn

consists of eigenvectors of A (1) with eigenvalues

an, and since they are a basis, a complete orthonormal set of eigenvectors of A (1) have been generated with theprocedure explained above. This in turn means that if A (1) is an observable in V1, its extension A (1) is also anobservable in V . Further, the spectrum of A (1) coincides with the spectrum of A (1). Notwithstanding, it worthsto say that if N2 is the dimension of V2, if an is gn−fold degenerate in V1, it will be gn ·N2−degenerate in V . This isbecause for a given eigenvector xin (1) in V1, there are N2 eigenvectors ψi,mn ≡ xin (1)⊗ym (2) since m = 1, . . . , N2.

We know that each eigenvalue an of A (1) in V1 defines an eigensubspace V1,an in V1 with gn dimension. Thecorresponding eigensubspace generated by an in V is a N2 · gn subspace Van . The projector onto V1,an is writtenby

V1 = V1,an ⊕ V ⊥1,an ; x (1) = xan (1) + x⊥

an (1) ; xan (1) ∈ V1,an , x⊥an (1) ∈ V ⊥

1,an

P an1 (x (1)) = xan (1)

and its extension to V is defined as

P an1 ≡ P an1 ⊗ I2 ; P an1 ψi,mn ≡ P an1[xin (1)⊗ ym (2)

]=[P an1 xin (1)

]⊗ ym (2)

P an1 ψi,mn = xan (1)⊗ ym (2)

Now assume that we have a sum of operators of both spaces

C = A (1) + B (2)

where A (1) and B (2) are observables in their corresponding spaces, with the following eigenvalues and eigenvectors

A (1)xin (1) = anxin (1) ; i = 1, 2, . . . , gn ; xin (1) ∈ V1

B (2)ykm (2) = bmykm (2) ; k = 1, 2, . . . , hm ; ykm (2) ∈ V2

we have seen that A (1) and B (2) commute, so they should have a commom basis of eigenvectors in V . This basisis precisely, the tensor product of their eigenvectors

A (1)[xin (1)⊗ ykm (2)

]= an

[xin (1)⊗ ykm (2)

]

B (2)[xin (1)⊗ ykm (2)

]= bm

[xin (1)⊗ ykm (2)

]

and they are also eigenvectors of C = A (1) + B (2)

[A (1) + B (2)

] [xin (1)⊗ ykm (2)

]= (an + bm)

[xin (1)⊗ ykm (2)

]

C[xin (1)⊗ ykm (2)

]= cnm

[xin (1)⊗ ykm (2)

]; cnm = an + bm

So that if C = A (1) + B (2) the eigenvalues of C are the sums of the eigenvalues of A (1) and B (2). Besides, wecan form a basis of eigenvectors of C by taking the tensor product of the basis of A (1) and B (2).

It is important to emphasize that even if an and bm are non-degenerate, it is posible that cnm be dege-nerate. Assume that an and bm are non-degenerate, and for a given cnm let us define all the sets of pairs

Page 74: Mecanica Cuantica: Notas de Clase

74 CAPITULO 1. LINEAR OR VECTOR SPACES

(nj,mj) : j = 1, . . . , q such that anj + bmj = cnm. In that case, the eigenvalue cnm is q−fold degenerate, andevery eigenvector corresponding to this eigenvalue can be written as

q∑

j=1

cj[xnj (1)⊗ ymj (2)

]

in this case there are eigenvectors of C that are not tensor products.

1.32.4. Complete sets of commuting observables in tensor product spaces

For simplicity assume that A (1) forms a C.S.C.O. by itself in V1, while B (2) , C (2) constitute a C.S.C.O.in V2. We shall show that by gathering the operators of the C.S.C.O. in V1 with the operators of C.S.C.O. in V2,we form a C.S.C.O. in V with their corresponding extensions.

Since A (1) is a C.S.C.O. in V1, all its eigenvalues are non-degenerate in V1

A (1)xn (1) = anx (1)

the ket x (1) is then unique within a constant factor. In V2 the set of two operators B (2) , C (2) defines commomeigenvectors ymp (2) that are unique in V2 within constant factors

B (2)ymp (2) = bmymp (2) ; C (2)ymp (2) = cpymp (2)

In V , the eigenvalues are N2−fold degenerate. Similarly, there are N1 linearly independent eigenvectors of B (2)and C (2) associated with two given eigenvalues of the form (bm, cp). However, the eigenvectors that are common

to the three commuting observables A (1) , B (2) , C (2) are unique within constant factors

A (1) [xn (1)⊗ ymp (2)] = an [x (1)⊗ ymp (2)]

B (2) [xn (1)⊗ ymp (2)] = bm [x (1)⊗ ymp (2)]

C (2) [xn (1)⊗ ymp (2)] = cp [x (1)⊗ ymp (2)]

since xn (1) and ymp (2) were bases in V1 and V2, we see that xn (1)⊗ ymp (2) is a basis in V constituted

by commom eigenvectors of the three operators. Thus the setA (1) , B (2) , C (2)

is a C.S.C.O. in V .

1.33. Restrictions of an operator to a subspace

It is useful in many applications to be able to restrict an operator to a certain subspace Vq of a given vectorspace V . Let us assume

V = V1 ⊕ . . .⊕ Vq ⊕ . . .

x = x1 + . . .+ xq + . . . ; xi ∈ Vi

Projectors, which are the natural operators to “restrict” a vector by extracting the components that are ortho-normal to a given subspace, will be also the natural operators to rectrict operators. Let Pq be the projector ontoa subspace Vq. A priori, we could think in defining a restriction by “restricting the vector” in which the operatorwill act on. This is done by substracting all components orthogonal to the subspace Vq by applying a projection,and then let the operator A act on this projection so we have

A = APq ⇒ Ax = APqx = Axq

Page 75: Mecanica Cuantica: Notas de Clase

1.34. FUNCTIONS OF OPERATORS 75

in this case we have restricted the domain of A appropriately, but once the operator A is applied, the image couldbe outside of the subspace too. Hence, the projector must be applied again after the application of A in order torestrict the image appropriately. We then define the restriction A of the operator A to the subspace Vq as

Aq ≡ PqA = PqAPq (1.129)

so that both the domain and the range are restricted to Vq. It can be easily checked that the matrix representation

of Aq is reduced to a submatrix in the Vq space. Let qk be the dimension of Vq. Let us use an ordered basis suchthat the first qk terms expand Vq. Using such a basis we have

(Aq

)ij

=(ui, Aquj

)= (ui, PqAPquj) = (Pqui, APquj)

(Pqui, APquj) =

(ui, Auj) if i, j ≤ qk

0 if i > qk and/or j > qk

observe that the submatrix associated with i, j ≤ qk (i.e. associated with the Vq subspace), remains the same withrespect to the non-restricted matrix. But the elements outside of such a submatrix are zeros, showing that thenew operator only acts in Vq.

It is important to emphasize that the restriction Aq of an operator A differs from A itself, because we arechanging the mapping. In the special case in which the subspace Vq is invariant under A, the range of A isautomatically restricted into Vq when the domain is restricted to Vq. Thus in that case the restriction can bedefined with only one projector operator

Aq ≡ APq

so when Vq is invariant under A the mapping described by Aq is identical to the mapping described by A whensuch mappings are restricted to the domain Vq.

1.34. Functions of operators

Let A be an arbitrary operator. The operator An with n being a non-negative integer is easily defined as

A0 ≡ I , An = AA · · ·A (n times)

similarly for negative integers a consistent definition is

A−n ≡(A−1

)nwith AA−1 = A−1A = I

it is useful to define functions of operators. Assume that a function F can be expanded in certain domain in thefollowing way

F (z) =∞∑

n=0

fnzn (1.130)

by definition, the function F (A) of the operator A corresponds to an expansion of the form (1.130) with the samecoefficients fn

F (A) =

∞∑

n=0

fnAn (1.131)

for instance, the function eA of the operator A reads

eA =

∞∑

n=0

An

n!= I +A+

A2

2!+A3

3!+ . . .

Page 76: Mecanica Cuantica: Notas de Clase

76 CAPITULO 1. LINEAR OR VECTOR SPACES

the convergence of series of the type (1.131) depends on the eigenvalues of A and the radius of convergence of thefunction (1.130). We shall not treat this topic in detail.

If F (z) is a real function the coefficients fn are real. On the other hand, if A is hermitian then F (A) also is,as can be seen from (1.131). Owing to the analogy between real numbers and hermitian operators this relation isquite expected. Now, assume that xi,k is an eigenvector of A with eigenvalue ai we then have

Axi,k = aixi,k ⇒ Anxi,k = ani xi,k

and applying the eigenvector in Eq. (1.131) we find

F (A)xi,k =∞∑

n=0

fnani xi,k = xi,k

∞∑

n=0

fnani

F (A)xi,k = F (ai)xi,k

so that if xi,k is an eigenvector of A with eigenvalue ai, then xi,k is also eigenvector of F (A) with eigenvalueF (ai).

On the other hand, if the operator is diagonalizable (this is the case for observables), we can find a basis inwhich the matrix representative of A is diagonal with the eigenvalues ai in the diagonal. In such a basis, theoperator F (A) has also a diagonal representation with elements F (ai) in the diagonal. For example let σz be anoperator that in certain basis has the matrix representation

σz =

(1 00 −1

)

in the same basis we have

eσz =

(e1 00 e−1

)=

(e 00 1/e

)

if A and B do not commute, we have that in general the operators F (A) and F (B) do not commute either. Forinstance

eAeB =

∞∑

n=0

An

n!

∞∑

m=0

Bm

m!=

∞∑

n=0

∞∑

m=0

An

n!

Bm

m!(1.132)

eBeA =∞∑

m=0

Bm

m!

∞∑

n=0

An

n!=

∞∑

m=0

∞∑

n=0

Bm

m!

An

n!(1.133)

eA+B =

∞∑

n=0

(A+B)n

n!(1.134)

these three expressions are in general different from each other unless [A,B] = 0. We see by direct inspectionof Eqs. (1.132, 1.133, 1.134) that if A and B commute, then F (A) and F (B) also do. Notice that when A,Bcommute they can be diagonalized simultaneously and so F (A) and F (B), which is another way to see that if[A,B] = 0 then [F (A) , F (B)] = 0.

1.34.1. Some commutators involving functions of operators

Theorem 1.70 Suppose we have two operators A and B such that B commutes with their commutator, that is

[B,C] = 0 ; C ≡ [A,B] (1.135)

if F (B) is a function of the operator B then we have

[A,F (B)] = [A,B]F ′ (B) (1.136)

Page 77: Mecanica Cuantica: Notas de Clase

1.35. DIFFERENTIATION OF OPERATORS 77

where F ′ (B) is the derivative of F (B) “with respect to B” defined as

F (B) =

∞∑

n=0

fnBn ⇒ F ′ (B) ≡

∞∑

n=0

nfnBn−1 (1.137)

Proof : The commutator [A,F (B)] is given by

[A,F (B)] =

[A,

∞∑

n=0

fnBn

]=

∞∑

n=0

fn [A,Bn] (1.138)

we show by induction that[A,Bn] = [A,B]nBn−1 (1.139)

for n = 0 we have Bn = I and both sides clearly vanish. Now let us assume that it works for n and show that itis satisfied by n+ 1. Applying Eq. (1.41), and taking into account Eqs. (1.139, 1.135) we have

[A,Bn+1

]= [A,BBn] = [A,B]Bn +B [A,Bn] = [A,B]BBn−1 +B [A,B]nBn−1

= CBBn−1 +BCnBn−1 = CBn + nCBBn−1 = C (n+ 1)Bn

[A,Bn+1

]= [A,B] (n+ 1)Bn

which shows the validity of Eq. (1.139). Replacing Eq. (1.139) in Eq. (1.138), we find

[A,F (B)] = [A,B]∞∑

n=0

fnnBn−1 = [A,B]F ′ (B)

Corollary 1.71 It is straightforward to show that if both operators commute with their commutator we see thatequations

[A,F (B)] = [A,B]F ′ (B) ; [G (A) , B] = [A,B]G′ (B) (1.140)

are satisfied simultaneously. A very important case in Physics occurs when [A,B] = αI. In that case, we have

[A,B] = αI ⇒ [A,F (B)] = αF ′ (B) ; [G (A) , B] = αG′ (B) (1.141)

1.35. Differentiation of operators

Let A (z) an operator that depends on the arbitrary variable z. We define the derivative of A (z) with respectto z as

dA

dz= lım

∆z→0

A (z +∆z)−A (z)

∆z(1.142)

provided that this limit exists. Operating A on an arbitrary vector x and using a basis ui independent of z, wehave

A (z) x = A (z)xiui = xiA (z)ui = xiujAji (z) (1.143)

since dA/dz is another operator, it makes sense to talk about its matrix representation

dA (z)

dzx =

dA (z)

dzxiui = xi

dA (z)

dzui = xiuj

(dA (z)

dz

)

ji

(1.144)

Applying the derivative on both extremes of Eq. (1.143), and taking into account that the basis ui is independentof z, we have

d

dzA (z) x = xiuj

dAji (z)

dz(1.145)

Page 78: Mecanica Cuantica: Notas de Clase

78 CAPITULO 1. LINEAR OR VECTOR SPACES

comparing Eqs. (1.144, 1.145) we obtain (dA (z)

dz

)

ji

=dAji (z)

dz

so the matrix representative of the derivative of A is obtained by taking the derivative of each of its elements12.The differentiation rules are similar to the ones in ordinary calculus

d

dz(F +G) =

dF

dz+dG

dz;

d

dz(FG) =

dF

dtG+ F

dG

dt(1.146)

except that care must be taken with the order of appearance for the operators involved. Let us examine the secondof this equations, applying FG to an arbitrary vector x and using a basis ui we have

(FG) x = xiuj (FG)ji

taking the derivative on both sides we have

(d (FG)

dz

)

ji

=d

dz(FG)ji =

d

dz[FjkGki] =

[(d

dzFjk

)Gki + Fjk

(d

dzGki

)]

=

[(dF

dz

)

jk

Gki + Fjk

(dG

dz

)

ki

]

in matrix form we see thatd (FG)

dz=dF

dzG+ F

dG

dz

since there is a one-to-one isomorphism from the operators onto the matrices, we see that this relation is also validfor the operators.

1.35.1. Some useful formulas

Applying the derivation rules we can develop some identities for functions of operators. Let us calculate thederivative of the operator eAt. By definition we have

eAt =

∞∑

n=0

(At)n

n!

differentiating the series term by term we have

d

dteAt =

∞∑

n=0

ntn−1An

n!= 0 +

∞∑

n=1

ntn−1An

n!= A

∞∑

n=1

(At)n−1

(n− 1)!

d

dteAt = A

[ ∞∑

k=0

(At)k

k!

]=

[ ∞∑

k=0

(At)k

k!

]A

where we have used the assignment k = n− 1. The series in the brackets is eAt once again, so we have

d

dteAt = AeAt = eAtA (1.147)

12Care must be taken to distinguish between the derivative in Eq. (1.137) and the derivative in Eq. (1.142). In Eq. (1.137) thederivative is taken with respect to B as the “variable of derivation”. On the other hand, in Eq. (1.142) the variable to derive with, isa parameter z from which our matrix depend on.

Page 79: Mecanica Cuantica: Notas de Clase

1.36. STATE SPACE AND DIRAC NOTATION 79

in this case eAt and A commutes because only one operator is involved. Suppose that we want to differentiateeAteBt. Applying Eqs. (1.146, 1.147) we have

d

dt

[eAteBt

]=d(eAt)

dteBt + eAt

d(eBt)

dt= AeAteBt + eAtBeBt

the operator A can pass over eAt if desired but not over eBt unless that A and B commute. Similarly, B can passover eBt but not over eAt.

However, even if a single operator appears we should be careful with the order sometimes. For instance, if A (t)is an arbitrary function of time then

d

dteA(t) 6= dA

dteA(t) (1.148)

it could be checked that A (t) and dA (t) /dt must commute with each other for the equality to be valid.Consider again two operators that commute with their commutator, we shall show that

[A, [A,B]] = [B, [A,B]] = 0 ⇒ eAeB = eA+Be12[A,B] (Glauber′s formula) (1.149)

let define F (t) with t real as

F (t) ≡ eAteBt ;dF (t)

dt= AeAteBt + eAtBeBt = A

(eAteBt

)+ eAtBe−At

(eAteBt

)

dF (t)

dt=

[A+ eAtBe−At

]F (t) (1.150)

since A,B commute with their commutator, we can apply Eq. (1.140), so that

[eAt, B

]= t [A,B] eAt ⇒ eAtB = BeAt + t [A,B] eAt

⇒ eAtBe−At = B + t [A,B]

substituting this expression in Eq. (1.150) we get

dF (t)

dt= A+B + t [A,B]F (t) (1.151)

by hypothesis, A+B commutes with [A,B], so that the differential equation (1.151) can be integrated as if A+Band [A,B] were numbers

F (t) = F (0) e(A+B)t+ 12[A,B]t2

setting t = 0 we see that F (0) = I, thus we obtain

F (t) = e(A+B)t+ 12[A,B]t2

setting t = 1 and taking into account again that A +B commutes with [A,B], we obtain (1.149). It is necessaryto emphasize that this equation is valid only if A and B commutes with [A,B].

1.36. State space and Dirac notation

We have defined the space of Physical states as the one constituted by functions ψ (r) square-integrablein a given volume. The space with these characteristics is denoted by L2, but since in general with add somerequirements to these functions, we actually work in a subspace ⊆ L2. On the other hand, we have seen thatseveral bases can be constructed to represent those functions. Therefore, the Physical system will be describedby either the functions ψ (r) or by the sete of its coordinates in a given representation. When the representation

Page 80: Mecanica Cuantica: Notas de Clase

80 CAPITULO 1. LINEAR OR VECTOR SPACES

is discrete we have a numerable set of coordinates (Fourier coefficients) while in the case of continuous bases,the set of coordinates is continuous as well (Fourier transforms). In particular, the continuous basis denoted asξr0 (r) shows that the function ψ (r) can be considered as a coordiante system as well, because in this basis, eachcoordinate is defined as ψ (r0) i.e. the value of ψ at each fixed point r0 of the volume13.

We have now a situation similar to the one obtained in R3, we can define a vector by a triple of coordinates inany basis defined by a set of coordinate axes. However, vectors in R3 can be defined geometrically (intrinsically),and its algebra can be performed in a coordinate-free form.

In the same way, we wish to define our state vector in a coordinate free (or intrinsic) way. The abstract spaceof state vectors of a particle is denoted as Er which should be isometrically isomorphic with . We should alsodefine the notation and algebra on the Er space.

Though we initially start with Er as identical to , we shall see that it permits a generalization of the formalismwhen the states in do not contain all the Physical information of the system, as is the case when spin degrees offreedom are introduced in the formalism. Hence, the algebra that we shall develop now will be valid when thesegeneralizations are carried out. In developing this algebra we are going to present the Dirac notation which isuseful in practical calculations

1.37. Dirac notation

We are going to establish a one-to-one correspondence between the states of and the states of Er, thoughthe latter will be extended later. Thus to every square-integrable function ψ (r) in we make to correspond anabstract vector in Er in the form

ψ (r) ↔ |ψ〉an abstract vector in the notation |ψ〉 will be called a ket. Notice that no r−dependence appears in |ψ〉. Indeed,ψ (r) is interpreted in this framework as a representation of |ψ〉 in which each ψ (r) is a coordinate in the basisgiven by ξr (r

′). Therefore, r plays the role of index (three continuous indices) for the particular basis used.The space of states of a particle in one dimension is denoted as Ex, while in three dimensions is Er.

1.37.1. Elements of the dual or conjugate space E∗r

In section 1.9.2 we defined a one-to-one correspondence between vectors (kets) of a Hilbert space and functionals(bras) in the conjugate (dual) space in the following way (see Eqs. 1.29, 1.30)

|ψ〉 ↔ f|ψ〉 ; f|ψ〉 (|ϕ〉) ≡ (|ψ〉 , |ϕ〉)

Dirac notation designates f|ψ〉 as 〈ψ| which is called a bra. The correspondence above and the inner product willbe written as

|ψ〉 ∈ Er ↔ 〈ψ| ∈ E∗r ; 〈ψ| (|ϕ〉) ≡ (|ψ〉 , |ϕ〉)

it induces a natural notation for the inner product

((|ψ〉 , |ϕ〉)) ≡ 〈ψ|ϕ〉

this is also called a bracket (i.e. the union of a bra with a ket). Let us now write the properties developed insection 1.9.2 Eq. (1.31), with this new notation

fα|ψ〉+β|ϕ〉 = α∗f|ψ〉 + β∗f|ϕ〉α |ψ〉+ β |ϕ〉 ∈ Er ↔ α∗ 〈ψ|+ β∗ 〈ϕ| ∈ E∗

r

13Notice that this is a simple way of defining an scalar field. A scalar field is completely delimited by defining its value at each pointof the space in which the field is defined (at a given time). In this case the number of coordinates is cleraly the number of points inour space.

Page 81: Mecanica Cuantica: Notas de Clase

1.37. DIRAC NOTATION 81

which is consistent with the properties of the inner product

(α |ψ〉+ β |ϕ〉 , |χ〉) = (α∗ 〈ψ|+ β∗ 〈ϕ|) |χ〉 ⇒〈αψ + βϕ|χ〉 = α∗ 〈ψ|χ〉+ β∗ 〈ϕ|χ〉

since the functionals (bras) are linear by definition, a linear combination of kets gives

f|ψ〉 (α |ϕ〉+ β |χ〉) ≡ αf|ψ〉 (|ϕ〉) + βf|ψ〉 (|χ〉)

in Dirac notation it reads

〈ψ|αϕ+ βχ〉 = α 〈ψ|ϕ〉+ β 〈ψ|χ〉from these facts it is clear that for any scalar α

|αψ〉 = α |ψ〉 ; 〈αψ| = α∗ 〈ψ| (1.152)

now since

(|ψ〉 , |ϕ〉) = (|ϕ〉 , |ψ〉)∗ ⇒〈ψ|ϕ〉 = 〈ϕ|ψ〉∗

1.37.2. The correspondence between bras and kets with hyperbases

We have seen that hyperbases are sets of elements from which any element of the space can be expanded despitethose elements do not belong to the space under study. On the other, hand we have seen that the correspondencebetween vectors and functionals (kets and bras) is one-to-one and onto. However, when hyperbases are used weshall see that some linear functionals (bras) can be well-defined while there is not a well-defined correspondingvector (ket)

Assume for example that we have a ket in given by a sufficiently regular function ξ(ε)x0 (x) such that

∫ ∞

−∞dx ξ(ε)x0 (x) = 1

with the form of a peak of height ∼ 1/ε and width ∼ ε centered at x = x0. If ε 6= 0 then∣∣∣ξ(ε)x0

⟩∈ Ex. Let

⟨ξ(ε)x0

∣∣∣ ∈ E∗x

be its associated bra. The idea is to have a function that conveeges to the Dirac delta function when ε → 0. Foreach |ψ〉 ∈ Ex we have that

〈ξ(ε)x0 |ψ〉 =(ξ(ε)x0 , ψ

)=

∫ ∞

−∞dx ξ(ε)x0 (x) ψ (x) (1.153)

now we let ε to approach zero, and we find that

lımε→0

ξ(ε)x0 /∈ x

since the square of its norm tend to 1/ε and diverges. Nevertheless, in the limit ε → 0 the expression (1.153) is

still well-defined, so that⟨ξ(ε)x0

∣∣∣ is still associated with a functional that can be applied to any element of the state

space, we shall denote this bra as 〈ξx0 | and this functional associates with each vector |ψ〉 ∈ Ex the value ψ (x0)taken on by the associated wave function in x at the point x0

lımε→0

⟨ξ(ε)x0

∣∣∣ = 〈ξx0 | ∈ E∗x if |ψ〉 ∈ Ex ⇒ 〈ξx0 |ψ〉 = ψ (x0)

then the bra 〈ξx0 | ∈ E∗x exists but there is not a ket associated with it in the hyperbasis.

Page 82: Mecanica Cuantica: Notas de Clase

82 CAPITULO 1. LINEAR OR VECTOR SPACES

This dissymetry is associated with the use of a hyperbasis. The elements of the hyperbasis do not belongto x and so has no elements associated in Ex either. However, the inner product of it with any element of x

is well-defined and it permits to associate a bra belonging to E∗x. Indeed, by the theory of Hilbert spaces the

corresponding ket must exists, what really happens is that we cannot construct it as an element of our hyperbasis,this is perfectly undestandable since such elements are out of our Hilbert space.

Notice that we have indeed extended the concept of inner product and we have applied it to elements out ofour Hilbert space. For practical reasons it is usual to associate the bras 〈ξx0 | ∈ E∗

x to the “generalized ket” |ξx0〉that are not physical states but are advantageous from the practical point of view.

Another example is the continuous basis consisting of plane waves truncated outside an interval of width L

v(L)p0 (x) =1√2π~

eip0x/~ ; −L2≤ x ≤ L

2

with the function v(L)p0 (x) going rapidly to zero outside of that interval, but keeping continuity and differentiability.

The ket associated is denoted as∣∣∣v(L)p0

v(L)p0 (x) ∈ x ↔∣∣∣v(L)p0

⟩∈ Ex

the square of the norm is ∼ L/2π~, diverges if L→ ∞. Therefore

lımL→∞

∣∣∣v(L)p0

⟩/∈ Ex

now we consider the limit of the bra⟨v(L)p0

∣∣∣ associated with∣∣∣v(L)p0

⟩and applied to an arbitrary vector |ψ〉 ∈ Ex

⟨v(L)p0

∣∣∣ψ〉 =(v(L)p0 , ψ

)≃ 1√

2π~

∫ L/2

−L/2dx e−ip0x/~

in the limit L → ∞ we find ψ (p0) i.e. the Fourier transform of ψ (x) evaluated at p = p0. From which we see thatthe inner product converges and is well-defined

lımL→∞

⟨v(L)p0

∣∣∣ ≡ 〈vp0 | ∈ E∗x

but it does not correspond to the ket associated with the limit of kets of the form∣∣∣v(L)p0

⟩.

We could take the results above with the following point of view, the ket |ξx0〉 means the ket given by∣∣∣ξ(ε)x0

with ε much smaller than any other length involved in the problem, so we are really working in Ex. The resultsobtained at the end depends very little on ε as long as it is much smaller than any other length in the problem.

Certainly,∣∣∣ξ(ε)x0

⟩does not form an orthonormal basis, and do not satisfy a closure realtion with ε 6= 0, but it

aproaches the orthonormality and closure conditions as ε becomes very small.The introduction of generalized kets, will ensure that we balance bras and kets in the limits concerned

above. Generalized kets do not have finite norm, but they can acquire a finite inner product with kets of our spaceof states.

1.38. The action of linear operators in Dirac notation

Linear operators are characterized easily in Dirac notation

∣∣ψ′⟩ = A |ψ〉 ; |ψ〉 ,∣∣ψ′⟩ ∈ Ex

A (α |ψ〉+ β |ϕ〉) = αA |ψ〉 + βA |ϕ〉

Page 83: Mecanica Cuantica: Notas de Clase

1.38. THE ACTION OF LINEAR OPERATORS IN DIRAC NOTATION 83

the product of operators writesAB |ψ〉 = A (B |ψ〉)

it is also important to calculate the inner product between |ϕ〉 and |ψ′〉 = A |ψ〉 in the form

(|ϕ〉 ,

∣∣ψ′⟩) = (|ϕ〉 , A |ψ〉) = 〈ϕ| (A |ψ〉)

this is usually denoted simply as〈ϕ| (A |ψ〉) ≡ 〈ϕ|A |ψ〉

1.38.1. Projectors

The simplest of all projectors are the ones in which the range are one dimensional subspaces of the Hilbertspace. Let |ψ〉 be the one dimensional space spanned by the single non-zero ket |ψ〉. The projector P|ψ〉 takesan arbitrary ket |ϕ〉 ∈ Ex and maps it into |ψ〉 i.e.

P|ψ〉 |ϕ〉 = α |ψ〉 ; α ≡ 〈ψ|ϕ〉

in Dirac notation it could be written as

P|ψ〉 ≡ |ψ〉 〈ψ| ; P|ψ〉 |ϕ〉 = (|ψ〉 〈ψ|) |ϕ〉 = |ψ〉 〈ψ|ϕ〉 = α |ψ〉 (1.154)

the most important property of a projector is the idempotence so that

P 2|ψ〉 ≡ (|ψ〉 〈ψ|) (|ψ〉 〈ψ|) = |ψ〉 〈ψ|ψ〉 〈ψ| = P|ψ〉

⇒ 〈ψ|ψ〉 = 1

so the definition of P|ψ〉 Eq. (1.154) as a projector is consistent only if |ψ〉 is normalized.Now we can write the projector onto a subspace of more than one dimension. If nj is the dimension of the

subspace M(nj)j ⊆ Ex we can define the projector from a complete orthonormal set

∣∣uij⟩

; i = 1, .., nj (1.155)

that spans such a subspace

Ex = M(n1)1 ⊕ . . . ⊕M

(nj)j ⊕ . . .

x = x1 + . . . + xj + . . .

x =

n1∑

i=1

α(1)i ui1 + . . .+

nj∑

i=1

α(j)i uij + . . .

α(n)k ≡

(ukn, x

)

PMjx = xj =

nj∑

i=1

α(j)i uij

PMjx =

nj∑

i=1

(uij , x

)uij

in Dirac notation it is

PMj |x〉 =nj∑

i=1

〈uij |x〉∣∣uij⟩=

nj∑

i=1

(∣∣uij⟩ ⟨uij∣∣) |x〉

Page 84: Mecanica Cuantica: Notas de Clase

84 CAPITULO 1. LINEAR OR VECTOR SPACES

thus a direct notation for the projector is

PMj ≡nj∑

i=1

∣∣uij⟩ ⟨uij∣∣ (1.156)

it is clear that this is a projector as long as Eq. (1.155) defines an orthonormal set that spans M(nj)j of dimension

nj.

P 2Mj

=

( nj∑

i=1

∣∣uij⟩ ⟨uij∣∣)( nj∑

k=1

∣∣∣ukj⟩⟨

ukj

∣∣∣)

=

nj∑

i=1

nj∑

k=1

∣∣uij⟩〈uij∣∣∣ukj⟩⟨

ukj

∣∣∣

P 2Mj

=

nj∑

i=1

nj∑

k=1

∣∣uij⟩δik

⟨ukj

∣∣∣ =nj∑

i=1

∣∣uij⟩ ⟨uij∣∣ = PMj

If we have an observable A, its spectrum of eigenvectors forms a basis and we can construct a complete orthonormalset. In that case, the spectral theorem (assuming it can be extended to infinite dimension for observables) says thatthe identity and the observable A itself can be decomposed by means of the projectors built on each eigensubspaceof the observable, if Mi is the eigensubspace generated by the eigenvalue λi of A we have that

Ex = M1 ⊕ . . . ⊕Mi ⊕ . . .

x = x1 + . . .+ xi + . . .

Pix = xi

in Dirac notation we have

Pi =

ni∑

j=1

∣∣∣uji⟩⟨

uji

∣∣∣

the spectral theorem says that

∞∑

i=1

Pi =∞∑

i=1

ni∑

j=1

∣∣∣uji⟩⟨

uji

∣∣∣ = I (1.157)

∞∑

i=1

λiPi =

∞∑

i=1

ni∑

j=1

λi

∣∣∣uji⟩⟨

uji

∣∣∣ = A (1.158)

these forms will be applied frequently in quantum mechanics. Notice that Eq. (1.157) is valid if and only ifuji

is a complete orthonormal set. Thus the decomposition of the identity in projectors is usually taken as the closurerelation for the basis (or hyperbasis) in which we are working.

It is also usual to work with a more general type of projector of the form

P = |ψ〉 〈ϕ| (1.159)

applying an arbitrary vector on it we find

|ψ〉 〈ϕ|χ〉 = α |ψ〉 ;α ≡ 〈ϕ|χ〉

this is a projector on the one dimensional subspace |ψ〉. This operator is idempotent only if 〈ϕ| is normal,however it defines a non-orthogonal projection, since we shall see later that this operator is not self-adjoint orhermitian.

Page 85: Mecanica Cuantica: Notas de Clase

1.39. HERMITIAN CONJUGATION 85

1.39. Hermitian conjugation

We have defined the action of a linear operator on a ket. We see that it induces a natural action of the operatoron the bra

f|ϕ〉 (A |ψ〉) = (|ϕ〉 , A |ψ〉) ≡ gA|ϕ〉 (|ψ〉) ∀ |ψ〉 ∈ Ex (1.160)

the definition of the new functional gA|ϕ〉 from a given f|ϕ〉 and a given A is written in Dirac notation as14

f|ϕ〉 ≡ 〈ϕ| A→ gA|ϕ〉 ≡ 〈ϕ|A (1.161)

and Eq. (1.160) is written as〈ϕ| (A |ψ〉) = (〈ϕ|A) (|ψ〉) (1.162)

so it is written simply as〈ϕ|A |ψ〉

we should check that g is indeed a functional i.e. that it is a continuous linear mapping of the vectors into thecomplex numbers, the basic properties of functionals are reproduced

gαA|ϕ〉+βA|χ〉 (ψ) = α∗gA|ϕ〉 (|ψ〉) + β∗gA|χ〉 (|ψ〉)gA|ϕ〉 (α |ψ〉+ β |χ〉) = αgA|ϕ〉 (|ψ〉) + βgA|ϕ〉 (|χ〉)

Further, the association (1.161) is linear, to see it, we write a linear combination of bras

〈ϕ| = λ1 〈ϕ1|+ λ2 〈ϕ2|

which means that〈ϕ|ψ〉 = λ1 〈ϕ1|ψ〉+ λ2 〈ϕ2|ψ〉 ; ∀ |ψ〉 ∈ Ex

then

(〈ϕ|A) (|ψ〉) = 〈ϕ| (A |ψ〉) = (λ1 〈ϕ1|+ λ2 〈ϕ2|) (A |ψ〉)= λ1 〈ϕ1| (A |ψ〉) + λ2 〈ϕ2| (A |ψ〉)= λ1 (〈ϕ1|A) |ψ〉+ λ2 (〈ϕ2|A) |ψ〉

since ψ is arbitrary we find〈ϕ|A = λ1 〈ϕ1|A+ λ2 〈ϕ2|A

notice that is different to start with a linear combination of kets from starting with a linear combination of bras,because the linear combination of a ket corresponds to a linear combination with conjugate coefficients in the bras(antilinearity). The order is important, the new bra induced from 〈ϕ| by the operator A is written as 〈ϕ|A andnot in the form A 〈ϕ|. For instance if we apply this relations to a ket the first expression 〈ϕ|A |ψ〉 is a complexnumber, while the second A 〈ϕ|ψ〉 = αA is another operator.

1.39.1. The adjoint operator A† in Dirac notation

In Dirac notation we write |ψ′〉 = A |ψ〉 ≡ |Aψ〉. We now want to know what is the corresponding bra|ψ′〉 ↔ 〈ψ′| ≡ 〈Aψ|. In mathematical notation the question is

|ψ〉 → f|ψ〉 ;∣∣ψ′⟩ = A |ψ〉 ≡ |Aψ〉 ⇒

∣∣ψ′⟩ ?→ f|ψ′〉

14Notice that gA|ψ〉 is a new functional induced from f|ϕ〉 and A. Of course gA|ψ〉 must be associated to some vector i.e. gA|ψ〉 = f|χ〉for some |χ〉 in our vector space, but it does not concern us. In particular, it is very important to observe that gA|ψ〉 6= fA|ψ〉.

Page 86: Mecanica Cuantica: Notas de Clase

86 CAPITULO 1. LINEAR OR VECTOR SPACES

to elucidate the answer we apply an arbitrary vector |ϕ〉 to the functional we want to find

fA|ψ〉 (|ϕ〉) = f|ψ′〉 (|ϕ〉) = 〈ψ′ |ϕ〉 = 〈Aψ|ϕ〉 = 〈ψ|A†ϕ〉

where we have applied property (1.36). Now we apply property (1.162) to get

f|ψ′〉 (|ϕ〉) = 〈ψ|(∣∣∣A†ϕ

⟩)=(〈ψ|A†

)(|ϕ〉)

since this is valid for |ϕ〉 arbitrary we find

f|ψ′〉 ≡⟨ψ′∣∣ = 〈ψ|A†

in Dirac notation we have then

∣∣ψ′⟩ = A |ψ〉 ≡ |Aψ〉⟨ψ′∣∣ = 〈ψ|A† ≡ 〈Aψ|

notice that as before, the mapping of the dual space into itself is denoted with the operator defined on the right-hand side and not on the left15. Further by assigning A = λI and taking into account that A† = λ∗I we havethat

⟨ψ′∣∣ = 〈λψ| = 〈λIψ| = 〈ψ| (λI)† = 〈ψ|λ∗I ⇒

〈λψ| = λ∗ 〈ψ|

in agreement with Eq. (1.152). On the other hand since

⟨ψ′∣∣ϕ〉 = 〈ϕ|ψ′〉∗

we see that〈ψ|A† |ϕ〉 = 〈ϕ|A |ψ〉∗ (1.163)

and we remember the most important properties of the adjoint operators (see Eqs. (1.35))

(A†)†

= A , (αA+ βB)† = α∗A† + β∗B† (1.164)

(AB)† = B†A† (1.165)

1.39.2. Mathematical objects and hermitian conjugation in Dirac notation

In general, the order of bras, kets and operators is of major importance, the only objects we can put in anyorder are scalars, for instance the mathematical objects

λ 〈ϕ|B |ψ〉 ; λ 〈ψ|B |ϕ〉 ; λ 〈ψ|ϕ〉B ; λ |ψ〉 〈ϕ|B (1.166)

are all distinct each other, the first and second are complex numbers, while the last two are operators, as can beverified by applying an arbitrary vector on the right-hand side of these objects. However, expressions like

λ |ψ〉 〈ϕ|B ; |ψ〉λ 〈ϕ|B ; |ψ〉 〈ϕ|λB ; |ψ〉 〈ϕ|Bλ

are all equal, indeed we could think about the multiplication by a scalar as equivalent to the operator λI whichcommutes with everything.

15Stricktly speaking, a mapping of the dual (or conjugate) space into itself is carried out by the conjugate operator instead of theadjoint operator since the latter maps the Hilbert space into itself and not the dual. Notwithstanding, from the practical point of viewthis subtlety is irrelevant.

Page 87: Mecanica Cuantica: Notas de Clase

1.39. HERMITIAN CONJUGATION 87

We shall now define a useful operation that we call hermitian conjugation. Our basic objects are kets, bras,operators and scalars. In general words, hermitian conjugations are mappings induced by the existence of the dualE∗ of our Hilbert space E .

A ket |ψ〉 ∈ E is naturally mapped into a bra 〈ψ| ∈ E∗.A bra 〈ψ| ∈ E∗ is naturally mapped into an element of the conjugate space of E∗, i.e on E∗∗. However, for

Hilbert spaces it can be shown that E∗∗ = E hence the bra is mapped into its corresponding ket16.An operator A in ß(E) is mapped naturally into the conjugate vector A∗ in ß(E∗) but the inner product

structure permits in turn to define another operator A† in ß(E) from A∗ and from the practical point of view weregard A∗ and A† as identical. Thus the hermitian conjugation in this case will be the mapping A→ A†.

Now finally for scalars. Taking into account that for all practical uses scalars λ can be considered as operatorsin ß(E) of the form λI we see that the natural hermitian conjugation gives λI → (λI)† = λ∗. Therefore, thenatural conjugation operation is λ→ λ∗.

We notice now that the hermitian conjugation reverses the order of the objects to which it is applied. We haveseen that (A |ψ〉)† = 〈ψ|A†, Eq. (1.165) shows that the order of a product of operators is reversed when we applythe “adjointness” (or hermitian conjugation) on that product, when scalars are involved the place in which scalarsare located is irrelevant.

By the same token, let us see what is the conjugate of the non orthogonal projection defined in (1.159)

P = |ψ〉 〈ϕ| ; P † = (|ψ〉 〈ϕ|)†

applying Eq. (1.163) we find

〈χ| (|ψ〉 〈ϕ|)† |η〉 = [〈η| (|ψ〉 〈ϕ|) |χ〉]∗ = 〈η|ψ〉∗ 〈ϕ|χ〉∗ = 〈χ|ϕ〉 〈ψ| η〉〈χ| (|ψ〉 〈ϕ|)† |η〉 = 〈χ| (|ϕ〉 〈ψ|) |η〉 ; ∀ |η〉 , |χ〉 ∈ E

then we have(|ψ〉 〈ϕ|)† = |ϕ〉 〈ψ| (1.167)

once again, the hermitian conjugation converts each object in its hermitian conjugate and reverse the order ofsuch objects.

These observations permit to give a rule to obtain the hermitian conjugate of a mathematical object composedby a juxtaposition of bras, kets, operators and scalars. The rule is (a) replace each object by its hermitian conjugate

|ψ〉 → 〈ψ| , 〈ϕ| → |ϕ〉 , A→ A† , λ→ λ∗

and (b) reverse the order of the factors, taking into account that the position of the scalars are not relevant.The hermitian conjugate of the objects defined in (1.166) are given by

[λ 〈ϕ|B |ψ〉]† = 〈ψ|B† |ϕ〉λ∗ = λ∗ 〈ψ|B† |ϕ〉 = [λ 〈ϕ|B |ψ〉]∗

[λ 〈ψ|B |ϕ〉]† = 〈ϕ|B† |ψ〉λ∗ = λ∗ 〈ϕ|B† |ψ〉 = [λ 〈ψ|B |ϕ〉]∗

[λ 〈ψ|ϕ〉B]† = B† 〈ϕ|ψ〉λ∗ = λ∗ 〈ϕ|ψ〉B† = (λ 〈ψ|ϕ〉)∗B†

[λ |ψ〉 〈ϕ|B]† = B† |ϕ〉 〈ψ|λ∗ = λ∗B† |ϕ〉 〈ψ| = λ∗B† [|ψ〉 〈ϕ|]†

in the first two expressions the original mathematical objects are scalars and hence the hermitian conjugatesare also scalars (the complex conjugates of the original scalars). In the third expression the original object isan operator and its hermitian conjugate is also an operator (the adjoint of the original operator). In the fourthexpression, the original object is a product of two operators and a scalar (a scalar times a projection times theoperator B) and the adjoint is the product of the scalar and adjoint of each of the operators in reverse order. In

16In Banach spaces, the property B∗∗ = B is called reflexibity and is not in general satisfied. For Hilbert spaces, reflexibity isautomatic from which we can assign the dual element of a dual element to the original vector. This is another satisfying property ofHilbert spaces, not accomplished by general Banach spaces.

Page 88: Mecanica Cuantica: Notas de Clase

88 CAPITULO 1. LINEAR OR VECTOR SPACES

each case, the scalars are located in the most convenient place since their positions are unimportant. Indeed, wecan put the conjugate of the scalars in any place, for instance in the case

[λ |χ〉 〈ψ|B |ϕ〉]† = [λ 〈ψ|B |ϕ〉 |χ〉]† = λ∗ 〈ψ|B |ϕ〉∗ 〈χ|

that coincides with the rules when we take into account Eq. (1.163).It is important to see that according to (1.167) the projectors given by (1.154) are hermitian, thus according

to theorem 1.44, they are orthogonal projectors (i.e. projectors in the sense of a Hilbert space), this in turn saysthat the sums in (1.156) are also orthogonal projectors (see theorem 1.50). On the other hand, the projectorsdescribed by (1.159) with |ϕ〉 6= |ψ〉 are non-hermitian and consequently they are non-orthogonal projections.

1.40. Theory of representations of E in Dirac notation

For most of our purposes we shall use a representation with respect to orthonormal bases. The particularproblem suggests the particular basis to work with. Most of the developments here are not new but gives us avery good opportunity of using the Dirac notation and be aware of its great advantages as a tool for calculations.We are going to describe the representation theory in both discrete and continuous bases.

1.40.1. Orthonormalization and closure relation

In Dirac notation, the orthonormality of a set of discrete |ui〉 or continuous |wα〉 orthonormal kets isexpressed by

〈ui |uj〉 = δij ; 〈wα |wα′〉 = δ(α− α′)

we emphasize once again that 〈wα |wα〉 diverges so that |wα〉 does not have a bounded norm and thus it does notbelong to our state space. We call |wα〉 generalized kets because they can be used to expand any ket of our statespace.

A discrete set ui or a continuous one wα constitutes a basis if each ket |ψ〉 of our state space can beexpanded in a unique way on each of these sets

|ψ〉 =∑

i

ci |ui〉 ; |ψ〉 =∫dα c (α) |wα〉 (1.168)

the problem is considerably simplified if we asume that the bases are orthonormal, because in that case we canextract the coefficients by applying a bra 〈uk| or 〈wα′ | on both sides of these equations

〈uk |ψ〉 = 〈uk|∑

i

ci |ui〉 ; 〈wα′ |ψ〉 = 〈wα′ |∫dα c (α) |wα〉

〈uk |ψ〉 =∑

i

ci 〈uk| ui〉 =∑

i

ciδki = ck

〈wα′ |ψ〉 =

∫dα c (α) 〈wα′ |wα〉 =

∫dα c (α) δ

(α− α′) = c

(α′)

from which we obtain the familiar result

ck = 〈uk |ψ〉 ; c(α′) = 〈wα′ |ψ〉 (1.169)

replacing the Fourier coefficients (1.169) in the expansions (1.168) we find

|ψ〉 =∑

i

〈ui |ψ〉 |ui〉 =∑

i

|ui〉 〈ui |ψ〉 =(∑

i

|ui〉 〈ui|)|ψ〉

|ψ〉 =

∫dα 〈wα |ψ〉 |wα〉 =

∫dα |wα〉 〈wα |ψ〉 =

(∫dα |wα〉 〈wα|

)|ψ〉

Page 89: Mecanica Cuantica: Notas de Clase

1.40. THEORY OF REPRESENTATIONS OF E IN DIRAC NOTATION 89

since this is valid for any ket |ψ〉 ∈ E the operators in parenthesis must be the identity operator on E

Pui ≡∑

i

|ui〉 〈ui| = I ; Pwα ≡∫dα |wα〉 〈wα| = 1 (1.170)

we can reverse the steps and show that applying the identity in the form given by Eqs. (1.170) we obtain that any|ψ〉 ∈ E must be a unique linear combination of |ui〉 or |wα〉

|ψ〉 = I |ψ〉 = Pui |ψ〉 =(∑

i

|ui〉 〈ui|)|ψ〉 =

i

|ui〉 〈ui|ψ〉

|ψ〉 =∑

i

ci |ui〉 ; ci ≡ 〈ui|ψ〉 (1.171)

|ψ〉 = I |ψ〉 = Pwα |ψ〉 =[∫

dα |wα〉 〈wα|]|ψ〉 =

∫dα |wα〉 〈wα|ψ〉

|ψ〉 =

∫dα c (α) |wα〉 ; c (α) ≡ 〈wα|ψ〉

these facts show that Eqs. (1.170) manifest a closure relation in Dirac notation. This is consistent with ourdiscussion in Sec. 1.38.1 that led to Eq. (1.157), in which we saw that each element of the form |ui〉 〈ui| isa projector operator and Eqs. (1.170) are decompositions of the identity in projectors17. In other words, theprojector given by the sums in (1.170) has the whole space as its range. In the case of the continuous basis, theyare “hyperprojectors” but we shall call them projectors from now on.

Hence the representation of a ket |ψ〉 in a discrete basis is given by the set of its fourier coefficients 〈ui|ψ〉it is usually written in matrix form as a column matrix

|ψ〉 =

〈u1|ψ〉〈u2|ψ〉

...〈ui|ψ〉

...

=

c1c2...ci...

the representation of a ket |ψ〉 in a continuous basis is given by the set of its fourier transforms 〈ui|ψ〉 it isusually written in continuous matrix form as a column matrix

|ψ〉 =

...〈wα|ψ〉

...

=

...c (α)...

the representation of a bra can be obtain by the same insertion of the identity as follows

〈ψ| = 〈ψ| I = 〈ψ|Pui =∑

i

〈ψ|ui〉 〈ui|

〈ψ| =∑

i

c∗i 〈ui| ; ci = 〈ui|ψ〉

17In Eq. (1.157) the lower index labels the eigenvalue and the upper index indicates the degree of degeneracy of the given eigenvalue.In Eq. (1.170) the single index runs over all different eigenvectors.

Page 90: Mecanica Cuantica: Notas de Clase

90 CAPITULO 1. LINEAR OR VECTOR SPACES

which can also be obtained by taking the hermitian conjugation of Eq. (1.171) and applying (1.152). For continuousbasis the process is similar

〈ψ| = 〈ψ| I = 〈ψ|Pwα =∫dα 〈ψ|wα〉 〈wα|

〈ψ| =

∫dα c∗ (α) 〈wα| ; c (α) = 〈wα|ψ〉

in matrix notation the bra is represented as a one row matrix of the coefficients, in both the discrete and continuouscases

〈ψ| =(〈ψ| u1〉 〈ψ| u2〉 · · · 〈ψ| ui〉 · · ·

)

〈ψ| =(c∗1 c∗2 · · · c∗3 · · ·

)

〈ψ| =(· · · c∗ (α) · · ·

)

by comparing the representation of the corresponding ket |ψ〉 we see that the representation of the bra is obtainedby transposing the matrix representative of the ket (i.e. converting the column in a row) and taking the conjugateof each element.

Let us reproduce the inner product expressions (1.107) and (1.114) by insertion of the identity with projectors

〈ϕ|ψ〉 = 〈ϕ| I |ψ〉 = 〈ϕ|Pui |ψ〉 =∑

i

〈ϕ| ui〉〈ui |ψ〉

〈ϕ|ψ〉 =∑

i

b∗i ci ; bi = 〈ui|ϕ〉 ; ci = 〈ui |ψ〉

〈ϕ|ψ〉 = 〈ϕ| I |ψ〉 = 〈ϕ|Pwα |ψ〉 =∫dα 〈ϕ|wα〉〈wα |ψ〉

〈ϕ|ψ〉 =

∫dα b∗ (α) c (α) ; b (α) = 〈wα|ϕ〉 ; c (α) = 〈wα |ψ〉

in matrix form we can see the inner product as the product of a row vector times a column vector

〈ϕ|ψ〉 =(b∗1 b∗2 · · · b∗3 · · ·

)

c1c2...ci...

=∑

i

b∗i ci

in continuum form we have

〈ϕ|ψ〉 =(· · · b∗ (α) · · ·

)

...c (α)...

=

∫dα b∗ (α) c (α)

and the norms are obtained with ϕ = ψ i.e. bi = ci or b (α) = c (α)

〈ψ|ψ〉 = ‖ψ‖2 =∑

i

|ci|2 =∫dα |c (α)|2

Page 91: Mecanica Cuantica: Notas de Clase

1.40. THEORY OF REPRESENTATIONS OF E IN DIRAC NOTATION 91

1.40.2. Representation of operators in Dirac notation

Let us see the representation of an operator A under a basis ui or wα. We have seen that a matrixrepresentative of A under the basis ui is

Aij = 〈ui|Auj〉 = 〈ui|A |uj〉

and in a continuous basis

A(α,α′) = 〈wα|A |wα′〉

they are arranged in a square matrix with infinite countable or continuous numbers of columns and rows

A =

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

A =

...· · · A (α,α′) · · ·

...

it is interesting to see the matrix representative of a product of operators by insertion of the identity

(AB)ij = 〈ui|AB |uj〉 = 〈ui|AIB |uj〉 = 〈ui|APuiB |uj〉 =∑

k

〈ui|A |uk〉 〈uk|B |uj〉

(AB)ij =∑

k

AikBkj

which coincides with the algorithm for matrix multiplication developed in Sec. 1.14.1, Eq. (1.50). We can developeasily the matrix multiplication algorithm with continuum matrices

(AB) (α, β) = 〈wα|AB |wβ〉 = 〈wα|AIB |wβ〉 = 〈wα|APuiB |wβ〉

(AB) (α, β) =

∫dγ 〈wα|A |wγ〉 〈wγ |B |wβ〉

(AB) (α, β) =

∫dγ A (α, γ)B (γ, β) (1.172)

now let us see the matrix representative of the ket |ψ′〉 given by

A |ψ〉 =∣∣ψ′⟩

from the knowledge of the components of |ψ〉 and A, in a given representation ui. The coordinates of |ψ′〉 inthis basis is

c′i = 〈ui∣∣ψ′⟩ = 〈ui|A |ψ〉 = 〈ui|AI |ψ〉 = 〈ui|APui |ψ〉 =

k

〈ui|A |uk〉 〈uk|ψ〉

c′i =∑

k

Aikck

Page 92: Mecanica Cuantica: Notas de Clase

92 CAPITULO 1. LINEAR OR VECTOR SPACES

that explicitly can be illustrated as

c′1c′2...c′i...

=

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

c1c2...ci...

with a continuous basis wα we have

c′ (α) = 〈wα|ψ′〉 = 〈wα|A |ψ〉 = 〈wα|AI |ψ〉 = 〈wα|APwα |ψ〉 =∫dβ 〈wα|A |wβ〉 〈wβ |ψ〉

c′ (α) =

∫dβ A (α, β) c (β)

which is the continuous extension of multiplication of a matrix with a column vector.

Let us see the representation of the bra 〈ψ|A

〈ψ|A = 〈ψ| IAI =∑

i

j

〈ψ| ui〉 〈ui|A |uj〉 〈uj|

=∑

i

j

c∗iAij 〈uj |

Therefore, the bra 〈ψ|A is represented by the product of the row matrix that represents 〈ψ| times the squarematrix representing A respecting the order

〈ψ|A =(c∗1 c∗2 · · · c∗3 · · ·

)

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

observe that the matrix product is not defined in the opposite order, thus we cannot give meaning to A 〈ψ|.In many cases, it is also interesting to calculate the element 〈ϕ|A |ψ〉 in terms of the coordinates of the bra

and the ket and in terms of the components of A. To do it, we insert an expansion of the identity twice

〈ϕ|A |ψ〉 = 〈ϕ| IAI |ψ〉 = 〈ϕ|PuiAPui |ψ〉 =∑

i

j

〈ϕ| ui〉 〈ui|A |uj〉 〈uj |ψ〉

〈ϕ|A |ψ〉 =∑

i

j

b∗iAijcj ; bi = 〈ui|ϕ〉, Aij = 〈ui|A |uj〉 , cj = 〈uj |ψ〉

which in matrix form is written as a bilinear form

〈ϕ|A |ψ〉 =(b∗1 b∗2 · · · b∗3 · · ·

)

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

c1c2...ci...

(1.173)

Page 93: Mecanica Cuantica: Notas de Clase

1.41. CHANGE OF REPRESENTATIONS 93

this is the natural way of superposing the representations of 〈ϕ|, A, and |ψ〉 respecting the order. The result is ofcourse a number. The extension for continuous bases is

〈ϕ|A |ψ〉 = 〈ϕ|PwαAPwβ |ψ〉 =∫dα

∫dβ 〈ϕ|wα〉 〈wα|A |wβ〉 〈wβ |ψ〉

and we obtain

〈ϕ|A |ψ〉 =

∫ ∫dα dβ b∗ (α) A (α, β) c (β)

b (α) = 〈wα|ϕ〉 ; A (α, β) = 〈wα|A |wβ〉 ; c (β) = 〈wβ |ψ〉

notice that Eq. (1.162) expresses the associativity of the matrix expressions given by Eq. (1.173).Finally, the projection operator P = |ψ〉 〈ψ| has matrix representative given by

Pij = 〈ui|P |uj〉 = 〈ui|ψ〉〈ψ |uj〉 = cic∗j

in matrix language it is written as

|ψ〉 〈ψ| =

c1c2...ci...

(c∗1 c∗2 · · · c∗3 · · ·

)=

c1c∗1 c1c

∗2 · · · c1c

∗j · · ·

c2c∗1 c2c

∗2 · · · c2c

∗j · · ·

......

...cic

∗1 cic

∗2 · · · cic

∗j · · ·

......

...

this representation is particularly simple when P = |uk〉 〈uk| i.e. when the ket that forms the projector is part ofthe basis.

The matrix representation of the adjoint operator is obtained by using property (1.163)

(A†)ij

= 〈ui|A† |uj〉 = 〈uj |A |ui〉∗ = A∗ji

(A†)(α, β) = 〈wα|A† |wβ〉 = 〈wβ |A |wα〉∗ = A∗ (β, α)

these results coincide with the one obtained in Eq. (1.70). If A is hermitian then A = A† and

Aij = A∗ji ; A (α, β) = A∗ (β, α) (1.174)

in particular applying these conditions for i = j or α = β we see that the diagonal elements of an hermitian matrixare real. These facts are valid only if the basis is orthonormal, otherwise the matrix representative of the adjointof the matrix takes another form.

1.41. Change of representations

In a representation characterized by a given orthonormal basis |ui〉 the kets, bras and operators have somespecific matrix representatives. We want to write the matrix representative of these objects in a new orthonormalbasis |tk〉 using the Dirac notation18. For future purposes we define the matrix S in the form

Sik ≡ 〈ui| tk〉 ;(S†)ki

= S∗ik = 〈tk| ui〉

18This problem is a bit lees general that the one treated in Sec. (1.14), because in that section the bases involved are non necessarilyorthonormal. However, in this case we are treating the problem in infinite dimension.

Page 94: Mecanica Cuantica: Notas de Clase

94 CAPITULO 1. LINEAR OR VECTOR SPACES

To give a geometrical meaning to S, let define V(k)i ≡ Sik and V(k) the k−th column vector with components Sik.

Then, it is clear that V(k) is the matrix representative (column matrix) of the element |tk〉 in the basis |ui〉. Wethen construct a square matrix by putting these column vectors side by side

S =(V(1) V(2) · · ·

)=

S11S21...

S12S22...

· · ·

=

S11 S12 · · ·S21 S22 · · ·...

...

We can also see that S is a unitary matrix(S†S

)km

=∑

i

S†kiSim =

i

〈tk| ui〉 〈ui| tm〉 = 〈tk|Pui |tm〉 = 〈tk| tm〉 = δkm

(SS†

)ij

=∑

k

SikS†kj =

k

〈ui| tk〉 〈tk|uj〉 = 〈ui|Ptk |uj〉 = 〈ui|uj〉 = δij

consequentlyS†S = SS† = I

On the other hand, we will also require the closure and orthonormalization relations with both bases

Pui =∑

i

|ui〉 〈ui| = I ; 〈ui|uj〉 = δij

Ptk =∑

k

|tk〉 〈tk| = I ; 〈tk| tm〉 = δkm

1.41.1. Transformation of the coordinates of a ket

The coordinates of a ket |ψ〉 in the basis |ui〉 are 〈ui|ψ〉 ≡ |ψ〉(ui). To know the coordinates in the new basis〈tk|ψ〉, in terms of the old ones, we insert the closure relation for |uk〉 in the element 〈tk|ψ〉

〈tk|ψ〉 =∑

i

〈tk|ui〉 〈ui|ψ〉 =∑

i

S†ki 〈ui|ψ〉

c(t)k =

i

S†kic

(u)i ; c(t) = S†c(u)

The inverse relation can be obtained by taking into account that S† = S−1

c(t) = S−1c(u) ⇒ c(u) = Sc(t)

or alternatively by inserting an identity in the element 〈ui|ψ〉〈ui|ψ〉 =

k

〈ui| tk〉 〈tk|ψ〉 =∑

k

Sik 〈tk|ψ〉

c(u)i =

k

Sikc(t)k ; c(u) = Sc(t)

1.41.2. Transformation of the coordinates of a bra

We insert the identity in the element 〈ψ| tk〉〈ψ| tk〉 =

i

〈ψ| ui〉 〈ui| tk〉 =∑

i

〈ψ| ui〉Sik

c∗(t)k =

i

c∗(u)i Sik ⇒ c∗(t) = c∗(u)S

similarlyc∗(u) = c∗(t)S†

Page 95: Mecanica Cuantica: Notas de Clase

1.42. REPRESENTATION OF THE EIGENVALUE PROBLEM IN DIRAC NOTATION 95

1.41.3. Transformation of the matrix elements of an operator

We start with 〈tk|A |tm〉 and insert two identities

〈tk|A |tm〉 = 〈tk| IAI |tm〉 =∑

i

j

〈tk|ui〉 〈ui|A |uj〉 〈uj |tm〉 =∑

i,j

S†kiA

(u)ij Sjm

A(t)km =

i,j

S†kiA

(u)ij Sjm ; A(t) = S†A(u)S (1.175)

and the inverse relation is obtained from

〈uk|A |um〉 =∑

i,j

〈uk| ti〉 〈ti|A |tj〉 〈tj |um〉 =∑

i,j

SkiA(t)ij S

†jm

A(u)km =

i,j

SkiA(t)ij S

†jm ; A(u) = SA(t)S† (1.176)

or taking into account that S† = S−1.

1.42. Representation of the eigenvalue problem in Dirac notation

For a given observable A the eigenvalue problem reads

A |ψ〉 = λ |ψ〉we want to construct its matrix representation in a basis ui. We first multiply by a bra of the form 〈ui| on bothsides

〈ui|A |ψ〉 = λ〈ui |ψ〉and insert an identity

j

〈ui|A |uj〉 〈uj |ψ〉 = λ〈ui |ψ〉∑

j

Aijcj = λci ; ci ≡ 〈ui |ψ〉 ; Aij ≡ 〈ui|A |uj〉

with ci and Aij the matrix elements of |ψ〉 and A in the basis ui. This expression can be rewritten as∑

j

[Aij − λδij ] cj = 0

which is the well known expression for the eigenvalue problem in matrix form.

1.42.1. C.S.C.O. in Dirac notation

Assume that a given set of observables A1, ..., Am forms a C.S.C.O. Then a given set of eigenvaluesa(1)n1 , ..., a

(m)nm

defines a unique normalized eigenvector common to all the observables (within a phase factor). We shall see laterthat any set of kets that differ in a global phase factor

|ψ〉 , eiθ1 |ψ〉 , ..., eiθk |ψ〉

have the same physical information. Thus, the normalized ket associated with the seta(1)n1 , ..., a

(m)nm

is unique

from the physical pointof view. Therefore, it is usual to denote the corresponding ket in the form |ψn1,...,nm〉 orsimply as |n1, n2, ..., nm〉 and the set of eigenvalues are called quantum numbers.

Ai |n1, . . . , ni, ..., nm〉 = a(i)ni |n1, . . . , ni, ..., nm〉 ; i = 1, ..,m

Page 96: Mecanica Cuantica: Notas de Clase

96 CAPITULO 1. LINEAR OR VECTOR SPACES

1.43. The continuous bases |r〉 and |p〉From the wave functions space we have constructed the abstract space Er such that there is an isometric

isomorphism of onto Er, therefore they are abstractly identical as Hilbert spaces. Consequently, an elementψ (r) ∈ has a unique image |ψ〉 ∈ Er and vice versa. In particular, the inner product must be preserved by thiscorrespondence

|ψ〉 ↔ ψ (r) ; |ϕ〉 ↔ ϕ (r) ; 〈ψ| ↔ ψ∗ (r) ; 〈ϕ| ↔ ϕ∗ (r)

(|ϕ〉 , |ψ〉) = (ϕ,ψ) ≡ 〈ϕ|ψ〉 =∫d3r ϕ∗ (r) ψ (r)

Er will describe the state space of a spinless particle. We have discussed before that ψ (r) can also be interpretedas a representation of the abstract ket |ψ〉 in the continuous basis ξr (r′) defined in Eq. (1.120). We also saw thatξr (r

′) are not elements of , but they can be used to expand any element of in a unique way. We call ξr (r′)

“generalized wave functions” and it is natural to associate with them some “generalized kets” denoted as |r〉 thatdo not belong to Er but can expand any element of Er in such a way that if ψ (r) ↔ |ψ〉 then the expansion ofψ (r) under ξr (r

′) has the same coefficients as the expansion of |ψ〉 under |r〉

ψ (r) =

∫dr′ c

(r′)ξr′ (r) ; |ψ〉 =

∫dr′ c

(r′) ∣∣r′

We denote this association as ξr ↔ |r〉. Similarly, for the continuous basis defined in Eq. (1.116) by vp (r) whichhas plane waves as “generalized wave functions”, we shall have a continuous basis of Er denoted as |p0〉

ξr(r′)↔ |r〉 ; vp (r) ↔ |p〉

therefore, using the bases ξr (r′) and vp (r) of we have defined two continuous basis in Er denoted as|r〉 and |p〉. Consequently, all bras, kets and operators in Er will have a continuous matrix representationin these bases. The basis |r〉 is labeled by three continuous indices x, y, z which are the coordinates of a pointin three dimensional space. Similarly, the basis |p〉 is labeled by three continuous indices px, py, pz which arecomponents of a cartesian vector.

1.43.1. Orthonormalization and closure relations

We shall calculate 〈r |r′〉 using the definition of the scalar product in Er

〈r∣∣r′⟩

=

∫d3r′′ ξ∗r

(r′′)ξr′(r′′)=

∫d3r′′ δ

(r′′ − r

)δ(r′′ − r′

)

〈r∣∣r′⟩

= δ(r− r′

)(1.177)

similarly

〈p∣∣p′⟩ =

∫d3r v∗p (r) vp′ (r) =

(1

2π~

)3 ∫d3r e−ip·r/~ eip

′·r =

(1

2π~

)3 ∫d3r e−i(p−p′)·r/~

〈p∣∣p′⟩ = δ

(p− p′)

where we have used property (1.117). The closure relations for |r〉 and |p〉 are written according with thesecond of Eqs. (1.170) integrating over three indices instead of one. The orthonormality and closure relations forthese bases are then

〈r∣∣r′⟩

= δ(r− r′

); 〈p

∣∣p′⟩ = δ(p− p′) (1.178)∫

d3r |r〉 〈r| = I ;

∫d3p |p〉 〈p| = I (1.179)

Page 97: Mecanica Cuantica: Notas de Clase

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 97

1.43.2. Coordinates of kets and bras in |r〉 and |p〉Consider an arbitrary ket |ψ〉 corresponding to a wave function ψ (r). The closure relations for |r〉 and |p〉

permits to expand |ψ〉 as

|ψ〉 =∫d3r |r〉 〈r|ψ〉 =

∫d3r c (r) |r〉 ; |ψ〉 =

∫d3p |p〉 〈p|ψ〉 =

∫d3p c (p) |p〉 (1.180)

the coefficients c (r) = 〈r|ψ〉 and c (p) = 〈p|ψ〉 are calculated as follows

〈r|ψ〉 =

∫d3r′ ξ∗r

(r′)ψ(r′)=

∫d3r′ δ

(r′ − r

)ψ(r′)= ψ (r)

〈p|ψ〉 =

∫d3r v∗p (r) ψ (r) =

(1

2π~

)3/2 ∫d3r e−ip·r/~ψ (r) = ψ (p)

hence

c (r) = 〈r|ψ〉 = ψ (r) ; c (p) = 〈p|ψ〉 = ψ (p) (1.181)

the coefficients c (r) of the expansion of |ψ〉 under |r〉 are the wave functions evaluated at the point r, this factreinforces the interpretation of the wave function as the representation of |ψ〉 under the basis |r〉. The coefficientsc (p) are the fourier transforms of the wave function, this coefficients ψ (p) are usually called “wave functions inmomentum space”, since they represent the same abstract vector |ψ〉 it is clear that ψ (r) and ψ (p) contain thesame physical information, this can also be seen by taking into account that given ψ (r) then ψ (p) is uniquelydetermined and vice versa. On the other hand, by comparing Eqs. (1.180, 1.181) with Eqs. (1.121, 1.122) we seethat if ψ (r) ↔ |ψ〉 then the expansion of ψ (r) under ξr (r

′) has the same coefficients as the expansion of |ψ〉 under|r〉 as we demanded. Similar situation occurs with the basis vp in and the basis |p〉 in Er.

An important particular case arises when |ψ〉 = |p〉 which is indeed a generalized ket. Assuming that all therelations above are also valid for generalized kets, and taking into account that |p〉 ↔ vp (r), then Eq. (1.181)gives

〈r|p〉 = vp (r) =

(1

2π~

)3/2

eip·r/~ (1.182)

the same result is obtained by taking into account the equality of the inner product of vectors in and vectorsin Er when this equality is extended to generalized vectors

〈r|p〉 = (|r〉 , |p〉) = (ξr, vp) =

∫d3r′ ξ∗r

(r′)vp(r′)=

∫d3r′ δ

(r′ − r

)vp(r′)= vp (r)

applying Eq. (1.181) for |ψ〉 = |r′〉 ↔ ψ (r) = ξr′ (r) we find

〈r| r′〉 = ξr′ (r) = δ(r− r′

)

which is consistent with the orthonormalization relation. Similar arguments leads to

〈p| r〉 = v∗p (r) =

(1

2π~

)3/2

e−ip·r/~ ; 〈p|p′〉 = δ(p− p′)

Assume that we have an orthonormal basis ui (r) in and an orthonormal basis |ui〉 in Er such thatui (r) ↔ |ui〉. Starting with the closure relation for |ui〉 in Er

i

|ui〉 〈ui| = I

Page 98: Mecanica Cuantica: Notas de Clase

98 CAPITULO 1. LINEAR OR VECTOR SPACES

and evaluating the matrix element of it between |r〉 and |r′〉 we have∑

i

〈r |ui〉 〈ui| r′〉 = 〈r| I∣∣r′⟩= 〈r| r′〉

and using Eqs. (1.181, 1.178) we find ∑

i

ui (r) u∗i

(r′)= δ

(r− r′

)

which is the closure relation as it was expressed in Eq. (1.110) for ui (r) in , reversing the steps we can obtainthe closure relation for |ui〉 in Er starting from the closure relation for ui (r) in 19.

Notice that the inner product of two kets in terms of their coordinates under the basis |r〉 is a particularcase of Eq. (1.114). Equivalently, we obtain it by insertion of the identity

〈ϕ |ψ〉 =∫d3r 〈ϕ |r〉 〈r |ψ〉

and interpreting the components 〈ϕ |r〉 and 〈r |ψ〉 as in Eq. (1.181)

〈ϕ |ψ〉 =∫d3r ϕ∗ (r)ψ (r)

a similar procedure can be done for the basis |p〉

〈ϕ |ψ〉 =∫d3p 〈ϕ |p〉 〈p |ψ〉 =

∫d3p ϕ∗ (p) ψ (p)

from which it is obtained ∫d3r ϕ∗ (r)ψ (r) =

∫d3p ϕ∗ (p) ψ (p)

this is a well-known property of the Fourier trasnforms.

1.43.3. Changing from the |r〉 representation to |p〉 representation and vice versa

The procedure is similar to the one in section 1.41 but for continuous basis. If we consider the change from|r〉 to |p〉, the unitary matrix S of changing the basis is

S (r,p) = 〈r |p〉 =(

1

2π~

)3/2

eip·r/~ (1.183)

a ket |ψ〉 is represented as ψ (r) in |r〉 and we know well that in |p〉 it is given by ψ (p). Here we see that itis consistent with the formalism developed in Sec. 1.41

〈p |ψ〉 =

∫d3r 〈p |r〉 〈r |ψ〉 =

∫d3r S† (r,p) 〈r |ψ〉

ψ (p) =

(1

2π~

)3/2 ∫d3r e−ip·r/~ψ (r) (1.184)

similarly

〈r |ψ〉 =

∫d3p 〈r |p〉 〈p |ψ〉 =

∫d3p S (r,p) 〈p |ψ〉

ψ (r) =

(1

2π~

)3/2 ∫d3p eip·r/~ψ (p) (1.185)

19Notice that I (r, r′) = 〈r′| I |r〉 = 〈r′| r〉 = δ (r− r′) shows that the Dirac delta can be seen as the representation of the identityunder the continuous hyperbasis |r〉.

Page 99: Mecanica Cuantica: Notas de Clase

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 99

the representation of bras can be obtained by hermitian conjugation of the relations with kets.Now for a given operator, the matrix elements in |p〉 read A (p′,p) = 〈p′|A |p〉 inserting two identities we

get

⟨p′∣∣A |p〉 =

∫d3r′

∫d3r

⟨p′∣∣ r′〉

⟨r′∣∣A |r〉 〈r |p〉

⟨p′∣∣A |p〉 =

∫d3r′

∫d3r S† (r′,p′) A

(r′, r

)S (r,p)

which is the continuous generalization of (1.175). Using (1.183) we find

A(p′,p

)=

(1

2π~

)3 ∫d3r′

∫d3r e−ip

′·r′/~ A(r′, r

)eip·r/~

A(p′,p

)=

(1

2π~

)3 ∫d3r′

∫d3r e−i(p

′·r′−p·r)/~ A(r′, r

)

the inverse relation is obtained from

⟨r′∣∣A |r〉 =

∫d3p′

∫d3p

⟨r′∣∣p′〉

⟨p′∣∣A |p〉 〈p |r〉

⟨r′∣∣A |r〉 =

∫d3p′

∫d3p S

(r′,p′) A

(p′,p

)S† (r,p)

this is the continuous generalization of (1.176). From (1.183) we find

A(r′, r

)=

(1

2π~

)3 ∫d3p′

∫d3p eip

′·r′/~ A(p′,p

)e−ip·r/~

A(r′, r

)=

(1

2π~

)3 ∫d3p′

∫d3p ei(p

′·r′−p·r)/~ A(p′,p

)

1.43.4. The R and P operators

Let |ψ〉 be an arbitrary ket of Er and ψ (r) = ψ (x, y, z) the corresponding wave function. We define an operatorX in the form20 ∣∣ψ′⟩ = X |ψ〉such that in the |r〉 representation the associated wave function ψ′ (r) = ψ (x, y, z) is given by

ψ′ (x, y, z) = xψ (x, y, z) (1.186)

so in the |r〉 representation, it corresponds to the operator that multiplies the wave function by x. We shouldemphasize however, that the operator X is defined on the Er state space. Eq. (1.186) can be expressed by

〈r|X |ψ〉 = 〈r|ψ′〉 = ψ′ (r) = xψ (r) = x〈r |ψ〉

Of course, we can introduce the operators Y and Z in a similar way

〈r|X |ψ〉 = x〈r |ψ〉 , 〈r|Y |ψ〉 = y〈r |ψ〉 , 〈r|Z |ψ〉 = z〈r |ψ〉 ; |r〉 = |x, y, z〉 (1.187)

we can consider X,Y,Z as the “components” of a “vector operator” R, by now it only means a condensed notationinspired in the fact that x, y, z are the components of the ordinary vector r.

20The operator X does not belong to ß(Er), because for some square integrable functions ψ (r), the function ψ′ (r) defined in Eq.(1.186) is not square integrable.

Page 100: Mecanica Cuantica: Notas de Clase

100 CAPITULO 1. LINEAR OR VECTOR SPACES

These operators can be easily manipulated in the |r〉 representation. For instance, the element 〈ϕ|X |ψ〉 canbe calculated as

〈ϕ|X |ψ〉 =∫d3r 〈ϕ| r〉 〈r|X |ψ〉 =

∫d3r ϕ∗ (r) x ψ (r)

similarly, we define the operators Px, Py , Pz that forms the “vector operator” P, such that their action in the |p〉representation is given by

〈p|Px |ψ〉 = px〈p |ψ〉 , 〈p|Py |ψ〉 = py〈p |ψ〉 , 〈p|Pz |ψ〉 = pz〈p |ψ〉 ; |p〉 = |px, py, pz〉 (1.188)

however, when we require to work with both operators simultaneously, we should choose only one basis. Hence,it is important to know how the operator P acts in the |r〉 representation, and how the operator R acts in the|p〉 representation.

Let us first look for the way in which the operator P acts in the |r〉 representation. For this, we use Eqs.(1.181, 1.182, 1.188) to evaluate

〈r|Px |ψ〉 =∫d3p 〈r|p〉 〈p|Px |ψ〉 =

∫d3p 〈r|p〉px 〈p|ψ〉 =

(1

2π~

)3/2 ∫d3p eip·r/~pxψ (p) (1.189)

to evaluate this term we start with the expression of the Fourier transform Eq. (1.185)

ψ (r) =

(1

2π~

)3/2 ∫ ∞

−∞d3p eip·r/~ψ (p)

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[∂

∂x

(eip·r/~

)]ψ (p)

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[i

~pxe

ip·r/~]ψ (p)

we have that

~

i

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p pxe

ip·r/~ψ (p) (1.190)

if we continue derivating this expression we find

∂nψ (r)

∂xn=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[(i

~px

)neip·r/~

]ψ (p)

replacing (1.190) in (1.189) we obtain

〈r|Px |ψ〉 =~

i

∂ψ (r)

∂x

and similarly for Py, Pz. In vector form we summarize it as

〈r|P |ψ〉 = ~

i∇〈r |ψ〉 (1.191)

in the |r〉 representation, the operator P coincides with the differential operator acting on the wave functions.Let us calculate 〈ϕ|Px |ψ〉 in the |r〉 representation

〈ϕ|Px |ψ〉 =∫d3r 〈ϕ |r〉 〈r|Px |ψ〉 =

∫d3r ϕ∗ (r)

[~

i

∂x

]ψ (r) (1.192)

Page 101: Mecanica Cuantica: Notas de Clase

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 101

of great importance are the commutators among the components Pi, Ri. We shall calculate them in the |r〉representation, for instance

〈r| [X,Px] |ψ〉 = 〈r| (XPx − PxX) |ψ〉 = 〈r| (XPx) |ψ〉 − 〈r| (PxX) |ψ〉

= 〈r|X |Pxψ〉 − 〈r|Px |Xψ〉 = x 〈r|Pxψ〉 −~

i

∂x〈r|Xψ〉

= x 〈r|Px |ψ〉 −~

i

∂x〈r|X |ψ〉 = ~

ix∂

∂x〈r|ψ〉 − ~

i

∂x[x 〈r|ψ〉]

=~

ix∂

∂x〈r|ψ〉 − ~

ix∂

∂x[〈r|ψ〉] − ~

i〈r|ψ〉

so that

〈r| [X,Px] |ψ〉 = i~ 〈r|ψ〉since this is valid for any ket |ψ〉 and any generalized ket |r〉 of the basis, we conclude that

[X,Px] = i~I

it is usual to omit the identity operator since it is not important for practical calculations. In a similar way, wecan calculate the other commutators, to condense notation it is convenient to define

R1 ≡ X, R2 ≡ Y, R3 ≡ Z, P1 ≡ Px, P2 ≡ Py, P3 ≡ Pz

to write

[Ri, Rj ] = [Pi, Pj ] = 0 ; [Ri, Pj ] = i~δij (1.193)

they are called canonical commutation relations. These relations are intrinsic and should not depend on the basisin which we derive them.

We can show that R and P are hermitian operators. For example let us show that X is hermitian

〈ϕ|X |ψ〉 =

∫d3r 〈ϕ |r〉 〈r|X |ψ〉 =

∫d3r ϕ∗ (r) x ψ (r) =

[∫d3r ψ (r)∗ x ϕ (r)

]∗

〈ϕ|X |ψ〉 = 〈ψ|X |ϕ〉∗

since this is valid for arbitrary kets |ψ〉 and |ϕ〉, and taking into account Eq. (1.163) we conclude that X = X†.For Px we see that

〈ϕ|Px |ψ〉 =

∫d3p 〈ϕ |p〉 〈p|Px |ψ〉 =

∫d3p ϕ∗ (p) px ψ (p) =

[∫d3p ψ (p)∗ px ϕ (p)

]∗

〈ϕ|Px |ψ〉 = 〈ψ|Px |ϕ〉∗

and Px = P †x . The procedure is the same for the other components of R and P

R = R† , P = P†

There is an alternative proof of the hermiticity of P by using its action in the |r〉 representation given byEq. (1.191). Integrating Eq. (1.192) by parts we have

〈ϕ|Px |ψ〉 =~

i

∫dy dz

∫ ∞

−∞dx ϕ∗ (r)

[∂

∂x

]ψ (r)

=~

i

∫dy dz

[ϕ∗ (r) ψ (r)]x=∞

x=−∞ −∫ ∞

−∞dx ψ (r)

∂xϕ∗ (r)

Page 102: Mecanica Cuantica: Notas de Clase

102 CAPITULO 1. LINEAR OR VECTOR SPACES

since the scalar product 〈ϕ|ψ〉 is convergent, ϕ∗ (r) ψ (r) approaches zero when x → ±∞. Hence the first termon the right-hand side vanishes and we find

〈ϕ|Px |ψ〉 = −~

i

∫d3r ψ (r)

∂xϕ∗ (r) =

[~

i

∫d3r ψ∗ (r)

∂xϕ (r)

]∗

〈ϕ|Px |ψ〉 = 〈ψ|Px |ϕ〉∗

two things deserve attention, first the presence of the i factor is essential because i∂/∂x is hermitian but ∂/∂x isnot. Second, we have used explicitly the fact that |ψ〉 and |ϕ〉 belong to Er by assuming that the scalar product〈ϕ|ψ〉 is convergent, so this proof is not valid for generalized kets.

1.43.5. The eigenvalue problem for R and P

Let us calculate the matrix element X (r′, r) of the operator X in the basis |r〉

X(r′, r

)=

⟨r′∣∣X |r〉 = x′

⟨r′∣∣ r〉 = x′δ

(r− r′

)= xδ

(r− r′

)= x

⟨r′∣∣ r〉⟨

r′∣∣Xr〉 = x

⟨r′∣∣ r〉

so the components of the ket X |r〉 in the |r′〉 representation are equal to the ones of the ket |r〉 = |x, y, z〉multiplied by x

X |r〉 = x |r〉

we proceed in the same way for Y and Z

X |r〉 = x |r〉 , Y |r〉 = y |r〉 , Z |r〉 = z |r〉 ; |r〉 = |x, y, z〉

the kets |r〉 are eigenkets common to X,Y,Z. The set |r〉 of common eigenvectors of X,Y,Z forms a basisshowing that X,Y,Z is a complete set of commuting observables. On the other hand, the specification of thethree eigenvalues x0, y0, z0 determines uniquely the “normalized” eigenvector |r0〉 except for a phase eiθ. In the |r〉representation the coordinates of |r0〉 are δ (x− x0) δ (y − y0) δ (z − z0). Therefore, the set X,Y,Z constitutes aC.S.C.O. in Er.

Analogous reasoning shows that for the commuting observables Px, Py, Pz the eigenvalues and eigenvectorsare

Px |p〉 = px |p〉 , Py |p〉 = py |p〉 , Pz |p〉 = pz |p〉 ; |p〉 = |px, py, pz〉

since |p〉 is a basis the operators Px, Py, Pz are observables. Because the set of eigenvalues (p0x, p0y, p0z) deter-mines uniquely the vector |p0〉 the set Px, Py, Pz constitutes as C.S.C.O. in Er.

It worths pointing out that X is not a C.S.C.O. by itself in the Er state space because when x0 is specified y0and z0 can take any real values. Therefore, x0 is an infinitely degenerate eigenvalue. Notwithstanding in the statespace Ex of a particle in one dimension, X constitutes a C.S.C.O. since the eigenvalue x0 determines uniquely theeigenvector |x0〉, and its coordinates in the |x〉 representation are given by δ (x− x0).

It can also be shown that the set X,Py, Pz constitutes a C.S.C.O. since they commute with each other, andfor a set of eigenvalues x0, p0y, p0z there is a unique eigenvector whose associated wave function is

ψx0,p0y,p0z (x, y, z) = δ (x− x0)1

2π~ei(p0yy+p0zz)/~

of course, similar C.S.C.O. are built from the sets

Y, Px, Pz , Z,Px, Py

Page 103: Mecanica Cuantica: Notas de Clase

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 103

1.43.6. Some properties of Fourier transforms

We have seen that if a vector |ψ〉 acquires the value ψ (r) in the |r〉 basis, its value ψ (p) in the |p〉 basisis connected with ψ (r) through a Fourier transform Eqs. (1.184, 1.185)

ψ (p) =

(1

2π~

)3/2 ∫d3r e−ip·r/~ψ (r) (1.194)

ψ (r) =

(1

2π~

)3/2 ∫d3p eip·r/~ψ (p) (1.195)

It can be seen that if ψ depends only on |r| = r, then ψ depends only on |p| = p and is given by

ψ (r) = ψ (r) ⇒ ψ (p) = ψ (p) =1√2π~

2

p

∫ ∞

0r dr sin

pr

~ψ (r) (1.196)

to see it, let us apply a rotation R to the vector p

p′ ≡ Rp

and we use such a rotated vector in Eq. (1.194), taking into account that ψ (r) = ψ (|r|) = ψ (r)

ψ(p′) =

(1

2π~

)3/2 ∫d3r e−ip

′·r/~ψ (r)

now we use a new (rotated) variable r′ = Rr

ψ(p′) =

(1

2π~

)3/2 ∫d3r′ e−ip

′·r′/~ψ(r′)

(1.197)

and we take into account that the length r, the volume element, and the dot product are all conserved under arotation

d3r′ = d3r ; p′ · r′ = p · r ; ψ(r′)= ψ (r)

applying these invariances in Eq. (1.197), we see that

ψ(p′) = ψ (p)

since the rotation is arbitrary, it means that ψ only depends on |p| and not on its direction. Therefore, we canevaluate ψ (p) with Eq. (1.194), by choicing p = puz

ψ (p) =

(1

2π~

)3/2 ∫d3r e−ipz/~ψ (r) =

(1

2π~

)3/2 ∫ ∞

0r2 dr ψ (r)

∫ π

0dθ sin θ e−ipr cos θ/~

∫ 2π

0dϕ

ψ (p) = 2π

(1

2π~

)3/2 ∫ ∞

0r2 dr ψ (r)

∫ π

0dθ sin θ e−ipr cos θ/~ (1.198)

let us evaluate the integral in θ∫ π

0dθ sin θ e−ipr cos θ/~ =

∫ π

0dθ e−

i2pr cos θ/~ 2~

ipr

[ipr

2~sin θ e−

i2pr cos θ/~

]

=2~

ipr

∫ π

0dθ e−

i2pr cos θ/~ d

[e−

i2pr cos θ/~

]=

2~

ipr

1

2e−ipr cos θ/~

∣∣∣∣π

0

(1.199)

=2~

ipr

1

2

(eipr/~ − e−ipr/~

)=

2~

ipr

2i

2Im(eipr/~

)=

2~

prIm[cos(pr~

)+ i sin

(pr~

)]

∫ π

0dθ sin θ e−ipr cos θ/~ =

2~

prsin(pr~

)(1.200)

Page 104: Mecanica Cuantica: Notas de Clase

104 CAPITULO 1. LINEAR OR VECTOR SPACES

substituting Eq. (1.200) in Eq. (1.198) we have

ψ (p) = 2π

(1

2π~

)3/2 ∫ ∞

0r2 dr ψ (r)

(2~

prsin

pr

~

)

thus, Eq. (1.196) is obtained.

1.44. General properties of two conjugate observables

Two arbitrary observables Q and P are called conjugate if they obey the conmutation rule

[Q,P ] = i~ (1.201)

such couples of observables are frequently encountered in quantum mechanics. The position and momentumobservables are good examples. However, in what follows all properties are derived from the commutation rule(1.201) regardless the specific form of the operators. Let us define the operator S (λ) that depends on a realparameter λ as

S (λ) = e−iλP/~ (1.202)

since P is observable and so hermitian this operator is unitary

S† (λ) = eiλP/~ = S−1 (λ) = S (−λ) (1.203)

since P obviously commute with itself, Eq. (1.149) leads to

S (λ)S (µ) = S (λ+ µ) (1.204)

now we calculate the commutator [Q,S (λ)]. To do it, we take into account that [Q,P ] = i~ clearly commuteswith Q and P , therefore we can apply theorem 1.70, Eq. (1.136) to obtain

[Q,S (P )] = [Q,P ]S′ (P ) = i~

(− iλ

~

)e−iλP/~ = λS (P )

where we have written S (P ) instead of S (λ) to emphasize that when applying Eq. (1.136) we are considering Sas a function of the operator P (so the derivative is with respect to P ). Rewriting it in the old notation we have

[Q,S (λ)] = λS (λ) ⇒ QS (λ)− S (λ)Q = λS (λ)

QS (λ) = S (λ) [Q+ λ] (1.205)

1.44.1. The eigenvalue problem of Q

Suppose that Q has a non-zero eigenvector |q〉, with eigenvalue q

Q |q〉 = q |q〉 (1.206)

applying Eq. (1.205) on the vector |q〉 we have

QS (λ) |q〉 = S (λ) [Q+ λ] |q〉 = S (λ) [q + λ] |q〉Q [S (λ) |q〉] = [q + λ] [S (λ) |q〉] (1.207)

therefore, S (λ) |q〉 is also an eigenvector of Q with eigenvalue q + λ. Note that S (λ) |q〉 is non-zero because S (λ)is unitary so the norm of |q〉 is preserved. On the other hand, since λ can take any real value, we conclude that by

Page 105: Mecanica Cuantica: Notas de Clase

1.44. GENERAL PROPERTIES OF TWO CONJUGATE OBSERVABLES 105

starting with an eigenvector of Q, we can construct another eigenvector of Q with any real eigenvalue by applyingthe appropiate S (λ). Consequently, the spectrum of Q is continuous and consists of all real values.

Note that this result shows in particular that conjugate operators Q,P cannot exist in finite dimensional vectorspaces since for the latter the spectrum must be finite. Even they do not exist strictly in spaces of denumerabledimension such as L2, (for which the spectrum must be at most denumerable), so the eigenvectors |q〉 will formhyperbasis in L2.

Let us now show that if any given q is non-degenerate, then all the other eigenvalues of Q are also non-degenerate. For this we assume that the eigenvalue q+λ is at least two-fold degenerate and arrive to a contradiction.From this hypothesis, there are at least two orthogonal eigenvectors |q + λ, α〉 and |q + λ, β〉 associated with theeigenvalue q + λ

〈q + λ, β |q + λ, α〉 = 0 (1.208)

now consider the two vectors S (−λ) |q + λ, α〉 and S (−λ) |q + λ, β〉 from Eq. (1.207) we see that

QS (−λ) |q + λ, α〉 = [q + λ+ (−λ)]S (−λ) |q + λ, α〉 = qS (−λ) |q + λ, α〉QS (−λ) |q + λ, β〉 = [q + λ+ (−λ)]S (−λ) |q + λ, β〉 = qS (−λ) |q + λ, β〉

so S (−λ) |q + λ, α〉 and S (−λ) |q + λ, β〉 are two eigenvectors associated with the eigenvalue q. Calculating theinner product of them

〈q + λ, β|S† (−λ)S (−λ) |q + λ, α〉 = 〈q + λ, β |q + λ, α〉 = 0

where we have used Eq. (1.208) and the fact that S (λ) is unitary. Thus, we arrive to the fact that S (−λ) |q + λ, α〉and S (−λ) |q + λ, β〉 are two orthogonal (and so linearly independent) eigenvectors associated with q, contradictingthe hypothesis that q is non-degenerate. This result can be extended to find that the eigenvalues of Q must allhave the same degree of degeneracy.

We now look for the eigenvectors. We fix the relative phses of the diffrent eigenvectors of Q with respect tothe eigenvector |0〉 associated with the eigenvalue 0, by setting

|q〉 ≡ S (q) |0〉 (1.209)

applying S (λ) on both sides of (1.209) and using (1.204), we get

S (λ) |q〉 = S (λ)S (q) |0〉 = S (λ+ q) |0〉 = |q + λ〉

and the corresponding bra gives

〈q|S† (λ) = 〈q + λ|now using Eq. (1.203) we see that S† (λ) = S (−λ) from which

〈q|S (−λ) = 〈q + λ| ⇒ 〈q|S (λ) = 〈q − λ|

where we have replaced λ→ −λ in the last step. In summary the action of S (λ) on the eigenvectors |q〉 of Q aregiven by

S (λ) |q〉 = |q + λ〉 ; 〈q|S (λ) = 〈q − λ| (1.210)

now we can characterize the action of the operators P,Q and S (λ) in either the |q〉 basis or the |p〉 basis.

1.44.2. The action of Q,P and S (λ) in the |q〉 basis

Since Q is an observables the set of eigenvectors |q〉 of Q forms a basis. A given ket |ψ〉 in our Hilbert spacecan be written in the |q〉 basis as

ψ (q) ≡ 〈q |ψ〉

Page 106: Mecanica Cuantica: Notas de Clase

106 CAPITULO 1. LINEAR OR VECTOR SPACES

let us calculate the representation of Q |ψ〉 in this basis

〈q|Q |ψ〉 = q〈q |ψ〉 = qψ (q)

where we have used (1.206) and the hermiticity of Q. The action of Q on |ψ〉 reduces to a simple multiplicationwith its associated eigenvalue. The action of S (λ) on |ψ〉 in this basis is also simple

〈q|S (λ) |ψ〉 = 〈q − λ|ψ〉 = ψ (q − λ) ; S (λ) ≡ e−iλP/~ (1.211)

where we have used (1.210). Note that a function f (x− a) is the function that at the point x = x0 + a, takes onthe value f (x0), so that it is the function obtained from f (x)by a translation of +a. Therefore, Eq. (1.211, showsthat the action of S (λ) on |ψ〉 in the basis |q〉 , can be described as a translation of the wave function over adistance +λ parallel to the q−axis. So S (λ) is usually called the translation operator.

The action of P on |ψ〉 in the |q〉 basis is a bit longer to obtain. Let ε be an infinitesimal quantity such that

S (−ε) = eiεP/~ = I + iε

~P +O

(ε2)

therefore

〈q|S (−ε) |ψ〉 = 〈q|[I + i

ε

~P +O

(ε2)]

|ψ〉 = 〈q |ψ〉+ iε

~〈q|P |ψ〉+O

(ε2)

〈q|S (−ε) |ψ〉 = ψ (q) + iε

~〈q|P |ψ〉+O

(ε2)

(1.212)

on the other hand, from Eq. (1.211) we have

〈q|S (−ε) |ψ〉 = ψ (q + ε) (1.213)

and comparing (1.212) with (1.213) we have

ψ (q + ε) = ψ (q) + iε

~〈q|P |ψ〉+O

(ε2)⇒

~〈q|P |ψ〉 = ψ (q + ε)− ψ (q)−O

(ε2)

solving for 〈q|P |ψ〉 and taking into account that ε is infinitesimal we have

〈q|P |ψ〉 =~

ilımε→0

ψ (q + ε)− ψ (q)

ε

〈q|P |ψ〉 =~

i

d

dqψ (q) (1.214)

so the action of P on a ket in the |q〉 basis is that of ~iddq .

1.44.3. Representation in the |p〉 basis and the symmetrical role of P and Q

From Eq. (1.214), we can obtain the wave function vp (q) associated in the |q〉 basis, with the eigenvector|p〉 of P with eigenvalue p

vp (q) = 〈q |p〉 = 1√2π~

eipq/~

we can then write

|p〉 = 1√2π~

∫ ∞

−∞dqeipq/~ |q〉

Page 107: Mecanica Cuantica: Notas de Clase

1.45. DIAGONALIZATION OF A 2× 2 HERMITIAN MATRIX 107

a wave function in the |p〉 representation is given by

ψ (p) = 〈p |ψ〉 = 〈p|∫

|q〉 〈q|ψ〉 =∫

〈p |q〉 〈q|ψ〉

ψ (p) =1√2π~

∫ ∞

−∞dqeipq/~ψ (q)

which is the Fourier transform of ψ (q).

It can be shown that the action of the P operator in the |p〉 repesentation is associated with multiplicationby p, while the representation of X corresponds to the operations i~d/dp. Therefore, the results are symmetricalin the |q〉 and |p〉 bases. It comes from the fact that we can interchange Q and P with no more cost thanchanging the sign of the conmutator in (1.201). The analogous of the translation operation in the |p〉 basis isthe operator defined by

T (α) = eiαQ/~

which acts as a translation in the momentum space. The arguments developed for the basis |q〉 can be repeatedin the basis |p〉 by interchanging P by Q and i by −i everywhere. As a matter of curiosity, in Classical Mechanics,the Hamilton equations are also symmetrical in the conjugate variables (Q,P ) and we can interchange them withno more cost that a change in sign.

We emphasize again that the results obtained in this section only depend on the canonica rule of commutation(1.201) and not on the explicit form of the Q and P operators.

1.45. Diagonalization of a 2× 2 hermitian matrix

This example illustrates many concepts introduced in the eigenvalue problem in a quite simple way. Further,it is useful in many practical calculations involving systems of two states in quantum mechanics. The eigenvalueproblem is very easy but the determination of eigenvectors could lead easily to complicated expressions. We shalldetermine the eigenvalues and find the eigenvectors in a way easy to handle.

1.45.1. Formulation of the problem

Consider an hermitian operator R in a two dimensional Hilbert space. Its matrix representation in a givenorthonormal basis |ϕ1〉 , |ϕ2〉 reads

H ≡(

〈ϕ1|R |ϕ1〉 〈ϕ1|R |ϕ2〉〈ϕ2|R |ϕ1〉 〈ϕ2|R |ϕ2〉

)=

(H11 H12

H21 H22

)(1.215)

an hermitian operator is described by an hermitian matrix when the basis used is orthonormal. Therefore,

H11 = H∗11 ; H22 = H∗

22 ; H12 = H∗21

so that diagonal elements are real. Let us express the matrix in Eq. (1.215) in the equivalent form

H =

(12 (H11 +H22) 0

0 12 (H11 +H22)

)+

(12 (H11 −H22) H12

H21 −12 (H11 −H22)

)

H =1

2(H11 +H22)

(1 00 1

)+

1

2(H11 −H22)

(1

2H∗21

(H11−H22)2H21

(H11−H22)−1

)

H =1

2(H11 +H22) I +

1

2(H11 −H22) K ; K ≡

(1

2H∗21

(H11−H22)2H21

(H11−H22)−1

)(1.216)

Page 108: Mecanica Cuantica: Notas de Clase

108 CAPITULO 1. LINEAR OR VECTOR SPACES

and I is the identity matrix. Let |ψ±〉 be two linearly independent eigenvectors of K

K |ψ±〉 = κ± |ψ±〉 (1.217)

applying the ket |ψ±〉 on Eq. (1.216) we have

H |ψ±〉 =1

2(H11 +H22) I |ψ±〉+

1

2(H11 −H22) K |ψ±〉

H |ψ±〉 =1

2[(H11 +H22) + (H11 −H22)κ±] |ψ±〉

therefore |ψ±〉 are also eigenvectors of H with eigenvalues

H |ψ±〉 = E± |ψ±〉 ; E± ≡ 1

2[(H11 +H22) + (H11 −H22) κ±] (1.218)

note that the problem reduces to find the eigenvectors of K (which coincide with the ones of H) and also itseigenvalues (which are related with the eigenvalues ofH through Eq. 1.218). Solving the problem forK is equivalentto choose the origin of the eigenvalues in (H11 +H22) /2 = (TrH)/2. Note that this shift is independent of thebasis chosen to write H.

1.45.2. Eigenvalues and eigenvectors of K

For simplicity we define the angles θ, ϕ in terms of the matrix elements Hij as follows

tan θ =2 |H21|

H11 −H22, 0 ≤ θ < π (1.219)

H21 = |H21| eiϕ , 0 ≤ ϕ < 2π (1.220)

so ϕ is the argument of the term H21. Matrix K in Eq. (1.216) can be written as

K =

(1 2|H21|e−iϕ

(H11−H22)2|H21|eiϕ(H11−H22)

−1

)=

(1 tan θ e−iϕ

tan θ eiϕ −1

)(1.221)

the characteristic equation of matrix (1.221) yields

det [K − λI] = 0 = (1− κ) (−1− κ)− tan2 θ ⇒κ2 − 1− tan2 θ = 0 ⇒ κ2 = 1 + tan2 θ =

1

cos2 θ

the eigenvalues of K read

κ+ =1

cos θ, κ− = − 1

cos θ(1.222)

and they are real as expected. We can express 1/ cos θ in terms of the matrix elements Hij by using Eqs. (1.219)and the fact that cos θ and tan θ are both of the same sign since 0 ≤ θ < π.

1

cos θ=

√1 + tan2 θ =

√1 +

4 |H21|2

(H11 −H22)2 =

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2

κ± = ± 1

cos θ= ±

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2 (1.223)

Page 109: Mecanica Cuantica: Notas de Clase

1.45. DIAGONALIZATION OF A 2× 2 HERMITIAN MATRIX 109

let us find the eigenvectors of K. We denote as a and b the components of |ψ+〉 in the basis |ϕ1〉 , |ϕ2〉. FromEqs. (1.221, 1.222) this eigenvector must satisfy

(1 tan θ e−iϕ

tan θ eiϕ −1

)(ab

)=

1

cos θ

(ab

)

of course only one of the two equations is linearly independent since only quotients between the coefficients canbe determined, therefore

a+ b tan θ e−iϕ =a

cos θ⇒ b tan θ e−iϕ = a

(1

cos θ− 1

)

multiplying by eiϕ/2 and defining 2α ≡ θ this equation yields

bsin 2α

cos 2αe−iϕ/2 = a

(1− cos 2α

cos 2α

)eiϕ/2

b sin 2α e−iϕ/2 = a (1− cos 2α) eiϕ/2

b (2 sinα cosα) e−iϕ/2 = a[1−

(1− 2 sin2 α

)]eiϕ/2

2b sinα cosα e−iϕ/2 = 2a sin2 α eiϕ/2

b(cosα e−iϕ/2

)= a sinα eiϕ/2

in terms of θ we get

b cosθ

2e−iϕ/2 = a sin

θ

2eiϕ/2 (1.224)

we demand normalization with the additional requirement of positivity for the coefficient a, so we have

|a|2 + |b|2 = 1 ⇒ |a|2 +∣∣∣∣∣a sin θ

2 eiϕ/2

cos θ2 e−iϕ/2

∣∣∣∣∣

2

= 1

|a|2 +∣∣∣∣a tan

θ

2eiϕ∣∣∣∣2

= 1 ⇒ |a|2 + |a|2 tan2 θ2= 1

|a|2[1 + tan2

θ

2

]= 1 ⇒ |a|2 = cos2

θ

2

so that

a = cosθ

2≥ 0 since 0 ≤ θ < π (1.225)

replacing (1.225) in (1.224) we get

b cosθ

2e−iϕ/2 = cos

θ

2sin

θ

2eiϕ/2 ⇒ b = sin

θ

2eiϕ

so that the eigenvector |ψ+〉′ associated with the eigenvalue κ+ reads

|ψ+〉′ = a |ϕ1〉+ b |ϕ2〉 = cosθ

2|ϕ1〉+ sin

θ

2eiϕ |ϕ2〉

it is clear that |ψ+〉 ≡ e−iϕ/2 |ψ+〉′ is also an eigenvector of K with the same eigenvalue κ+ and this vector looksmore symmetrical. Thus, we define the eigenvector |ψ+〉 as21

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉+ sin

θ

2eiϕ/2 |ϕ2〉 (1.226)

21This is equivalent to define the phase of the coefficient a as −ϕ/2 instead of zero, in the process of normalization.

Page 110: Mecanica Cuantica: Notas de Clase

110 CAPITULO 1. LINEAR OR VECTOR SPACES

an analogous calculation gives the eigenvector of K corresponding to κ− = −1/ cos θ

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉+ cos

θ

2eiϕ/2 |ϕ2〉 (1.227)

the eigenvalues of H are obtained by combining Eqs. (1.218, 1.223)

E± ≡ 1

2[(H11 +H22) + (H11 −H22) κ±]

=1

2

[(H11 +H22)± (H11 −H22)

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2

]

E± ≡ 1

2

[(H11 +H22)±

√(H11 −H22)

2 + 4 |H21|2]

it worths saying that the eigenvalue problem can be solved directly without resorting to the angles θ and ϕ definedin Eq. (1.219, 1.220). This procedure is advantageous only if we have to calculate the eigenvectors as well.

1.45.3. Eigenvalues and eigenvectors of H

Let us summarize our results. We consider an hermitian operator R in a two dimensional Hilbert space, andits matrix representation in the orthonormal basis |ϕ1〉 , |ϕ2〉

H ≡(

〈ϕ1|R |ϕ1〉 〈ϕ1|R |ϕ2〉〈ϕ2|R |ϕ1〉 〈ϕ2|R |ϕ2〉

)=

(H11 H12

H21 H22

)(1.228)

its eigenvalues and eigenvectors are given by

E± ≡ 1

2

[(H11 +H22)±

√(H11 −H22)

2 + 4 |H21|2]

(1.229)

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉+ sin

θ

2eiϕ/2 |ϕ2〉 (1.230)

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉+ cos

θ

2eiϕ/2 |ϕ2〉 (1.231)

tan θ =2 |H21|

H11 −H22, H21 = |H21| eiϕ ; 0 ≤ θ < π , 0 ≤ ϕ < 2π (1.232)

as a matter of consistence we can see that

E+ + E− = H11 +H22 = TrH , E+E− = H11H22 − |H12|2 = detH

in agreement with Eq. (1.93, 1.94). From Eq. (1.229), the spectrum becomes degenerate i.e. E+ = E− when(H11 −H22)

2 + 4 |H21|2 = 0. That is when H11 = H22 and H12 = H21 = 0. So a 2 × 2 hermitian matrix has adegenerate spectrum if and only if it is proportional to the identity.

It worths remarking that although functions of θ are expressed simply in terms of the Hij elements by means ofEqs. (1.232), it is not the case when functions of θ/2 appears. Thus, when we do calculations with the eigenvectors(1.230, 1.231), it is convenient to keep the results in terms of θ/2 up to the end of the calculation instead ofreplacing it in terms of the Hij quantities.

Page 111: Mecanica Cuantica: Notas de Clase

Capıtulo 2

Construccion fenomenologica de lospostulados de la mecanica cuantica

Nuestro presente entendimiento de la naturaleza requiere reevaluar las leyes de la mecanica clasica, especial-mente en lo referente a los fenomenos atomicos y subatomicos. No obstante, existen manifestaciones macroscopicasde los procesos cuanticos. A manera de ejemplo, la existencia misma de los solidos solo se puede explicar en uncontexto cuantico, y los modelos sobre calor especıfico de los solidos no se pueden explicar con un modelo clasico.

A finales del siglo diecinueve, se identificaban en la fısica dos tipos de entidades bien diferenciadas: la materia yla radiacion. Las leyes de Newton permitıan explicar los fenomenos relativos a la materia en la escala macroscopicay las ecuaciones de Maxwell proporcionaban una excelente descripcion de la dinamica de la radiacion1. Finalmente,la interaccion de la materia con la radiacion la proporcionaba la ley de fuerza de Lorentz. Es notable el hechode que la teorıa de Maxwell habia logrado la unificacion de fenomenos que antes se consideraban separados: laelectricidad, el magnetismo y la optica.

No obstante, a finales del siglo diecinueve y principios del veinte una serie de experimentos condujeron areevaluar la estructura fundamental de la materia y ademas a replantear las leyes que rigen a estas estructurasfundamentales. La mecanica cuantica es entonces el resultado de estos replanteamientos. Vale decir por supuestoque al menos en principio, el mundo macroscopico tambien se rige por la leyes de la cuantica, si bien para lamayorıa de fenomenos a escala humana, la Fısica clasica representa una descripcion mucho mas simple y al mismotiempo bastante adecuada.

A continuacion se realizara una breve descripcion de los experimentos que dieron lugar a las nuevas ideas sobreel mundo microscopico, con el fin de dejar claros los puntos que es necesario reevaluar en la mecanica clasica. Ladescripcion de estos experimentos no pretende ser completa ni exhaustiva, solo pretende mostrar las ideas queestos nos arrojan sobre el comportamiento de la naturaleza a nivel microscopico (atomico y subatomico). Para unestudio mas detallado de estos experimentos el lector puede recurrir a los textos estandar sobre Fısica Moderna(ver por ejemplo Ref. [1]).

2.1. La radiacion del cuerpo negro

Un cuerpo negro tiene la capacidad de absorber toda la radiacion que incide sobre el, a su vez esto lo convierteen un emisor perfecto. Utilizando argumentos de la termodinamica y la mecanica estadıstica, Rayleigh y Jeanspredijeron el espectro del cuerpo negro utilizando la distribucion de Boltzmann. Sin embargo, las predicciones deRayleigh y Jeans estaban muy lejos del espectro experimental en el regimen de longitudes de onda corta, fenomenoconocido como la “catastrofe del ultravioleta”. Es bien conocido que la energıa asociada a una frecuencia particularde la radiacion del cuerpo negro se relaciona con la energıa de una partıcula cargada en la pared de una cavidaddel cuerpo negro oscilando sinusoidalmente a la misma frecuencia. Originalmente, Max Planck cuantizo la energıa

1Las ondas mecanicas podıan explicarse en ultimo termino con las leyes de Newton.

111

Page 112: Mecanica Cuantica: Notas de Clase

112 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

de la partıcula oscilante asumiendo que cada una de estas partıculas solo puede tener una energıa εn que seamultiplo entero de una energıa fundamental ε0 = hν siendo ν la frecuencia de oscilacion y siendo h una constanteuniversal que se ajusta experimentalmente, por lo tanto

εn = nhν , n = 0, 1, 2, 3, 4, . . . (2.1)

recalculando el espectro con este postulado, Planck pudo reproducir el espectro del cuerpo negro para todaslas longitudes de onda. Posteriormente, Planck observo que esto era equivalente a cuantizar directamente lasondas electromagneticas estacionarias asociadas a cada frecuencia y que oscilan sinusoidalmente. De hecho, Planckgeneraliza su postulado diciendo que la Ec. (2.1) describe la energıa total asociada a cualquier entidad fısica cuyaunica coordenada generalizada efectua oscilaciones armonicas simples (variaciones sinusoidales en el tiempo).

2.2. El efecto fotoelectrico

Cuando se hace incidir luz ultravioleta sobre la superficie de un metal, se emiten electrones provenientes dedicho metal. A principios del siglo XX, Lenard realizo experimentos en donde los electrones extraıdos con luzultravioleta de la superficie metalica (fotocatodo) son acelerados por una diferencia de potencial con respecto aotro electrodo. Al medir la corriente que llegaba al segundo electrodo como funcion del voltage entre los electrodos,observo que todavıa llegaba corriente incluso cuando el potencial era retardante para cargas negativas indicandoque los electrones son emitidos con energıa cinetica que no es despreciable. La forma de la curva indico queno todos los fotoelectrones son emitidos con la misma energıa cinetica pero existe un voltaje retardante decorte V = −Vmax luego del cual cesa la fotocorriente. Este voltage de corte sugiere la existencia de una energıamaxima bien definida para los fotoelectrones dada por Emax = eVmax siendo e la magnitud de la carga electronica.Los fotoelectrones de maxima energıa son los que provienen de la superficie del fotocatodo en tanto que losfotoelectrones de menor energıa provienen del interior del fotocatodo y pierden energıa cinetica al llegar a lasuperficie, esto nos indica que Emax es una buena medida de la energıa transmitida a los electrones en el procesofotoelectrico. Lenard encontro ademas que la corriente fotoelectrica es directamente proporcional a la intensidadluminosa incidente para voltages acelerantes. Sin embargo, observo tambien que el potencial de corte retardanteV = −Vmax es independiente de la intensidad luminosa. En consecuencia, la energıa maxima adquirida por loselectrones es independiente de la intensidad luminosa incidente.

En el marco de la teorıa clasica, se puede demostrar que la energıa cinetica promedio de los electrones sometidosa la luz ultravioleta es proporcional al campo electrico al cuadrado (asociado a la onda incidente) y por tanto esproporcional a la intensidad incidente. Esto entra en conflicto directo con el hecho de que la energıa adquirida porlos electrones de la superficie del fotocatodo sea independiente de la intensidad luminosa. Un problema mas seriosurge cuando se intenta calcular el tiempo necesario para que los fotoelectrones adquieran la energıa suficiente parallegar al otro electrodo. Este tiempo se estimo en unos ∼ 100seg bajo la hipotesis clasica de que la energıa luminosase distribuye uniformemente sobre frentes de onda esfericos cuyo centro es la fuente. Experimentos posterioresrevelaron que el tiempo de absorcion no superaba los ∼ 10−9seg.

Lo anterior llevo a Einstein en 1905 a generalizar el postulado de Planck enunciando que el contenido energeticode una onda electromagnetica de frecuencia ν en una fuente de radiacion (onda libre) tambien puede tener solovalores de la forma nhν siendo n entero no-negativo y ν la frecuencia de la onda que se propaga. Esto implica queal pasar la fuente de un estado de energıa nhν a otro de energıa (n− 1) hν, la fuente emite un paquete de energıaelectromagnetica con energıa hν. Einstein propuso ademas que este paquete de energıa (foton) esta localizadoinicialmente en una pequena region del espacio y permanece localizado cuando se aleja de la fuente luminosa convelocidad c, en contraste con la expansion caracterıstica de un frente de onda clasico. Este paquete o cuanto deenergıa denominado foton posee una energıa ε = hν. Postulo ademas que en el proceso fotoelectrico un cuanto eracompletamente absorbido por el fotoelectron.

En primera instancia, el hecho de que el cuanto permaneciera localizado y fuese completamente absorbidopermitıa que los fotoelectrones absorbieran la energıa necesaria para formar la fotocorriente de manera casi ins-tantanea, eliminando la incompatibilidad con el tiempo de absorcion que se presentaba con las ondas clasicas.

Page 113: Mecanica Cuantica: Notas de Clase

2.3. EL EFECTO COMPTON 113

Por otro lado, definamos ∆E como la energıa necesaria para que un electron pueda llegar al otro electrodo,esta sera igual a la energıa necesaria para llegar a la superficie, mas la energıa W necesaria para salir del materialvenciendo la fuerzas superficiales atractivas. El mecanismo fotoelectrico imparte una energıa hν al fotoelectron ysi esta energıa es mayor que ∆E el electron puede escapar de la superfice del fotocatodo. Es claro que para loselectrones de la superficie ∆E = W de modo que la maxima energıa cinetica con la que llegan los fotoelectronesal otro electrodo es

Emax = hν −W

mostrando claramente que tal energıa maxima es funcion lineal de la frecuencia de la radiacion incidente, pero esindependiente de su intensidad. Estas predicciones fueron corroboradas por Millikan en 1916.

2.3. El efecto compton

En 1923, Compton realizo un experimento en el cual un haz aproximadamente monocromatico de rayos X delongitud de onda λ0, incidıa en una placa metalica. Compton encontro que la radiacion dispersada contenıa unpico de intensidad asociado a la longitud de onda λ1 > λ0, ademas del pico asociado a λ0. A la presencia de estepico en λ1 se le conoce como efecto Compton. En la discusion subsecuente nos concentraremos en la explicaciondel pico de intensidad en λ1.

La observaciones mostraban que λ1 aumentaba a medida que se incrementaba el angulo de dispersion θ, peroera independiente del material de la lamina metalica. Puesto que λ1 es siempre mayor que λ0, la frecuenciaν1 = c/λ1 de la radiacion dispersada disminuye al aumentar el angulo θ de dispersion.

Adicionalmente, si asumimos que ν1 es proporcional a la energıa E1 del cuanto asociado a la radiacion (comolo sugiere el efecto fotoelectrico), la dependencia de E1 con θ es cualitativamente similar a la dependencia angularde la energıa de una partıcula dispersada por otra partıcula. Por supuesto esta dispersion debe ser relativista,puesto que los fotones son eminentemente relativistas.

El procedimiento de Compton fue en consecuencia, combinar la teorıa de la dispersion clasica relativista entreparticulas con la relacion frecuencia energıa asumida para el cuanto de radiacion (foton) en el efecto fotoelectrico.Consideremos entonces un cuanto o paquete localizado asociado a la radiacion electromagnetica (rayos X en estecaso), en la cual se cumple la relacion

E = hν (2.2)

donde ademas el momento lineal del foton es p. La energıa total relativista de una partıcula de masa en reposom0 es

E =m0c

2

√1− v2

c2

(2.3)

y dado que la velocidad del foton es c, su masa en reposo debe ser nula. Por tanto, su energıa E es totalmentecinetica. Adicionalmente, la relacion entre el momento lineal y la energıa de una partıcula relativista esta dadapor

E2 = p2c2 +(m0c

2)2

(2.4)

puesto que m0 = 0 para el foton, esta relacion se convierte en

p =E

c=hν

c=h

λ(2.5)

Ahora bien, puesto que la frecuencia ν1 donde se obtiene un pico de intensidad (ν1 < ν0) de la radiaciondispersada, es independiente del material de la hoja metalica, es razonable suponer que en la dispersion no participael atomo completo. En consecuencia, otra de las suposiciones fundamentales de Compton, fue que los fotones sedispersaban en virtud de las colisiones entre estos y los electrones libres en la lamina, que estan inicialmente enreposo. Esta suposicion es razonable si tenemos en cuenta que un cuanto de rayos X tiene una energıa mayor

Page 114: Mecanica Cuantica: Notas de Clase

114 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

en varios ordenes de magnitud a la energıa de un cuanto de luz ultravioleta, y teniendo en cuenta que a su vezel efecto fotoelectrico sugiere que la energıa de un cuanto de luz ultravioleta, es comparable con la energıa deligadura del electron en el metal.

Consideraremos entonces una colision entre un foton y un electron libre en reposo. Por simplicidad elegimos eleje X a lo largo del momento lineal incidente p0 del foton localizado. Denotaremos como (E0, p0) a la energıa y lamagnitud del momento lineal del foton incidente, (E1, p1) seran la energıa y el momento lineal del foton dispersadoen un angulo θ (con respecto a X). Finalmente, (T, p) son la energıa cinetica y el momento lineal del electrondispersado en un angulo φ con respecto al eje X. La conservacion del momento lineal en X nos dice que

p0 = p1 cos θ + p cosφ (2.6)

y la conservacion del momento lineal en Y nos dice que

p1 sin θ = p sinφ (2.7)

elevando al cuadrado ambas ecuaciones se obtiene

(p0 − p1 cos θ)2 = p2 cos2 φ ; p21 sin

2 θ = p2 sin2 φ

y sumando estas expresiones, obtenemos

p20 + p21 − 2p0p1 cos θ = p2 (2.8)

por otro lado, aplicando la conservacion de la energıa total relativista antes y despues de la dispersion, se tieneque

E0 +m0c2 = E1 + T +m0c

2 ⇒E0 − E1 = T

donde m0 es la masa en reposo del electron. Aplicando la relacion (2.5), que es valida solo para el foton, seencuentra que

c (p0 − p1) = T (2.9)

Adicionalmente, aplicando la relacion (2.4), al electron dispersado tenemos que

(T +m0c

2)2

= p2c2 +(m0c

2)2 ⇒ T 2 + 2Tm0c

2 = p2c2

T 2

c2+ 2Tm0 = p2 (2.10)

sustituyendo p2 y T de las Ecs. (2.8, 2.9) en la Ec. (2.10) resulta

c2 (p0 − p1)2

c2+ 2c (p0 − p1)m0 = p20 + p21 − 2p0p1 cos θ ⇒ −2p0p1 + 2m0c (p0 − p1) = −2p0p1 cos θ ⇒

m0c (p0 − p1) = p0p1 (1− cos θ) ⇒ (p0 − p1)

p0p1=

1

m0c(1− cos θ) ⇒

(1

p1− 1

p0

)=

1

m0c(1− cos θ)

multiplicando por h y usando la relacion (2.5) para el foton, queda finalmente

(λ1 − λ0) = λC (1− cos θ) ; λC ≡ h

m0c≃ 0,02426 × 10−8cm (2.11)

Page 115: Mecanica Cuantica: Notas de Clase

2.4. ESPECTROSCOPIA, ESTABILIDAD DEL ATOMO Y TEORIA DE BOHR 115

donde λC se denomina la longitud de onda de Compton. La Ec. (2.11) se conoce como ecuacion de Compton.Esta ecuacion predice que el aumento en la longitud de onda asociada al segundo pico de resonancia con respecto ala longitud de onda incidente, depende solamente del angulo de dispersion y de la constante universal λC , pero esindependiente del material de la hoja metalica y de la longitud de onda incidente. La corroboracion experimentalfue realizada por diversos autores tales como Bothe, Wilson, Geiger, y Bless entre los anos 1923 y 1927.

Este experimento ademas de dar una prueba convincente de la existencia del cuanto de radiacion (foton),muestra que este puede comportarse como partıcula en un experimento de dispersion. Vimos anteriormente queel efecto fotoelectrico tambien proporciona evidencia de la existencia de los cuantos, que ademas se suponenlocalizados como las partıculas. A priori pareciera darse un retroceso a una imagen corpuscular de la radiacion. Noobstante, la radiacion electromagnetica tiene ciertas propiedades como la difraccion, que solo puede ser explicadaen terminos de movimiento ondulatorio. Esto nos conduce a considerar que en la radiacion electromagneticael comportamiento ondulatorio y corpuscular coexisten, fenomeno que se conoce como dualidad onda-partıcula.Experimentos posteriores nos permitiran profundizar sobre esta naturaleza dual en el mundo microscopico.

2.4. El problema espectroscopico, la estabilidad del atomo y la teorıa de

Bohr

Con el advenimiento del modelo atomico de Rutherford, en el cual el atomo estaba constituıdo por un pequenonucleo de carga positiva con la carga negativa (electrones) orbitando en la periferia, surge el problema de laestabilidad del atomo. Esto debido a que la electrodinamica clasica predice que una carga acelerada radıa emitiendoenergıa. Por tanto, los electrones al orbitar deberıan radiar perdiendo energıa y provocando el colapso del electronhacia el nucleo. El hecho de que la estructura atomica fuese estable constituyo entonces un reto para la Fısica deprincipios del siglo XX.

Por otra parte, surgıa el problema de la discretizacion de los espectros atomicos. No entraremos en detalles sobrelos montajes experimentales para medir estos espectros. Mencionaremos simplemente, que cuando una descargaelectrica atraviesa una region que contiene un gas monoatomico las colisiones de los atomos con los electronesy con otros atomos hacen que los atomos adquieran una energıa mayor que la normal. Al regresar a su estadonormal, los atomos liberan la energıa excedente en forma de radiacion electromagnetica, la cual esta compuestapor ondas de diferente longitud de onda. La observacion de estas longitudes de onda que componen a la radiacion(lıneas espectrales) mostro que la radiacion electromagnetica emitida por un atomo libre consiste solo de ciertaslongitudes de onda, es decir el espectro es discreto2. Adicionalmente, se observo que cada tipo de atomo tienesu propio espectro, es decir un conjunto caracterıstico de longitudes de onda, hecho que es de gran importanciapractica.

Ahora bien, el espectro del atomo de Hidrogeno es relativamente simple en virtud de la simplicidad de suestructura atomica. En dicho espectro se observa que la distancia en longitudes de onda de dos lıneas contiguasdecrece al disminuir la longitud de onda de las lıneas hasta llegar a una lınea lımite de convergencia que denotamospor λ∞ = 3645,6 A. La regularidad y simplicidad de este espectro llevo a buscar formulas empıricas que revelaranel patron de longitudes de onda del espectro de emision. Adicionalmente, se observo que la estructura de las lıneasespectrales para atomos alcalinos (con un solo electron en la capa externa), obedece a un patron similar. Despuesde muchos analisis se encontro que en terminos del numero de onda k = λ−1 la formula empırica

k = R

[1

(m− a)2− 1

(n− b)2

]

describıa muy bien la distribucion de lıneas espectrales de los atomos alcalinos, donde R, a y b son constantespropias del elemento, en tanto que m y n son enteros positivos. La constante R es conocida como constante de

2Esto contrasta por ejemplo, con el espectro contınuo de la radiacion electromagnetica emitida por la superficie de los solidos a altatemperatura.

Page 116: Mecanica Cuantica: Notas de Clase

116 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

Rydberg. Para el atomo de Hidrogeno en particular, se tiene que a = b = 0 y R ≡ RH = 109677,576 cm−1 y seescribe

k = RH

[1

m2− 1

n2

], n > m (2.12)

las series de numeros de onda fueron clasificadas de acuerdo a valores fijos de m. Hablamos entonces de la seriede Lyman (m = 1), serie de Balmer (m = 2), Paschen (m = 3), Brackett (m = 4) y Pfund (m = 5).

Hemos descrito el espectro de emision. No obstante, tambien existe el espectro de absorcion, para el cualse usa una fuente que emite un espectro contınuo cuya radiacion se hace incidir sobre un recipiente de vidrio quecontiene el gas monoatomico que se desea investigar. Al medir el espectro que emite el gas monoatomico despuesde haber absorbido la radiacion contınua, se observa que el espectro es contınuo pero faltan algunas lıneas muyespecıficas, y que corresponden a las lıneas del espectro que han sido suprimidas del espectro contınuo emitidopor la fuente, y que debieron ser absorbidas por los atomos del gas. Se observo que para cada elemento, a cadalınea del espectro de absorcion le corresponde una lınea en el espectro de emision, pero lo recıproco no es cierto:solo ciertas lıneas de emision se manifiestan en el espectro de absorcion. En el espectro de absorcion del atomo deHidrogeno, normalmente solo aparecen las lıneas correspondientes a la serie de Lyman; pero cuando el gas esta amuy alta temperatura (por ejemplo en la superficie de una estrella), se observan las lıneas de la serie de Balmeren el espectro de absorcion.

2.4.1. La teorıa de Bohr

Los postulados que describiremos a continuacion, enunciados por Niels Bohr en 1913, permitieron dar cuentarazonablemente de los siguientes fenomenos: (a) La estabilidad del atomo, (b) La naturaleza discreta de losespectros de emision y absorcion, (c) La descripcion especıfica del espectro del atomo de Hidrogeno, (d) Ladiferencia entre el espectro de absorcion y el de emision. Tales postulados fueron los siguientes:

1. En el atomo, un electron se mueve en una orbita circular alrededor del nucleo, bajo la influencia de lainteraccion coulombiana entre el nucleo y el electron, y obedeciendo a las leyes de la mecanica clasica.

2. De la infinidad de orbitas clasicamente permitidas, el electron solo puede moverse en aquellas para las cualesel momento angular orbital L es un multiplo entero de la cantidad ~ ≡ h/2π. Esto es

L = n~ = nh/2π , n = 1, 2, 3, . . . (2.13)

3. A pesar de que el electron esta en permanente aceleracion, se mueve en una orbita permitida sin radiarenergıa electromagnetica, de modo que su energıa total E, permanece constante.

4. Un electron emite energıa electromagnetica, solo cuando se mueve de una orbita permitida (con energıa Ei)a otra orbita permitida (con energıa Ef ), de manera discontınua. La frecuencia de la radiacion permitidaesta dada por

ν =Ei − Ef

h(2.14)

Con estos postulados, Bohr da cuenta de la estabilidad del atomo e introduce la cuantizacion del momentoangular, en contraste con los postulados de cuantizacion antes descritos, los cuales involucran la cuantizacion dela energıa.

Notese que el cuarto postulado Ec. (2.14) esta ıntimamente relacionado con el postulado de Einstein, ya queE = Ei − Ef es la energıa del cuanto (foton) que se emite, y por tanto E = hν.

Page 117: Mecanica Cuantica: Notas de Clase

2.4. ESPECTROSCOPIA, ESTABILIDAD DEL ATOMO Y TEORIA DE BOHR 117

2.4.2. Predicciones de la teorıa de Bohr para atomos con un electron

Vamos a estudiar el caso de un atomo de masa M y carga +Ze, con un electron de masa m y carga −e. Estees el caso del Hidrogeno (Z = 1), el helio ionizado He+ (Z = 2), el litio doblemente ionizado Li++(Z = 3), etc.Supongamos que el electron se mueve en trayectoria circular alrededor del nucleo. Por simplicidad, asumiremosque el nucleo permanece fijo en un sistema de referencia inercial, lo cual es razonable teniendo en cuenta que lamasa del nucleo es mucho mayor que la del electron. La condicion de estabilidad de esta orbita circular es que lafuerza coulombiana iguale a la fuerza centrıpeta necesaria para mantener la trayectoria circular.

Ze2

r2= m

v2

r(2.15)

siendo v la rapidez del electron y r el radio del cırculo. El momento angular esta dado por

L = mvr

aplicando la condicion de cuantizacion Ec. (2.13), se tiene que

mvr = n~ ⇒ v =n~

mr, n = 1, 2, 3, 4, . . . (2.16)

y sustituyendo esta rapidez en la Ec. (2.15) queda

Ze2 = mrv2 = mrn2~2

m2r2=n2~2

mr

despejando r vemos que el radio estarıa tambien cuantizado

r =n2~2

mZe2; n = 1, 2, 3, 4, . . . (2.17)

reemplazando (2.17) en (2.16) tenemos

v =n~

m

1

r=n~

m

mZe2

n2~2=Ze2

n~; n = 1, 2, 3, 4, . . . (2.18)

vemos que tanto la velocidad como el radio estan cuantizados como consecuencia de la cuantizacion del momentoangular. Similarmente es facil ver que los postulados de Bohr tambien conducen a la cuantizacion de la energıa.Para verlo, tendremos en cuenta que la energıa potencial coulombiana esta dada por

V = −Ze2

r

donde el menos se debe a la naturaleza atractiva de la interaccion. Por otro lado, la energıa cinetica (no-relativista)se puede calcular empleando la Ec. (2.15)

T =1

2mv2 =

Ze2

2r(2.19)

sumando estas dos energıas y empleando la Ec. (2.17) la energıa total queda

E = T + V = −Ze2

2r= −T = −Ze

2

2

mZe2

n2~2

E = −mZ2e4

2n2~2; n = 1, 2, 3, 4, . . . (2.20)

cuando se calcula el radio de la orbita menor (n = 1), empleando los valores numericos apropiados (con Z = 1)en la Ec. (2.17) se obtiene

r0 =~2

me2≡ a0 ≈ 0,53× 10−10m (2.21)

Page 118: Mecanica Cuantica: Notas de Clase

118 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

es claro de la Ec. (2.17) que este es el menor radio posible. Adicionalmente, este valor concuerda de formarazonable con las predicciones para el modelo atomico de Rutherford. Ası mismo, la Ec. (2.20) nos dice quecuando n = 1 obtenemos el estado de menor energıa, de modo que n = 1 corresponde al estado base o estadonormal del atomo de Hidrogeno. El valor del radio para este estado de menor energıa se denomina radio deBohr. Finalmente, la velocidad del electron es maxima cuando n = 1 como se aprecia en la Ec. (2.18). TomandoZ = n = 1 y los valores numericos apropiados en la Ec. (2.18) esta velocidad esta dada por

v ≈ 2,2× 106m/seg < 0,01c

como esta velocidad es menos del uno por ciento de la velocidad de la luz, se espera que una descripcion no-relativista sea adecuada, esto es ademas consistente con la suposicion no-relativista dada en la Ec. (2.19). Sinembargo, la descripcion no-relativista deja de ser adecuada para valores grandes de Z.

Por otra parte, se observa que al incrementarse el numero cuantico a partir del estado base n = 1, la energıase hace menos negativa, y por tanto se incrementa. Claramente, E = 0 es una energıa lımite (asociada a n→ ∞),y los estados de energıa se aproximan arbitrariamente a E = 0 cuando n crece. En consecuencia, los estadospermitidos son todos de energıa negativa. Esto se debe a que energıas mayores que cero, corresponden a electroneslibres que ya no estan ligados al atomo, y en estado libre la energıa de los electrones corresponde a un espectrocontınuo. Es de enfatizar sin embargo, que la teorıa de Bohr solo nos habla de electrones ligados a un atomo.

Queda entonces por calcular las frecuencias permitidas para la radiacion emitida, para lo cual apelamos alcuarto postulado Ec. (2.14) que combinado con la Ec. (2.20) conduce a

ν =Ei − Ef

h=mZ2e4

4π~3

[1

n2f− 1

n2i

](2.22)

que en terminos del numero de onda k = λ−1 = ν/c nos da

k = RH

[1

n2f− 1

n2i

]; RH ≡ me4

4πc~3Z2 (2.23)

expresion que coincide con la formula empırica (2.12), en donde una evaluacion numerica de la constante RHen la Ec. (2.23), coincidia razonablemente con el valor numerico que se habıa obtenido empıricamente RH ≃109677,576 cm−1. La teorıa de Bohr nos dice entonces que existe una energıa asociada al estado base o de mınimaenergıa para el electron, que corresponde a n = 1. En una descarga electrica el atomo puede absorber energıa ygenerar una transicion a un estado de energıa mayor o estado excitado con n > 1. Una vez excitado, el atomoemitira este exceso de energıa para regresar al estado base. En general, esta desexcitacion se logra mediante unaserie de transiciones en las que el electron pasa sucesivamente por estados de energıa cada vez mas baja hasta llegaral estado base. En cada transicion se emitira radiacion electromagnetica con frecuencias dadas por la Ec. (2.22).Por ejemplo, un electron puede ser excitado al estado con n = 6, y pasar sucesivamente por los estados n = 4, 2, 1emitiendo tres lıneas del espectro atomico, con frecuencias dadas por (2.22). En la infinidad de excitaciones ydesexcitaciones de todos los atomos que se efectuan en la medida del espectro de emision, se presentan todas lastransiciones posibles y por tanto se exhibe el espectro completo.

Estas predicciones fueron corroboradas experimentalmente para el hidrogeno (Z = 1) y para el He+ (Z = 2).Ası mismo, la teorıa puede explicar el espectro de absorcion para atomos con un electron. Ya que solo ciertastransiciones son posibles, el atomo solo absorbera cantidades discretas de energıa de la radiacion incidente. Laradiacion incidente consiste de haces de cuantos de todas las frecuencias, en donde solo los fotones con frecuenciasdadas por (2.22) pueden ser absorbidos. No obstante, los atomos en general estan inicialmente en el estado basen = 1, de manera que solo pueden presentarse procesos de absorcion de n = 1 a n > 1, razon por la cual seobservaran normalmente solo las lıneas asociadas a la serie de Lymann en el caso del Hidrogeno. Cuando el gasesta a una temperatura elevada, es posible que algunos atomos esten inicialmente en el primer estado excitadon = 2 de modo que tambien seran observables las lıneas de la serie de Balmer. La temperatura necesaria para

Page 119: Mecanica Cuantica: Notas de Clase

2.5. LAS REGLAS DE CUANTIZACION DE WILSON Y SOMMERFELD 119

que exista una poblacion razonable de atomos en el estado n = 2 se puede calcular utilizando la estadıstica deBoltzmann, vemos que una fraccion 1/e de los atomos estara en el estado n = 2 para temperaturas del ordende 105K, temperatura tıpica de algunas superficies estelares. En consecuencia, la teorıa de Bohr puede tambienexplicar la diferencia entre el espectro de absorcion y el de emision.

Todas las predicciones de la teorıa de Bohr, se ajustan aun mejor cuando se tiene en cuenta la correccion deque la masa nuclear es finita y se realiza la reduccion del problema de dos cuerpos al problema de un cuerpo conmasa igual a la masa reducida del sistema (ver seccion 12.1). Posteriormente, la cuantizacion de los estados deenergıa de los electrones en el atomo fue corroborada por los experimentos de Franck y Hertz.

2.5. Las reglas de cuantizacion de Wilson y Sommerfeld

En las descripciones anteriores, vemos que las cuantizaciones introducidas hasta el momento obedecen a pro-blemas fenomenologicos a priori diferentes y cada proceso de cuantizacion se ha introducido para cada fenomenoespecıfico. Las reglas de cuantizacion de Wilson y Sommerfeld constituyen un intento de unificar al menos par-cialmente estos diversos postulados de cuantizacion.

Una primera observacion es el hecho de que la cuantizacion de la energıa de Planck esta asociada a oscila-dores armonicos y la de Bohr esta asociada a orbitas circulares regulares. Es decir, ambas estan asociadas a unmovimiento periodico. En mecanica clasica, los movimientos periodicos son particularmente transparentes en laformulacion de Hamilton-Jacobi de la mecanica clasica, particularmente en la variante conocida como variablesaccion-angulo. Por esta razon, la formulacion que veremos a continuacion esta basada en el formalismo de lasvariables accion angulo.

La regla de cuantizacion de Wilson y Sommerfeld se enuncia de la siguiente manera: Sea q una coordenadageneralizada de un sistema fısico que varıa periodicamente con el tiempo, y sea pq su momento canonicamenteconjugado. Este par de variables canonicas q y pq obedecen a la siguiente regla de cuantizacion

∮pq dq = nqh (2.24)

siendo nq un numero cuantico entero y la integral cerrada se efectua sobre un periodo de movimiento. Noteseque el producto de una coordenada generalizada por su momento conjugado siempre tiene unidades de momentoangular, y por eso la cuantizacion esta directamente relacionada con la constante de Planck, la cual tiene unidadesde momento angular. Veremos que la cuantizacion de Bohr y de Planck surgen como casos especiales de esta reglade cuantizacion, y que ademas permite ampliar el dominio de la mecanica cuantica.

Sin embargo, es necesario aclarar que la regla de Wilson y Sommerfeld no puede explicar la cuantizacion deEinstein o Compton, puesto que en estos casos los cuantos son esencialmente libres y no poseen un movimientoperiodico.

2.5.1. El atomo de Bohr bajo las reglas de Wilson y Sommerfeld

Retomemos el atomo de Bohr con un electron de masa m en una orbita circular de radio r0 con velocidadconstante. Usaremos la coordenada generalizada θ (la coordenada r no es independiente de modo que no seincluye como coordenada generalizada), la coordenada θ es claramente periodica si consideramos que la rapidezdel electron es uniforme. El momento canonicamente conjugado a θ es el momento angular orbital L = mr20 θ, ydado que θ = cte por ser periodico el movimiento, vemos que el momento angular es una constante de movimiento.Al aplicar la regla de cuantizacion (2.24) a q = θ y pq = L tenemos

∮L dθ = 2πL = nqh ⇒ L =

nh

2π= n~

que reproduce la regla de cuantizacion de Bohr.

Page 120: Mecanica Cuantica: Notas de Clase

120 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

2.5.2. Cuantizacion de Planck con las reglas de Wilson y Sommerfeld

Consideremos un oscilador armonico simple de masa m, frecuencia angular ω = 2πν y amplitud x0. Lacoordenada generalizada x es periodica y viene dada por3

x = x0 sin 2πνt = x0 sinωt

el momento canonicamente conjugado a x es p = mx, de modo que

p = mx0ω cosωt (2.25)

y la regla de cuantizacion (2.24) nos da∮p dx = mx0ω

∮cosωt dx = nh (2.26)

para poder evaluar esta integral debemos expresar cosωt en funcion de x

x2 = x20 sin2 ωt = x20

(1− cos2 ωt

)⇒ cos2 ωt =

x20 − x2

x20

cosωt = ±√x20 − x2

x0(2.27)

es claro que el signo de cosωt (que es el signo del momento p de acuerdo con la Ec. 2.25), viene dado por el sentidoinstantaneo de movimiento. Vamos a expresar el movimiento periodico completo partiendo del origen hacia laderecha y llegando de nuevo al origen desde la izquierda. En la primera etapa desde cero hasta x0, la velocidad (ypor tanto cosωt) es positiva. Desde x0 hasta cero cosωt es negativo, al igual que desde cero hasta −x0. Finalmentecosωt ≥ 0 en el intervalo desde −x0 hasta cero. Tenemos entonces

∮cosωt dx =

∫ x0

0|cosωt| dx+

∫ 0

x0

(− |cosωt|) dx+

∫ −x0

0(− |cosωt|) dx+

∫ 0

−x0|cosωt| dx

=

∫ x0

0|cosωt| dx+

∫ x0

0|cosωt| dx−

∫ −x0

0|cosωt| dx−

∫ −x0

0|cosωt| dx

= 2

∫ x0

0

√x20 − x2

x0dx− 2

∫ −x0

0

√x20 − x2

x0dx

donde hemos usado la Ec. (2.27) en el ultimo paso. Haciendo x′ = −x en la segunda integral se tiene∮

cosωt dx = 2

∫ x0

0

√x20 − x2

x0dx− 2

∫ x0

0

√x20 − x′2

x0

(−dx′

)

y siendo x′ variable muda, ambas integrales son identicas de modo que∮

cosωt dx = 4

∫ x0

0

√x20 − x2

x0dx =

4

x0

[x√x20 − x2

2+x202

arcsinx

x0

]x0

0

= 2x0 (arcsin 1− arcsin 0) = πx0

con lo cual la integral en (2.26) queda∮p dx = πmωx20 =

ω

mω2x202

=1

ν

mω2x202

ahora bien, recordando que la energıa total del oscilador armonico es igual a la energıa potencial maxima E =(1/2)mω2x20 (ya que en la posicion de maxima elongacion no hay energıa cinetica), y usando la regla de cuantizacion(2.26), tenemos que ∮

p dx =E

ν= nh⇒ E = nhν

que es la regla de cuantizacion de Planck.

3Naturalmente puede haber una fase, pero esto no es relevante para nuestros propositos.

Page 121: Mecanica Cuantica: Notas de Clase

2.5. LAS REGLAS DE CUANTIZACION DE WILSON Y SOMMERFELD 121

2.5.3. La teorıa relativista de Sommerfeld y la estructura fina del atomo de Hidrogeno

Por medio de espectrometros de gran resolucion, fue posible determinar que los atomos poseen una estructurafina en su espectro. En particular, la estructura fina del atomo de Hidrogeno poseıa una separacion en componentesde una misma lınea espectral, unas 104 veces menor que la separacion entre lıneas espectrales (en terminos denumero de onda). Basado en la cuantizacion de Wilson y Sommerfeld, el ultimo de estos adiciono un postuladode la siguiente forma: Lo que se suponıa como un solo estado del atomo de Hidrogeno, consiste en realidad devarios estados de energıas aproximadamente iguales, asociados a orbitas elıpticas de diferente excentricidad. Sinembargo, el movimiento se sigue considerando periodico, de modo que las reglas de cuantizacion de Wilson ySommerfeld permanecen validas.

En primer lugar, Sommerfeld evaluo las consecuencias de este postulado adicional en terminos de la regla decuantizacion de Wilson y Sommerfeld en el marco de la mecanica clasica no-relativista. Utilizando coordenadaspolares r y θ, y teniendo en cuenta que r ya no es constante, entonces r y θ se consideraran coordenadas generali-zadas con sus momentos canonicamente conjugados. Por tanto, habra dos condiciones de cuantizacion, a diferenciadel caso de orbita circular en el cual hay solo una. Puesto que pr = mr las condiciones de cuantizacion quedan enla forma ∮

L dθ = nθh ;

∮prdr = nrh

la primera condicion nos provee de la regla de cuantizacion ya conocida del momento angular

L = nθ~ , nθ = 1, 2, 3, . . .

en tanto que la segunda condicion de cuantizacion queda en la forma

L(ab− 1)= nr~ , nr = 0, 1, 2, 3, . . .

siendo a y b los semiejes mayor y menor de la elipse respectivamente.. La relacion de estabilidad de la orbitaelıptica analoga a la Ec. (2.15) para orbita circular, conduce a las relaciones de cuantizacion para los semiejes yla energıa de los electrones en las orbitas elıpticas

a =n2~2

µZe2, b = a

nθn

, E = −µZ2e4

2n2~2; n ≡ nθ + nr , n, nθ = 1, 2, 3, . . . (2.28)

donde µ es la masa reducida del electron (es decir ya se tuvo en cuenta el efecto de masa finita del nucleo). El numerocuantico n se denomina numero cuantico principal, puesto que la energıa de los estados (en aproximacion no-relativista) solo depende de el. Por otro lado, nθ se conoce como numero cuantico azimutal. Observese queel semieje mayor coincide con el radio de la orbita circular de Bohr, como se observa al comparar la primera delas Ecs. (2.28) con la Ec. (2.17). Adicionalmente, la segunda de las Ecs. (2.28) muestra que la forma de la elipseesta determinada por el cociente nθ/n. Cuando n = nθ, las orbitas son cırculos de radio a y nos reducimos a lasorbitas de Bohr. Es facil ver que para un n fijo, hay n valores diferentes para el numero cuantico azimutal nθ. Enconsecuencia, hay n orbitas elıpticas (una de ellas es circular) asociadas a un mismo valor de la energıa (la cualsolo depende de n), se dice entonces que las orbitas posibles para un n dado estan degeneradas.

Por otra parte, el estimativo del orden de magnitud de la velocidad maxima de un electron en una orbitade Bohr, nos dio que v/c ≃ 10−2. Esto implicarıa que la correccion relativista a la energıa total, debida a lavariacion relativista de la masa electronica sea del orden de (v/c)2 ≃ 10−4, que a su vez es el orden de magnitudde separacion entre componentes de la misma lınea espectral (con respecto a la separacion de las lıneas). Estosugiere que la degeneracion pueda removerse aplicando la corrrecion relativista al modelo. Una vez hechas talesconsideraciones, Sommerfeld encontro la siguiente expresion para la energıa total de un electron que se mueve enuna orbita elıptica caracterizada por los numeros cuanticos n y nθ

E = −µZ2e4

2n2~2

[1 +

α2Z2

n

(1

nθ− 3

4n

)]

Page 122: Mecanica Cuantica: Notas de Clase

122 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

donde la constante adimensional α se define como

α ≡ e2

~c≃ 1

137

la dependencia con nθ de la correccion relativista, introduce la remocion de la degeneracion necesaria para explicarla estructura fina del atomo de Hidrogeno. No obstante, existıan algunas transiciones que no se observabanexperimentalmente. Por ejemplo, una transicion del estado (n, nθ) = (3, 2) al estado (1, 1) es posible. Pero latransicion del estado (3, 3) al estado (1, 1) no se observa en un solo paso. Sin embargo, la ultima transicion (quenos lleva al estado base) se puede hacer en dos transiciones directas que sı estan permitidas: (3, 3) → (2, 2) → (1, 1).Las observaciones experimentales nos llevan a la siguiente regla de seleccion: Una transicion entre dos estadoscaracterizados por los numeros cuanticos (ni, nθi) y

(nf , nθf

)solo es posible si se cumple la condicion

nθi − nθf = ±1

esta regla de seleccion debe ser postulada por aparte en la teorıa relativista de Sommerfeld.

2.6. Los postulados de De Broglie

Los modelos de Einstein y Compton sugerıan que la radiacion (fotones) podıa tener comportamiento de partıcu-la. Esencialmente, la naturaleza corpuscular de la radiacion se manifiesta en la interaccion radiacion materia (almenos a nivel microscopico), en tanto que el patron ondulatorio se manifiesta en la forma en que la radiacion sepropaga.

Ahora bien, si la radiacion puede tener comportamiento corpuscular, es natural apelar a un principio desimetrıa y preguntarse si las partıculas (la materia) pueden exhibir comportamiento ondulatorio. Este principiode simetrıa fue el que introdujo de Broglie en 1924. Puesto que el comportamiento ondulatorio de las partıculasno se habıa observado, era necesario que las predicciones sobre la longitud de la onda asociada a la partıcula (queDe Broglie llamo onda piloto), fuesen mucho menores que todas las dimensiones tıpicas de la mayorıa de objetosmateriales.

Para estimar la longitud de las ondas piloto asociadas a una partıcula, De Broglie supuso que la relacion entrela energıa total relativista E y la frecuencia ν de esta onda, era identica a la relacion de Einstein para la radiacionelectromagnetica

ν =E

h(2.29)

y que la longitud de onda λ se puede calcular con la relacion usual entre λ, ν y la velocidad w de propagacion dela onda

λ =w

ν(2.30)

para la radiacion electromagnetica w = c, y por tanto

λ =c

ν=hc

E(2.31)

adicionalmente, la Ec. (2.5) nos dice que el momento lineal de un foton es p = E/c, de modo que λ queda en laforma

λ =h

p(2.32)

En sıntesis, De Broglie postulo que las Ecs. (2.32, 2.29), que hasta aquı eran validas solo para fotones, tambiennos dan la longitud de onda y la frecuencia de las ondas piloto asociadas a una partıcula de momento lineal p yenergıa relativista E, de modo que

λ =h

p; ν =

E

h(2.33)

Page 123: Mecanica Cuantica: Notas de Clase

2.6. LOS POSTULADOS DE DE BROGLIE 123

notese que la derivacion de la Ec. (2.32) provino de hacer w = c en la Ec. (2.30), lo cual no es valido para partıculascon masa diferente de cero, al menos si suponemos que la velocidad de la onda esta relacionada con la velocidadde la partıcula. Sin embargo, la relacion (2.32) es independiente de la velocidad de la onda y fue la relacion queDe Broglie extrapolo para partıculas.

2.6.1. Propiedades de las ondas piloto

Es de esperarse que la velocidad de la onda piloto sea la velocidad de la partıcula, o al menos que haya unarelacion simple entre las dos. Combinando las Ecs. (2.30, 2.33) vamos a calcular la velocidad de propagacion w delas ondas piloto asociadas a la partıcula

w = νλ =E

h

h

p=E

p(2.34)

y utilizando la expresion para la energıa total relativista tenemos

w =

√c2p2 + (m0c2)

2

p=c√p2 + (m0c)

2

p

w = c

√1 +

(m0c

p

)2

(2.35)

observamos que w es mayor que c. No obstante, esto no supone una contradiccion ya que w esta asociado a

Figura 2.1: Apariencia de una onda piloto, asociada a una partıcula. Puesto que suponemos que una partıcula estalocalizada, su paquete de onda asociado debe estar tambien localizado. El perfil ψ (x, t) del paquete, se dibuja aquıpara una configuracion instantanea evaluada en t = t0.

la velocidad de fase de las ondas piloto. Es de esperarse que el perfil instantaneo de una onda piloto tenga unaapariencia similar a la mostrada en la Fig. 2.1. Es decir, la onda piloto debe tener un valor distinto de cero soloen cierta vecindad espacial, ya que es logico que la localizacion de la onda piloto este asociada a la localizacionde la partıcula. Para formar un pulso de ondas como el de la Fig. 2.1 es necesario superponer un numero infinitode ondas monocromaticas, constituyendo un paquete de ondas. Para dicho paquete, debe distinguirse entre lavelocidad de fase w y la velocidad de grupo wg, del paquete

4. Es posible demostrar que estas velocidades vienen

4Las caracterısticas de un paquete de ondas, su velocidad de fase y de grupo, seran consideradas en detalle en las secciones 2.11 y2.13.

Page 124: Mecanica Cuantica: Notas de Clase

124 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

dadas por

w =ν

k; wg =

dk

ademas, es la velocidad de grupo la que no debe superar a la velocidad de la luz, es decir la que esta asociada alos fenomenos de transporte. Calculemos entonces la velocidad de grupo de las ondas piloto de una partıcula enmovimiento. Partimos de las Ecs. (2.33)

ν =E

h; k ≡ 1

λ=p

h

por tanto

dν =dE

h; dk =

dp

h

wg =dν

dk=dE

dp(2.36)

utilizando de nuevo la expresion relativista de la energıa, tenemos

E2 = c2p2 +(m0c

2)2 ⇒ 2E dE = 2pc2 dp

⇒ dE

dp= c2

p

E(2.37)

reemplazando (2.37) en (2.36) se tiene

wg = c2p

E(2.38)

y teniendo en cuenta las expresiones relativistas

E = m0γc2 , p = m0γvp ; γ ≡ 1√

1− v2pc2

(2.39)

donde vp es la velocidad de la partıcula y m0 su masa en reposo. Sustituyendo (2.39) en (2.38), se obtiene

wg = c2m0γvpm0γc2

= vp (2.40)

de modo que la velocidad de grupo, que es la que contiene las propiedades de propagacion de la onda, es igual a lavelocidad de la partıcula, mostrando la consistencia de los postulados de De Broglie. Por otro lado, las Ecs. (2.34,2.38) nos dicen la relacion que hay entre la velocidad de fase y la velocidad de grupo (o velocidad de la partıcula)

w =c2

wg=c2

vp

notese que si usaramos las Ecs. (2.31, 2.29), en lugar de las Ecs. (2.32, 2.29) obtendrıamos

w =ν

k= νλ =

E

h

hc

E= c ; wg =

dk=

dE/h

dE/hc= c

relacion que solo es valida para cuantos que se mueven a la velocidad de la luz. Ya habıamos enfatizado que laEc. (2.32) se obtenıa usando w = c en la Ec. (2.30), lo cual solo era valido para la radiacion. Sin embargo, la Ec.(2.32) era independiente de la velocidad, y por esa razon se podıa extrapolar a partıculas materiales. En contraste,la Ec. (2.31) depende explıcitamente de la velocidad c, y no puede ser extrapolada directamente.

Page 125: Mecanica Cuantica: Notas de Clase

2.6. LOS POSTULADOS DE DE BROGLIE 125

2.6.2. Corroboracion experimental de los postulados de De Broglie

Para poder medir experimentalmente la longitud de la onda piloto asociada a una partıcula, debemos encontrarun sistema para el cual λ = h/p sea del orden de magnitud de las dimensiones caracterısticas de dicho sistema.Consideremos primero una partıcula de polvo con radio tıpico r y densidad ρ que se mueve con una velocidad norelativista v. Utilizando valores tıpicos tomaremos

r = 10−4cm , ρ = 10gr/cm3 , v = 1cm/seg , h = 6,62 × 10−27erg − seg

de modo que

p = mv =4

3πr3ρv ≃ 4× 10−11gr − cm− seg−1

λ =h

p=

6,62× 10−27gr − cm2 − seg−2 − seg

4× 10−11gr − cm− seg−1≃ 1,6× 10−16cm

esta longitud es ¡108 veces menor que un radio atomico!. Por tanto, no es viable para una exploracion experimental.

Consideremos ahora un electron cuya energıa sea del orden de 10eV = 1,6 × 10−11ergs, esta es aproximada-mente, la energıa cinetica de un electron en el atomo de Hidrogeno. Para esta energıa cinetica la velocidad esmucho menor que c y se puede considerar no relativista. Por tanto, si asumimos un electron libre no relativistacon esta energıa, su impulso viene dado por la expresion no-relativista

p =√2mT ≃ 3,9× 10−8cm

esta longitud es casi un orden de magnitud mayor que un radio atomico tıpico, y aproximadamente del orden demagnitud de la distancia interatomica en un cristal5. Esto sugiere que un electron incidiendo en un cristal puedepresentar fenomenos de difraccion, en donde las “rendijas” son los intersticios interatomicos. No describiremosaquı los montajes experimentales que condujeron a la deteccion del patron de difraccion de los electrones. Bastacon decir que los experimentos de Davidson y Germer en 1927 tomaron el patron de difraccion de los electronesque inciden en un cristal. El patron anular de difraccion de los electrones por cristales, no se puede atribuir a lainterferencia entre dos o mas electrones distintos, sino a las ondas asociadas a un solo electron y que provienen dedistintas partes del cristal. Esto se debe a que en el montaje experimental se empleo un haz de tan baja intensidad,que los electrones son emitidos uno por uno, eliminando ası las posibles interferencias entre electrones distintos.

2.6.3. Las reglas de cuantizacion de Bohr a la luz de los postulados de De Broglie

Hemos visto que la longitud de la onda piloto de un electron es aproximadamente λ ≃ 4× 10−8cm (asumiendoque su energıa cinetica es aproximadamente la del electron en el estado base del atomo de Hidrogeno). Por otrolado, el radio de Bohr es la distancia tıpica del electron al nucleo en el estado base del atomo de Hidrogeno y estadada por r0 ≃ 0,5×10−8cm. En consecuencia, λ es casi un orden de magnitud mayor al radio de Bohr y por tanto,es de esperarse que el comportamiento ondulatorio sea esencial en el entendimiento de las orbitas en el atomode Hidrogeno. Sin embargo, las consideraciones anteriores se realizaron para electrones libres que no repiten suorbita periodicamente, razon por la cual su onda piloto asociada debıa ser una onda viajera que acompanara ala partıcula en su propagacion. Ahora bien, un electron en una orbita atomica posee un movimiento periodico yno posee una direccion neta de propagacion6, con lo cual esperarıamos que su onda piloto asociada no tenga unadireccion neta de propagacion. Esto nos conduce de manera natural a considerar que la onda piloto asociada a unelectron en una orbita atomica periodica debe ser una onda estacionaria i.e. con nodos fijos.

5Ademas, esta longitud de onda es muy grande con respecto a todas las dimensiones esperadas de la partıcula asociada (el electron).6Por ejemplo, si promediamos el vector r sobre un periodo completo, tomando como origen el nucleo atomico, dicho promedio es

nulo.

Page 126: Mecanica Cuantica: Notas de Clase

126 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

Veremos que la combinacion de la regla de cuantizacion de Bohr junto con los postulados de De Broglie, nosconducen a ondas piloto estacionarias. La regla de cuantizacion de Bohr Ec. (2.16) se escribe como

mvr = pr =nh

2π; n = 1, 2, 3, . . .

siendo p el momento lineal del electron en la orbita permitida de radio r. Al sustituir el momento lineal por elprimer postulado de De Broglie de la Ec. (2.33) tenemos

hr

λ=

nh

2π; n = 1, 2, 3, . . .

2πr = nλ ; n = 1, 2, 3, . . . (2.41)

de manera que el perımetro de las orbitas permitidas es un multiplo entero de longitudes de onda de De Broglie.La Ec. (2.41) es precisamente la condicion para que las ondas piloto del electron que se mueve repetidamente sobresu orbita, se combinen coherentemente con las ondas piloto de recorridos anteriores, de modo que la superposicionforme una onda estacionaria. De hecho, si se violara la condicion (2.41), entonces cuando se superpongan las ondasasociadas a un gran numero de recorridos, su interferencia sera destructiva y se cancelara su intensidad promedio.Puesto que la intensidad de la onda piloto es una medida de la ubicacion de la partıcula, lo anterior implica que elelectron no podrıa estar en esa orbita. La Fig. 2.2 ilustra el patron de intensidad ψ (x, t0) de la onda estacionariaasociada a las tres primeras orbitas de Bohr, para un tiempo fijo t = t0. Cuando el tiempo evoluciona cambia lamagnitud y el signo de los patrones oscilantes, pero la ubicacion de los nodos es la misma en todo tiempo, ya queestos son fijos en una onda estacionaria.

Por otra parte, es posible demostrar que la exigencia de ondas piloto estacionarias para partıculas en movimien-to periodico, conduce a que dicha partıcula deba satisfacer las reglas de cuantizacion de Wilson y Sommerfeld, Ec.(2.24). Finalmente, las caracterısticas independientes del tiempo de la onda estacionaria permiten explicar porqueel electron en movimiento periodico orbital no emite radiacion electromagnetica.

2.7. Sıntesis de los resultados experimentales

Newton considero que la luz era un haz de corpusculos que podıan reflejarse en un espejo cuando “rebotan”.Sin embargo, los experimentos que mostraron fenomenos como la interferencia y la difraccion, establecieron lanaturaleza ondulatoria de la luz a mediados del siglo XIX, lo cual permitio la fusion de la optica con la electricidady el magnetismo. Los fenomenos de polarizacion de la luz pueden interpretarse como una manifestacion del caractervectorial del campo electrico.

No obstante, el estudio de la radiacion del cuerpo negro sugirio la hipotesis de la cuantizacion de la energıa delas ondas electromagneticas estacionarias (osciladores armonicos) que se generaban al interior del cuerpo negro. Laenergıa de estos osciladores es de la forma E = nhν con n = 0, 1, 2, ...; siendo ν la frecuencia de cada oscilador. Estacuantizacion permite predecir adecuadamente el espectro de emision del cuerpo negro empleando la estadıstica deBoltzmann. Por otra parte, el estudio del efecto fotoelectrico sugirio que las ondas electromagneticas libres quese propagaban tambien estaban constituıdas por paquetes de energıa que indican valores discretos de esta. Cadapaquete denominado foton tendra una energıa dada por E = hν. Esto permitio a Einstein comprender porquela energıa maxima adquirida por los electrones era independiente de la intensidad de la onda electromagneticaincidente y porque este energıa se adquirıa en tiempos tan cortos. Para ello era necesario ademas que el paqueteestuviera localizado en una pequena region del espacio y que permaneciera localizado a medida que se aleja de lafuente, a diferencia de las ondas clasicas que se extienden cuando se alejan de la fuente. Mas adelante, mediante lairradiacion de una placa metalica con rayos X, compton muestra que estos cuantos pueden dispersarse mediantela colision con un electron libre estacionario, emulando una colision tipo “bolas de billar”. De esta forma pudopredecir el pico en el espectro asociado a una longitud de onda mayor que la incidente.

En sıntesis, estos experimentos estan mostrando la naturaleza discreta de la energıa que se propaga en una ondaelectromagnetica y el hecho de que el cuanto asociado se puede comportar como partıcula. Adicionalmente, tanto

Page 127: Mecanica Cuantica: Notas de Clase

2.7. SINTESIS DE LOS RESULTADOS EXPERIMENTALES 127

Figura 2.2: Patrones de onda estacionaria (lineas punteadas) asociados a las tres primeras orbitas de Bohr (lineascontinuas). El perfil se dibuja para una configuracion instantanea evaluada en t = t0.

la cuantizacion como la colision de fotones con electrones libres pudo explicarse satisfactoriamente relacionandolos parametros de partıcula (energıa E y momento p del foton) con los parametros de onda (frecuencia ν y numero

Page 128: Mecanica Cuantica: Notas de Clase

128 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

de onda k del foton) de la radiacion, en la forma

E = hν ; p = ~k ; ~ ≡ h

2π; h ≃ 6,62× 10−34Joul × seg (2.42)

De otra parte, los experimentos espectroscopicos nos muestran que la radiacion emitida o absorbida debidaa transiciones electronicas en los atomos, solo nos arroja cuantos con valores discretos de longitud de onda, ypor tanto de energıa. Esto implica que los niveles de energıa permitidos para un electron ligado a un atomotambien estan cuantizados. Lo anterior llevo a Bohr a postular la cuantizacion del momento angular asociado alelectron junto con la hipotesis de ausencia de radiacion, en contraste con las predicciones de la mecanica clasica.La cuantizacion de los estados de energıa atomicos fue corroborada por los experimentos de Franck y Hertz, entanto que las reglas de cuantizacion fueron perfeccionadas por Wilson y Sommerfeld.

Una vez caracterizada la dualidad onda partıcula de la radiacion, es natural preguntarse si esta dualidad estatambien presente en los objetos fısicos que tradicionalmente llamamos materia, por ejemplo en los electrones. Estapregunta condujo a De Broglie a postular que el movimiento de una partıcula esta gobernado por la propagacionondulatoria de ciertas ondas piloto asociadas con la partıcula. Asumiendo que la energıa E y el momento p de lapartıcula tambien cumplen las relaciones (2.42) dadas para el foton, De Broglie estimo la frecuencia y la longitudde onda de las ondas piloto

λ = h/p ; ν = E/h (2.43)

Este postulado fue confirmado por los experimentos de Davidson y Germer sobre difraccion de electrones.Naturalmente, el momento y la energıa totales se deben conservar en cada proceso, en donde los momentos y

energıas de la radiacion y la materia estan dados por los postulados anteriores.Vamos ahora a examinar en mas detalle el experimento de Young de la doble rendija. Veremos que este analisis

aportara ideas adicionales con respecto al comportamiento de la naturaleza a nivel subatomico.

2.8. El experimento de Young de la doble rendija

Hemos visto que es necesario incorporar aspectos corpusculares al comportamiento de la radiacion electro-magnetica, la pregunta es si debemos abandonar la teorıa ondulatoria de la radiacion electromagnetica. Veremosque no es posible con una teorıa puramente corpuscular explicar todos los fenomenos relacionados con los fotones,de manera que tendremos que incorporar tanto los aspectos ondulatorios como corpusculares de la radiacion.

El dispositivo utilizado se muestra en la Fig. 2.3, y consiste en una fuente aproximadamente monocromaticafrente a la cual se coloca una placa opaca P con dos rendijas pequenas F1 y F2 (pequenas con respecto a la longitudde onda emitida), detras de esta placa opaca se ubica una pantalla de observacion O que es usualmente una placafotografica. Es importante que las dimensiones de las rendijas sean menores que la longitud de onda, ya que delo contrario las intensidades recogidas en la pantalla O seran compatibles con la optica geometrica que puedeexplicarse con una teorıa corpuscular. En contraste, el fenomeno de difraccion que se presenta cuando las rendijasson pequenas nos muestra la naturaleza ondulatoria del fenomeno.

Cuando obstruımos la rendija F2 obtenemos sobre la pantalla O una distribucion de intensidades I1 (x) que esel patron de difraccion generado por la rendija F1. Analogamente, al cerrar F1 obtenemos el patron de intensidadesI2 (x). Si ahora abrimos las dos rendijas simultaneamente obtendremos un nuevo patron de intensidades I (x). Laprimera observacion es que la intensidad resultante NO es la suma de las intensidades obtenidas con una solarendija

I (x) 6= I1 (x) + I2 (x)

¿como podrıan explicarse estos resultados a la luz de una teorıa corpuscular?. Es bien conocido que el patronde Difraccion generado por una sola rendija no puede ser explicado con una teorıa corpuscular cuando la rendijatiene una dimension menor que la longitud de onda incidente. Sin embargo, veremos que aun cuando pudiesemosexplicar el fenomeno de una rendija con una teorıa corpuscular, el patron de interferencia que se forma cuandose abren las dos rendijas entra en conflicto con una teorıa puramente corpuscular. Asumamos que el patron de

Page 129: Mecanica Cuantica: Notas de Clase

2.8. EL EXPERIMENTO DE YOUNG DE LA DOBLE RENDIJA 129

Figura 2.3: (a) Montaje del experimento de Young con doble rendija. (b) Patron de intensidades asociado a laexposicion por una sola rendija. La lınea punteada indica la suma de los dos patrones de intensidad. (c) Patronde intensidades obtenido con la apertura simultanea de las dos rendijas. El contraste con la grafica punteada nosmuestra que la intensidad resultante no es la suma de las intensidades obtenidas con la apertura de una solarendija, revelando la existencia de un patron de interferencia.

interferencia que se observa, es generado por la interaccion de tipo corpuscular entre los fotones que pasan porla rendija F1 con aquellos que pasan por la rendija F2. De ser ası, tendrıamos que si regulamos la potencia de lafuente de tal manera que los fotones salgan practicamente uno por uno, se eliminarıan estas interacciones y portanto deberıa desaparecer este patron de interferencia, incluso si se espera mucho tiempo para que se depositenmucho fotones sobre O.

Veamos ahora cual serıa la prediccion de una teorıa puramente ondulatoria. La teorıa ondulatoria predice quela intensidad en un punto dado I (x) es proporcional a la amplitud al cuadrado del campo electrico evaluadoen tal punto. Cuando las dos rendijas estan abiertas es claro que el campo total resultante en tal punto es lasuperposicion de los dos campos generados por la onda que pasa por cada rendija

E (x) = E1 (x) + E2 (x)

Page 130: Mecanica Cuantica: Notas de Clase

130 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

la intensidad es entonces proporcional a la amplitud del campo electrico total al cuadrado

I (x) ∝ |E (x)|2 = |E1 (x) + E2 (x)|2

I1 (x) ∝ |E1 (x)|2 ; I2 (x) ∝ |E2 (x)|2 ⇒ I (x) 6= I1 (x) + I2 (x)

si E1 (x) y E2 (x) se escriben en notacion compleja, el termino de interferencia resultante dependera de la diferenciaen las fases complejas asociadas a E1 (x) y E2 (x). Esta interferencia explica el patron de franjas que ocurre enel fenomeno de difraccion por dos rendijas. Si disminuımos la potencia de la fuente, las franjas de interferenciadisminuiran en intensidad pero no desapareceran. De por sı este fue uno de los experimentos determinantes enfavor de la teorıa ondulatoria en el siglo XIX.

Sin embargo, los resultados obtenidos cuando la potencia de la fuente es tal que los fotones se liberan uno auno, son realmente sorprendentes y entran en conflicto con la teorıa puramente corpuscular pero tambien con lateorıa puramente ondulatoria.

Por una parte, si hacemos que el tiempo de exposicion sea muy largo de manera que una gran cantidad defotones impactan la placa fotografica, vemos que las franjas de interferencia no desaparecen a pesar de habereliminado la interaccion entre los fotones. Por tanto, la teorıa corpuscular no puede predecir este fenomeno. Lateorıa ondulatoria en cambio ofrece una explicacion satisfactoria al respecto.

De otra parte, si el tiempo de exposicion lo hacemos muy corto de modo que solo unos pocos fotones impactenla pantalla, vemos que los impactos sobre la placa son muy localizados como se esperarıa de un comportamientocorpuscular, y no se observa el patron de interferencia con baja intensidad que predecirıa la teorıa ondulatoria.

Mas aun si el experimento para tiempos cortos de exposicion se repite muchas veces para las mismas condicionesiniciales (el mismo dispositivo con fotones de la misma energıa y momento, ası como igual tiempo de exposicion),vemos que los pocos impactos localizados en cada experimento pueden tener una distribucion muy diferente. Estoindica que el proceso tiene un caracter altamente aleatorio que no es atribuıble al desconocimiento o falta decontrol en las condiciones iniciales.

Si en cambio repetimos el experimento muchas veces bajo las mismas condiciones iniciales pero para tiemposde exposicion muy grandes, en los cuales muchos fotones han impactado la placa, vemos que el patron contınuode intensidades se forma segun lo indicado en la teorıa ondulatoria, es decir con los patrones adecuados deinterferencia. Para este caso el fenomeno es altamente reproducible, es decir la distribucion de intensidades esesencialmente la misma en cada experimento.

Si se hacen experimentos para tiempos de exposicion especıficos y estos tiempos de exposicion se van incre-mentando gradualmente, vemos que a medida que el tiempo de exposicion aumenta el experimento se vuelve masreproducible, pasando desde resultados muy aleatorios para tiempos de exposicion cortos (pocos fotones inciden-tes) hasta resultados altamente reproducibles para tiempos muy largos de exposicion (muchos fotones incidentes).Esto revela que la ley fundamental que rige al fenomeno debe ser de naturaleza probabilıstica, ya que un modeloprobabilıstico en general falla en sus predicciones cuando una muestra posee muy pocos elementos o eventos, peroes altamente predictivo cuando la muestra consta de un enorme numero de elementos o de eventos. En nuestrocaso los eventos son los impactos de los fotones sobre la placa y lo que vemos es que el patron de interferencia seva construyendo a medida que los fotones van impactando la placa.

Un aspecto que no hemos tocado hasta aquı, es el referente a la determinacion de la rendija por la cual pasacada foton. Si queremos determinar por cual rendija pasa cada uno de los fotones que se emiten uno por uno,podemos colocar dos detectores (digamos dos fotomultiplicadores) sobre cada rendija F1 y F2, en tal caso podemosdeterminar completamente la rendija a traves de la cual pasa cada foton, ya que cuando se emite un foton unasenal es registrada en uno de los detectores pero no en ambos al tiempo. Sin embargo, en este caso todos losfotones detectados son absorbidos por los detectores y no alcanzan la pantalla. En otras palabras, la completadeterminacion de la rendija por la cual pasa cada foton destruyo completamente la informacion sobre el patron dedifraccion. Por otro lado, si dejamos un detector solo en F1 y dejamos abierto F2 veremos que cuando han pasadomuchos fotones cerca del 50% han sido detectados (con respecto al experimento anterior). Concluımos que losdemas han pasado por F2 pero entonces el patron de difraccion que se construira gradualmente sobre la pantallasera el correspondiente a la difraccion por una rendija, no se observara entonces el fenomeno de interferencia

Page 131: Mecanica Cuantica: Notas de Clase

2.8. EL EXPERIMENTO DE YOUNG DE LA DOBLE RENDIJA 131

inherente al experimento con dos rendijas. Una vez mas el proceso de medicion (determinacion de la rendija depaso) ha alterado la evolucion posterior del sistema.

En lo referente al caracter probabilıstico cuantico, es necesario distinguirlo de los aspectos probabilısticos quese emplean usualmente en mecanica clasica. En la termodinamica y especialmente en la mecanica estadısticaclasica, se utilizan conceptos de probabilidad y estadıstica debido a que en la practica (experimental) no es posibledeterminar o controlar las condiciones iniciales de muchas partıculas, aunado con la dificultad practica (teorica)de resolver un gran numero de ecuaciones diferenciales acopladas. Se asume sin embargo en las teorıas clasicasque si conozco todas las condiciones iniciales puedo al menos en principio predecir las trayectorias exactas delas partıculas y por tanto de mi sistema como un todo. En cuantica nos vemos avocados a usar la probabilidadincluso con el conocimiento y/o control de las condiciones iniciales del sistema, estamos hablando entonces deun comportamiento probabilıstico esencial e inherente a las leyes de la naturaleza, al menos en nuestra presenteinterpretacion de los fenomenos.

2.8.1. Interpretacion mecano-cuantica de la dualidad onda partıcula

Hemos visto que tanto los aspectos corpusculares como los ondulatorios son indispensables para un correctoentendimiento de los experimentos de Young con doble rendija. Dado que en mecanica clasica estos aspectos sonmutuamente excluyentes, sera necesario replantearse las ideas de la mecanica clasica, las cuales despues de todotuvieron su semilla en los fenomenos macroscopicos. Veamos a la luz de los resultados anteriores que aspectosdeben ser revaluados

De la discusion anterior hemos visto que cuando colocamos un fotomultiplicador (o dos) para detectar porcual rendija van a pasar los electrones, afectamos de manera fundamental al sistema produciendo un cambiodrastico en el resultado final debido a que los fotones detectados se absorben y no alcanzan la pantalla. Vemosentonces que el proceso de medicion afecta de forma fundamental al sistema que se mide. En mecanica clasica,si bien es necesario perturbar al sistema para poder medirlo, esta implıcito que esta perturbacion se puede hacerarbitrariamente pequena al menos en principio. En mecanica cuantica este y otros experimentos nos indicaranque cuando se realiza un proceso de medicion existe una cierta “perturbacion fundamental” que no puede serminimizada y que altera de manera considerable al sistema que se mide.

Por otro lado, hemos visto que aunque los fotones se envıen uno por uno, eliminando de esta forma la interaccionentre fotones, un foton parece comportarse diferente si estan abiertas las dos rendijas con respecto al caso en queuna sola de ellas esta abierta, de no ser ası la intensidad resultante cuando las dos estan abiertas serıa la suma delas intensidades obtenidas cuando se abre cada una. Adicionalmente, ya hemos visto que si intentamos determinarpor cual rendija pasan los fotones, evitamos que estos alcancen la pantalla. Esto se puede replantear diciendoque es imposible observar el patron de interferencia y al mismo tiempo conocer por cual rendija paso cada foton.Esta afirmacion sera reforzada mas adelante cuando discutamos el principio de incertidumbre de Heisenberg. Pararesolver esta paradoja es necesario abandonar la idea de que cada foton pasara inevitablemente por una rendijaespecıfica, lo cual nos lleva a su vez a cuestionar el concepto de trayectoria, tan firmemente establecido en lamecanica clasica.

Ahora bien, hemos visto que cuando unos pocos fotones han impactado la pantalla, la distribucion de estosfotones no es reproducible a pesar de que los experimentos se repitan bajo las mismas condiciones iniciales. Estoimplica que para un foton dado no podemos predecir con total certeza en que punto golpeara a la pantalla inclusosi conocemos sus condiciones iniciales. En consecuencia, el conocimiento de las condiciones iniciales de un sistemano determina completamente el movimiento subsecuente de este. No obstante, el hecho de que el mismo patronde interferencia se construya cuando el numero de fotones es muy alto, nos indica que las condiciones iniciales nospueden determinar una distribucion de probabilidad que sı puede ser especificada por alguna ecuacion dinamica.En este caso especıfico, la probabilidad de que un foton golpee la pantalla dentro de un intervalo entre el puntox y el punto x + dx, es proporcional a I (x) dx calculado con la teorıa ondulatoria, es decir sera proporcional a|E (x)|2 dx. Notese que el principio de superposicion que rige el comportamiento de los fenomenos opticos clasicosesta basado en el hecho de que las ecuaciones de Maxwell sin fuentes son ecuaciones lineales y homogeneas, para

Page 132: Mecanica Cuantica: Notas de Clase

132 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

las cuales vale el principio de superposicion, si E1 y E2 son soluciones de las Ecs. de Maxwell sin fuentes, unacombinacion lineal de ellas tambien lo es.

Los anteriores hechos se pueden entonces postular en la siguiente forma:Los aspectos corpusculares y ondulatorios de la luz son inseparables. De modo que la luz se comporta si-

multaneamente como onda y como flujo de partıculas. Las predicciones sobre el comportamiento del foton son solode caracter probabilıstico. El comportamiento ondulatorio nos dictamina la distribucion de probabilidad de sumanifestacion como partıcula (foton). La informacion fısica sobre el foton en un momento dado esta determinadapor la componente E (r, t) de la onda electromagnetica que es solucion de las ecuaciones de Maxwell. El campoE (r, t) caracteriza al estado de los fotones en el tiempo t. Dicho campo se interpreta como la amplitud de proba-bilidad de que un foton aparezca en el punto r en el tiempo t. Esto implica que la correspondiente probabilidadde que un foton este en el volumen d3r centrado en r es proporcional a |E (r, t)|2 d3r.

Mas adelante veremos que la amplitud de probabilidad E (r, t) tendra su analogo para la materia en la deno-minada funcion de onda ψ (r, t). Si bien existen muchas analogıas entre E (r, t) y ψ (r, t) tambien existen algunasdiferencias importantes, por ejemplo E (r, t) no caracteriza completamente al estado de un foton, en tanto que lafuncion de onda caracteriza completamente el estado de una partıcula sin espın. La funcion de onda es esencialmen-te compleja en tanto que E se hace complejo solo por conveniencia. La teorıa cuantica completa para los fotones(electrodinamica cuantica) debe tener en cuenta el caracter eminentemente relativista de las ecuaciones de Maxwelly ademas corresponde a la cuantizacion de un medio que es clasicamente contınuo (campos electromagneticos).En contraste, la mecanica cuantica para partıculas corresponde a la cuantizacion de un medio que clasicamentese considera discreto (partıculas puntuales) y que en muchos casos se puede tratar como no-relativista. Aquı solotrabajaremos la mecanica cuantica no relativista de medios clasicamente discretos y por tanto no trabajaremos elproblema concerniente al proceso matematico de cuantizacion del foton.

2.9. Proceso de medicion, preparacion de un sistema y el principio de ladescomposicion espectral

Vamos a examinar otro experimento de optica que arrojara muchas luces sobre las ideas relativas al procesode medicion en cuantica.

La Fig. 2.4, muestra el montaje que queremos estudiar. Asumamos que hacemos incidir una onda planamonocromatica de una fuente sobre un polarizador P , elegiremos el eje z como el eje de propagacion de la ondaelectromagnetica y asumiremos que el polarizador P se ubica en el plano xy. Paralelo al plano xy colocaremos unanalizador A que transmitira luz polarizada a lo largo de ux y absorbera luz polarizada a lo largo de uy.

Asumiremos que el experimento se realizara en condiciones en donde sea valida la optica clasica, es decircuando el haz de luz es muy intenso. En este caso, cuando la onda pasa por P queda polarizada en una direccionespecıfica up caracterizada por

up = cos θ ux + sin θ uy

la onda plana monocromatica que sale del polarizador P esta caracterizada por el campo electrico

E (r, t) = E0upei(kz−ωt) = E0 cos θe

i(kz−ωt) ux + E0 sin θ ei(kz−ωt) uy (2.44)

E0 es la amplitud (constante) de la onda polarizada. La intensidad es proporcional a |E0|2. Cuando la ondapolarizada pasa por el analizador su campo electrico vendra dado por

E′ (r, t) = E′0uxe

i(kz−ωt) = E0 cos θ uxei(kz−ωt)

que surge basicamente de la eliminacion de la componente a lo largo de uy en la Ec. (2.44). La intensidad de la

onda que paso el analizador esta dada por |E′0|2 es decir

I ′ = I cos2 θ

Page 133: Mecanica Cuantica: Notas de Clase

2.9. MEDICION Y PREPARACION DE UN SISTEMA: DESCOMPOSICION ESPECTRAL 133

Figura 2.4: (a) Montaje experimental para medidas de polarizacion. En z < 0 tenemos luz no polarizada que enz = 0 se polariza en la direccion up. El analizador A suprimira la componente uy del campo electrico polarizado.

resultado conocido como la ley de Malus.

Nos preguntamos ahora por lo que ocurre a nivel cuantico. Es decir, cuando la intensidad de la fuente estan baja que los fotones se emiten uno a uno, de manera que la cuantizacion de la radiacion se hace manifiesta.Podemos colocar un detector de fotones detras del analizador para mirar los resultados. Retomaremos para ellolos resultados de las discusiones anteriores.

En primera instancia, debido a la existencia de un cuanto indivisible (el foton) el detector no registra unafraccion de foton. O bien el foton cruza el analizador o bien es absorbido completamente por el.

Adicionalmente, no podemos predecir con total certeza si un cierto foton incidente sobre el analizador cruzarao sera absorbido por este. Solo podremos conocer la probabilidad de que un evento especıfico de estos ocurra.Veremos sin embargo que en ciertos casos especıficos, podremos hacer predicciones con total certeza.

Cuando el numero total de fotones es muy grande, es decir cuando ha pasado suficiente tiempo, se construiraun patron reproducible de probabilidad equivalente al que se obtiene para tiempos cortos con un haz de altaintensidad. En sıntesis debe generarse un patron reproducible (y por tanto predecible) que corresponda ademas allımite clasico. Es decir, si N es el numero (grande) de fotones entonces un numero dado por N cos2 θ de fotonescruzara el analizador.

Notese que el aparato de medida (analizador) solo puede dar algunos resultados especıficos que llamaremosresultados propios o autoresultados. En este experimento solo hay dos resultados posibles: el foton pasa elanalizador o es absorbido por el. Hay entonces una cuantizacion del resultado, lo cual es muy diferente al escenarioclasico en el cual la intensidad puede variar de manera contınua desde 0 hasta I cuando el angulo θ se varıa deforma contınua.

El experimento muestra ademas el siguiente resultado, si el foton esta polarizado a lo largo de ux dicho fotonpasara con toda certeza el analizador (con probabilidad 1). Analogamente, si el foton esta polarizado a lo largode uy hay una certeza total de que este foton sera absorbido (probabilidad cero para pasar). Estas aseveracionesrequieren naturalmente de una repeticion de una gran cantidad de experimentos que muestren la naturaleza

Page 134: Mecanica Cuantica: Notas de Clase

134 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

probabilıstica para fotones con estas polarizaciones. Adicionalmente, se observa que estos son los unicos estadosde polarizacion que conducen a una total certeza en la medida. Por esta razon llamaremos a estos estados depolarizacion estados propios o autoestados. Vemos ademas que a cada resultado propio le corresponde unestado propio, el resultado propio “foton que cruza” esta asociado con el estado propio de polarizacion a lo largode ux. El resultado propio “foton que se absorbe” esta asociado a fotones con polarizacion uy. En otras palabras,para un estado propio tenemos total certeza de obtener su correspondiente resultado propio. Matematicamentepodemos describir nuestros dos estados propios como

u(1)p = ux ; u(2)

p = uy

La siguiente pregunta obvia es ¿cual es la probabilidad de obtener un resultado propio dado, cuando el estadoes una superposicion de los estados propios? es decir cuando el estado de polarizacion del foton es arbitrario i.e.

up = cos θ ux + sin θ uy = cos θ u(1)p + sin θ u(2)

p (2.45)

para obtener la distribucion de probabilidad es necesario tener una gran cantidad de eventos para cada estado depolarizacion. Esto se logra midiendo muchos fotones que poseen las mismas condiciones iniciales7 y se encuentraexperimentalmente que para un numero N (grande) de fotones con polarizacion dada por un angulo θ en (2.45) unnumero N cos2 θ de ellos pasara, y N sin2 θ de ellos sera absorbido. Por tanto, un foton especıfico con polarizaciondefinida por θ tiene una probabilidad P (1) = cos2 θ de ser transmitido y una posibilidad P (2) = sin2 θ de serabsorbido. Esto coincide con la ley clasica de Malus como esperabamos cuando el numero de fotones es grande.

Lo anterior junto con la Ec. (2.45), nos indica que la probabilidad de obtener un cierto resultado propio esproporcional al cuadrado del valor absoluto del coeficiente del estado propio asociado, al coeficiente lo llamamosla amplitud de probabilidad, las amplitudes de probabilidad A (i) y las probabilidades P (i) para cada resultadopropio son en este caso

A (1) = cos θ =⟨u(1)p

∣∣∣up〉 ; P (1) = cos2 θ =∣∣∣⟨u(1)p

∣∣∣up〉∣∣∣2

A (2) = sin θ =⟨u(2)p

∣∣∣up〉 ; P (2) = sin2 θ =∣∣∣⟨u(2)p

∣∣∣up〉∣∣∣2

P (1) + P (2) = cos2 θ + sin2 θ = 1

en algunos casos sera necesario colocar una constante de proporcionalidad para garantizar que la suma de lasprobabilidades de todos los resultados propios sea uno.

Esto nos induce a postular que si tenemos un conjunto de autoresultados Ri asociados a autoestados ψiun estado arbitrario se escribira como superposicion de los autoestados

ψ =∑

i

ciψi (2.46)

y la probabilidad de obtener un autoresultado Rk sera

P (Rk) =|ck|2∑i |ci|2

(2.47)

o equivalentemente

P (Rk) =|〈ψk|ψ〉|2〈ψ|ψ〉 (2.48)

donde el denominador me asegura la conservacion de la probabilidad∑

i

P (Ri) = 1

7Notese que el polarizador tiene el papel de reproducir las mismas condiciones iniciales en cada conjunto de experimentos.

Page 135: Mecanica Cuantica: Notas de Clase

2.10. DUALIDAD ONDA PARTICULA PARA LA MATERIA 135

puesto que el conjunto de todos los autoresultados es por definicion el conjunto de todos los resultados experimen-tales que podemos obtener al medir el sistema. Esta afirmacion se denomina el principio de descomposicionespectral.

El ejemplo de los fotones polarizados nos indica ademas que la descomposicion espectral especıfica depende deltipo de instrumento de medicion dado que hay que utilizar los autoestados que corresponden a este aparato. Porejemplo, si el analizador (aparato de medicion) tiene una orientacion diferente, los autoestados estaran definidossegun esta nueva direccion. Si en vez de un analizador tenemos un medidor de otra variable fısica (por ejemplo elespın) los autoresultados deben definirse correspondientemente y por lo tanto los autoestados.

Supongamos que dos fotones poseen la misma polarizacion pero se diferencian en otros observables fısicos (mo-mento, espın, etc.), un aparato que mide polarizacion solo puede dicernir los diferentes valores de este observable,por tanto si existen otros observables que caracterizan a mi partıcula, al autovalor de polarizacion a, le corres-ponde mas de un autoestado ya que todos los autoestados con polarizacion a estan asociados a este autovalorsin importar cuales sean los valores de los otros observables. Decimos que los autoestados estan degenerados conrespecto al observable o autovalor a lo cual segun la presente discusion indica que solo tenemos una informacionparcial sobre el sistema. Volveremos sobre el tema de la degeneracion mas adelante.

La consistencia de estos resultados se puede examinar poniendo un segundo analizador A′ despues de A y quepermita el paso de fotones con polarizacion en ux. Dado que todos los fotones que pasaron por A quedaron “prepa-rados” en el estado de polarizacion ux, todos estos fotones estan en un solo autoestado del nuevo analizador A′ conautoresultado “el foton pasa”. Por tanto, todos los fotones que pasaron por A deben pasar por A′. Similarmente,si A′ esta orientado segun uy, todos los fotones que vienen de A deben ser absorbidos en A′. Estas prediccionesestan confirmadas por los experimentos.

Analicemos ahora un aspecto de la medicion directamente asociado con la naturaleza cuantica de la radiacion.Al ser el foton un cuanto indivisible solo existe la posibilidad de transmision o absorcion, esto desemboco en elhecho de que a partir de un estado arbitrario de polarizacion, hay un cambio abrupto luego de la medicion paralos fotones que pasan, pues estos pasan de la polarizacion up a la polarizacion ux que corresponde a un autoestadode mi aparato. Existe entonces una perturbacion fundamental que altera el estado del sistema y que no puede serdisminuıda. Notese que despues de la medicion (preparacion del foton en un autoestado) tenemos una informacionadicional “el foton ha pasado el analizador”.

Lo anterior es entonces una confirmacion de que el proceso de medicion perturba de manera fundamentalel estado del sistema. Podrıamos en este punto postular que luego del proceso de medicion, el sistema quedapreparado en un estado propio definido por el sistema mismo y por el aparato de medicion.

2.10. Dualidad onda partıcula para la materia

Hemos visto que de acuerdo con los postulados de De Broglie, la materia al igual que los fotones exhibe uncomportamiento dual onda partıcula. La corroboracion experimental de estos postulados se realizo a traves de losexperimentos de Davidsson y Germer, ası como los experimentos de G. P. Thomson (ambos sobre difraccion deelectrones), y los experimentos de Estermann, Frisch y Stern concernientes a la difraccion de atomos de Helio.

Adicionalmente, De Broglie postulo que si bien la onda asociada a una partıcula libre era una onda viajera(nodos en movimiento), para un electron en un atomo que este ligado al nucleo atomico y que recorre su orbitaperiodicamente, su onda piloto debe estar asociada a una onda estacionaria (nodos fijos). Esta interpretacionpermitio dar una explicacion a las reglas de cuantizacion de Bohr, demostrando que las orbitas permitidas enun atomo son aquellas que corresponden a un perımetro circular con un numero entero de longitudes de ondasestacionarias. Ademas para orbitas no circulares la exigencia de ondas estacionarias resulto equivalente a las reglasde cuantizacion de Wilson y Sommerfeld, en donde los niveles permitidos de energıa aparecen como los analogosde los modos normales de una cuerda vibrante.

Recordemos ademas que dentro de sus postulados De Broglie asume que la energıa E y el momento p de una

Page 136: Mecanica Cuantica: Notas de Clase

136 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

partıcula material posee la siguiente relacion con sus parametros de onda

E = hν = ~ω ; p = ~k (2.49)

siendo ν, ω,k la frecuencia, frecuencia angular y numero de onda respectivamente. La correspondiente longitud deonda es

λ =2π

|k| =h

|p| (2.50)

una estimacion de la longitud de onda de la materia ordinaria nos permite comprender porque no observamos lanaturaleza ondulatoria de la materia ordinaria en el mundo macroscopico.

En virtud de la gran simetrıa que parece existir entre la radiacion y la materia, vamos a incorporar las ideasya recogidas de los experimentos opticos para incorporarlas a la naturaleza de las partıculas materiales. Estasextrapolaciones estan soportadas en el hecho de que experimentos similares a los opticos se pueden realizar conlos electrones y otras partıculas materiales, y observar que el comportamiento es muy similar al mostrado por losfotones.

Comenzaremos entonces por mencionar que el concepto clasico de trayectoria sera sustituıdo por el conceptode una distribucion dinamica (dependiente del tiempo) de probabilidad de que la partıcula este en cierta regiondel espacio. Para ello sera necesario encontrar una amplitud de probabilidad ψ (r, t) que estara asociada a uncampo escalar. A esta amplitud de probabilidad se le conoce como funcion de onda y me define el estado de unapartıcula en un instante dado, es decir contiene toda la informacion posible sobre la partıcula. La probabilidad deencontrar a la partıcula en un volumen d3r esta dada por

dP (r, t) = C |ψ (r, t)|2 d3r

donde C es una constante de normalizacion. Puesto que los experimentos muestran que esta distribucion deprobabilidad presenta las propiedades ondulatorias, es necesario que la ecuacion de movimiento que la generasea lineal y homogenea para que se cumpla el principio de superposicion que se requiere para los fenomenos deinterferencia. Es claro que estos fenomenos de interferencia se veran reflejados en la probabilidad (al igual que enla intensidad en los fenomenos opticos), al elevar al cuadrado la cantidad ψ (r) (el analogo a E (r, t) en optica).Dado que la partıcula debe estar siempre en algun lugar, es claro que la probabilidad total debe ser igual a launidad ∫

C |ψ (r, t)|2 d3r = 1 (2.51)

esto nos indica entonces que los estados fısicos ψ (r, t) deben ser funciones de cuadrado integrable en todas lasregiones accesibles a la partıcula (es posible que ciertas condiciones fısicas hagan que algunas regiones no seanaccesibles). En otras palabras, la integral sobre el volumen accesible de la partıcula debe ser convergente.

Asumiremos ademas que se cumple el principio de descomposicion espectral aplicado a la medida de unacantidad fısica arbitraria. Esto significa que (a) El resultado de la medida debe pertenecer a un conjunto deautoresultados a. (b) Con cada autovalor a se asocia un autoestado, es decir una autofuncion ψa (r). Estaautofuncion cumple la condicion de que si ψ (r, t0) = ψa (r) siendo t0 el instante en el cual se realiza la medida, elresultado de tal medida nos dara con toda certeza el autovalor a. (c) Para todo estado ψ (r, t) la probabilidad Pade obtener el autovalor a cuando se realiza una medida en el tiempo t0, se encuentra descomponiendo ψ (r, t) enlos autoestados ψa (r, t)

ψ (r, t0) =∑

a

caψa (r) ; Pa =|ca|2∑b |cb|2

=|〈ψa |ψ〉|2〈ψ |ψ〉 ;

a

Pa = 1

en virtud de la arbitrariedad del estado inicial ψ (r, t0), lo anterior implica que los autoestados ψa (r) deben sercompletos, es decir deben formar una base para el conjunto de todos los estados fısicos posibles, esto nos llevarade manera natural al concepto de observable. (d) Si la medida nos arroja un autovalor a, la partıcula quedara

Page 137: Mecanica Cuantica: Notas de Clase

2.11. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 137

en su autoestado asociado ψa (r). (e) La ecuacion que describe la evolucion del sistema (evolucion temporal dela amplitud de probabilidad) debe ser lineal y homogenea en ψ. Debe tener soluciones de naturaleza ondulatoriacompatibles con las relaciones de De Broglie, en la siguiente seccion estudiaremos con mas detalle estas propiedades.

Es importante observar que cuando realizamos el paso de suplantar la trayectoria de una partıcula (clasicamentepuntual), por una distribucion dinamica de probabilidad (un campo) estamos reemplazando un estado clasico departıcula puntual de seis parametros en cada tiempo (tres coordenadas de posicion y tres de velocidad), por unestado cuantico determinado por un numero infinito de parametros: el valor de la funcion de onda en cada puntodel espacio (y en el tiempo dado). El hecho de que la distribucion de probabilidad dependa del tiempo nos llevaraal concepto de propagacion de la onda asociada con la partıcula. A manera de ejemplo, en el experimento de ladoble rendija de Young cuando se observa el patron de interferencia no poseemos informacion sobre la rendija porla cual paso cada foton (tambien vale para electrones u otras partıculas materiales), en realidad la onda asociadacruza por ambas rendijas y solo podemos calcular la probabilidad de que pase por una de ellas.

Es importante mencionar sin embargo, que la simetrıa materia radiacion exhibida hasta el momento poseeuna excepcion importante: los fotones son en general emitidos (creados) o absorbidos (destruıdos) durante unexperimento. En contraste, las partıculas materiales no se crean ni se destruyen en los experimentos tıpicos. Porejemplo, un electron emitido por un filamento caliente ya existıa previamente en el filamento. De la misma formaun electron absorbido en un detector no desaparece, simplemente se vuelve parte de un atomo del detector o deuna corriente en este. En realidad la teorıa de la relatividad predice que es posible la creacion y aniquilacion departıculas materiales: por ejemplo un foton de alta energıa que pasa cerca a un atomo puede crear un par electronpositron (partıcula antipartıcula). Recıprocamente, una colision electron positron aniquila a ambas partıculasemitiendo un foton, esta conversion radiacion materia o viceversa es posible gracias a la equivalencia energeticade la masa. Sin embargo, en el lımite no relativista la materia no se puede crear ni destruır, lo cual nos llevaa una ley importante de conservacion del numero de partıculas. En particular, para sistemas de una partıculapodemos hacer la afirmacion de que la partıcula esta en alguna parte para todo tiempo, lo cual nos indica unaconservacion de la probabilidad (la integral de volumen 2.51 debe ser la unidad para todo tiempo).

Resumamos entonces las diferencias importantes entre materia y radiacion que nos conducen a que la teorıacuantica para la materia es mas sencilla. (a) Los fotones son irremediablemente relativistas, la materia en cambiopuede estar en un regimen no relativista y de hecho para solidos a temperaturas normales los electrones y nucleostienen velocidades mucho menores que la de la luz. Por tanto, para la materia tiene sentido una teorıa cuantica norelativista pero no para la radiacion. (b) La naturaleza relativista de los fotones (y de la materia a altas energıas)conduce a que el numero de fotones no se conserva en el tiempo, por tanto la distribucion de probabilidad debecolapsar para tiempos anteriores a la emision y posteriores a la absorcion, la Ec. (2.51) no es valida para todotiempo y debe incorporarse una ecuacion o ecuaciones que me den cuenta de la dinamica en el numero de partıculas(dinamica de creacion y destruccion). (c) Desde el punto de vista clasico las partıculas suelen modelarse comomedios discretos (partıculas puntuales), en tanto que el escenario clasico del foton corresponde a medios contınuos(campos electromagneticos). La cuantizacion de la materia se asocia entonces a menudo con la cuantizacion deun medio clasicamente discreto (teorıa cuantica “ordinaria”), en tanto que la cuantizacion de la radiacion estanecesariamente asociada a la cuantizacion de un medio clasicamente contınuo (teorıa cuantica de campos).

2.11. Aspectos ondulatorios de una partıcula material

Hemos visto que la distribucion de probabilidad esta asociada con las propiedades ondulatorias de la materia(o la radiacion). Por tanto, la generacion de la ecuacion dinamica para esta distribucion de la probabilidadrequerira de estudiar las propiedades ondulatorias que dicha ecuacion debe generar. En general, la mayor parte dela discusion que se desarrollara en esta seccion es tambien valida para ondas clasicas, los desarrollos matematicosson basicamente identicos pero la interpretacion difiere en ambos casos. Si seguimos los postulados de De Broglie,el punto de partida natural sera el estudio de las ondas viajeras libres. Dentro de la ecuacion de onda clasica libre

Page 138: Mecanica Cuantica: Notas de Clase

138 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

(i.e. homogenea) la solucion mas simple (monocromatica) es la solucion tipo onda plana

ψ (r, t) = Aei(k·r−ωt) (2.52)

es inmediato ver que la onda plana es tal que

|ψ (r, t)|2 = |A|2

de modo que si efectivamente representa a la onda asociada a una partıcula libre, nos predice que la distribucionde probabilidad de una partıcula libre es uniforme en el espacio, lo cual es compatible con la homogeneidad eisotropıa del espacio. Podrıa argumentarse que las ondas planas no son de cuadrado integrable de modo que norepresentan estrictamente un estado fısico. Sin embargo, nuestra experiencia con la optica en la cual las ondasplanas tampoco son estados fısicos nos muestra que el estudio de sus propiedades es muy provechoso, por un ladoporque se puede considerar como el lımite de un estado fısico y por otro lado porque los estados fısicos se podranescribir como superposicion de tales funciones en virtud de su completez (ver seccion 1.31.1).

Tomaremos entonces la solucion (2.52) como el prototipo de una onda piloto. Nuestro objetivo sera realizaruna teorıa no relativista que sea compatible con los postulados de De Broglie. Partiremos entonces de la relacionno relativista entre E y p para una partıcula

E =p2

2m(2.53)

y utilizando las relaciones de De Broglie (2.49) llegamos a

ω =~k2

2m(2.54)

la relacion de dispersion (2.54) nos dice que la ecuacion de onda NO es la ecuacion dinamica que gobierna a lateorıa cuantica no relativista de una partıcula, ya que es facil demostrar que insertando (2.52) en la ecuacion deonda clasica se obtiene la relacion de dispersion

ω2 = k2v2 (2.55)

siendo v la velocidad de la onda. Volveremos sobre este problema mas adelante, de momento asumiremos que laonda viajera libre (2.52) es solucion de la ecuacion de movimiento para el estado cuantico ψ de una partıcula librecon relacion de dispersion dada por (2.54). Puesto que las ondas piloto deben generar los fenomenos ondulatorios,es necesario que la combinacion lineal de soluciones sea solucion de la ecuacion dinamica para generar los fenomenosde interferencia.

2.11.1. Estados cuanticos arbitrarios como superposicion de ondas planas

De acuerdo con lo anterior, y dado que las ondas planas pueden generar cualquier funcion de cuadrado integrable(completez) cualquier estado cuantico de una partıcula (no necesariamente libre) se puede escribir como unasuperposicion de la forma

ψ (r, t) =1

(2π)3/2

∫ψ (k, t) ei[k·r−ωt]d3k (2.56)

donde d3k = dkx dky dkz representa un diferencial de volumen en el espacio de las k′s (usualmente denominadoespacio recıproco). La transformada de Fourier ψ (k) puede ser compleja pero debe ser bien comportada parapermitir derivar la solucion dentro de la integral. Por supuesto, las transformadas de Fourier especıficas dependerandel problema especıfico.

Una funcion de onda que es superposicion de ondas planas como la descrita en (2.56) se denomina un paquetede ondas tridimensional. Por simplicidad, tomaremos el caso unidimensional

ψ (x, t) =1√2π

∫ψ (k, t) ei[kx−ωt]dk (2.57)

y estudiaremos mas adelante el caso tridimensional. En primer lugar estudiaremos el perfil del paquete de ondaen un instante dado

Page 139: Mecanica Cuantica: Notas de Clase

2.11. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 139

2.11.2. Perfil instantaneo del paquete de onda

Por simplicidad elegimos el instante como t = 0. La Ec. (2.57) se simplifica a

ψ (x, 0) =1√2π

∫ψ (k, 0) eikxdk (2.58)

y su inversa es

ψ (k, 0) =1√2π

∫ψ (x, 0) e−ikxdx (2.59)

la forma instantanea del paquete estara dada por la dependencia x de ψ (x, 0) definida en (2.58). Trataremosde definir el comportamiento cualitativo de ψ (x, 0) por medio de ejemplos sencillos. Supongamos que ψ (x, t)esta dado por una superposicion de tres ondas planas eikx (en t = 0), caracterizadas por los numeros de ondak0, k0 − ∆k

2 , k0 +∆k2 con amplitudes g (k0), g (k0) /2 y g (k0) /2

ψ (x) =g (k0)√

[eik0x +

1

2ei(k0−

∆k2 )x +

1

2ei(k0+

∆k2 )x

](2.60)

ψ (x) =g (k0)√

2πeik0x

[1 + cos

(∆k

2x

)](2.61)

Figura 2.5: (a) Partes reales de cada una de las tres ondas dadas por (2.60). (b) Superposicion de las tres ondas. Lalınea punteada es la envolvente dada por

[1 + cos

(∆x2 x)], que le da forma al paquete de ondas. La lınea contınua

describe las oscilaciones.

La Fig. 2.5 muestra la forma de cada una de estas tres ondas (sus partes reales) y de la superposicion. La Ec.(2.61) muestra que |ψ (x)| es maximo cuando x = 0, lo cual se aprecia en la Fig. 2.5 en virtud de que en x = 0

Page 140: Mecanica Cuantica: Notas de Clase

140 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

las tres ondas estan en fase y por lo tanto interfieren constructivamente. A medida que nos movemos desde x = 0(hacia la izquierda o la derecha) las ondas estan cada vez mas en desfase de modo que |ψ (x)| va disminuyendo,hasta que la interferencia se vuelve totalmente destructiva en ciertos puntos xn (posiciones de los nodos), cuandola diferencia de fase entre eik0x y ei(k0±∆k/2)x es igual a (2n+ 1) π, siendo n un entero no negativo. Los nodosxn mas cercanos a x = 0 estan asociados a una diferencia de fase π

k0xn −(k0xn ±

∆k

2xn

)= π ⇒ ∓∆k

2xn = π

∆k

2xn = ∓π ⇒ xn = ∓ 2π

∆k

Dado que el paquete es simetrico y esta centrado en x = 0, el ancho del paquete es ∆x = 2 |xn|

∆x =4π

∆k⇒ (∆x) (∆k) = 4π (2.62)

esto nos muestra que a medida que el ancho ∆k de la funcion∣∣ψ (k)

∣∣ decrece, el ancho ∆x de la funcion |ψ (x)|aumenta, siendo ∆x la distancia entre dos ceros de |ψ (x)|. Similarmente, si el ancho del paquete ∆x disminuye(paquete mas localizado), el ancho ∆k de

∣∣ψ (k)∣∣ debe aumentar a fin de mantener la relacion (2.62).

Si asumimos que k0 ≫ ∆k entonces la frecuencia del termino eik0x es mucho mayor a la frecuencia del termino1+cos

(∆k2 x). Por lo tanto, la parte oscilante en x para la Ec. (2.61) esta dada por la funcion eik0x y la envolvente

(modulacion de la amplitud de oscilacion) esta dada por

|ψ (x)| = g (k0)√2π

∣∣∣∣1 + cos

(∆k

2x

)∣∣∣∣

esta amplitud de la envolvente o funcion moduladora de la amplitud se ilustra como lınea punteada en la Fig. 2.5.En este caso, vemos que la envolvente dada por |ψ (x)| es periodica en x de modo que tenemos un tren infinitode paquetes de onda con una serie de nodos y maximos. Este hecho se debe a que la superposicion es de unnumero finito de ondas planas. Para una superposicion contınua de un numero infinito de ondas como el dado en(2.58), este fenomeno no ocurre y tendremos en general un solo maximo para el perfil |ψ (x, 0)|. En realidad, lo queesperamos de una onda piloto asociada a una partıcula es un solo paquete relativamente “localizado” alrededordel maximo del paquete (region de mayor probabilidad de localizar a la partıcula).

Retornemos ahora al caso general de una superposicion contınua de la forma (2.58), aquı el fenomeno deinterferencia es mas complejo pero de nuevo tendremos un maximo en |ψ (x, 0)| cuando las diferentes ondasviajeras interfieran constructivamente. Imaginemos que

∣∣ψ (k, 0)∣∣ esta dada por una curva cuyo perfil es similar

a una campana de Gauss simetrica centrada en k = k0 con un pico bien pronunciado en k0 y un ancho ∆k.En realidad, no hay una sola forma de parametrizar este ancho, pero tomaremos por convencion que el ancho lodefinimos a la mitad de la altura del pico. Bajo esta suposicion, escribamos ψ (k, 0) en notacion polar siendo α (k)el argumento y siendo

∣∣ψ (k, 0)∣∣ la longitud del fasor

ψ (k, 0) =∣∣ψ (k, 0)

∣∣ eiα(k) (2.63)

ahora asumamos que α (k) varıa lentamente en el intervalo [k0 −∆k/2, k0 +∆k/2] donde la longitud del fasor∣∣ψ (k, 0)∣∣ es apreciable. Cuando ∆k es suficientemente pequeno, podemos expandir a α (k) en las vecindades de

k = k0

α (k) ≃ α (k0) + (k − k0)

[dα

dk

]

k=k0

(2.64)

Page 141: Mecanica Cuantica: Notas de Clase

2.11. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 141

reemplazando esta expansion en (2.58) se obtiene

ψ (x, 0) =1√2π

∫ ∞

−∞ψ (k) eikxdk =

1√2π

∫ ∞

−∞

∣∣ψ (k)∣∣ eiα(k) eikxdk (2.65)

≃ 1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+kx

]

dk

=1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+kx−k0x+k0x

]

dk

=1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+(k−k0)x+k0x

]

dk

=ei[α(k0)+k0x]√

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

(k−k0)

([ dαdk ]k=k0

+x)

dk (2.66)

quedando finalmente

ψ (x, 0) ≃ ei[k0x+α(k0)]√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei(k−k0)(x−x0)dk (2.67)

x0 ≡ −[dα

dk

]

k=k0

(2.68)

La expresion (2.67) es util para un analisis cualitativo de las variaciones de |ψ (x, 0)| con x. Partiendo de k = k0

Figura 2.6: Variaciones con respecto a k, de la parte real del integrando en la Ec. (2.67) (a) cuando x es fijo enun valor tal que |x− x0| > 1/∆k, en tal caso la funcion oscila varias veces en el intervalo ∆k. (b) Cuando xes fijo en un valor tal que |x− x0| < 1/∆k, en tal caso la funcion oscila muy poco en tal intervalo y la funcionψ (x, 0) toma valores grandes. Por tanto, el centro del paquete de ondas (punto donde |ψ (x, 0)| es maximo) seubica en x=x0. En todo el analisis se ha supuesto que

∣∣ψ (k)∣∣ es una funcion simetrica centrada en k0, con un

perfil similar a una campana de Gauss.

el siguiente valor kb para el cual se ha ejecutado una oscilacion es

(kb − k0) (x− x0) = 2π ⇒ (kb − k0) =2π

(x− x0)

Page 142: Mecanica Cuantica: Notas de Clase

142 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

De modo que el valor de |x− x0| nos dice si |kb − k0| es mayor o menor que ∆k/2 o en otras palabras, si en elintervalo de integracion definido en (2.67) el integrando ha logrado o no completar una oscilacion. Cuando |x− x0|es grande i.e. cuando |x− x0| ≫ 2π/∆k, se tiene que

(kb − k0) =2π

(x− x0)≪ ∆k

de modo que una oscilacion en el integrando de (2.67) se realiza en un intervalo mucho menor que el ancho deintegracion. En consecuencia, la funcion de k que se integra en (2.67) oscila muchas veces dentro del intervalo ∆ky las contribuciones de las sucesivas oscilaciones se cancelan entre sı (Fig. 2.6a); por tanto, la integral sobre k sevuelve muy pequena. Es decir que cuando x esta fijo en un valor lejano a x0 las fases de las diversas ondas queconstituyen a ψ (x, 0) varıan muy rapidamente en el dominio ∆k, y forman entre ellas una interferencia destructiva.Por otra parte, cuando x ≃ x0, o en otras palabras cuando

|x− x0| ≪ 1/∆k

se tiene que|kb − k0| ≫ 2π∆k > ∆k

la funcion que se integra sobre k solo realiza una pequena fraccion de la oscilacion a partir de k0 y dado que|k − k0| < ∆k para un k que este en el intervalo de integracion, se tiene que

|k − k0| |x− x0| ≪ 1

∆k∆k = 1 , k ∈

[k0 −

∆k

2, k0 +

∆k

2

]

∣∣ψ (k)∣∣ ei(k−k0)(x−x0) ≃

∣∣ψ (k)∣∣ (2.69)

de modo que la exponencial apenas modifica un poco el perfil de∣∣ψ (k)

∣∣ (Fig. 2.6b), y en el proceso de integracionla fase se mantiene casi constante, por tanto la interferencia es constructiva y |ψ (x, 0)| es maximo.

De otra parte, la Ec. (2.69) se convierte en una igualdad para la posicion xM tal que xM = x0, en cuyo caso nohay oscilacion y la interferencia es completamente constructiva. Por tanto, la posicion xM (0) = x0 corresponde alcentro del paquete de onda (maximo del modulo del paquete) que de acuerdo con la Ec. (2.68) viene dada por:

xM (0) = x0 = −[dα

dk

]

k=k0

(2.70)

alternativamente, se puede ver que (2.70) nos da la posicion del centro del paquete teniendo en cuenta que la Ec.(2.58) adquiere su maximo en valor absoluto cuando las ondas de mayor amplitud (aquellas con k cercano a k0)interfieren constructivamente. Esto ocurre cuando las fases que dependen de k de estas ondas varıan lentamentealrededor de k0. Para obtener el centro del paquete se impone que la derivada con respecto a k de la fase sea ceropara k = k0, esta fase se puede ver en la segunda igualdad de la Ec. (2.65) y se obtiene

d

dk[kx+ α (k)]k=k0 = 0 ⇒

[x+

dk

]

k=k0

= 0 (2.71)

vemos entonces que la condicion de fase estacionaria (2.71) se reduce a (2.70).Cuando x se aleja de x0, el valor de |ψ (x, 0)| decrece. El proposito ahora es definir un ancho ∆x dependiendo

del decrecimiento de |ψ (x, 0)| alrededor de x0. Notese que este decrecimiento es apreciable si ei(k−k0)(x−x0) oscilauna vez o mas cuando k recorre el dominio desde k0 − ∆k

2 hasta k0 +∆k2 es decir cuando

∆k · |x− x0| & 2π

donde hemos definido el “umbral” para |x− x0| como el valor para el cual se ejecuta una oscilacion. Si definimos∆x ≡ |x− x0| /2π como el ancho tıpico del paquete, tenemos

∆k ∆x & 1 (2.72)

Page 143: Mecanica Cuantica: Notas de Clase

2.11. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 143

lo cual nos da una relacion entre los anchos de dos funciones que son transformadas de Fourier una de otra.Observemos de nuevo que no hay una unica manera de definir el ancho ∆x, por ejemplo podemos definir esteancho con dos oscilaciones, con tres etc, entre mayor sea el numero de oscilaciones mayor es el efecto de cancelacion,el ancho sera mayor y estaremos tomando una mayor porcion del area bajo la curva. De la misma forma, puedotomar el ancho ∆k cuando la altura

∣∣ψ (k)∣∣ es 1/2, 1/e, 1/3 etc, es decir puedo ensanchar ∆k para tomar una porcion

mas grande del area bajo la curva y tener mejores aproximaciones. En vista de lo anterior, el hecho importantees que este producto tiene una cota inferior, ya que el valor preciso de esta cota depende de la definicion de losanchos ∆k y ∆x. Esta es la razon para utilizar el sımbolo & en la Ec. (2.72) en lugar de ≥.

La relacion (2.72) nos dice ademas que no es posible construır paquetes cuyo producto de anchos sea muchomenor que uno, pero en cambio sı es posible construır paquetes cuyo producto de anchos sea mucho mayor queuno.

Notese que este analisis ha sido completamente matematico, k y x pueden ser variables arbitrarias siempreque ψ (x, 0) y ψ (k) sean transformadas de Fourier la una de la otra. No existe ninguna suposicion fısica en estosargumentos.

El presente analisis se utiliza en ondas clasicas asignando a k el numero de onda y a x la variable espacial enuna dimension. La Ec. (2.72) demuestra que a medida que un paquete de ondas se hace mas monocromatico (amedida que se reduce ∆k) el ancho ∆x del paquete de onda espacial se hace mayor. En un paquete estrictamentemonocromatico ∆k → 0 y por tanto ∆x → ∞, por lo cual las ondas monocromaticas no corresponden a estadosfısicos. Este mismo principio nos muestra que no existe un tren de ondas electromagneticas para el cual se puedadefinir la posicion y la longitud de onda con infinita precision al mismo tiempo.

2.11.3. El principio de incertidumbre de Heisenberg

En nuestro contexto de la mecanica cuantica, el paquete de onda ψ (x, t) dado por (2.57) representa el estado deuna partıcula cuya probabilidad en t = 0 de estar fuera del paquete centrado en x0 y de ancho ∆x es practicamentecero.

El resultado (2.72) posee una interesante interpretacion a la luz de la mecanica cuantica. Por ejemplo, hemosvisto que cuando nuestro estado se describe por una sola onda plana del tipo dado en la Ec. (2.52) (que no esestrictamente un estado fısico), la probabilidad de estar en cualquier punto del eje x es uniforme, y es la misma paratodos los valores de t, de modo que no hay propagacion de la probabilidad. Por otro lado, el ancho ∆x del paquetede onda se puede considerar infinito (la amplitud no se modula), lo cual se traduce en la maxima incertidumbreposible en la posicion de la partıcula (igual probabilidad en todas partes). Por otra parte, esta onda tiene solouna frecuencia angular ω0 y un solo numero de onda k0 (onda monocromatica) y de acuerdo con las relaciones deDe Broglie su energıa y su momento estan perfectamente definidos E = ~ω0, p = ~k0. Esta onda plana pura sepuede considerar como un caso particular del paquete de ondas (2.57) con

ψ (k) = δ (k − k0) ; ∆k → 0

donde el hecho de que ∆k → 0 se ve claramente si vemos a la delta de Dirac como el lımite de Gaussianas cadavez mas altas y agudas. La relacion ∆k → 0 junto con la Ec. (2.72) nos lleva a que ∆x→ ∞ como ya se dijo.

A la luz del principio de descomposicion espectral este resultado se puede ver de la siguiente forma: A lapartıcula en t = 0 le hemos asignado una funcion de onda ψ (x, 0) = Aeikx y hemos visto que posee un momentobien determinado. Es decir que una medida del momento en t = 0 dara definitivamente el valor p = ~k 8. Deesto se deduce que Aeikx caracteriza al autoestado correspondiente al autovalor p = ~k. Puesto que existen ondasplanas para todos los valores de k, los autovalores de p que se pueden obtener en una medicion del momento sobreun estado arbitrario son todos los valores reales. En este caso no hay cuantizacion de los autoresultados, todos los

8Este punto es quizas el mas adecuado para decir que siempre hemos tratado con medidas ideales. Decir que la medida del momentoesta completamente definida no es experimentalmente cierto. Lo que en realidad se quiere decir es que en este caso no hay unaperturbacion fundamental que cambie drasticamente el sistema y por tanto las demas perturbaciones se puede hacer cada vez maspequenas.

Page 144: Mecanica Cuantica: Notas de Clase

144 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

valores del momento son permitidos como en la mecanica clasica. Ahora bien, la total determinacion de p vieneacompanada por una completa incertidumbre en x.

Volvamos ahora al caso de un paquete como el dado por (2.58). Como ψ (x, 0) es una superposicion lineal deautofunciones del momento eikx con coeficientes ψ (k, 0), el principio de descomposicion espectral nos conduce a

interpretar a∣∣ψ (k, 0)

∣∣2 dk (con un posible factor de normalizacion) como la probabilidad de encontrar un valorde momento entre p = ~k y p + dp = ~ (k + dk), cuando hacemos una medida en t = 0 del momento de unapartıcula cuyo estado es descrito por ψ (x, 0) en (2.58). Esta interpretacion es necesaria cuando el autovalor tieneun espectro contınuo ya que en este caso la probabilidad de estar en un punto matematico especıfico serıa ceroy solo es finita la probabilidad de estar en un intervalo dado. En este caso

∣∣ψ (k, 0)∣∣2 serıa una densidad de

probabilidad (probabilidad por unidad de volumen unidimensional), y no una probabilidad como ocurre en el casodiscreto.

Ahora bien, dado que para una partıcula es mas usual hacer medidas de momento y energıa que de frecuenciaangular y numero de onda, es mas adecuado escribir las expresiones en terminos de E y p usando las relacionesde De Broglie Ecs. (2.49)9. En particular, la Ec. (2.58) se reescribe como

ψ (x, 0) =1√2π~

∫ψ (p, 0) eipx/~ dp

dado que las transformadas de Fourier satisfacen la relacion de Bessel parseval (invarianza de la norma)

〈ψ|ψ〉 (0) =∫ ∞

−∞|ψ (x, 0)|2 dx =

∫ ∞

−∞

∣∣ψ (p, 0)∣∣2 dp ≡ C

tendremos entonces que

dP (x, 0) =1

C|ψ (x, 0)|2 dx ; dP (p, 0) =

1

C

∣∣ψ (p, 0)∣∣2 dp

dP (x, 0) representa la probabilidad de encontrar a la partıcula en t = 0 en el intervalo [x, x+ dx]. Similarmente,dP (p, 0) es la probabilidad de obtener una medida del momento de la partıcula en t = 0 que este dentro delintervalo [p, p+ dp].

Ahora escribamos la desigualdad (2.72) en terminos de E y p usando la relaciones de De Broglie (2.49)

∆x ∆p & ~ (2.73)

para dar una interpretacion fısica a (2.73), supongamos que el estado de una partıcula esta definido por el paquetede onda (2.57). En tal caso, la probabilidad de encontrar la partıcula en t = 0 dentro del intervalo [x0 − ∆x/2,x0 + ∆x/2] es practicamente uno. Decimos entonces que ∆x es la incertidumbre en la medida de la posicion dela partıcula. Similarmente, si medimos el momento de la partıcula en el mismo tiempo (t = 0) tal probabilidad escasi uno dentro del intervalo [p0 −∆p/2, p0 +∆p/2]. Es decir que ∆p mide la incertidumbre en la determinaciondel momento de la partıcula.

A la luz de lo anterior la Ec. (2.73) expresa que es imposible medir al mismo tiempo la posicion y el momentode la partıcula con grado arbitrario de exactitud. Cuando alcanzamos el lımite inferior en (2.73) una disminucionen ∆x (es decir un aumento en la exactitud de la medicion de la posicion) conduce a un aumento en ∆p (es decirun aumento en la incertidumbre de la medida del momento, o equivalentemente una disminucion en la exactitudde tal medida) y viceversa. Este enunciado se conoce como el principio de incertidumbre de Heisenberg.Notemos que el valor del termino de la derecha en (2.73) nos expresa mas bien un orden de magnitud que unlımite inferior preciso.

Es de anotar que si bien hay un analogo clasico del principio de incertidumbre para las ondas, no hay un analogoclasico para las partıculas. En realidad hemos visto que el principio de incertidumbre esta asociado inicialmente alos parametros de onda, que se conectan a los parametros de partıcula por medio de las relaciones de De Broglie,estas a su vez estan asociadas a la dualidad onda partıcula que es una caracterıstica cuantica. La pequenez de ~

hace que este principio de incertidumbre no se manifieste en los sistemas macroscopicos.

9En otras palabras, es mas usual medir parametros de materia que parametros de onda.

Page 145: Mecanica Cuantica: Notas de Clase

2.12. EL PRINCIPIO DE COMPLEMENTARIEDAD PARA LADUALIDAD ONDA PARTICULA Y SU RELACION CON

2.12. El principio de complementariedad para la dualidad onda partıcula ysu relacion con el principio de incertidumbre de Heisenberg

Figura 2.7: Variante del experimento de Young de la doble rendija, para el cual la placa opaca P, puede desplazarseverticalmente.

La discusion sobre el experimento de la doble rendija nos ha mostrado que si bien la dualidad onda partıculaes necesaria para explicar los resultados, ambas manifestaciones parecen ser mutuamente excluyentes. La perfectadeterminacion de las propiedades ondulatorias (patron de interferencia con doble rendija) nos conduce a una totalignorancia sobre la rendija por la cual pasa cada foton (propiedad de “trayectoria” asociada a una partıcula). Porotro lado, la perfecta determinacion de la rendija por la cual pasa cada foton (determinacion de sus propiedadesde partıcula) conduce a la completa destruccion del patron de interferencia (i.e. de sus propiedades ondulatorias).Se dice entonces que los aspectos ondulatorio y material de la partıcula son complementarios.

Vamos ahora a reconsiderar el experimento de la doble rendija para demostrar la profunda relacion entre elprincipio de complementariedad y el principio de incertidumbre de Heisenberg. Para ello analizaremos una variantedel experimento de la doble rendija ilustrada en la Fig. 2.7.

Asumamos que la placa opaca P sobre la cual se perforan las rendijas esta montada sobre cojinetes que permitensu desplazamiento vertical. Asumiremos que el foco de los fotones esta muy lejos, de modo que podemos suponerque todos los fotones inciden perpendicularmente sobre la placa P. Un foton que golpea la placa de observacion O

en el punto M (de coordenada x respecto al origen O), tuvo que sufrir un cambio de momento que fue absorbidopor P a fin de mantener el momento conservado. Notese que si el foton de momento p = hν/c pasa por la rendijaF1, el momento transferido a P es

p1 = −hνc

sin θ1 (2.74)

Page 146: Mecanica Cuantica: Notas de Clase

146 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

y si pasa por la rendija F2, tal momento transferido es

p2 = −hνc

sin θ2 (2.75)

Siendo θ1 el angulo de deflexion del foton cuando cruza la rendija F1 e impacta en el punto M . El angulo θ2 sedefine similarmente con la rendija F2. Por tanto, el momento transferido a P depende de la trayectoria del foton,puesto que depende de la rendija por la que pase.

Enviando los fotones uno por uno podemos construir el patron de interferencia gradualmente sobre la pantallade observacion. Aparentemente, este dispositivo nos permite construir tal patron de interferencia asociado a la doblerendija al tiempo que permite determinar la rendija por la cual pasa cada foton. A priori pareciera que podemosdeterminar completamente las caracterısticas corpusculares y ondulatorias de los fotones en forma simultanea.

Sin embargo, las franjas de interferencia no son visibles con este montaje. El error consiste en asumir que sololos fotones poseen un caracter cuantico. Sin embargo, la placa P aunque es un objeto macroscopico tambien poseeun caracter cuantico. Si queremos discriminar por cual rendija paso el foton, la incertidumbre ∆p en la medidadel momento vertical de P debe ser suficientemente pequena para determinar la diferencia entre p1 y p2

∆p≪ |p2 − p1|

aplicando las relaciones de incertidumbre, la posicion de la placa P se puede conocer a lo mas dentro de un intervalode incertidumbre dado por

∆x &~

∆p≫ h

|p2 − p1|(2.76)

si denotamos a la distancia entre las rendijas y d la distancia entre la placa P y la pantalla O, y si asumimos queθ1 y θ2 son pequenos (i.e. a/d≪ 1 y x/d≪ 1) obtenemos

θ1 ≃ tan θ1 =x− a/2

d; θ2 ≃ tan θ2 =

x+ a/2

d

|θ2 − θ1| ≃ a

d

los momentos p1 y p2 dados en las Ecs. (2.74, 2.75) nos dan

|p2 − p1| =hν

c|sin θ2 − sin θ1| ≃

c|θ2 − θ1| ≃

c

a

d=h

λ

a

d

siendo λ la longitud de onda asociada al foton. Sustituyendo esta relacion en (2.76) se obtiene

∆x≫ λd

a(2.77)

pero (λd) /a es precisamente la separacion entre franjas que se espera encontrar en el patron de difraccion sobrela pantalla O. Ahora bien, si la posicion vertical de las rendijas solo se puede determinar en un intervalo deincertidumbre mayor a la separacion de las franjas, es imposible observar el patron de interferencia.

La discusion anterior nos muestra que la construccion de una teorıa cuantica de la radiacion requiere de laconstruccion de una teorıa cuantica de la materia para evitar contradicciones. En el ejemplo anterior, si trabajamosla placa P como un sistema clasico material, invalidamos el principio de complementariedad de los dos aspectoscorpuscular y ondulatorio de la luz y por tanto, la teorıa cuantica de la radiacion. Se puede demostrar que dificulta-des analogas surgen cuando se considera que solo la materia posee caracter cuantico. Por tanto, la consistencia delprincipio de complementariedad requiere que tanto la materia como la radiacion tengan caracterısticas cuanticas.

Otro aspecto que vale la pena discutir, es que en este ejemplo la naturaleza cuantica de P es esencial para unadecuado entendimiento del fenomeno, a pesar de ser un sistema macroscopico. La razon estriba en que si bien elsistema es macroscopico, las incertidumbres combinadas para el momento y la posicion que se requieren en dicho

Page 147: Mecanica Cuantica: Notas de Clase

2.13. EVOLUCION TEMPORAL DE PAQUETES DE ONDAS LIBRE 147

sistema para soslayar el principio de complementariedad, estan en un umbral no permitido por las relaciones deincertidumbre.

Podemos entonces precisar el principio de complementariedad enunciado por Niels Bohr diciendo que lanaturaleza ondulatoria y corpuscular de la radiacion o de las partıculas no pueden exhibirse al mismo tiempoen la misma medida. Los conceptos clasicos de onda y partıcula son mutuamente excluyentes cuando se utilizanpara describir fenomenos cuanticos. Puesto que la existencia de las dos caracterısticas de onda y partıcula nopuede ser observada simultaneamente, estas no generan conflicto la una con la otra en un mismo experimento. Noobstante, ambas son necesarias para la descripcion de los fenomenos cuanticos. Las dos descripciones dan visionescomplemetarias de la realidad, no visiones contradictorias. Bohr ilustraba este principio con el ejemplo simplede una moneda que tiene dos caras pero no podemos ver las dos caras simultaneamente, el ver una de las carasexcluye la posibilidad de ver la otra.

2.13. Evolucion temporal de paquetes de ondas libre

Asumamos un paquete de ondas como el descrito por (2.56), la forma especıfica del paquete en t = 0 estadada por las condiciones iniciales. La evolucion del paquete estara entonces dictaminada por las relaciones dedispersion que dependen de la interaccion de la partıcula con el resto del universo. Puesto que no hemos generadouna ecuacion dinamica para la partıcula no podemos en general resolver la evolucion temporal de una partıculainteractuante, sin embargo la relacion de dispersion (2.54) nos permitira resolver el problema de la evoluciontemporal para una partıcula libre.

En el caso mas simple, un paquete unidimensional esta constituıdo por una sola onda plana

ψ (x, t) = Aei(kx−ωt) = Aeik(x−ωkt) = f

(x− ω

kt)

su parte real es

ψ (x, t) = A cos[k(x− ω

kt)]

su velocidad de propagacion (velocidad de propagacion del frente de onda i.e. de un punto con fase constante)esta dada por la velocidad con que se propaga el maximo correspondiente a xM = 0 en t = 0 (que corresponde afase total cero). Para cualquier tiempo la posicion de este maximo corresponde a fase total cero

xM (t)− ω

kt = 0 ⇒ xM (t) =

ω

kt

la velocidad de este maximo es entoncesdxM (t)

dt= Vf (k) =

ω

k(2.78)

como esta es la velocidad de un punto que define una fase total constante para todo tiempo (fase cero), llamaremosa este termino velocidad de fase de la onda plana, la cual solo depende de x y t por medio de

(x− ω

k t).

Es bien sabido que para ondas electromagneticas en el vacio Vf es independiente de k e igual a c. Todas lasondas que constituyen el paquete viajan a la misma velocidad de modo que el paquete mantiene su forma. Sinembargo, en un medio dispersivo la velocidad de fase esta dada por

Vf (k) =c

n (k)

siendo n (k) el ındice de refraccion relativo entre el vacıo y el medio. En este caso cada onda componente viaja adistinta velocidad, lo cual produce un cambio de forma del paquete con el tiempo. A medida que se propaga elpaquete se ensancha, fenomeno conocido como dispersion. Fısicamente, esto se debe a que el material responde deforma distinta para cada longitud de onda componente.

Page 148: Mecanica Cuantica: Notas de Clase

148 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

Volviendo a nuestro caso de onda monocromatica cuantica, si usamos las Ecs. (2.78, 2.54) vemos que lavelocidad de fase esta dada por

Vf (k) =ω

k=

~k2

2mk=

~k

2m(2.79)

de modo que Vf es funcion explıcita de k. Notese que si usaramos la relacion de dispersion dada por la ecuacionde onda, Ec. (2.55) entonces Vf no presentarıa dispersion (Vf no depende de k) como ocurre efectivamente conlas ondas clasicas libres (como las ondas electromagneticas libres).

Ahora analizaremos el caso de ondas que son superposicion de ondas planas. Veremos a continuacion quecuando las diferentes ondas tienen diferentes velocidades de fase, la velocidad del maximo xM del paquete de ondano es la velocidad de fase promedio dada por

ω0

k0=

~k02m

como antes, comencemos con el ejemplo simple de la superposicion de tres ondas planas similares a las descritasen (2.60) pero ahora con variacion temporal

ψ (x, t) =g (k0)√

ei(k0x−ω0t) +

1

2ei[(k0−

∆k2 )x−(ω0−∆ω

2 )t] +1

2ei[(k0+

∆k2 )x−(ω0+

∆ω2 )t]

(2.80)

=g (k0)√

2πei(k0x−ω0t)

[1 + cos

(∆k

2x− ∆ω

2t

)]

ψ (x, t) =g (k0)√

2πeik0

(x−ω0

k0t)

1 + cos

[∆k

2

(x− ∆ω

∆kt

)](2.81)

puesto que las tres ondas tiene numeros de onda k0 y k0 ±∆k, es claro que k0 es el numero de onda promedio.Similarmente, ω0 es la frecuencia angular promedio.

De la Ec. (2.81) se ve claramente que el maximo de |ψ (x, t)| que estaba en x = 0 cuando t = 0 esta ahora enel punto

xM (t) =∆ω

∆kt (2.82)

y no en el punto x = ω0t/k0. El origen de este resultado se puede apreciar en la Fig. 2.8, en (a) se representa la

Figura 2.8: Posicion de tres maximos consecutivos (1) (2) (3) para cada una de las tres ondas planas de la super-posicion en la Ec. (2.81). (a) Configuracion de los maximos en t = 0, para el cual hay interferencia constructivaen x = 0, que se da con los maximos rotulados por (2). (b) Configuracion en un instante posterior en el cual lainterferencia totalmente constructiva se da a la derecha de x con los maximos (3).

posicion en t = 0 de tres maximos consecutivos de cada una de las partes reales de las tres ondas. Puesto que los

Page 149: Mecanica Cuantica: Notas de Clase

2.13. EVOLUCION TEMPORAL DE PAQUETES DE ONDAS LIBRE 149

maximos denotados con (2) coinciden en x = 0, hay una interferencia constructiva en este punto lo cual nos dael maximo de |ψ (x, t = 0)|. Puesto que la velocidad de fase aumenta con k segun (2.79), tenemos que el maximo(3) de la onda k0 +

∆k2 termina alcanzando al maximo de la onda k0 tambien denotado por tres. Similarmente

el maximo (3) de k0 alcanzara al maximo de k0 − ∆k2 denotado por (3). Un analisis detallado muestra que todos

coinciden en cierto tiempo t, determinando entonces el maximo xM (t) de |ψ (x, t)| por interferencia constructiva.El calculo detallado del punto donde esto ocurre reproduce la Ec. (2.82).

Analicemos finalmente el caso en el cual el paquete de ondas es arbitrario y consta de una superposicioncontınua de ondas planas como en la Ec. (2.57). El corrimiento del centro del paquete se encuentra aplicando denuevo el metodo de fase estacionaria. Comparando la forma de ψ (x, t) con la de ψ (x, 0) Ecs. (2.57, 2.58) vemosque si la transformada de Fourier en (2.57) no depende explıcitamente del tiempo, entonces ψ (x, t) se obtienea partir de ψ (x, 0) con la asignacion ψ (k) → ψ (k) e−iω(k)t. Por tanto, el razonamiento dado en la pag. 142 semantiene valido reemplazando el argumento α (k) de ψ (k) en la Ec. (2.63), por el argumento

α (k) → α (k)− ω (k) t (2.83)

la condicion de fase estacionaria (2.71) se escribe ahora de la forma

d

dk[kxM + α (k)− ω (k) t]k=k0 = 0 ⇒

[xM +

dk− dω (k)

dkt

]

k=k0

= 0

Y la dinamica del centro del paquete estara dada por

xM (t) =

[dω

dk

]

k=k0

t−[dα

dk

]

k=k0

que nos reproduce una vez mas el resultado (2.82) solo que en este caso ∆ω y ∆k tienden a cero ya que hay unbarrido contınuo en estas variables. La velocidad del maximo del paquete de ondas es

Vg (k0) =dxM (t)

dt=

[dω

dk

]

k=k0

conocida como velocidad de grupo del paquete. Con la relacion de dispersion (2.54) para partıcula libre y teniendoen cuenta (2.79) tenemos que

Vg (k0) =~k0m

= 2Vf (k0) (2.84)

Notamos entonces dos diferencias importantes entre la onda asociada a la partıcula libre cuantica y la solucionlibre ondulatoria proveniente de la ecuacion de onda. (a) Las ondas electromagneticas clasicas libres no presentandispersion en tanto que la solucion cuantica (ondulatoria) de partıcula libre si presenta dispersion y (b) paralas ondas electromagneticas libres la velocidad de grupo es menor que la de fase, mientras que para la solucionondulatoria de partıcla libre cuantica, la velocidad de grupo es mayor que la velocidad de fase10.

Notese que el resultado (2.84) reproduce adecuadamente el lımite clasico ya que si ∆x y ∆p son ambosdespreciables, podemos hablar de la posicion xM (t) y del momento p0 de la partıcula. Pero entonces su velocidaddebe ser p0/m segun la mecanica clasica, esto es compatible con la Ec. (2.84) obtenida en el marco cuantico conp0 = ~k0, siempre que ∆x y ∆p sean ambos despreciables Vg se puede asociar a la velocidad de la partıcula, quees la velocidad del maximo del paquete.

Es posible tambien estudiar la forma en que evoluciona la forma del paquete. Si por ejemplo ∆p es unaconstante de movimiento entonces ∆x se incrementa con el tiempo, (dipersion del paquete).

10Notese que el hecho de que la velocidad de grupo sea mayor a la de fase en la Ec. (2.84), no entra en contradiccion con la relatividad,puesto que nuestros resultados solo son validos en un regimen no relativista, ya que la relacion de dispersion (2.54) proviene de laecuacion (2.53), la cual es no relativista.

Page 150: Mecanica Cuantica: Notas de Clase

150 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

2.14. Caracterizacion de paquetes de onda gaussianos

Estudiaremos perfiles de paquetes de onda ψ (x, 0) para los cuales la transformada de Fourier ψ (k, 0) esgaussiana. Este ejemplo especıfico es de amplio uso en fısica y tiene la ventaja de permitir ilustrar los conceptosasociados a paquetes de onda con calculos exactos. Estudiaremos ademas la evolucion temporal de estos paquetes.

2.14.1. Integrales basicas para paquetes gaussianos

El calculo del paquete de onda (y muchos otros calculos relativos a paquetes de onda gaussianos) requiereevaluar una integral del tipo

I (α, β) =

∫ ∞

−∞e−α

2(ξ+β)2dξ

donde α y β son numeros complejos. Es necesario que Re(α2)> 0 para que la integral converja. El teorema del

residuo nos permite encontrar que

I (α, β) = I (α, 0)

de modo que la integral no depende de β. Si se satisface la condicion |Arg (α)| < π/4 (lo cual siempre es posiblesi Re

(α2)> 0), esta integral se puede escribir como

I (α, 0) =1

αI (1, 0)

y solo resta calcular I (1, 0), lo cual se puede hacer como una integral doble en el plano XY usando coordenadaspolares

I (1, 0) =

∫ ∞

−∞e−ξ

2dξ =

√π

de lo cual se obtiene

I (α, β) =

∫ ∞

−∞e−α

2(ξ+β)2dξ =

√π

α(2.85)

2.14.2. Perfiles de paquetes de onda gaussianos

Consideremos el modelo unidimensional de una partıcula libre cuya funcion de onda en t = 0 tiene el perfil

ψ (x, 0) =

√a

(2π)3/4

∫ ∞

−∞e−

a2

4(k−k0)2eikx dk (2.86)

el cual resulta de superponer ondas planas eikx con coeficientes de Fourier de la forma

1√2πψ (k, 0) =

√a

(2π)3/4e−

a2

4(k−k0)2 (2.87)

para calcular ψ (x, 0) es conveniente reescribir la exponencial en (2.86) de modo que los terminos en k quedencomo un cuadrado perfecto a fin de compararlos con (2.85)

−a2

4(k − k0)

2 + ikx = −a2

4

[k − k0 −

2ix

a2

]2+ ik0x− x2

a2

con lo cual la Ec. (2.86) queda

ψ (x, 0) =

√a

(2π)3/4eik0xe−

x2

a2

∫ ∞

−∞e− a2

4

[k−k0− 2ix

a2

]2dk

Page 151: Mecanica Cuantica: Notas de Clase

2.15. EVOLUCION TEMPORAL DE PAQUETES DE ONDA GAUSSIANOS (OPCIONAL) 151

comparando con (2.85) vemos que α = a/2 de modo que

ψ (x, 0) =

√a

(2π)3/4eik0xe−

x2

a22√π

a

ψ (x, 0) =

(2

πa2

)1/4

eik0xe−x2

a2 (2.88)

vemos entonces que la transformada de Fourier de un paquete gaussiano es tambien gaussiana. El modulo alcuadrado del paquete y de su transformada en t = 0 (que estaran relacionados con las densidades de probabilidadasociadas a la posicion y momento respectivamente, para una partıcula en t = 0) se obtienen de (2.87, 2.88), yson

|ψ (x, 0)|2 =√

2

πa2e−

2x2

a2 =

√2

πa2e−(

xa/

√2

)2

;∣∣ψ (k, 0)

∣∣2 = a e−a2

2(k−k0)2

√2π

=

a exp

−[

k−k0(√2/a)

]2

√2π

(2.89)

y la curva asociada a este modulo es una tıpica campana de Gauss. El centro del paquete de onda corresponde almaximo de |ψ (x, 0)|2 y se situa en x = 0. Esto resultado tambien se puede obtener por aplicacion de la Ec. (2.70).

2.14.3. Relaciones de incertidumbre para paquetes gaussianos

Al igual que para todo paquete que no posee nodos, el ancho de una funcion gaussiana f (x) = e−x2/b2 no

puede ser definido en forma unıvoca. Sin embargo, es costumbre definir tal ancho de modo que cuando x varıaentre ±∆x la funcion f (x) se haya reducido en un factor de 1/

√e, esto conduce a un ancho

f (x) = exp

−(xb

)2→ ∆x =

b√2

(2.90)

esta definicion tiene la ventaja de coincidir con la definicion de la raız de la desviacion media cuadratica, comoveremos mas adelante. Con esta convencion podemos definir el ancho asociado al cuadrado del paquete de onda|ψ (x, 0)|2 y de su transformada de Fourier

∣∣ψ (k, 0)∣∣2 en la Ec. (2.89)11

∆x =a

2; ∆k =

1

a⇒ ∆p =

~

a(2.91)

con lo cual se obtiene

(∆x) · (∆p) = ~

2(2.92)

relacion que es compatible con el principio de incertidumbre. Notese ademas que el principio de incertidumbrese escribe en general en la forma (∆x) · (∆p) & ~/2. Esto implica que el principio de incertidumbre permite engeneral, que el producto del ancho de la funcion con el ancho de su transformada de Fourier adquiera un valormayor al lımite inferior. Si aceptamos a ~/2 como el lımite inferior, vemos que los paquetes de onda gaussianospredicen una igualdad, es decir que los productos de las incertidumbres siempre tienen el menor valor posible. Ental sentido decimos que los paquetes de onda gaussianos son paquetes de “mınima incertidumbre”.

2.15. Evolucion temporal de paquetes de onda gaussianos (opcional)

La Ec. (2.56) junto con la relacion de dispersion (2.54) nos dan la forma del perfil de un paquete de ondaasociado a partıcula libre, donde el paquete inicial tiene forma arbitraria. Aplicando estas ecuaciones al caso

11Es mas adecuado definir los anchos asociados a las funciones al cuadrado ya que estas son las que tienen interpretacion fısicadirecta.

Page 152: Mecanica Cuantica: Notas de Clase

152 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

especıfico en que el paquete inicial posee el perfil gaussiano dado por la Ec. (2.87), se tiene que

ψ (x, t) =

√a

(2π)3/4

∫ ∞

−∞e−

a2

4(k−k0)2ei[kx−ω(k)t]dk ; ω (k) =

~k2

2m(2.93)

veremos que el paquete permanece gaussiano para todo tiempo t. Se puede agrupar la parte dependiente de k delos exponentes para formar un cuadrado perfecto, con el fin de comparar (2.93) con (2.85) y obtener

ψ (x, t) =

(2a2

π

)1/4eiϕ

(a4 + 4~2t2

m2

)1/4 eik0x exp

[x− ~k0

m t]2

a2 + 2i~tm

ϕ ≡ −θ − ~k202m

t ; tan 2θ =2~

ma2t

el modulo al cuadrado del paquete (densidad de probabilidad) en el tiempo t esta dado por

|ψ (x, t)|2 =√

2

πa21√

1 + 4~2t2

m2a4

exp

−2a2

(x− ~k0

m t)2

a4 + 4~2t2

m2

(2.94)

debemos ahora calcular ∫ ∞

−∞|ψ (x, t)|2 dx (2.95)

una forma serıa empleando (2.85) para integrar (2.94). No obstante, es mas simple observar de la expresion (2.93)que la transformada de Fourier de ψ (x, t) viene dada por

ψ (k, t) = e−iω(k)tψ (k, 0) (2.96)

se ve entonces que∣∣ψ (k, t)

∣∣ =∣∣ψ (k, 0)

∣∣. Por otro lado, es bien conocido del analisis de Fourier, que∣∣ψ (k, t)

∣∣ =|ψ (x, t)| (ecuacion de Parseval-Plancherel) para todo tiempo, con lo cual se obtiene

|ψ (x, t)| =∣∣ψ (k, t)

∣∣ =∣∣ψ (k, 0)

∣∣ = |ψ (x, 0)|

por tanto, la norma del paquete es independiente del tiempo y por tanto tambien la integral (2.95). Este resultado esimportante para la conservacion de la probabilidad y de hecho para la consistencia de la interpretacion de |ψ (x, t)|2como una densidad de probabilidad. Veremos mas adelante que esto resulta del hecho de que el Hamiltoniano dela partıcula libre es hermıtico.

Ahora bien, la Ec. (2.94) nos dice que la densidad de probabilidad es gaussiana centrada en

xM = V0t ; V0 ≡~k0m

donde V0 es la velocidad del paquete. Esta expresion es consistente con la velocidad de grupo dada por la Ec.(2.84).

2.15.1. Dispersion del paquete de onda gaussiano (opcional)

Tomando la expresion (2.90) para el ancho ∆x (t) del paquete de onda, y teniendo en cuenta el perfil delpaquete Ec. (2.94), tenemos que

∆x (t) =a

2

√1 +

4~2t2

m2a4(2.97)

Page 153: Mecanica Cuantica: Notas de Clase

2.15. EVOLUCION TEMPORAL DE PAQUETES DE ONDA GAUSSIANOS (OPCIONAL) 153

Figura 2.9: Dispersion de un paquete de onda Gaussiano libre. El ancho del paquete se reduce a medida que sepropaga desde t = −∞ hasta t=0. Posteriormente, el paquete comienza a ensancharce indefinidamente a medidaque se propaga.

esta ecuacion nos muestra que la evolucion del paquete no consiste simplemente en una propagacion con velocidadV0. El paquete tambien sufre deformacion. Cuando t se incrementa desde −∞ hasta cero, el ancho del paquetedecrece y alcanza su valor mınimo en t = 0, a partir de entonces el paquete se ensancha indefinidamente (dispersiondel paquete de onda). Esta situacion se ilustra en la Fig. 2.9.

Adicionalmente, la Ec. (2.94) para el perfil del paquete nos muestra que la altura tambien varıa, pero de formaopuesta al ancho, de tal manera que la norma de ψ (x, t) permanece constante.

Es natural ahora preguntarse por el comportamiento de la forma del “paquete de ondas en el espacio delos momentos (o espacio recıproco)” con el tiempo. Las propiedades de la transformada de Fourier ψ (k, t) sontotalmente distintas, vemos por ejemplo que de acuerdo a la Ec. (2.96) se tiene que

∣∣ψ (k, t)∣∣ =

∣∣ψ (k, 0)∣∣

de modo que el momento promedio del paquete ~k0 y la dispersion del momento ∆p = ~∆k son constantes enel tiempo. Veremos mas adelante que esto es una consecuencia de que el momento lineal es una constante demovimiento para la partıcula libre. En virtud de la ausencia de interaccion, la distribucion de momentos de unapartıcula libre no cambia. Adicionalmente, dado que ∆p es constante y que ∆x crece con el valor absoluto deltiempo, es claro que estos ya no son paquetes de mınima incertidumbre excepto para t = 0, esto se debe a queel paquete en el espacio recıproco (i.e. la transformada de Fourier del paquete de ondas en el espacio) ya no espuramente gaussiano en t 6= 0, como se puede ver en la Ec. (2.96).

Cuanticamente, la existencia de una dispersion del momento ∆p = ~∆k significa que la velocidad de la partıculasolo se conoce en un intervalo ∆v = ∆p/m y usando la ultima de las Ecs. (2.91), vemos que ∆v = ~/ma. Estehecho posee un interesante analogo clasico: imaginemos un conjunto de partıculas clasicas que en t = 0 estanlocalizadas en x = 0 y que tienen una dispersion ∆v = ~/ma de sus velocidades. Es claro que en el tiempo t ladispersion de sus posiciones sera

∆xcl = |t|∆v =~ |t|ma

(2.98)

donde estamos asumiendo que se calcula su dispersion tambien para tiempos negativos anteriores a t = 0. Ladispersion decrece linealmente para la evolucion temporal desde un t < 0 y crece linealmente con t a partir det = 0. La Fig. 2.10, muestra una comparacion entre el comportamiento temporal de los anchos clasico ∆xcl ycuantico ∆x dados por las Ecs. (2.97, 2.98). Vemos que cuando |t| → ∞ las dos graficas coinciden, dado que lasrectas correspondientes al ancho clasico son las asıntotas de la hiperbola cuantica. Por tanto, para |t| muy grandepodemos decir que hay un comportamiento cuasi-clasico del ancho cuantico ∆x. Sin embargo, cuando |t| → 0, elcomportamiento cuantico difiere cada vez mas del clasico. Esto se debe a que la partıcula cuantica debe siempresatisfacer el principio de incertidumbre de Heisenberg ∆x ∆p ≥ ~/2 y dado que ∆p es fijo, este impone un lımiteinferior para ∆x que el sistema clasico no tiene que obedecer (efectivamente nuestro sistema clasico no poseıa

Page 154: Mecanica Cuantica: Notas de Clase

154 CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS

Figura 2.10: Comparacion entre el comportamiento con el tiempo de un ∆x cuantico (hiperbola) y su analogoclasico ∆xcl (rectas).

dispersion en la posicion para t = 0 ya que todas las partıculas estaban en x = 0). No obstante, este analogoclasico debe tomarse con cuidado. Por ejemplo, en nuestro sistema clasico la dispersion se genero con un conjuntode partıculas, en tanto que la dispersion cuantica esta asociada a un conjunto de ondas asociadas a UNA SOLApartıcula.

Vale la pena anotar que aunque hemos analizado la dispersion de un paquete de ondas libres cuya condicioninicial consta de componentes gaussianas, la dispersion se presenta para un paquete libre bajo cualquier formainicial del paquete, y la variacion del ancho del paquete con el tiempo tiene la forma mostrada en la Fig. 2.10.

Combinando las Ecs. (2.91, 2.97) vemos que

∆x ·∆p = ~

2

√1 +

4~2t2

m2a4⇒ ∆x ·∆k =

1

2

√1 +

4~2t2

m2a4(2.99)

para t = 0 el lımite inferior esta en el mismo orden de magnitud que el dado en la Ec. (2.72)12 Pag. 142. Sinembargo, para tiempos grandes en valor absoluto, el lımite inferior de (2.99) se aleja mucho de aquel que seestimo en (2.72). Para entender esta discrepancia, recordemos que de acuerdo con la Ec. (2.64) Pag. 140, nuestrotratamiento general asumio que la fase α (k) de la transformada de Fourier se podıa aproximar a una funcionlineal dentro del rango ∆k. Despreciar los terminos no lineales en la expansion (2.64) equivale a decir que

(∆k)2[d2α (k)

dk2

]

k=k0

≪ 2π (2.100)

de no ser ası la contribucion de segundo orden a α (k) no sera mucho menor a 2π dentro del dominio k0 ±∆k. Ennuestro contexto, puesto que ∆k ≃ 1/a y de la Ec. (2.93) se tiene que α (k) = −

(~k2/2m

)t, la condicion (2.100)

se escribe como~t

a2m≪ 2π (2.101)

esta condicion se cumple en t = 0 y tiempos t ≪ 2πa2m/~. En contraste, falla para tiempos suficientementegrandes para los cuales el lımite inferior en (2.99) difiere sustancialmente de aquel en la Ec. (2.72).

12Recordemos que para encontrar la Ec. (2.72), se asumio que la transformada de Fourier tenıa una forma similar (en perfil generico)a una campana de Gauss. Esto naturalmente coincide con nuestro actual tratamiento. Observemos ademas que la Ec. (2.72) expresauna desigualdad que muestra la vaguedad del lımite inferior.

Page 155: Mecanica Cuantica: Notas de Clase

Capıtulo 3

Ecuacion de Schrodinger y sus propiedades

Hemos estudiado la dualidad onda partıcula partiendo de los postulados de De Broglie y hemos analizado elcomportamiento de la onda asociada a una partıcula libre. Sin embargo, si consideramos un sistema de una o maspartıculas interactuantes sera necesario generar una ecuacion de movimiento que gobierne la dinamica de la ondaasociada. Si bien esta ecuacion de movimiento se postulara, existen ciertos argumentos de plausibilidad para suconstruccion.

3.1. Plausibilidad de la ecuacion de Schrodinger

Si aceptamos la validez de los postulados de De Broglie, debemos encontrar una ecuacion de movimiento quenos describa la propagacion de las ondas piloto y su relacion con la dinamica de la partıcula, para el caso en quela partıcula interactue con su entorno. Por simplicidad asumiremos un caso unidimensional en esta seccion.

El punto de partida sera entonces las ecuaciones de De Broglie aplicadas a una partıcula material

λ = h/p ; ν = E/h (3.1)

ahora bien, a pesar de que las relaciones de De Broglie son consistentes con la teorıa de la relatividad (de hecho,fueron inspiradas por las relaciones analogas en los fotones), vamos a plantear una formulacion no relativista, estocon el fin de evitar el problema del manejo de la probabilidad que surge de la posibilidad de creacion y aniquilacionde partıculas materiales. Tomaremos entonces la relacion no relativista (corpuscular) entre energıa y momento

E =p2

2m+ V (3.2)

siendo m = m0 la masa en reposo de la partıcula. La Ec. (3.1) nos muestra que un cambio en la definicion deenergıa (por ejemplo si tomaramos la relacion relativista) nos cambiarıa el valor de ν. Los experimentos descritoshasta ahora no han explorado la validez de la relacion (3.2), de modo que las predicciones que la ecuacion dinamicahaga sobre una partıcula interactuante deben ser corroboradas por los experimentos.

Es claro que para una partıcula libre, los resultados deben poder obtenerse con cualquier potencial constante(no necesariamente cero) aplicado a la Ec. (3.2). Es facil verificar que un potencial constante predice que lavelocidad de grupo de la onda piloto corresponde a p/m y por tanto a la velocidad de la partıcula, combinando(3.1) con (3.2) se tiene que

ν =E

h=

p2

2mh+V

h; K ≡ 1

λ=p

h

teniendo en cuenta que V es constante, tenemos

dν =2p dp

2mh, dK =

dp

h

155

Page 156: Mecanica Cuantica: Notas de Clase

156 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Ahora bien, teniendo en cuenta quek ≡ 2πK ; ω ≡ 2πν

la velocidad de grupo queda

Vg =dω

dk=

dK=p dp

mh

h

dp=

p

m= vpartıcula

y podemos reescribir las relaciones de De Broglie en la forma

p = ~k ; E = ~ω (3.3)

si insertamos estas relaciones en (3.2) obtenenemos la siguiente relacion de Dispersion

~2k2

2m+ V (x, t) = ~ω (3.4)

tomaremos como prototipo la ecuacion para la partıcula libre con potencial constante. Las consideraciones ante-riores nos dicen que la ecuacion de movimiento que genere la funcion de onda ψ (x, t) (i.e. la dinamica de las ondaspiloto), debe cumplir las siguientes propiedades

1. Debe ser consistente con las Ecs. (3.1, 3.2). Es decir debe cumplir los postulados de De Broglie y la relacionno relativista entre E y p.

2. Debe ser lineal y homogenea en ψ (x, t) con el fin de que sea valido el principio de superposicion que a su veznos genera los fenomenos ondulatorios de interferencia. Esto implica que si ψ1 (x, t) y ψ2 (x, t) son solucionesde la ecuacion una combinacion lineal de ellas tambien es solucion.

3. En general, consideraremos potenciales que solo dependen de la posicion y el tiempo V = V (x, t). Cuandoel potencial es constante la partıcula es libre y por tanto se deben conservar E y p, lo cual a su vez implicaque se conservan λ = 2π/k y ν de acuerdo con las relaciones (3.1).

4. Las soluciones para partıcula libre son funcionalmente identicas a las soluciones de la ecuacion de ondahomogenea, pero deben cumplir con una relacion de dispersion que sea consistente con la Ec. (3.4) conV constante, en vez de la relacion de dispersion para ondas libres dada por (2.55), lo cual nos dice quela ecuacion de onda no es la ecuacion dinamica para la funcion de onda ψ (r, t). Entonces la ecuacion demovimiento para partıcula libre debe tener soluciones en forma de ondas viajeras con numero de onda yfrecuencia constantes.

5. Lo anterior nos lleva a postular que funciones de onda de la forma Aei(kx−ωt) son soluciones para partıculalibre (i.e. con potencial constante), ya que estas funciones son soluciones de la ecuacion de onda homogeneaque corresponden a ondas viajeras con numero de onda y frecuencia constantes, y que gracias a las relacionesde De Broglie, tambien corresponden a momento y energıa conservados.

La linealidad y homogeneidad prohibe terminos del tipo [ψ (x, t)]2 (no lineales) o terminos independientes deψ (x, t) (terminos inhomogeneos o fuentes). Puesto que la mayorıa de ecuaciones dinamicas de la Fısica son a lomas de segundo orden, postularemos que los terminos lineales son a lo mas de segundo orden en el espacio y eltiempo, y posiblemente un termino lineal en ψ (x, t). Parametrizaremos a la ecuacion en la forma siguiente

a1∂ψ (x, t)

∂x+ a2

∂2ψ (x, t)

∂x2− b1

∂ψ (x, t)

∂t− b2

∂2ψ (x, t)

∂t2+ c ψ (x, t) = 0

asumamos que la solucion de partıcula libre es ψ (x, t) = Aei(kx−ωt), ademas se debe cumplir la relacion dedispersion (3.4) con V constante. Esta relacion de dispersion contiene un termino proporcional a k2 que se obtendrıade una segunda derivada espacial de la onda plana, y un termino lineal en ω que se puede extraer de una primera

Page 157: Mecanica Cuantica: Notas de Clase

3.1. PLAUSIBILIDAD DE LA ECUACION DE SCHRODINGER 157

derivada temporal de la onda plana. La ausencia de un termino lineal en k y de un termino cuadratico en ωsugiere la ausencia de primeras derivadas espaciales y de segundas derivadas temporales. Finalmente, la presenciadel potencial en (3.4) sugiere la presencia de un termino lineal en ψ de la forma V ψ. El ansatz para la solucion sereduce a

a2∂2ψ (x, t)

∂x2+ V ψ (x, t) = b1

∂ψ (x, t)

∂t(3.5)

ahora debemos ajustar los parametros a2 y b1 de manera que exista una solucion tipo onda plana que reproduzcala relacion de dispersion (3.4). Recordemos que en mecanica clasica, el caracter complejo de las soluciones de laecuacion de onda se introduce solo por conveniencia y la solucion Fısica es la parte real de la solucion compleja.Por este motivo si bien podemos insertar una solucion tipo onda plana en (3.5), es razonable intentar primero usarla solucion real para la ecuacion de onda clasica como prototipo de solucion, insertaremos entonces una funcionde onda de la forma

ψ (x, t) = cos (kx− ωt) (3.6)

teniendo en cuenta que k, ω y V son constantes, se tiene que

∂2ψ (x, t)

∂x2= −k2 cos (kx− ωt) ;

∂ψ

∂t= ω sin (kx− ωt)

y al insertar estos resultados en (3.5) obtenemos

−a2k2 cos (kx− ωt) + V cos (kx− ωt) = b1ω sin (kx− ωt)(V − a2k

2)cos (kx− ωt) = b1ω sin (kx− ωt)

pero no es posible ajustar los parametros para que esta relacion sea valida para todo x, t, de modo que la solucionclasica dada por (3.6) no es compatible con la relacion de dispersion de la teorıa. Aun podemos tratar de encontraruna solucion real si agregamos una fase adicional en la forma cos (kx− ωt+ δ) que es equivalente a escribir unasolucion de la forma

ψ (x, t) = cos (kx− ωt) + γ sin (kx− ωt) (3.7)

lo cual tambien se puede postular observando que en tal caso ambas derivadas tendran senos y cosenos quepermitiran igualar coeficientes adecuadamente

∂2ψ (x, t)

∂x2= −k2 cos (kx− ωt)− γk2 sin (kx− ωt) ;

∂ψ

∂t= ω sin (kx− ωt)− γω cos (kx− ωt)

que al insertarlos en (3.5) nos da

−a2k2 [cos (kx− ωt) + γ sin (kx− ωt)] + V [cos (kx− ωt) + γ sin (kx− ωt)]

= b1ω [sin (kx− ωt)− γ cos (kx− ωt)]

quedando

(−a2k2 + V + b1ωγ

)cos (kx− ωt) +

(−a2k2γ + V γ − b1ω

)sin (kx− ωt) = 0

Los coeficientes de seno y coseno deben anularse para que esta relacion sea valida para todo x, t. Tenemosentonces dos ecuaciones con tres incognitas (a2, b1, γ) que junto con la relacion de dispersion (3.4), nos da

−a2k2 + V + b1ωγ = 0 ; −a2k2γ + V γ − b1ω = 0 ;~2k2

2m+ V = ~ω (3.8)

las dos primeras ecuaciones se pueden reescribir como

−a2k2 + V = −b1ωγ ; −a2k2 + V =b1γω ⇒ −b1ωγ =

b1γω

⇒ −γ =1

γ⇒ γ2 = −1

Page 158: Mecanica Cuantica: Notas de Clase

158 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

tenemos entonces

γ = ±√−1 = ±i

sustituyendo en la primera de las Ecs. (3.8)

−a2k2 + V ± iωb1 = 0 ⇒ −a2k2 + V = ∓iωb1

al comparar esta expresion con la tercera de las Ecs. (3.8)

−a2 =~2

2m; ∓ib1 = ~

tenemos entonces dos soluciones que dependen de la eleccion del signo de γ, la eleccion mas usual es

γ = i ; a2 = − ~2

2m; b1 = i~

que al reemplazarlo en (3.5) nos da

− ~2

2m

∂2ψ

∂x2+ V ψ = i~

∂ψ

∂t

que se ha derivado para un potencial constante V . Ahora postularemos que la relacion se mantiene valida paraun potencial arbitrario de la forma V (x, t). Se obtiene entonces

− ~2

2m

∂2ψ

∂x2+ V (x, t) ψ = i~

∂ψ

∂t(3.9)

expresion conocida como la ecuacion de Schrodinger. Por supuesto podemos postular su extension a tres dimen-siones como

− ~2

2m∇2ψ (r, t) + V (r, t) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.10)

Notese que γ = ±i, lo cual indica que la pretendida solucion real (3.7) nos proporciona inevitablementeuna solucion compleja tipo onda plana. Vemos que hay una diferencia con las soluciones de onda clasica que setoman complejas solo por conveniencia. En contraste, para la ecuacion de Schrodinger no pudimos encontrar unasolucion real consistente con las relaciones de dispersion para partıcula libre, el caracter de la solucion es en esenciacomplejo. Esto se refleja en el factor imaginario que aparece a la derecha de la ecuacion (3.9) de Schrodinger.

3.2. Ecuacion de Schrodinger para una partıcula sometida a un potencial

escalar independiente del tiempo: estados estacionarios

Supongamos que una partıcula de masa m esta sometida a un potencial V (r). La ecuacion de Schrodinger(3.10) se escribe entonces

− ~2

2m∇2ψ (r, t) + V (r) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.11)

plantearemos una separacion de variables para la solucion

ψ (r, t) = χ (t)ϕ (r) (3.12)

al introducirlo en la Ec. (3.11) se obtiene

− ~2

2mχ (t)∇2ϕ (r) + V (r) χ (t)ϕ (r) = i~ϕ (r)

∂χ (t)

∂t

Page 159: Mecanica Cuantica: Notas de Clase

3.2. ECUACION DE SCHRODINGER CON POTENCIAL ESCALAR INDEPENDIENTE DEL TIEMPO 159

dividiendo a ambos lados por χ (t)ϕ (r) se escribe

− ~2

2m

∇2ϕ (r)

ϕ (r)+ V (r) = i~

1

χ (t)

∂χ (t)

∂t

el miembro izquierdo solo depende de la posicion en tanto que el derecho depende solo del tiempo. Por tantoambos miembros deben ser iguales a una constante que por comodidad la tomaremos como ~ω, de momento ω essolo una constante a ajustar, aunque es claro que debe tener dimensiones de frecuencia angular. Tenemos entoncesque

i~1

χ (t)

∂χ (t)

∂t= ~ω ⇒ ∂χ (t)

∂t= −iωχ (t)

χ (t) = Ae−iωt (3.13)

y la ecuacion para la parte espacial es

− ~2

2m

∇2ϕ (r)

ϕ (r)+ V (r) = ~ω ⇒

− ~2

2m∇2ϕ (r) + V (r)ϕ (r) = ~ωϕ (r) (3.14)

combinando las Ecs. (3.12, 3.13), la solucion para la ecuacion de Schrodinger (3.11) es

ψ (r, t) = ϕ (r) e−iωt (3.15)

donde hemos absorbido el factor A en la solucion ϕ (r) de la ecuacion (3.14).Notese que la solucion (3.15) nos conduce a una densidad de probabilidad independiente del tiempo, aunque

inhomogenea|ψ (r, t)|2 = |ϕ (r)|2

razon por la cual se conoce como solucion estacionaria de la ecuacion de Schrodinger. Ahora bien, la Ec.(3.15) nos muestra que la constante de integracion ω corresponde efectivamente a la frecuencia angular asociadaa la funcion de onda estacionaria. Notese que en la solucion estacionaria, solo aparece un valor de frecuenciaangular ω que a su vez nos conduce a un valor bien definido de la energıa de acuerdo con la relacion de PlanckEinstein E = ~ω. En mecanica clasica un potencial independiente del tiempo nos lleva a la conservacion de laenergıa total. En mecanica cuantica, lo que podemos decir es que para potenciales independientes del tiempoexisten estados de energıa bien determinada. La Ec. (3.14) se puede escribir entonces como

[− ~2

2m∇2 + V (r)

]ϕ (r) = Eϕ (r) (3.16)

que se puede reescribir como

Hϕ (r) = Eϕ (r) ; H ≡ − ~2

2m∇2 + V (r) (3.17)

siendo H un operador diferencial que es claramente lineal

H [λ1ϕ1 (r) + λ2ϕ2 (r)] = λ1Hϕ1 (r) + λ2Hϕ2 (r)

y vemos que (3.17) es una ecuacion de valores propios para el operador H en la cual ϕ (r) son las funciones propias(vectores propios) y las energıas E son los valores propios. Las energıas permitidas para la partıcula son entonceslos valores propios del operador H. Notese que no cualquier solucion ϕ (r) de la ecuacion de Schrodinger es unasolucion fısica, debemos imponer que sea de cuadrado integrable, esta imposicion restringira los valores permitidosde energıa y nos llevara a una cuantizacion de esta cantidad.

Page 160: Mecanica Cuantica: Notas de Clase

160 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

A la Ec. (3.17) se le llama usualmente ecuacion de Schrodinger independiente del tiempo, en tanto que a (3.11)se le denomina ecuacion de Schrodinger dependiente del tiempo. La Ec. (3.11) nos da la evolucion de la funcionde onda para un estado arbitrario de la partıcula, en tanto que la Ec. (3.17) solo nos da los estados estacionariosde esta.

Dado que tenemos un conjunto de valores permitidos de la energıa (autoresultados o autovalores), vamos arotular las energıas y las autofunciones de la forma

Hϕn,m (r) = Enϕn,m (r)

donde tanto n como m pueden simbolizar un ındice contınuo o discreto o incluso varios ındices. El ındice m meindica la posibilidad de degeneracion, es decir de varias autofunciones linealmente independientes que pertenecenal mismo valor propio En. Los estados estacionarios de la partıcula son de la forma

ψn,m (r, t) = ϕn,m (r) e−iEnt/~

ψn,m (r, t) es una solucion de la ecuacion de Schrodinger Ec. (3.11), y en virtud de la linealidad de esta ecuacion,una superposicion de las soluciones estacionarias es tambien solucion

ψ (r, t) =∑

n

m

cnmϕn,m (r) e−iEnt/~ (3.18)

en realidad es usual que se requiera la superposicion puesto que soluciones arbitrarias no satisfacen en generallas condiciones iniciales y de frontera que pide un problema especıfico. La superposicion garantiza que podemosobtener cualquier estado siempre que las funciones ϕnm (r) sean completas como funciones espaciales (las funcionestemporales son ondas planas y por tanto completas), esto requiere a su vez que el operador H tenga el caracterde observable.

Para t = 0 la Ec. (3.18) nos da

ψ (r, 0) =∑

n

m

cnmϕn,m (r) (3.19)

de modo que si conocemos el estado inicial del sistema (el cual es en principio arbitrario) podemos descomponerloen la base de las autofunciones ϕn,m de H (siempre que H sea un observable). Para obtener la evolucion temporalbasta con multiplicar cada termino en (3.19) por e−iEnt/~, debe aclararse que cada termino corresponde a una fasediferente y por tanto la superposicion ya no corresponde en general a un estado estacionario.

Es esencial tener presente que toda esta discusion solo es valida cuando V (r) no es funcion explıcita del tiempo,de otro modo no es posible en general tener soluciones con separacion de variables.

3.3. Propiedades generales de la ecuacion de Schrodinger

Retornaremos ahora a la forma general de la ecuacion de Schrodinger Ec. (3.10)

[− ~2

2m∇2 + V (r, t)

]ψ (r, t) = i~

∂ψ (r, t)

∂t

H (r, t)ψ (r, t) = i~∂ψ (r, t)

∂t(3.20)

en la cual el potencial puede depender del espacio y del tiempo. La primera observacion relevante es que el operadorH es hermıtico. Para ver esto, basta con tener en cuenta que desde el punto de vista de los kets, las funciones deonda son kets escritos en la representacion de coordenadas, y en tal representacion el operador H se puede escribircomo

H =(−i~∇) (−i~∇)

2m+ V (r, t) =

P 2

2m+ V (r, t) (3.21)

Page 161: Mecanica Cuantica: Notas de Clase

3.3. PROPIEDADES GENERALES DE LA ECUACION DE SCHRODINGER 161

siendo P el operador definido por las Ecs. (1.188), que en representacion de la base |r〉 esta dado por la Ec.(1.191). Ya vimos en la seccion 1.43.4 que este operador es Hermıtico, y como V (r, t) es una funcion real, tambienes hermıtica1. En consecuencia H tambien es hermıtico. Notese que esto es indispensable para que el espectro deeste operador (la energıa) sea real (ver teorema 1.62).

Ahora bien, recordemos que a cada funcion de onda en el espacio le asociamos un ket en el espacio E en laforma ψ (r, t) ↔ |ψ (t)〉 es conveniente escribir la ecuacion de Schrodinger como una ecuacion dinamica de los kets(en lugar de la funcion de onda), debido a que una ecuacion planteada para el vector abstracto se puede tomarde manera muy sencilla en cualquier representacion. Es facil ver que la Ec. de Schrodinger para kets de la forma

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (3.22)

conduce a la Ec. de Schrodinger (3.20) cuando usamos la representacion de la base |r〉, siempre que H (t) sea eloperador (abstracto) que en representacion de la base |r〉 este dado por (3.21). Para verlo aplicamos el bra 〈r|a ambos lados de (3.22)

i~ 〈r| ddt

|ψ (t)〉 = 〈r|H (t) |ψ (t)〉

dado que |ψ (t)〉 no depende de r, la derivada total o parcial en el tiempo coinciden para el ket. Adicionalmente,cuando el ket se transforma en funcion de onda la cual es un campo, debe tenerse en cuenta que las coordenadas ren ψ (r, t) son lugares geometricos y no variables dinamicas, por tanto las variables r y t son todas independientes,de modo que2

i~ 〈r| ddt

|ψ (t)〉 = i~ 〈r| ∂∂t

|ψ (t)〉 = ∂

∂t〈r |ψ (t)〉

i~ 〈r| ddt

|ψ (t)〉 =∂ψ (r, t)

∂t

y de la condicion establecida para H (t) se tiene que

〈r|H (t) |ψ (t)〉 = H (r, t) 〈r |ψ (t)〉 = H (r, t)ψ (r, t)

con lo cual se reproduce la Ec. de Schrodinger (3.20) en representacion de coordenadas. Veamos las principalespropiedades de la ecuacion de Schrodinger.

3.3.1. Determinismo en las soluciones

Puesto que la ecuacion es de primer orden en el tiempo, dado un estado inicial |ψ (t0)〉 el estado |ψ (t)〉 en untiempo t subsequente esta determinado, esto se debe a que la ecuacion no es invariante ante t → −t (como sı ocurrecon la ecuacion de onda). No hay indeterminacion en la evolucion del estado del sistema. La indeterminacion seproduce es con el proceso de medida de una cantidad Fısica, en cuyo caso el vector de estado sufre un cambioabrupto y parcialmente impredecible (ya que se puede evaluar una probabilidad para cada cambio abrupto posible).Sin embargo, en el tiempo comprendido entre dos medidas, el vector de estado evoluciona en forma perfectamentedeterminista segun la Ec. (3.22).

3.3.2. Principio de superposicion

Puesto que la Ec. (3.22) es lineal y homogenea (por construccion), si |ψ1 (t)〉 y |ψ2 (t)〉 son soluciones, tambienlo sera |ψ (t)〉 = λ1 |ψ1 (t)〉+ λ2 |ψ2 (t)〉. Esto implica que si el estado inicial es de la forma |ψ (t0)〉 = λ1 |ψ1 (t0)〉+

1Visto de otro modo el potencial es un operador del tipo V (r, t) I , siendo I la identidad. Si V (r, t) es real, este operador es hermıtico.2En una teorıa clasica de campos, las coordenadas espaciales se convierten en parametros y las coordenadas generalizadas son los

campos. Tenemos entonces cuatro parametros: 3 posiciones y el tiempo, siendo la posiciones lugares geometricos en la “grilla” delespacio euclidiano. Los cuatro parametros son totalmente independientes unos de otros.

Page 162: Mecanica Cuantica: Notas de Clase

162 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

λ2 |ψ2 (t0)〉 entonces el estado en un tiempo t posterior sera |ψ (t)〉 = λ1 |ψ1 (t)〉 + λ2 |ψ2 (t)〉 con lo cual tenemosuna correspondencia lineal entre |ψ (t0)〉 y |ψ (t)〉. Por tanto, hay un operador lineal conocido como operadorevolucion temporal que conecta a estas dos funciones

|ψ (t)〉 = U (t, t0) |ψ (t0)〉 (3.23)

analizaremos este operador mas en detalle en la Sec. 7.1.

3.3.3. Conservacion de la probabilidad

En virtud de la interpretacion de |ψ (r, t)|2 como una densidad de probabilidad es necesario que

〈ψ (t)|ψ (t)〉 = ‖ψ‖2 =∫

|ψ (r, t)|2 d3r = 1

para todo tiempo, i.e. en cualquier instante la partıcula debe encontrarse en algun lugar del espacio (exceptocuando hay procesos de creacion y destruccion de partıculas que no incluımos en el presente formalismo). Estosignifica que la norma de un ket |ψ (t)〉 debe ser constante en el tiempo. Es necesario por tanto que la ecuacionde Schrodinger mantenga invariante en el tiempo la norma de los vectores, con el fin de dar una interpretacionprobabilıstica coherente.

Para mirar la conservacion de la probabilidad debemos evaluar la derivada total de la norma en el tiempo

d

dt〈ψ (t)|ψ (t)〉 =

[d

dt〈ψ (t)|

]|ψ (t)〉+ 〈ψ (t)|

[d

dt|ψ (t)〉

](3.24)

la derivada temporal del ket se obtiene directamente de la ecuacion de Schrodinger Ec. (3.22)

d

dt|ψ (t)〉 = 1

i~H (t) |ψ (t)〉 (3.25)

para obtener la derivada temporal del bra, sacamos el hermıtico conjugado de dicha ecuacion

d

dt〈ψ (t)| = − 1

i~〈ψ (t)|H† (t) = − 1

i~〈ψ (t)|H (t) (3.26)

donde hemos usado la hermiticidad de H. Reemplazando (3.25) y (3.26) en (3.24) se obtiene

d

dt〈ψ (t)|ψ (t)〉 =

[− 1

i~〈ψ (t)|H (t)

]|ψ (t)〉+ 〈ψ (t)|

[1

i~H (t) |ψ (t)〉

]= 0

esto implica entonces que si normalizamos el estado inicial, el estado en cualquier tiempo continuara normaliza-do. Notese la importancia de la hermiticidad de H para lograr la conservacion de la norma y por tanto, de laprobabilidad.

3.3.4. La ecuacion de continuidad para la probabilidad

Por simplicidad trabajaremos el caso de una sola partıcula (sin espın). Asumiremos que la funcion de ondaψ (r, t) esta normalizada, en tal caso |ψ (r, t)|2 representa la densidad de probabilidad de que la partıcula este enla posicion r en el tiempo t

dP (r, t) = ρ (r, t) dV = |ψ (r, t)|2 dV (3.27)

tenemos que la probabilidad total nos da

PT ≡∫ρ (r, t) dV = 1

Page 163: Mecanica Cuantica: Notas de Clase

3.3. PROPIEDADES GENERALES DE LA ECUACION DE SCHRODINGER 163

para todo tiempo, de modo que PT representa una “carga generalizada” que se conserva. Por supuesto esto nosignifica que la distribucion de esta “carga” (distribucion de probabilidad), permanezca igual en el tiempo paracada punto r, las variaciones de ρ (r, t) con el tiempo generan una propagacion de la distribucion de carga. Engeneral tanto las variaciones espaciales como temporales de ρ (r, t) generan una corriente de probabilidad, si ρno es funcion del tiempo se genera una corriente estacionaria. Recordemos que el volumen no es necesariamentetodo el espacio si existen regiones con probabilidad cero. Lo importante es que no cruce corriente de probabilidaden la superficie que delimita al volumen de integracion, ya que si esto ocurre, habra probabilidad diferente de ceroen regiones que en tiempos anteriores eran inaccesibles. Esta situacion es analoga al caso en que ρ (r, t) simbolizabauna densidad de carga electrica a la cual le podemos asociar una densidad de corriente J (r, t).

Es bien conocido que la conservacion global de la carga generalizada proviene de una ley de conservacion localque prohibe la creacion espontanea de carga generalizada neta. Esto implica que si tomamos un volumen por cuyasuperficie limitadora cruza corriente de carga generalizada, el flujo neto de carga por la superficie hacia afuera(adentro) debe estar compensado por una disminucion (aumento) en la carga interior al volumen, el enunciadopreciso de esta ley local de conservacion es

∂tρ (r, t) +∇ · J (r, t) = 0 (3.28)

siendo ρ la densidad de carga generalizada y J la densidad de corriente generalizada, esta expresion es conocidacomo ecuacion de continuidad. Puesto que hemos encontrado la carga conservada (probabilidad total) y definidoya la densidad de probabilidad, debemos encontrar una densidad de corriente de probabilidad que nos de unaecuacion de la forma (3.28), en este caso estamos tratando a la probabilidad como un fluıdo o medio contınuo.

Volveremos a la ecuacion de Schrodinger en representacion de coordenadas dado por (3.10)

− ~2

2m∇2ψ (r, t) + V (r, t) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.29)

el potencial V (r, t) debe ser real para que H sea hermıtico (lo cual es esencial para la conservacion de la proba-bilidad como ya vimos). La ecuacion compleja conjugada de la Ec. de Schrodinger es

− ~2

2m∇2ψ∗ (r, t) + V (r, t) ψ∗ (r, t) = −i~∂ψ

∗ (r, t)∂t

(3.30)

multiplicamos (3.29) por ψ∗ (r, t) y (3.30) por −ψ (r, t) y sumamos

− ~2

2mψ∗ (r, t)∇2ψ (r, t) + V (r, t) ψ∗ (r, t)ψ (r, t) = i~ψ∗ (r, t)

∂ψ (r, t)

∂t~2

2mψ (r, t)∇2ψ∗ (r, t)− V (r, t) ψ (r, t)ψ∗ (r, t) = i~ψ (r, t)

∂ψ∗ (r, t)∂t

quedando

− ~2

2m

[ψ∗∇2ψ − ψ∇2ψ∗] = i~

[ψ∗ ∂ψ

∂t+ ψ

∂ψ∗

∂t

]

− ~

2mi

[ψ∗∇2ψ − ψ∇2ψ∗] =

∂t[ψ∗ψ]

sumando y restando un termino a la izquierda

− ~

2mi

[ψ∗∇2ψ + (∇ψ∗) · (∇ψ)− (∇ψ∗) · (∇ψ)− ψ∇2ψ∗] =

∂t[ψ∗ψ]

− ~

2mi∇ · [ψ∗∇ψ − ψ∇ψ∗] =

∂ρ

∂t

Page 164: Mecanica Cuantica: Notas de Clase

164 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

quedando finalmente∂ρ

∂t+∇ ·

~

2mi[ψ∗∇ψ − ψ∇ψ∗]

= 0 (3.31)

y comparando (3.31) con la ecuacion (3.28) de continuidad se tiene que

J =~

2mi[ψ∗∇ψ − ψ∇ψ∗]

esta ecuacion se puede reescribir definiendo

J =~

m

1

2i[Z − Z∗]

; Z ≡ ψ∗∇ψ

J =1

m

1

2

[~Z

i+

(~Z

i

)∗]=

1

mRe

[~Z

i

]

de modo que

J (r, t) =~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

1

mRe

[ψ∗(~

i∇ψ)]

(3.32)

hemos probado entonces la conservacion local de la probabilidad y encontramos la forma explıcita de la densidadde corriente, la cual es real como era de esperarse.

Vale la pena calcular la corriente de probabilidad para el caso especial de estados estacionarios de la forma(3.15), en tal caso al reemplazar (3.15) en (3.32) resulta

J =~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

~

2mi

[ϕ (r) e−iωt

]∗∇[ϕ (r) e−iωt

]−[ϕ (r) e−iωt

]∇[ϕ (r) e−iωt

]∗

J =~

2mi

ϕ∗ (r) eiωte−iωt∇ϕ (r)− ϕ (r) e−iωteiωt∇ϕ∗ (r)

quedando finalmente

J (r) =~

2miϕ∗ (r)∇ϕ (r)− ϕ (r)∇ϕ∗ (r) =

1

mRe

[ϕ∗ (r)

~

i∇ϕ (r)

]estados estacionarios (3.33)

comparando, (3.32) con (3.33), vemos que para estados estacionarios, la corriente se puede calcular reemplazandoψ (r, t) por ϕ (r), es decir omitiendo la componente temporal de ψ. Efectivamente, (3.33) corresponde a unacorriente estacionaria tal como se usa en mecanica clasica, i.e. una corriente que depende de la posicion pero queno depende explıcitamente del tiempo.

3.3.5. Expresion polar de la corriente de probabilidad

Consideremos una funcion de onda arbitraria ψ (r), utilizando su descomposicion compleja polar tenemos

ψ (r) = α (r) eiξ(r) ; α (r) ≥ 0 , 0 ≤ ξ (r) < 2π

si sustituımos esta expresion polar en la Ec. (3.32) para la densidad de corriente de probabilidad encontramosque3

J (r) =~

2mi

α (r) e−iξ(r)∇

[α (r) eiξ(r)

]− α (r) eiξ(r)∇

[α (r) e−iξ(r)

]

=~

2mi

α (r) e−iξ(r)eiξ(r) [∇α (r) + iα (r) ∇ξ (r)]− α (r) eiξ(r)e−iξ(r) [∇α (r)− iα (r) ∇ξ (r)]

J (r, t) =~

mα2 (r, t) ∇ξ (r, t) (3.34)

3Por simplicidad hemos omitido la posible dependencia explıcita del tiempo pero esto no altera los resultados.

Page 165: Mecanica Cuantica: Notas de Clase

3.4. APLICACION DE LA ECUACION DE SCHRODINGER A POTENCIALES DISCONTINUOS 165

y la densidad de probabilidad esta dada por

ρ (r, t) = |ψ (r, t)|2 = α2 (r, t) (3.35)

vemos que ρ (r, t) solo depende del modulo del complejo ψ (r, t), en tanto que J (r, t) depende del modulo y delgradiente de la fase. Por ejemplo, si la fase es constante en el espacio, J (r, t) es cero, aunque la densidad no losea4. Las Ecs. (3.34, 3.35) nos dan a J (r, t) y ρ (r, t) cuando conocemos ψ (r, t), vale preguntarse si inversamentepodemos determinar unıvocamente a ψ (r, t) con base en el conocimiento de J (r, t) y ρ (r, t). La Ec. (3.35) nos daa ρ (r, t) en funcion del modulo de ψ (r, t). Por otro lado, dividiendo las Ecs. (3.34, 3.35) resulta

∇ξ (r, t) = m

~

J (r, t)

ρ (r, t)

esta ecuacion solo tiene solucion si

∇× J (r, t)

ρ (r, t)= 0 (3.36)

que tiene un conjunto infinito de soluciones que solo diferen en una constante (o en una funcion solo del tiempo),que corresponderıa a una fase global irrelevante en ψ (r, t). Por tanto, si conocemos a ρ (r, t) y J (r, t) entoncesψ (r, t) esta bien especificada siempre y cuando se satisfaga la condicion (3.36). Si dicha condicion no se satisface,no existe una funcion de onda asociada a ρ (r, t) y J (r, t) incluso si estas cumplen con la ecuacion de continuidad.

3.4. Aplicacion de la ecuacion de Schrodinger a potenciales discontınuos

Hemos visto que los efectos cuanticos no son evidentes cuando se considera a h como muy pequena. Enparticular, si la longitud de onda λ = h/p asociada a la partıcula es mucho menor que todas las demas longitudesinvolucradas en el problema, la naturaleza ondulatoria de la materia quedara apantallada y el comportamientode la partıcula sera esencialmente clasico. Esto es analogo a lo que ocurre entre la optica geometrica y la opticaondulatoria. Cuando la longitud de la onda es mucho menor que las demas longitudes involucradas en el problema,la optica geometrica nos predice muy bien los fenomenos opticos, el comportamiento de los rayos es esencialmentecorpuscular. Cuando esto no se cumple, los aspectos ondulatorios de la luz se vuelven importantes para unaadecuada descripcion de los fenomenos.

De la misma forma, cuando un potencial actua sobre una partıcula, los efectos cuanticos debidos a estainteraccion solo seran significativos si el potencial varıa significativamente sobre una distancia menor a la longitudde onda de DeBroglie asociada a la partıcula. Es por esta razon que estudiaremos potenciales discontınuos en dondela variacion sera finita para una distancia basicamente cero (es decir menor que cualquier longitud de onda). Esclaro que esto constituye una idealizacion ya que los potenciales fısicos deben ser contınuos si bien pueden exhibiruna enorme pendiente. Este lımite solo correspondera aproximadamente a la realidad si la distancia δx en queocurre esta fuerte variacion, es mucho menor que la longitud de onda de De Broglie asociada a la partıcula ymucho menor que cualquier otra longitud tıpica del problema. Estos potenciales se podran definir adecuadamentea traves de la funcion paso definida por

θ (x− x0) =

0 si x < x01 si x > x0

3.5. Potenciales rectangulares, analogo optico

Definamos un potencial de la forma

4Esto es una consecuencia mas del caracter intrınsecamente complejo de la funcion de onda, pues la fase tiene un claro contenidofısico.

Page 166: Mecanica Cuantica: Notas de Clase

166 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

V (x) =

V0 si −∞ < x < x0V1 si x0 < x < x1V2 si x1 < x <∞

; V1 < V2 < V0 (3.37)

la fuerza F (x) = −dV (x) /dx serıa del tipo

F (x) = F0δ (x− x0)− F1δ (x− x1)

En primer lugar las predicciones de la mecanica clasica son inmediatas, por ejemplo si V (x) es una energıapotencial gravitacional, el perfil del potencial representa el perfil de la superficie sobre la cual se mueve la partıcula,los valores de x para los cuales E < V estaran prohibidos. En las regiones de potencial constante la velocidadde la partıcula es constante ya que es libre, solo en las discontinuidades experimenta una fuerza y si pasa a laotra region (si E > V ) su energıa cinetica se vera aumentada (disminuıda) si pasa a una zona de menor (mayor)potencial.

Como el potencial no depende del tiempo podemos encontrar soluciones estacionarias para la ecuacion deSchrodinger. En la region de potencial constante V , la ecuacion de Schrodinger independiente del tiempo nos da

[− ~2

2m

d2

dx2+ V

]ϕ (x) = Eϕ (x)

[d2

dx2+

2m

~2(E − V )

]ϕ (x) = 0 (3.38)

escrita en esta forma la ecuacion tiene un interesante analogo optico. Consideremos un medio transparente deındice de refraccion n independiente de la posicion y el tiempo. En tal medio puede haber ondas electromagneticascon campo electrico independiente de y y z

E (r, t) = uE (x) e−iΩt (3.39)

siendo u un vector unitario perpendicular al eje x, teniendo en cuenta que E satisface la ecuacion de onda y lasecuaciones de Maxwell, resulta [

d2

dx2+n2Ω2

c2

]E (x) = 0 (3.40)

las Ecs. (3.38) y (3.40) son identicas si hacemos la asignacion

2m

~2(E − V ) =

n2Ω2

c2(3.41)

adicionalmente, en los lugares en donde V (y por tanto n) son discontınuos las condiciones de frontera para ϕ (x)y E (x) son las mismas: las soluciones y sus primeras derivadas deben permanecer contınuas (lo veremos masadelante para las ϕ (x)). Esta analogıa permite asociar al problema de una partıcula en un potencial del tipo(3.37) un problema optico asociado a la propagacion de una onda electromagnetica de frecuencia angular Ω en unmedio cuyo ındice de refraccion n tiene discontinuidades del mismo tipo. En la Ec. (3.41) podemos despejar paran (Ω) y obtener

n (Ω) =1

√2mc2 (E − V ) (3.42)

notese que para la onda electromagnetica, la region con E > V corresponde a un medio transparente con ındicede refraccion real y la onda es de la forma eikx. Por otro lado, cuando E < V corresponde a un medio con unındice de refraccion imaginario de modo que n2 < 0 y al reemplazar esto en (3.40) se obtiene una solucion de laforma e−ρx que es del tipo de onda evanescente.

Debe tenerse en cuenta que si bien obtendremos un comportamiento funcional analogo al optico, la interpre-tacion probabilıstica es muy diferente a la interpretacion clasica para onda electromagnetica.

Page 167: Mecanica Cuantica: Notas de Clase

3.5. POTENCIALES RECTANGULARES, ANALOGO OPTICO 167

3.5.1. Estrategia de solucion para potenciales acotados con discontinuidades de salto

Veamos ahora la estrategia especıfica de solucion para los estados estacionarios de la partıcula sometidas apotenciales discontınuos. En las regiones de energıa potencial constante usamos la Ec. (3.38)

[d2

dx2+

2m

~2(E − V )

]ϕ (x) = 0 (3.43)

es util distinguir tres casos(a) E > V , introduzcamos por conveniencia una constante positiva k definida por

E − V ≡ ~2k2

2m(3.44)

al reemplazar en (3.43) queda [d2

dx2+ k2

]ϕ (x) = 0 (3.45)

que es la ecuacion de un oscilador armonico y la solucion de la Ec. (3.45) se puede escribir como

ϕ (x) = Aeikx +A′e−ikx (3.46)

donde A y A′ son complejos constantes.(b) E < V , esta condicion corresponde a regiones del espacio que estan clasicamente prohibidas. En este caso

introducimos la constante positiva ρ dada por

V − E ≡ ~2ρ2

2m(3.47)

y la Ec. (3.43) queda [d2

dx2− ρ2

]ϕ (x) = 0 (3.48)

con solucionϕ (x) = Beρx +B′e−ρx (3.49)

siendo B y B′ constantes complejas.(c) E = V , en este caso

d2ϕ (x)

dx2= 0 ⇒ ϕ (x) = Cx+C ′

Ahora veamos el comportamiento de las soluciones en la discontinuidad. La primera tentacion es pensar quela funcion de onda debe ser discontınua en un punto donde el potencial lo sea, veremos sin embargo que tantoϕ (x) como dϕ (x) /dx deben ser contınuas y solo es la segunda derivada d2ϕ (x) /dx2 la que es discontınua en elpunto. Para ver esto, recordemos que un potencial con una discontinuidad de salto en x1 representa en fısica ellımite cuando ε→ 0 de un potencial Vε (x) que es igual a V (x) fuera del intervalo [x1 − ε, x1 + ε], pero que varıade forma contınua en dicho intervalo. Consideremos la ecuacion

d2

dx2ϕε (x) +

2m

~2[E − Vε (x)]ϕε (x) = 0 (3.50)

asumimos que Vε (x) esta acotado en el intervalo [x1 − ε, x1 + ε], y que esta cota no depende del parametro ε.Esto se cumple en la mayorıa de los casos, ya que usualmente Vε estara definido dentro de los valores [V0, V1] quese tienen en la discontinuidad de salto a la izquierda y la derecha de x1. Escogemos una solucion ϕε (x) que parax < x1 − ε y para x > x1 + ε coincida con una solucion dada de la Ec. (3.43). La idea es demostrar que cuandoε→ 0 entonces ϕε (x) tiende a una funcion ϕ (x) contınua y diferenciable a primer orden en x1. Es posible probar

Page 168: Mecanica Cuantica: Notas de Clase

168 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

a traves de las propiedades de la ecuacion diferencial (3.43) que ϕε (x) permanece acotada para cualquier valorde ε con una cota independiente de ε, en la vecindad de x = x1. Esto fısicamente implica que la densidad deprobabilidad permanece finita. Integrando la Ec. (3.50) en el intervalo [x1 − η, x1 + η] resulta

∫ x1+η

x1−η

d

dx

[d

dxϕε (x)

]dx+

2m

~2

∫ x1+η

x1−η[E − Vε (x)]ϕε (x) dx = 0

dϕε (x1 + η)

dx− dϕε (x1 − η)

dx=

2m

~2

∫ x1+η

x1−η[Vε (x)− E]ϕε (x) dx (3.51)

y dado que Vε (x) y ϕε (x) permanecen acotados con cotas independientes de ε, la integral a la derecha de la Ec.(3.51) tiende a cero cuando η tiende a cero. Por lo tanto

lımη→0

[dϕε (x1 + η)

dx− dϕε (x1 − η)

dx

]= 0

por tanto, en este lımite, dϕ/dx es contınua en x = x1 y por tanto tambien ϕ (x) ya que derivabilidad implicacontinuidad. Por otro lado, d2ϕ/dx2 es discontınua en x = x1 puesto que en la Ec. (3.43) vemos que

lımη→0+

d2ϕ (x1 + η)

dx2+

2m

~2[E − V (x1 + η)]ϕ (x1 + η)

= 0

lımη→0+

[d2ϕ (x1 + η)

dx2

]= lım

η→0+

2m

~2[V (x1 + η)− E]ϕ (x1 + η)

lımη→0+

[d2ϕ (x1 + η)

dx2

]=

2m

~2[V1 − E]ϕ (x1)

siendo V1 el valor del potencial a la derecha de x1, similarmente

lımη→0−

[d2ϕ (x1 + η)

dx2

]=

2m

~2[V0 − E]ϕ (x1)

siendo V0 el valor del potencial a la izquierda de x1. Tenemos entonces que en x1 la segunda derivada presenta unsalto dado por

lımη→0+

[d2ϕ (x1 + η)

dx2

]− lımη→0−

[d2ϕ (x1 + η)

dx2

]=

2m

~2(V1 − V0)ϕ (x1)

esto es una discontinuidad de salto para la segunda derivada ya que V1 6= V0. Notese sin embargo, que la segundaderivada permanece acotada. Es importante resaltar la importancia de que Vε (x) permanezca acotado. Por ejem-plo, si V (x) = aδ (x) tenemos una funcion cuya integral permanece finita pero que no es acotada. En tal caso,ϕ (x) permanece contınua pero no la primera derivada.

Por tanto, para encontrar la solucion de los estados estacionarios cuando el potencial es contınuo a trozoscon discontinuidades de salto finito, calculamos primero las soluciones para las regiones en donde el potencial esconstante (con E > V o E < V segun el caso), y hacemos el “empalme” en los puntos donde hay discontinuidadesexigiendo la continuidad de la solucion y de su primera derivada.

3.5.2. Expresion para la corriente en regiones de potencial constante

Por simplicidad consideraremos un problema unidimensional de una partıcula colocada en un potencial cons-tante V0. Aunque este caso corresponde a partıcula libre, resulta interesante obtener la corriente en terminos deV0 ya que despues consideraremos la posibilidad de regiones con potencial constante pero diferente en cada region.Como la corriente (3.33) depende de la solucion para la funcion de onda estacionaria debemos considerar varioscasos segun la seccion 3.5.1

Page 169: Mecanica Cuantica: Notas de Clase

3.5. POTENCIALES RECTANGULARES, ANALOGO OPTICO 169

(a) E > V0, en tal caso la solucion estacionaria viene dada por la Ec. (3.46)

ϕ (x) = Aeikx +A′e−ikx (3.52)

donde hemos usado la definicion (3.44)

E − V0 ≡~2k2

2m

y sustituyendo (3.52) en la expresion (3.33) para la corriente

Jx =~

2mi[ϕ∗∂xϕ− ϕ∂xϕ

∗]

Jx =~

2mi

[(A∗e−ikx +A′∗eikx

)∂x

(Aeikx +A′e−ikx

)−(Aeikx +A′e−ikx

)∂x

(A∗e−ikx +A′∗eikx

)]

Jx =~

2mi

[(A∗e−ikx +A′∗eikx

)(ikAeikx − ikA′e−ikx

)−(Aeikx +A′e−ikx

)(−ikA∗e−ikx + ikA′∗eikx

)]

Jx =~k

2m

[(A∗e−ikx +A′∗eikx

)Aeikx −

(A∗e−ikx +A′∗eikx

)A′e−ikx

+(Aeikx +A′e−ikx

)A∗e−ikx −

(Aeikx +A′e−ikx

)A′∗eikx

]

Jx =~k

2m

[A∗A+A′∗Ae2ikx −A∗A′e−2ikx −A′∗A′ +AA∗ +A′A∗e−2ikx −AA′∗e2ikx −A′A′∗

]

Jx =~k

2m

[2 |A|2 +A′∗Ae2ikx −AA′∗e2ikx −A∗A′e−2ikx +A′A∗e−2ikx − 2

∣∣A′∣∣2]

Jx =~k

m

[|A|2 −

∣∣A′∣∣2]

(3.53)

el signo relativo se puede entender teniendo en cuenta que la funcion de onda (3.52) representa dos ondas conmomentos opuestos p = ±~k con densidades de probabilidad |A|2 y |A′|2, ademas ~k

m = pm = vg nos dice que Jx es

de la forma ρvg como era de esperarse.(b) Cuando E < V0 la solucion esta dada por las Ecs. (3.47, 3.49)

ϕ (x) = Beρx +B′e−ρx (3.54)

V0 − E ≡ ~2ρ2

2m(3.55)

sustituyendo (3.54) en (3.33) nos da

Jx =~

2mi[ϕ∗∂xϕ− ϕ∂xϕ

∗]

Jx =~

2mi

[(B∗eρx +B′∗e−ρx

)∂x(Beρx +B′e−ρx

)−(Beρx +B′e−ρx

)∂x(B∗eρx +B′∗e−ρx

)]

Jx =~

2mi

[(B∗eρx +B′∗e−ρx

) (ρBeρx − ρB′e−ρx

)−(Beρx +B′e−ρx

) (ρB∗eρx − ρB′∗e−ρx

)]

Jx =~ρ

2mi

[(B∗eρx +B′∗e−ρx

)Beρx −

(B∗eρx +B′∗e−ρx

)B′e−ρx

−(Beρx +B′e−ρx

)B∗eρx +

(Beρx +B′e−ρx

)B′∗e−ρx

]

Jx =~ρ

2mi

[B∗Be2ρx +B′∗B −B∗B′ −B′∗B′e−2ρx −BB∗e2ρx −B′B∗ +BB′∗ +B′B′∗e−2ρx

]

Jx =~ρ

2mi

[B∗Be2ρx −BB∗e2ρx + 2B′∗B − 2B∗B′ −B′∗B′e−2ρx +B′B′∗e−2ρx

]

Jx =~ρ

2mi

[2B′∗B − 2B∗B′]

Page 170: Mecanica Cuantica: Notas de Clase

170 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Jx =~ρ

2mi

[BB′∗ −B∗B′] = ~ρ

mIm[BB′∗] (3.56)

vemos que es necesario que en la funcion de onda (3.54) ambos coeficientes sean no nulos para que la corriente deprobabilidad sea diferente de cero.

3.6. El potencial escalon

Figura 3.1: Perfil de un potencial escalon con discontinuidad en x = 0 y altura V0.

Definamos un potencial en la forma

V (x) = V0θ (x) =

0 si x < 0 (Region I)V0 si x > 0 (Region II)

cuyo perfil se ilustra en la Fig. 3.1. Asumiremos que la partıcula viene desde x = −∞ en t = −∞ de modo queinicialmente solo hay una onda viajera que se propaga hacia la derecha. Distinguiremos dos casos

3.6.1. E > V0, reflexion parcial

Como la energıa es mayor que el potencial en ambas regiones, la Ec. (3.45) y la definicion (3.44) son validaspara las dos regiones I y II

[d2

dx2+ k21

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.57)

[d2

dx2+ k22

]ϕ (x) = 0 ; k2 ≡

√2m (E − V0)

~2(region II) (3.58)

ası mismo las soluciones en las dos regiones son de la forma (3.46)

ϕI (x) = A1eik1x +A′

1e−ik1x ; ϕII (x) = A2e

ik2x +A′2e

−ik2x (3.59)

dϕI (x)

dx= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= ik2

(A2e

ik2x −A′2e

−ik2x)

(3.60)

y puesto que la ecuacion (3.43) es homogenea, si ϕ es solucion tambien lo sera ϕ/A, siendo A una constante. Estoimplica que solo podemos determinar los cocientes entre las amplitudes pero no todas las amplitudes. Ahora bien,

Page 171: Mecanica Cuantica: Notas de Clase

3.6. EL POTENCIAL ESCALON 171

puesto que la amplitud de entrada es la de la onda incidente, es decir la de la onda que viaja hacia la derechaen la region I, tenemos que A1 es el parametro de entrada y todos los demas deben compararse con el. Por tantodeterminaremos los cocientes

A′1

A1,A2

A1,A′

2

A1.

Veamos la informacion que nos dan las condiciones de empalme, la continuidad de la funcion en x = 0 nos da

lımx→0−

ϕ (x) = lımx→0+

ϕ (x) ⇒ ϕI (x = 0) = ϕII (x = 0)

A1 +A′1 = A2 +A′

2 (3.61)

y la continuidad de la primera derivada en x = 0 nos da

lımx→0−

dϕ (x)

dx= lım

x→0+

dϕ (x)

dx⇒ dϕI (x = 0)

dx=dϕII (x = 0)

dx

k1(A1 −A′

1

)= k2

(A2 −A′

2

)(3.62)

como solo tenemos dos ecuaciones (3.61) y (3.62) para los tres cocientes, debemos fijar una amplitud para poderdeterminar los cocientes. Para ello tengamos en cuenta que cuando la funcion de onda penetra la region II vuelvea ser una funcion de onda libre (potencial constante) y ya hemos visto que la funcion de onda libre es una ondaviajera en una sola direccion, de modo que no es de esperarse que surja una onda reflejada en el interior de laregion II (solo en el lımite entre I y II donde sı hay interaccion). En consecuencia, no habra onda reflejada en laregion II, por lo cual segun la Ec. (3.59) vemos que

A′2 = 0 (3.63)

notese que esto esta relacionado con el hecho de que hayamos tomado el caso de una partıcula incidente queproviene de x = −∞ (condiciones iniciales)5. Las Ecs. (3.61, 3.62) se simplifican a

A1 +A′1 = A2 ; k1

(A1 −A′

1

)= k2A2 (3.64)

A1 +A′1

A1=

A2

A1;k1 (A1 −A′

1)

A1= k2

A2

A1

1 +A′

1

A1=

A2

A1;k1k2

(1− A′

1

A1

)=A2

A1(3.65)

igualando las dos Ecs. (3.65)

1 +A′

1

A1=

k1k2

(1− A′

1

A1

)⇒ 1− k1

k2= −

(1 +

k1k2

)A′

1

A1⇒ k2 − k1

k2= −

(k2 + k1k2

)A′

1

A1

A′1

A1=

k1 − k2k1 + k2

y reemplazando en la primera de las Ecs. (3.65)

1 +k1 − k2k1 + k2

=A2

A1⇒ 2k1

k1 + k2=A2

A1

tenemos entonces que las condiciones iniciales y de empalme nos llevan a

A′2 = 0 ;

A′1

A1=k1 − k2k1 + k2

> 0 ;A2

A1=

2k1k1 + k2

> 0 (3.66)

5Si la partıcula proviniera de x = +∞ y viajara hacia la izquierda, esperarıamos onda incidente y reflejada en la region II y soloonda transmitida en la region I.

Page 172: Mecanica Cuantica: Notas de Clase

172 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

donde el hecho de que el primer cociente es positivo proviene de las expresiones para k1 y k2 Ecs. (3.57, 3.58).Ahora bien, para E > V0, la funcion ϕI (x) en la Ec. (3.59) representa dos ondas con momentos opuestos, es decirpropagandose en direcciones opuestas. La onda proporcional a A1 se propaga de izquierda a derecha de modo querepresenta una partıcula incidente (p = ~k1), la onda proporcional a A′

1 tiene momento p = −~k1 por lo cualrepresenta una partıcula reflejada. Puesto que A′

2 = 0 tenemos que ϕII (x) en la Ec. (3.59) representa solo unaonda que corresponde a una partıcula transmitida. Es natural entonces preguntarse por la probabilidad de queuna partıcula que incide desde x = −∞ pase el escalon de potencial o rebote en el (que en terminos cuanticos es laprobabilidad de detectar a la partıcula en las regiones II y I respectivamente). A tales cantidades las llamaremoscoeficientes de transmision T y de reflexion R respectivamente. Para calcular estas cantidades debemos calcularprimero la corriente asociada a cada region de potencial constante. Para el caso E > V0 esta corriente viene dadapor las Ecs. (3.52, 3.53), que aplicadas a las soluciones (3.59) y con la condicion A′

2 = 0 Ec. (3.63) nos da

JI (x) =~k1m

[|A1|2 −

∣∣A′1

∣∣2]

(3.67)

JII (x) =~k2m

|A2|2 (3.68)

JI es la superposicion entre la corriente incidente y la corriente reflejada, en tanto que JII es la corriente trans-mitida, por lo tanto

JI (x) = Jinc + Jrefl ; Jinc =~k1m

|A1|2 ; Jrefl = −~k1m

∣∣A′1

∣∣2

JII (x) = Jtr =~k2m

|A2|2

Ahora bien, la corriente incidente Jinc se divide en dos terminos cuando incide sobre la discontinuidad: la corrientereflejada y la transmitida

Jinc = Jtr + Jrefl

El coeficiente de reflexion del escalon es entonces el cociente entre la corriente reflejada sobre la corriente incidente

R =

∣∣∣∣JreflJinc

∣∣∣∣ =∣∣∣∣A′

1

A1

∣∣∣∣2

(3.69)

y el coeficiente de transmision es el cociente entre la corriente transmitida sobre la corriente incidente

T =

∣∣∣∣JtrJinc

∣∣∣∣ =k2k1

∣∣∣∣A2

A1

∣∣∣∣2

(3.70)

podemos escribir R y T en terminos de k1 y k2. Para hacerlo con R reemplazamos (3.66) en (3.69)

R =

∣∣∣∣A′

1

A1

∣∣∣∣2

=

∣∣∣∣k1 − k2k1 + k2

∣∣∣∣2

=(k1 − k2)

2

(k1 + k2)2 =

(k1 + k2)2 − 4k1k2

(k1 + k2)2

R = 1− 4k1k2

(k1 + k2)2

para el caso de T , reemplazamos (3.66) en (3.70)

T =k2k1

∣∣∣∣A2

A1

∣∣∣∣2

=k2k1

∣∣∣∣2k1

k1 + k2

∣∣∣∣2

=k2k1

4k21(k1 + k2)

2 =4k1k2

(k1 + k2)2

los coeficientes R y T quedan finalmente

R = 1− 4k1k2

(k1 + k2)2 , T =

4k1k2

(k1 + k2)2 (3.71)

Page 173: Mecanica Cuantica: Notas de Clase

3.6. EL POTENCIAL ESCALON 173

ahora bien, en un experimento concreto es claro que la partıcula debe reflejarse o transmitirse, y esto se traduceen que necesariamente

R+ T = 1

lo cual es consistente con las Ecs. (3.71). Es de enfatizar que contrario a las predicciones de la mecanica clasica,tenemos una probabilidad diferente de cero de que la partıcula se devuelva.

Ahora estamos preparados para la analogıa optica: De las Ecs. (3.42) vemos que un escalon de potencial conV = 0 para x < x1 (region I) y V = V0 < E para x > x1 (region II), corresponde a una onda electromagneticaque se propaga de izquierda a derecha desde una region I de ındice real n1 dado por

n1 =c

√2mE

hacia una region II (separada de la region I por el punto x = x1) de ındice de refraccion real n2

n2 =c

√2m (E − V0)

de modo que tenemos una interfase plana en x = x1 con n1 > n2 (la region I podrıa ser vidrio y la region II podriaser aire o el vacıo). Ambos medios son transparentes. En este caso la onda incidente (con direccion de propagacionnormal a la interfase) se parte en una onda transmitida (o refractada) y una onda reflejada. Ahora bien, las Ecs.(3.66) muestran que los cocientes A′

1/A1 y A2/A1 son reales positivos, i.e. A′1 y A2 tienen la misma fase que A1

6.Fısicamente, esto significa que no hay corrimiento de fase en la onda reflejada ni en la transmitida, con respectoa la onda incidente. Por tanto, la partıcula cuantica no es retardada por su reflexion o transmision.

Es interesante ver lo que ocurre en el lımite cuando E ≫ V0. De las definiciones de k1 y k2 en las Ecs. (3.57,3.58), junto con las Ecs. (3.71) es facil ver que

T =4k1k2

(k1 + k2)2 =

4(√

2mE~2

)(√2m(E−V0)

~2

)

(√2mE~2

+√

2m(E−V0)~2

)2 =8m(√

E)(√

(E − V0))

(√2mE +

√2m (E − V0)

)2

T =8m[√

E (E − V0)]

[√2m(√

E +√E − V0

)]2 =4[√

E (E − V0)]

[(√E +

√E − V0

)]2 =

4[√

E(E−V0)]

E

[(√E+

√E−V0)]

2

E

T =

4

[√1− V0

E

]

[(√E+

√E−V0)√E

]2 =

4

[√1− V0

E

]

[1 +

√1− V0

E

]2 ≈ 4

[1 + 1]2= 1

por tanto si E ≫ V0 entonces R ∼= 0 y T ∼= 1, de modo que para energıas suficientemente grandes comparadas conla altura del potencial, la partıcula saltara el escalon practicamente con toda certeza.

La diferencia en la interpretacion en optica y en cuantica se puede apreciar con el proceso de medicion. Sijusto despues de que la onda incidente se parte en dos, colocamos dos detectores en la regiones I y II, en unexperimento optico los dos aparatos detectaran una onda cada una con intensidad menor a la incidente (siendola suma de las dos intensidades la intensidad incidente). En un experimento cuantico solo uno de los detectoresdetectara una partıcula, pero si repetimos el experimento muchas veces, la partıcula sera detectada en uno u otrodetector en cada experimento, en una proporcion dada por el patron de probabilidad.

6Para el cociente de dos amplitudes complejas podemos escribir tales cocientes en forma polar i.e A1/A2 =(|A1| eiδ1

)/ |A2| eiδ2 . De

modo que si el cociente es positivo entonces δ1 = δ2, si el cociente es negativo hay una diferencia de fase π y si el cociente es complejohay una diferencia de fase arbitraria diferente a cero y π.

Page 174: Mecanica Cuantica: Notas de Clase

174 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

3.6.2. E < V0; reflexion total

Asumiendo E ≥ 0 se tiene que en la region I son validas la Ec. (3.45) y la definicion (3.44), en tanto que enla region II son validas la Ec. (3.48) y la definicion (3.47)

[d2

dx2+ k21

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.72)

[d2

dx2− ρ22

]ϕ (x) = 0 ; ρ2 ≡

√2m (V0 − E)

~2(region II) (3.73)

De modo que la solucion en la region I es del tipo armonico Ec. (3.46) y en la region II es del tipo exponencialEc. (3.49)

ϕI = A1eik1x +A′

1e−ik1x ; ϕII (x) = B2e

ρ2x +B′2e

−ρ2x (3.74)

dϕIdx

= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕIIdx

= ρ2(B2e

ρ2x −B′2e

−ρ2x) (3.75)

para que la solucion se mantenga acotada cuando x→ +∞ es necesario que7

B2 = 0 (3.76)

y las condiciones de empalme nos dan

lımx→0−

ϕ (x) = lımx→0+

ϕ (x) ; lımx→0−

dϕ (x)

dx= lım

x→0+

dϕ (x)

dx⇒

ϕI (x = 0) = ϕII (x = 0) ;dϕIdx

(x = 0) =dϕIIdx

(x = 0) (3.77)

y reemplazando (3.74, 3.75, 3.76) en (3.77) resulta

A1 +A′1 = B′

2 ; ik1(A1 −A′

1

)= −ρ2B′

2 (3.78)

Debido a la nulidad de B2, podremos encontrar todos los cocientes de la forma A′1/A1 y B′

2/A1 sin ningunasuposicion adicional. Dividiendo las Ecs. (3.78) por A1 queda

1 +A′

1

A1=

B′2

A1; ik1

(1− A′

1

A1

)= −ρ2

B′2

A1

1 +A′

1

A1=

B′2

A1; − ik1

ρ2

(1− A′

1

A1

)=B′

2

A1(3.79)

igualando estas ecuaciones

1 +A′

1

A1= − ik1

ρ2

(1− A′

1

A1

)⇒ A′

1

A1− ik1ρ2

A′1

A1= − ik1

ρ2− 1

(1− ik1

ρ2

)A′

1

A1= −

(ik1ρ2

+ 1

)⇒ (ρ2 − ik1)

A′1

A1= −ik1 − ρ2

(iρ2 + k1)A′

1

A1= k1 − iρ2 ;

A′1

A1=k1 − iρ2k1 + iρ2

y reemplazando este cociente en la primera de las Ecs. (3.79)

1 +k1 − iρ2k1 + iρ2

=B′

2

A1⇒ B′

2

A1=

2k1k1 + iρ2

7En x→ −∞ la solucion es oscilante ya que estamos en la region I. Por lo tanto, no hay problemas de divergencia.

Page 175: Mecanica Cuantica: Notas de Clase

3.6. EL POTENCIAL ESCALON 175

tenemos que los cocientes estan dados por

A′1

A1=k1 − iρ2k1 + iρ2

;B′

2

A1=

2k1k1 + iρ2

(3.80)

Las expresiones finales para ϕI (x) y ϕII (x) estan dadas por las Ecs. (3.74, 3.75, 3.76)

ϕI = A1eik1x +A′

1e−ik1x ; ϕII (x) = B′

2e−ρ2x (3.81)

dϕIdx

= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= −ρ2B′

2e−ρ2x (3.82)

reemplazando la primera de las Ecs. (3.81) en (3.53)

JI =~k

m

[|A1|2 −

∣∣A′1

∣∣2]

Por otro lado, usando la segunda de las Ecs. (3.81) en la Ec. (3.56) y teniendo en cuenta que en la Ec. (3.56)los dos coeficientes deben ser no nulos para que exista corriente, se tiene que

JII = 0

de modo que el flujo transmitido es cero.

En el analogo optico, cuando E < V0 el ındice n2 correspondiente a la region II (x > x1) se vuelve puramenteimaginario y la onda se refleja completamente. Sin embargo, la onda evanescente para la region II muestra que unafraccion de la intensidad de la onda cruza la frontera (onda sobreamortiguada i.e. sin oscilacion). Similarmente enel caso cuantico la partıcula es siempre reflejada (reflexion total) pero hay una probabilidad diferente de cero deque la partıcula pase a la region II8, esto difiere sin embargo del comportamiento clasico de una partıcula parala cual esta region estarıa estrictamente prohibida. No obstante, en el caso cuantico, esta probabilidad disminuyecon x exponencialmente de modo que se vuelve despreciable cuando x es mayor a la “longitud de penetracion”1/ρ2 de la onda evanescente. Adicionalmente, las Ecs. (3.80) nos dicen que el coeficiente A′

1/A1 es complejo demodo que hay cierto corrimiento de fase en la reflexion que fısicamente se debe a que la partıcula es retardadacuando penetra la region II. Este fenomeno es parcialmente analogo al efecto piel de penetracion de una onda enun metal, aunque en el efecto piel hay una parte oscilante y una de amortiguamiento (subamortiguamiento), entanto que en el caso presente solo hay termino amortiguado (sobreamortiguamiento)9 .

Surge una aparente paradoja teniendo en cuenta que en la region II, la corriente de probabilidad es ceroen tanto que la probabilidad de que la partıcula este en esta region es no nula. Un analisis mas detallado delpaquete de onda incidente muestra que parte del paquete de onda incidente entra en la region II clasicamenteprohibida para la partıcula y se refleja despues de haber penetrado, esta onda reflejada desde la region II interfieredestructivamente con la onda incidente que esta penetrando de modo que se anula la corriente en la region II.

Vale decir que esta interferencia perfectamente destructiva solo aparece en el caso unidimensional. Un analisisdel caso bidimensional muestra que efectivamente aparece una corriente no nula en la region II cuando la incidenciaes oblıcua.

Es interesante analizar el caso en el cual V0 → ∞, de la definicion para ρ2 en (3.73) vemos que ρ2 → ∞ demodo que la segunda de las Ecs. (3.80) nos da B′

2 → 0, y usando esto en la primera de las Ecs. (3.80) se obtieneA′

1/A1 → −1 es decir

A′1 → −A1 ; B′

2 → 0 (3.83)

8Hablamos de reflexion total en el sentido de que solo las funciones de onda incidente y reflejada oscilan. La onda transmitida estaen cambio sobreamortiguada.

9Esta diferencia se debe a que en el efecto piel el numero de onda es un complejo cuya parte real da cuenta de la oscilacion y cuyaparte imaginaria da cuenta del amortiguamiento. En nuestro caso en cambio, el numero de onda es imaginario puro.

Page 176: Mecanica Cuantica: Notas de Clase

176 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

y la segunda de las Ecs. (3.81) muestra que en la region II la funcion de onda tiende a cero, ası como el rango depenetracion 1/ρ2 de esta10. Aplicando los lımites (3.83) a las Ecs. (3.81)

lımx→0−

ϕ (x) = ϕI (0) = A1 +A′1 → 0 , lım

x→0+ϕ (x) = ϕII (0) = B′

2 → 0 (3.84)

la funcion de onda ϕ (x) se va para cero en x = x1 de manera que se mantiene contınua en el punto de discontinuidaddel potencial. Veamos ahora los lımites laterales en la derivadas, Ecs. (3.82)

lımx→0−

dϕ (x)

dx=

dϕI (0)

dx= ik1

(A1 −A′

1

)→ 2ik1A1

lımx→0+

dϕ (x)

dx= lım

x→0+

dϕII (x)

dx= − lım

x→0+ρ2B

′2e

−ρ2x

usando la segunda de las Ecs. (3.79) se obtiene

lımx→0+

dϕ (x)

dx= − lım

x→0+ρ2

[− ik1ρ2

(A1 −A′

1

)]e−ρ2x = 2ik1A1 lım

x→0+e−ρ2x (3.85)

el valor de este lımite dependera del crecimiento comparativo entre ρ2 y x. Por ejemplo si suponemos que elpotencial V0 crece como x−3 tenemos que

ρ2 →√

2m

~2V0 →

√2m

~2x−3/2 ≡ kx−3/2

con lo cual la Ec. (3.85) queda

lımx→0+

dϕ (x)

dx= 2ik1A1 lım

x→0+e−ρ2x = 2ik1A1 lım

x→0+e−kx

−1/2= 0

Vemos entonces que la derivada puede cambiar abruptamente del valor 2ikA1 a cero, en cuyo caso no serıacontınua. Esto se debe a que el potencial no es acotado (requisito para la validez del desarrollo en la seccion 3.5.1)de modo que la integral en la Ec. (3.51) no necesariamente tiende a cero cuando η → 0.

3.7. Barrera de potencial

La barrera de potencial se describe a traves de la siguiente expresion

V (x) =

0 si x < 0 (region I)V0 > 0 si 0 < x < L (region II)0 si L < x (region III)

Para E > V0 veremos que la transmision es total para ciertos valores del ancho de la barrera, fenomeno conocidocomo resonancia en la transmision. Tambien hay ciertos anchos especıficos de la barrera para los cuales la reflexiones maxima, aunque la transmision nunca se anula completamente.

Para E < V0, una partıcula clasica debe rebotar. Si el ancho de la barrera no es mucho mayor que la longitudde penetracion 1/ρ de la onda evanescente, veremos que parte de la onda incidente se transmite a la region III.En consecuencia, incluso para E < V0 la probabilidad de que la partıcula cruce la barrera es diferente de cero.Este hecho se conoce como efecto tunel.

10En otras palabras, el escalon se vuelve un obstaculo totalmente rıgido, como era de esperarse.

Page 177: Mecanica Cuantica: Notas de Clase

3.7. BARRERA DE POTENCIAL 177

Figura 3.2: Perfil de una barrera de potencial de altura V0, con discontinuidades en x = 0 y x = L.

3.7.1. E > V0, resonancias

En el analogo optico tenemos una capa transparente de ancho L (en 0 < x < L) con ındice de refraccion realn2 rodeado de un medio transparente (en x < 0 y x > L) de ındice de refraccion real n1 > n2. Como la energıa esmayor que el potencial, la Ec. (3.45) y la definicion (3.44) son validas para las tres regiones

[d2

dx2+ k21

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.86)

[d2

dx2+ k22

]ϕ (x) = 0 ; k2 ≡

√2m (E − V0)

~2(region II) (3.87)

[d2

dx2+ k23

]ϕ (x) = 0 ; k3 = k1 ≡

√2mE

~2(region III) (3.88)

ası mismo las soluciones en las tres regiones son de la forma (3.46)

ϕI (x) = A1eik1x +A′

1e−ik1x ; ϕII (x) = A2e

ik2x +A′2e

−ik2x ; ϕIII (x) = A3eik1x +A′

3e−ik1x (3.89)

dϕI (x)

dx= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= ik2

(A2e

ik2x −A′2e

−ik2x)

dϕIII (x)

dx= ik1

(A3e

ik1x −A′3e

−ik1x)

(3.90)

donde hemos usado la segunda de las Ecs. (3.88). Como antes se tiene que

A′3 = 0 (3.91)

ya que asumimos una onda incidente desde x→ −∞ y no es de esperarse una onda reflejada desde el interior dela region III. Usando (3.91), las condiciones de empalme aplicadas a las Ecs. (3.89) en x = 0 y en x = L quedan

lımx→0+

ϕ (x) = lımx→0−

ϕ (x) ⇒ ϕI (0) = ϕII (0) ⇒ A1 +A′1 = A2 +A′

2

lımx→L+

ϕ (x) = lımx→L−

ϕ (x) ⇒ ϕII (L) = ϕIII (L) ⇒ A2eik2L +A′

2e−ik2L = A3e

ik1L

lımx→0+

dϕ (x)

dx= lım

x→0−

dϕ (x)

dx⇒ dϕI (0)

dx=dϕII (0)

dx⇒ k1

(A1 −A′

1

)= k2

(A2 −A′

2

)

lımx→L+

dϕ (x)

dx= lım

x→L−

dϕ (x)

dx⇒ dϕII (L)

dx=dϕIII (L)

dx⇒ k2

(A2e

ik2L −A′2e

−ik2L)= k1A3e

ik1L

Page 178: Mecanica Cuantica: Notas de Clase

178 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

una vez mas podemos determinar los cocientes A′1/A1, A2/A1, A

′2/A1, A3/A1. Es decir, normalizados con respecto

a la amplitud de la onda incidente. Con respecto a estos cocientes las ecuaciones quedan

1 +A′

1

A1=

A2

A1+A′

2

A1;A2

A1eik2L +

A′2

A1e−ik2L =

A3

A1eik1L (3.92)

(1− A′

1

A1

)=

k2k1

(A2

A1− A′

2

A1

);

k2k1

(A2

A1eik2L − A′

2

A1e−ik2L

)=A3

A1eik1L (3.93)

despejando A′1/A1 en la primera de las Ecs. (3.92) y en la primera de las Ecs. (3.93) e igualando resulta

A2

A1+A′

2

A1− 1 = 1− k2

k1

(A2

A1− A′

2

A1

)⇒ A2

A1

(1 +

k2k1

)+A′

2

A1

(1− k2

k1

)= 2

A2

A1(k1 + k2) +

A′2

A1(k1 − k2) = 2k1 ⇒ A′

2

A1=

2k1(k1 − k2)

− A2

A1

(k1 + k2)

(k1 − k2)(3.94)

igualando la segunda de las Ecs. (3.92) con la segunda de las Ecs. (3.93), resulta

A2

A1eik2L +

A′2

A1e−ik2L =

k2k1

(A2

A1eik2L − A′

2

A1e−ik2L

)⇒ A′

2

A1e−ik2L

(1 +

k2k1

)=A2

A1eik2L

(k2k1

− 1

)(3.95)

reemplazando (3.94) en (3.95) queda[

2k1(k1 − k2)

− A2

A1

(k1 + k2)

(k1 − k2)

]e−ik2L

(k1 + k2k1

)=

A2

A1eik2L

(k2 − k1k1

)

[2k1 (k1 + k2)−

A2

A1(k1 + k2)

2

]e−ik2L = −A2

A1eik2L (k1 − k2)

2

A2

A1

[(k1 + k2)

2 e−ik2L − (k1 − k2)2 eik2L

]= 2k1 (k1 + k2) e

−ik2L (3.96)

reescribamos el termino en parentesis cuadrados en la Ec. (3.96)

(k1 + k2)2 e−ik2L − (k1 − k2)

2 eik2L =(k21 + 2k1k2 + k22

)e−ik2L −

(k21 − 2k1k2 + k22

)eik2L

= −k21(eik2L − e−ik2L

)+ 2k1k2

(eik2L + e−ik2L

)− k22

(eik2L − e−ik2L

)

= −2ik21 sin k2L+ 4k1k2 cos k2L− 2ik22 sin k2L

(k1 + k2)2 e−ik2L − (k1 − k2)

2 eik2L = −2i(k21 + k22

)sin k2L+ 4k1k2 cos k2L

con lo cual la Ec. (3.96) queda

A2

A1

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]= k1 (k1 + k2) e

−ik2L

A2

A1=

k1 (k1 + k2) e−ik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] (3.97)

reemplazando (3.97) en la Ec. (3.94) resulta

A′2

A1=

2k1(k1 − k2)

− A2

A1

(k1 + k2)

(k1 − k2)=

2k1(k1 − k2)

− k1 (k1 + k2) e−ik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] (k1 + k2)

(k1 − k2)

=2k1

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]− k1 (k1 + k2)

2 e−ik2L[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

](k1 − k2)

A′2

A1=

[−2i

(k21 + k22

)sin k2L+ 4k1k2 cos k2L

]−(k21 + k22 + 2k1k2

)e−ik2L[

−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

](k1 − k2)

k1

≡ Z k1[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

](k1 − k2)

Page 179: Mecanica Cuantica: Notas de Clase

3.7. BARRERA DE POTENCIAL 179

la cantidad Z se evalua como

Z ≡[−2i

(k21 + k22

)sin k2L+ 4k1k2 cos k2L

]−(k21 + k22 + 2k1k2

)e−ik2L

= −k21[2i sin k2L+ e−ik2L

]− k22

[2i sin k2L+ e−ik2L

]+ 2k1k2

[2 cos k2L− e−ik2L

]

= −(k21 + k22

) [2i sin k2L+ e−ik2L

]+ 2k1k2

[(eik2L + e−ik2L

)− e−ik2L

]

= −(k21 + k22

) [(eik2L − e−ik2L

)+ e−ik2L

]+ 2k1k2e

ik2L

= −(k21 + k22

)eik2L + 2k1k2e

ik2L = −[k21 + k22 − 2k1k2

]eik2L

Z = − (k1 − k2)2 eik2L

con lo cual el cociente A′2/A1 queda finalmente

A′2

A1= − k1 (k1 − k2) e

ik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] (3.98)

despejando A′1/A1 en la primera de las Ecs. (3.92) y reemplazando las Ecs. (3.97, 3.98) en la ecuacion resultante

se obtiene

A′1

A1=

A2

A1+A′

2

A1− 1 =

k1 (k1 + k2) e−ik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] − k1 (k1 − k2) eik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] − 1

=−k21

(eik2L − e−ik2L

)+ k1k2

(eik2L + e−ik2L

)[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] − 1 =−2ik21 sin k2L+ 2k1k2 cos k2L[

−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] − 1

=−2ik21 sin k2L+ 2k1k2 cos k2L−

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

][−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]

A′1

A1=

−2ik21 sin k2L+ 2k1k2 cos k2L+ i(k21 + k22

)sin k2L− 2k1k2 cos k2L[

−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]

A′1

A1=

i(k22 − k21

)sin k2L[

−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] ≡ M

N(3.99)

reemplazando las Ecs. (3.97, 3.98) en la segunda de las Ecs. (3.92) resulta

A3

A1eik1L =

A2

A1eik2L +

A′2

A1e−ik2L

A3

A1eik1L =

k1 (k1 + k2) e−ik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]eik2L − k1 (k1 − k2) eik2L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]e−ik2L

A3

A1eik1L =

k1 (k1 + k2)− k1 (k1 − k2)[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] = 2k1k2[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

]

A3

A1=

2k1k2 e−ik1L

[−i(k21 + k22

)sin k2L+ 2k1k2 cos k2L

] ≡ P

N(3.100)

ahora calculamos los coeficientes de reflexion y transmision por medio de las Ecs. (3.99)

R =

∣∣∣∣JreflJinc

∣∣∣∣ =∣∣∣∣A′

1

A1

∣∣∣∣2

=M

N

M∗

N∗ =|M |2

|N |2=

(k22 − k21

)2sin2 k2L

|N |2(3.101)

T =

∣∣∣∣JtransJinc

∣∣∣∣ =∣∣∣∣A3

A1

∣∣∣∣2

=|P |2

|N |2=

4k21k22

|N |2(3.102)

Page 180: Mecanica Cuantica: Notas de Clase

180 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

calculamos ahora la magnitud al cuadrado del denominador N

|N |2 = NN∗ =[2k1k2 cos k2L− i

(k21 + k22

)sin k2L

] [2k1k2 cos k2L+ i

(k21 + k22

)sin k2L

]

= 4k21k22 cos

2 k2L+(k21 + k22

)2sin2 k2L = 4k21k

22

(1− sin2 k2L

)+(k41 + k42 + 2k21k

22

)sin2 k2L

= 4k21k22 +

(k41 + k42 − 2k21k

22

)sin2 k2L

|N |2 = 4k21k22 +

(k22 − k21

)2sin2 k2L (3.103)

reemplazando (3.103) en las Ecs.(3.101, 3.102), los coeficientes de reflexion y transmision quedan

R =

∣∣∣∣A′

1

A1

∣∣∣∣2

=

(k22 − k21

)2sin2 k2L

4k21k22 +

(k22 − k21

)2sin2 k2L

(3.104)

T =

∣∣∣∣A3

A1

∣∣∣∣2

=4k21k

22

4k21k22 +

(k22 − k21

)2sin2 k2L

(3.105)

se ve inmediatamente que R+ T = 1. Es mas util escribir a R y T en terminos de cantidades Fısicas mas directascomo E y V0. Para ello reemplazamos las expresiones (3.86, 3.87) en la Ec. (3.105)

T =4k21k

22

4k21k22 +

(k22 − k21

)2sin2 k2L

=4(2mE~2

) [2m(E−V0)~2

]

4(2mE~2

) [2m(E−V0)~2

]+[2mE~2

− 2m(E−V0)~2

]2sin2

[√2m(E−V0)

~L

]

=4E (E − V0)

4E (E − V0) + [E − (E − V0)]2 sin2

[√2m(E−V0)

~L

]

T =4E (E − V0)

4E (E − V0) + V 20 sin2

[√2m(E−V0)

~L

] (3.106)

si hacemos una grafica de T contra L con valores fijos de E, V0 y m (ver Fig 3.3), y tenemos en cuenta que sin2 xes periodica en x con periodo π, entonces T es periodica en L con periodo

∆L =π

k2=

π~√2m (E − V0)

(3.107)

El mınimo de T se obtiene cuando el seno al cuadrado adquiere el valor 1 y el maximo se obtiene cuando el senoal cuadrado adquiere el valor cero. Es claro entonces que

Tmın =4E (E − V0)

4E (E − V0) + V 20

> 0 ; Tmax = 1 (3.108)

vemos que se obtienen valores de L para los cuales la transmision es total (T = 1), lo cual ocurre cuandoLn = n∆L = nπ/k2 o equivalentemente

Ln =nπ

k2=

nπ~√2m (E − V0)

(3.109)

decimos entonces que se obtienen resonancias en la transmision para estos valores de Ln, los cuales correspondena multiplos enteros de la semilongitud de onda de la partıcula en la region II11. Estos hechos se ilustran en la Fig.

11El hecho de que sean multiplos enteros de semilongitudes de onda (y no de las longitudes de onda) proviene del hecho de que laEc. (3.106), depende de sin2 x cuyo periodo π es la mitad del periodo de la funcion sin x.

Page 181: Mecanica Cuantica: Notas de Clase

3.7. BARRERA DE POTENCIAL 181

Figura 3.3: Grafica de T vs L, con E, V0 y m fijos, para una barrera de potencial como la indicada en la Fig. 3.2con la condicion E > V0.

3.3. Este es el analogo cuantico de la transmision en un interferometro de Fabry-Perot en optica, en el cual tambiense observan estas resonancias en la transmision. Cuando E > V0, se tiene que la reflexion de la partıcula en cadadiscontinuidad del potencial (i.e. en x = 0, L) ocurre sin corrimiento de fase de la funcion de onda cuando L = Ln.Por esta razon, la condicion de resonancia k2L = nπ coincide con los valores de L para los cuales pueden existirondas estacionarias en la region II. Por otro lado, cuando L 6= Ln surge un corrimiento de fase en las reflexionesque genera interferencia destructiva, la cual se maximiza lejos de la resonancia, es decir cuando L = (n+ 1/2) π,como se aprecia en la Fig. 3.3 esto genera el valor mınimo de T . Notese que en L = (n+ 1/2) π tendrıamos unaresonancia en la reflexion, pero la reflexion no es total ya que la transmision nunca es nula12.

Un estudio del comportamiento del paquete de onda en una barrera de potencial con E > V0 muestra quecuando se cumple la condicion de resonancia, el paquete de onda pasa un tiempo relativamente grande en la regionII. En mecanica cuantica esto se denomina resonancia en el scattering, ya que en un problema de dispersionpor este tipo de potencial el paquete de onda estarıa pasando un tiempo relativamente largo en la region de colision(que serıa la region II).

3.7.2. Caso E < V0: Efecto tunel

En el analogo optico, tenemos una capa de ancho L con ındice de refraccion imaginario (region II) rodeado deun medio transparente (regiones I y III). En este caso las regiones I y III poseen ondas oscilantes en tanto que la

12Naturalmente, la condicion de resonancia en la transmision Ec. (3.109) puede interpretarse para L fijo como los valores k2n denumero de onda que producen dicha resonancia. Si asumimos por ejemplo que L, V0 y m son fijos, lo que estamos obteniendo son lasenergıas de resonancia En, que implicaran unas frecuencias de resonancia En = hνn.

Page 182: Mecanica Cuantica: Notas de Clase

182 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

region II corresponde a ondas evanescentes lo cual se escribe como

[d2

dx2+ k21

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.110)

[d2

dx2− ρ22

]ϕ (x) = 0 ; ρ2 ≡

√2m (V0 − E)

~2(region II) (3.111)

[d2

dx2+ k23

]ϕ (x) = 0 ; k3 = k1 ≡

√2mE

~2(region III) (3.112)

comparando las Ecs. (3.110, 3.111, 3.112) con las Ecs. (3.86, 3.87, 3.88), vemos que podemos utilizar las solucionesanteriores reemplazando k2 por −iρ2 con lo cual se obtiene

T =

∣∣∣∣A3

A1

∣∣∣∣2

=4E (V0 − E)

4E (V0 − E) + V 20 sinh2

[√2m(V0−E)

~L

] ; R = 1− T (3.113)

para una partıcula clasica que en t → −∞ esta en x → −∞, es decir en la region I, las regiones II y III estanprohibidas. Contrario a las predicciones para una partıcula clasica, vemos que en el caso cuantico las probabilidadesen las regiones II y III son distintas de cero. En particular esto implica una probabilidad diferente de cero de que lapartıcula cruce la barrera de potencial, fenomeno conocido como efecto tunel. En la region II el comportamientoes de onda evanescente de rango 1/ρ2. Cuando L . 1/ρ2 la partıcula tiene una probabilidad considerable decruzar la barrera por efecto tunel. Este efecto tiene muchas aplicaciones en Fısica tales como el efecto Josephson,la inversion de la molecula de amonio, el diodo tunel etc.

Es natural entonces comparar la longitud o rango de penetracion 1/ρ2 de la onda evanescente, con el anchoL de la barrera. Si el ancho de la barrera es mucho mayor que el rango de la onda evanescente tenemos queL≫ 1/ρ2 de modo que ρ2L≫ 1, usando la Ec. (3.111) esta condicion queda

ρ2L =

√2m (V0 − E)

~2L ≫ 1 ; sinhx ≃ ex

2; x≫ 1

con estas aproximaciones, la Ec. (3.113) queda

T =

∣∣∣∣A3

A1

∣∣∣∣2

≃ 4E (V0 − E)

4E (V0 − E) + V 20

(eρ2L

2

)2 ≃ 4E (V0 − E)

V 20e2ρ2L

4

=16E (V0 − E)

V 20

e−2ρ2L

T ≃ 16E

V0

(1− E

V0

)e−2ρ2L ≪ 1 (3.114)

en tal caso la atenuacion es muy fuerte y la probabilidad de transmision muy baja.Para tener una idea de los ordenes de magnitud del efecto, pensemos en un electron con energıa E =

1eV (electron-voltio) que cruzara una barrera de potencial V0 = 2eV, de ancho L = 1oA. Usando V0 = 2E = 2eV ası

como los valores de la masa del electron y de la constante de Planck en la Ec. (3.111), vemos que el rango

1/ρ2 ≃ 1,96oA, es decir del orden de magnitud de la ancho de la barrera, por lo cual se espera una probabilidad

considerable de que el electron cruce la barrera, evaluando esta probabilidad con la Ec. (3.113) se obtiene T ≃ 0,78un resultado muy diferente al clasico ya que en este caso es de hecho mas probable la transmision que la reflexion.

Si reemplazamos al electron por un proton solo hay que cambiar la masa asociada (unas 1840 veces la del

electron), permaneciendo iguales los demas datos. En tal caso el rango es 1/ρ2 ≃ 4,6 × 10−2oA de modo que la

barrera es mucho mas ancha que el rango de la onda evanescente. Usando la Ec. (3.113) o la Ec. (3.114) tenemosque T ≃ 4×10−19. Esta tremenda diferencia con respecto al electron se debe a la gran sensibilidad de la exponencialdecreciente en la Ec. (3.114) con la masa, o del seno hiperbolico en (3.113) con la masa. Esto tambien explicaporque el efecto tunel no es observable en sistemas macroscopicos.

Page 183: Mecanica Cuantica: Notas de Clase

3.8. POZO DE POTENCIAL 183

3.8. Pozo de potencial

El pozo de potencial se describe con el perfil

V (x) =

0 si x < x1 (region I)−V0 < 0 si x1 < x < x2 (region II)0 si x2 < x (region III)

3.8.1. Partıcula con energıa −V0 < E < 0

Figura 3.4: Perfil de un pozo de potencial de profundidad V0, con discontinuidades en x = −a/2 y x = a/2.

Para esta situacion, definiremos el pozo de potencial en la forma (ver Fig. 3.4)

V (x) =

0 si x < −a2 (region I)

−V0 < 0 si −a2 < x < a

2 (region II)0 si a

2 < x (region III)

donde hemos elegido colocar el origen de tal modo que V (x) = V (−x).Una partıcula clasica en un pozo de potencial como este, y con energıa E negativa (pero mayor que −V0)

solo puede oscilar entre −a/2 y a/2 con energıa cinetica Ek = E + V0. En el analogo optico, para la situacion

Page 184: Mecanica Cuantica: Notas de Clase

184 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

−V0 < E < 0 los ındices de refraccion n1 y n3 en las regiones I y III son imaginarios, en tanto que n2 es real.Esto es equivalente a una capa de aire de ancho “a” entre dos medios reflectivos. Las diferentes ondas que sereflejan sucesivamente en x = −a/2 y x = a/2 se destruyen unas a otras excepto para ciertas frecuencias muyespecıficas (modos normales) que permiten la formacion de ondas estacionarias. Desde el punto de vista cuantico,esto significa que las energıas negativas de la partıcula estan cuantizadas. En contraste, para la partıcula clasicatodos los valores de energıa entre −V0 y cero son posibles. Vale la pena mencionar que los valores permitidos dela longitud de onda (y por tanto de la energıa) no estan dados por la bien conocida condicion a = kλ2/2, ya queexisten ondas evanescentes que generan un corrimiento de fase en los puntos de reflexion x = −a/2 y x = a/2.

En las regiones I, II y III las soluciones de la ecuacion de Schrodinger independiente del tiempo son

ϕI (x) = B1eρx +B′

1e−ρx ; ρ =

√−2mE

~2> 0 (3.115)

ϕII (x) = A2eikx +A′

2e−ikx ; k =

√2m (E + V0)

~2> 0 (3.116)

ϕIII (x) = B3eρx +B′

3e−ρx ; ρ =

√−2mE

~2> 0 (3.117)

asumiremos de nuevo la condicion inicial de que la onda viaja inicialmente desde la region I. A fin de que estasfunciones sean acotadas en la region I (x→ −∞) y en la region III (x→ ∞) se requiere que

B′1 = B3 = 0 (3.118)

con lo cual las ecuaciones se simplifican a

ϕI (x) = B1eρx ; ϕII (x) = A2e

ikx +A′2e

−ikx ; ϕIII (x) = B′3e

−ρx (3.119)

las condiciones de empalme resultan

ϕI

(−a2

)= ϕII

(−a2

);

dϕI(−a

2

)

dx=dϕII

(−a

2

)

dx

ϕII

(a2

)= ϕIII

(a2

);

dϕII(a2

)

dx=dϕIII

(a2

)

dx

estas condiciones aplicadas sobre las Ecs. (3.119) nos dan

B1e−ρa

2 = A2e−ik a

2 +A′2eik a

2 ; ρB1e−ρa

2 = ik(A2e

−ik a2 −A′

2eik a

2

)

B′3e

−ρa2 = A2e

ik a2 +A′

2e−ik a

2 ; −ρB′3e

−ρa2 = ik

(A2e

ik a2 −A′

2e−ik a

2

)(3.120)

en este caso la amplitud incidente es B1 (aunque de una onda evanescente) y por tanto los cocientes se normalizancon esta cantidad. Las Ecs. (3.120) quedan

1 =A2

B1e(ρ−ik)

a2 +

A′2

B1e(ρ+ik)

a2 ; 1 =

ik

ρ

[A2

B1e(ρ−ik)

a2 − A′

2

B1e(ρ+ik)

a2

](3.121)

B′3

B1=

A2

B1e(ρ+ik)

a2 +

A′2

B1e(ρ−ik)

a2 ;

B′3

B1=ik

ρ

[A′

2

B1e(ρ−ik)

a2 − A2

B1e(ρ+ik)

a2

](3.122)

de la primera de las ecuaciones (3.121) tenemos

−A′2

B1e(ρ+ik)

a2 =

A2

B1e(ρ−ik)

a2 − 1 (3.123)

Page 185: Mecanica Cuantica: Notas de Clase

3.8. POZO DE POTENCIAL 185

y reemplazando esta cantidad en la segunda de las ecuaciones (3.121) se obtiene

1 =ik

ρ

[A2

B1e(ρ−ik)

a2 +

A2

B1e(ρ−ik)

a2 − 1

]⇒ ρ

ik= 2

A2

B1e(ρ−ik)

a2 − 1 ⇒ 1

2

( ρik

+ 1)e(−ρ+ik)

a2 =

A2

B1

A2

B1=

(ρ+ ik

2ik

)e(−ρ+ik)

a2 (3.124)

reemplazando (3.124) en (3.123) tenemos

−A′2

B1e(ρ+ik)

a2 =

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ−ik)

a2 − 1 ⇒ A′

2

B1= −

[(ρ+ ik

2ik

)− 1

]e−(ρ+ik)a

2

A′2

B1= −

(ρ− ik

2ik

)e−(ρ+ik)a

2 (3.125)

reemplazando (3.124, 3.125) en la primera Ec. (3.122) tenemos

B′3

B1=

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2 −

[(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2 =

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika

2ik

(eika − e−ika

)+

1

2

[eika + e−ika

]

B′3

B1=

ρ

ksin ka+ cos ka (3.126)

igualando las Ecs. (3.122) y usando las expresiones (3.124, 3.125), obtenemos

A2

B1e(ρ+ik)

a2 +

A′2

B1e(ρ−ik)

a2 =

ik

ρ

[A′

2

B1e(ρ−ik)

a2 − A2

B1e(ρ+ik)

a2

]⇒

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2 +

[−(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2 =

ik

ρ

[−(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2

−[(

ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika =

−ik2ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik) eika − (ρ− ik) e−ika =−ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika =

−ik2ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik) eika − (ρ− ik) e−ika =−ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

dividiendo ambos miembros por ρ+ ik resulta

eika − (ρ− ik)

(ρ+ ik)e−ika =

−ikρ

(ρ− ik)

(ρ+ ik)e−ika + eika

⇒ eika

[1 +

ik

ρ

]=

(ρ− ik)

(ρ+ ik)e−ika

[1− ik

ρ

]

e2ika[ρ+ ik

ρ

]=

(ρ− ik)

(ρ+ ik)

[ρ− ik

ρ

]

e2ika =(ρ− ik)2

(ρ+ ik)2(3.127)

Page 186: Mecanica Cuantica: Notas de Clase

186 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

vale la pena discutir la estrategia de solucion antes de seguir adelante. A priori podrıa pensarse que las Ecs. (3.120)nos pueden dar solucion para todas las amplitudes B1, A2, A

′2 y B3, puesto que tenemos cuatro ecuaciones. Sin

embargo, no es logico fısicamente que la amplitud de entrada B1 pueda ser determinada por las condiciones deempalme ya que esta amplitud tiene relacion con las condiciones iniciales, las cuales puedo acomodar en principioarbitrariamente. Por esta razon la estrategia de solucion se interpreta diciendo que las cuatro ecuaciones (3.120)nos brindan soluciones para los tres cocientes A2/B1, A

′2/B1, B

′3/B1 mas una ligadura entre las cantidades ρ y k

dada por la Ec. (3.127).

Por otro lado, las Ecs. (3.115, 3.116) nos muestran que ρ y k estan relacionadas con la energıa E de la partıcula.Esto implica que la ligadura (3.127) solo se satisface para ciertos valores de la energıa. Por tanto, al imponer elacotamiento de ϕ (x) hemos llegado a una cuantizacion de la energıa. Esto se puede ver teniendo en cuenta quela ligadura (3.127) provino del hecho de que el sistema de cuatro ecuaciones (3.121, 3.122) esta sobredeterminadopara el conjunto de tres cocientes A2/B1, A

′2/B1, B

′3/B1; pero esto a su vez ocurre debido a la eliminacion de las

amplitudes Ec. (3.118) que se realizo para mantener acotada la solucion.

En resumen, para un pozo de potencial como el de la Fig. 3.4 de profundidad V0 y de ancho a, la funcion deonda (acotada) en las tres regiones en que el potencial divide al espacio vienen dadas por

ϕI (x) = B1eρx ; ϕII (x) = A2e

ikx +A′2e

−ikx ; ϕIII (x) = B′3e

−ρx (3.128)

ρ =

√−2mE

~2> 0 ; k =

√2m (E + V0)

~2> 0 (3.129)

A2

B1=

(ρ+ ik

2ik

)e(−ρ+ik)

a2 ;

A′2

B1= −

(ρ− ik

2ik

)e−(ρ+ik)a

2 ;B′

3

B1=ρ

ksin ka+ cos ka (3.130)

e2ika =(ρ− ik)2

(ρ+ ik)2(3.131)

donde hemos supuesto que la partıcula incide desde la region I.

Caso 1 para energıa negativa

La ligadura (3.131) nos conduce a dos situaciones posibles

I)

ρ− ik

ρ+ ik= −eika (3.132)

reescribimos esta relacion en la forma

(ρ/k)− i

(ρ/k) + i= −eika ⇒ ρ

k− i = −

(ρk+ i)eika ⇒ ρ

k

[1 + eika

]= i[1− eika

]

ρ

k=

(eika − 1

)

i (1 + eika)=

(eika−1)i

e−ika/22

(1 + eika) e−ika/2

2

=

(eika/2 − e−ika/2

)/2i(

e−ika/2 + eika/2)/2

=sin(ka2

)

cos(ka2

)

quedando finalmente

ρ

k= tan

(ka

2

)(3.133)

definimos la magnitud del complejo ρ+ ik en la forma

k0 ≡√k2 + ρ2 =

√2mV0~2

(3.134)

Page 187: Mecanica Cuantica: Notas de Clase

3.8. POZO DE POTENCIAL 187

donde hemos tenido en cuenta las Ecs. (3.129). Usando identidades trigonometricas y las Ecs. (3.133, 3.134),tenemos que

1

cos2(ka2

) = 1 + tan2ka

2= 1 +

ρ2

k2=k2 + ρ2

k2

1

cos2(ka2

) =

(k0k

)2

(3.135)

de modo que la Ec. (3.132) es equivalente a las Ecs. (3.133, 3.135) que se pueden sintentizar en las ecuaciones

∣∣∣∣cos(ka

2

)∣∣∣∣ =k

k0; tan

(ka

2

)> 0 (3.136)

Donde hemos tenido en cuenta que la Ec. (3.135) proviene de la Ec. (3.133), pero sustituyendo una tangente al

Figura 3.5: Solucion grafica de las Ecs. (3.136, 3.142). La interseccion de la lınea recta con las lıneas punteadascosenoidales nos dan los puntos denotados por P , correspondientes a soluciones de las Ecs. (3.136) y asociados afunciones de onda pares. La interseccion de la recta con las lıneas punteadas del arco senoidal nos dan los puntosdenotados por I, correspondientes a soluciones de las Ecs. (3.142) y asociados a funciones de onda impares.

cuadrado con lo cual se pierde la informacion del signo de esta tangente al llegar a la Ec. (3.135).

La primera de las Ecs. (3.136) se puede solucionar graficando la parte izquierda y =∣∣cos

(ka2

)∣∣ y la parte derechay = k/k0 y encontrando la interseccion entre las dos graficas. Es decir graficamos los arcos cosenoidales (arcos delcoseno con nodos en (2q + 1) π/a de la Fig. 3.5 con q entero no negativo) y la lınea recta de pendiente 1/k0 paraobtener tal interseccion. Ahora bien, las franjas ascendentes del coseno (lıneas contınuas del arco cosenoidal en laFig. 3.5) violan la condicion dada por la segunda ecuacion (3.136), en tanto que las franjas descendentes (lıneaspunteadas del arco cosenoidal en la Fig. 3.5) satisfacen tal condicion13. Los puntos de interseccion de la recta conlas lıneas punteadas del coseno se denotan en la Fig. 3.5 con la letra P , y sus componentes x nos dan los valoreskn que cuantizan al numero de onda y por tanto a la energıa, la cual viene dada por la ecuacion (3.129)

kn =

√2m (En + V0)

~2(3.137)

13Por ejemplo en la franja 0 ≤ k ≤ π/a es claro que tan (ka/2) > 0, en tanto que en la franja π/a < k < 2π/a se tiene quetan (ka/2) ≤ 0, y ası sucesivamente.

Page 188: Mecanica Cuantica: Notas de Clase

188 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Por otro lado, dividiendo las dos primeras Ecs. (3.130) se obtiene

A′2

A2=

−(ρ−ik2ik

)e−(ρ+ik)a

2

(ρ+ik2ik

)e(−ρ+ik)

a2

= −(ρ− ik) e−ika2

(ρ+ ik) eika2

= −(ρ− ik)

(ρ+ ik)e−ika

y utilizando la Ec. (3.132) resultaA′

2

A2= 1

si reemplazamos la Ec. (3.133) (la cual es equivalente a la Ec. 3.132) en la tercera de las Ecs. (3.130) y definiendox ≡ ka/2 obtenemos

B′3

B1=

ρ

ksin ka+ cos ka = tan

(ka

2

)sin ka+ cos ka = tan x sin 2x+ cos 2x

= tan x (2 sin x cos x) +(1− 2 sin2 x

)= 2

sinx

cos xsinx cos x+ 1− 2 sin2 x

B′3

B1= 1

En conclusion la Ec. (3.132) que define el caso 1 de nuestro analisis, conduce a las relaciones

A′2 = A2 ; B′

3 = B1 (3.138)

y al reemplazar estas relaciones en la Ecs. (3.128) esto nos da

ϕI (x) = B1eρx ; ϕII (x) = 2A2 cos kx ; ϕIII (x) = B1e

−ρx (3.139)

para −a/2 ≤ x ≤ a/2 (region II), es claro que −x tambien pertenece a la region II. Si x pertenece a la region I (x ≤−a/2) entonces −x pertenece a la region III (−x ≥ a/2). Similarmente, si x esta en la region III entonces −x estaen la region I. Vemos ademas que la Ec. (3.139) nos dice que

ϕI (x) = B1eρx = ϕIII (−x) ; ϕII (x) = ϕII (−x)

lo cual nos lleva a la conclusion de que en el caso 1 caracterizado por la Ec. (3.132), la funcion de onda es par entodas las regiones i.e.

ϕ (−x) = ϕ (x) ; x ∈ (−∞, ∞) (3.140)

Caso 2 para energıa negativa

La Ec. (3.131), tiene dos soluciones, la primera corresponde a la Ec. (3.132) y la segunda vendra dada por

ρ− ik

ρ+ ik= eika (3.141)

un calculo analogo nos lleva a que los numeros de onda permitidos estan dados por∣∣∣∣sin

(ka

2

)∣∣∣∣ =k

k0; tan

(ka

2

)< 0 (3.142)

la Fig. 3.5 muestra la interseccion entre la recta de pendiente 1/k0 y los arcos senoidales (arcos del seno con nodosen k = 2qπ/a siendo q entero no negativo). La interseccion entre la recta y la parte punteada (descendente) delos arcos senoidales, nos da los puntos denotados por I en la Fig. 3.5, cuya abcisa nos da el valor cuantizado dekn, con el cual se encuentra la energıa cuantizada usando la Ec. (3.137). Notese que los niveles encontrados seencuentran entre los niveles hallados para el primer caso. Puede similarmente demostrarse que la funcion de ondaasociada es impar

ϕ (x) = −ϕ (−x) ; x ∈ (−∞, ∞) (3.143)

Puede observarse ademas que el hecho de que el potecial sea par V (x) = V (−x), es lo que genera la existenciade soluciones pares e impares en los casos 1 y 2 Ecs. (3.140, 3.143).

Page 189: Mecanica Cuantica: Notas de Clase

3.8. POZO DE POTENCIAL 189

Relacion entre k0 y los estados acotados

Observese que si

0 ≤ k0 ≤π

a

La Fig. 3.5 nos muestra que solo existe un estado acotado para la partıcula y dicho estado se asocia con unafuncion de onda par. En otras palabras, la recta tiene una pendiente muy alta de modo que cruza la rectahorizontal (maximo de los sinusoides) antes de llegar al primer nodo de la funcion cosenoidal (de modo que solocruza una vez la lınea punteada del coseno) y antes de llegar al primer maximo de la funcion senoidal (de modoque no cruza la lınea punteada del seno). Un analisis similar nos muestra que cuando tenemos

π

a≤ k0 ≤

a

aparecen solo dos estados uno par y otro impar. Generalizando, si se cumple la condicion

2pπ

a≤ k0 ≤

(2p + 1) π

a; p = 0,

1

2, 1,

3

2, 2,

5

2, . . . (3.144)

aparecen [p+ 1] estados pares y[p+ 1

2

]estados impares, siendo [p] la funcion parte entera de p que se define como

[p] ≡ k tal que : k es entero con k ≤ p < k + 1

Para el ejemplo de la figura 3.5 tenemos que 4π/a < k0 < 5π/a, de modo que p = 2. El numero de estados pareses [2 + 1] = 3, el numero de estados impares es

[2 + 1

2

]= 2.

Es util escribir la condicion (3.144), en terminos de parametros mas fısicos. De la definicion (3.134) podemosescribir la condicion (3.144) en la forma

2pπ

a≤

√2mV0~2

≤ (2p+ 1) π

a⇒

(2pπ

a

)2

≤ 2mV0~2

≤((2p + 1) π

a

)2

(2p)2π2~2

2ma2≤ V0 ≤ (2p+ 1)2

π2~2

2ma2

(2p)2 V1 ≤ V0 ≤ (2p+ 1)2 V1 ; V1 ≡π2~2

2ma2; p = 0,

1

2, 1,

3

2, 2,

5

2, . . . (3.145)

La Ec. (3.145), nos sugiere definir a V1 como un potencial umbral. Por ejemplo si p = 0 tenemos que 0 ≤ V0 ≤ V1conduce a un estado par y ningun estado impar. Si p = 1/2, la condicion queda V1 ≤ V0 ≤ 4V1 que conduce a unafuncion par y otra impar y ası sucesivamente.

Si V0 ≫ V1 (de modo que p≫ 1) entonces la pendiente de la recta 1/k0 es muy pequena y los primeros numerosde onda practicamente coinciden con los nodos de los arcos senoidal y cosenoidal. Es decir, para los numeros deonda mas bajos tenemos que

k ≃ nπ

a; para n entero y n≪ p

y aplicando la Ec. (3.137), la energıa queda

E ≃ n2π2~2

2ma2− V0 ; para n entero y n≪ p (3.146)

Pozo de potencial con profundidad infinita

Asumiremos que V (x) es cero fuera del intervalo 0 < x < a, e infinito negativo −V0 → −∞ en dicho intervalo.Supondremos sin embargo que E + V0 ≡ ∆E > 0 en 0 < x < a y que ∆E es finito, a fin de que la partıculaposea energıa cinetica finita. La discusion es totalmente analoga a la realizada en la seccion 3.6.2, Pag. 175 para

Page 190: Mecanica Cuantica: Notas de Clase

190 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

escalon de potencial infinito. Segun esta discusion, al penetrar en la barrera la onda es evanescente con longitud depenetracion que tiende a cero, en el lımite podemos entonces considerar que la funcion decae a cero inmediatamente,es decir la funcion de onda se anula en las discontinuidades de salto infinito. Esto es consistente con las ecuacionesque se obtienen en este lımite para el empalme, como se aprecia en las Ecs. (3.83, 3.84). Adicionalmente, la Ec.(3.84) tambien nos muestra que la funcion de onda debe seguir siendo continua en los empalmes, con lo cual lafuncion de onda en nuestro caso debe ser nula fuera del intervalo [0, a]. No obstante, vimos que en general laprimera derivada ya no es contınua, debido a que tenemos un potencial no acotado.

Como E + V0 ≡ ∆E es positivo y finito, la solucion de la ecuacion de onda esta dada por

ϕ (x) = Aeikx +A′e−ikx para 0 ≤ x ≤ a ; k ≡√

2m ∆E

~2(3.147)

poniendo la condicion de nulidad de la funcion de onda en el extremo x = 0 tenemos que

ϕ (0) = 0 = A+A′ ⇒ A = −A′ ⇒ϕ (x) = A

(eikx − e−ikx

)= 2iA sin kx (3.148)

usando nulidad de la funcion de onda (3.148) en el extremo x = a tenemos

ϕ (a) = 2iA sin ka = 0

con lo cual ka = nπ o equivalentemente

kn =nπ

a; n entero positivo (3.149)

n es positivo ya que se asume k positivo en la Ec. (3.147)14 . La funcion queda

ϕ (x) = 2iA sinnπ

ax

la constante 2iA la elegimos como positiva (fase cero) de modo que normalice a la funcion de onda. Con esto setiene finalmente

ϕn (x) =

√2

asin(nπx

a

)

con energıas

∆En =n2π2~2

2ma2(3.150)

en este caso la cuantizacion de la energıa es mucho mas simple de demostrar. Notese que la Ec. (3.149), nos diceque la condicion para el estado estacionario es tal que el ancho a del potencial debe contener un numero entero desemilongitudes de onda π/k. Este es el analogo a la formacion de ondas estacionarias con extremo fijo en optica.Vemos que la condicion de extremo fijo (nulidad de la funcion de onda en los extremos) solo se da para pozosinfinitamente profundos. Si el pozo tiene profundidad finita, el extremo no es totalmente fijo, lo cual se traduceen la penetracion de una onda evanescente (pero no nula) en las regiones fuera del pozo.

Si bien no hay pozos infinitos, en la practica pozos muy profundos poseen el comportamiento aquı descrito.Pero ¿que es un pozo muy profundo?. La respuesta esta en el potencial umbral V1 definido en la Ec. (3.145).Efectivamente, vimos que cuando V0 ≫ V1 los estados mas bajos se comportan como los de un pozo infinito comose ve al comparar las Ecs. (3.146, 3.150). Debe tenerse en cuenta sin embargo, que aun cuando V0 sea mucho mayorque V1 siempre habra estados excitados que se desvıen significativamente del comportamiento aquı descrito, valedecir cuando la aproximacion n≪ p ya no sea valida, como se ve en la Ec. (3.146).

14Si tomaramos la raız negativa en la Ec. (3.147) tendrıamos la misma solucion de la funcion de onda.

Page 191: Mecanica Cuantica: Notas de Clase

3.8. POZO DE POTENCIAL 191

3.8.2. Partıcula con energıa E > 0

En esta situacion, definiremos el origen de modo que

V (x) =

0 si x < 0 (region I)−V0 < 0 si 0 < x < L (region II)0 si L < x (region III)

con el fin de poder comparar con los resultados de la seccion 3.7.1. Cuando la partıcula clasica tiene energıapositiva y viene desde −∞, viaja con energıa cinetica constante Ek = E hasta x = 0, donde experimenta unaumento abrupto en su energıa cinetica a Ek = E + V0, y luego una desaceleracion similar en x = L, continuandohacia la derecha con energıa cinetica constante Ek = E.

Para E > 0, en el analogo optico todos los ındices de refraccion son reales

n1 = n3 =c

Ω

1

~

√2mE ; n2 =

c

Ω

1

~

√2m (E + V0)

y los resultados se pueden extraer de la Sec. 3.7.1, con la asignacion V0 → −V0. Puesto que n2 es mayor que n1 yn3 la situacion optica es analoga a tener una capa de vidrio en medio del aire15. Para obtener la onda reflejadapara x < 0, o la onda transmitida para x > L, es necesario superponer un numero infinito de ondas que surgen dela reflexion sucesiva entre x = 0 y x = L (interferometro multiple analogo a un Fabry-Perot). Se encuentra quepara ciertas frecuencias incidentes la onda es completamente transmitida (asumiendo que L, V0 y m son fijos).En el caso cuantico, la partıcula tiene cierta probabilidad de ser reflejada, pero existen ciertos valores llamadosenergıas resonantes para los cuales la probabilidad de transmision es 1 y por tanto la probabilidad de reflexiones cero.

15En la Sec. 3.7.1, la situacion optica era la de una capa de aire rodeada de vidrio.

Page 192: Mecanica Cuantica: Notas de Clase

Capıtulo 4

Enunciado matematico de los postulados dela mecanica cuantica

4.1. Los fenomenos clasicos

En mecanica clasica, un sistema discreto de partıculas se describe a traves de un conjunto de coordenadas gene-ralizadas qi (t) y de velocidades generalizadas qi (t), y podemos utilizar por ejemplo el Lagragiano L = L (qi, qi, t)como el generador de las ecuaciones de movimiento del conjunto qi (t) , qi (t). Las q′is deben ser independientesen el sentido de que debe ser posible mover una sola de estas coordenadas sin violar las ligaduras impuestassobre el sistema. De esta forma, para un pendulo simple con el origen ubicado en el pivote, la unica coordenadageneralizada es θ puesto que la distancia r de la lenteja es fija, de modo que no es posible mover el valor de r sinviolar la ligadura de distancia constante al origen. Por esta razon el numero de coordenadas generalizadas n delsistema no es en general igual a 3N , siendo N el numero de partıculas. No obstante, las ligaduras son usualmentemanifestaciones macroscopicas de fuerzas microscopicas, por ejemplo la tension de la cuerda del pendulo es el re-sultado de las fuerzas que generan los enlaces moleculares de la cuerda. Por esta razon, en el mundo microscopicoel concepto de ligadura basicamente desaparece y los sistemas de partıculas se tratan en general como sistemasno ligados por las interacciones. Por tanto, el numero de grados de libertad de posicion sera usualmente n = 3N .

A menudo resulta mas ventajoso utilizar en lugar del conjunto qi, qi un nuevo conjunto qi, pi donde lasvariables pi estan dadas por

pi ≡∂L (q, q, t)

∂qi

y pi se denomina el momento canonicamente conjugado a la variable qi. Si definimos la transformada de Legendredel Lagrangiano en la forma

H ≡∑

i

piqi − L (qi, qi, t)

a esta cantidad cuando se escribe enteramente en terminos del conjunto qi, pi, la llamamos el Hamiltoniano delsistema y actua como generador de ecuaciones de movimiento para el sistema qi, pi, a traves de las llamadasecuaciones de Hamilton

qi =∂H

∂pi; pi = −∂H

∂qi(4.1)

La resolucion de estas ecuaciones nos genera el comportamiento de qi y pi como funcion del tiempo y por tantotoda la informacion fısica del sistema. El Hamiltoniano es una funcion que puede variar tanto funcional comonumericamente cuando se hace un cambio en el sistema coordenado. El uso directo de las ecuaciones de Hamiltonpermite demostrar que

dH

dt=∂H

∂t(4.2)

192

Page 193: Mecanica Cuantica: Notas de Clase

4.1. LOS FENOMENOS CLASICOS 193

En consecuencia, si para un sistema coordenado dado el Hamiltoniano no es funcion explıcita del tiempo, estacantidad sera una constante de movimiento. Adicionalmente, la Ec. (4.1) nos dice que si una cierta coordenadageneralizada qi no aparece en el Hamiltoniano, pero sı aparece su momento conjugado pi, se tiene que estemomento conjugado sera una constante de movimiento. Por otro lado, para muchos casos de interes el Hamiltonianocorresponde a la energıa total del sistema, para que el Hamiltoniano sea la energıa del sistema se deben cumplirlos siguientes requisitos (como condiciones de suficiencia): (a) El lagrangiano asociado debe poder descomponerseen la forma

L (q, q, t) = L0 (q, t) + L1 (q, q, t) + L2 (q, q, t)

siendo Li con i = 0, 1, 2 una funcion homogenea de grados 0, 1 y 2 en las variables qi. (b) La transformacion quelleva de las coordenadas cartesianas a las coordenadas generalizadas

ri = ri (q1, ..., qn)

no debe depender explıcitamente del tiempo, y (c) el potencial asociado solo debe ser funcion de las coordenadas yel tiempo. Para los sistemas microscopicos estas condiciones se cumplen en casi todos los casos de interes. Vale decirque la condicion (c) es violada por los potenciales asociados a las interacciones electromagneticas para las cuales elpotencial depende tambien de las qi. No obstante, se puede demostrar que aun con la violacion de esta condicion,el Hamiltoniano sigue siendo la energıa del sistema para el caso especial de interacciones electromagneticas. Noteseque esto tiene que ver con el hecho de que estas son condiciones de suficiencia pero no de necesidad.

En virtud de la discusion anterior, asumiremos para nuestros propositos que el Hamiltoniano correspondenumericamente a la energıa total del sistema. De particular importancia sera el Hamiltoniano asociado a unapartıcula no relativista, no ligada y sometida a un potencial que no depende de las velocidades generalizadas. Eneste caso el Hamiltoniano corresponde a la energıa total de la partıcula y se podra escribir en la forma

H =p2

2m+ V (r, t)

si usamos como coordenadas generalizadas las coordenadas cartesianas de la partıcula, se tendra que el momentolineal pi sera el momento canonicamente conjugado a la variable xi con i = 1, 2, 3. Si aplicamos las ecuaciones deHamilton a este Hamiltoniano, las ecuaciones de movimiento quedan

xi =pim

; pi = −∂V∂xi

que coinciden con las leyes Newtonianas basicas.Por otro lado, existen en la mecanica clasica los fenomenos ondulatorios, estos aparecen de manera natural

como excitaciones o perturbaciones colectivas de un sistema de partıculas, como es el caso de las cuerdas vibranteso las olas en el agua, estos fenomenos colectivos se pueden entender a la luz de las leyes de Newton pero no sepresentan fenomenos ondulatorios clasicos para una sola partıcula. Mas bien se trata de una perturbacion quese transmite de una partıcula a otra generando propiedades de propagacion. Por otro lado, existen fenomenosondulatorios (electromagneticos) que no estan asociados clasicamente a partıculas y que no estan regidos porlas leyes de Newton sino por las denominadas ecuaciones de Maxwell. Podemos entonces por un lado hablar demateria (regida por la mecanica Newtoniana) que genera los fenomenos corpusculares y las ondas mecanicas, yla radiacion (regida por las ecuaciones de Maxwell, que genera fenomenos ondulatorios que clasicamente no estanasociados a la materia). De otra parte, podemos hablar de fenomenos corpusculares generados por las partıculasindividuales y fenomenos ondulatorios generados por los campos electromagneticos o por perturbaciones colectivasen la materia. En todo caso, salvo por la ley de Lorentz que nos da la interaccion de la radiacion con la materia,estos dos tipos de entes fısicos radiacion y materia son completamente distintos en mecanica clasica y se rigen porleyes muy distintas. Por otro lado, una partıcula individual no puede generar fenomenos ondulatorios de modoque el comportamiento corpuscular esta bien diferenciado del comportamiento ondulatorio.

De la anterior discusion podemos inferir las principales caracterısticas de los sistemas clasicos

Page 194: Mecanica Cuantica: Notas de Clase

194 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

(1) El estado de un sistema en un tiempo t queda totalmente especificado por el valor de sus coordenadas ymomentos conjugados en tal tiempo. Esto equivale a conocer sus posiciones, masas y velocidades en dicho instante.

(2) Al especificar el estado del sistema en cierto tiempo, cualquier cantidad fısica tiene un valor unico que sereflejara en el proceso de medida (con ciertas incertidumbres de ındole experimental).

(3) Las ecuaciones de Hamilton son un posible conjunto de ecuaciones de movimiento. De ellas se observa quedados los valores de qi (t0) , pi (t0) para un tiempo inicial t0, la evolucion de qi, pi es unica de modo que los valoresqi (t) , pi (t), estan completamtne determinados para todo tiempo. En consecuencia el estado del sistema se conocecompletamente para cualquier tiempo t ≥ t0 si lo conocemos para t0. Esto a su vez implica que cualquier cantidadfısica evoluciona de manera unica y su valor al ser medido sera unico en cualquier instante.

(4) En principio todos valores reales de qi, pi son posibles de obtener en un sistema mecanico (al menos dentrode ciertos intervalos). Por tanto un observable F (qi, pi) tambien posee valores en un espectro contınuo al menosdentro de cierto intervalo. Ademas en el proceso de medicion estos seran tambien los valores accesibles de lascantidades fısicas.

(5) Las ecuaciones de Maxwell nos dan cuenta de la radiacion a traves de grados de libertad contınuos ca-racterizados por los campos electricos y magneticos. La evolucion de estas ecuaciones es unica para condicionesiniciales y de frontera adecuadas, junto con el conocimiento de la distribucion de cargas y corrientes. Al igual queen la mecanica clasica del discreto la evolucion temporal de los observables es determinista ası como el valor delas medidas que se efectuen. Similarmente, el espectro posible de valores para los observables es contınuo.

4.2. Los fenomenos cuanticos

La exposicion sistematica de los sistemas microscopicos descritos anteriormente nos ha llevado a encontrarfenomenos que difieren radicalmente de los fenomenos clasicos, veamos los mas importantes

(1) Existen ciertas cantidades fısicas tales como la energıa, el momento angular etc. que bajo ciertas condicionessolo nos arrojan medidas discretas. Este fenomeno de cuantizacion de las medidas accesibles aparece en escenariostan diversos como la radiacion del cuerpo negro, el efecto fotoelectrico y la medicion de los espectros atomicos.

(2) Tanto la materia como la radiacion presentan fenomenos de dualidad onda partıcula. Pueden dispersarsecomo partıculas pero tambien interferir y difractarse como las ondas.

(3) La repeticion sistematica de ciertos experimentos bajo las mismas condiciones iniciales, nos lleva a que lamedida de los observables no es reproducible. Sin embargo, cuando muchos experimentos identicos son realizados,aparece un patron reproducible relativo a la distribucion con que se obtienen las diferentes medidas. Estos noslleva a la idea de que existe un patron de probabilidad para obtener cada uno de los resultados accesibles (que engeneral pueden o no estar cuantizados).

(4) La distribucion de probabilidad esta asociada con el caracter ondulatorio de los sistemas.(5) En un proceso de medida se evidencia solo uno de los aspectos (ondulatorio o corpuscular) de la naturaleza

cuantica, como una moneda que posee dos caras pero solo nos muestra una a la vez (principio de complementa-riedad).

(6) La cuantizacion de los observables nos conduce a pensar que los estados asociados a estos observablestambien estan cuantizados (autoestados del sistema). El principio de superposicion que poseen las ondas sugierepensar que el estado del sistema en un tiempo t es la superposicion de todos los autoestados, en donde cadaautoestado contribuye con cierto peso.

(7) El proceso de medida nos cambia el estado del sistema de manera drastica: justo antes de la medida elestado del sistema es la superposicion de todos los autoestados, justo despues de la medida el sistema quedapreparado en una superposicion que solo incluye a los autoestados asociados con el autovalor obtenido.

(8) Lo anterior nos induce a pensar que existe una perturbacion fundamental que no puede ser minimizada, yque es inherente al proceso de medicion e independiente de la resolucion del aparato de medida.

(9) La probabilidad de obtener un autovalor esta relacionada con los coeficientes asociados a sus autoestados.Lo anterior es confirmado por la repeticion sucesiva de los experimentos. Notese que esto ademas implica que laforma en que actuara la perturbacion fundamental no se puede predecir con certeza.

Page 195: Mecanica Cuantica: Notas de Clase

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 195

(10) Como corolario se obtiene que si vuelvo a hacer una medida del mismo observable justo despues de laprimera medicion, el autovalor se reproduce con total certeza. Lo anterior es confirmado por los hechos experi-mentales.

(11) La distribucion de probabilidad para la materia evoluciona de manera determinista, siendo la ecuacion deSchrodinger un buen prospecto como generador de esta evolucion, al menos en el regimen no relativista.

(12) La funcion de onda (solucion de la ecuacion de Schrodinger) que describe la distribucion de probabilidaddebe ser de cuadrado integrable para poder mantener la conservacion de la probabilidad.

(13) Para una partıcula el estado clasico en un tiempo t se caracteriza por seis cantidades (3 posiciones y tresmomentos) en tanto que para una partıcula cuantica esta caracterizada por un numero infinito de cantidades: losvalores de ψ (r, t) para cada posicion r.

En sıntesis, los postulados deben dar cuenta de las caracterısticas arriba citadas.

4.3. Establecimiento de los postulados

4.3.1. Descripcion de los estados y las cantidades fısicas

Hemos visto que el estado de una partıcula se caracteriza por la funcion de onda ψ (r, t) que es una funcionde cuadrado integrable. Adicionalmente, vimos que a cada funcion de onda en el espacio le corresponde un ket|ψ〉 en el espacio de estados Er. Donde la relacion entre ambos viene dada por |ψ (t)〉 → 〈r |ψ (t)〉 = ψ (r, t). Estarelacion nos muestra a la funcion de onda como una representacion del ket |ψ (t)〉 en la base |r〉. Ademas, larepresentacion por kets posee la flexibilidad de ser expresada en cualquier base. Generalizaremos este enunciadode una partıcula al caso de un sistema fısico arbitrario

Primer postulado: El estado de un sistema fısico en un tiempo t0 esta especificado por un ket |ψ (t0)〉 ∈ E.Siendo E un subespacio de un espacio de Hilbert H, donde H es isomorfo e isometrico al espacio L2 de lasfunciones cuadraticamente integrables en un volumen dado.

Al ser E un espacio vectorial, una combinacion lineal de estados es tambien un estado, lo cual implica unprincipio de superposicion. Mas adelante veremos las implicaciones fısicas de este principio de superposicion.

De otra parte, observamos que la ecuacion de Schrodinger independiente del tiempo nos lleva a una ecuacionde valores propios

H |ψ〉 = E |ψ〉donde el operador H esta definido por

H =P 2

2m+ V (r)

siendo P el operador cuyos valores propios corresponden al momento de la partıcula. Este operador H tiene comovalores propios los valores accesibles de energıa del sistema. En forma similar vimos que al menos para partıculalibre los operadores R y P tiene como valores propios los valores accesibles (contınuos) de posicion y momento.Vale ademas decir que H, R y P son todos observables. La generalizacion de estos hechos nos lleva al segundo ytercer postulado

Segundo postulado: Toda cantidad fısica medible A, esta descrita por un operador A que actua sobre elespacio vectorial E. Dicho operador es un observable, i.e. un operador hermıtico cuyo espectro de autoestados escompleto.

Mas adelante veremos que la caracterıstica de observable es esencial. Notese que en la mecanica cuantica losestados estan representados por vectores y las cantidades Fısicas por operadores.

Tercer postulado: El unico resultado posible en una medicion de una cantidad fısica A es uno de los auto-valores del correspondiente observable A.

Por supuesto, toda medida experimental debe ser un numero real. El caracter hermıtico de A nos garantizaque una medida de A nos dara un valor real, ya que todo valor propio de A es real. Adicionalmente, dado queel problema de valores propios conduce en muchas circunstancias a valores propios discretos, es de esperarse queeste postulado nos de cuenta de la naturaleza cuantica de algunas cantidades fısicas.

Page 196: Mecanica Cuantica: Notas de Clase

196 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

4.3.2. El proceso de medicion y la distribucion de probabilidad

Cuando analizamos el experimento de fotones polarizados (seccion 2.9), nos topamos con el principio dedescomposicion espectral, al cual le daremos un caracter mas general en la presente seccion. Consideremos que unsistema esta caracterizado en el tiempo t, por el ket |ψ (t)〉 (de acuerdo con el primer postulado) el cual asumiremoscomo normalizado a 1

〈ψ |ψ〉 = 1

sabemos que si queremos medir una cantidad fısica A asociada a un observable A no podemos hacer una predicciondel resultado con toda certeza sino solo una prediccion de la probabilidad de obtener un valor dado accesible, esdecir un autovalor dado de A.

Asumamos por ahora que el espectro de A es totalmente discreto y no degenerado, en tal caso a cada valorpropio an le corresponde un unico vector propio normalizado |un〉 (excepto por una fase constante). La ecuacionde valores propios de A es

A |un〉 = an |un〉y dado que A es un observable, los vectores propios |un〉 forman una base ortonormal en E . El vector de estado|ψ〉 se puede entonces expandir en esta base

|ψ〉 =∑

n

cn |un〉

y postularemos siguiendo el principio de descomposicion espectral (seccion 2.9 Ecs. 2.46, 2.47, 2.48), que laprobabilidad de obtener el valor propio ak esta dada por

P (ak) = |ck|2 = |〈uk |ψ〉|2

¿Que ocurre si el autovalor es degenerado?, en este caso varios vectores ortonormales corresponden a este valorpropio

A∣∣uin⟩= an

∣∣uin⟩

; i = 1, ..., gn

dado que A es observable, el conjunto∣∣uin

⟩forma una base de modo que podemos expandir el estado |ψ〉 en

dicha base

|ψ〉 =∑

n

gn∑

i=1

cin∣∣uin⟩

(4.3)

en este caso la probabilidad P (ak) debe involucrar a todos los coeficientes asociados a los estados propios convalor propio ak

P (ak) =

gk∑

i=1

∣∣cik∣∣2 =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2

con lo cual estableceremos el cuarto postulado para espectros discretos

Cuarto postulado (caso de espectro discreto): Cuando se mide una cantidad fısica A sobre un sistema queesta en el estado normalizado |ψ〉, la probabilidad P (ak) de obtener el autovalor ak correspondiente al observableA es

P (ak) =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2 (4.4)

siendo gk el grado de degeneracion de ak y∣∣uik

⟩i = 1, ..., gk un conjunto ortonormal de vectores que forman

una base en el autosubespacio Ek generado por el valor propio ak del observable A.

Naturalmente, cuando ak no es degenerado, entonces gk = 1 y la suma solo contiene un termino, siendo elautoespacio Ek de una dimension.

Page 197: Mecanica Cuantica: Notas de Clase

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 197

Notese que para que este postulado tenga sentido, es necesario que el calculo de la probabilidad no dependade la base especıfica

∣∣uik⟩

que se use. Esto se puede ver facilmente considerando la descomposicion de E comosuma directa de los autoespacios Ek

E = E1 ⊕ E2 ⊕ . . .⊕ Ek ⊕ . . . (4.5)

notese que para poder hacer esta descomposicion, es necesario que el operador sea un observable (extension delteorema espectral a dimension infinita). Si retomamos la Ec. (4.3) y la reescribimos adecuadamente resulta

|ψ〉 =g1∑

i=1

ci1∣∣ui1⟩+

g2∑

i=1

ci2∣∣ui2⟩+ . . .+

gk∑

i=1

cik∣∣uik⟩+ . . .

y es claro que

|ψm〉 ≡gm∑

i=1

cim∣∣uim

⟩∈ Em (4.6)

de modo que

|ψ〉 = |ψ1〉+ |ψ2〉+ . . . + |ψk〉+ . . . ; |ψm〉 ∈ Em (4.7)

Por otro lado, en virtud de la descomposicion (4.5), existe una unica expansion de |ψ〉 en vectores de cadaautoespacio. En otras palabras, cada |ψm〉 en la expansion es unico. En terminos de proyectores tenemos que

|ψ〉 = (P1 + P2 + . . .+ Pk + . . .) |ψ〉 = P1 |ψ〉+ P2 |ψ〉+ . . .+ Pk |ψ〉+ . . .

Pm |ψ〉 = |ψm〉 ∈ Em

en notacion de Dirac el proyector Pm se escribe

Pm =

gm∑

i=1

∣∣uim⟩ ⟨uim∣∣

como se puede verificar al operar sobre |ψ〉

Pm |ψ〉 =gm∑

i=1

∣∣uim⟩ ⟨uim∣∣ψ〉 =

gm∑

i=1

cim∣∣uim

⟩= |ψm〉 ∈ Em

la probabilidad es

P (ak) =

gk∑

i=1

∣∣cik∣∣2 =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2 =

gk∑

i=1

〈ψ∣∣uik⟩〈uik |ψ〉

P (ak) = 〈ψ|Pk |ψ〉 (4.8)

y usando la idempotencia y hermiticidad de Pk se tiene que

P (ak) = 〈ψ|PkPk |ψ〉 =(〈ψ|P †

k

)(Pk |ψ〉)

P (ak) = 〈ψk|ψk〉 = ‖|ψk〉‖2

pero dado que |ψk〉 es unico y su norma es independiente de la base en que se calcule, vemos que esta probabilidades independiente de la base como se esperaba. La Ec. (4.8) es una forma alternativa de calcular esta probabilidad.

Veamos el caso de un espectro contınuo no degenerado. La ecuacion de valores propios de A es

A |vα〉 = α |vα〉

Page 198: Mecanica Cuantica: Notas de Clase

198 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

siendo α un ındice contınuo y siendo |vα〉 ortonormal en el sentido extendido. Siendo A un observable (tambienen el sentido extendido), podemos expandir el ket |ψ〉 en terminos de los autoestados de A

|ψ〉 =∫dα c (α) |vα〉

puesto que el conjunto de medidas accesibles de A es contınuo, debemos definir una densidad de probabilidad, talcomo lo hicimos con la funcion de onda ψ (r, t) y su transformada de Fourier ψ (p, t). En el caso de estas funcionesla probabilidad de encontrar a la partıcula en un volumen d3r o dentro de un intervalo tridimensional de momentod3p estan dados por

dP (r) = |ψ (r, t)|2 d3r = |〈r |ψ〉|2 d3r ; R |r〉 = r |r〉dP (p) =

∣∣ψ (p, t)∣∣2 d3p = |〈p |ψ〉|2 d3p ; P |p〉 = p |p〉

la extrapolacion natural para un espectro contınuo arbitrario es

dP (α) = ρ (α) dα ; ρ (α) = |〈vα |ψ〉|2

siendo dP (α) la probabilidad de obtener un valor dentro del intervalo entre α y α+ dα. Naturalmente, α puedeestar indicando varios ındices contınuos.

Cuarto postulado (caso contınuo no degenerado): Cuando se mide la cantidad fısica A sobre un sistemaque esta en el estado normalizado |ψ〉, la probabilidad de obtener un valor dentro del intervalo entre α y α+ dαesta dada por

dP (α) = |〈vα |ψ〉|2 dα ≡ ρ (α) dα (4.9)

siendo |vα〉 el autovector correspondiente al autovalor α del observable A asociado a la cantidad Fısica A. A lacantidad ρ (α) la llamamos la densidad de probabilidad asociada al autovalor α.

Notese que tanto en el contınuo como en el discreto, la probabilidad de obtener cualquier valor accesible esigual a la unidad como debe ser

k

P (ak) =∑

k

〈ψ|Pk |ψ〉 = 〈ψ|(∑

k

Pk

)|ψ〉 = 〈ψ| I |ψ〉 = 〈ψ |ψ〉 = 1

o alternativamente∑

k

P (ak) =∑

k

gk∑

i=1

∣∣cik∣∣2 = 〈ψ |ψ〉 = 1

en el caso contınuo∫ b

adP (α) =

∫ b

a|〈vα |ψ〉|2 dα =

∫ b

a〈ψ |vα〉 〈vα |ψ〉 dα = 〈ψ|

∫ b

a|vα〉 〈vα| dα

|ψ〉 = 〈ψ| I |ψ〉 = 1

siendo [a, b] el intervalo en donde se define la variable contınua α. Por supuesto, si la funcion es de cuadradointegrable pero no esta normalizada, estas probabilidades se pueden calcular normalizando a |ψ〉

∣∣ψ′⟩ = 1√〈ψ |ψ〉

|ψ〉

y para el discreto y el contınuo se obtiene

P (ak) =

gk∑

i=1

∣∣〈uik∣∣ψ′⟩∣∣2 = 1

〈ψ |ψ〉

gk∑

i=1

∣∣〈uik |ψ〉∣∣2

dP (α) = ρ (α) dα =1

〈ψ |ψ〉 |c (α)|2 dα

Page 199: Mecanica Cuantica: Notas de Clase

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 199

es importante enfatizar que el caracter de observable de A es vital para la construccion del cuarto postulado, yaque este depende de que un estado (arbitrario) pueda expandirse en terminos de los autovectores de A.

Si el espectro contınuo es degenerado podemos escribir

A∣∣∣vβα⟩= α

∣∣∣vβα⟩

β ∈ [c, d]

y la densidad de probabilidad asociada a α se obtiene sumando sobre todos los vectores propios con valor propioα

ρ (α) =

∫ d

c

∣∣∣〈vβα |ψ〉∣∣∣2dβ ; dP (α) =

[∫ d

c

∣∣∣〈vβα |ψ〉∣∣∣2dβ

]dα

la extension a casos en donde parte del espectro es contınuo y parte discreto es relativamente simple y sera ilustradaposteriormente con ejemplos.

4.3.3. Relevancia fısica de las fases en mecanica cuantica

Consideremos dos kets |ψ〉 y |ψ′〉 relacionados en la forma

∣∣ψ′⟩ = eiθ |ψ〉

siendo θ un numero real. Es facil ver que los dos vectores poseen la misma norma y que la probabilidad predichapara una medicion arbitraria es la misma para ambos kets.

〈ψ′ ∣∣ψ′⟩ = 〈ψ| e−iθeiθ |ψ〉 = 〈ψ |ψ〉∣∣〈uik |ψ′〉

∣∣2

〈ψ′ |ψ′〉 =

∣∣eiθ〈uik |ψ〉∣∣2

〈ψ |ψ〉 =

∣∣〈uik |ψ〉∣∣2

〈ψ |ψ〉

aun mas, los kets relacionados en la forma ∣∣ψ′′⟩ = αeiθ |ψ〉

tambien contienen la misma informacion fısica, ya que estrictamente los observables solo se calculan con ketsnormalizados. En consecuencia, dos kets linealmente dependientes representan el mismo estado del sistema fısico.

Este resultado debe interpretarse con cuidado. Por ejemplo, sea el estado

|ψ〉 = λ1 |ψ1〉+ λ2 |ψ2〉

donde λ1 y λ2 son complejos. De lo anterior, sabemos que eiθ1 |ψ1〉 representa al mismo estado que |ψ1〉 y queeiθ2 |ψ2〉 representa al mismo estado que |ψ2〉, no obstante el estado

|ϕ〉 = λ1eiθ1 |ψ1〉+ λ2e

iθ2 |ψ2〉

no representa el mismo estado fısico que |ψ〉, ya que la diferencia de fase θ2 − θ1 dara lugar a fenomenos deinterferencia, volveremos sobre esto mas adelante. Por el momento mencionaremos que los dos estados describiranla misma fısica solo si θ1 = θ2 + 2nπ, siendo n un entero. Pues en tal caso eiθ1 = eiθ2 y resulta

|ϕ〉 = eiθ1 [λ1 |ψ1〉+ λ2 |ψ2〉] = eiθ1 |ψ〉

de modo que un factor de fase global no afecta las predicciones fısicas, pero las fases relativas de los coeficientesde una expansion son significativas.

Page 200: Mecanica Cuantica: Notas de Clase

200 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

4.3.4. El proceso de medida y la reduccion del paquete de onda

Hasta el momento hemos hablado del valor experimental obtenido en la medicion pero no del estado del sistemauna vez que la medicion se ha efectuado. En el experimento de polarizacion de fotones vimos que justo despuesde que la medida es realizada, el sistema queda preparado en el autoestado asociado al autovalor que se obtuvoen la medicion. Vamos ahora a generalizar este proceso conocido como reduccion del paquete de onda.

Supongamos que queremos medir una cantidad fısica A asociada a un observable A en un tiempo dado t.Si |ψ〉 representa el estado del sistema justo antes de la medicion, el cuarto postulado nos permite obtener laprobabilidad para cada autovalor posible en la medicion. Sin embargo, una vez que la medida es efectuada solouno de los posibles autovalores es obtenido. Por tanto, justo despues de la medicion, ya no podemos hablar dela probabilidad de obtener un autovalor, pues ya sabemos cual de ellos se obtuvo, de manera que poseemos unainformacion adicional y es comprensible que el estado del sistema ya no sea |ψ〉 ya que justo despues de la medicionel estado debe incorporar la informacion del autovalor especıfico que se obtuvo. Por tanto, es de esperarse queel estado |ψk〉 justo despues de la medida sea la componente de |ψ〉 asociada con el autoestado ak. Tendremosentonces que cuando se ejecuta una medida con resultado ak, el estado tendra un cambio abrupto desde |ψ〉 (justoantes de la medicion) hasta |ψk〉 pero normalizado (justo despues de la medicion).

|ψ〉 (ak)−→ 1√〈ψk |ψk〉

|ψk〉 =Pk |ψ〉√〈ψ|Pk |ψ〉

Es importante decir que la normalizacion es necesaria ya despues de la medicion |ψk〉 describe todo el estado delsistema y no solo una componente de tal estado como antes de la medicion. Recordando las expansiones (4.3, 4.7)y la expresion (4.6) para la componente |ψk〉 de |ψ〉 sobre el autoespacio Ek, se tiene

|ψ〉 =∑

n

gn∑

i=1

cin∣∣uin⟩

|ψ〉 (ak)−→ 1√∑gkm=1

∣∣cmk∣∣2

gk∑

i=1

cik∣∣uik⟩

Quinto postulado: Si la medida de la cantidad fısica A sobre el sistema en el estado |ψ〉, nos da el valorpropio ak, el estado del sistema inmediatamente despues de la medida esta dado por la proyeccion normalizadade |ψ〉 sobre el autoespacio Ek asociado con ak

|ψ〉 (ak)−→ Pk |ψ〉√〈ψ|Pk |ψ〉

=1√

〈ψk |ψk〉|ψk〉 =

1√∑gkm=1

∣∣cmk∣∣2

gk∑

i=1

cik∣∣uik⟩

(4.10)

el estado del sistema inmediatamente despues de la medicion es entonces un autovector de A con autovalor ak.Pero no un autovector cualquiera de Ek, sino la componente sobre este autoespacio del estado |ψ〉 que se tenıaantes de la medicion. Cuando hay ausencia de degeneracion gk = 1 y se tiene que el estado despues de la mediciones

|ψ〉 (ak)−→ 1√|ck|2

ck |uk〉 =1

|ck|(|ck| eiα

)|uk〉

|ψ〉 (ak)−→ eiα |uk〉

el cual es fısicamente identico a |uk〉. Efectivamente en este caso salvo por una constante de proporcionalidad,el autovector asociado a ak es unico. Este postulado nos da cuenta de los cambios abruptos en el estado, operturbaciones fundamentales que se aprecian en diversos experimentos.

Page 201: Mecanica Cuantica: Notas de Clase

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 201

Por otra parte, la combinacion del cuarto y el quinto postulado nos dice que si el estado de un sistema fısicocoincide con un autovector |ψk〉 de un observable A asociado a un autovalor ak, entonces la medicion del observableA nos dara con toda certeza el valor propio ak y el estado permanecera intacto. Estas son las caracterısticas conlas cuales hemos definido a los autoresultados y a los autoestados del sistema con respecto al observable A, demodo que los autoresultados y autoestados del sistema asociados con un observable A corresponden a sus valorespropios y kets propios1.

4.3.5. Evolucion fısica de los sistemas cuanticos

Ya hemos usado argumentos de plausibilidad para suponer que la ecuacion de Schrodinger es la ecuacionque gobierna la evolucion temporal de los estados correspondientes a un sistema de una partıcula cuantica norelativista. Postularemos que esta misma ecuacion gobierna la evolucion temporal de todos los sistemas cuanticosno relativistas

Sexto postulado: La evolucion temporal de un vector de estado |ψ (t)〉 esta regida por la ecuacion de Schrodin-ger

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉

donde H (t) es el observable asociado con la energıa total del sistema. H (t) se conoce como el operador Hamilto-niano del sistema y se obtiene del Hamiltoniano clasico por medio de ciertas reglas de cuantizacion.

Antes de explicar las reglas de cuantizacion, discutiremos un aspecto importante de la evolucion temporalque resulta de la combinacion del quinto y sexto postulados. La ecuacion de Schrodinger me dara la evoluciondel estado del sistema desde un tiempo inicial t0 hasta un tiempo final t2, siempre que en este intervalo no serealice ninguna medida. Asumamos por el contrario, que se realiza la medida de una cantidad A asociada a unobservable A, en el tiempo t1 con t0 < t1 < t2, y que el resultado es el valor propio ak. En tal caso, la ecuacion deSchrodinger me permitira calcular la evolucion del estado desde su valor en t0 dado por |ψ (t0)〉 hasta el valor queadquiere en t1 (justo antes de la medida) dado por |ψ (t1)〉, como en ese instante se realiza una medida el sistematendra un cambio discontınuo de estado de modo que en t1 (pero justo despues de la medida) el sistema quedaen el estado |ψk|−1 |ψk〉, por tanto la evolucion temporal del sistema para tiempos posteriores a t1 debera tomareste valor como condicion inicial |ψ′ (t1)〉 = |ψk|−1 |ψk〉 para obtener su evolucion hasta cualquier valor posteriordel tiempo digamos t2, siempre que no se haga otra medida entre t1 y t2. En general, cada medida obligara auna “recalibracion” de las condiciones iniciales (tomando como tiempo inicial el tiempo en que se realiza cadamedida), para calcular la evolucion temporal del estado.

Volvamos ahora a las condiciones de cuantizacion

4.3.6. Reglas de cuantizacion

Hemos visto que el Hamiltoniano clasico tiene asociado un operador cuyos valores propios son las energıasaccesibles del sistema. Conocemos la forma de este operador para la representacion en la base |r〉, y vemos quea partir del Hamiltoniano clasico H (r,p, t) el operador Hamiltoniano queda en la forma

p2

2m+ V (r) → P2

2m+ V (R) = − ~2

2m∇2 + V (r)

H (r,p, t) → H (R,P, t)

siendo P y R los operadores de momento y posicion definidos en la seccion 1.43.4. En lo anterior hemos usadoel hecho de que en la representacion de la base |r〉, el operador P esta representado por el operador diferencial−i~∇, y el operador R esta representado por la multiplicacion por el valor de posicion R → r (ver Ecs. 1.186,1.191).

1Notese que si cambiamos de observable los autoestados y autoresultados (kets y valores propios), se redefinen completamente yaque estos conceptos estan ligados al sistema fısico junto con el aparato de medida.

Page 202: Mecanica Cuantica: Notas de Clase

202 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

Nuevamente, extenderemos este algoritmo a la construccion de un operador A asociado a una cantidad fısicaA que esta definida en la mecanica clasica. Consideremos una partıcula sin espın sujeta a un potencial escalar,estableceremos la siguiente regla de cuantizacion

A la posicion r (x, y, z) de la partıcula se le asocia el observable R (x, y, z). Al momento p (px, py, pz) de lapartıcula se le asocia el observable P (px, py, pz).

Recordemos que las componentes de los operadores R y P satisfacen las relaciones canonicas de commutacion

[Ri, Rj ] = [Pi, Pj ] = 0 ; [Ri, Pj ] = − [Pj , Ri] = i~δij (4.11)

por tanto, dado que una cantidad fısica clasica A se puede escribir en terminos de r,p, t i.e. A (r,p, t), el corres-pondiente observable A se obtendra reemplazando las variables dinamicas r,p en la expresion A (r,p, t) por losobservables R y P

A (t) = A (R,P, t)

sin embargo, este algoritmo puede generar algunas ambiguedades e inconsistencias. Asumamos por ejemplo queen la cantidad fısica A (r,p, t) aparece un termino de la forma

r · p = xpx + ypy + zpz

en mecanica clasica, el producto r · p es conmutativo, de modo que tambien podemos escribirlo como

p · r = pxx+ pyy + pzz

pero en el proceso de cuantizacion, ambos terminos conducen a operadores diferentes ya que R y P no conmutan

R ·P 6= P ·R

adicionalmente, ninguno de estos operadores es Hermıtico2

(R ·P)† = (XPx + Y Py + ZPz)† = P †

xX† + P †

yY† + P †

zZ† = PxX + PyY + PzZ = P ·R

la segunda de las Ecs. (1.43) nos sugiere la forma de generar un operador hermıtico con este producto

Z ≡ R ·P+ (R ·P)†

2=

R ·P+P ·R2

=P ·R+ (P ·R)†

2⇒

Z ≡ R ·P+P ·R2

esta forma ademas de ser hermıtica, es simetrica con respecto a R·P y P ·R es decir con respecto a la cuantizacionde cualquiera de los dos operadores. De modo que debemos anadir una regla de simetrizacion de los operadoresque incluya operadores mas complejos que R ·P

Regla de cuantizacion y simetrizacion: El observable A que describe a una cantidad fısica definida clasi-camente por A (r,p, t), se obtiene reemplazando para A a las variables dinamicas r,p (canonicamente conjugadas)por los observables R,P, en una forma adecuadamente simetrizada.

Mas adelante veremos sin embargo, que ciertos observables A en mecanica cuantica no provienen de unacantidad fısica A definida clasicamente, sino que surgen directamente como observables cuanticos, este es el casodel espın de la partıcula.

Es importante enfatizar que las reglas de cuantizacion y las propiedades de commutacion establecidas enesta seccion solo son validas para las coordenadas cartesianas. Si bien es posible extenderlas a otros tipos decoordenadas, no adquiriran formas tan simples. Veamos algunos ejemplos del uso de las reglas de cuantizacion.

2Recordemos que el producto de operadores hermıticos no es en general hermıtico (ver teorema 1.34).

Page 203: Mecanica Cuantica: Notas de Clase

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 203

(a) El caso mas simple es el de una partıcula de masa m, bajo una interaccion que se puede describir por unpotencial que solo depende de la posicion y el tiempo, el Hamiltoniano clasico en coordenadas cartesianas vendradado por

H (r,p) =p2

2m+ V (r) ; p = m

dr

dt= mv

la regla de cuantizacion no presenta dificultades ya que no es necesaria ninguna simetrizacion puesto que R y Pnunca se acoplan, de modo que no aparecen productos de operadores que no conmutan. El Hamiltoniano comoobservable queda

H (R,P) =P2

2m+ V (R)

en este caso particular en virtud del sexto postulado la ecuacion de Schrodinger queda

i~d

dt|ψ (t)〉 =

[P2

2m+ V (R)

]|ψ (t)〉

(b) Veamos ahora el Hamiltoniano de una partıcula sometida a una interaccion electromagnetica, en tal casoel Hamiltoniano clasico se escribe en la forma

H (r,p) =1

2m[p− qA (r, t)]2 + qφ (r, t) (4.12)

siendo A (r, t) , φ (r, t) los potenciales vectorial y escalar, p es el momento canonicamente conjugado a r y estadado por

p = mdr

dt+ qA (R, t) = mv + qA (R, t)

notese que el momento p canonicamente conjugado a r, no es el momento lineal de la partıcula, esto se debe aque para una partıcula en un campo electromagnetico, el potencial generalizado asociado depende de la velocidadgeneralizada y no solo de la posicion. De nuevo la cuantizacion es sencilla puesto que no hay operadores parasimetrizar, el Hamiltoniano como observable queda

H (R,P) =1

2m[P− qA (R, t)]2 + V (R, t) ; V (R, t) ≡ qφ (R, t)

y la ecuacion de Schrodinger resulta

i~d

dt|ψ (t)〉 =

1

2m[P− qA (R, t)]2 + V (R, t)

|ψ (t)〉

habiamos mencionado antes que a pesar de que el potencial generalizado depende de la velocidad, el Hamiltonianocontinua siendo la energıa del sistema, esto se puede ver teniendo en cuenta que el momento lineal de la partıculaque denotaremos por ~p esta relacionado con el momento conjugado a la variable r en la forma

~p = p− qA

de modo que el Hamiltoniano clasico queda

H =~p2

2m+ V (r, t)

el primer termino es la energıa cinetica y el segundo es la componente del potencial que genera trabajo. La claveesta en el hecho de que el campo magnetico (que es el que introduce el potencial dependiente de la velocidad) norealiza trabajo.

Este ejemplo tambien nos sirve para realizar una aclaracion importante, en la regla de cuantizacion es elmomento p canonicamente conjugado a r, y no el momento lineal ~p el que debe reemplazarse por el operador

Page 204: Mecanica Cuantica: Notas de Clase

204 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS

P. Si recordamos que dos variables xi, pi canonicamente conjugadas clasicamente son tales que sus corchetes dePoisson cumplen la relacion

[xi, xj ]pois = [pi, pj ]pois = 0 ; [xi, pj ]pois = − [pj, xi]pois = δij (4.13)

diremos que las cantidades que clasicamente cumplen las relaciones canonicas (4.13) con corchetes de Poisson,pasaran en el proceso de cuantizacion a cumplir las relaciones canonicas (4.11) con conmutadores. Notese ademasque las propiedades fundamentales de los conmutadores (1.37-1.42) tambien las cumplen los corchetes de Poissony con ambas se podra generar un algebra de Lie.

Page 205: Mecanica Cuantica: Notas de Clase

Capıtulo 5

Consecuencias de los postulados sobre losobservables y sus medidas

Ya hemos estudiado los kets de posicion |r〉 y los kets de momento |p〉 ası como los operadores de posicion ymomento R y P. Por simplicidad usaremos el caso unidimensional, las ecuaciones de valores propios paraX,Px son

X |x〉 = x |x〉 ; Px |px〉 = px |px〉estos operadores tienen un espectro contınuo lo cual coincide con el hecho experimental de que todos los valoresreales son posibles para las posiciones y momentos de la partıcula. Si utilizamos el cuarto postulado podemoscalcular la probabilidad de obtener una posicion dentro del intervalo entre x y x+dx o la probabilidad de obtenerun momento en el intervalo entre px y px + dpx.

dP (x) = |〈x |ψ〉|2 dx = |ψ (x)|2 dx ; dP (p) = |〈p |ψ〉|2 dp =∣∣ψ (p)

∣∣2 dpde hecho estas expresiones fueron usadas para establecer el cuarto postulado. No obstante, es de particular interesla interpretacion a la luz de este postulado del caso en el que el estado del sistema esta descrito justamente por|x′〉 o |p′〉, en tal caso estas probabilidades quedan

dP (x) =∣∣〈x∣∣x′⟩∣∣2 dx =

∣∣δ(x− x′

)∣∣2 dx ; dP (p) =∣∣〈p∣∣p′⟩∣∣2 dp =

∣∣δ(p− p′

)∣∣2 dpsi integramos estas probabilidades entre x′ − ε y x′ + ε o entre p′ − ε y p′ + ε respectivamente, tenemos que laprobabilidad da la unidad sin importar el tamano de ε, si por el contrario calculamos la integral en cualquiervolumen que excluya al punto x′ o p′ esta integral da cero. Por tanto |x′〉 describe un estado en donde la partıculaesta en un punto bien definido del espacio y |p′〉 describe una partıcula con momento especıfico p′. Para el estado|x′〉 la medida de posicion es totalmente predecible y para el estado |p′〉 es totalmente predecible la medida delmomento. Notese que para el estado |x′〉 la densidad de probabilidad asociada a la posicion diverge en el puntox′ y se anula en los demas, esto esta relacionado con el hecho de que este no es un estado fısicamente realizable,ya que no es de cuadrado integrable1. Similar discusion ocurre para el estado |p′〉 para el cual la densidad deprobabilidad asociada al momento diverge en el punto p′ y se anula en los demas.

El estado |x′〉 se puede calcular en las bases |x〉 y |p〉

x′ (x) = 〈x∣∣x′⟩= δ

(x− x′

); x′ (p) = 〈p

∣∣x′⟩=e−ipx

′/~√2π~

si calculamos la probabilidad de que al medir el momento lineal de la partıcula en el estado |x′〉 se encuentre unvalor entre p y p+ dp, obtenemos

dP (p) =∣∣x′ (p)

∣∣2 dp = dp

2π~1En mecanica clasica el fenomeno es similar. Una partıcula puntual (localizada en r′) corresponde a un sistema fısico de densidad

infinita de masa ρ (r) = mδ (r− r′). Por tanto, este es un estado clasico impropio.

205

Page 206: Mecanica Cuantica: Notas de Clase

206 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

es decir, una probabilidad uniforme. Nuevamente, la probabilidad diverge por ser un estado impropio. Sin embargo,es interesante ver que el colapso de la funcion de onda en un punto del espacio (es decir la certeza total de teneruna posicion descrita por el estado |x′〉) lleva a la incertidumbre total en el momento, como ya se discutio para elprincipio de incertidumbre de Heisenberg. Un analisis similar se puede hacer para el estado impropio |p′〉. ComoX, P tienen como valores propios las posiciones y momentos de estos estados colapsados, tiene sentido que laregla de cuantizacion reemplace x por X y p por P .

Vale la pena mencionar que para interpretar adecuadamente una funcion de onda, es esencial conocer la baseen la que esta escrita. A manera de ejemplo, observese que el ket |x〉 corresponde a una partıcula perfectamentelocalizada en x y con incertidumbre total del momento, en tanto que el ket |−p〉 corresponde a una partıcula conmomento perfectamente definido −p y con total incertidumbre en la posicion. Ahora veamos como se escribe |x〉en la base |p〉 y como se escribe |−p〉 en la base |x〉

x (p) = 〈p |x〉 = e−ipx/~√2π~

; −p (x) = 〈x |−p〉 = e−ipx/~√2π~

notese que dos estados totalmente distintos pueden ser descritos con la misma forma funcional si ambos estanescritos en bases diferentes. Una onda plana en la base |p〉 corresponde a una partıcula bien localizada, en tantoque la misma onda plana en la base |x〉 esta asociada a una partıcula con momento bien definido.

Como ya se menciono, en algunos casos la ecuacion de valores propios (establecida en el tercer postulado)conduce a un espectro discreto y en otros casos a un espectro contınuo, lo cual nos generara la discretizacion deciertas cantidades fısicas. Lo interesante es que tanto para los casos discretos como para los contınuos hay unaexcelente concordancia con los experimentos.

Los postulados cuatro y cinco plantean ciertos problemas fundamentales inherentes al proceso de medida. Porejemplo, la existencia de una perturbacion fundamental implica que el sistema no se puede considerar indepen-dientemente al aparato de medida, en realidad el conjunto sistema fısico-aparato de medida deben considerarsecomo un todo. El punto es que el proceso de observacion requiere de una interaccion entre el sistema y el aparato.Ademas el aparato de medida (para un sistema fısico dado) define tanto los autoresultados como los autoestadosque se pueden obtener en el proceso de medicion, como se discutio en la seccion 2.9, pagina 135 sobre la medicionde fotones polarizados. Esto conlleva a preguntas delicadas sobre el proceso de medida que no discutiremos aquı.

Notese que de acuerdo con los postulados cuarto y quinto, la indeterminacion en el proceso de medida indicapor un lado la existencia de la perturbacion fundamental pero tambien la no determinacion de su comportamientoespecıfico, ya que a partir del estado antes de la medida (que se puede obtener en forma totalmente determinista),la medida nos lleva a un cambio abrupto que no se puede determinar con certeza. Puesto que la ecuacion deSchrodinger es totalmente determinista, la generacion de la perturbacion fundamental y de la indeterminacion soninherentes al proceso de medida.

En lo que sigue consideraremos solo medidas ideales. Esto significa que se asume que el aparato de medida esperfecto, de modo que solo se generan las perturbaciones e incertidumbres inherentes a las leyes cuanticas. En larealidad, los aparatos son imperfectos y por tanto presentan una incertidumbre experimental que afecta de maneraadicional a la medida. Por ejemplo, un analizador deja pasar ondas polarizadas no solo en una direccion fija sinoen cierto intervalo alrededor de esta direccion. Sin embargo, a diferencia de las incertidumbres y perturbacionescuanticas, estas incertidumbres y perturbaciones experimentales pueden disminuırse indefinidamente (al menos enprincipio) para acercarse cada vez mas al lımite ideal.

5.1. Consideraciones estadısticas

5.1.1. Valor medio de un observable para un sistema en un estado dado

Para verificar el cuarto postulado, es necesario preparar un sistema en un estado bien definido y repetirel experimento muchas veces, donde para cada experimento tenemos un sistema identico con el mismo estadoinicial. Estrictamente, las predicciones solo se reproduciran en el lımite cuando N (numero de reproducciones del

Page 207: Mecanica Cuantica: Notas de Clase

5.1. CONSIDERACIONES ESTADISTICAS 207

experimento o numero de eventos) tiende a infinito. En la practica N es finito y por tanto deben usarse tecnicasestadısticas para interpretar los resultados.

De aquı en adelante denominaremos observable tanto a la cantidad fısica como al operador cuantico asociado.Definiremos el valor esperado (o valor medio) de un observable, como el promedio de los resultados obtenidoscuando se realiza un gran numero de mediciones N de dicho observable, para sistemas identicos que se preparanen un estado especıfico |ψ〉. Denotaremos al valor esperado del observable A para el sistema en el estado |ψ〉 en laforma 〈A〉|ψ〉 o cuando se sobreentienda cual es el estado, la notacion se simplificara en la forma 〈A〉.

La idea es poder predecir el valor esperado con base en los postulados. Comencemos primero con el caso deespectro discreto. Si se realizan N experimentos para identicos sistemas cada uno en el estado |ψ〉 y se obtieneel autovalor an para el observable A un numero N (an) de veces, la probabilidad de obtener dicho autovalor sedefine como

P (an) ≡ lımN→∞

N (an)

N(5.1)

y es claro que ∑

n

N (an) = N

el valor medio es simplemente la suma de todas las medidas obtenidas dividida por el numero N de medidas. Porsupuesto, cuando un numero N (an) de medidas han dado el mismo resultado an, la suma con que contribuyenestos eventos se escribe simplemente como anN (an) y se suma sobre los resultados diferentes obtenidos

〈A〉|ψ〉 =1

N

n

anN (an)

a N (an) se le conoce como la frecuencia del evento. Si tomamos el lımite cuando N → ∞ y usamos la definicion(5.1) de probabilidad se tiene que

〈A〉|ψ〉 =∑

n

anP (an)

y usando la Ec. (4.4) que proviene del cuarto postulado, se obtiene

〈A〉|ψ〉 =∑

n

an

gn∑

i=1

∣∣〈ψ∣∣uin⟩∣∣2 =

n

an

gn∑

i=1

〈ψ∣∣uin⟩〈uin |ψ〉

donde∣∣uin⟩son los vectores propios (ortonormalizados) de A asociados al valor propio an

A∣∣uin⟩= an

∣∣uin⟩

de modo que

〈A〉|ψ〉 =∑

n

gn∑

i=1

〈ψ| an∣∣uin⟩〈uin |ψ〉 =

n

gn∑

i=1

〈ψ|A∣∣uin⟩〈uin |ψ〉

〈A〉|ψ〉 = 〈ψ|A[∑

n

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣]|ψ〉 = 〈ψ|A

[∑

n

Pn

]|ψ〉 = 〈ψ|AI |ψ〉

donde hemos usado la relacion de completez para el discreto Ec. (1.170), notese que el uso de la completez requiereuna vez mas que A sea un observable. Finalmente, la expresion para el valor esperado queda

〈A〉|ψ〉 = 〈ψ|A |ψ〉 (5.2)

Page 208: Mecanica Cuantica: Notas de Clase

208 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

para el caso del espectro contınuo no degenerado, el argumento es similar. Consideremos N experimentos identicosy denominemos dN (α) el numero de experimentos cuyo resultado este incluıdo entre α y α+ dα, la probabilidadla definimos similarmente como

dP (α) = lımN→∞

dN (α)

N

el valor medio o esperado se escribe como

〈A〉|ψ〉 = lımN→∞

1

N

∫α dN (α) =

∫α dP (α)

usando de nuevo el cuarto postulado (para espectro contınuo), sustituımos dP (α) por su valor en la Ec. (4.9)

〈A〉|ψ〉 =∫α |〈ψ |vα〉|2 dα =

∫α 〈ψ |vα〉 〈vα |ψ〉 dα

y dado queA |vα〉 = α |vα〉

se obtiene

〈A〉|ψ〉 =

∫〈ψ|α |vα〉 〈vα |ψ〉 dα =

∫〈ψ|A |vα〉 〈vα |ψ〉 dα

〈A〉|ψ〉 = 〈ψ|A[∫

|vα〉 〈vα| dα]|ψ〉 = 〈ψ|AI |ψ〉 = 〈ψ|A |ψ〉

donde hemos usado la relacion de completez para el contınuo Ec. (1.170). Por tanto, se obtiene de nuevo la Ec.(5.2). Es importante aclarar que 〈A〉|ψ〉 es un promedio realizado sobre un conjunto de mediciones identicas, y nodebe confundirse con los promedios temporales que se utilizan con frecuencia en fısica para estados que dependendel tiempo.

Si el ket no esta normalizado, la Ec. (5.2) se debe convertir en

〈A〉|ψ〉 =〈ψ|A |ψ〉〈ψ |ψ〉

5.1.2. Valor esperado para los observables X,P

Para realizar el calculo del valor esperado de un observable debemos recurrir a una representacion especıfica.Calculemos 〈X〉|ψ〉 usando la representacion |r〉

〈X〉|ψ〉 = 〈ψ|X |ψ〉 =∫d3r 〈ψ |r〉 〈r|X |ψ〉 =

∫d3r ψ∗ (r) x〈r |ψ〉

〈X〉|ψ〉 =

∫d3r ψ∗ (r) x ψ (r) (5.3)

calculando 〈P 〉|ψ〉 usando la representacion |p〉 se obtiene

〈Px〉|ψ〉 =∫d3p ψ∗ (p) px ψ (p) (5.4)

si por ejemplo se calcula 〈P 〉|ψ〉 usando la representacion |r〉 se tiene

〈Px〉|ψ〉 = 〈ψ|Px |ψ〉 =∫d3r 〈ψ |r〉 〈r|Px |ψ〉 =

∫d3r ψ∗ (r)

[~

i∂x

]〈r |ψ〉

〈Px〉|ψ〉 =

∫d3r ψ∗ (r)

[~

i∂xψ (r)

](5.5)

Page 209: Mecanica Cuantica: Notas de Clase

5.1. CONSIDERACIONES ESTADISTICAS 209

5.1.3. Valor esperado para el commutador de dos observables

Es facil ver que el commutador de dos operadores hermıticos es antihermıtico

[A,B]† = (AB −BA)† = BA−AB = − [A,B]

esto significa que podemos escribir el commutador entre dos operadores hermıticos como

[A,B] = iC ; C = C†

siendo C un operador hermıtico, los valores propios de iC son puramente imaginarios al igual que su valor esperadocon respecto a cualquier estado |ψ〉. Podemos escribir entonces

〈[A,B]〉 = iM

siendo M un numero real. Vemos que si A y B son observables, su commutador no es un observable ya que no eshermıtico.

5.1.4. La desviacion media cuadratica

Si bien el valor medio o esperado 〈A〉 nos da el orden de magnitud de los resultados esperados al medir lacantidad fısica A, es tambien estadısticamente importante conocer la dispersion que presentan los datos cuandose realizan una gran cantidad de medidas. Asumamos que el espectro de A es contınuo. Si hacemos una grafica deρ (α) vs α, el valor esperado 〈A〉 sera la abscisa del “centro de gravedad” del area bajo la curva, notese ademas quesi esta curva no es simetrica alrededor de 〈A〉 entonces el valor αm para el cual ρ (αm) adquiere su valor maximo,no necesariamente coincide con 〈A〉. De hecho, puede existir mas de un maximo local.

La grafica de ρ (α) vs α suele ser asintotica, es decir tiende a cero para α→ ±∞, pero usualmente no es igual acero para ningun α real. Esto implica que estrictamente hay en la mayorıa de los casos una probabilidad diferentede cero de encontrar cualquier valor real de α. Sin embargo, es usual definir un ancho δA centrado en 〈A〉 en elcual este la mayor parte del area bajo la curva, es decir existe una probabilidad cercana a la unidad de que lamedida de α arroje un valor entre 〈A〉 − δA/2 y 〈A〉+ δA/2. La cantidad δA caracteriza el ancho de la curva demodo que a menor δA, tenemos que los resultados estaran mas concentrados alrededor de 〈A〉, lo cual indica unamenor dispersion de las medidas.

Veremos ahora como encontrar una cantidad que caracterice la dispersion de las medidas. A priori uno podrıapensar en tomar la diferencia entre cada valor αi obtenido y 〈A〉, (a esta diferencia la llamamos la desviacion deldato αi), para luego promediar estas desviaciones. Este metodo sin embargo, no es adecuado ya que el promediode las desviaciones es siempre cero tanto en el contınuo como en el discreto

D (αi) ≡ 〈A〉 − αi ; 〈D (A)〉 = 1

N

N∑

i=1

D (αi) =1

N

N∑

i=1

[〈A〉 − αi] ⇒

〈D (A)〉 =1

NN 〈A〉 − 1

N

N∑

i=1

αi = 〈A〉 − 1

N

n∑

k=1

nkαk = 〈A〉 − 〈A〉 = 0

donde el promedio de A se reescribio multiplicando αk por su frecuencia nk (numero de datos con el mismoresultado) y sumando sobre los datos diferentes (k = 1, .., n). Similarmente en el contınuo

〈D (A)〉 = 〈〈A〉 − α〉 = 〈A〉 − 1

α1 − α0

∫ α1

α0

ρ (α) α dα

〈D (A)〉 = 〈A〉 − 〈A〉 = 0

donde el ρ (α) dα es la frecuencia diferencial en el contınuo (densidad multiplicada por el diferencial de volumen).La anulacion de la desviacion promedio tiene que ver con la definicion misma de valor promedio o esperado, en el

Page 210: Mecanica Cuantica: Notas de Clase

210 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

cual las desviaciones negativas se compensan con las positivas. Para evitar este fenomeno de cancelacion, podemosdefinir las desviaciones cuadraticas en la forma

(∆A)2 ≡⟨(A− 〈A〉)2

y definimos entonces la raız de la desviacion media cuadratica como

∆A =

√⟨(A− 〈A〉)2

⟩(5.6)

y usando la expresion para el valor medio o esperado dada por la Ec. (5.2) obtenemos

∆A =

√〈ψ| (A− 〈A〉)2 |ψ〉

la desviacion media cuadratica se puede reescribir en la forma

⟨(A− 〈A〉)2

⟩=

⟨[A2 − 2A 〈A〉+ 〈A〉2

]⟩=⟨A2⟩− 2 〈A〉 〈A〉+ 〈A〉2

⟨(A− 〈A〉)2

⟩=

⟨A2⟩− 〈A〉2

y la raız de la desviacion media cuadratica queda

∆A =

√〈A2〉 − 〈A〉2 (5.7)

por ejemplo para el espectro contınuo de un observable A, ∆A queda en la forma

(∆A)2 =

∫ α1

α0

[α− 〈A〉]2 ρ (α) dα

(∆A)2 =

∫ α1

α0

α2ρ (α) dα−[∫ α1

α0

α ρ (α) dα

]2

5.2. Observables compatibles

Consideremos dos observables A y B que conmutan

[A,B] = 0

asumiremos por simplicidad que ambos espectros son discretos. El teorema 1.69 nos dice que existe un conjuntocompleto de vectores propios comunes a ambos observables, es usual denotar esta base como |an, bp, i〉, o aunmas simple como |n, p, i〉

A |n, p, i〉 = an |n, p, i〉 ; B |n, p, i〉 = bp |n, p, i〉donde el ındice i indica que a cada par de autovalores (an, bp) le pueden corresponder varios autovectores lineal-mente independientes. Por tanto, para cada posible valor del par (an, bp) existe por lo menos un vector |n, p, i〉para el cual la medida de A siempre sera an y la medida de B siempre sera bp. Veamos las implicaciones fısicassobre los observables asociados a operadores que conmutan.

Partamos de un estado inicial normalizado dado |ψ〉 (que en principio es arbitrario). Este estado se puedeescribir como una combinacion lineal de la base |n, p, i〉 comun a A y B:

|ψ〉 =∑

n′,u,v

cn′,u,v∣∣n′, u, v

⟩(5.8)

Page 211: Mecanica Cuantica: Notas de Clase

5.2. OBSERVABLES COMPATIBLES 211

asumamos que primero hacemos una medida del observable A y se obtiene an y que inmediatamente despues (demodo que en el tiempo transcurrido se pueda despreciar la evolucion temporal del estado) realizamos una medidade B de la cual obtenemos el valor bp. Calculemos la probabilidad P (an, bp) de obtener an en la primera medida ybp en la segunda. Usando el cuarto postulado Ec. (4.4) y la Ec. (5.8), la probabilidad P (an) de obtener la primeramedida es

P (an) =∑

p′,i′

∣∣⟨n, p′, i′∣∣ψ〉∣∣2 =

p′,i′

∣∣∣∣∣∣⟨n, p′, i′

∣∣∑

n′,u,v

cn′,u,v∣∣n′, u, v

⟩∣∣∣∣∣∣

2

=∑

p′,i′

∣∣∣∣∣∣∑

n′,u,v

cn′,u,v⟨n, p′, i′

∣∣n′, u, v〉

∣∣∣∣∣∣

2

=∑

p′,i′

∣∣∣∣∣∣∑

n′,u,v

cn′,u,vδn,n′δp′uδi′v

∣∣∣∣∣∣

2

P (an) =∑

p′,i′

∣∣cn,p′,i′∣∣2 (5.9)

pero segun el quinto postulado Ec. (4.10), el sistema luego de esta primera medicion queda preparado en el estadonormalizado |ψn〉 definido por

|ψn〉 =1√∑

k,m |cn,k,m|2∑

p′,i′cn,p′,i′

∣∣n, p′, i′⟩

(5.10)

este sera entonces el estado en el que estara el sistema justo antes de la medicion de B. Recurriendo de nuevo alcuarto postulado Ec. (4.4) la probabilidad de que habiendo obtenido en la primera medicion el valor an se obtengaen la segunda medicion el valor bp estara dada por

Pan (bp) =∑

n′,i

∣∣⟨n′, p, i∣∣ψn〉

∣∣2 =∑

n′,i

∣∣∣∣∣∣⟨n′, p, i

∣∣ 1√∑

k,m |cn,k,m|2∑

p′,i′cn,p′,i′

∣∣n, p′, i′⟩∣∣∣∣∣∣

2

=

∑n′,i

∣∣∣∑

p′,i′ cn,p′,i′〈n′, p, i |n, p′, i′〉∣∣∣2

∑k,m |cn,k,m|2

=

∑n′,i

∣∣∣∑

p′,i′ cn,p′,i′δn′nδpp′δii′∣∣∣2

∑k,m |cn,k,m|2

Pan (bp) =

∑i |cn,p,i|2∑

k,m |cn,k,m|2(5.11)

ahora bien, la probabilidad P (an, bp) que buscamos corresponde a una composicion de eventos: para que estosdos eventos de hecho ocurran, debemos primero encontrar an para lo cual hay una probabilidad P (an) y entonceshabiendo cumplido la primera condicion, debemos encontrar bp para lo cual hay una probabilidad Pan (bp) por lotanto

P (an, bp) = P (an)× Pan (bp) (5.12)

sustituyendo (5.9) y (5.11) en (5.12) se obtiene

P (an, bp) =

p′,i′

∣∣cn,p′,i′∣∣2[ ∑

i |cn,p,i|2∑k,m |cn,k,m|2

]

P (an, bp) =∑

i

|cn,p,i|2 (5.13)

y el estado del sistema despues de la segunda medicion de acuerdo con el quinto postulado Ec. (4.10), sera

|ψn,p〉 =Pp |ψn〉√

〈ψn|Pp |ψn〉(5.14)

Page 212: Mecanica Cuantica: Notas de Clase

212 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

evaluemos el numerador y el denominador de esta expresion, usando la Ec. (5.10).

Pp |ψn〉 =

l,v

|l, p, v〉 〈l, p, v|

1√∑

k,m |cn,k,m|2∑

p′,i′cn,p′,i′

∣∣n, p′, i′⟩

=

[∑l,v

∑p′,i′ cn,p′,i′ |l, p, v〉 〈l, p, v|n, p′, i′〉

]

√∑k,m |cn,k,m|2

=

[∑l,v

∑p′,i′ cn,p′,i′ |l, p, v〉 δlnδpp′δvi′

]

√∑k,m |cn,k,m|2

Pp |ψn〉 =

∑i′ cn,p,i′ |n, p, i′〉√∑

k,m |cn,k,m|2(5.15)

〈ψn|Pp |ψn〉 =

p′,r

c∗n,p′,r⟨n, p′, r

∣∣∑

i′ cn,p,i′ |n, p, i′〉∑k′,m′

∣∣cn,k′,m′∣∣2 =

∑p′,r

∑i′ c

∗n,p′,rcn,p,i′ 〈n, p′, r|n, p, i′〉∑k′,m′

∣∣cn,k′,m′∣∣2

〈ψn|Pp |ψn〉 =

∑p′,r

∑i′ c

∗n,p′,rcn,p,i′δnnδp′pδri′∑

k′,m′∣∣cn,k′,m′

∣∣2 =

∑i′ c

∗n,p,i′cn,p,i′∑

k′,m′∣∣cn,k′,m′

∣∣2 =

∑i′∣∣cn,p,i′

∣∣2∑

k′,m′∣∣cn,k′,m′

∣∣2 ⇒

√〈ψn|Pp |ψn〉 =

√∑i′∣∣cn,p,i′

∣∣2√∑

k′,m′∣∣cn,k′,m′

∣∣2(5.16)

Reemplazando (5.15, 5.16) en (5.14), el estado justo despues de la segunda medida queda finalmente

|ψn,p〉 =1√∑

k |cn,p,k|2∑

i

cn,p,i |n, p, i〉 (5.17)

es facil verificar que |ψn,p〉 es un estado propio de A y B con valores propios an y bp

A |ψn,p〉 =

∑i cn,p,i [A |n, p, i〉]√∑

k |cn,p,k|2=

∑i cn,p,i [an |n, p, i〉]√∑

k |cn,p,k|2= an

∑i cn,p,i [|n, p, i〉]√∑

k |cn,p,k|2

A |ψn,p〉 = an |ψn,p〉y similarmente para B

B |ψn,p〉 = bp |ψn,p〉Por tanto, si midieramos de nuevo A (nuevamente los tiempos deben ser cortos para que el estado no hayaevolucionado significativamente a partir del estado descrito por la Ec. 5.17) la probabilidad de obtener el resultadoan es 1 y no se altera el estado del sistema. Igualmente si medimos B con el sistema en el estado |ψn,p〉 laprobabilidad de obtener bp es 1 y el estado permanece inalterado despues de la medicion.

Volvamos ahora al estado inicial |ψ〉 del sistema y hagamos las mediciones en el orden contrario (primeroB y luego A). Evaluaremos la probabilidad de obtener el valor bp en la primera medida y el valor an en lasegunda medida que denotamos como P (bp, an), siguiendo los mismos razonamientos del caso anterior vemos quela probabilidad de obtener bp en la primera medida es

P (bp) =∑

n′,i′

∣∣cn′,p,i′∣∣2

y si el valor bp es obtenido, el estado despues de la medicion sera

|ϕp〉 =1√∑

uv |cu,p,v|2∑

n′,i′cn′,p,i′

∣∣n′, p, i′⟩

Page 213: Mecanica Cuantica: Notas de Clase

5.2. OBSERVABLES COMPATIBLES 213

y la probabilidad de que partiendo del estado |ϕp〉 se obtenga el valor an del observable A en la segunda medidaes

Pbp (an) =1∑

uv |cu,p,v|2∑

i

|cn,p,i|2

adicionalmente la probabilidad de que ocurran ambos eventos en este orden sera

P (bp, an) = P (bp)× Pbp (an)

P (bp, an) =∑

i

|cn,p,i|2 (5.18)

si de hecho encontramos bp en la primera medida y an en la segunda, el estado del sistema despues de la segundamedida sera

|ϕp,n〉 =1√∑

k |cn,p,k|2∑

i

cn,p,i |n, p, i〉 (5.19)

comparando la Ec. (5.13) con la Ec. (5.18) vemos que la probabilidad de obtener un par especıfico de valores(an, bp) de los observables A y B respectivamente, es igual sin importar el orden en que se midan (siempre teniendoen cuenta que la distancia temporal entre dos medidas debe ser pequena para evitar la evolucion del sistema).Adicionalmente, al comparar (5.17) con (5.19) vemos que el estado despues de la segunda medida tambien es elmismo en ambos casos. Finalmente, una medida posterior de A o B nos dara con certeza los valores an o bp.

Notese que estos hechos dependen de que podamos encontrar un conjunto completo comun de vectores propiospara ambos observables, para lo cual es necesario y suficiente que ambos observables conmuten (teorema 1.69).Por esta razon a los observables conmutantes tambien se les denomina observables compatibles.

Podemos resumir las propiedades de los observables compatibles de la siguiente manera: Cuando dos observablesA y B son compatibles, si medimos primero A entonces la medida posterior de B no causa ninguna perdida deinformacion previamente obtenida en la medida de A y viceversa. Por el contrario, la medida de B se “adiciona”como informacion a lo que se obtiene en la primera medida. Ademas la realizacion de las dos medidas ejecutadasen cualquier orden arroja la misma distribucion de probabilidad para cada par accesible de valores propios. Ahorasupongamos que se realizan dos experimentos ambos con el mismo estado inicial, midiendo en el primero lasecuencia A ⇒ B y en el segundo la secuencia B ⇒ A, si en ambos experimentos se obtienen los mismos valorespropios, entonces obtendremos el mismo estado final.

Vale decir que si en un experimento particular en el orden A ⇒ B se obtuvo (an, bp), no quiere decir queen otro experimento especıfico con las mismas condiciones iniciales y en el orden B ⇒ A se obtenga (bp, an), yaque lo que se igualan son las probabilidades2. Adicionalmente, tampoco tenemos que llegar al mismo estado finalen ambos experimentos, solo tenemos garantizado que si en ambos experimentos obtenemos los mismos valorespropios, el estado final sera el mismo.

Ahora bien, puesto que no es relevante el orden en que se ejecutan las medidas de A y B podemos considerarla medicion simultanea de ambos observables. Notese que para observables compatibles se puede hacer una especiede “extension” de los postulados cuarto y quinto como se puede apreciar de las Ecs. (5.13, 5.18) y de las Ecs.(5.17, 5.19). De estas ecuaciones se observa que podemos considerar a la dupla (an, bp) como un solo resultadoque corresponde a la superposicion de vectores ortonormales |n, p, i〉 donde i indica la degeneracion asociada al“unico valor propio” cnp ≡ (an, bp).

Un aspecto importante cuando se realizan medidas sucesivas de observables compatibles es que la adicion deinformacion que se obtiene luego de cada medida, conduce a una reduccion “acumulativa” del paquete de ondascuando este paquete se define con respecto a kets propios comunes a todos los observables3. Esto se puede observar

2Es decir el patron de distribucion de valores propios en ambos casos debe ser el mismo cuando se hace una gran cantidad deexperimentos de cada tipo.

3Es esencial comprender que la definicion de paquete de ondas en el presente contexto, depende de una base especıfica. Por ejemplo, siel estado de un sistema en un instante dado es |ψk〉 donde este es un ket propio de A, entonces el paquete asociado sera “monocromatico”si lo referimos a una base de kets propios de A en donde |ψk〉 hace parte de la base. No obstante, si el paquete lo definimos eligiendouna base asociada a kets propios de otro observable B, entonces |ψk〉 sera una superposicion “policromatica” con respecto a dicha base.

Page 214: Mecanica Cuantica: Notas de Clase

214 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

si comparamos al estado |ψ〉 en la Ec. (5.8) (antes de la medida de A) con el estado |ψn〉 en la Ec. (5.10) (posteriora la medida de A) y luego con el estado |ψn,p〉 en la Ec. (5.17) (despues de la medida de A y B). Es decir, que almedir sucesivamente observables compatibles A1, A2, . . . , Am el paquete de onda despues de medir el observableAi es un subconjunto propio del paquete justo antes de dicha medicion. En principio, la reduccion del paquetesera maxima cuando el conjunto de observables compatibles forme un C.S.C.O. volveremos sobre este punto en laseccion 5.5.

5.3. Observables no compatibles e incertidumbres

Segun el teorema 1.69 si A y B no conmutan, no existe un conjunto completo de vectores propios comunesa ambos observables4. Por tanto, los argumentos anteriores no seran validos. Esto se puede ilustrar de manerasencilla si reemplazamos el espacio de Hilbert E por el espacio vectorial real de dos dimensiones. Supongamos que|u1〉 , |u2〉 son autovectores ortonormales del observable A (que definen a los ejes X,Y ) con autovalores a1 y a2.Sean |v1〉 , |v2〉 autovectores ortonormales de B (que definen ejes X ′Y ′ en general rotados con respecto a XY ),con valores propios b1 y b2. Si definimos θ el angulo de rotacion (en direccion antihoraria) de los ejes X ′Y ′ conrespecto a los ejes XY tenemos que las bases correspondientes a los autovectores de A y B estan relacionadas por

|v1〉 = cos θ |u1〉+ sin θ |u2〉|v2〉 = cos

(θ +

π

2

)|u1〉+ sin

(θ +

π

2

)|u2〉 = − sin θ |u1〉+ cos θ |u2〉

en resumen estas relaciones y sus inversas quedan

|v1〉 = cos θ |u1〉+ sin θ |u2〉 ; |v2〉 = − sin θ |u1〉+ cos θ |u2〉|u1〉 = cos θ |v1〉 − sin θ |v2〉 ; |u2〉 = sin θ |v1〉+ cos θ |v2〉

ahora pensemos que la condicion inicial esta dada por un vector unitario |ψ〉 en direccion arbitraria que hace unangulo ϕ con |u1〉. En ambas bases este vector se escribe

|ψ〉 = cosϕ |u1〉+ sinϕ |u2〉 ; |ψ〉 = cos (ϕ− θ) |v1〉+ sin (ϕ− θ) |v2〉

Primero mediremos A y asumamos que encontramos el valor a1, el sistema quedara preparado en el estado |u1〉.Si luego medimos B y encontramos por ejemplo b2 el estado final del sistema sera |v2〉.

|ψ〉 (a1)=⇒ |u1〉

(b2)=⇒ |v2〉 (5.20)

si por otro lado, realizamos las medidas en el orden opuesto y encontramos los mismos valores propios anteriorespero en la secuencia b2 ⇒ a1 el esquema sera

|ψ〉 (b2)=⇒ |v2〉

(a1)=⇒ |u1〉 (5.21)

el estado final del sistema no es el mismo en ambos casos. Ahora, las probabilidades en ambos casos serıan

P (a1, b2) = P (a1)× Pa1 (b2) = |〈ψ| u1〉|2 × |〈u1| v2〉|2

P (b2, a1) = P (b2)× Pb2 (a1) = |〈ψ| v2〉|2 × |〈v2| u1〉|2

cada uno de estos productos internos da

〈ψ| u1〉 = cosϕ ; 〈ψ| v2〉 = sin (ϕ− θ) ; 〈u1| v2〉 = 〈v2|u1〉 = − sin θ

4Esto no significa que no puedan existir vectores propios comunes a ambos. Pero si estos existen, no seran suficientes para conformaruna base.

Page 215: Mecanica Cuantica: Notas de Clase

5.4. DESVIACION MEDIA CUADRATICA Y PRINCIPIO DE INCERTIDUMBRE 215

por lo tantoP (a1, b2) = cos2 ϕ sin2 θ ; P (b2, a1) = sin2 (ϕ− θ) sin2 θ

con lo cual se observa queP (b2, a1) 6= P (a1, b2)

esto significa entonces que dos observables no compatibles no se pueden medir simultaneamente5. Se puede verde las Ecs. (5.20, 5.21) que la segunda medida genera la perdida de la informacion suministrada por la primera.Si por ejemplo despues de la secuencia A ⇒ B representada por (5.20) medimos de nuevo A, no podemos tenercerteza del resultado ya que |v2〉 no es autovector de A. Toda la informacion que se gano en la primera medidade A se ha perdido al ejecutar la posterior medicion de B.

Es claro de los postulados que si definimos un paquete de ondas con respecto a una base generada por Aentonces la medida de A conduce a una reduccion de este paquete, algo similar ocurre con el observable B. Sinembargo, no podemos construır una base fija en donde el paquete se reduzca acumulativamente con respecto a dichabase cuando se miden sucesivamente A y B. Esto se debe a la ausencia de una base comun, que en terminos masfısicos implicarıa la posibilidad de adicionar informacion en cada medida con respecto a la informacion obtenidaen la medida anterior.

5.4. La desviacion media cuadratica y el principio de incertidumbre para

observables arbitrarios (opcional)

Supongamos que tenemos dos observables A y B arbitrarios, siguiendo los argumentos de la seccion 5.1.3,definiremos el valor esperado de su conmutador en la forma

iM ≡ 〈[A,B]〉 (5.22)

donde M es un numero real. Asumamos que el sistema fısico esta en el estado |ψ〉. Con base en dicho estado,construiremos un ket |ϕ〉 y su bra asociado 〈ϕ| en la forma

|ϕ〉 = (A+ iλB) |ψ〉 ; 〈ϕ| = 〈ψ| (A− iλB) (5.23)

siendo λ una variable real arbitraria. Estudiaremos las predicciones para el producto de las incertidumbres ∆A, ∆Bdonde las incertidumbres se definiran a traves de la raız de la desviacion media cuadratica de cada observable.

La norma al cuadrado de |ϕ〉 se escribe como

〈ϕ|ϕ〉 = 〈ψ| (A− iλB) (A+ iλB) |ψ〉 = 〈ψ|A2 + iλAB − iλBA+ λ2B2

|ψ〉

〈ϕ|ϕ〉 =⟨A2⟩+ iλ 〈AB −BA〉+ λ2

⟨B2⟩= λ2

⟨B2⟩+ iλ 〈[A,B]〉+

⟨A2⟩

〈ϕ|ϕ〉 = λ2⟨B2⟩− λM +

⟨A2⟩≥ 0 (5.24)

donde hemos usado la Ec. (5.22). Ahora bien, por definicion la norma al cuadrado de |ϕ〉 es no negativa para todovalor de λ. Por tanto, el polinomio cuadratico en λ definido por la ecuacion (5.24) debe ser no negativo para todoλ, esto solo es posible si tal polinomio no posee raıces reales en λ o a lo mas las raıces reales deben ser degeneradasy corresponder a un mınimo local (en cuyo caso la norma de |ϕ〉 es cero para un valor dado de λ, y positiva paralos otros valores). Esto implica que como ecuacion cuadratica para λ, el discriminante deber ser negativo o cero

M2 − 4⟨A2⟩ ⟨B2⟩

≤ 0 ⇒ (5.25)

⟨A2⟩ ⟨B2⟩

≥ M2

4(5.26)

5Supongamos que medimos un observable A en el tiempo t y otro observable B en el tiempo t + ∆t. La medicion simultanea sepuede definir consistentemente solo si los “lımites laterales” ∆t→ 0+ (donde se mide en el orden A ⇒ B) y ∆t→ 0− (donde se mideen el orden B ⇒ A) conducen a las mismas predicciones en terminos de distribucion de probabilidad, y estados. Por esta razon solo sepuede definir adecuadamente la medicion simultanea de observables compatibles.

Page 216: Mecanica Cuantica: Notas de Clase

216 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

recordando que |ψ〉 describe el estado del sistema, introducimos dos nuevos observables A′, B′ definidos por

A′ = A− 〈A〉 I = A− 〈ψ|A |ψ〉 (5.27)

B′ = B − 〈B〉 I = B − 〈ψ|B |ψ〉 (5.28)

donde 〈A〉 y 〈B〉 son numeros reales e I es el operador identidad. Es claro que las relaciones de conmutacion deA′, B′ coinciden con las de A y B [

A′, B′] = [A,B] = iM (5.29)

con lo cual el resultado (5.26) tambien es valido para A′ y B′

⟨A′2⟩ ⟨B′2⟩ ≥ M2

4⇒

⟨(A− 〈A〉)2

⟩⟨(B − 〈B〉)2

⟩≥ M2

4

y teniendo en cuenta la definicion de la raız de la deviacion media cuadratica Ec. (5.6), tenemos que

(∆A)2 (∆B)2 ≥ M2

4⇒

(∆A) · (∆B) ≥ |M |2

y recordando la definicion (5.22) resulta

(∆A) · (∆B) ≥ |〈[A,B]〉|2

(5.30)

Si definimos la incertidumbre en los observables como la raız de la desviacion media cuadratica de su distri-bucion, esto se puede considerar como una extension del principio de incertidumbre. Notese que en este caso ellımite inferior esta muy bien definido, precisamente porque hemos definido de manera muy clara el ancho de ladistribucion por medio de la raız de la desviacion media cuadratica.

Vale decir ademas que solo tendremos un lımite inferior no nulo, cuando los observables NO son compatibles(no conmutantes). Para los observables compatibles no hay un principio de incertidumbre, lo que permite sinambiguedad su medicion simultanea y la no destruccion de la informacion por efecto de mediciones adicionales.

Un caso especial muy importante es el de dos variable conjugadas. Se dice que dos observables Q, P sonconjugados si

[Q,P ] = i~

esta es una extrapolacion natural del concepto de variables canonicamente conjugadas en mecanica clasica, quecumplen propiedades similares pero con los corchetes de Poisson en lugar de los conmutadores. Para observablesconjugados, la expresion (5.30) queda en la forma

∆Q ·∆P ≥ ~/2

A su vez, un caso especial de variables conjugadas son los pares de posicion y momento (X,Px), (Y, Py) y(Z,Pz). Se obtiene entonces

∆X ·∆Px ≥ ~/2 ; ∆Y ·∆Py ≥ ~/2 ; ∆Z ·∆Pz ≥ ~/2

que son las relaciones de incertidumbre de Heisenberg (2.73), pero con lımites inferiores precisos, lo cual surge dehaber definido de manera precisa las incertidumbres.

Page 217: Mecanica Cuantica: Notas de Clase

5.4. DESVIACION MEDIA CUADRATICA Y PRINCIPIO DE INCERTIDUMBRE 217

5.4.1. Paquetes de mınima incertidumbre

Es natural preguntarse por las condiciones que se requieren para obtener un paquete de mınima incertidumbre.Es decir, bajo que condiciones obtenemos la igualdad en la Ec. (5.30). Esto implica imponer la igualdad en lasdesigualdades (5.24-5.30). En particular, esto implica que el polinomio cuadratico en λ definido por la ecuacion(5.24) sea nulo y corresponda a un mınimo local para algun valor λ0 (raız real degenerada), esto conlleva a lanulidad de la norma de |ϕ〉. Lo anterior se obtiene con la anulacion del discriminante Ec. (5.25)

⟨A2⟩ ⟨B2⟩=M2

4⇒

⟨A2⟩=

M2

4 〈B2〉 (5.31)

usando la Ec. (5.31), llegamos a una solucion unica λ ≡ λ0 para la cuadratica (5.24)

λ0 =M

2 〈B2〉 =2⟨A2⟩

M(5.32)

Redefiniendo los observables a traves de las Ecs. (5.27, 5.28) y teniendo en cuenta la invarianza del conmutadorEc. (5.29) vemos que los resultados obtenidos para A y B son tambien validos para A′ y B′ (ya que todos ellosdependen solo de la relacion de conmutacion Ec. 5.22). Por tanto para el ket

∣∣ϕ′⟩ =(A′ + iλB′) |ψ〉 ;

⟨ϕ′∣∣ = 〈ψ|

(A′ − iλB′)

podemos hacer el mismo procedimiento que se realizo para el ket |ϕ〉 de la Ec. (5.23), y llegar a que la norma de|ϕ′〉 es nula cuando λ = λ0. Pero la norma es cero si y solo si el ket es nulo, por lo tanto

∣∣ϕ′⟩ ≡(A′ + iλB′) |ψ〉 = 0 ⇒

[A− 〈A〉+ iλ0 (B − 〈B〉)] |ψ〉 = 0 (5.33)

ası mismo las Ecs. (5.31, 5.32) son aplicables tambien para A′, B′ con lo cual

⟨A′2⟩ = M2

4 〈B′2〉 ; λ0 =M

2 〈B′2〉 =2⟨A′2⟩

M(5.34)

y teniendo en cuenta que

⟨A′2⟩ ≡

⟨(A− 〈A〉)2

⟩≡ (∆A)2 ;

⟨B′2⟩ ≡

⟨(B − 〈B〉)2

⟩≡ (∆B)2

las Ecs. (5.34) quedan finalmente

(∆A)2 =M2

4 (∆B)2; λ0 =

M

2 (∆B)2=

2 (∆A)2

M(5.35)

la Ec. (5.33) junto con las ligaduras (5.35) nos dictaminan la condicion para obtener paquetes de mınima incerti-dumbre. Su solucion explıcita debe realizarse en una base especıfica y depende de la naturaleza de los operadoresA y B.

Un caso particular de interes surge para variables conjugadas para lo cual definimos A ≡ Q, B ≡ P y M ≡ ~.La Ec. (5.33) y las ligaduras (5.35) quedan en la forma

[Q− 〈Q〉+ iλ0 (P − 〈P 〉)] |ψ〉 = 0 ; (∆Q)2 =~2

4 (∆P )2; λ0 =

~

2 (∆P )2=

2 (∆Q)2

~(5.36)

Page 218: Mecanica Cuantica: Notas de Clase

218 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

usando la representacion |q〉 y el hecho de que en esta representacion P actua como (~/i)d/dq (ver Ec. 1.214,Pag. 106) se obtiene6

〈q| [Q− 〈Q〉+ iλ0 (P − 〈P 〉)] |ψ〉 = 0 ⇒[q − 〈Q〉+ iλ0

(~

i

d

dq− 〈P 〉

)]〈q |ψ〉 = 0 ⇒

[q + ~λ0

d

dq− 〈Q〉 − iλ0 〈P 〉

]ψ (q) = 0 (5.37)

para resolver la ecuacion diferencial (5.37) es conveniente introducir la funcion h (q) definida por

ψ (q) = ei〈P 〉q/~h (q − 〈Q〉) (5.38)

insertando la Ec. (5.38) en la Ec. (5.37) resulta[q + ~λ0

d

dq− 〈Q〉 − iλ0 〈P 〉

] [ei〈P 〉q/~h (q − 〈Q〉)

]= 0

[q − 〈Q〉 − iλ0 〈P 〉] ei〈P 〉q/~h (q − 〈Q〉) + ~λ0d

dq

[ei〈P 〉q/~h (q − 〈Q〉)

]= 0

[q − 〈Q〉 − iλ0 〈P 〉] ei〈P 〉q/~h (q − 〈Q〉) + ~λ0i 〈P 〉~

h (q − 〈Q〉) ei〈P 〉q/~ + ~λ0ei〈P 〉q/~ d

dqh (q − 〈Q〉) = 0

[q − 〈Q〉]h (q − 〈Q〉) + ~λ0d

dqh (q − 〈Q〉) = 0

sustituyendoq′ = q − 〈Q〉 (5.39)

queda [q′ + ~λ0

d

dq′

]h(q′)= 0 (5.40)

cuya solucion es

h(q′)= Ce

− q′22λ0~ (5.41)

siendo C una constante de normalizacion que elegiremos como positiva. Reemplazando las Ecs. (5.36, 5.39) en lasolucion (5.41), tenemos

h (q − 〈Q〉) = Ce− (q−〈Q〉)2

4(∆Q)2 = Ce−[(q−〈Q〉)2(∆Q)

]2(5.42)

finalmente reemplazando (5.42) en (5.38) y normalizando (con constante positiva) resulta

ψ (q) =1

4

√2π (∆Q)2

ei〈P 〉q/~e−[(q−〈Q〉)2(∆Q)

]2(5.43)

para encontrar el paquete de onda recıproco, es decir en la base |p〉, podemos proceder de manera analoga aldesarrollo anterior, o haciendo la transformada de Fourier de la Ec. (5.43). En tal caso se encuentra la funcion deonda recıproca ψ (p) definida por

ψ (p) =1

4

√2π (∆P )2

e−i~〈Q〉pe

−[(q−〈P 〉)2(∆P )

]2(5.44)

En la Sec. 2.14.3, pag. 151, habıamos demostrado que los paquetes gaussianos son de mınima incertidumbrepara un par de observables conjugados. En la presente seccion hemos demostrado el recıproco: para dos observablesconjugados Q y P , hemos demostrado que si ∆Q ·∆P es exactamente ~/2, la funcion de onda asociada con esteestado en la representacion |q〉 es un paquete gaussiano ası como la representacion de la funcion de onda en labase |p〉.

6Debe tenerse en cuenta que la Ec. (1.214) fue demostrada para cualquier par de observables conjugados y no solo para posicionesy momentos.

Page 219: Mecanica Cuantica: Notas de Clase

5.5. PREPARACION DE UN ESTADO 219

5.5. Preparacion de un estado

Consideremos un sistema fısico en el estado |ψ〉 dado por

|ψ〉 =∑

k

gn∑

i=1

cik∣∣uik⟩

siendo∣∣uik

⟩autoestados del observable A. Asumiremos que todos los observables tienen espectro discreto. Si

medimos el observable A y el valor obtenido an es no degenerado, el autovector normalizado |un〉 en que se preparael sistema es fısicamente unico, por tanto conocemos perfectamente el estado despues de la medida, y ademas dichoestado es independiente de |ψ〉 (el estado justo antes de la medida).

Sin embargo, si el autovalor an es degenerado, el estado inmediatamente despues de la medida sera

∣∣ψ′n

⟩=

Pn |ψ〉〈ψ|Pn |ψ〉

=1√∑gn

m=1 |cmn |2

gn∑

i=1

cin∣∣uin⟩

tanto los valores absolutos de los coeficientes cin como sus fases son relevantes. Y puesto que este estado esla proyeccion |ψ′

n〉 (normalizada) del vector |ψ〉 sobre el autosubespacio En tendremos que el autoestado finaldepende de |ψ〉 y por lo tanto tambien los coeficientes cin siempre que En sea de mas de una dimension (si En esde una sola dimension, solo hay un vector normalizado fısicamente relevante).

Ahora bien, dado que vimos que la medicion de otro observable B compatible con A adiciona informacionsobre el estado, y se puede medir simultaneamente con A, vemos que si el resultado (an, bp) de las dos medidascorresponde a un unico autovector |an, bp〉 ≡ |n, p〉 comun a A y B no tendremos suma sobre i en (5.17) y resulta

|ψnp〉 =cnp|cnp|

|n, p〉 = eiθ |n, p〉

que es fısicamente equivalente a |n, p〉. En otras palabras, el autoespacio Enp de autovectores comunes a A y Bcon valores propios an y bp es de una dimension y por tanto define fısicamente un unico vector normalizado. Portanto, la especificacion de estos dos valores determina el estado final de manera unica e independiente de |ψ〉.

Podrıa ocurrir sin embargo que existan varios vectores |n, p, i〉 linealmente independientes que conduzcan almismo par (an, bp) de valores propios de A y B, es decir el espacio Enp no es unidimensional y para determinar laproyeccion de |ψ〉 sobre Enp se requiere conocer a |ψ〉. En este caso podemos ganar mas informacion introduciendoun tercer observable C compatible con los otros dos y medir su valor propio cq. El proceso debe continuar hastaque se remueva completamente la degeneracion es decir cuando el autoespacio Enpq... sea unidimensional, en cuyocaso el estado |npq . . .〉 es fısicamente unico.

Por otro lado, es posible que la medicion de cierto conjunto de autovalores especıficos sea suficiente paradeterminar el estado de manera unica, pero cuando el mismo sistema me arroja otros valores propios las medidaspodrıan resultar insuficientes. Por ejemplo, si medimos el observable A y se obtiene el valor no degenerado a1, elestado estara totalmente determinado. Pero si la medida nos arroja el valor a2 (degenerado), necesitaremos medirotro observable compatible para determinar el estado.

La idea por supuesto es determinar un conjunto de observables A1, A2, . . . , Am; que determine de maneraunica el estado despues de la medida (independiente de |ψ〉) sin importar los valores experimentales obtenidos.Para ello es necesario que todos los autoespacios de la forma En1,n2,...,nm sean unidimensionales. En otras pala-bras, el conjunto completo de autovectores |n1, n2, . . . , nm〉 comun a los observables A1, A2, . . . , Am no debepresentar degeneracion para ningun conjunto posible de medidas (an1 , . . . , anm). Esto indica entonces que el con-junto A1, A2, . . . , Am forma un C.S.C.O. (ver seccion 1.23). Adicionalmente, es natural pensar que el conjuntoA1, A2, . . . , Am sea minimal en el sentido de que al remover un observable del conjunto el sistema ya no sea unC.S.C.O. Usualmente se asume que un C.S.C.O. dado es minimal a menos que se indique lo contrario.

Page 220: Mecanica Cuantica: Notas de Clase

220 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

Los metodos para preparar un sistema cuantico en un estado bien definido son similares en principio a los quese usan para polarizar luz. Cuando se coloca un polarizador en el camino de un haz de luz, la luz que sale estapolarizada en una direccion especıfica caracterıstica del polarizador, e independiente del estado de polarizacion dela luz incidente. Similarmente se pueden construır dispositivos para preparar un sistema cuantico de manera quesolo permitan el paso de un estado correspondiente a un autovalor especıfico. Si queremos preparar completamenteel estado, sera necesario usar m dispositivos que midan a los observables A1, .., Am que solo permitan el paso deun conjunto especıfico de autovalores (an1 , ..., anm).

Es claro que puede haber infinidad de C.S.C.O, si cambiamos el conjunto completo de observables compatibles,obtendremos otros estados del sistema. Para entender mejor esto, recordemos que los autoestados estan definidosno solo por el sistema a estudiar sino tambien por los aparatos de medicion (ver seccion 2.9, pag 135).

5.6. Propiedades adicionales de la ecuacion de Schrodinger

Hemos establecido formalmente en el sexto postulado, que la ecuacion de Schrodinger es la ecuacion de evolucionde los estados de sistemas cuanticos no relativistas. Veremos algunas propiedades adicionales de esta ecuacion (verseccion 3.3)

5.6.1. Aspectos adicionales sobre la conservacion de la probabilidad (opcional)

Hemos visto que la norma de los estados permanece invariante en el tiempo cuando la ecuacion de Schrodingeres la ecuacion de evolucion, lo cual es esencial para la conservacion de la probabilidad. Adicionalmente para unapartıcula sometida a un potencial que solo depende de la posicion V (r, t) cuyo Hamiltoniano es

H =P2

2m+ V (R, t)

podemos encontrar una ecuacion de continuidad que nos expresa la conservacion local de la probabilidad en laforma

∂ρ

∂t+∇ · J = 0 ; ρ ≡ ψψ∗ = |ψ (r, t)|2 (5.45)

J ≡ ~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

1

mRe

[ψ∗(~

i∇ψ)]

(5.46)

siendo ρ, J la densidad y corriente de probabilidad respectivamente. Escribamos J en la forma

J ≡ 1

2m

[ψ∗(~

i∇)ψ − ψ

(~

i∇)ψ∗]=

1

2m

[ψ∗(~

i∇)ψ − ψ

(−~

i∇ψ)∗]

=1

2m

[〈ψ| r〉

(~

i∇)〈r|ψ〉+ 〈r|ψ〉

(~

i∇〈r|ψ〉

)∗]

J =1

2m[〈ψ| r〉 〈r|P |ψ〉+ 〈r|ψ〉 〈r|P |ψ〉∗] = 1

2m[〈ψ| r〉 〈r|P |ψ〉+ 〈ψ|P |r〉 〈r|ψ〉]

J =1

2m〈ψ| [|r〉 〈r|P+P |r〉 〈r|] |ψ〉

donde hemos usado la Ec. (1.191). Finalmente

J = [〈ψ| K (r) |ψ〉] ; K (r) ≡ 1

2

|r〉 〈r| P

m+

P

m|r〉 〈r|

(5.47)

para la densidad de corriente es mas facil ver que

ρ = [〈ψ| [|r〉 〈r|] |ψ〉] = 〈ψ| (r) |ψ〉 ; (r) ≡ |r〉 〈r| (5.48)

Page 221: Mecanica Cuantica: Notas de Clase

5.7. EVOLUCION TEMPORAL DEL VALOR ESPERADO DE UN OBSERVABLE 221

si comparamos las Ecs. (5.47, 5.48) con la Ec. (5.2), vemos que la densidad de probabilidad ρ y la densidad decorriente de probabilidad J, se pueden ver como el valor esperado de los operadores K (r) y (r) respectivamente.Ahora bien, en coordenadas cartesianas los momentos canonicos son los momentos lineales (cuando el potencialno depende de la velocidad). Por tanto, P/m se puede considerar el “operador velocidad” V. En consecuencia, el“operador densidad de corriente” K (r) esta relacionado con el operador densidad (r) en la forma

K (r) ≡ 1

2V + V

que corresponde a la cuantizacion de la relacion J =ρv, pero adecuadamente simetrizada.Si la partıcula se coloca en un campo electromagnetico descrito por los potenciales φ (r, t) y A (r, t) , el Ha-

miltoniano asociado es (ver Ec. 4.12)

H =[P− qA (R, t)]2

2m+ V (R, t) ; V (R, t) ≡ qφ (R, t) + V (R) (5.49)

donde V (R) es un potencial escalar que describe una interaccion adicional a la del campo electromagnetico sobrela partıcula. Con un procedimiento similar al de la seccion 3.3.4, la densidad de corriente resultante es

JEM =1

mRe

ψ∗[~

i∇− qA

(5.50)

que tambien se puede obtener de la corriente (5.46) simplemente reemplazando P → P− qA, o equivalentemente~i∇ → ~

i∇− qA (R, t).Un ejemplo sencillo para el calculo de ρ y J es la onda plana. Sea un estado (no estrictamente fısico) descrito

por una onda planaψ (r, t) = Aei(k·r−ωt)

la densidad de probabilidad es claramenteρ = ψψ∗ = |A|2

que es uniforme y constante. El calculo de J (r, t) es inmediato

J =1

mRe

[ψ∗(~

i∇ψ)]

=1

mRe

A∗e−i(k·r−ωt)

(~A

i∇ei(k·r−ωt)

)

J =1

mRe

A∗e−i(k·r−ωt)

(~A

iikei(k·r−ωt)

)=

1

mRe~ |A|2 k

J =~k

m|A|2 (5.51)

y recordando que vg = ~k/m es la velocidad de grupo asociada al momento ~k (seccion 2.13 Ec. 2.84). Vemosque esta corriente tambien es analoga a la relacion clasica J = ρv. La corriente generada por una onda plana esestacionaria (independiente del tiempo) y ademas es uniforme y homogenea.

5.7. Evolucion temporal del valor esperado de un observable y su relacioncon la mecanica clasica

Si A es un observable, su valor esperado cuando el sistema esta en el estado |ψ (t)〉 se escribe como

〈A〉 (t) = 〈ψ (t)|A |ψ (t)〉

Vale decir que el valor medio o esperado solo depende de t ya que por ejemplo si usamos la representacion de|r〉 este valor esperado corresponde a una integral sobre todo el espacio para un tiempo fijo. En contraste, el

Page 222: Mecanica Cuantica: Notas de Clase

222 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

observable clasico A (r,p, t) asume un valor para ciertas posiciones y momentos especıficos en un tiempo dado (yaque las partıculas estan localizadas y sus momentos se pueden medir simultaneamente junto con las posiciones).Para estos observables clasicos, la dependencia con el tiempo puede ser tanto explıcita como implıcita, es decir atraves de r (t) y p (t).

Cuando cuantizamos el observable asignamos a la cantidad clasica A (r,p, t) el operador hermıtico A ≡A (R,P, t). Observese que ni los autoestados ni los autovalores de los operadores R y P dependen del tiem-po, por tanto los observables cuanticos R y P no pueden dar cuenta de una dependencia implıcita con el tiempo.En conclusion, los observables cuanticos solo dependen del tiempo de manera explıcita. En cuanto al valor esperadodel observable, la variacion temporal de 〈A〉 se debe tanto a la variacion temporal del estado |ψ (t)〉 (dictaminadapor la ecuacion de Schrodinger), como a la variacion temporal del observable mismo A (t). Si usamos por ejemplola representacion de coordenadas, el valor esperado de A queda

〈A〉 = 〈ψ (t)|A (R,P, t) |ψ (t)〉 =∫d3r 〈ψ (t)| r〉 〈r|A (R,P, t) |ψ (t)〉 =

∫d3r ψ∗ (r, t) A

(r,

~

i∇, t

)ψ (r, t)

de lo cual es claro que esta cantidad solo depende del tiempo, ya que esta integrada sobre las variables espaciales.

Vamos a estudiar la variacion temporal del valor esperado de un observable arbitrario y a relacionarla con lavariacion temporal clasica. Derivando el valor esperado con respecto al tiempo resulta

d

dt〈ψ (t)|A |ψ (t)〉 =

[d

dt〈ψ (t)|

]A |ψ (t)〉+ 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉+ 〈ψ (t)|A

[d

dt|ψ (t)〉

]

donde hemos usado que dA/dt = ∂A/∂t ya que un observable cuantico solo puede depender del tiempo de maneraexplıcita. Usando las Ecs. (3.25, 3.26) tenemos

d

dt〈ψ (t)|A |ψ (t)〉 = 〈ψ (t)|

[− 1

i~H (t)

]A |ψ (t)〉+ 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉+ 〈ψ (t)|A

[1

i~H (t)

]|ψ (t)〉

d

dt〈ψ (t)|A |ψ (t)〉 =

1

i~〈ψ (t)| [AH −HA] |ψ (t)〉+ 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉

quedando finalmented

dt〈A〉 = 1

i~〈[A, H]〉+

⟨∂A

∂t

⟩(5.52)

vale recordar que en el formalismo clasico Hamiltoniano, un observable Acl que es funcion de las variables delespacio de fase y del tiempo es decir Acl = Acl (q,p, t), posee una evolucion temporal dada por

dAcldt

= [Acl,H]pois +∂Acl∂t

(5.53)

donde en lugar del conmutador, esta el corchete de Poisson entre el observable y el Hamiltoniano. Volviendo alproblema cuantico, veremos que el valor esperado (y no el operador A

(r, ~i∇, t

)) es el que debe ser comparado

con el correspondiente observable clasico.

5.7.1. Evolucion temporal de los valores esperados de R, P: Teorema de Ehrenfest

Dado que R, P son todos los observables fundamentales para la cuantizacion de una partıcula sin espın,es necesario explorar la evolucion temporal de sus valores esperados. Si bien estos observables no dependen deltiempo, sus valores esperados sı poseen una dependencia temporal proveniente de la evolucion del estado |ψ (t)〉.

Asumiendo un Hamiltoniano de la forma

H =P2

2m+ V (R) (5.54)

Page 223: Mecanica Cuantica: Notas de Clase

5.7. EVOLUCION TEMPORAL DEL VALOR ESPERADO DE UN OBSERVABLE 223

asignando A → R en la Ec. (5.52) y usando el Hamiltoniano (5.54) tenemos

d

dt〈R〉 = 1

i~

⟨[R,

P2

2m+ V (R)

]⟩+

⟨∂R

∂t

⟩=

1

i~

⟨[R,

P2

2m

]⟩+

1

i~〈[R, V (R)]〉

y usando las propiedades de los conmutadores (1.37-1.42) ası como las relaciones canonicas de conmutacion (4.11)obtenemos

d

dt〈R〉 = 1

2mi~〈[R, P]P〉+ 1

2mi~〈P [R, P]〉 =

⟨i~I

2mi~P

⟩+

⟨P

i~I

2mi~

quedando finalmented

dt〈R〉 = 1

m〈P〉

similarmente el valor esperado para P es

d

dt〈P〉 =

1

i~

⟨[P,

P2

2m+ V (R)

]⟩+

⟨∂P

∂t

⟩=

1

i~

⟨[P,

P2

2m

]⟩+

1

i~〈[P, V (R)]〉

d

dt〈P〉 =

1

i~〈[P, V (R)]〉

y usando la Ec. (1.141) pag. 77, se obtiene

[P, V (R)] = −i~∇V (R)

se obtienen entonces la relaciones fundamentales

d

dt〈R〉 = 1

m〈P〉 ;

d

dt〈P〉 = −〈∇V (R)〉 (5.55)

estas dos ecuaciones se conocen como teorema de Ehrenfest. Muy semejantes a las relaciones asociadas a suscorrespondientes observables clasicos.

En virtud de la similitud con las relaciones clasicas, es natural buscar el lımite clasico a traves del teoremade Ehrenfest Ecs. (5.55). La funcion de onda ψ (r, t) que describe el estado de una partıcula, es en general unpaquete de ondas. 〈R〉 representa tres coordenadas 〈Xi〉 que en general dependen del tiempo. Al punto definidopor 〈R〉 (t) en el instante t, lo llamaremos el centro del paquete de onda en tal instante. Notese que si el paquetees asimetrico el centro del paquete sera en general diferente del punto en donde la amplitud es maxima. Cuandomovemos el parametro tiempo el punto 〈R〉 (t) se mueve en el espacio generando la trayectoria del centro delpaquete. Por supuesto, esta trayectoria no se puede asociar a la partıcula cuyo estado esta descrito por el paquetecompleto que tiene una extension dada7. Sin embargo, si la extension del paquete de ondas es mucho menor quetodas las demas longitudes involucradas en el problema, podemos aproximar el paquete de ondas por su centro yla descripcion clasica resultara una buena aproximacion.

La pregunta natural es entonces si el movimiento del centro del paquete de onda obedece las leyes de lamecanica clasica. La respuesta yace en el teorema de Ehrenfest, la primera de las Ecs. (5.55) nos dice que lavelocidad del centro del paquete es igual al momento promedio del paquete dividido por m. Por tanto la segundade las Ecs. (5.55) se puede escribir como

md2 〈R〉dt2

= −〈∇V (R)〉

por tanto, el centro del paquete seguira una trayectoria clasica solo si la cantidad −〈∇V (R)〉 coincide con lafuerza clasica en el punto donde se ubica el centro del paquete

Fcl = [−∇V (r)]r=〈R〉

7Notese incluso que cada punto en esta trayectoria no necesariamente coincide con el punto de maxima densidad de probabilidaden cada instante.

Page 224: Mecanica Cuantica: Notas de Clase

224 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

debemos observar sin embargo que −〈∇V (R)〉 es en realidad el valor promedio de la fuerza sobre el paquetecompleto, que no necesariamente debe coincidir con su valor en el centro del paquete

〈∇V (R)〉 6= [∇V (r)]r=〈R〉 (5.56)

lo cual se puede expresar diciendo que el valor medio de una funcion no es en general igual al valor que tomacuando se evalua en el valor medio de la variable. Esto se puede ver con facilidad tomando un ejemplo especıfico,sea un potencial de la forma

V (x) = λxn (5.57)

siendo λ una constante real y n un entero positivo. La cuantizacion de este potencial nos lleva a

V (X) = λXn (5.58)

el lado izquierdo de (5.56) nos da

⟨d

dxV (X)

⟩=

⟨d

dx(λXn)

⟩= λn

⟨Xn−1

en tanto que el lado derecho de (5.56) es

[d

dxV (x)

]

x=〈X〉=

[d

dx(λxn)

]

x=〈X〉=[nλxn−1

]x=〈X〉 = λn 〈X〉n−1

y en general⟨Xn−1

⟩6= 〈X〉n−1. Por ejemplo, para n = 3 se tiene que

⟨X2⟩6= 〈X〉2 y la diferencia entre ambas es

proporcional a la raız de la desviacion media cuadratica definida en la Ec. (5.7).

Sin embargo, para n = 0 (partıcula libre), n = 1 (partıcula en un campo de fuerzas uniforme) y n = 2 (partıculaen un potencial parabolico i.e. un oscilador armonico), la igualdad sı se cumple y vemos que el centro del paquetede onda en estos casos obedece las leyes de la mecanica clasica.

Por otra parte, aunque los dos lados de (5.56) no son en general iguales, ocurre que en algunas circunstancias(escenarios semiclasicos) la diferencia entre ambos es despreciable, esto ocurre cuando el paquete de onda es losuficientemente localizado. Para verlo, escribamos el lado izquierdo de (5.56) en la base |r〉.

〈∇V (R)〉 =∫d3r ψ∗ (r, t) [∇V (r)] ψ (r, t) =

∫d3r |ψ (r, t)|2 ∇V (r) (5.59)

asumir el paquete muy localizado equivale a decir que |ψ (r, t)|2 es una distribucion que toma valores no desprecia-bles solo en cierto dominio cuyas dimensiones son mucho mas pequenas que las distancias sobre las cuales ∇V (r)varıa apreciablemente. Por tanto, en este dominio centrado alrededor de 〈R〉, la cantidad ∇V (r) es practicamenteconstante. En tal caso se puede reemplazar ∇V (r) en (5.59) por su valor en r = 〈R〉 y se puede sacar de la in-tegral en (5.59), y teniendo en cuenta que ψ (r, t) esta normalizada, se obtiene que para paquetes suficientementelocalizados tenemos que

〈∇V (R)〉 ∼= [∇V (r)]r=〈R〉 (5.60)

es claro en particular que en el lımite macroscopico en el cual las longitudes de onda de De Broglie son muchomenores que las distancias sobre las cuales los potenciales y sus gradientes varıan, los paquetes de onda puedenser lo suficientemente localizados para satisfacer la Ec. (5.60) y al mismo tiempo mantener un momento biendefinido. Este ultimo punto es muy importante, ya que no basta con que 〈R〉 se comporte de manera semejanteal valor clasico de posicion para llegar a un escenario clasico, pues un paquete muy localizado en 〈R〉 implica queel paquete de onda en el espacio de los momentos puede ser muy disperso, y tendrıamos que aunque 〈P〉 puedatener un comportamiento similar al valor clasico, la dispersion de 〈P〉 significara una incertidumbre enorme ensu medida lo cual nos aleja del escenario clasico. Por tanto, es necesario que los valores de ∆r y ∆p compatibles

Page 225: Mecanica Cuantica: Notas de Clase

5.8. ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 225

con el principio de incertidumbre sean mucho menores que todas las distancias y momentos involucrados en elproblema, situacion que en general se cumple en los sistemas macroscopicos.

Bajo las condiciones anteriores, el movimiento del paquete de onda es practicamente el de una partıcula clasicade masa m sometida al potencial V (r). Vemos como era de esperarse que la ecuacion de Schrodinger genera lassoluciones clasicas con ciertas condiciones lımite apropiadas que en particular son satisfechas por los sistemasmacroscopicos.

5.8. Soluciones de la ecuacion de Schrodinger para sistemas conservativos

En mecanica clasica, si el Hamiltoniano no depende explıcitamente del tiempo, es una constante de movimientoen virtud de que su derivada total coincide con su derivada parcial. Si ademas el Hamiltoniano coincide con laenergıa del sistema entonces la energıa total del sistema es constante en el tiempo y hablamos de un sistemaconservativo. Es natural entonces averiguar por las propiedades de un sistema conservativo cuando cuantizamosun Hamiltoniano que es clasicamente constante de movimiento y que corresponde a la energıa del sistema.

Consideremos en primer lugar la ecuacion de valores propios del Hamiltoniano

H |ϕn,τ 〉 = En |ϕn,τ 〉 (5.61)

asumiremos por simplicidad un espectro discreto. El ındice τ denota la degeneracion de los valores propios quepuede corresponder a varios ındices. Tales ındices nos fijaran los autovalores de observables que constituyen unC.S.C.O. junto con H. Puesto que H no depende explıcitamente del tiempo, los autovalores En y autovectores|ϕn,τ 〉 tampoco dependeran del tiempo.

Hemos visto para un caso especıfico de sistema conservativo (ver seccion 3.2) que la Ec. de Schrodinger sepuede solucionar a partir de este problema de valores propios. En este caso veremos que la Ec. (5.61) tambiense puede utilizar para resolver la ecuacion de Schrodinger. Teniendo en cuenta que H es observable, podemosexpandir la solucion de la Ec. de Schrodinger en terminos de la base |ϕn,τ 〉

|ψ (t)〉 =∑

n,τ

cn,τ (t) |ϕn,τ 〉 ; cn,τ (t) ≡ 〈ϕn,τ |ψ (t)〉 (5.62)

notese que toda la dependencia temporal de |ψ (t)〉 esta contenida en los cn,τ (t). Aplicando el bra 〈ϕn,τ | sobre laecuacion de Schrodinger y teniendo en cuenta que este bra no depende del tiempo

i~d

dt〈ϕn,τ |ψ (t)〉 = 〈ϕn,τ |H |ψ (t)〉 (5.63)

y dada la hermiticidad de H el hermıtico conjugado de (5.61) es

〈ϕn,τ |H = En 〈ϕn,τ | (5.64)

aplicando (5.64) y la segunda Ec. (5.62) en (5.63) se obtiene

i~d

dtcn,τ (t) = Encn,τ (t)

la cual se puede integrar directamente para obtener

cn,τ (t) = cn,τ (t0) e−iEn(t−t0)/~ (5.65)

por tanto, si H no depende del tiempo podemos encontrar a |ψ (t)〉 a partir de su valor inicial |ψ (t0)〉 en lasiguiente forma

Page 226: Mecanica Cuantica: Notas de Clase

226 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

(a) Expandimos el valor inicial del estado en la base de autoestados de H

|ψ (t0)〉 =∑

n

τ

cn,τ (t0) |ϕn,τ 〉 ; cn,τ (t0) ≡ 〈ϕn,τ |ψ (t0)〉 (5.66)

(b) En virtud de las Ecs. (5.62) y (5.65), multiplicamos cada sumando en la expansion (5.66) por la fasee−iEn(t−t0)/~, siendo En el autovalor asociado a los autoestados |ϕn,τ 〉

|ψ (t)〉 =∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉 (5.67)

para el caso de espectro contınuo se realiza un procedimiento analogo para obtener

|ψ (t)〉 =∑

τ

∫dE cτ (E, t0) e

−iE(t−t0)/~ |ϕE,τ 〉 (5.68)

o si la degeneracion τ tambien es contınua tenemos

|ψ (t)〉 =∫dτ

∫dE c (τ,E, t0) e

−iE(t−t0)/~ |ϕE,τ 〉

notese finalmente que los sumandos en (5.67) poseen fases diferentes para diferentes valores de n. Por tanto, dichasfases son fısicamente relevantes y producen fenomenos de interferencia.

5.8.1. Estados estacionarios

Un caso especial importante surge cuando el estado inicial del sistema |ψ (t0)〉 coincide con un ket propio deH. En tal caso la expansion (5.66) viene dada por autoestados de H asociados a un solo valor propio

|ψ (t0)〉 =∑

τ

cn,τ (t0) |ϕn,τ 〉 (5.69)

y dado que no hay suma sobre n, la Ec. (5.67) para el estado |ψ (t)〉 queda

|ψ (t)〉 = e−iEn(t−t0)/~∑

τ

cn,τ (t0) |ϕn,τ 〉 = e−iEn(t−t0)/~ |ψ (t0)〉

de modo que el estado inicial y el estado en cualquier tiempo solo difieren en una fase global fısicamente irrelevante.Por tanto, todas las propiedades fısicas de sistemas que estan inicialmente preparados en un autoestado de H,permanecen inalteradas en el tiempo. Por esta razon a los estados propios del Hamiltoniano se les denominaestados estacionarios.

De aquı surge ademas la manifestacion cuantica de la conservacion de la energıa para sistemas conservativos.Si en el tiempo t0 medimos la energıa de un sistema conservativo y encontramos el valor En, el sistema quedapreparado luego de la medicion en un autoestado de H dado por (5.69) con valor propio En. A partir de estemomento se puede aplicar la ecuacion de Schrodinger tomando este autoestado de H como estado inicial, perodado que dicho estado es estacionario, no se genera fısicamente evolucion temporal y para todo tiempo el estadocontinua siendo autoestado de H con energıa En. En consecuencia, una segunda medida de la energıa del sistemaen cualquier tiempo posterior nos dara el mismo valor de energıa En obtenido en la primera medicion.

Finalmente, vale la pena senalar que lo anterior nos conduce a que solo hay evolucion cuando la energıa enel estado inicial no esta bien definida (de manera que hay varias fases de la forma e−iEk(t−t0)/~). Esto nos llevaramas adelante a una relacion de incertidumbre entre el tiempo de evolucion y la energıa.

Page 227: Mecanica Cuantica: Notas de Clase

5.8. ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 227

5.8.2. Constantes de movimiento

La Ec. (5.52) nos dice que la cantidad 〈A〉 sera constante de movimiento si se cumplen las condiciones

∂A

∂t= 0 ; [A,H] = 0 (5.70)

aplicando estas condiciones en (5.52) se obtiene que

d 〈A〉dt

=d

dt〈ψ (t)|A |ψ (t)〉 = 0 (5.71)

para cualquier estado |ψ (t)〉 del sistema. Es claro que si se cumplen las condiciones (5.70) el valor medio de Asera constante de movimiento8. En consecuencia, definiremos por extension que un observable A es constantede movimiento si cumplen las condiciones (5.70). En palabras, un observable es constante de movimiento si nodepende explıcitamente del tiempo y conmuta con el Hamiltoniano. En particular si H no depende del tiempo(sistemas conservativos), H como tal es constante de movimiento.

Veremos que si A es constante de movimiento hay algunas consecuencias fısicas adicionales. En primer lugar,puesto que A y H son observables que conmutan, poseen un conjunto comun completo de kets propios

H |ϕn,p,τ 〉 = En |ϕn,p,τ 〉 ; A |ϕn,p,τ 〉 = ap |ϕn,p,τ 〉

de nuevo asumimos espectros discretos por simplicidad9. El ındice τ fija los valores propios de observables queforman un C.S.C.O. con H y A. Ahora bien, los kets |ϕn,p,τ 〉 son autoestados de H y por tanto son estadosestacionarios (siempre que H no dependa del tiempo). En consecuencia, si |ϕn,p,τ 〉 define el estado inicial delsistema, permanecera en este estado indefinidamente (excepto por una fase global irrelevante). No obstante, |ϕn,p,τ 〉tambien es ket propio deA. En consecuencia, cuandoA es una constante de movimiento yH no depende del tiempo,existen estados estacionarios |ϕn,p,τ 〉 del sistema fısico que permanecen para todo tiempo como autoestados de Acon el mismo autovalor ap. Por esta razon a los autovalores de A se les denomina numeros cuanticos buenos.Es claro que si |ϕn,p,τ 〉 es el estado inicial, el valor de la energıa y de ap seran siempre el mismo sin importarel tiempo en que se midan, el orden en que se midan (son observables compatibles), o cuantas veces se midan,ademas hay una certeza total en sus valores (ambas cantidades estan bien definidas y se conservan).

Ahora supongamos que el estado inicial no es del tipo |ϕn,p,τ 〉, sino un ket arbitrario |ψ (t0)〉. Veremos que siel sistema es conservativo, la probabilidad de encontrar un cierto valor ap es independiente del tiempo cuando semide la constante de movimiento A. Expandiendo |ψ (t0)〉 en la base |ϕn,p,τ 〉 se tiene

|ψ (t0)〉 =∑

n

p

τ

cn,p,τ (t0) |ϕn,p,τ 〉

y aplicando el procedimiento descrito por las Ecs. (5.66) y (5.67) se obtiene

|ψ (t)〉 =∑

n

p

τ

cn,p,τ (t) |ϕn,p,τ 〉 ; cn,p,τ (t) = cn,p,τ (t0) e−iEn(t−t0)/~

y usando el postulado de descomposicion espectral, la probabilidad P (ap, t) de obtener ap cuando A se mide sobre

8Si se pide⟨∂A∂t

⟩= 〈[A,H ]〉 = 0, entonces la Ec. (5.71) solo sera valida para un estado o estados especıficos |ψ (t)〉. La idea aquı es

estudiar constantes de movimiento inherentes al sistema y no a condiciones iniciales especıficas.9Si en lugar de la Ec. (5.70) asumimos la condicion mas debil ∂A

∂t+ [A,H ] = 0, tenemos que A no conmuta en general con H . Por

tanto, aunque tal condicion conduce a la conservacion de 〈A〉 Ec. (5.71), no conduce a la existencia de una base comun para A y H demodo que las consecuencias fısicas adicionales que discutiremos aquı, no son validas para esta condicion mas debil.

Page 228: Mecanica Cuantica: Notas de Clase

228 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

el sistema en el tiempo t (y por tanto en el estado |ψ (t)〉) esta dado por

P (ap, t) =∑

n,τ

|〈ϕn,p,τ |ψ (t)〉|2 =∑

n,τ

∣∣∣∣∣∣〈ϕn,p,τ |

n′p′τ ′cn′,p′,τ ′ (t)

∣∣ϕn′,p′,τ ′⟩∣∣∣∣∣∣

2

=∑

n,τ

∣∣∣∣∣∣∑

n′p′τ ′cn′,p′,τ ′ (t) 〈ϕn,p,τ

∣∣ϕn′,p′,τ ′⟩∣∣∣∣∣∣

2

=∑

n,τ

∣∣∣∣∣∣∑

n′p′τ ′cn′,p′,τ ′ (t) δn,n′δp,p′δτ,τ ′

∣∣∣∣∣∣

2

=∑

n

τ

|cn,p,τ (t)|2 =∑

n

τ

cn,p,τ (t) c∗n,p,τ (t)

P (ap, t) =∑

n

τ

cn,p,τ (t0) e−iEn(t−t0)/~ c∗n,p,τ (t0) e

iEn(t−t0)/~

cada fase se anula y se obtiene

P (ap, t) =∑

n

τ

|cn,p,τ (t0)|2 = P (ap, t0)

lo cual prueba la independencia con el tiempo de esta distribucion de probabilidad. En particular, si en t0 el sistemaesta en un autoestado de A con autovalor am, de modo que P (ak, t0) = δkm, esta probabilidad no evoluciona en eltiempo; por lo tanto, para cualquier instante se obtiene la misma medida am, y el estado del sistema en cualquiertiempo continua siendo autoestado de A con valor propio am.

5.8.3. Frecuencias de Bohr de un sistema y reglas de seleccion

Sea B un observable del sistema que estamos estudiando y que no necesariamente conmuta con H. La evoluciontemporal de 〈B〉 esta dada por la Ec. (5.52)

d

dt〈B〉 = 1

i~〈[B,H]〉+

⟨∂B

∂t

para un sistema conservativo el estado en cualquier instante vendra dado por (5.67), con lo cual podemos calcularel valor esperado de B cuando el sistema esta en el estado |ψ (t)〉. Para ello necesitamos el bra asociado a (5.67)el cual viene dado por

〈ψ (t)| =∑

n′

τ ′c∗n′,τ ′ (t0) e

iEn′ (t−t0)/~⟨ϕn′,τ ′

∣∣ (5.72)

usando (5.67, 5.72) el valor esperado de B resulta

〈ψ (t)|B |ψ (t)〉 =[∑

n′

τ ′c∗n′,τ ′ (t0) e

iEn′ (t−t0)/~⟨ϕn′,τ ′

∣∣]B

[∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉

]

〈B〉|ψ(t)〉 =∑

n′

τ ′

n

τ

c∗n′,τ ′ (t0) cn,τ (t0)⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 ei(En′−En)(t−t0)/~ (5.73)

asumiremos de aquı en adelante que B no depende explıcitamente del tiempo, en tal caso los elementos matriciales⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 son constantes. De esto y de la Ec. (5.73) se ve que la evolucion temporal de 〈B〉 (t) se debeexclusivamente a las fases, es decir a terminos oscilantes con frecuencias dadas por

νn′,n ≡ 1

|En′ − En|~

=|En′ − En|

h(5.74)

tales frecuencias son caracterısticas del sistema bajo estudio pero son independientes del observable B consideradoy de las condiciones iniciales del sistema (descritas por los coeficientes c∗n′,τ ′ (t0) cn,τ (t0) ), ya que solo dependende los valores propios de H.

Page 229: Mecanica Cuantica: Notas de Clase

5.8. ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 229

Las frecuencias νn′,n se denominan las frecuencias de Bohr del sistema. Por ejemplo, para un atomo los valoresesperados de todos los parametros atomicos (tales como momentos dipolares electricos y magneticos), oscilana las varias frecuencias de Bohr del atomo. Es razonable imaginar que estas frecuencias pueden ser absorbidaso emitidas por el atomo, lo cual nos permite entender intuitivamente la relacion de Bohr entre las diferentesfrecuencias absorbidas o emitidas y las diferencias en las energıas atomicas.

Puede verse de (5.73) que aunque las frecuencias involucradas en la evolucion temporal de 〈B〉 no dependende B, los pesos de cada frecuencia sı dependen de B a traves de los elementos matriciales

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉. Enparticular si hay elementos

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 que sean nulos, las correspondientes frecuencias vn′,n estaran ausentesde la expansion de 〈B〉 (t) sin importar cual sea el estado inicial del sistema. Este es el origen de las reglas deseleccion que nos indican las frecuencias que pueden ser emitidas o absorbidas bajo las condiciones dadas. Loselementos de matriz

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 nos dicen la importancia de cada frecuencia de Bohr.

De lo anterior vemos que el estudio de las reglas de seleccion proviene del calculo de los elementos no diagonales⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 de los diversos observables atomicos (o de cualquier otro sistema cuantico) tales como los dipoloselectricos y magneticos.

Por otro lado, la Ec. (5.73) muestra que el peso completo de cada frecuencia esta dado por el producto

W(n, n′

)=∑

τ

τ ′c∗n′,τ ′ (t0) cn,τ (t0)

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉

y por tanto tambien depende de las condiciones iniciales por medio de c∗n′,τ ′ (t0) cn,τ (t0). Vale la pena anotar

que si bien la nulidad de los elementos⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 conduce a la ausencia de una frecuencia de Bohr paracualquier estado inicial del sistema, tambien se puede dar la ausencia de una frecuencia por la nulidad del productoc∗n′,τ ′ (t0) cn,τ (t0), es decir por ciertas condiciones iniciales especıficas. En particular, si el estado inicial es unestado estacionario de energıa Ek la expansion de |ψ (t0)〉 solo contiene un valor de n (n = k) y el productoc∗n′,τ ′ (t0) cn,τ (t0) solo es no nulo para n = n′ = k, en este caso 〈B〉 no depende del tiempo y no hay frecuenciasde Bohr no triviales, notese que esta regla de seleccion se da por condiciones iniciales y se da para cualquierobservable B.

Es interesante ver que de la Ec. (5.73) tambien podemos verificar que el valor esperado de una constante demovimiento no depende del tiempo. Al ser B constante de movimiento, no depende explıcitamente del tiempo conlo cual la dependencia temporal de 〈B〉 recae exclusivamente en las fases que contienen la energıa en la Ec. (5.73).Ahora bien el teorema 1.68 (pag. 58) nos dice que dado que B conmuta con H (por ser constante de movimiento),si |ϕn,τ 〉 y

∣∣ϕn′,τ ′⟩corresponden a autovalores diferentes (En′ 6= En) entonces el producto

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 es cero.Por tanto para una constante de movimiento solo sobreviven los terminos con n = n′ para los cuales las fasesei(En′−En)(t−t0)/~ seran iguales a la unidad y no habra dependencia temporal.

5.8.4. Relacion de incertidumbre entre tiempo y energıa para sistemas conservativos

A continuacion veremos que los sistemas conservativos presentan la propiedad de que entre mayor sea laincertidumbre en la energıa, mas rapida es la evolucion temporal. Para ver esto, definimos ∆t como un intervalode tiempo caracterıstico al final del cual el sistema ha evolucionado de forma apreciable, y ∆E denotara laincertidumbre en la energıa.

Veamos primero el caso en el cual la energıa esta completamente definida, esto ocurre cuando el sistema estaen un autoestado de H, de modo que ∆E = 0. Hemos visto que este estado es estacionario y que por tanto noevoluciona, podemos considerar entonces que el tiempo para que el sistema evolucione apreciablemente es infinito,vemos entonces que cuando ∆E = 0 se tiene que ∆t→ ∞.

Ahora asumamos que el sistema en el estado inicial se encuentra en el estado |ψ (t0)〉 que es una superposicionde solo dos autoestados de H que denotamos por |ϕ1〉 , |ϕ2〉

|ψ (t0)〉 = c1 |ϕ1〉+ c2 |ϕ2〉 (5.75)

Page 230: Mecanica Cuantica: Notas de Clase

230 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

el estado en cualquier tiempo sera entonces

|ψ (t)〉 = c1e−E1(t−t0)/~ |ϕ1〉+ c2e

−E2(t−t0)/~ |ϕ2〉

si medimos la energıa encontramos E1 o E2. En consecuencia, la incertidumbre en la energıa es del orden de

∆E ∼= |E2 − E1|

ahora consideremos un observable arbitrario B que no conmuta con H. La probabilidad de encontrar en unamedida de B en el tiempo t el valor propio bm (que asumimos no degenerado por simplicidad) asociado con elautovector |um〉 nos da

P (bm, t) = |〈um |ψ (t)〉|2 = 〈um |ψ (t)〉 〈ψ (t) |um〉=

〈um|

[c1e

−E1(t−t0)/~ |ϕ1〉+ c2e−E2(t−t0)/~ |ϕ2〉

]

×[c∗1e

E1(t−t0)/~ 〈ϕ1|+ c∗2eE2(t−t0)/~ 〈ϕ2|

]|um〉

P (bm, t) =c1e

−E1(t−t0)/~ 〈um|ϕ1〉+ c2e−E2(t−t0)/~ 〈um|ϕ2〉

×c∗1e

E1(t−t0)/~ 〈ϕ1|um〉+ c∗2eE2(t−t0)/~ 〈ϕ2|um〉

= c1c∗1 〈um|ϕ1〉 〈ϕ1|um〉+ c2c

∗2 〈um|ϕ2〉 〈ϕ2|um〉

+c1c∗2e

−E1(t−t0)/~eE2(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉+ c2c∗1e

−E2(t−t0)/~eE1(t−t0)/~ 〈um|ϕ2〉 〈ϕ1|um〉

P (bm, t) = |c1|2 |〈um|ϕ1〉|2 + |c2|2 |〈um|ϕ2〉|2 + c1c∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉+[c1c

∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉]∗

P (bm, t) = |c1|2 |〈um|ϕ1〉|2 + |c2|2 |〈um|ϕ2〉|2 + 2Rec1c

∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2| um〉

(5.76)

notese que la interferencia esta dada por la diferencia entre las dos fases. Esta ecuacion muestra que la probabilidadoscila entre dos valores extremos, con una frecuencia de Bohr dada por

v21 =|E2 − E1|

h

vale la pena mencionar que el valor de esta frecuencia de Bohr no dependio del observable, sino de los valorespropios del Hamiltoniano. Sin embargo, la Ec. (5.76) nos muestra que el peso con el cual contribuye tal frecuenciadepende de las condiciones iniciales descritas por la Ec. (5.75), y del observable mismo a traves de |um〉 que es elvector propio de B asociado al valor propio bm, al cual se le esta calculado la probabilidad. El tiempo caracterısticode evolucion sera entonces un periodo de oscilacion de la probabilidad

∆t ∼= 1

ν21=

h

|E2 − E1|∼= h

∆E

con lo cual se obtiene la relacion

∆t ·∆E ∼= h (5.77)

Asumamos ahora que el espectro de H es contınuo y no degenerado. El estado inicial |ψ (t0)〉 se puede escribircomo

|ψ (t0)〉 =∫dE c (E) |ϕE〉

Page 231: Mecanica Cuantica: Notas de Clase

5.8. ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 231

siendo |ϕE〉 el ket propio deH con autovalor E. Asumamos que en una grafica de |c (E)|2 (densidad de probabilidadpara E) vs. E, la densidad de probabilidad solo es apreciable en un intervalo [E0 −∆E/2, E0 +∆E/2]. Lacantidad ∆E representa entonces la incertidumbre en la energıa del sistema (que depende del algoritmo paraelegir el ancho). El estado en un tiempo t se obtiene de (5.68)

|ψ (t)〉 =∫dE c (E) e−iE(t−t0)/~ |ϕE〉

la probabilidad de obtener bm cuando se mide el observable B (de espectro discreto) en el estado |ψ (t)〉 es

P (bm, t) = |〈um |ψ (t)〉|2 =∣∣∣∣∫dE c (E) e−iE(t−t0)/~〈um |ϕE〉

∣∣∣∣2

P (bm, t) ∼=∣∣∣∣∣

∫ E0+∆E/2

E0−∆E/2dE c (E) e−iE(t−t0)/~〈um |ϕE〉

∣∣∣∣∣

2

(5.78)

en general 〈um |ϕE〉 no varıa en forma rapida con E cuando E varıa alrededor de E0. Si ∆E es lo suficientementepequeno, la variacion de 〈um |ϕE〉 en la integral (5.78) se puede despreciar con respecto a la variacion de c (E).Con lo cual la integral (5.78) se puede aproximar a

P (bm, t) ∼= |〈um |ϕE0〉|2∣∣∣∣∣

∫ E0+∆E/2

E0−∆E/2dE c (E) e−iE(t−t0)/~

∣∣∣∣∣

2

cuando esta aproximacion es valida vemos que P (bm, t) es proporcional al cuadrado del modulo de la transformadade Fourier de c (E). Aplicando la propiedad de incertidumbre para la transformada de Fourier, vemos que el anchoen t de P (bm, t), es decir ∆t esta relacionado con el ancho ∆E de |c (E)|2 por medio de la relacion

∆E ·∆t & h

usualmente conocida como la cuarta relacion de incertidumbre de Heisenberg. Sin embargo, esta relacion esdiferente a la mostrada por las componentes de R y P ya que el tiempo es un parametro para el cual no existeun operador cuantico asociado, y las variables H y t no son canonicamente conjugadas. Adicionalmente, ∆t no esen realidad una incertidumbre en la medida del tiempo, sino un tiempo que caracteriza la “rapidez” con que elsistema fısico evoluciona.

A priori podrıa pensarse que la presencia de incertidumbre en la energıa para un sistema conservativo, entraen conflicto con la conservacion de la energıa. Debemos observar sin embargo, que el concepto de conservacion(o no conservacion) de una cantidad fısica involucra la comparacion entre dos o mas medidas de dicha cantidad.Si el estado inicial no es estacionario, entonces hay una incertidumbre en la energıa, tal incertidumbre persiste ypuede evolucionar en el tiempo mientras no se realice una medida. No obstante, cuando se realiza una medida dela energıa, el sistema queda preparado en un estado estacionario con energıa bien definida En, y ya se discutio quetoda medida posterior de la energıa dara el mismo valor En con toda certeza. Lo mismo ocurrira con cualquiercantidad posterior de medidas de este observable. Tenemos entonces un principio de conservacion puesto que elexperimento revela que para un sistema conservativo, las medidas de esta cantidad fısica en diferentes tiemposcoinciden siempre. Similar discusion se puede dar para la conservacion del momento u otra cantidad fısica.

5.8.5. Cuarta relacion de incertidumbre para un paquete de onda unidimensional

Veamos el caso de un paquete de ondas unidimensional. A la incertidumbre ∆p en el momento del paquete lepodemos asociar una incertidumbre en la energıa de la forma

∆E =dE

dp∆p ; E = ~ω ; p = ~k ⇒

∆E =dω

dk∆p = vg ∆p (5.79)

Page 232: Mecanica Cuantica: Notas de Clase

232 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

por otra parte, es razonable definir el tiempo caracterıstico de evolucion ∆t de un paquete de ondas viajerasunidimensional como el tiempo que le toma a este paquete de onda viajando a la velocidad vg para “pasar” unpunto fijo en el espacio, es decir para que haya recorrido una longitud igual a su extension espacial ∆x. Por tanto

∆t ∼= ∆x

vg(5.80)

y combinando las Ecs. (5.79, 5.80) resulta

∆E ·∆t ∼= ∆x ·∆p & ~

5.9. Consecuencias fısicas del principio de superposicion

El primer postulado nos dice que los estados accesibles de un sistema cuantico forman un espacio vectorialcompleto, lo cual implica que la superposicion lineal (incluso infinita) de estados fısicamente realizables tambiennos da un estado fısicamente realizable. Veremos las consecuencias fısicas de este primer postulado.

Hemos mencionado ya los efectos de interferencia que surgen de este primer postulado cuando se combina conlos demas, estos fueron especialmente importantes en la explicacion de la dualidad onda partıcula. Vimos ademasque la interferencia se da entre las amplitudes de probabilidad por lo cual debemos examinar tales amplitudes enforma detallada

5.9.1. Diferencia entre superposicion lineal y mezcla estadıstica

Sean |ψ1〉 y |ψ2〉 dos estados normalizados ortogonales

〈ψ1 |ψ1〉 = 〈ψ2 |ψ2〉 = 1 ; 〈ψ1 |ψ2〉 = 0

estos estados podrıan ser por ejemplo estados propios de un observable B asociados a valores propios diferentesb1 y b2. Si el sistema esta en el estado |ψ1〉 podemos calcular todas las probabilidades concernientes a resultadosde medidas de un cierto observable A. Si asumimos por ejemplo que el autovalor an de A es no degenerado ydenotamos |un〉 a su autovector asociado normalizado, la probabilidad de encontrar el valor an cuando se mide Asobre el sistema estando este en el estado |ψ1〉 esta dado por

P1 (an) = |〈un |ψ1〉|2 (5.81)

analogamente podemos medir esta probabilidad cuando el sistema esta en el estado |ψ2〉

P2 (an) = |〈un |ψ2〉|2 (5.82)

ahora consideremos un estado normalizado |ψ〉 que se construye como superposicion de los estados |ψ1〉 y |ψ2〉

|ψ〉 = c1 |ψ1〉+ c2 |ψ2〉 ; |c1|2 + |c2|2 = 1 (5.83)

este vector estara normalizado si |ψ1〉 y |ψ2〉 lo estan. Puesto que |ψ1〉 y |ψ2〉 son autovectores del observableB correspondientes a valores propios diferentes b1 y b2, la probabilidad de medir b1 es |c1|2 y la de medir b2 es|c2|2. Con frecuencia se dice que cuando el sistema esta en el estado |ψ〉 descrito por (5.83), entonces |c1|2 es laprobabilidad de encontrar al sistema en el estado |ψ1〉 y |c2|2 es la probabilidad de encontrarlo en el estado |ψ2〉,debe decirse sin embargo que esto solo es cierto si se ejecuta una medida del observable B, ya que si se midecualquier otro observable C en general |ψ1〉 y |ψ2〉 no seran autoestados de C y por tanto luego de la medida elsistema no quedara en ninguno de estos estados. En este caso se tendra que expandir a |ψ〉 en autoestados de C(esto es posible dado que es un observable), y obtener los respectivos coeficientes. Esto nos muestra una vez masque el aparato de medida y la medida misma juegan un papel muy importante en los postulados.

Page 233: Mecanica Cuantica: Notas de Clase

5.9. CONSECUENCIAS FISICAS DEL PRINCIPIO DE SUPERPOSICION 233

Volviendo a la distribucion de probabilidades para b1 y b2, lo anterior podrıa sugerir erroneamente que Nsistemas identicos cada uno en el estado |ψ〉 descrito por (5.83), equivalen a otro conjunto compuesto por N |c1|2sistemas identicos cada uno en el estado |ψ1〉, junto con N |c2|2 sistemas identicos cada uno en el estado |ψ2〉. Aesto ultimo se le denomina una mezcla estadıstica de los estados |ψ1〉 y |ψ2〉 con pesos |c1|2 y |c2|2.

Para chequear esta hipotesis calcularemos la probabilidad de encontrar el autovalor an cuando medimos A,sobre el sistema en el estado |ψ〉. Si interpretamos este estado como una mezcla estadıstica de los estados |ψ1〉 y |ψ2〉con pesos |c1|2 y |c2|2, esta probabilidad se puede calcular como la suma ponderada de probabilidades P1 (an) yP2 (an)

10

P (an)?= |c1|2 P1 (an) + |c2|2 P2 (an) (5.84)

por otro lado, aplicando los postulados de la mecanica cuantica, esta probabilidad se calcula como

P (an) = |〈un|ψ〉|2

la probabilidad es el modulo al cuadrado de la amplitud de probabilidad 〈un|ψ〉. Tal amplitud es la suma dedos terminos

〈un|ψ〉 = 〈un| c1 |ψ1〉+ c2 |ψ2〉 = c1 〈un|ψ1〉+ c2 〈un|ψ2〉el modulo al cuadrado se calcula con un procedimiento identico al que nos llevo a la Ec. (5.76) (excepto por laausencia de las exponenciales de la energıa)

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2Re c1c∗2 〈un|ψ1〉 〈ψ2| un〉

puesto que las cantidades c1, c2, 〈un|ψ1〉 y 〈ψ2| un〉 son complejas podemos escribirlas en notacion polar

c1 = |c1| eiθ1 , c2 = |c2| eiθ2 , 〈un|ψ1〉 = |〈un|ψ1〉| eiδ1〈ψ2| un〉 = 〈un|ψ2〉∗ = |〈un|ψ2〉| e−iδ2

con lo cual la probabilidad queda

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2Re|c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| ei(θ1+δ1−θ2−δ2)

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉|Reei(θ1+δ1−θ2−δ2)

quedando finalmente

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| cos (θ1 + δ1 − θ2 − δ2)

usando las Ecs. (5.81, 5.82) esta expresion se puede reescribir como

P (an, t) = |c1|2 P1 (an) + |c2|2 P2 (an) + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| cos (θ1 + δ1 − θ2 − δ2)

este resultado difiere del mostrado en (5.84) en donde se considero a |ψ〉 como una mezcla estadıstica. El punto esque la mezcla estadıstica no considera los efectos de interferencia contenidos en el producto cruzado que se obtienecuando se eleva al cuadrado una suma de amplitudes. El resultado muestra que la probabilidad no depende solode los modulos de los pesos |c1| y |c2| y de las amplitudes |〈un|ψ1〉| y |〈un|ψ2〉| sino tambien de sus fases relativasθ1, θ2, δ1 y δ2. Notese sin embargo, que una fase global eiθ multiplicando al estado |ψ〉 no afecta esta probabilidadpuesto que se elimina con su conjugado en el termino de interferencia.

10Puesto que P1 (an) es la probabilidad de obtener el valor an cuando el sistema esta en el estado |ψ1〉, es claro que en una mezclaestadıstica con N muy grande, el numero de estados |ψ1〉 que arrojara an cuando se mide A sobre los N

∣∣c21∣∣ estados |ψ1〉, viene

dada por N∣∣c21

∣∣P1 (an). Similarmente, N∣∣c22

∣∣P2 (an) es el numero de estados |ψ2〉 de la mezcla estadıstica que arrojaran el valor anen la medicion de A. Es claro entonces que la probabilidad de obtener an cuando se mide sobre la mezcla estadıstica completa es

lımN→∞N|c21|P1(an)+N|c22|P2(an)

Nque coincide con la Ec. (5.84).

Page 234: Mecanica Cuantica: Notas de Clase

234 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

5.9.2. Efectos de interferencia en fotones polarizados

Consideremos fotones polarizados que se propagan en la direccion uz en los cuales el estado de polarizacionesta representado por el vector unitario

u =1√2(ux + uy) (5.85)

este estado es una superposicion de dos estados de polarizacion ortogonales ux y uy. Esto representa luz polarizadalinealmente a un angulo de π/4 con respecto a los ejes X e Y .

Si consideraramos u como una mezcla estadıstica de los estados ux y uy con identicos pesos, tendrıamos que

N fotones en el estado u son equivalentes a N ×(

1√2

)2= N

2 fotones en el estado ux y N2 fotones en el estado uy.

Si colocaramos en la trayectoria del haz de luz un analizador cuyo eje u′ sea perpendicular a u (y de modo queu,u′ generen un plano paralelo a XY), para la mezcla estadıstica la mitad de los fotones pasarıa el analizador.En contraste, tanto la teorıa cuantica como los experimentos muestran que ninguno de los N fotones en el estadou pasa el analizador (ver seccion 2.9).

Este ejemplo muestra que una superposicion lineal de la forma (5.85) es diferente a una mezcla estadısticade iguales proporciones entre los estados ux y uy. Notese por ejemplo que la superposicion en (5.85) describe unhaz de luz polarizada a π/4 de los ejes X e Y . En contraste, una mezcla estadıstica esta asociada con un hazno polarizado puesto que el sistema contiene fotones de diferente polarizacion la mitad en direccion ux y la otramitad en la direccion uy.

La importancia de las fases relativas de los coeficientes de la expansion se puede ilustrar con los siguientesestados de polarizacion

u1 =1√2(ux + uy) ; u1 =

1√2(ux − uy) ; u1 =

1√2(ux + iuy) ; u1 =

1√2(ux − iuy)

los cuales difieren solo en las fases relativas de sus coeficientes siendo estas fases 0, π, π/2 y −π/2 respectivamen-te. Estos cuatro estados son fısicamente distintos: los dos primeros representan luz polarizada linealmente peroen direcciones distintas (el primer estado es ortogonal al segundo). Los dos ultimos representan luz polarizadacircularmente (dextrogira y levogira respectivamente).

5.9.3. Suma sobre los estados intermedios

Para ilustrar el uso adecuado del principio de superposicion, vamos a examinar dos experimentos ilustrativos.En esta seccion asumiremos que los observables A,B,C tienen un espectro discreto y no degenerado. Asumiremostambien que todas las medidas sucesivas se hacen en intervalos de tiempo cortos, de manera que el sistema no hatenido tiempo de evolucionar.

Primer experimento: Asumamos que en cierto tiempo, se midio el observable A y se obtuvo el valor propioa. El estado despues de la medida sera el ket propio |ua〉 asociado con a. Inmediatamente despues medimos alobservable C que no conmuta con A y obtenemos el valor c, de modo que el sistema quedara en el estado |vc〉.La probabilidad de que habiendo obtenido el valor a en la primera medida, obtengamos en la segunda medida unvalor c esta dada por

Pa (c) = |〈vc |ua〉|2 (5.86)

Segundo experimento: En este experimento medimos de forma sucesiva los observables A,B, y C que noconmutan entre sı. Si Pa (b, c) es la probabilidad de que habiendo obtenido el resultado a en la primera medida seobtengan los valores b y c en las otras dos, tenemos que esta probabilidad es el producto

Pa (b, c) = Pa (b)× Pb (c)

es decir Pa (b, c) es la probabilidad Pa (b) de que habiendo obtenido el valor a del observable A en la primeramedida, obtengamos b en la segunda, multiplicada por la probabilidad de que habiendo obtenido un valor b del

Page 235: Mecanica Cuantica: Notas de Clase

5.9. CONSECUENCIAS FISICAS DEL PRINCIPIO DE SUPERPOSICION 235

observable B en la segunda medida obtengamos un valor c de C en la tercera. Si denotamos |wb〉 al ket propio deB asociado con el valor propio b, la cantidad Pa (b, c) estara dada por

Pa (b, c) = |〈vc|wb〉|2 |〈wb| ua〉|2 (5.87)

Veamos ahora las semejanzas y diferencias entre ambos experimentos. Asumiremos que en ambos experimentosse han obtenido los mismos valores especıficos de A y C. En ambos experimentos el estado despues de la medicionde A es |ua〉, de hecho el papel de esta medicion es el de fijar a |ua〉 como el estado inicial (o “preparar” el sistemaen el estado inicial |ua〉). Despues de la medicion de C en ambos experimentos, el estado sera |vc〉 que lo tomaremoscomo el estado final. Los dos experimentos coinciden entonces en el estado inicial y en el final.

Para ambos experimentos es posible descomponer el estado justo antes de la medida de C en terminos deautovectores |wb〉 de B, y decir que entre los estados |ua〉 y |vc〉 el sistema puede “pasar” a traves de diferentes“estados intermedios” |wbi〉. Cada uno de estos estados intermedios define un posible “camino” entre el estadoinicial |ua〉 y el estado final |vc〉.

De aquı surge la diferencia fundamental entre los dos experimentos. En el primero el camino que el sistemaha tomado para ir desde |ua〉 hasta |vc〉 no ha sido determinado experimentalmente, ya que solo hemos medido laprobabilidad Pc (a) de que comenzando en el estado |ua〉 terminemos en el estado |vc〉. En el segundo experimentoel camino para ir desde |ua〉 hasta |vc〉 ha sido determinado experimentalmente midiendo el observable B, ya queesta medida nos permite obtener la probabilidad Pa (b, c) de que el sistema comenzando en |ua〉, pase a traves deun estado intermedio dado |wb〉 y termine en el estado |vc〉.

La idea ahora es relacionar a Pa (c) con Pa (b, c). Resulta tentador pensar que en el primer experimento elsistema es “libre de pasar” a traves de todos los estados intermedios |wb〉, pareciera entonces que la probabilidadglobal Pa (c) es la suma de todas las probabilidades Pa (b, c) asociadas con cada uno de los posibles “caminos”,esto conducirıa a

Pa (c)?=∑

b

Pa (b, c) (5.88)

veremos que este resultado es incorrecto a la luz de los postulados de la mecanica cuantica. La manera mas simplepara relacionar Pa (c) con Pa (b, c) consiste en tomar la formula de probabilidad Pa (c) Ec. (5.86) y aplicarle larelacion de completez para la base |wb〉

Pa (c) = |〈vc |ua〉|2 =∣∣∣∣∣∑

b

〈vc |wb〉 〈wb |ua〉∣∣∣∣∣

2

(5.89)

Pa (c) =

[∑

b

〈vc |wb〉 〈wb |ua〉][∑

b′〈vc |wb′〉 〈wb′ |ua〉

]∗

Pa (c) =∑

b

b′〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

es conveniente separar los terminos en las componentes diagonales b = b′ y las no diagonales

Pa (c) =∑

b

〈vc |wb〉 〈wb |ua〉 〈vc |wb〉∗ 〈wb |ua〉∗ +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

Pa (c) =∑

b

|〈vc |wb〉|2 |〈wb |ua〉|2 +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

y teniendo en cuenta la Ec. (5.87) tenemos que

Pa (c) =∑

b

Pa (b, c) +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗ (5.90)

Page 236: Mecanica Cuantica: Notas de Clase

236 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

comparando (5.90) con (5.88) vemos nuevamente que los terminos cruzados que aparecen en el cuadrado delmodulo de la suma en (5.89) estan ausentes en (5.88), y por tanto todos los efectos de interferencia entre losdiferentes posibles caminos.

Los argumentos anteriores nos muestran que es necesario razonar en terminos de amplitudes de probabilidadpara aplicar adecuadamente el principio de superposicion. Cuando los estados intermedios del sistema no estandeterminados experimentalmente son las amplitudes de probabilidad y no las probabilidades las que se debensumar.

Para comprender mejor el error en el razonamiento que nos llevo a la Ec. (5.88), recurrimos al quinto pos-tulado de reduccion del paquete de onda. En el segundo experimento, la medida del observable B involucra unaperturbacion del sistema bajo estudio y durante la medida su ket de estado experimenta un cambio abrupto quese manifiesta como la proyeccion sobre uno de los estados |wb〉, esta perturbacion inevitable y fundamental es laresponsable de la desaparicion de los efectos de interferencia. En el primer experimento no podemos decir que elsistema fısico “pasa” a traves de uno u otro de los estados |wb〉, es mas acertado decir que el sistema pasa a travesde todos los estados |wb〉 en forma ponderada. Esto se puede ver teniendo en cuenta que el estado antes de lamedida de B del segundo experimento es |ua〉 y este tambien es el estado del sistema en el primer experimentoantes de la medida de C, en el primer experimento el estado antes de la medida de C es

|ua〉 =∑

b

cb |wb〉

vemos entonces que cuando no se realiza la medida de B el sistema “esta en todos los estados posibles |wb〉”aunque en forma ponderada por los coeficientes cb.

De otra parte si las medidas sucesivas no se hacen en tiempos cortos, es posible realizar razonamientos similaresteniendo en cuenta la evolucion del sistema con la ecuacion de Schrodinger, y en todo caso la diferencia fundamentalentre superposiciones lineales de estados y mezcla estadıstica de estados continua existiendo (ver seccion 7.1.2 Pag.262).

Notese que estos razonamientos son muy similares a los que se describieron en la seccion 2.8 sobre el experimentode Young de la doble rendija. En el, la densidad de probabilidad de que un foton emitido por la fuente llegue aun punto dado M en la pantalla se obtiene primero superponiendo linealmente los campos electricos radiados porcada rendija para luego elevar al cuadrado y obtener la intensidad en M (y por tanto la densidad de probabilidaddeseada). El campo electrico hace las veces de la amplitud de probabilidad y la intensidad hace las veces de ladensidad de probabilidad como tal. Cuando no intentamos determinar por cual rendija pasa el foton (es decirno determinamos experimentalmente el “estado intermedio”), son los campos electricos radiados por cada rendijalos que se deben superponer linealmente y no sus intensidades, con el fin de obtener la intensidad (densidadde probabilidad) resultante. Podemos decir entonces que el campo radiado por una rendija sobre el punto Mrepresenta la amplitud para un foton emitido desde la fuente (estado inicial) de pasar a traves de tal rendija(estado intermedio) antes de arrivar al punto M sobre la pantalla (estado final), pero sin la medicion del estadointermedio se considera que el foton pasa por ambas rendijas (todos los estados intermedios accesibles).

De lo anterior podemos obtener las siguientes conclusiones

(a) Las predicciones probabilısticas de la teorıa cuantica se obtienen siempre elevando al cuadrado el modulode una amplitud de probabilidad

(b) Cuando en un experimento particular no se mide un estado intermedio, no se debe razonar en terminos delas probabilidades de los diversos resultados accesibles que se hubieran obtenido en tales medidas. Se debe razonaren terminos de las amplitudes de probabilidad. Esto tiene que ver con que las medidas destruyen la interferencia,dado que se obtienen valores bien definidos de un observable y un estado intermedio dado. En contraste cuandouna medida no se efectua, el sistema esta simultaneamente en todos los estados intermedios posibles y es estasimultaneidad la que permite la interferencia.

(c) El hecho de que los estados de un sistema fısico se pueden superponer linealmente significa que las am-plitudes de probabilidad con frecuencia tienen la forma de una suma de amplitudes parciales. La correspondiente

Page 237: Mecanica Cuantica: Notas de Clase

5.10. PRINCIPIO DE SUPERPOSICION CON VARIOS ESTADOS ASOCIADOS A UNA MEDIDA 237

probabilidad es entonces igual al modulo al cuadrado de esta suma de terminos con lo cual las amplitudes parcialesinterfieren entre sı.

5.10. El principio de superposicion para casos en que varios estados estan

asociados a una medida

En la anterior seccion hemos trabajado el caso de mediciones asociadas a valores propios no degenerados en loscuales hay un solo estado asociado a cada medida. En este caso la probabilidad de ocurrencia de un evento se haescrito como el cuadrado del modulo de una suma de terminos (amplitudes). No obstante, cuando hay presenciade degeneracion el cuarto postulado Ec. (4.4) nos dice que la probabilidad de obtener un valor propio degeneradoinvolucra una suma de cuadrados de modulos. Debe tenerse en cuenta sin embargo que cada sumando en (4.4)puede a su vez ser el modulo al cuadrado de una suma de amplitudes. Esto implicara discutir con cuidado el usoadecuado del principio de superposicion para obtener la probabilidad asociada a valores propios degenerados.

Por otra parte, existe otro escenario importante en el cual varios estados estan asociados con una medicion:cuando la resolucion del aparato de medida es insuficiente (como ocurre en la realidad). Hasta el momentohemos considerado medidas ideales pero es necesario discutir como las limitaciones experimentales deben sermanejadas para obtener predicciones teoricas sobre los resultados. Esta discusion permitira ademas extender elquinto postulado de reduccion del paquete de onda a los espectros contınuos.

5.10.1. El principio de superposicion para valores propios degenerados

Cuando un valor propio an es gn−degenerado, sus kets propios linealmente independientes∣∣uin

⟩generan un

autosubespacio En de dimension gn. En este caso, el estado en el cual queda el sistema despues de obtener an enla medicion no esta unıvocamente determinado, ya que depende del estado inicial |ψ〉 (estado justo antes de lamedicion). Si el estado inicial |ψ〉 es dado, el estado justo despues de la medicion vendra dado por la proyeccionnormalizada de |ψ〉 sobre En que denotamos por |ψn〉. Sin embargo, incluso cuando se obtiene la misma medidaan esta proyeccion es diferente cuando cambia el vector inicial, por lo cual podemos decir que hay varios estadosfinales asociados a la medida an.

La Ec. (4.4) nos dice como calcular la probabilidad P (an) de obtener el valor an cuando conocemos el estado|ψ〉 del sistema justo antes de la medicion.

P (an) =

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 (5.91)

para calcular esta probabilidad escogemos una base ortonormal∣∣uin

⟩del autosubespacio En y calculamos los

pesos∣∣⟨uin

∣∣ψ〉∣∣2 asociados a cada uno de los estados de esta base, la probabilidad P (an) sera entonces la suma

de estos gn pesos. Debemos tener en cuenta que cada probabilidad∣∣⟨uin

∣∣ψ〉∣∣2 puede ser el cuadrado del modulo

de una suma de amplitudes que nos generara interferencias. Por ejemplo si el estado inicial normalizado es de laforma

|ψ〉 = c1 |ψ1〉+ c2 |ψ2〉

cada sumando en (5.91) sera de la forma

∣∣⟨uin∣∣ψ〉∣∣2 =

∣∣c1⟨uin∣∣ψ1〉+ c2

⟨uin∣∣ψ2〉

∣∣2

con lo cual se obtienen interferencias al expandir el modulo al cuadrado.

Page 238: Mecanica Cuantica: Notas de Clase

238 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

5.10.2. Aparatos insuficientemente selectivos en la medida

Supongamos que tenemos un dispositivo para medir el observable A de un sistema fısico dado, y que el estadojusto antes de la medicion viene dado por

|ψ〉 =∑

k,i

ck,i∣∣uik⟩

(5.92)

siendo∣∣uik

⟩los estados propios de A con valor propio ak. Asumamos que el dispositivo posee las siguientes

caracterısticas.

(a) El dispositivo solo puede dar dos respuestas (autoresultados), que por convencion denotaremos como “si”y “no”.

(b) Si el estado inicial del sistema |ψ〉 esta en una combinacion lineal cuyos valores propios yacen todos en unintervalo dado ∆ del eje real, la respuesta sera definitivamente “sı”. En otras palabras, la respuesta es “sı” contoda certeza, cuando todos los ck,i no nulos de (5.92) sean tales que ak ∈ ∆.

(c) La respuesta es definitivamente “no” si el estado inicial del sistema |ψ〉 esta en una combinacion lineal deestados donde todos los valores propios asociados a los estados de la combinacion lineal yacen fuera del intervalo∆.

Vemos que ∆ define el poder de resolucion del instrumento. Ası mismo ∆ define los autoestados asociados alos autoresultados “si” y “no”. Si existe un solo valor propio an de A en el intervalo ∆ el dispositivo tendra unaresolucion infinita, ya que para el sistema en un estado inicial arbitrario, la probabilidad P (si) sera igual a laprobabilidad de obtener an en la medida de A. La probabilidad de obtener “no” es naturalmente P (no) = 1−P (si).

Por otro lado, si existen varios valores propios an de A en ∆, el dispositivo no tiene suficiente resolucion paradiscriminar entre estos diferentes autovalores. En este caso hablamos de un aparato o dispositivo insuficiente-mente selectivo.

Para estudiar la distribucion de probabilidad de P (no) , P (si) con estos dispositivos insuficientemente selec-tivos, debemos primero estudiar la perturbacion que estos aparatos crean sobre el sistema cuando realizan unamedida. Para caracterizar esta perturbacion anadiremos la siguiente hipotesis: El dispositivo transmite sin per-turbar todos los estados propios de A asociados con autovalores incluıdos en el intervalo ∆, ası como cualquiercombinacion lineal de estos estados, en cambio el dispositivo bloquea los autoestados de A asociados con valorespropios fuera del intervalo ∆ ası como todas sus combinaciones lineales. El dispositivo actua entonces como unfiltro perfecto para todos los estados asociados con ∆.

Ilustraremos la plausibilidad de esta hipotesis con un ejemplo. Cuando el espectro de un observable es contınuo,todo dispositivo experimental para medir este espectro es siempre insuficientemente selectivo. Tomaremos enconsecuencia un ejemplo con espectro contınuo. Supongamos que queremos medir la coordenada x de un electronque se propaga en la direccion uz. Para ello colocamos sobre el plano XY (en z = 0) una superficie bloqueadoracon una ranura con bordes entre x1 y x2 y de ancho infinito paralelo al eje Y . Un paquete de onda que estecompletamente incluıdo entre los planos x = x1 y x = x2, entrara a la region derecha (viniendo desde la izquierda)sin ninguna modificacion (esto equivale a un “sı”). Que el paquete de onda este entre los planos x = x1 y x = x2significa que es una superposicion de autoestados de R con autovalores x, y, z donde los x estan todos incluıdosen el intervalo [x1, x2]. Por otro lado, cualquier paquete de onda situado por debajo de x = x1 o por encima dex = x2 sera bloqueado por la superficie y no pasara a la derecha (esto equivale a un “no”).

Vemos que para un dispositivo insuficientemente selectivo, hay varios estados finales posibles luego de unamedicion que ha dado la respuesta “si” incluso cuando el espectro de A es no degenerado, ya que los estadospropios de A asociados a los diferentes autovalores ak en ∆ son estados posibles finales.

Queremos estudiar cuales son las predicciones que podemos hacer con estos dispositivos cuando un sistemafısico en un estado arbitrario es medido con uno de ellos. Para el ejemplo anterior cuando el paquete de onda estacompletamente adentro (o afuera) del intervalo [x1, x2], la respuesta es definitivamente si (no). Debemos estudiarlas probabilidades P (si) y P (no) cuando el paquete no esta completamente adentro ni completamente afuera.Veremos que esto es equivalente a medir un observable cuyo espectro sea degenerado.

Page 239: Mecanica Cuantica: Notas de Clase

5.10. PRINCIPIO DE SUPERPOSICION CON VARIOS ESTADOS ASOCIADOS A UNA MEDIDA 239

Por el momento retornaremos al caso de un espectro discreto. Consideremos el autosubespacio E∆ generadopor todos los autoestados

∣∣uin⟩

de A cuyos valores propios yacen en el intervalo ∆. El proyector P∆ sobre estesubespacio es

P∆ =∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ (5.93)

donde hemos tenido en cuenta que las autovalores an pueden ser degenerados. Notese que E∆ esta compuestopor todos los estados accesibles del sistema despues de que la medida de A ha dado el valor “si”. En terminosmas matematicos, podemos decir que la respuesta del dispositivo es definitivamente “si” cuando el estado inicialpertenece a E∆, es decir para cualquier estado propio de P∆ con valor propio +1. Adicionalmente, la respuesta esdefinitivamente “no” cuando el estado inicial pertenece al complemento ortogonal de E∆ es decir cuando el estadoes autoestado de P∆ con valor propio 0. Si denotamos E∆ al complemento ortogonal de E∆ podemos escribir

E = E∆ ⊕ E∆ ; |ψ〉 = |ψ∆〉 ⊕ |ψ∆〉 ; |ψ〉 ∈ E ; |ψ∆〉 ∈ E∆ ; |ψ∆〉 ∈ E∆ (5.94)

P∆ |ψ〉 = |ψ∆〉 ; P∆ |ψ∆〉 = (+1) |ψ∆〉 ; P∆ |ψ∆〉 = (0) |ψ∆〉 (5.95)

donde |ψ〉 es un estado arbitrario. Vemos entonces que las respuestas “si” y “no” que nos da nuestro dispositivoequivalen a los autovalores +1 y 0 respectivamente del observable P∆. Podemos decir entonces que el dispositivoesta realmente midiendo los valores propios de P∆ en lugar de los de A.

Con tal interpretacion podemos calcular las distribuciones de probabilidad P (si) y P (no) aplicando los pos-tulados al observable P∆ que es el que realmente se esta midiendo. La probabilidad P (si) es la probabilidad deobtener el valor propio +1 para el observable P∆. Si el estado inicial normalizado es |ψ〉 tal probabilidad se puedeescribir aplicando el cuarto postulado (pag. 196) y la Ec. (4.4)

P (si) = P (+1) =∑

m

|〈vm|ψ〉|2 ; P (no) = 1− P (si)

donde |vm〉 es una base ortonormal asociada al subespacio E(+1) generado por el valor propio +1 de P∆. De(5.95) es claro que E(+1) es justamente E∆; por tanto una base ortonormal |vm〉 posible es precisamente la base∣∣uin

⟩con an ∈ ∆, que se construyo para E∆. Por tanto, las probabilidades quedan en la forma

P (si) = P (+1) =∑

an∈∆

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 ; P (no) = 1− P (si) (5.96)

otra forma es usar las Ecs. (4.8, 5.94) donde en este caso el proyector sobre el autoespacio E(+1) = E∆ del observableP∆ es justamente P∆

P (si) = 〈ψ|P∆ |ψ〉 = 〈ψ∆ |ψ∆〉 (5.97)

aplicando (5.93) en (5.97) vemos que se reproduce (5.96)

|ψ∆〉 = P∆ |ψ〉 =∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ψ〉 ; 〈ψ|P∆ |ψ〉 = 〈ψ|

[∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ψ〉]

(5.98)

〈ψ|P∆ |ψ〉 =∑

an∈∆

gn∑

i=1

〈ψ∣∣uin⟩ ⟨uin∣∣ψ〉 =

an∈∆

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 (5.99)

Similarmente, puesto que el dispositivo no perturba los estados que pertenecen a E∆ y bloquea aquellos quepertenecen a E∆, vemos que el estado del sistema despues de la medicion cuando ha dado un resultado “si”, es

Page 240: Mecanica Cuantica: Notas de Clase

240 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

decir cuando el autovalor obtenido para P∆ es +1 esta dado por |ψ∆〉 pero normalizado, de las Ecs. (5.98, 5.99)se tiene

∣∣ψ′⟩si

=|ψ∆〉

〈ψ∆ |ψ∆〉=

P∆ |ψ〉〈ψ|P∆ |ψ〉 (5.100)

∣∣ψ′⟩si

=

∑an∈∆

∑gni=1

∣∣uin⟩ ⟨uin∣∣ψ〉√∑

am∈∆∑gm

k=1 |〈ukm|ψ〉|2

(5.101)

similarmente, la probabilidad de obtener el resultado “no” y el estado del sistema luego de que una medida nosarroje este resultado es

P (no) = P (0) = 〈ψ∆

∣∣∣ψ∆

⟩= 1− P (si)

∣∣ψ′⟩no

=

∣∣∣ψ∆

〈ψ∆

∣∣∣ψ∆

⟩ =P∆ |ψ〉

〈ψ| P∆ |ψ〉=

(I − P∆) |ψ〉〈ψ| (I − P∆) |ψ〉

=

∑an /∈∆

∑gni=1

∣∣uin⟩ ⟨uin∣∣ψ〉√∑

am /∈∆∑gm

k=1 |〈ukm|ψ〉|2

Cuando ∆ contiene solo un autovalor an de A, E∆ y P∆ se reducen a En y Pn y la resolucion del aparato esinfinita, en el sentido de que las incertidumbres y perturbaciones son solo las inherentes a las leyes de la mecanicacuantica, es decir estamos hablando de medidas ideales en el sentido cuantico. Vemos entonces que las Ecs. (4.8,4.10) se pueden ver como casos particulares de las Ecs. (5.97, 5.100). Notese que la suma sobre an en las Ecs.(5.96, 5.101) se puede ver como una “degeneracion adicional”. Se puede observar que cuando ∆ contiene variosvalores propios, el problema se asemeja a un problema con degeneracion incluso si cada an en ∆ es no degenerado,ya que en lo que concierne al calculo de la probabilidad Ec. (5.96), la suma sobre an es tambien una suma demodulos al cuadrado al igual que la suma sobre i.

5.11. Discusion general sobre el fenomeno de interferencia

Hemos visto que en algunos casos la probabilidad se calcula como el cuadrado del modulo de una suma deamplitudes y en otros casos como suma de modulos cuadrados (sumas de probabilidades). Es importante dejarclaro cuando se emplea cada algoritmo.

Nuevamente el experimento de Young de la doble rendija resulta ilustrativo. Supongamos que queremos calcularla probabilidad de que un determinado foton golpee la pantalla en un cierto intervalo [x1, x2]. Esta probabilidades proporcional a la intensidad total incidente sobre todo este intervalo

IT =

∫ x2

x1

I (x) dx =

∫ x2

x1

|E (x)|2 dx

es decir es una suma de cuadrados (suma de densidades de probabilidad). No obstante, la intensidad en un puntode la pantalla x ∈ [x1, x2] es el cuadrado del campo electrico E (x) el cual es la superposicion lineal de los camposelectricos EA (x) y EB (x) radiados por las dos rendijas A y B sobre el punto x en la pantalla. I (x) es entonces|EA (x) +EB (x)|2 es decir el cuadrado de una suma. EA (x) y EB (x) son las amplitudes asociadas a los doscaminos posibles (paso por cada rendija) que terminan en el mismo punto x. Estas amplitudes se adicionan paraobtener la amplitud en x ya que no estamos tratando de determinar por cual rendija pasa el foton. Luego, paracalcular la intensidad total se suman estos modulos al cuadrado (suma de intensidades), es decir se suman lasintensidades sobre los diferentes puntos x, para obtener la intensidad total en el intervalo [x1, x2] (equivalente asuma de probabilidades para obtener probabilidad total).

La anterior discusion nos muestra que la suma de amplitudes se realiza cuando partiendo desde un estadoinicial dado llegamos por diferentes caminos al mismo estado final (en este caso un punto fijo x en la pantalla).Tendremos tantas amplitudes como caminos intermedios considerados. Una vez calculado el modulo al cuadrado

Page 241: Mecanica Cuantica: Notas de Clase

5.12. MEDICION INSUFICIENTE DE ESPECTROS CONTINUOS 241

de la suma de estas amplitudes se suman estos cuadrados sobre estados finales diferentes (en este ejemplocorresponde a sumar las intensidades sobre los diferentes puntos x del intervalo).

Resumimos el algoritmo en la siguiente forma: Se suman las amplitudes correspondientes al mismo estado final,luego se suman las probabilidades correspondientes a estados finales ortogonales.

El hecho de que se sume sobre estados ortogonales tiene que ver con que usualmente los diferentes estadosque se usan para construır una base son todos ortogonales entre sı. En general, debemos decir que se suma sobreestados linealmente independientes.

5.12. Medicion insuficiente de espectros contınuos

Ya mencionamos que todo dispositivo que mida un observable con espectro contınuo necesariamente debe serinsuficiente, ya que ningun instrumento de medicion esta exento de la incertidumbre experimental. Por tanto, ladiscusion sobre la aplicacion de los postulados para medidas insuficientes resulta apropiado para el estudio de lamedicion de espectros contınuos.

El ejemplo mas simple y directo es la medicion de la posicion de una partıcula. Nos preguntamos por laprobabilidad de encontrar a la partıcula en una posicion dentro de un intervalo ∆ = [x1, x2] con un dispositivosimilar al descrito anteriormente.

Asumamos que la partıcula (sin espın) esta en un estado |ψ〉. El subespacio E∆ asociado con esta medida esel expandido por los kets |r〉 = |x, y, z〉 / x1 ≤ x ≤ x2. Puesto que estos kets son ortonormales en el sentidoextendido, la aplicacion de la regla descrita en la seccion 5.11 nos dice que

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |〈x, y, z |ψ〉|2 =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (r)|2 (5.102)

vemos que la Ec. (5.97) conduce al mismo resultado ya que P∆ viene dado en este caso por

P∆ =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |x, y, z〉 〈x, y, z|

de modo que

P (x1 ≤ x ≤ x2) = 〈ψ|P∆ |ψ〉 = 〈ψ|[∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |x, y, z〉 〈x, y, z|

]|ψ〉

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz 〈ψ |x, y, z〉 〈x, y, z|ψ〉 (5.103)

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (r)|2 (5.104)

ahora debemos encontrar el estado |ψ′〉 despues de que la medicion arroje un valor “si”, es decir cuando la posicionde la partıcula este dentro de ∆ despues de la medicion. Para ello aplicamos la Ec. (5.100)

∣∣ψ′⟩ =P∆ |ψ〉

〈ψ|P∆ |ψ〉 =1

〈ψ|P∆ |ψ〉

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′

∣∣x′, y′, z′⟩ ⟨x′, y′, z′

∣∣ψ〉∣∣ψ′⟩ =

1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′

∣∣r′⟩ψ(r′)

; N ≡ 〈ψ|P∆ |ψ〉

donde el factor de normalizacion N ≡ 〈ψ|P∆ |ψ〉 = P (x1 ≤ x ≤ x2), esta dado por la Ec. (5.104). Es inmediato

Page 242: Mecanica Cuantica: Notas de Clase

242 CAPITULO 5. CONSECUENCIAS FENOMENOLOGICAS DE LOS POSTULADOS

encontrar la funcion de onda asociada a |ψ′〉

〈r∣∣ψ′⟩ =

1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′ 〈r

∣∣r′⟩ψ(r′)

ψ′ (x, y, z) =1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′ δ

(x− x′

)δ(y − y′

)δ(z − z′

)ψ(x′, y′, z′

)

ψ′ (x, y, z) =1

N

∫ x2

x1

dx′ δ(x− x′

)ψ(x′, y, z

)

y como x puede estar dentro o fuera del intervalo [x1, x2] la funcion de onda sera

ψ′ (x, y, z) =

ψ (x, y, z) si x1 ≤ x ≤ x2

0 si x /∈ [x1, x2](5.105)

vemos entonces que la parte de ψ (r) que corresponde al intervalo asociado al aparato de medicion persiste sinmodificacion, ya que el factor 1/N simplemente asegura que el estado se mantenga normalizado. El resto essuprimido por la medicion. Podemos decir entonces que el paquete de onda inicial ψ (r) de la partıcula esta siendo“truncado” por los lımites de la “ranura”. Podemos entonces entender a partir de estos procesos porque hablamosde una reduccion del paquete de onda.

Ahora bien, si tenemos un gran numero de partıculas todas en el estado |ψ〉, entrando sucesivamente en elaparato, el resultado sera algunas veces “si” y otras veces “no” segun la distribucion de probabilidad prescritaanteriormente. Si la respuesta es “si”, la partıcula sigue su camino a partir de un estado inicial “truncado” o“reducido” dado por |ψ′〉; si el resultado es “no” la partıcula es absorbida por la placa colocada en el plano XY .

Es claro que cuando el espectro es contınuo, el dispositivo sera siempre insuficientemente selectivo puesto queel intervalo [x1, x2] siempre contiene infinitos puntos por pequeno que este sea. Vale la pena sin embargo, analizarel lımite cuando el ancho de este intervalo tiende a cero. Tomemos un intervalo de ancho ∆x centrado en x0, si∆x lo tomamos lo suficientemente pequeno podemos despreciar la variacion de ψ (r) en x y reemplazarla por suvalor en x0, en cuyo caso se puede integrar en x la probabilidad dada por (5.102)

P

(x0 −

∆x

2, x0 +

∆x

2

)≃ ∆x

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (x0, y, z)|2

dP (x0) = ρ (x0) dx

donde de acuerdo con el cuarto postulado hemos interpretado a la densidad de probabilidad asociada a x0 como laintegral en y y z de la expresion anterior. La diferencia con la Ec. (4.9) es que en (4.9) el espectro se considerabano degenerado en tanto que aquı el espectro de X es infinitamente degenerado en Er, ya que todo vector de laforma |x, y, z〉 es vector propio de X. Por esta razon, en esta densidad de probabilidad interviene una integraldoble sobre y y z.

5.13. Postulado de reduccion del paquete de onda (quinto postulado) paraun espectro continuo

En la discusion del quinto postulado dada en la seccion 4.3.4, nos hemos restringido al caso discreto. Sinembargo, la discusion realizada en la seccion 5.12 sobre dispositivos insuficientemente selectivos nos permiteextender el postulado al caso de espectro contınuo. El cual estableceremos de la siguiente forma

Quinto postulado o postulado de reduccion del paquete de onda (caso contınuo): Si estandoel sistema en un estado |ψ〉 realizamos una medida sobre el observable A de espectro contınuo no degenerado,obteniendo como resultado un valor dentro del intervalo [α0 −∆α, α0 +∆α], el estado del sistema inmediatamentedespues de la medida esta descrito por

∣∣ψ′⟩ = P∆α (α0) |ψ〉〈ψ|P∆α (α0) |ψ〉

; P∆α (α0) ≡∫ α0+

∆α2

α0−∆α2

dα |να〉 〈να|

Page 243: Mecanica Cuantica: Notas de Clase

5.13. REDUCCION DEL PAQUETE DE ONDA PARA ESPECTRO CONTINUO 243

el proceso de reduccion aparece con claridad en la Ec. (5.105), si la generalizamos a cualquier observable A deespectro contınuo α con funcion de onda 〈να |ψ〉 que representa a |ψ〉 en la base |να〉. Segun la Ec. (5.105)adecuadamente generalizada, el sistema queda preparado en un estado cuya funcion de onda es cero fuera delintervalo de seleccion y dentro de dicho intervalo conserva la forma de la funcion de onda original (excepto porun factor de normalizacion). Sin importar que tan pequeno sea ∆α nunca obtenemos el autoestado |να0〉 despuesde la medida, el cual en la base |να〉 estarıa representado por 〈να |να0〉 = δ (α− α0). Pues la funcion de ondatruncada siempre tiene un ancho finito ∆α. Finalmente, es claro que el factor de normalizacion debe ser mayorque la unidad.

Page 244: Mecanica Cuantica: Notas de Clase

Capıtulo 6

Aplicacion de los postulados cuando seposee informacion parcial de un sistema

Hemos estudiado hasta el momento la aplicacion de los postulados cuando el estado del sistema se conoceperfectamente. Veremos dos casos en los cuales manejamos informacion parcial del sistema (a) cuando el sistemaesta compuesto de dos o mas subsistemas, y solo realizamos medidas de un subsistema especıfico. (b) cuandodesconocemos las condiciones iniciales detalladas y solo poseemos informacion en forma de probabilidad, comoocurre en la mecanica estadıstica. Estudiaremos primero el caso (a).

6.1. Aplicacion de los postulados cuando se mide un observable de un sub-sistema

Cuando dos subsistemas cuanticos se condensan, podemos formar un unico sistema global a traves del productotensorial de los espacios de Hilbert asociados a cada subsistema. Nuestro proposito es estudiar el comportamientodel sistema global cuando se realiza la medida de un observable asociado a uno de los subsistemas.

Consideremos el sistema fısico como compuesto de dos subsistemas (1) y (2) descritos por los espacios deHilbert E (1) y E (2). El espacio de estados asociado al sistema global es

E ≡ E (1)⊗ E (2)

por ejemplo un sistema de dos electrones (sin espın), esta descrito por una funcion de onda de la forma

ψ (r1, r2) ≡ 〈r1, r2 |ψ〉 = ψ (x1, y1, z1;x2, y2, z2) ; ψ (r1, r2) ∈ Er (1)⊗ Er (2)

Estudiaremos el caso en el cual se mide un observable asociado a solo uno de los subsistemas. Asumiremos deaquı en adelante que las medidas se realizaran sobre el subsistema (1) ya que el analisis del caso en que se haceuna medida sobre el subsistema (2) es totalmente analogo. El observable A (1) asociado a una medida sobre elsubsistema (1) es la extension tensorial del observable A (1) (ver Ec. 1.128)

A (1) ≡ A (1)⊗ I (2) (6.1)

ya vimos en la seccion 1.32.3 que el espectro de A (1) en E (1) ⊗ E (2) es identico al espectro de A (1) en E (1).Vimos adicionalmente que la degeneracion de cada valor propio en E (1)⊗E (2) es el producto de su degeneracionen E (1) por la dimension de E (2). Esto implica que (si E (2) es de dos o mas dimensiones) todo valor propio deA (1) es degenerado. En consecuencia, cuando se realiza una medida sobre el subsistema (1), el estado del sistemaglobal despues de la medida dependera tanto del resultado de la medida como del estado justo antes de esta.Fısicamente, esto se debe a que el resultado no da ninguna informacion sobre el subsistema (2), y por tanto elobservable asociado no constituye un C.S.C.O.

244

Page 245: Mecanica Cuantica: Notas de Clase

6.1. APLICACION DE LOS POSTULADOS AL MEDIR SOBRE UN SUBSISTEMA 245

Vamos a calcular la probabilidad de obtener un valor propio dado an en una medida del observable A (1). Paraello apelamos a la Ec. (4.8) pag 197

P (1) (an) = 〈ψ| Pn (1) |ψ〉 (6.2)

siendo |ψ〉 el estado (normalizado) en el que se encuentra el sistema global antes de la medicion. El proyectorextendido Pn (1) se escribe en terminos del proyector Pn (1) en E (1) en la forma

Pn (1) ≡ Pn (1)⊗ I (2) ; Pn (1) =

gn∑

i=1

∣∣uin (1)⟩ ⟨uin (1)

∣∣ (6.3)

siendo∣∣uin (1)

⟩una base ortonormal en E (1) y gn la degeneracion de an en E (1). Pn (1) es entonces el proyector

en E (1) ⊗ E (2) sobre el autosubespacio generado por an en E (1) ⊗ E (2), el cual es claramente E(1)an ⊗ E (2).

Adicionalmente podemos expresar la identidad de (2) usando una base ortonormal |vk (2)〉 de E (2) con lo cualPn (1) queda

Pn (1) ≡ Pn (1)⊗ I (2) =

[gn∑

i=1

∣∣uin (1)⟩ ⟨uin (1)

∣∣]⊗[∑

k

|vk (2)〉 〈vk (2)|]

=

gn∑

i=1

k

[∣∣uin (1)⟩⊗ |vk (2)〉

] [⟨uin (1)

∣∣⊗ 〈vk (2)|]

Pn (1) =

gn∑

i=1

k

∣∣uin (1) vk (2)⟩ ⟨uin (1) vk (2)

∣∣ (6.4)

aplicando este proyector en la Ec. (6.2) resulta

P (1) (an) = 〈ψ| Pn (1) |ψ〉 =gn∑

i=1

k

〈ψ|[∣∣uin (1) vk (2)

⟩ ⟨uin (1) vk (2)

∣∣] |ψ〉

=

gn∑

i=1

k

〈ψ| uin (1) vk (2)〉⟨uin (1) vk (2)

∣∣ψ〉

P (1) (an) = 〈ψ| Pn (1) |ψ〉 =gn∑

i=1

k

∣∣⟨uin (1) vk (2)∣∣ψ〉∣∣2 (6.5)

adicionalmente, el estado |ψ′〉 justo despues de la medicion se puede calcular empleando la Ec. (4.10) pag. 200, yteniendo en cuenta las Ecs. (6.5, 6.4)

∣∣ψ′⟩ = Pn (1) |ψ〉√〈ψ| Pn (1) |ψ〉

=

∑gni=1

∑k

∣∣uin (1) vk (2)⟩ ⟨uin (1) vk (2)

∣∣ψ〉√∑gnm=1

∑p |〈umn (1) vp (2)|ψ〉|2

(6.6)

Notese que las Ecs. (6.2, 6.3, 6.6), nos dicen que la base ortonormal |vk (2)〉 en E (2) se puede elegir arbitraria-mente, en el sentido de que ninguna base ortonormal especıfica de E (2) presenta ventajas operativas especiales,cuando se miden solo observables del subsistema (1). Esto es de esperarse, ya que al no realizarse ninguna medidaen el sistema (2), ningun conjunto de estados en E (2) es preferencial.

6.1.1. Interpretacion fısica de los estados que son productos tensoriales

En la seccion 1.32, vimos que no todos los estados en E (1)⊗E (2) se pueden expresar como producto tensorialde estados en E (1) y en E (2). Estudiaremos aquı el significado fısico de los estados que sı son producto tensorialde los subespacios anteriores, sea |ψ〉 ∈ E (1)⊗ E (2) tal que

|ψ〉 = |ϕ (1)〉 ⊗ |χ (2)〉 = |ϕ (1)χ (2)〉 ; |ϕ (1)〉 ∈ E (1) , |χ (2)〉 ∈ E (2) , ‖|ϕ (1)〉‖ = ‖|χ (2)〉‖ = 1 (6.7)

Page 246: Mecanica Cuantica: Notas de Clase

246 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

supongamos que |ψ〉 es el estado del sistema antes de la medicion de A (1), el estado |ψ′〉 despues de la medicionse obtiene aplicando las Ecs. (6.6, 6.7, 6.3)

∣∣ψ′⟩ =Pn (1) |ψ〉√〈ψ| Pn (1) |ψ〉

=[Pn (1)⊗ I (2)] [|ϕ (1)〉 ⊗ |χ (2)〉]√

[〈ϕ (1)| ⊗ 〈χ (2)|] [Pn (1)⊗ I (2)] [|ϕ (1)〉 ⊗ |χ (2)〉]∣∣ψ′⟩ =

Pn (1) |ϕ (1)〉 ⊗ I (2) |χ (2)〉√[〈ϕ (1)| ⊗ 〈χ (2)|] [Pn (1) |ϕ (1)〉 ⊗ I (2) |χ (2)〉]

=Pn (1) |ϕ (1)〉 ⊗ |χ (2)〉√

〈ϕ (1)|Pn (1) |ϕ (1)〉 〈χ (2)|χ (2)〉

que se puede escribir como

∣∣ψ′⟩ =∣∣ϕ′ (1)

⟩⊗ |χ (2)〉 ;

∣∣ϕ′ (1)⟩≡ Pn (1) |ϕ (1)〉√

〈ϕ (1)|Pn (1) |ϕ (1)〉

vemos que el estado posterior a la medicion tambien es un producto tensorial tal que el estado del subsistema (1)ha cambiado pero no el estado asociado al subsistema (2). La probabilidad P (an) queda en la forma

P (1) (an) = 〈ψ| Pn (1) |ψ〉 = 〈ϕ (1)χ (2)| [Pn (1)⊗ I (2)] |ϕ (1)χ (2)〉= 〈ϕ (1)|Pn (1) |ϕ (1)〉 〈χ (2)| I (2) |χ (2)〉

P (1) (an) = 〈ϕ (1)|Pn (1) |ϕ (1)〉

de lo cual se ve que P (1) (an) no depende de |χ (2)〉 solo del estado |ϕ (1)〉 del subsistema (1). Por tanto, cuando elestado del sistema esta descrito por un producto tensorial como en la Ec. (6.7), las predicciones fısicas asociadasa solo uno de los dos subsistemas, no dependen del estado del otro subsistema y se obtienen unicamente a partirdel estado del subsistema sobre el que se mide.

En consecuencia, un estado producto |ϕ (1)〉⊗|χ (2)〉 describe una simple yuxtaposicion de los subsistemas (1) y(2) cada uno de ellos en los estados |ϕ (1)〉 y |χ (2)〉 respectivamente. En tal estado, se dice que los dos subsistemasNO estan correlacionados, esto implica que la medicion de observables que pertenecen a uno u otro subsistemacorresponden a variable aleatorias independientes. Esto ocurre cuando los subsistemas han sido preparados en losestados |ϕ (1)〉 y |χ (2)〉 para luego unirlos sin interaccion.

Example 6.1 Sea H1 el Hamiltoniano que describe al sistema (1) y H2 el Hamiltoniano que describe al sistema(2). Si la ecuacion de Schrodinger independiente y dependiente del tiempo vienen dadas por

H1 |ϕ1〉 = E1 |ϕ1〉 ; i~d

dt|ψ1〉 = H1 |ψ1〉

H2 |ϕ2〉 = E2 |ϕ2〉 ; i~d

dt|ψ2〉 = H2 |ψ2〉

y si el hamiltoniano del sistema (1) + (2) esta dado por H = H1 +H2, es facil verificar que

H |ϕ〉 = E |ϕ〉 ; i~d

dt|ψ〉 = H |ψ〉

H = H1 +H2 ; E = E1 + E2 ; |ϕ〉 = |ϕ1〉 ⊗ |ϕ2〉 ; |ψ〉 = |ψ1〉 ⊗ |ψ2〉

dado que en el sistema completo H1 y H2 son operadores sobre E = E (1) ⊗ E (2) entonces cada Hi se refiere asu extension sobre E. Efectivamente, esta es la forma del Hamiltoniano cuando simplemente se agregan los dossistemas sin interaccion entre ellos, en cuyo caso la energıa total es simplemente la suma de las energıas asociadasa cada subsistema.

Page 247: Mecanica Cuantica: Notas de Clase

6.1. APLICACION DE LOS POSTULADOS AL MEDIR SOBRE UN SUBSISTEMA 247

6.1.2. Significado fısico de estados que no son productos tensoriales

Sean |un (1)〉 y |vk (2)〉 bases de E (1) y E (2) respectivamente. Si el estado |ψ〉 no esta asociado a unproducto tensorial entonces este se escribe como

|ψ〉 =∑

n,k

cn,k |un (1)〉 ⊗ |vk (2)〉

donde hay por lo menos dos sumandos diferentes de cero. Veamos las predicciones sobre la medicion de unobservable A (1) asociado solo al subsistema (1). En tal caso, es facil probar que las predicciones fısicas no sepueden escribir solo en terminos de un estado del subsistema (1). Esto se puede ver aplicando las formulas (6.5,6.6) en el contexto mas general. Esta situacion corresponde entonces a la existencia de correlaciones entre los dossubsistemas, los resultados de medidas sobre cada subsistema corresponden a variables aleatorias dependientes yque pueden ser correlacionadas. Puede demostrarse por ejemplo que si dos subsistemas descritos por un productotensorial se “conectan” entre sı por medio de una interaccion, el nuevo estado ya no sera un producto tensorial.Esto se puede ilustrar re-examinando el ejemplo 6.1, en el caso en el cual el Hamiltoniano del sistema se escribacomo

H = H1 +H2 +Hint

donde Hint es un Hamiltoniano que modela la interaccion entre los dos subsistemas. En este caso las solucionesde la ecuacion de Schrodinger dependiente e independiente del tiempo para el sistema completo, ya no son losproductos tensoriales de las soluciones para cada subsistema.

Estudiemos primero el caso mas sencillo, asumiendo que el valor propio an obtenido en la medida, es nodegenerado en el subsistema (1). En tal caso desaparece la sumatoria sobre i en la Ec. (6.3) y en todas las demasecuaciones. El estado despues de la medida se obtiene de (6.6) suprimiendo la suma sobre i

∣∣ψ′⟩ =

∑k |un (1) vk (2)〉 〈un (1) vk (2)|ψ〉√∑

p |〈un (1) vp (2)|ψ〉|2=

|un (1)〉 ⊗∑

k |vk (2)〉 〈un (1) vk (2)|ψ〉√∑p |〈un (1) vp (2)|ψ〉|2

∣∣ψ′⟩ = |un (1)〉 ⊗∣∣χ′ (2)

⟩;∣∣χ′ (2)

⟩=

∑k |vk (2)〉 〈un (1) vk (2)|ψ〉√∑

p |〈un (1) vp (2)|ψ〉|2(6.8)

en conclusion, sin importar el estado |ψ〉 previo a la medicion del subsistema (1), el estado global posterior ala medicion de un observable que no es degenerado en el subsistema (1), es siempre un producto tensorial. Esteresultado se puede extender al caso en que se realiza un conjunto de mediciones asociadas a un C.S.C.O. de E (1),es decir cuando la medicion es completa con respecto a un subsistema (estas mediciones son naturalmente parcialescon respecto al sistema global).

Cuando el estado del sistema global no es un producto tensorial del tipo |ϕ (1)〉 ⊗ |χ (2)〉, no podemos asociarun ket |ϕ (1)〉 , |χ (2)〉 a cada subsistema (1) y (2) 1. Surge entonces la pregunta de como caracterizar cadasistema parcial en un sistema correlacionado. Esta pregunta es de gran interes si tenemos en cuenta que en generaltodo sistema fısico ha interactuado en el pasado con otros sistemas incluso si esta aislado en el momento en queestudiamos tal sistema. Esto implica que el sistema total (sistema bajo estudio mas el sistema con el que interactuoen el pasado) no es en general un estado producto y no es posible asociar un vector de estado |ϕ (1)〉 con el sistemabajo estudio. Este problema se resuelve asociando al subsistema (1) (sistema bajo estudio) un operador (operadordensidad) en lugar de un vector, volveremos sobre este punto en la seccion 6.2.

Por el momento, tomaremos un caso en el cual se puede asociar un vector de estado para el sistema (1). Estoocurre cuando se realiza un conjunto completo de medidas del subsistema (1). Hemos visto que en tal situacion,para cualquier estado del sistema global (1) + (2) antes de la medida, un conjunto completo de medidas en E (1)

1Por ejemplo, la energıa de un sistema compuesto no es en general la suma de las energıas individuales ya que la interaccion aportaa dicha energıa, ademas no hay una manera no ambigua de “repartir” la energıa total del sistema asignandole una porcion a cadasistema.

Page 248: Mecanica Cuantica: Notas de Clase

248 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

coloca al sistema global en un estado que es producto tensorial como se ve en la Ec. (6.8). El vector asociadocon (1) es el que se obtiene de manera unica (salvo por un factor multiplicativo), por medio de los valores delconjunto completo de medidas sobre (1). En consecuencia, el conjunto completo de medidas sobre (1) borra todaslas correlaciones que surgen de interacciones previas entre los dos sistemas. En particular, si en el momento de lamedida el sistema (2) esta muy lejos y ya no interactua con el sistema (1), el sistema (2) puede ser totalmenteomitido para efectos de estudiar al sistema (1).

Hemos visto que cuando el estado |ψ〉 es un producto tensorial, el vector de estado asociado al subsistema(2), no depende de medidas hechas sobre el sistema (1). Ahora bien, cuando el estado del sistema global es |ψ〉antes de las medidas, y realizamos un conjunto completo de medidas sobre (1), la Ec. (6.8) nos muestra el estado|ψ′〉 en el cual queda preparado el sistema global. Dicha ecuacion nos muestra que cuando |ψ〉 no es un productotensorial, el vector de estado |χ′ (2)〉 asociado al sistema (2) posterior a las medidas, depende del resultado delconjunto completo de medidas en (1). Esto es a priori sorprendente ya que el estado del sistema (2) despues deejecutar un conjunto completo de medidas en (1), dependera del resultado de dichas medidas incluso si el sistema(2) esta muy lejos del sistema (1) en el momento de realizar las medidas. En otras palabras un conjunto completode medidas sobre (1) influirıa sobre el sistema (2) incluso cuando estos no interactuan. Esta paradoja ha sidoampliamente estudiada por cientıficos como Einstein, Podolsky, Rosen y Bell.

6.2. Operador densidad

Cuando conocemos completamente el estado del sistema en un cierto tiempo, podemos predecir determinısti-camente el estado en cualquier tiempo posterior en tanto no se realice una medida. Tambien podemos predecirperfectamente probabilidades de obtener determinados resultados cuando se realizan medidas. Para determinarcompletamente el estado en cierto tiempo es suficiente realizar un conjunto de medidas que formen un C.S.C.O.Este es el caso en el experimento de polarizacion de fotones descrito en la seccion 2.9, en el cual el estado depolarizacion es conocido perfectamente cuando el haz atravieza el polarizador.

Sin embargo, ocurre con frecuencia que el estado del sistema no esta completamente determinado. Por ejemplo,los estados de polarizacion de los fotones que emanan de una fuente de luz natural (no polarizada) no estan biendefinidos. Otro ejemplo lo constituyen los atomos de un gas a cierta temperatura, para los cuales el valor dela energıa cinetica de los atomos solo se conoce estadısticamente. La pregunta natural es como incorporar estainformacion incompleta en el formalismo de modo que se pueda aprovechar de la mejor manera posible. Estonos llevara a la introduccion del operador densidad que nos permitira incorporar los resultados parciales en lospostulados de la mecanica cuantica.

6.2.1. El concepto de mezcla estadıstica de estados

Ya hemos mencionado el concepto de mezcla estadıstica de estados (ver seccion 5.9.1, pag 232). Cuandotenemos informacion incompleta de un sistema es usual utilizar el concepto de probabilidad para incorporar lainformacion parcial. Como ejemplo, cada estado de polarizacion posible para un foton posee la misma probabilidaden un haz de luz no polarizada. Un sistema termodinamico en equilibrio a temperatura T posee una probabilidadproporcional a e−En/kT de estar en el estado de energıa En.

En mecanica cuantica es usual que la informacion parcial se presente de la siguiente forma: Un sistema cuanticodado posee un conjunto de estados accesibles |ψn〉 siendo pk la probabilidad de obtener un estado especıfico |ψk〉donde obviamente ∑

k

pk = 1 ; 0 ≤ pk ≤ 1

decimos entonces que el sistema esta en una mezcla estadıstica de estados accesibles |ψn〉 con probabilidades pn.Queremos ahora hacer predicciones sobre los resultados cuando se realiza un conjunto de medidas sobre el sistema.Si el sistema estuviera en un estado |ψk〉 podrıamos aplicar los postulados para realizar las correspondientespredicciones. Sin embargo, dado que no tenemos certeza sobre el estado inicial sino solo una probabilidad pk de

Page 249: Mecanica Cuantica: Notas de Clase

6.2. OPERADOR DENSIDAD 249

que se encuentre en ese estado, los resultados obtenidos deben ser ponderados por el factor pk y luego sumadossobre todos los estados accesibles en la mezcla estadıstica.

Los estados accesibles |ψk〉 se pueden normalizar y de hecho asumiremos de aquı en adelante que estannormalizados. Sin embargo, estos estados no son necesariamente ortogonales.

Por otra parte sera necesario distinguir en nuestro estudio dos tipos diferentes de probabilidad: (a) Probabilidadde obtener un estado |ψk〉 en el tiempo inicial. En otras palabras, probabilidad de encontrar al sistema en t0 enunas condiciones iniciales dadas. Este tipo de probabilidad se utiliza tambien en mecanica estadıstica clasica y esinherente a la informacion incompleta sobre las condiciones iniciales. (b) Probabilidad de obtener ciertos resultadoscuando se realizan medidas en el sistema, esta probabilidad es eminentemente cuantica y proviene de los postuladosde la mecanica cuantica, ademas no desaparece incluso si determinamos perfectamente las condiciones iniciales(estado |ψk〉) del sistema.

Adicionalmente, es necesario diferenciar entre una mezcla estadıstica y una superposicion lineal de estados(ver secciones 5.9.1, 5.9.3). Para una superposicion lineal de estados

|ψ〉 =∑

k

ck |ψk〉 (6.9)

es frecuente decir que cuando el vector de estado es |ψ〉, el sistema tiene probabilidad |ck|2 de estar en el estado|ψk〉. Esto en realidad significa que cuando se realiza un conjunto de medidas que corresponden a un C.S.C.O. yque tienen a |ψk〉 como autovector, la probabilidad de encontrar el conjunto de autovalores asociados con |ψk〉 es|ck|2. Vimos en la seccion 5.9.3 que un estado |ψ〉 dado por la Ec. (6.9) no equivale simplemente a un sistema quetiene la probabilidad |ck|2 de estar en el estado |ψk〉 para cada estado accesible. Esto se debe a que una combinacionlineal del conjunto |ψk〉 genera interferencias entre los estados accesibles debidas a terminos cruzados de la formackc

∗p que surgen cuando los modulos de la amplitud de probabilidad se suman y luego se elevan al cuadrado. En

una mezcla estadıstica el sistema esta en un estado especıfico |ψm〉 de los estados accesibles |ψk〉, aunque nosepamos en cual de ellos esta (esta falta de informacion se parametriza con la distribucion de probabilidad). Encontraste, en una superposicion lineal de los estados |ψk〉, el sistema esta simultaneamente en todos los estadosaunque ponderados por los coeficientes ck.

Lo anterior implica que no podemos en general describir una mezcla estadıstica a traves de un “vector de estadopromedio” que sea una superposicion de los estados |ψk〉. Como ya mencionamos, cuando tomamos una sumaponderada de probabilidades no se obtienen terminos de interferencia entre los estados accesibles de la mezclaestadıstica.

Ya hemos sugerido una estrategia para estudiar los estados que son una mezcla estadıstica que es calcularlas predicciones fısicas asociadas a cada estado |ψk〉 ponderando cada estado con su probabilidad para entoncessumar sobre los estados accesibles. Aunque este metodo es correcto resulta engorroso en muchos casos. Por otrolado ante la imposibilidad de describir los estados mezclados por medio de un “vector promedio”, recurriremosa utilizar un “operador promedio” que denominaremos operador densidad. Comenzaremos el tratamiento con elcaso mas sencillo en el cual el estado del sistema es completamente conocido

6.2.2. Estados puros y operador densidad

Cuando el estado inicial es perfectamente conocido solo hay un estado accesible |ψm〉 de modo que las proba-bilidades asociadas a los estados estan dadas por pk = δkm. En tal caso existe un vector de estado que describe alsistema en cualquier instante de tiempo

|ψ (t)〉 =∑

n

cn (t) |un〉

siendo |un〉 una base ortonormal en el espacio de estados, que por simplicidad asumiremos discreta. Si el estadoesta normalizado los coeficientes satisfacen la relacion

n

|cn (t)|2 = 1 (6.10)

Page 250: Mecanica Cuantica: Notas de Clase

250 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

si A es un observable, sus elementos de matriz en la base |un〉 y su valor esperado cuando el sistema esta en elestado |ψ (t)〉 estan dados por

〈un|A |up〉 = Anp (6.11)

〈A〉 (t) = 〈ψ (t)|A |ψ (t)〉 =∑

n,p

〈ψ (t)|un〉 〈un|A |up〉 〈up |ψ (t)〉 (6.12)

〈A〉 (t) =∑

n,p

c∗n (t) cp (t) Anp ; ck (t) ≡ 〈uk |ψ (t)〉 (6.13)

y la evolucion de |ψ (t)〉 se describe con la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (6.14)

siendo H (t) el Hamiltoniano del sistema. Notese que el valor esperado de A depende cuadraticamente de loscoeficientes de Fourier como se aprecia en la Ec. (6.13). El producto de coeficientes c∗n (t) cp (t) que aparece endicha ecuacion se puede escribir en la forma

c∗n (t) cp (t) = 〈up |ψ (t)〉 〈ψ (t)|un〉 = 〈up| [|ψ (t)〉 〈ψ (t)|] |un〉

de modo que este producto es claramente un elemento de la representacion matricial del proyector |ψ (t)〉 〈ψ (t)|en la base |uk〉. Es natural entonces definir un operador ρ (t) en la forma

ρ (t) ≡ |ψ (t)〉 〈ψ (t)| (6.15)

que denominaremos operador densidad. Su representacion matricial en la base |uk〉 es claramente

ρpn = 〈up| ρ (t) |un〉 = c∗n (t) cp (t) (6.16)

mostraremos a continuacion que el operador densidad ρ (t), posee la misma informacion fısica que el vector deestado |ψ (t)〉. Para verlo reescribiremos las formulas (6.10, 6.13, 6.14) en terminos de ρ (t). Sustituyendo (6.16)en (6.10) tenemos ∑

n

|cn|2 =∑

n

c∗ncn = 1 ⇒∑

n

ρnn = 1

de modo que en virtud de la normalizacion del estado |ψ (t)〉 en (6.15), la traza del operador densidad es igual ala unidad

Trρ (t) = 1 (6.17)

teniendo en cuenta las relaciones (6.11, 6.16), la Ec. (6.13) queda

〈A〉 (t) =∑

n,p

c∗n (t) cp (t) Anp =∑

n,p

〈up| ρ (t) |un〉 〈un|A |up〉 =∑

p

〈up| ρ (t)A |up〉

〈A〉 (t) = Tr ρ (t)A (6.18)

ahora calcularemos la evolucion temporal de ρ (t), partiendo de la Ecuacion de Schrodinger y su conjugada

d

dtρ (t) =

d

dt[|ψ (t)〉 〈ψ (t)|] =

[d

dt|ψ (t)〉

]〈ψ (t)|+ |ψ (t)〉

[d

dt〈ψ (t)|

]

=1

i~H (t) |ψ (t)〉 〈ψ (t)|+ 1

(−i~) |ψ (t)〉 〈ψ (t)|H (t) =1

i~H (t) ρ (t)− 1

i~ρ (t)H (t)

d

dtρ (t) =

1

i~[H (t) , ρ (t)]

Page 251: Mecanica Cuantica: Notas de Clase

6.2. OPERADOR DENSIDAD 251

veamos ahora como se escribe la probabilidad P (an) de obtener el valor an cuando se mide el observable A, enterminos del operador densidad. La Ec. (4.8) nos muestra que P (an) es el valor esperado del proyector Pn sobreel autoespacio generado por an

P (an) = 〈ψ (t)|Pn |ψ (t)〉 = 〈Pn〉 (6.19)

y usando (6.18) en (6.19) se obtieneP (an) = 〈Pn〉 = Tr Pnρ (t) (6.20)

otras propiedades del operador densidad se siguen directamente de su definicion Ec. (6.15)

ρ† (t) = ρ (t) ; ρ2 (t) = ρ (t) ; Trρ2 (t) = 1

En resumen, hemos encontrado las siguientes expresiones para el operador densidad y su relacion con losobservables fısicos

〈A〉 (t) = Tr ρ (t)A ; P (an) = Tr Pnρ (t) (6.21)

i~d

dtρ (t) = [H (t) , ρ (t)] (6.22)

Trρ = 1, ρ† (t) = ρ (t) (6.23)

ρ2 (t) = ρ (t) ; Trρ2 (t) = 1 (6.24)

la segunda de las Ecs. (6.21) nos expresa la conservacion de la probabilidad en el lenguaje del operador densidad.Veremos que estas ecuaciones seran tambien validas en el caso de estados mezclados, excepto las Ecs. (6.24), lascuales provienen del hecho de que para estados puros, el operador densidad es un proyector.

Para el caso de estados puros, el formalismo de operador densidad es totalmente equivalente al de vectoresde estado. No obstante, el formalismo de operador densidad posee algunas ventajas incluso para estudiar estadospuros. Por ejemplo, los estados fısicamente equivalentes |ψ (t)〉 y eiθ |ψ (t)〉 estan asociados a un solo operadordensidad ρ (t) = |ψ (t)〉 〈ψ (t)| de modo que el operador densidad remueve la arbitrariedad introducida por lafase en el vector de estado. Por otra parte, las Ecs. (6.21, 6.22, 6.23) muestran que las formulas basicas para losobservables son lineales con respecto al operador densidad ρ (t). En contraste, las Ecs. (6.12, 6.19) son cuadraticasen el vector de estado |ψ (t)〉. Veremos que la linealidad simplificara el tratamiento considerablemente.

6.2.3. Mezcla estadıstica de estados: estados no puros

Estudiaremos ahora la incorporacion del operador densidad para la caracterizacion de estados mezclados, enlos cuales no es posible una caracterizacion por vectores de estado. Sea pn la probabilidad de encontrar al sistemaen el estado accesible |ψn〉. Estas probabilidades pk son numeros reales que satisfacen las condiciones

0 ≤ pk ≤ 1 ;∑

k

pk = 1 (6.25)

veamos como calcular la probabilidad P (an) de que al medir el observable A se obtenga el valor an. Comenzaremospor evaluar la probabilidad Pk (an) de obtener el valor an del observable A, cuando el sistema se encuentra en elestado |ψk〉, puesto que tal probabilidad sale directamente de los postulados

Pk (an) = 〈ψk|Pn |ψk〉

para obtener P (an) debemos entonces ponderar esta probabilidad con la probabilidad pk de que el sistema esteen el estado |ψk〉 2, para luego sumar sobre todos los estados accesibles

P (an) =∑

k

pkPk (an) (6.26)

2Esto nos da la probabilidad de que ocurran simultaneamnte dos hechos: (a) que el estado del sistema sea |ψk〉 y (b) que el valorobtenido en la medida del observable A sea an.

Page 252: Mecanica Cuantica: Notas de Clase

252 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

Pk (an) es una probabilidad asociada a un estado puro (con vector de estado |ψk〉) de modo que podemos evaluarlaaplicando la Ec. (6.20)

Pk (an) = Tr ρkPn (6.27)

siendo ρk = |ψk〉 〈ψk| el operador densidad asociado al vector de estado |ψk〉. Para obtener P (an) en terminos delos operadores densidad ρk sustituımos (6.27) en (6.26)

P (an) =∑

k

pkTr ρkPn = Tr

k

pkρkPn

(6.28)

observese que si definimos

ρ (t) ≡∑

k

pkρk (t) (6.29)

y sustituımos esta definicion en (6.28), obtendremos una expresion para estados mezclados analoga a la Ec. (6.20)para estados puros

P (an) = Tr ρPn (6.30)

es natural entonces definir a ρ en la Ec. (6.29), como el operador densidad asociado al sistema en un estadomezclado. Notese que ρ es el promedio ponderado de los operadores ρk asociados a estados puros.

6.2.4. Propiedades generales del operador densidad

Derivaremos las propiedades del operador densidad para estados mezclados. Obviamente, tales propiedadesdeben contener como caso particular las propiedades del operador densidad para estados puros, para lo cual debehacerse pk = δkm. Calculemos primero la traza de ρ

Trρ = Tr

[∑

k

pkρk

]=∑

k

pkTrρk =∑

k

pk = 1

donde hemos usado las Ecs. (6.29, 6.17, 6.25). La expresion para la probabilidad Ec. (6.30) coincide con la expresionpara estados puros, con la extension apropiada del operador densidad Ec. (6.29). Veamos lo que ocurre con elvalor esperado de un observable

〈A〉 =∑

k

pk 〈Ak〉 =∑

k

pkTr ρkA = Tr

[∑

k

pkρk

]A

〈A〉 = Tr ρA

esto tambien se puede ver usando la Ec. (6.30) en la forma

〈A〉 =∑

n

anP (an) =∑

n

anTr ρPn = Tr

ρ∑

n

anPn

= Tr ρA

donde hemos usado el teorema espectral Ec. (1.98), Pag. 52. Calculemos ahora la evolucion temporal del operadordensidad para estados mezclados. Para ello asumiremos que a diferencia del estado del sistema, su Hamiltonianoesta bien definido. En otras palabras, el sistema como tal esta perfectamente definido aunque no lo este su estado.Puede verse facilmente que si en el tiempo t0 el sistema tiene una probabilidad pk de estar en el estado |ψk〉entonces en un tiempo posterior t, tiene la misma probabilidad de estar en el estado |ψk (t)〉 3. Si el sistema esta

3Esto se puede ver teniendo en cuenta que la probabilidad de que en el tiempo t el sistema este en el estado |ψk (t)〉 es la composicionde dos probabilidades: (i) La probabilidad pk de que en t0 el sistema este en el estado |ψk (t0)〉 y (ii) la probabilidad pt de que estandoel sistema en el estado |ψk (t0)〉 en t0, quede en el estado |ψk (t)〉 en el tiempo posterior t. La probabilidad total es el producto de lasdos probabilidades. Sin embargo, la probabilidad del segundo evento es pt = 1 debido a la naturaleza determinista de la ecuacion deSchrodinger. Notese que para que el segundo evento sea determinista, es necesario que el Hamiltoniano del sistema este bien definido(y por tanto la Ec. de Schrodinger), aunque el estado inicial no este bien definido.

Page 253: Mecanica Cuantica: Notas de Clase

6.2. OPERADOR DENSIDAD 253

en el estado |ψk〉 (puro) en t0, la evolucion temporal esta dada por la ecuacion de Schrodinger

i~d

dt|ψk (t)〉 = H (t) |ψk (t)〉 ; |ψk (t0)〉 = |ψk〉

el operador densidad en el tiempo t esta dado por

ρ (t) =∑

k

pkρk (t) (6.31)

donde hemos usado el hecho ya mencionado de que pk no evoluciona en el tiempo. Usando (6.22, 6.31) encontramosque

dρ (t)

dt=

k

pkdρk (t)

dt=∑

k

pk1

i~[H (t) , ρk (t)] =

1

i~

[H (t) ,

k

pkρk (t)

]=

1

i~[H (t) , ρ]

i~dρ (t)

dt= [H (t) , ρ]

notese que hemos usado la linealidad de las Ecs. (6.22, 6.31) con respecto a ρk (t) para obtener la evoluciontemporal de ρ. Vemos entonces que la ecuacion de evolucion temporal es totalmente analoga a la obtenida paraestados puros Ec. (6.22).

Notese sin embargo, que ρ definido por (6.31) no es un proyector (a menos que pk = δkm, en cuyo caso tenemosun estado puro). Se puede verificar que cuando el estado es mezclado i.e. pk 6= δkm tenemos que

ρ2 6= ρ ; Trρ2 < 1 (6.32)

y que verificando una sola de las ecuaciones (6.24) nos dice que el sistema esta en un estado puro. En conclusion,utilizando la definicion (6.31) del operador densidad ρ para estados mezclados, se obtienen las Ecs. (6.21-6.23),pero las Ecs. (6.24) para estados puros son reemplazadas por las Ecs. (6.32) para estados mezclados.

Demostraremos adicionalmente que ρ es un operador positivo, en primer lugar es claro que ρ es hermıtico puestoque pk son numeros reales no negativos y cada ρk es hermıtico. Adicionalmente, si tomamos un ket arbitrario |u〉podemos escribir

〈u| ρ |u〉 =∑

k

pk 〈u| ρk |u〉 =∑

k

pk 〈u|ψk〉〈ψk |u〉 =∑

k

pk |〈u|ψk〉|2

〈u| ρ |u〉 ≥ 0 (6.33)

donde hemos usado el hecho de que las probabilidades pk son no negativas. Esto demuestra que ρ es un operadorpositivo.

Resumimos estos resultados en la siguiente forma: sea un sistema que esta en una mezcla estadıstica de estadoscon estados accesibles |ψk〉, cada uno de ellos asociado a una probabilidad pk, definimos el operador densidadρ con las siguientes propiedades

ρ (t) ≡∑

k

pkρk (t) ; ρk (t) ≡ |ψk〉 〈ψk| (6.34)

ρ = ρ† ; Trρ = 1 ; ρ es un operador positivo (6.35)

ρ2 (t) = ρ (t) ; Trρ2 (t) = 1 para estados puros (i.e. pk = δkm) (6.36)

ρ2 (t) 6= ρ (t) ; Trρ2 (t) < 1 para estados mezclados (i.e. pk 6= δkm) (6.37)

〈A〉 (t) = Tr ρ (t)A ; P (an) = Tr Pnρ (t) (6.38)

i~d

dtρ (t) = [H (t) , ρ (t)] (6.39)

Page 254: Mecanica Cuantica: Notas de Clase

254 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

6.2.5. Populaciones y coherencias

Veremos ahora el significado Fısico de los elementos matriciales ρnp de ρ en una cierta base |un〉 de vectorespropios asociados a un cierto observable A que por simplicidad asumimos no degenerado. Consideremos primerolos elementos diagonales ρnn. De acuerdo con (6.34) estos elementos estan dados por

ρnn =∑

k

pk [ρk]nn =∑

k

pk [|ψk〉 〈ψk|]nn =∑

k

pk〈un |ψk〉 〈ψk|un〉 =∑

k

pk |〈un |ψk〉|2

ρnn =∑

k

pk

∣∣∣c(k)n

∣∣∣2

; c(k)n ≡ 〈un |ψk〉 (6.40)

los factores∣∣∣c(k)n

∣∣∣2son cantidades positivas que fısicamente se interpretan de la siguiente manera: Si el estado del

sistema es |ψk〉 y si se mide el observable A cuyos vectores propios estan dados por la base |un〉, entonces∣∣∣c(k)n

∣∣∣2

es la probabilidad de que el sistema quede preparado en el estado |un〉 despues de la medida de A 4.Ahora bien, la Ec. (6.40), nos dice que ρnn es la suma ponderada (a traves de las probabilidades asociadas a

los estados) de las probabilidades arriba mencionadas. En otras palabras, ρnn representa la probabilidad promediode encontrar al sistema en el estado |un〉. Este promedio surge de la indeterminacion que tenemos sobre el estadoinicial del sistema. Por las razones anteriores, ρnn se conoce como la populacion del estado |un〉; puesto que sirealizaramos la misma medida un numeroN de veces para sistemas identicos bajo las mismas condiciones iniciales5

con N → ∞, entonces un numero Nρnn de sistemas estaran en el estado |un〉. Es claro ademas de la Ec. (6.40),

que ρnn es un numero real positivo, igual a cero solo si todos los∣∣∣c(k)n

∣∣∣2son cero.

Con un calculo muy similar se encuentran los elementos no diagonales de ρ en la base |un〉

ρnp =∑

k

pkc(k)n c(k)∗p ; c(k)n ≡ 〈un |ψk〉 (6.41)

los terminos cruzados c(k)n c

(k)∗p son del mismo tipo que los estudiados en la seccion 5.9.1. Por tanto, ellos expresan

los efectos de interferencia entre los estados |un〉 y |up〉 que pueden surgir cuando el estado |ψk〉 es una superposicionlineal coherente de estos estados. La Ec. (6.41) nos dice que ρnp es el promedio de estos terminos cruzados tomadossobre todos los estados accesibles de la mezcla estadıstica. A diferencia de las populaciones, ρnp se puede anularincluso si los terminos cruzados no son nulos, esto se debe a que estos terminos cruzados son numeros complejos(y no numeros reales no negativos como ocurre con los ρnn). Si un ρnp es cero, significa que hay una cancelacionestadıstica de los efectos de interferencia entre los estados |un〉 y |up〉. Por otro lado, si ρnp no es cero, decimosque existe cierta coherencia entre estos estados. Por esta razon, a los elementos no diagonales ρnp suele llamarselescoherencias.

Es importante mencionar que la distincion entre populaciones y coherencias depende de la base |un〉 escogidaen el espacio de estados, o en otras palabras del observable A para el cual construımos la base |un〉 de vectorespropios. Puesto que ρ es hermıtico, es posible encontrar una base ortonormal |χl〉 donde ρ sea diagonal, ρ sepuede escribir entonces en la forma

ρ =∑

l

πl |χl〉 〈χl|

4Si existe degeneracion, de modo que A∣∣uin

⟩= an

∣∣uin⟩, solo podremos decir que

∑gni=1

∣∣∣c(k)n,i

∣∣∣2

es la probabilidad de que al medir el

observable A el sistema quede en un estado que pertenece al subespacio Ean . En otras palabras, es la probabilidad de que al medir Ael sistema quede en algun estado asociado al valor propio an. Sin embargo, el estado especıfico no es unico, ya que depende del estadodel sistema antes de la medida cuando hay degeneracion.

5En este caso, las mismas condiciones iniciales no significan que el sistema parta siempre del mismo estado |ψk〉. Lo que significa esque en el momento inicial para cada experimento, el sistema posee los mismo estados accesibles |ψk〉 con las mismas ponderacionespk para estos. Podemos decir que el sistema esta en la misma condicion mezclada inicial, ya que para cada experimento, el operadordensidad es el mismo en el tiempo inicial.

Page 255: Mecanica Cuantica: Notas de Clase

6.3. APLICACIONES DEL OPERADOR DENSIDAD 255

siendo πl los valores propios de ρ y |χl〉 sus vectores propios. Dado que ρ es positivo, sus valores propios son realesno-negativos y puesto que Trρ =

∑l πl = 1 tenemos que

0 ≤ πl ≤ 1 ;∑

l

πl = 1

por tanto se puede considerar que ρ describe una mezcla estadıstica de sus propios autoestados |χl〉 con probabi-lidades πl. Claramente, no hay coherencias entre los estados |χl〉.

Usando la Ec. (6.33) se puede demostrar que

ρnnρpp ≥ |ρnp|2

de esto se obtiene en particular, que ρ solo puede tener coherencias entre estados cuya populacion es no nula.Esto es razonable ya que implica que un estado puede generar una coherencia con otro, solo si forma parte de losestados accesibles del sistema.

Un caso interesante ocurre cuando la base elegida |un〉 son autovectores del Hamiltoniano, y este ultimo nodepende explıcitamente del tiempo. Por simplicidad, asumiremos que el Hamiltoniano es no degenerado. Tenemosentonces que

H |un〉 = En |un〉usando la Ec. (6.39) y teniendo en cuenta que |un〉 y En no dependen del tiempo (ya que el Hamiltoniano nodepende del tiempo) se encuentra que

〈un|(i~d

dtρ

)|up〉 = 〈un| [H, ρ] |up〉 ⇒ i~

d

dt〈un| ρ |up〉 = 〈un| [Hρ− ρH] |up〉

⇒ i~dρnpdt

= 〈un| [Enρ− ρEp] |up〉 ⇒ i~dρnpdt

= (En − Ep) 〈un| ρ |up〉

i~dρnpdt

= (En − Ep) ρnp

conviene colocar los terminos diagonales y no diagonales por aparte

i~dρnndt

= 0 ; i~dρnpdt

= (En − Ep) ρnp

de lo cual se deduce

ρnn (t) = constante ; ρnp = ei~(Ep−En)tρnp (0)

de modo que las populaciones relativas a estados propios del Hamiltoniano son constantes, y sus coherenciasoscilan a las frecuencias de Bohr del sistema.

6.3. Aplicaciones del operador densidad

6.3.1. Sistema en equilibrio termodinamico

Este ejemplo es tomado de la mecanica estadıstica cuantica. Consideremos un sistema termodinamico enequilibrio con un bano termico a temperatura absoluta T . Se puede mostrar que su operador densidad es

ρ = Z−1e−H/kT ; Z ≡ Tre−H/kT

donde H es el Hamiltoniano del sistema, k la constante de Boltzmann y Z es una funcion de normalizacion(conocida como funcion de particion) para mantener la traza de ρ igual a la unidad.

Page 256: Mecanica Cuantica: Notas de Clase

256 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

Vamos a calcular las populaciones y coherencias para la base ortonormal |un〉 asociada a los autoestados delHamiltoniano. Los elementos matriciales de ρ estaran dados por

ρnp = Z−1 〈un| e−H/kT |up〉 = Z−1 〈un| e−Ep/kT |up〉 = Z−1e−Ep/kT 〈un|up〉ρnp = Z−1e−Ep/kT δnp

vemos entonces que en el equilibrio termodinamico, las populaciones de los estados estacionarios |un〉 son funcionesexponencialmente decrecientes de la energıa, ademas el decrecimiento es mas rapido a medida que disminuye latemperatura. Por otro lado, las coherencias entre los estados estacionarios son nulas.

6.3.2. Descripcion de subsistemas con base en observables globales de un sistema: el con-cepto de traza parcial

Volveremos a estudiar sistemas consistentes en dos subsistemas (1) y (2) como se describio en la seccion 6.1.Sea E (1) [E (2)] el espacio de estados del subsistema (1) [(2)], y sea |un (1)〉 [|vp (2)〉] una base ortonormal enel espacio E (1) [E (2)]. El espacio de estados para el sistema global E y una base ortonormal para dicho espaciose obtienen como

E = E (1)⊗ E (2) ; |un (1)〉 ⊗ |vp (2)〉 ≡ |un (1)〉 |vp (2)〉 ≡ |un (1) vp (2)〉

Sea un observable A que actua en el espacio E . Ya hemos estudiado como extender un operador que provienede uno de los espacios factores. Ahora estudiaremos un proceso inverso: con base en el operador A que actua enel espacio producto, encontraremos un operador A (1) que actua en el espacio E (1), y que nos permitira hacerpredicciones fısicas sobre el sistema (1). Esta operacion se denominara la traza parcial con respecto al sistema (2).Naturalmente, se puede inducir analogamente el operador A (2) sobre el sistema (2) usando la traza parcial conrespecto al sistema (1).

Introduciremos el operador A (1) por medio del operador A, definiendo los elementos matriciales de A (1) enla base |un (1)〉 de E (1)

〈un (1)|A (1) |un′ (1)〉 ≡∑

p

〈un (1) vp (2)|A |un′ (1) vp (2)〉 = 〈un (1)|∑

p

[〈vp (2)|A |vp (2)〉]|un′ (1)〉 (6.42)

como esta definicion es valida para cualquier base |un (1)〉 de E (1) tenemos

A (1) ≡∑

p

[〈vp (2)|A |vp (2)〉] (6.43)

si definimos la traza parcial con respecto al sistema (2) de un operador A sobre E en la forma

Tr2A ≡∑

p

〈vp (2)|A |vp (2)〉 (6.44)

podemos escribir la definicion de A (1), Ec. (6.43) en la forma

A (1) ≡ Tr2A (6.45)

para comprender el concepto de traza parcial, escribamos la traza “normal” de un operador A en terminos de labase |un (1)〉 |vp (2)〉 de E

TrA =∑

n

p

〈un (1) vp (2)|A |un (1) vp (2)〉 (6.46)

comparando (6.46) con (6.44) vemos que la apariencia de las dos ecuaciones es similar, excepto que en (6.44) solose suma sobre la base del sistema (2). Por esta razon, hablamos de la traza parcial de A con respecto al sistema

Page 257: Mecanica Cuantica: Notas de Clase

6.3. APLICACIONES DEL OPERADOR DENSIDAD 257

(2). Notese ademas que la traza parcial con respecto al sistema (2) de un operador A sobre E , es un operadoren E (1). Esta es una gran diferencia con respecto a la traza normal, la cual es un numero complejo. Para ver quedicha traza parcial es un operador sobre E (1), aplicaremos esta traza parcial sobre un ket |ψ (1)〉 ∈ E (1)

A (1) |ψ (1)〉 ≡ (Tr2A) |ψ (1)〉 ≡∑

m

〈vm (2)|A |vm (2)〉 |ψ (1)〉 =∑

m

〈vm (2)| A |vm (2)ψ (1)〉

y dado que A |vm (2)ψ (1)〉 es un ket en el espacio E = E (1)⊗ E (2), se puede escribir como una superposicion dela base |un (1)〉 |vp (2)〉 de E , por tanto

A (1) |ψ (1)〉 =∑

m

〈vm (2)|∑

n,p

cnp |un (1)〉 |vp (2)〉

=∑

m

〈vm (2)| vp (2)〉∑

n,p

cnp |un (1)〉

⇒ A (1) |ψ (1)〉 =∑

n,p

cnp |un (1)〉 ≡ |χ (1)〉 ∈ E (1)

como se querıa demostrar. Veamos ahora como se escribe la traza normal de A en terminos de las trazas parcialessobre los sistemas (1) y (2).

TrA =∑

n

p

〈un (1)| 〈vp (2)|A |vp (2)〉 |un (1)〉 =∑

n

〈un (1)|∑

p

〈vp (2)|A |vp (2)〉|un (1)〉

=∑

n

〈un (1)| Tr2A |un (1)〉 = Tr1 (Tr2A)

asumiendo que las sumatorias pueden intercambiarse encontramos que

TrA = Tr1 (Tr2A) = Tr2 (Tr1A) (6.47)

Es facil ver que la traza parcial con respecto al sistema (1) de un operador sobre E (1) es un numero complejo, eigualmente cuando tomamos el sistema (2). Por esta razon, si tomamos la traza parcial con respecto a (1) y luegola traza parcial con respecto a (2) (o viceversa) de un observable A sobre E , el resultado es un numero complejocomo se ve en la Ec. (6.47).

Obtendremos ahora la traza (normal) de A (1) (calculada sobre E (1)). Para ello usamos la Ec. (6.43), con locual se obtiene

TrA (1) =∑

n

〈un|A (1) |un〉 =∑

n

〈un|[∑

p

〈vp (2)|A |vp (2)〉]|un〉 =

n

p

〈unvp (2)|A |unvp (2)〉

TrA (1) = TrA (6.48)

En conclusion la traza de A (calculada sobre E) coincide con la traza de A (1) (calculada sobre E (1)) y obviamentetambien coincide con la traza de A (2) (calculada sobre E (2)).

Adicionalmente, es facil ver a partir de la Ec. (6.43), que si A es hermıtico entonces A (1) y A (2) tambien loson.

6.3.3. Traza parcial y operador densidad

Una de las aplicaciones de mayor interes del concepto de traza parcial se obtiene cuando lo aplicamos aloperador densidad ρ sobre E = E (1)⊗E (2). Puesto que la traza de ρ es igual a la unidad, la traza de ρ (1) y ρ (2)tambien lo sera, de acuerdo con la Ec. (6.48). Ası mismo, los operadores ρ (1) y ρ (2) tambien seran hermıticos y engeneral, puede demostrarse que ρ (1) y ρ (2) satisfacen todas las propiedades de un operador densidad establecidasen la seccion 6.2.46.

6Sin embargo, la evolucion temporal de ρ (1) o ρ (2) no viene en general dada por la Ec. (6.39).

Page 258: Mecanica Cuantica: Notas de Clase

258 CAPITULO 6. APLICACION DE LOS POSTULADOS CON INFORMACION PARCIAL

Sea ademas A (1) un observable definido sobre E (1). La Ec. (6.38) nos dice que el valor esperado del observableA (1) ≡ A (1)⊗ I2 sobre E esta dado por

⟨A (1)

⟩= Tr

ρA (1)

=∑

n,p

〈un (1) vp (2)|[ρA (1)

]|un (1) vp (2)〉

=∑

n,p

〈un (1) vp (2)| ρ

n′,p′

∣∣un′ (1) vp′ (2)⟩ ⟨un′ (1) vp′ (2)

∣∣ (A (1)⊗ I2) |un (1) vp (2)〉

=∑

n,p

n′,p′〈un (1) vp (2)| ρ

∣∣un′ (1) vp′ (2)⟩〈un′ (1)|A (1) |un (1)〉

⟨vp′ (2)

∣∣ I2 |vp (2)〉

=∑

n,p

n′,p′〈un (1) vp (2)| ρ

∣∣un′ (1) vp′ (2)⟩〈un′ (1)|A (1) |un (1)〉 δpp′

con lo cual es valor esperado de A (1) queda

⟨A (1)

⟩=

n,n′

[∑

p

〈un (1) vp (2)| ρ |un′ (1) vp (2)〉]〈un′ (1)|A (1) |un (1)〉

⟨A (1)

⟩=

n,n′〈un (1)|

[∑

p

〈vp (2)| ρ |vp (2)〉]|un′ (1)〉 〈un′ (1)|A (1) |un (1)〉

pero el factor dentro de parentesis cuadrados es el elemento matricial de ρ (1), como se observa en la definicion(6.43). Con lo cual tenemos

⟨A (1)

⟩=

n,n′[〈un (1)| ρ (1) |un′ (1)〉] 〈un′ (1)|A (1) |un (1)〉 =

n

n′[ρ (1)]nn′ [A (1)]n′n =

n

[ρ (1)A (1)]nn

⟨A (1)

⟩= Tr [ρ (1)A (1)] (6.49)

comparando con la expresion (6.38) vemos que la traza parcial ρ (1) nos permite calcular los valores esperados de

observables del tipo⟨A (1)

⟩como si el sistema (1) estuviera aislado y tuviera a ρ (1) como su operador densidad.

Similarmente, obtenemos una expresion analoga a la segunda de las Ecs. (6.38) para calcular probabilidadesasociadas a observables del tipo A (1), es decir para resultados de medidas realizadas solo sobre el sistema (1).

En la seccion 6.1.2, vimos que no es posible asignar un vector de estado al sistema (1), si el estado del sistemaglobal (1) + (2) no esta descrito por un producto tensorial de estados de E (1) y E (2). Esto nos muestra otraventaja del operador densidad: independientemente de que el sistema global este o no este en un producto deestados, o de que el sistema este en un estado puro o mezclado, siempre es posible construır un operador densidadρ (1) asociado al subsistema (1), utilizando las trazas parciales. Esto permite el calculo de todas las cantidadesasociadas solo con el sistema (1). En contraste, para que podamos asignar un vector de estado a cada subsistemadel sistema global, se requiere que dicho sistema global este en un estado puro y que el vector de estado que lodescribe sea un producto tensorial de vectores de cada subsistema.

Por otro lado, se puede demostrar a partir de la Ec. (6.42) que Trρ2 (1)

no es en general igual a la unidad,

incluso si Trρ = Trρ2 = 1. Fısicamente, esto significa que incluso si ρ describe un estado puro, los operadoresdensidad ρ (1) y ρ (2) obtenidos por trazas parciales no necesariamente describen estados puros. En otras palabras,incluso si se puede asignar un vector de estado al sistema global, no es en general posible asignar un vector deestado al subsistema (1) [o al (2)], excepto en el caso en el cual el sistema global esta en un estado producto.

Lo anterior nos induce a estudiar el caso en el cual el sistema global esta en un estado producto

|ψ〉 = |ϕ (1)〉 ⊗ |χ (2)〉 = |ϕ (1)χ (2)〉 (6.50)

Page 259: Mecanica Cuantica: Notas de Clase

6.3. APLICACIONES DEL OPERADOR DENSIDAD 259

puesto que esto implica un estado puro, el operador densidad viene dado por la Ec. (6.15)

ρ = |ϕ (1)χ (2)〉 〈ϕ (1)χ (2)| = [|ϕ (1)〉 〈ϕ (1)|]⊗ [|χ (2)〉 〈χ (2)|]

esto se puede escribir en la forma

ρ = σ (1)⊗ τ (2) (6.51)

σ (1) ≡ |ϕ (1)〉 〈ϕ (1)| , τ (2) ≡ |χ (2)〉 〈χ (2)| (6.52)

Calculando las trazas parciales a partir de (6.44) se tiene que

Tr2 σ (1)⊗ τ (2) ≡∑

p

〈vp (2)| [σ (1)⊗ τ (2)] |vp (2)〉 = σ (1)∑

p

〈vp (2)| τ (2) |vp (2)〉

Tr2 σ (1)⊗ τ (2) = σ (1)Tr [τ (2)] = σ (1)

y similarmente para Tr1 σ (1)⊗ τ (2), con lo cual se obtiene

Tr2 σ (1)⊗ τ (2) = σ (1) ; Tr1 σ (1)⊗ τ (2) = τ (2) (6.53)

por tanto si el operador densidad esta descrito por (6.51), tal operador representa una simple yuxtaposicion de unsistema (1) descrito por el operador densidad σ(1), y un sistema (2) descrito por τ (2). No hay correlacion entreestos dos subsistemas.

Notese que los resultados arriba mencionados dependen de la Ec. (6.51), pero no de las Ecs. (6.50, 6.52). Estoimplica que la validez de (6.53) se extiende a un contexto mas general, ya que es posible encontrar estados delsistema en los cuales ρ se puede factorizar en la forma (6.51), pero en donde los operadores factor no necesariamenteson de la forma descrita por (6.52), es decir σ (1) y τ (2) pueden corresponder a estados puros y/o mezclados. Sial menos uno de los operadores σ (1) , τ (2) corresponde a un estado mezclado, el estado del sistema no estaradescrito por un vector de la forma (6.50). Lo anterior implica la simple yuxtaposicion de dos sistemas cada unoen un estado mezclado, pero que no estan correlacionados entre sı, y el sistema global sera en general mezclado.

Page 260: Mecanica Cuantica: Notas de Clase

Capıtulo 7

Formulaciones alternativas de la mecanicacuantica

7.1. Operador evolucion temporal: definicion y propiedades

En la seccion 3.3.2 vimos que la transformacion que nos lleva de un estado inicial |ψ (t0)〉 al estado |ψ (t)〉 delmismo sistema en un instante posterior t, es una transformacion lineal descrita por la Ec. (3.23)

|ψ (t)〉 = U (t, t0) |ψ (t0)〉 (7.1)

por otro lado, vimos en la seccion 3.3.3, que los kets |ψ (t)〉 poseen la misma norma para todo tiempo, propiedadfundamental para obtener conservacion de la probabilidad. Esto implica entonces que el operador U (t, t0) debeser unitario (debe conservar la norma). Caracterizar este operador conocido como operador evolucion temporal,es en todo sentido equivalente fısicamente a resolver la ecuacion de Schrodinger. Una primera propiedad que sedesprende directamente de la definicion Eq. (7.1) es que

U (t0, t0) = I (7.2)

escribiendo la Ec. de Schrodinger en el lenguaje de los kets y usando la Eq. (7.1) se tiene

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (7.3)

i~

[∂

∂tU (t, t0)

]|ψ (t0)〉 = H (t)U (t, t0) |ψ (t0)〉

y teniendo en cuenta que el estado inicial es en principio arbitrario, podemos escribir

i~∂

∂tU (t, t0) = H (t)U (t, t0) (7.4)

vemos que (7.4) es una ecuacion diferencial de primer orden para U (t, t0) que debe cumplir la condicion inicial(7.2). Las Ecs. (7.2, 7.4) se pueden sintetizar en una sola ecuacion integral

U (t, t0) = I − i

~

∫ t

t0

H(t′)U(t′, t0

)dt′

La Ec. (7.1) es valida para todos los valores de t y t0 (de momento no hemos introducido causalidad), por tantopodemos escribir

|ψ (t1)〉 = U (t1, t0) |ψ (t0)〉 (7.5)

|ψ (t2)〉 = U (t2, t1) |ψ (t1)〉 (7.6)

260

Page 261: Mecanica Cuantica: Notas de Clase

7.1. OPERADOR EVOLUCION TEMPORAL: DEFINICION Y PROPIEDADES 261

y sustituyendo (7.5) en (7.6) se tiene

|ψ (t2)〉 = U (t2, t1) [U (t1, t0) |ψ (t0)〉]|ψ (t2)〉 = [U (t2, t1)U (t1, t0)] |ψ (t0)〉 (7.7)

de la misma forma, la accion de U (t2, t0) se puede escribir usando (7.1)

|ψ (t2)〉 = U (t2, t0) |ψ (t0)〉 (7.8)

y puesto que |ψ (t2)〉 y |ψ (t0)〉 son arbitrarios, la comparacion de las Ecs. (7.7, 7.8) nos da

U (t2, t0) = U (t2, t1)U (t1, t0) (7.9)

este procedimiento se puede generalizar para escribir

U (tn, t0) = U (tn, tn−1)U (tn−1, tn−2) . . . U (t2, t1)U (t1, t0) (7.10)

donde t0, t1, . . . , tn son arbitrarios. Si asumimos causalidad i.e. t0 < t1 < . . . < tn, la Ec. (7.10) se puede interpretardiciendo que el sistema evoluciona desde t0 pasando progresivamente por los estados intermedios t1, t2, . . .,tn−1

hasta llegar a tn. Si usamos t0 = t2 en (7.9) y tenemos en cuenta (7.2) llegamos a

U (t2, t2) = I = U (t2, t1)U (t1, t2)

U (t1, t2) = U−1 (t2, t1) (7.11)

es importante insistir en que t1 y t2 son arbitrarios y no se ha asumido causalidad. La relacion (7.11) es sinembargo muy logica desde el punto de vista causal.

Veremos como es el operador evolucion temporal infinitesimal, es decir el que conecta a un tiempo t con untiempo t+ dt, para ello escribimos la ecuacion de Schrodinger (7.3) en forma diferencial

i~ d |ψ (t)〉 = H (t) |ψ (t)〉 dt ⇒ [|ψ (t+ dt)〉 − |ψ (t)〉] = − i

~H (t) |ψ (t)〉 dt ⇒

|ψ (t+ dt)〉 =

[I − i

~H (t) dt

]|ψ (t)〉 (7.12)

de la definicion de operador evolucion temporal se tiene

|ψ (t+ dt)〉 = U (t+ dt, t) |ψ (t)〉 (7.13)

comparando (7.12) con (7.13) se tiene que

U (t+ dt, t) =

[I − i

~H (t) dt

]

vemos que el operador infinitesimal de evolucion temporal es unitario a primer orden ya que H es hermıtico

U † (t+ dt, t) =

[I +

i

~H (t) dt

]⇒

U (t+ dt, t)U † (t+ dt, t) =

[I − i

~H (t) dt

] [I +

i

~H (t) dt

]

U (t+ dt, t)U † (t+ dt, t) = I +O((dt)2

)

una transformacion unitaria finita se obtiene con sucesivas transformaciones infinitesimales, este proceso de inte-gracion solo requiere terminos de primer orden ya que los de segundo orden continuan yendo a cero cuando setoma el lımite. Por tanto, el operador finito de evolucion temporal sera tambien unitario como tenıa que ser

U † (t1, t2) = U−1 (t1, t2) = U (t2, t1)

Page 262: Mecanica Cuantica: Notas de Clase

262 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

7.1.1. Operador evolucion temporal para sistemas conservativos

Cuando H no es funcion del tiempo, la Ec. (7.4) junto con la condicion inicial (7.2) se pueden integrar paraobtener1

U (t, t0) = e−iH(t−t0)/~ (7.14)

es facil verificar que este operador es unitario y que U (t0, t) = U−1 (t, t0). La unitariedad de U (t, t0) (y por tantola conservacion de la probabilidad) esta directamente relacionada con la hermiticidad de H. Una vez mas, vemos elpapel clave de la hermiticidad del Hamiltoniano en la conservacion de la probabilidad. A manera de consistencia,vamos a encontrar la Ec. (5.67) a partir de la Ec. (5.66) aplicando el operador evolucion temporal para sistemasconservativos. La Ec. (5.66) es una expansion del estado inicial del sistema en la base |ϕn,τ 〉 de estados propiosdel Hamiltoniano

|ψ (t0)〉 =∑

n

τ

cn,τ (t0) |ϕn,τ 〉 ; cn,τ (t0) ≡ 〈ϕn,τ |ψ (t0)〉 (7.15)

al aplicar el operador evolucion temporal a un |ϕn,τ 〉 queda

U (t, t0) |ϕn,τ 〉 = e−iH(t−t0)/~ |ϕn,τ 〉 =∞∑

k=0

1

k!

[− i

~H (t− t0)

]k|ϕn,τ 〉 =

∞∑

k=0

1

k!

[− i

~(t− t0)

]kHk |ϕn,τ 〉

=

∞∑

k=0

1

k!

[− i

~(t− t0)

]kEkn |ϕn,τ 〉 =

∞∑

k=0

1

k!

[− i

~En (t− t0)

]k|ϕn,τ 〉

U (t, t0) |ϕn,τ 〉 = e−iEn(t−t0)/~ |ϕn,τ 〉 (7.16)

aplicando U (t, t0) a ambos lados de la Ec. (7.15) y teniendo en cuenta que este operador es lineal tenemos

U (t, t0) |ψ (t0)〉 =∑

n

τ

cn,τ (t0) U (t, t0) |ϕn,τ 〉

|ψ (t)〉 =∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉 (7.17)

donde hemos usado (7.16). Esta ecuacion coincide con (5.67).

7.1.2. Observaciones adicionales sobre el operador evolucion temporal (opcional)

Cuando H depende explıcitamente del tiempo podrıamos pensar en analogıa con la ecuacion (7.14), que eloperador evolucion temporal es igual al operador V (t, t0) dado por

V (t, t0) = e− i

~

∫ tt0H(t′) dt′

sin embargo, esto no es correcto en general, dado que la derivada de un operador de la forma eF (t) no es en generaligual a F ′ (t) eF (t) (ver Eq. 1.148, pag. 79) de modo que en este caso

i~∂V (t, t0)

∂t6= H (t)V (t, t0)

Consideremos ahora los experimentos descritos en la seccion 5.9.3 en los cuales se llegaba desde el mismoestado inicial |ua〉 hasta el mismo estado final |vc〉 de dos maneras: (1) Efectuando medidas de los observables Ay C obteniendo dichos estados y (2) Efectuando sucesivamente medidas de los observables A,B y C donde parael estado intermedio se obtiene |wb〉. En la discusion de la seccion 5.9.3 se asumio que las medidas se hacıan enintervalos muy cortos de modo que el sistema no tenıa tiempo de evolucionar. Ahora asumiremos que las medidas

1Aplicando la Ec. (1.147) Pag. 78, al operador en (7.14), podemos verificar que se cumple la Ec. (7.4).

Page 263: Mecanica Cuantica: Notas de Clase

7.2. BRAS, KETS Y OBSERVABLES EQUIVALENTES 263

se hacen en intervalos en los cuales la evolucion temporal es apreciable. Para el primer caso asumimos que elsistema esta en el estado |ua〉 en t0, y |vc〉 en t2. Para el segundo caso asumimos que el sistema esta en el estado|ua〉 en t0, en el estado |wb〉 en t1 y finalmente en el estado |vc〉 en t2. Es decir t0, t1 y t2 definen los tiempos enque se realizan las medidas.

En tal situacion, la Ec. (5.86) se convierte en

Pa (c) =∣∣〈vc|ψ

(t−2)〉∣∣2 = |〈vc|U (t2, t0) |ua〉|2 (7.18)

donde∣∣ψ(t−2)⟩

es el estado del sistema que evoluciona desde |ua〉 en t0 hasta el instante justo antes de la medidade C, por eso la notacion t−2 , es claro que

∣∣ψ(t+2)⟩

= |vc〉 (estado justo despues de la medida de C). La Ec. (5.87)queda

Pa (b, c) =∣∣〈vc|φ

(t−2)〉∣∣2 ∣∣〈wb|ψ

(t−1)〉∣∣2 = |〈vc|U (t2, t1) |wb〉|2 |〈wb|U (t1, t0) |ua〉|2 (7.19)

siendo∣∣φ(t−2)⟩

el estado del sistema justo antes de la medida de C, cuando el sistema evoluciona a partir delestado |wb〉 en t1. El estado

∣∣ψ(t−1)⟩

describe al sistema justo antes de la medida de B cuando evoluciona desde|ua〉 en t0.

Ahora usando la Ec. (7.9) se tiene

〈vc|U (t2, t0) |ua〉 = 〈vc|U (t2, t1)U (t1, t0) |ua〉〈vc|U (t2, t0) |ua〉 =

b

〈vc|U (t2, t1) |wb〉 〈wb|U (t1, t0) |ua〉 (7.20)

sustituyendo (7.20) en la Ec. (7.18), y comparando el resultado con la Ec. (7.19), se puede verificar que al igualque en la ecuacion (5.90) se tiene que

Pa (c) 6=∑

b

Pa (b, c)

7.2. Bras, kets y observables equivalentes

A traves de la discusion de los postulados de la mecanica cuantica y sus consecuencias, hemos observado quelas predicciones de la mecanica cuantica tales como valores accesibles de un observable, probabilidades, valoresesperados del observable etc. estan expresados en terminos de ecuaciones de valores propios y productos escalares,es decir expresiones de la forma

A |η〉 = a |η〉 ; m = 〈φ|A |ψ〉 (7.21)

donde |η〉 , |φ〉 , |ψ〉 se refiere a estados arbitrarios del sistema y A es un observable (operador hermıtico completo).Desde este punto de vista los bras, kets y observables (entendidos estos ultimos como operadores hermıticoscompletos) no son cantidades medibles sino solo herramientas para calcular los verdaderos observables fısicos(valores propios y productos escalares). Esto es analogo a lo que ocurre con los potenciales escalar y vectorial enelectrodinamica los cuales son excelentes herramientas pero no corresponden a observables fısicos.

Esto indica que si los kets, bras y observables se redefinen de manera que no se alteran los valores propios nilos productos escalares, tendremos una imagen diferente pero totalmente equivalente fısicamente desde el puntode vista de los postulados. La alternativa mas evidente para hacer este cambio de imagen es el uso de operadoresunitarios ya que estos no alteran el valor del producto interno. Vamos a reexpresar el producto interno en (7.21)insertando operadores identidad a traves de un operador unitario I = O†O = OO†

〈φ|A |ψ〉 = 〈φ|(O†O

)A(O†O

)|ψ〉 =

[〈φ|O†

] (OAO†

)[O |ψ〉]

〈φ|A |ψ〉 = 〈Oφ|(OAO†

)|Oψ〉 (7.22)

ahora redefinimos los operadores, kets y bras en la forma

A′ ≡ OAO† ;∣∣ψ′⟩ ≡ |Oψ〉 = O |ψ〉 ;

⟨ψ′∣∣ ≡ 〈Oψ| = 〈ψ|O† (7.23)

Page 264: Mecanica Cuantica: Notas de Clase

264 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

y combinando las Ecs. (7.22, 7.23) es claro que

〈φ|A |ψ〉 =⟨φ′∣∣A′ ∣∣ψ′⟩ (7.24)

adicionalmente puede verificarse que el espectro de valores propios de A′ coincide con el de A, y los vectorespropios de A′ estan dados por |η′〉 ≡ O |η〉 , siendo |η〉 los kets propios de A

A |η〉 = a |η〉 ⇒ OA |η〉 = aO |η〉 ⇒ OA(O†O

)|η〉 = aO |η〉

⇒(OAO†

)[O |η〉] = a [O |η〉]

se deduce entonces que

A |η〉 = a |η〉 ⇒ A′ ∣∣η′⟩= a

∣∣η′⟩

; A′ ≡ OAO† ,∣∣η′⟩≡ O |η〉

En conclusion, los nuevos bras, kets y operadores mantienen intactos los valores propios y productos internosasociados con los observables fısicos y por tanto describen la misma Fısica que los bras, kets y operadores originales.

7.2.1. La transformada de un operador y sus propiedades

Si tomamos la igualdad expresada en (7.24) para los elementos de una base del espacio

〈ui|A |uj〉 =⟨u′i∣∣A′ ∣∣u′j

tal igualdad se puede interpretar diciendo que el elemento matricial A′ij de A′ en la base

∣∣∣u′j⟩

coincide con el

elemento matricial Aij de A en la base |uj〉; siendo ambas bases ortonormales (conectadas por una transformacionunitaria). En este contexto se dice que A′ es la transformada del operador A. La transformada A′ posee propiedadesmuy utiles, ya vimos que el espectro de ambos operadores es identico y sus vectores propios estan conectados poruna transformacion unitaria. Las siguientes propiedades se obtienen de la definicion

(A′)† =

(OAO†

)†= OA†O† =

(A†)′

en particular, se obtiene que

A = A† ⇔ A′ =(A′)†

de modo que la hermiticidad se preserva con esta relacion. Vemos ademas que la transformada de A esta conectadacon A por una transformacion de similaridad, con el requerimiento de que el operador que realiza la transformacionsea unitario. Como las transformaciones de similaridad preservan el producto, es claro que

(A′)n = (An)′

y usando la definicion para una funcion F (A) del operador A, Ec. (1.131) se obtiene

F ′ (A) = F(A′) (7.25)

donde en este caso F ′ (A) significa la transformada de la funcion F (A) con respecto al operador O, y no laderivada de F (A) “con respecto a A” (ver notacion en la seccion 1.34.1 Eq. 1.137). Para los conmutadores de lastransformadas de dos operadores A y B tenemos

[A′, B′] =

[OAO†, OBO†

]=(OAO†

)(OBO†

)−(OBO†

)(OAO†

)

= OA(O†O

)BO† −OB

(O†O

)AO† = OABO† −OBAO† = O (AB −BA)O†

[A′, B′] = O [A,B]O† = [A,B]′ (7.26)

Page 265: Mecanica Cuantica: Notas de Clase

7.3. LA IMAGEN DE SCHRODINGER Y LA IMAGEN DE HEISENBERG 265

de modo que el conmutador de las transformadas es la transformada del conmutador. Si el conmutador es propor-cional a la identidad (observables conjugados) tenemos

[Q,P ] = αI ⇒[Q′, P ′] = O [Q,P ]O† = αOIO† = αI

[Q,P ] = αI ⇒[Q′, P ′] = [Q,P ] (7.27)

el caso mas importante son los observables X,P para los cuales vemos que el conmutador de sus transformadasX ′, P ′, es identico al de los operadores originales.

7.3. La imagen de Schrodinger y la imagen de Heisenberg

Denotaremos a los kets, bras y observables originalmente utilizados en la mecanica cuantica como |ψS〉 , 〈ψS | ,AS ; indicando que estan en la “imagen de Schrodinger”. En esta imagen, los observables basicos X,P no dependendel tiempo y los observables que se construyen con ellos solo pueden tener dependencia explıcita con el tiempo(excluiremos el espın por ahora) de modo que AS = AS (X,P, t), simplificaremos la notacion a AS = AS (t). Laevolucion temporal del estado en la imagen de Schrodinger se obtiene a traves de la ecuacion de Schrodinger (deallı el nombre de la imagen) o equivalentemente, a traves del operador evolucion temporal Ec. (7.1)

|ψS (t)〉 = U (t, t0) |ψS (t0)〉 ⇒ |ψS (t0)〉 = U † (t, t0) |ψS (t)〉 (7.28)

donde hemos tenido en cuenta que U (t, t0) es unitario, y por tanto tambien lo es U † (t, t0). Notese que definiendoa O ≡ U † (t, t0) como el operador unitario para transformar bras, kets y observables, segun la Ec. (7.23), vemosque la Ec. (7.28) nos conduce a que los nuevos bras y kets seran independientes del tiempo. Denotaremos a losnuevos bras, kets y operadores con el subındice H para indicar “la imagen de Heisenberg”. Usando O ≡ U † (t, t0)en las Ecs. (7.23) y aplicando la Ec. (7.28) se obtiene

|ψH〉 ≡ U † (t, t0) |ψS (t)〉 = |ψS (t0)〉 ; 〈ψH | ≡ 〈ψS (t)|U (t, t0) = 〈ψS (t0)| (7.29)

AH ≡ U † (t, t0)AS (t)U (t, t0) (7.30)

la Ec. (7.29) nos muestra que en la imagen de Heisenberg, los kets y bras no poseen evolucion temporal y suvalor coincide con el del estado en la imagen de Schrodinger en t0. Por otro lado, incluso los observables A que enla imagen de Schrodinger no dependen del tiempo, adquieren dependencia temporal en la imagen de Heisenbergcomo se aprecia en la Ec. (7.30). Se tiene entonces que la evolucion temporal en la imagen de Heisenberg recaecompletamente en los operadores.

Calculemos la evolucion temporal del operador AH (t) para un operador arbitrario AS (t). Derivando la Ec.(7.30) y usando la Ec. (7.4) ası como su adjunta, se tiene que

dAH (t)

dt=

dU † (t, t0)dt

AS (t)U (t, t0) + U † (t, t0)dAS (t)

dtU (t, t0) + U † (t, t0)AS (t)

dU (t, t0)

dtdAH (t)

dt= − 1

i~U † (t, t0)H

†S (t)AS (t)U (t, t0) + U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~U † (t, t0)AS (t)HS (t)U (t, t0)

Page 266: Mecanica Cuantica: Notas de Clase

266 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

insertando un operador identidad apropiadamente tenemos

dAH (t)

dt= − 1

i~U † (t, t0)HS (t)

[U (t, t0)U

† (t, t0)]AS (t)U (t, t0) + U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~U † (t, t0)AS (t)

[U (t, t0)U

† (t, t0)]HS (t)U (t, t0)

dAH (t)

dt= − 1

i~

[U † (t, t0)HS (t)U (t, t0)

] [U † (t, t0)AS (t)U (t, t0)

]+ U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~

[U † (t, t0)AS (t)U (t, t0)

] [U † (t, t0)HS (t)U (t, t0)

]

dAH (t)

dt= − 1

i~HH (t)AH (t) + U † (t, t0)

(dAS (t)

dt

)U (t, t0) +

1

i~AH (t)HH (t)

i~dAH (t)

dt= [AH (t) , HH (t)] + i~

(dAS (t)

dt

)

H

(7.31)

una ecuacion muy similar a la ecuacion para un observable clasico u (q, p) que es funcion del espacio de fase q, p,en donde tenemos corchete de Poisson en lugar de conmutador (ver Ec. 5.53, Pag. 222). A manera de consistencia,veremos que es facil reproducir la Ec. (5.52) teniendo en cuenta que por construccion

〈A〉 (t) = 〈ψS (t)|AS (t) |ψS (t)〉 = 〈ψH |AH (t) |ψH〉

teniendo en cuenta la Ec. (7.31) y el hecho de que en la imagen de Heisenberg los estados no dependen del tiempose tiene

d 〈A〉 (t)dt

= 〈ψH |dAH (t)

dt|ψH〉 = 〈ψH |

1

i~[AH (t) , HH (t)] +

(dAS (t)

dt

)

H

|ψH〉

d 〈A〉 (t)dt

=1

i~〈[AH (t) , HH (t)]〉H +

⟨(dAS (t)

dt

)

H

H

(7.32)

una vez mas, por construccion estas cantidades son iguales al caso en que todo lo evaluamos en la imagen deSchrodinger, de modo que sustituyendo el subındice H por S en la Ec. (7.32), se reproduce la Ec. (5.52). Notesesin embargo, que la expresion (7.31) es mas general que la Ec. (5.52) ya que la ultima es valida solo para valoresesperados en tanto que (7.31) es valida para los operadores como tal.

7.3.1. Algunos sistemas simples en la imagen de Heisenberg

Tomemos el caso de una partıcula no-relativista unidimensional de masa m sometida a un potencial del tipoV (XS , t). Usando la Ec. (7.25), tenemos que

HS (t) =P 2S

2m+ V (XS , t) ; HH (t) =

P 2H

2m+ V (XH , t) (7.33)

la Ec. (7.27) nos dice que[XH , PH ] = [XS , PS ] = i~ (7.34)

sustituyendo (7.33, 7.34) en (7.31) se obtiene la evolucion temporal de los operadores XH , PH

i~dXH (t)

dt= [XH (t) , HH (t)] + i~

(dXS

dt

)

H

=

[XH (t) ,

P 2H

2m+ V (XH , t)

]

=

[XH (t) ,

P 2H

2m

]=PH2m

[XH (t) , PH ] + [XH (t) , PH ]PH2m

= i~PHm

dXH (t)

dt=

PHm

Page 267: Mecanica Cuantica: Notas de Clase

7.4. LA IMAGEN DE INTERACCION 267

i~dPH (t)

dt= [PH (t) , HH (t)] + i~

(dPSdt

)

H

=

[PH (t) ,

P 2H

2m+ V (XH , t)

]

= [PH (t) , V (XH , t)] = −i~∂XHV (XH , t)

dPH (t)

dt= −∂V (XH , t)

∂XH

donde se ha usado la Ec. (1.141) pag. 77. Hemos obtenido entonces la evolucion temporal de los observables basicosen la imagen de Heisenberg

dXH (t)

dt=PHm

;dPH (t)

dt= −∂V (XH , t)

∂XH(7.35)

estas ecuaciones son una generalizacion del teorema de Ehrenfest Ec. (5.55) Pag. 223, ya que estas ecuaciones sonvalidas para los operadores como tal y no solo para sus valores esperados.

Vemos que la analogıa con las ecuaciones clasicas es mas fuerte en la imagen de Heisenberg. En la imagen deSchrodinger, la analogıa aparece solo cuando se toman los valores esperados de los observables. En contraste, enla imagen de Heisenberg la analogıa aparece directamente en la ecuaciones de movimiento para los observables.

Un sistema simple de amplio interes ocurre cuando el sistema es conservativo (HS es independiente del tiempo),y el observable AS conmuta con el Hamiltoniano HS . Para sistemas conservativos, el operador evolucion temporalesta dado por (7.14)

U (t, t0) = e−i~HS(t−t0)

si AS conmuta con HS tambien conmuta con eαHS de modo que conmuta con U (t, t0). El observable asociado enla imagen de Heisenberg queda entonces

AH (t) = U † (t, t0)AS (t)U (t, t0) = U † (t, t0)U (t, t0)AS (t) = AS (t)

En conclusion, si el sistema es conservativo y AS conmuta con HS, los observables en las imagenes de Schrodinger yde Heisenberg coinciden. Como caso particular, HS = HH para sistemas conservativos. Notese que no es necesarioque AS sea constante de movimiento, ya que en general hemos permitido que AS (t) sea funcion explıcita deltiempo.

7.4. La imagen de interaccion

Consideremos un sistema fısico descrito por un Hamiltoniano H0S en la imagen de Schrodinger. Denotaremosel operador evolucion temporal asociado a H0S como U0 (t, t0) de modo que se cumplen las Ecs. (7.4)

i~∂U0 (t, t0)

∂t= H0S (t) U0 (t, t0) ; U0 (t0, t0) = I (7.36)

asumimos ahora que el sistema es “perturbado” por cierta interaccion adicional, de modo que el Hamiltoniano semodifica en la forma

HS (t) = H0S (t) +WS (t) (7.37)

definiremos una transformacion unitaria para kets, bras y observables a traves del operador evolucion temporaldel “Hamiltoniano no perturbado” H0S. Por tanto, los nuevos kets, bras y observables se definiran como

|ψI (t)〉 ≡ U †0 (t, t0) |ψS (t)〉 ; 〈ψI (t)| ≡ 〈ψS (t)|U0 (t, t0) ; AI ≡ U †

0 (t, t0)AS U0 (t, t0) (7.38)

notese que en ausencia de perturbacion i.e. cuando WS (t) = 0, el ket |ψI (t)〉 es independiente del tiempo (ytodo coincide con la imagen de Heisenberg). No obstante, la presencia de WS (t) hace que |ψI (t)〉 tenga aundependencia temporal. Coloquialmente, podemos decir que el operador unitario elegido, “absorbe” la dependenciatemporal del ket debida a H0S dejandonos solo con la dependencia temporal causada por WS (t). Ya veremos que

Page 268: Mecanica Cuantica: Notas de Clase

268 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

las ecuaciones de movimiento apoyan esta vision cualitativa de la situacion. Las Ecs. (7.36, 7.37, 7.38), describenlo que se denomina la “imagen de interaccion”.

Primero describiremos la dinamica de los kets |ψI (t)〉 en la imagen de interaccion. Derivando la primera delas Ecs. (7.38) resulta

i~d |ψI (t)〉

dt≡ i~

dU †0 (t, t0)

dt|ψS (t)〉+ i~U †

0 (t, t0)d |ψS (t)〉

dt

y usando las Ecs. (7.36, 7.3) tenemos

i~d |ψI (t)〉

dt≡ −U †

0 (t, t0)H0S (t) |ψS (t)〉+ U †0 (t, t0)HS (t) |ψS (t)〉

= −U †0 (t, t0)H0S (t)

[U0 (t, t0)U

†0 (t, t0)

]|ψS (t)〉

+U †0 (t, t0)HS (t)

[U0 (t, t0)U

†0 (t, t0)

]|ψS (t)〉

i~d |ψI (t)〉

dt= −

[U †0 (t, t0)H0S (t)U0 (t, t0)

] [U †0 (t, t0) |ψS (t)〉

]

+[U †0 (t, t0)HS (t)U0 (t, t0)

] [U †0 (t, t0) |ψS (t)〉

]

i~d |ψI (t)〉

dt=

U †0 (t, t0) [HS (t)−H0S (t)]U0 (t, t0)

[U †0 (t, t0) |ψS (t)〉

]

=[U †0 (t, t0)WS (t)U0 (t, t0)

] [U †0 (t, t0) |ψS (t)〉

]

quedando finalmente

i~d |ψI (t)〉

dt=WI (t) |ψI (t)〉 (7.39)

de modo que la evolucion temporal del ket |ψI (t)〉 en la imagen de interaccion esta regida solo por el termino deperturbacion como se habıa anticipado. Es facil demostrar que la ecuacion diferencial (7.39) es equivalente a laecuacion integral dada por

|ψI (t)〉 = |ψI (t0)〉+1

i~

∫ t

t0

dt′ WI

(t′) ∣∣ψI

(t′)⟩

(7.40)

Teniendo en cuenta la Ec. (7.38) y el hecho de que U0 (t0, t0) = I, obtenemos la condicion

|ψI (t0)〉 = |ψS (t0)〉

la ecuacion integral (7.40) se puede resolver por iteracion de manera que |ψI (t)〉 queda escrita como una expansionen series de potencias integrales de WI (t)

|ψI (t)〉 =I +

1

i~

∫ t

t0

dt1 WI (t1) +

(1

i~

)2 ∫ t

t0

dt1 WI (t1)

∫ t1

t0

dt2WI (t2) + . . .

|ψI (t0)〉 (7.41)

Estudiemos ahora la evolucion temporal de los observables en esta imagen. Para esto se deriva en el tiempo latercera de las ecuaciones (7.38), el procedimiento es muy similar al realizado para obtener la Ec. (7.31), el unicodetalle a tener en cuenta es que aquı se usa U0 (t, t0) que esta asociado a H0S , de modo que el analogo a la Ec.(7.31) queda

i~dAI (t)

dt= [AI (t) , H0I (t)] + i~

(dAS (t)

dt

)

I

(7.42)

las ecuaciones de evolucion (7.39) y (7.42) muestran que los kets de estado tienen solo a WI (t) como fuentede cambio, en tanto que los operadores tiene solo a H0I como fuente de cambio. Cada parte del Hamiltoniano

Page 269: Mecanica Cuantica: Notas de Clase

7.4. LA IMAGEN DE INTERACCION 269

contribuye a uno u otro cambio, a diferencia de la imagen de Schrodinger en donde la dinamica de los kets estaregida por el Hamiltoniano completo, o la de Heisenberg en la cual la dinamica de los operadores se rige por elHamiltoniano completo.

Es notable que la Ec. (7.39) para los kets, se asemeja a la ecuacion de Schrodinger en la imagen del mismonombre, aunque en la Ec. (7.39) solo aparece la perturbacion. Analogamente, la Ec. (7.42) para los operadores seasemeja a la Ec. (7.31) en la imagen de Heisenberg, aunque en (7.42) solo aparece el Hamiltoniano no perturbado.

Si por ejemplo, WS (t) es mucho menor2 que H0S (t), la dinamica del vector |ψI (t)〉 es mucho mas “suave”que la dinamica de |ψS (t)〉. Este hecho facilita el uso de diversos metodos de aproximacion. En la practica, estaimagen resulta util cuando H0S es un Hamiltoniano suficientemente simple para conocer su solucion analıtica,de modo que WS (t) se considera una perturbacion que se puede evaluar por diferentes metodos. Dado que losoperadores toman sus valores no perturbados (que en principio se asumen conocidos), podemos concentrarnossolo en la evolucion de los kets |ψI〉 que en general tienen una evolucion suave. Por ejemplo H0S puede ser laenergıa cinetica (solucion de partıcula libre como caso no perturbado) y WS (t) puede ser la energıa potencial, oH0S puede ser la energıa cinetica mas una parte de la energıa potencial que sea suficientemente simple, y WS (t)contiene interacciones externas adicionales mas complejas.

2Naturalmente, la comparacion entre dos observables se refiere en realidad a la comparacion entre sus valores propios.

Page 270: Mecanica Cuantica: Notas de Clase

Capıtulo 8

El oscilador armonico cuantico

El oscilador armonico es un sistema de gran importancia en la fısica clasica. Tal importancia radica en elhecho de que todo movimiento acotado alrededor de un punto de equilibrio estable puede ser aproximado aun movimiento armonico simple, siempre que las oscilaciones sean suficientemente pequenas. La cuantizaciondel oscilador armonico aparece en el nacimiento mismo de la mecanica cuantica, ya que la hipotesis de Planckconsistio en cuantizar los modos normales que estan asociados a osciladores armonicos en el interior de un cuerponegro. Adicionalmente, las pequenas oscilaciones alrededor del equilibrio tambien estan presentes en el mundomicroscopico, como es el caso de las vibraciones de moleculas diatomicas o de los atomos alrededor del puntode equilibrio en un red cristalina, etc. Puesto que en estos casos las “elongaciones” alrededor del equilibrio soncomparables a la longitud de onda de De Broglie de los objetos que vibran, es claro que las correcciones cuanticasseran importantes para estos sistemas que se comportan como osciladores armonicos.

8.1. Propiedades generales del oscilador armonico cuantico unidimensional

El Hamiltoniano cuantizado del oscilador armonico sera de la forma

H =P 2

2m+

1

2mω2X2 (8.1)

puesto que H no es funcion del tiempo, el oscilador armonico cuantico define un sistema conservativo. En conse-cuencia, el estudio mecanico cuantico de dicho sistema se reduce al estudio de su ecuacion de valores propios

H |ϕ〉 = E |ϕ〉

que en la base |x〉 se escribe como

[− ~2

2m

d2

dx2+

1

2mω2x2

]ϕ (x) = E ϕ (x) (8.2)

antes de resolver en detalle la ecuacion de valores propios vale la pena mencionar que la forma del potencial

V (x) =1

2kx2 =

1

2mω2x2

nos permite obtener algunas propiedades generales de las soluciones. En primer lugar, los autovalores del Hamil-toniano son positivos, ya que se puede mostrar que en general si la funcion potencial tiene una cota inferior, losautovalores E de un Hamiltoniano de la forma

H =P 2

2m+ V (X)

270

Page 271: Mecanica Cuantica: Notas de Clase

8.2. EL PROBLEMA DE VALORES PROPIOS DEL HAMILTONIANO 271

son mayores que el mınimo de V (x) de modo que si V (x) ≥ Vm ⇒ E > Vm. Para nuestro caso Vm = 0 y portanto E > 0.

Por otro lado, debido a que el potencial es una funcion par en el argumento x

V (−x) = V (x)

existen autofunciones ψ (x) de H en la base |x〉 con paridad definida (pares o impares en x). Veremos que estocombinado con el hecho de que el espectro no es degenerado, nos conduce a que las funciones de onda asociadascon los estados estacionarios son necesariamente pares o impares.

Adicionalmente, es bien sabido que el movimiento clasico esta limitado a un intervalo acotado para cualquiervalor de la energıa total del oscilador. Con base en este hecho, se puede demostrar que todos los autovalores deenergıa son discretos.

Veremos ahora el problema de valores propios en detalle.

8.2. El problema de valores propios del Hamiltoniano

Veremos que el espectro de energıas de la ecuacion de valores propios

H |ϕ〉 = E |ϕ〉

se puede resolver con base en las relaciones canonicas de conmutacion

[X,P ] = i~

por conveniencia utilizaremos los siguientes operadores adimensionales

X ≡√mω

~X ; P ≡ P√

m~ω(8.3)

con los cuales, las relaciones canonicas de conmutacion quedan[X, P

]= i (8.4)

y el Hamiltoniano se puede escribir en la forma

H = ~ωH ; H ≡ 1

2

(X2 + P 2

)(8.5)

podemos entonces simplificar la ecuacion de valores propios en la forma

H∣∣ϕiν⟩= εν

∣∣ϕiν⟩

donde tanto el operador H como los valores propios εν son adimensionales. Los ındices ν, i pueden ser (por elmomento) contınuos o discretos y el ındice i nos indica el grado de degeneracion.

Notese que si X y P fueran numeros, podrıamos escribir H en (8.5) de la forma H =(X+iP√

2

)(X−iP√

2

), es decir

como el producto de dos funciones lineales. Sin embargo, dado que X y P son operadores no conmutantes, estafactorizacion no es correcta. Sin embargo, veremos que la redefinicion de estos operadores lineales nos simplificaconsiderablemente el problema de valores propios, definiremos entonces

a ≡ 1√2

(X + iP

); a† ≡ 1√

2

(X − iP

)(8.6)

a =

(√mω

2~X + i

P√2m~ω

); a† =

(√mω

2~X − i

P√2m~ω

)(8.7)

Page 272: Mecanica Cuantica: Notas de Clase

272 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

cuya inversa se escribe como

X =1√2

(a† + a

); P =

i√2

(a† − a

)(8.8)

X =

√~

2mω

(a† + a

); P = i

√m~ω

2

(a† − a

)(8.9)

el conmutador de a† y a se calcula con las reglas canonicas de conmutacion

[a, a†

]=

1

2

[X + iP , X − iP

]=

1

2

[X + iP , X

]− i

2

[X + iP , P

]

=1

2

[X, X

]+i

2

[P , X

]− i

2

[X, P

]− i

2

[iP , P

]

=i

2

[P , X

]+i

2

[P , X

]= i[P , X

]

y usando la Ec. (8.4) queda [a, a†

]= I (8.10)

esta relacion es entonces equivalente a las reglas canonicas de conmutacion. Ahora queremos escribir el Hamilto-niano en terminos de los operadores a, a†, para ello calculamos primero el producto a†a 1

a†a =1

2

(X − iP

)(X + iP

)=

1

2

(X2 + P 2 + iXP − iP X

)

a†a =1

2

(X2 + P 2 + i

[X, P

])

a†a =1

2

(X2 + P 2 − I

)(8.11)

de aquı en adelante reemplazamos la identidad I por el numero 1 lo cual no es causa de ambiguedad. Notese quela presencia del termino adicional I/2 es debido a la no conmutatividad de X y P . Comparando (8.5) con (8.11)vemos que el Hamiltoniano adimensional sera

H = N +1

2; N ≡ a†a (8.12)

es claro que el nuevo operador N es Hermıtico

N † =(a†a)†

= (a)†(a†)†

= a†a = N

por otro lado el Hamiltoniano adimensional tambien se puede escribir como

H = aa† − 1

2

ahora bien, de acuerdo con la Ec. (8.12), H y N solo difieren en un operador que es multiplo de la identidad. Enconsecuencia, los autovectores de H son autovectores de N y viceversa.

Ahora calcularemos los conmutadores de N con a y a† por medio de la Ec. (8.10)

[N, a] =[a†a, a

]= a† [a, a] +

[a†, a

]a = −a

[N, a†

]=

[a†a, a†

]= a†

[a, a†

]+[a†, a†

]a = a†

1De acuerdo con la discusion anterior este producto serıa el Hamiltoniano si los operadores P , X fueran conmutantes.

Page 273: Mecanica Cuantica: Notas de Clase

8.3. DETERMINACION DEL ESPECTRO 273

en resumen, el algebra de conmutadores entre a, a† y N se escribe

[a, a†

]= 1 ; [N, a] = −a ;

[N, a†

]= a† (8.13)

donde tambien hemos tenido en cuenta la Ec. (8.10). Veremos que la ecuacion de valores propios se resolvera enterminos de las propiedades de los operadores a, a† y N . De momento, hemos reducido el problema a encontrarlos vectores y valores propios del operador N

N∣∣ϕiν⟩= ν

∣∣ϕiν⟩

y teniendo en cuenta las Ecs. (8.5, 8.12) los autovectores∣∣ϕiν⟩seran tambien autovectores del Hamiltoniano H

con autovalores E =(ν + 1

2

)~ω

H∣∣ϕiν⟩=

(ν +

1

2

)~ω∣∣ϕiν⟩

(8.14)

8.3. Determinacion del espectro

En todo lo que sigue, asumiremos que los∣∣ϕiν⟩estan normalizados. Calculemos la norma del vector a

∣∣ϕiν⟩.

Dicha norma es obviamente no negativa

∥∥a∣∣ϕiν⟩∥∥2 =

⟨ϕiν∣∣ a†a

∣∣ϕiν⟩=⟨ϕiν∣∣N

∣∣ϕiν⟩

∥∥a∣∣ϕiν⟩∥∥2 = ν

⟨ϕiν∣∣ϕiν〉 = ν ≥ 0 (8.15)

lo cual nos indica que

Lemma 1 Los valores propios del operador N son no negativos

La Ec. (8.15) nos muestra que∥∥a∣∣ϕiν⟩∥∥ = 0 ⇔ ν = 0 pero dado que

∥∥a∣∣ϕiν⟩∥∥ = 0 ⇔ a

∣∣ϕiν⟩= 0 se tiene que

a∣∣ϕiν⟩= 0 ⇔ ν = 0.

De acuerdo a lo anterior, si ν > 0 entonces a∣∣ϕiν⟩no es cero. Apliquemos ahora el conmutador [N, a] sobre el

autovector∣∣ϕiν⟩usando las reglas de conmutacion (8.13)

[N, a]∣∣ϕiν⟩

= −a∣∣ϕiν⟩⇒ Na

∣∣ϕiν⟩= aN

∣∣ϕiν⟩− a

∣∣ϕiν⟩= aν

∣∣ϕiν⟩− a

∣∣ϕiν⟩

N[a∣∣ϕiν⟩]

= (ν − 1)[a∣∣ϕiν⟩]

esta expresion nos indica que cuando ν > 0 el vector a∣∣ϕiν⟩es vector propio de N con autovalor ν− 1. Esto indica

ademas que ν ≥ 1 cuando ν > 0, ya que de lo contrario ν − 1 serıa un autovalor negativo de N contradiciendo ellema anterior. Estos resultados los podemos resumir en la siguiente forma

Lemma 2 Sea∣∣ϕiν⟩un autovector no nulo de N con autovalor ν. Tenemos que (a) a

∣∣ϕiν⟩= 0 ⇔ ν = 0. (b) Si

ν > 0 ⇒ a∣∣ϕiν⟩es un autovector no nulo de N con autovalor ν − 1.

El anterior lema nos caracteriza las propiedades de los vectores a∣∣ϕiν⟩, es natural entonces preguntarse por las

propiedades de los vectores a†∣∣ϕiν⟩. Con un proceso similar al anterior se tiene que

∥∥∥a†∣∣ϕiν⟩∥∥∥

2=

⟨ϕiν∣∣ aa†

∣∣ϕiν⟩=⟨ϕiν∣∣aa† − a†a+ a†a

∣∣ϕiν⟩=⟨ϕiν∣∣[a, a†

]+N

∣∣ϕiν⟩

∥∥∥a†∣∣ϕiν⟩∥∥∥

2=

⟨ϕiν∣∣ (1 +N)

∣∣ϕiν⟩= (ν + 1)

⟨ϕiν∣∣ϕiν〉

∥∥∥a†∣∣ϕiν⟩∥∥∥

2= ν + 1

Page 274: Mecanica Cuantica: Notas de Clase

274 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

donde hemos usado la Ec. (8.10). Puesto que ν ≥ 0 el vector a†∣∣ϕiν⟩es siempre no nulo. Ahora usando la Ec.

(8.13) calculemos

[N, a†

] ∣∣ϕiν⟩

= a†∣∣ϕiν⟩⇒ Na†

∣∣ϕiν⟩= a†N

∣∣ϕiν⟩+ a†

∣∣ϕiν⟩= νa†

∣∣ϕiν⟩+ a†

∣∣ϕiν⟩

N[a†∣∣ϕiν⟩]

= (ν + 1)[a†∣∣ϕiν⟩]

vemos que a†∣∣ϕiν⟩es un autovector de N con autovalor ν + 1. Lo anterior podemos resumirlo en la forma

Lemma 3 Sea∣∣ϕiν⟩un autovector no nulo de N con autovalor ν. Tenemos que (a) a†

∣∣ϕiν⟩es siempre no nulo.

(b) a†∣∣ϕiν⟩es un autovector de N con autovalor ν + 1.

Por ahora sabemos que el espectro de N es no negativo. Asumamos que ν no es entero y mostraremos queesta hipotesis contradice al lema 1 y por tanto debe ser rechazada. Si ν no es entero podemos encontrar un enteron tal que

n < ν < n+ 1 (8.16)

consideremos la sucesion de kets

∣∣ϕiν⟩, a∣∣ϕiν⟩, a2

∣∣ϕiν⟩, . . . , ap

∣∣ϕiν⟩, . . . , an

∣∣ϕiν⟩

(8.17)

aplicaremos iterativamente el lema 2.∣∣ϕiν⟩= a0

∣∣ϕiν⟩es por hipotesis un autovector no nulo de N con valor

propio ν0 = ν − 0. Ahora a∣∣ϕiν⟩de acuerdo con el lema es un autovector no nulo (ya que ν > 0) de N con

valor propio ν1 = ν − 1, podemos denotar entonces a∣∣ϕiν⟩≡∣∣ϕiν−1

⟩. Otra aplicacion del lema lleva a que si

v − 1 > 0 entonces a2∣∣ϕiν⟩= a

∣∣ϕiν−1

⟩es un autovector no nulo de N con valor propio ν2 = ν − 2. En general

ap∣∣ϕiν⟩= a

[ap−1

∣∣ϕiν⟩]

= a∣∣ϕiν−p+1

⟩es autovector no nulo de N con valor propio ν − p, siempre y cuando se

cumpla que ν − p+ 1 > 0. Adicionalmente, puesto que ν no es entero, ν − p es no nulo, con lo cual el lema 1, nosdice que ν − p > 0. A su vez, de la Ec. (8.16) vemos que la condicion ν − p > 0 solo se cumple en el intervalo0 ≤ p ≤ n.

En sıntesis, de acuerdo con el lema 2, un vector ap∣∣ϕiν⟩de la sucesion (8.17) con 0 ≤ p ≤ n, es un autovector

no nulo de N con valor propio ν − p > 0.Veamos ahora que pasa con un vector fuera de la sucesion para lo cual calculamos

an+1∣∣ϕiν⟩= a

[an∣∣ϕiν⟩]

an∣∣ϕiν⟩es un autovector no nulo de N con valor propio v−n > 0 (de acuerdo con la Ec. 8.16). Por tanto podemos

aplicar el lema 2 para decir que an+1∣∣ϕiν⟩es autovector de N con autovalor ν − n − 1 pero este valor propio es

estrictamente negativo de acuerdo con la Ec. (8.16). Esto contradice el lema 1 por lo cual debemos rechazar lahipotesis de que ν es no entero.

Lo anterior se puede describir de otra forma diciendo que ap∣∣ϕiν⟩con 0 ≤ p ≤ n es autovector de N donde los

valores propios νp tienen la siguiente caracterıstica: ν0 = ν ∈ (n, n+ 1); ν1 ∈ (n− 1, n); v2 ∈ (n− 2, n − 1) ; . . . ;νn−1 ∈ (1, 2); νn ∈ (0, 1). Al aplicar de nuevo el operador a, el valor propio correspondiente quedarıa en el intervalo(−1, 0) que esta prohibido por el lema 1.

Veremos ahora que la hipotesis de que ν es entero es perfectamente consistente con los lemas anteriores, en talcaso la Ec. (8.16) se cambia por

n = ν < n+ 1

y el ket an∣∣ϕiν⟩es un autovector no nulo de N con valor propio v − n = 0. Como su valor propio es cero, el lema

2 nos dice que2

an+1∣∣ϕin⟩= 0 (8.18)

2Estrictamente, debemos escribir |0〉 a la derecha de la Ec. (8.18), ya que este es un elemento del espacio de Hilbert (vector nulo).Sin embargo, no se presenta confusion al usar el sımbolo 0.

Page 275: Mecanica Cuantica: Notas de Clase

8.3. DETERMINACION DEL ESPECTRO 275

por tanto el conjunto de vectores diferentes obtenida por aplicacion reiterada de a sobre∣∣ϕiν⟩esta limitada cuando

ν = n es entero, ya que el lema 2 predice que para todo entero m ≥ n+ 1 tenemos que am∣∣ϕiν⟩= 0, y se obtiene

el vector cero para cualquier aplicacion adicional del operador a. De esta manera se evita la contradiccion con ellema 1 evitando valores propios negativos.

Veremos ahora que el espectro de N consta de todos los enteros no negativos. Ya hemos construıdo un auto-vector de N con valor propio nulo: an

∣∣ϕin⟩≡∣∣ϕi0⟩. Ahora bien, el lema 3 nos dice que la aplicacion sucesiva de a†

sobre∣∣ϕi0⟩nos genera autoestados

(a†)k ∣∣ϕi0

⟩, con valor propio k, barriendo claramente todos los valores enteros

no negativos.Utilizando la Ec. (8.14) decimos que los autovalores de H tienen la forma

En =

(n+

1

2

)~ω ; n = 0, 1, 2, . . . (8.19)

vemos entonces que la energıa del oscilador armonico cuantico esta cuantizada, ya que no puede adquirir cualquiervalor. El espaciamiento entre los valores accesibles es ademas uniforme, es decir cada estado excitado consisteen agregar un cuanto ~ω al estado anterior. Adicionalmente, el estado base (estado de menor energıa) no poseeenergıa cero sino ~ω/2. Notese que el espaciamiento uniforme de los niveles de energıa del oscilador armonicocuantico con valor de espaciamiento ~ω, coincide con la hipotesis de Planck para el estudio de la radiacion delcuerpo negro.

8.3.1. Interpretacion de los operadores a, a† y N

Si comenzamos con un estado∣∣ϕin⟩de H con valor propio En =

(n+ 1

2

)~ω, la aplicacion de los operadores

a y a† sobre∣∣ϕin⟩nos da

a∣∣ϕin⟩

= αn−1

∣∣ϕin−1

⟩;∣∣ϕin−1

⟩→ En−1 =

[(n− 1) +

1

2

]~ω = En − ~ω

a†∣∣ϕin⟩

= αn+1

∣∣ϕin+1

⟩;∣∣ϕin+1

⟩→ En+1 =

[(n+ 1) +

1

2

]~ω = En + ~ω

N = a†a∣∣ϕin⟩= n

∣∣ϕin⟩

; n = 0, 1, 2, 3, . . .

vemos que la accion de a sobre∣∣ϕin⟩equivale a “extraer” un cuanto de energıa ~ω del valor de energıa En del

estado original. En otras palabras, su accion sobre un autovector de N (o de H) consiste en hacer desaparecer uncuanto de energıa. Por esta razon se denomina operador de destruccion o de aniquilacion.

Similarmente, la accion de a† sobre∣∣ϕin⟩equivale a “anadir” un cuanto de energıa ~ω al valor original de

energıa En. Su accion sobre un autovector de N (o de H) consiste en hacer aparecer un cuanto de energıa. Poresta razon se denomina operador de construccion o creacion.

Finalmente, vemos que el operador N aplicado sobre∣∣ϕin⟩nos da el valor n de cuantos que estan asociados

con el nivel de energıa (hay n cuantos agregados al valor del mınimo de la energıa). Por esta razon N se conocecomo operador numero.

8.3.2. Estudio de la degeneracion del espectro

Mostraremos que el espectro del oscilador armonico es no degenerado. Comenzaremos estudiando el estadobase. Todos los autoestados deH asociados a E0 = ~ω/2, o equivalentemente todos los autoestados de N asociadoscon n = 0, deben satisfacer segun el lema 2 la siguiente condicion

a∣∣ϕi0⟩= 0 (8.20)

debemos ver entonces cuantos kets linealmente independientes satisfacen esta condicion. Usando las Ecs. (8.7), laEc. (8.20) queda en la forma

Page 276: Mecanica Cuantica: Notas de Clase

276 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

1√2

[√mω

~X +

i√m~ω

P

] ∣∣ϕi0⟩

= 0 ⇒[√

~

√mω

~X +

√mω

~

i√m~ω

P

] ∣∣ϕi0⟩= 0 ⇒

[mω

~X +

i

~P

] ∣∣ϕi0⟩

= 0

que en la base |x〉 se escribe

(mω

~x+

d

dx

)ϕi0 (x) = 0 ; ϕi0 (x) = 〈x

∣∣ϕi0⟩

(8.21)

debemos entonces resolver la ecuacion diferencial de primer orden (8.21). Su solucion mas general es de la forma

ϕi0 (x) = ce−12mω~x2 (8.22)

siendo c una constante de integracion (solo hay una en virtud de que la ecuacion es de primer orden). Por tantotodas las soluciones no nulas posibles de (8.21) son linealmente dependientes. Existe por tanto un unico ket dentrode factores multiplicativos asociado a E0 = ~ω/2. Por tanto, el estado base es no degenerado3.

La demostracion de que los demas estados no son degenerados la haremos por induccion para lo cual ya tenemosel primer paso al demostrar que el estado base no es degenerado.

El segundo paso en la induccion es probar que si En = (n+ 1/2) ~ω no es degenerado entonces el nivelEn+1 = (n+ 1 + 1/2) ~ω tampoco lo es. Nuestra hipotesis es entonces que dentro de factores multiplicativos, solohay un vector |ϕn〉 tal que

N |ϕn〉 = n |ϕn〉 (8.23)

ahora consideramos un autovector∣∣ϕin+1

⟩correspondiente al autovalor n+1, donde el ındice i indica una posible

degeneracion

N∣∣ϕin+1

⟩= (n+ 1)

∣∣ϕin+1

⟩(8.24)

el lema 2 nos dice que a∣∣ϕin+1

⟩es un autovector no nulo de N con autovalor n. Dado que este ket no es degenerado

por hipotesis, tenemos que a∣∣ϕin+1

⟩es linealmente dependiente con |ϕn〉

a∣∣ϕin+1

⟩= ci |ϕn〉

si aplicamos a† a ambos lados se tiene

a†a∣∣ϕin+1

⟩= cia† |ϕn〉

N∣∣ϕin+1

⟩= cia† |ϕn〉 (8.25)

donde hemos usado la definicion de N Ec. (8.12). Combinando (8.24) con (8.25) se tiene

(n+ 1)∣∣ϕin+1

⟩= cia† |ϕn〉

∣∣ϕin+1

⟩=

ci

(n+ 1)

[a† |ϕn〉

](8.26)

el lema 3 nos dice que a† |ϕn〉 es autovector de N con autovalor (n+ 1). La expresion (8.26) nos muestra quetodos los kets

∣∣ϕin+1

⟩asociados al valor propio (n+ 1) son linealmente dependientes con a† |ϕn〉. Por tanto el valor

propio n + 1 es no degenerado y la demostracion esta completa. Todos los valores propios del Hamiltoniano sonno degenerados.

3Aunque aquı usamos la base |x〉, es claro que el grado de degeneracion es independiente de la base utilizada.

Page 277: Mecanica Cuantica: Notas de Clase

8.4. ESTADOS PROPIOS DEL HAMILTONIANO 277

8.4. Estados propios del Hamiltoniano

Ya que hemos resuelto el problema de valores propios, procederemos ahora a estudiar el problema de los ketspropios del Hamiltoniano del oscilador armonico unidimensional. Tomaremos como hipotesis de trabajo que N yH son observables, de modo que sus kets propios |ϕn〉 constituyen una base ortonormal4 de Ex, y se cumplenpor lo tanto, relaciones de ortonormalidad y completez

〈ϕn′ |ϕn〉 = δn′n ;∑

n

|ϕn〉 〈ϕn| = 1

la completez sera probada mas adelante utilizando la representacion |x〉, es decir calculando las funciones de ondaϕn (x) y mostrando que estas funciones son completas en el espacio de las funciones cuadraticamente integrablesen x.

Por otro lado N y H tienen un espectro no degenerado. Por tanto cada uno de estos observables constituyepor sı solo un C.S.C.O. en Ex.

8.4.1. Construccion de los kets propios con base en el ket del estado base

El ket |ϕ0〉 asociado al estado base i.e. a n = 0 en N y a E0 = ~ω/2 en H, es el vector en Ex que satisface lacondicion

a |ϕ0〉 = 0

y es unico salvo constantes de proporcionalidad. Si lo asumimos normalizado, la ambiguedad se reduce a solo unfactor de fase global arbitraria eiθ, con θ real. Aplicando el lema 3 pag 274, el vector |ϕ1〉 asociado a n = 1 esproporcional a a† |ϕ0〉

|ϕ1〉 = c1 a† |ϕ0〉 (8.27)

determinaremos c1 requiriendo que |ϕ1〉 este normalizado y que tal coeficiente sea real y positivo (es decir c1 sefija con fase cero). Para esto se calcula la norma de |ϕ1〉

〈ϕ1 |ϕ1〉 =〈ϕ0|

(a†)†c∗1

c1 a

† |ϕ0〉= |c1|2 〈ϕ0| aa† |ϕ0〉

y usando la regla de conmutacion (8.10) se obtiene

〈ϕ1 |ϕ1〉 = |c1|2 〈ϕ0|(a†a+ 1

)|ϕ0〉 = |c1|2 〈ϕ0| (N + 1) |ϕ0〉 = |c1|2 〈ϕ0| (0 + 1) |ϕ0〉

〈ϕ1 |ϕ1〉 = |c1|2 〈ϕ0|ϕ0〉 ⇒ c1 = 1

la Ec. (8.27) queda entonces|ϕ1〉 = a† |ϕ0〉

De manera similar construımos a |ϕ2〉 aplicando el operador creacion a† sobre |ϕ1〉

|ϕ2〉 = c2 a† |ϕ1〉 (8.28)

nuevamente requeriremos que c2 sea una constante real positiva que normalice a |ϕ2〉. De aquı en adelante estesera el requerimiento para todas las constantes con que se construyen los siguientes estados.

〈ϕ2 |ϕ2〉 = |c2|2 〈ϕ1| aa† |ϕ1〉 = |c2|2 〈ϕ1| (N + 1) |ϕ1〉 = |c2|2 〈ϕ1| (1 + 1) |ϕ1〉〈ϕ2 |ϕ2〉 = 2 |c2|2 = 1 ⇒ c2 =

1√2

4La ortonormalidad esta garantizada automaticamente, debido a la ausencia de degeneracion.

Page 278: Mecanica Cuantica: Notas de Clase

278 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

con lo cual la Ec. (8.28) queda

|ϕ2〉 =1√2a† |ϕ1〉 =

1√2

(a†)2

|ϕ0〉

este proceso se puede generalizar para construır al estado |ϕn〉 con base en el estado |ϕn−1〉

|ϕn〉 = cn a† |ϕn−1〉 (8.29)

〈ϕn |ϕn〉 = |cn|2 〈ϕn−1| aa† |ϕn−1〉 = |cn|2 〈ϕn−1| (N + 1) |ϕn−1〉 = |cn|2 〈ϕn−1| [(n− 1) + 1] |ϕn−1〉〈ϕn |ϕn〉 = n |cn|2 ⇒ cn =

1√n

con lo cual la Ec. (8.29) queda

|ϕn〉 =1√na† |ϕn−1〉 ; n = 1, 2, 3, . . . (8.30)

usando la Ec. (8.30) iterativamente, podemos conectar a |ϕn〉 con el estado base

|ϕn〉 =1√na† |ϕn−1〉 =

1√n

1√n− 1

(a†)2

|ϕn−2〉 =1√n

1√n− 1

1√n− 2

(a†)3

|ϕn−3〉

|ϕn〉 =1√n

1√n− 1

1√n− 2

. . .1√2

1√1

(a†)n

|ϕ0〉

quedando finalmente

|ϕn〉 =1√n!

(a†)n

|ϕ0〉 ; n = 0, 1, 2, 3, . . . (8.31)

En sıntesis, todos los autoestados de N y H se pueden construır con base en el autoestado base |ϕ0〉 poraplicacion sucesiva del operador creacion. El factor 1/

√n! garantiza la normalizacion de cada nuevo estado creado,

bajo la convencion de que los coeficientes de normalizacion tengan fase cero, es decir que sean reales y positivos.

8.4.2. Ortonormalidad de los kets propios (opcional)

Es interesante ver a manera de consistencia, que la expresion (8.31) conduce a que los kets |ϕn〉 son ortonormales

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉 (8.32)

veamos como actuan los operadores sobre el ket

an′(a†)n

|ϕ0〉 = an′−1(aa†)(

a†)n−1

|ϕ0〉 = an′−1 (N + 1)

[(a†)n−1

|ϕ0〉]

an′(a†)n

|ϕ0〉 = an′−1 (N + 1)

[√(n− 1)! |ϕn−1〉

]= an

′−1 [(n− 1) + 1][√

(n− 1)! |ϕn−1〉]

an′(a†)n

|ϕ0〉 = nan′−1

[√

(n− 1)!1√

(n− 1)!

(a†)n−1

|ϕ0〉]

an′(a†)n

|ϕ0〉 = nan′−1(a†)n−1

|ϕ0〉 (8.33)

donde hemos usado la Ec. (8.31). Utilizaremos el resultado (8.33) iterativamente, para ello analizamos tres casos

Page 279: Mecanica Cuantica: Notas de Clase

8.4. ESTADOS PROPIOS DEL HAMILTONIANO 279

1) n < n′. En este caso usamos la propiedad (8.33) n−veces de forma iterativa

an′(a†)n

|ϕ0〉 = n

[an

′−1(a†)n−1

|ϕ0〉]= n

[(n− 1) an

′−2(a†)n−2

|ϕ0〉]

an′(a†)n

|ϕ0〉 = n (n− 1) (n− 2)

[an

′−3(a†)n−3

|ϕ0〉]

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . . [n− (n− 1)]

[an

′−n(a†)n−n

|ϕ0〉]

(8.34)

an′(a†)n

|ϕ0〉 = n× [n− 1]× . . . × 1×[a|n

′−n|(a†)0

|ϕ0〉]

(8.35)

finalmente

an′(a†)n

|ϕ0〉 = n!a|n′−n| |ϕ0〉 (8.36)

pero por hipotesis |n′ − n| es un entero mayor o igual que 1, por tanto a|n′−n| |ϕ0〉 = 0 ya que a |ϕ0〉 = 0. Usando

(8.32) y (8.36) resulta que

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉 =1√n! n′!

〈ϕ0|n!a|n

′−n| |ϕ0〉= 0

2) si n = n′ podemos usar (8.34) para obtener

an(a†)n

|ϕ0〉 = n!a0(a†)0

|ϕ0〉 = n! |ϕ0〉 (8.37)

Usando (8.32) y (8.37) resulta que si n = n′

〈ϕn |ϕn〉 =1√n! n!

〈ϕ0| an(a†)n

|ϕ0〉 =1

n!〈ϕ0| n! |ϕ0〉 = 1

3) n > n′. En este caso podemos conjugar el producto interno 〈ϕn′ |ϕn〉 = 〈ϕn |ϕn′〉∗ y probar la ortogonalidaddel miembro derecho con lo cual quedamos nuevamente en el primer caso. Alternativamente, podemos usar lapropiedad (8.33) n′−veces de forma iterativa, aplicando la Ec. (8.31). En tal caso el analogo de la Ec. (8.34) es

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n−

(n′ − 1

)] [an

′−n′(a†)n−n′

|ϕ0〉]

(8.38)

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n− n′ + 1

]×[a0(a†)|n−n′|

|ϕ0〉]

(8.39)

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n− n′ + 1

]×[√

(n− n′)! |ϕn−n′〉]

(8.40)

y el producto interno (8.32) queda

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉

=n [n− 1] [n− 2] . . . [n− n′ + 1]

√(n− n′)!√

n! n′!〈ϕ0 |ϕn−n′〉 = 0

donde hemos usado el hecho de que n− n′ es un entero mayor o igual que uno, de modo que 〈ϕ0 |ϕn−n′〉 = 0.

Page 280: Mecanica Cuantica: Notas de Clase

280 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

8.4.3. Accion de los operadores creacion y destruccion sobre los autoestados del Hamilto-niano

Las Ecs. (8.9) nos muestran que los observables X,P se pueden escribir en terminos de a y a†, por lo tantocualquier observable fısico (sin espın) se puede escribir en terminos de a y a†. Por otro lado, como los autoestados|ϕn〉 del Hamiltoniano del oscilador armonico, constituyen una base en Ex, recurriremos con frecuencia a estabase para construır representaciones matriciales. Por lo anterior, resulta de especial importancia estudiar la accionde los operadores a y a† sobre los estados |ϕn〉.

La accion de a† sobre |ϕn〉 se puede obtener reemplazando n por n+ 1 en la Ec. (8.30)

a† |ϕn〉 =√n+ 1 |ϕn+1〉 ; n = 0, 1, 2, . . .

para obtener a |ϕn〉 multiplicamos la Ec. (8.30) por a.

a |ϕn〉 =1√naa† |ϕn−1〉 =

1√n(N + 1) |ϕn−1〉 =

1√n[(n− 1) + 1] |ϕn−1〉

a |ϕn〉 =√n |ϕn−1〉 ; n = 0, 1, 2, . . .

tenemos entonces que la accion de los operadores mas relevantes sobre los autoestados |ϕn〉 son

a† |ϕn〉 =√n+ 1 |ϕn+1〉 ; a |ϕn〉 =

√n |ϕn−1〉 ; n = 0, 1, 2, . . . (8.41)

N |ϕn〉 = n |ϕn〉 ; H |ϕn〉 =(n+

1

2

)~ω |ϕn〉 ; n = 0, 1, 2, . . . (8.42)

Se puede ver que la segunda de las Ecs. (8.41) contiene automaticamente el hecho de que a |ϕ0〉 = 0. Notese queel adjunto de las Ecs. (8.41) es

〈ϕn| a =√n+ 1 〈ϕn+1| ; 〈ϕn| a† =

√n 〈ϕn−1| (8.43)

podemos expresar el significado de las Ecs. (8.41, 8.43) en palabras diciendo que a es un operador destruccion(construccion) para kets (bras), en tanto que a† es un operador construccion (destruccion) para kets (bras).

La accion de los observables basicos X y P sobre los autoestados |ϕn〉 se obtiene usando las Ecs. (8.9)

X |ϕn〉 =√

~

2mω

(a† + a

)|ϕn〉 =

√~

2mω

[√n+ 1 |ϕn+1〉+

√n |ϕn−1〉

]

P |ϕn〉 = i

√mω~

2

(a† − a

)|ϕn〉 = i

√mω~

2

[√n+ 1 |ϕn+1〉 −

√n |ϕn−1〉

]

con estas relaciones es facil encontrar la representacion matricial de los operadores a, a†, X y P en la base |ϕn〉

〈ϕm| a |ϕn〉 =√n〈ϕm |ϕn−1〉 =

√nδm,n−1 (8.44)

〈ϕm| a† |ϕn〉 =√n+ 1〈ϕm |ϕn+1〉 =

√n+ 1δm,n+1 (8.45)

〈ϕm|X |ϕn〉 =

√~

2mω

[√n+ 1δm,n+1 +

√nδm,n−1

](8.46)

〈ϕm|P |ϕn〉 = i

√mω~

2

[√n+ 1δm,n+1 −

√nδm,n−1

](8.47)

se puede ver que las matrices representativas de a y a† son hermıticas conjugadas una de otra como era deesperarse, pues en este caso las matrices son reales y la una es la traspuesta de la otra. En forma explıcita estasmatrices vienen dadas por

Page 281: Mecanica Cuantica: Notas de Clase

8.5. FUNCIONES PROPIAS ASOCIADAS A LOS ESTADOS ESTACIONARIOS EN LA BASE |X〉 281

a =

0√1 0 0 · · ·

0 0√2 0 · · ·

0 0 0√3 · · ·

0 0 0 0 · · ·...

......

.... . .

; a† =

0 0 0 0 · · ·√1 0 0 0 · · ·0

√2 0 0 · · ·

0 0√3 0 · · ·

......

......

. . .

notese que las matrices deX y P son proporcionales a la suma y la diferencia de las matrices anteriores. Finalmente,las matrices asociadas a X y P son hermıticas como se esperaba.

8.5. Funciones propias asociadas a los estados estacionarios en la base |x〉Los resultados obtenidos hasta el momento se han extraıdo a partir de los kets abstractos |ϕn〉 y el algebra

abstracta de los operadores a, a† y N . En otras palabras, todos los resultados anteriores son independientes de labase5. El unico resultado que no ha sido demostrado es el hecho de que los estados |ϕn〉 forman una base, lo cualhasta el momento es solo una hipotesis de trabajo que debe ser examinada. Con el fin de verificar la completezde los kets propios de H y con el fin de poder hacer calculos concretos de probabilidades vamos a encontrar estoskets propios de H en la base |x〉 es decir las funciones de onda asociadas.

Ya hemos determinado la funcion de onda asociada al estado base ϕ0 (x) la cual esta dada por la Ec. (8.22)

ϕ0 (x) = 〈x |ϕ0〉 =(mωπ~

)1/4e−

12mω~x2 (8.48)

donde (mω/π~)1/4 es un factor de normalizacion. Dado que los demas estados se obtienen de la Ec. (8.31)

|ϕn〉 =1√n!

(a†)n

|ϕ0〉 (8.49)

debemos obtener la representacion del vector |ϕn〉 en la base |x〉 para ello multiplicamos la Ec. (8.49) por el bra〈x|

〈x |ϕn〉 =1√n!

〈x|(a†)n

|ϕ0〉 =1√n!

〈x|[

1√2

(X − iP

)]n|ϕ0〉

ϕn (x) =1√n!

〈x|[

1√2

(√mω

~X − i√

mω~P

)]n|ϕ0〉

ϕn (x) =1√n!

1√2n

[√mω

~x− i√

mω~

~

i

d

dx

]n〈x|ϕ0〉

ϕn (x) =1√2n n!

[√mω

~x−

√~

d

dx

]n〈x|ϕ0〉

ϕn (x) =1√2n n!

[√~

(mω

~x− d

dx

)]n〈x|ϕ0〉

ϕn (x) =

[1

n!

(~

2mω

)n] 12[(

~x− d

dx

)]nϕ0 (x)

5La ausencia de degeneracion del estado base se demostro utilizando la base especıfica |x〉, pero el resultado debe ser independientede la base.

Page 282: Mecanica Cuantica: Notas de Clase

282 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

ahora usando en forma explıcita la funcion de onda del estado base Ec. (8.48) se tiene que

ϕn (x) =

[1

n!

(~

2mω

)n] 12 (mω

π~

) 14

[(mω

~x− d

dx

)]ne−

12mω~x2 (8.50)

de lo anterior se puede ver facilmente que ϕn (x) es el producto de e−12mω~x2 por un polinomio de grado n y paridad

(−1)n. Los polinomios que surgen se denominan polinomios de Hermite.

Las dos primeras funciones asociadas a estados excitados (con energıa mayor al estado base) son

ϕ1 (x) =

[4

π

(mω~

)3]1/4xe−

12mω~x2 (8.51)

ϕ2 (x) =(mω4π~

)1/4 [2mω

~x2 − 1

]e−

12mω~x2 (8.52)

si se grafica la funcion de onda y la densidad de probabilidad para n = 0, 1, 2 (ver Figs. 8.1, 8.2) y para valores

Figura 8.1: Funciones de onda asociadas a n = 0, 1, 2 para el oscilador armonico.

Figura 8.2: Densidades de probabilidad asociadas a n = 0, 1, 2 para el oscilador armonico.

grandes de n (Figs. 8.3), se pueden observar las siguientes caracterısticas: cuando n aumenta, la region en xen la cual la densidad de probabilidad toma valores no despreciables se vuelve mayor. Esto corresponde a lacaracterıstica clasica de que la amplitud de movimiento (y por tanto la region accesible) aumenta con la energıa.Tambien veremos que el valor promedio o esperado de la energıa potencial se incrementa con la energıa (y portanto con n). Aunque esto se puede ver de un calculo directo, se puede explicar cualitativamente teniendo encuenta que para n grandes, ϕn (x) toma valores no despreciables en regiones donde x es grande y por tanto dondeV (x) es grande. Las graficas tambien muestran que el numero de ceros de ϕn (x) es igual a n, lo cual se puededemostrar formalmente con las propiedades de los polinomios de Hermite. Un analisis de estos polinomios muestra

Page 283: Mecanica Cuantica: Notas de Clase

8.6. VALORES ESPERADOS Y DISPERSION EN UN ESTADO ESTACIONARIO DEL OSCILADOR 283

Figura 8.3: Funcion de onda (izquierda) y densidad de probabilidad (derecha) asociadas a n = 10, para el osciladorarmonico.

tambien que el valor promedio de la energıa cinetica se incrementa con n, puesto que tal valor promedio vienedado por

1

2m

⟨P 2⟩= − ~2

2m

∫ ∞

−∞ϕ∗n (x)

d2ϕndx2

dx (8.53)

y cuando el numero de ceros de ϕn (x) aumenta, tambien se incrementa la curvatura de la funcion de onda y enla Ec. (8.53) la segunda derivada de ϕn se incrementa a su vez.

Otra caracterıstica sobresaliente para grandes valores de n es que la densidad de probabilidad es grandepara x ∼= ±xM siendo xM la amplitud clasica de movimiento cuando la energıa es En. Esto se relaciona con lacaracterıstica clasica de que en xM la partıcula esta en reposo instantaneo y por tanto, en promedio se mantienemas tiempo en las vecindades de ±xM que por ejemplo en las vecindades de x = 0 donde la rapidez es maxima.

8.6. Valores esperados y dispersion para los observables cuando el sistema

esta en un estado estacionario del oscilador armonico

Dado que ninguno de los observables X y P conmuta con H, los autoestados |ϕn〉 del Hamiltoniano no sonautoestados de X ni P . Por tanto, si el oscilador armonico esta en un estado estacionario |ϕn〉 la medida de X oP dara en principio cualquier valor ya que el espectro de estos observables incluye a todos los numeros reales.

Calcularemos los valores esperados de X y P y las raıces de la desviacion media cuadratica ∆X y ∆P , cuandoel sistema esta en un estado estacionario |ϕn〉. Los valores esperados se calculan directamente de las Ecs. (8.46,8.47)

〈X〉 = 〈ϕn|X |ϕn〉 = 〈P 〉 = 〈ϕn|P |ϕn〉 = 0 (8.54)

estos valores son validos para todo tiempo. Notese que el comportamiento del centro del paquete de onda difiereprofundamente del caso clasico en el cual las variables x y p son oscilantes en el tiempo (excepto cuando la energıaes cero)6. Para calcular ∆X, ∆P deben calcularse los valores esperados de X2 y P 2

(∆X)2 = 〈ϕn|X2 |ϕn〉 − [〈ϕn|X |ϕn〉]2 = 〈ϕn|X2 |ϕn〉 (8.55)

(∆P )2 = 〈ϕn|P 2 |ϕn〉 − [〈ϕn|P |ϕn〉]2 = 〈ϕn|P 2 |ϕn〉 (8.56)

6Puede verse que clasicamente los valores promedio de x y p tomados sobre un periodo completo de movimiento, sı son nuloscomo en el caso cuantico. Sin embargo, debemos recordar que en el caso cuantico los promedios no son tomados sobre un periodo demovimiento.

Page 284: Mecanica Cuantica: Notas de Clase

284 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

y usando (8.9) tenemos que

X2 =~

2mω

(a† + a

)(a† + a

)=

~

2mω

[(a†)2

+ aa† + a†a+ a2]

X2 =~

2mω

[(a†)2

+ (1 +N) +N + a2]

X2 =~

2mω

[(a†)2

+ a2 + 2N + 1

](8.57)

P 2 = −m~ω

2

(a† − a

)(a† − a

)= −m~ω

2

[(a†)2

− aa† − a†a+ a2]

P 2 = −m~ω

2

[(a†)2

+ a2 − 2N − 1

](8.58)

reemplazando (8.57, 8.58) en (8.55, 8.56) es claro que

(∆X)2 =~

2mω〈ϕn|

[(a†)2

+ a2 + 2N + 1

]|ϕn〉 (8.59)

(∆P )2 = −m~ω

2〈ϕn|

[(a†)2

+ a2 − 2N − 1

]|ϕn〉 (8.60)

calculando cada elemento matricial se tiene

〈ϕn| a2 |ϕn〉 =√n (n− 1)〈ϕn |ϕn−2〉 = 0 (8.61)

〈ϕn|(a†)2

|ϕn〉 =√

(n+ 1) (n+ 2)〈ϕn |ϕn+2〉 = 0 (8.62)

〈ϕn| (2N + 1) |ϕn〉 = (2n+ 1) 〈ϕn |ϕn〉 = (2n + 1) (8.63)

reemplazando (8.61, 8.62, 8.63) en (8.59, 8.60), resulta

(∆X)2 =(2n+ 1) ~

2mω; (∆P )2 =

(2n+ 1)m~ω

2

Finalmente

(∆X)2 =

(n+

1

2

)~

mω=

Enmω2

; (∆P )2 =

(n+

1

2

)m~ω = mEn (8.64)

notese que a medida que aumenta el nivel de energıa, se ensanchan ambos paquetes. Esto es perfectamentepermitido por el principio de incertidumbre el cual solo prohibe un angostamiento indefinido de ambos paquetes.El producto de estas desviaciones que se puede tomar como la definicion de incertidumbre, es

∆X ·∆P =

(n+

1

2

)~ ≥ ~

2

La cota inferior para el producto ∆X ·∆P depende de la forma del potencial, y en el caso del oscilador armonicoadquiere el mınimo valor posible ~/2 cuando n = 0, es decir cuando el sistema esta en el estado base. Esto estarelacionado con el hecho de que en el estado base, la funcion de onda es una gaussiana y las gaussianas sondistribuciones de mınima incertidumbre (ver Sec. 2.14.3).

Por otro lado, es bien sabido que si xM es la amplitud del oscilador armonico clasico con energıa En =(n+ 1/2) ~ω, la relacion entre la energıa y la amplitud es

En =1

2mω2x2M

Page 285: Mecanica Cuantica: Notas de Clase

8.6. VALORES ESPERADOS Y DISPERSION EN UN ESTADO ESTACIONARIO DEL OSCILADOR 285

usando (8.64) se tiene que

(∆X)2 =Enmω2

=1

2

mω2x2Mmω2

=1

2x2M

∆X =1√2xM (8.65)

analogamente, si pM es la amplitud de oscilacion del momento clasico se tiene que

pM = mωxM

∆P =1√2pM (8.66)

vemos que el ancho ∆X es del orden del ancho del intervalo [−xM , xM ], esto es de esperarse ya que esta es laregion clasicamente accesible y ya vimos en la seccion 8.5 que es aproximadamente en esta region en donde ϕn (x)adquiere valores no despreciables. Un resultado similar se sigue para el intervalo [−pM , pM ].

Lo anterior permite tambien entender porque ∆X se incrementa con n: la densidad |ϕn (x)|2 posee dos picossimetricos situados aproximadamente en x = ±xM . La desviacion media cuadratica no puede ser mucho menorque la distancias entre picos incluso si estos son muy agudos. Un argumento similar se sigue para ∆P .

Ahora bien, el valor esperado de la energıa potencial en el estado |ϕn〉, se puede calcular teniendo en cuentala Ec. (8.55), y esta dado por

〈V (X)〉 = 1

2mω2

⟨X2⟩⇒ 〈V (X)〉 = 1

2mω2 (∆X)2 (8.67)

similarmente, el valor esperado de la energıa cinetica es⟨P 2

2m

⟩=

1

2m(∆P )2 (8.68)

y reemplazando (8.64) en (8.67, 8.68) resulta

〈V (X)〉 =1

2

(n+

1

2

)~ω =

En2⟨

P 2

2m

⟩=

1

2

(n+

1

2

)~ω =

En2

el valor esperado de las energıas cinetica y potencial es igual. Esto es consistente con el teorema del virial. Noobstante, debe tenerse en cuenta que en el teorema del virial el promedio es sacado sobre un periodo de movimiento,en tanto que el promedio cuantico no esta asociado a una evolucion temporal.

Es notable ademas la simetrıa entre los resultados sobre las variables X y P , esto se debe a que el Hamiltonianoes muy simetrico en ambos ya que la energıa cinetica es proporcional a P 2 y la energıa potencial es proporcionalX2. Tal simetrıa se ve de forma manifiesta en la Ec. (8.5).

Los estados estacionarios |ϕn〉 no tienen equivalente en la mecanica clasica ya que tienen energıa no nula apesar de que 〈X〉 y 〈P 〉 sı son nulos. Sin embargo, podemos establecer cierta analogıa entre el estado estacionario|ϕn〉 y el estado de una partıcula clasica cuya posicion esta descrita por

x = xM cos (ωt− ϕ)

y para el cual la fase inicial ϕ es escogida arbitrariamente, es decir puede tomar cualquier valor entre 0 y 2π conla misma probabilidad. Los valores esperados de x y p son entonces nulos ya que

xcl = xM

[1

∫ 2π

0cos (ωt− ϕ) dϕ

]= 0

pcl = −pM[1

∫ 2π

0sin (ωt− ϕ) dϕ

]= 0

Page 286: Mecanica Cuantica: Notas de Clase

286 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

ahora, calculando el valor esperado de x2cl y p2cl

x2cl = xM

[1

∫ 2π

0cos2 (ωt− ϕ) dϕ

]=x2M2

p2cl = pM

[1

∫ 2π

0sin2 (ωt− ϕ) dϕ

]=p2M2

la desviacion media cuadratica clasica de x y p queda

∆xcl =

√x2cl − (xcl)

2 =xM√2

; ∆pcl =

√p2cl − (pcl)

2 =pM√2

y vemos que coincide con sus valores cuanticos Ecs. (8.65, 8.66). Este promedio clasico se esta realizando sobrelos posible valores de la fase y no sobre un periodo de movimiento. Es decir, al igual que el promedio cuantico, noinvolucra evolucion temporal.

8.7. Propiedades del estado base

En la mecanica clasica, el estado de mas baja energıa del oscilador armonico se obtiene cuando la partıculaesta en reposo en el origen (condiciones iniciales x = p = 0) y la energıa total es cero. En contraste, el sistemacuantico posee un estado de mınima energıa |ϕ0〉 con energıa no nula y la funcion de onda asociada posee unaextension espacial caracterizada por la desviacion media cuadratica ∆X =

√~/2mω.

La diferencia entre las dos descripciones tiene su origen en el principio de incertidumbre, que impide la mini-mizacion simultanea de la energıa cinetica y la potencial, ya que los operadores energıa cinetica y potencial noconmutan entre sı. El estado base es entonces el resultado de la minimizacion de la suma de las dos energıas.Notese que el resultado clasico x = p = 0 para obtener energıa mınima cero, requerirıa una determinacion totalsimultanea de posicion y momento, que cuanticamente no es posible.

Podemos realizar un argumento semicuantitativo para estimar el orden de magnitud de la energıa base y laextension espacial de su funcion de onda. Pensemos que la distancia ξ caracteriza la extension espacial de lafuncion de onda, es decir ξ ∼ ∆X. Entonces, de acuerdo con (8.67) el potencial promedio sera del orden de

V ∼= 1

2mω2ξ2

pero∆X ·∆P ∼= ~ ⇒ ξ ·∆P ∼= ~ (8.69)

por tanto

∆P ∼= ~

ξ⇒ T =

p2

2m=

(∆P )2

2m∼= ~2

2mξ2

con lo cual el orden de magnitud de la energıa total es

E = T + V ∼= ~2

2mξ2+

1

2mω2ξ2 (8.70)

para valores pequenos de ξ, T domina sobre V y para valores grandes de ξ ocurre lo contrario. El estado base secalcula de manera aproximada con el mınimo de la funcion E en la Ec. (8.70)

(dE

)

ξ=ξm

= 0 ⇒ − ~2

mξ3m+mω2ξm = 0

−~2

m+mω2ξ4m = 0 ⇒ ξ4m =

~2

m2ω2

Page 287: Mecanica Cuantica: Notas de Clase

8.8. EVOLUCION TEMPORAL DE LOS OBSERVABLES DEL OSCILADOR ARMONICO 287

por tanto el valor mımimo aproximado del promedio de la energıa total es

E ∼= ~2

2mξ2m+

1

2mω2ξ2m =

~2

2m(

~mω

) + 1

2mω2

(~

)=

2+

2

E ∼= ~ω

notese que la Ec. (8.69) implica tomar un principio de “mınima incertidumbre” ya que implica que el producto delas incertidumbres se acerca al lımite inferior. Vemos entonces que la combinacion de mınima incertidumbre conla minimizacion del promedio de la suma de las energıas cinetica y potencial, nos predice correctamente el ordende magnitud de la energıa del estado base.

Finalmente, podrıa argumentarse que el aumento en la energıa base con respecto al caso clasico es irrelevanteya que es una cantidad constante ~ω/2. Al fin y al cabo, el verdadero observable fısico esta en las transicioneso diferencias de energıa y no en la energıa misma. Sin embargo, esto no es en general cierto, puesto que hayprocesos en los cuales interviene mas de una frecuencia caracterıstica ω, en los cuales pueden haber diferencias enla energıa base de varios osciladores. Adicionalmente, la diferencia entre la energıa clasica y cuantica del osciladores intrınseca y no depende de la calibracion que se defina en el caso clasico. Por ejemplo, si defino la energıamınima clasica como E0 = −~ω/2, entonces el estado de menor energıa cuantica sera E0 = 0. Una vez mas estaredefinicion de la energıa base debe tomarse con cuidado, puesto que si hay mas de una frecuencia involucrada,solo puedo redefinir E0 = −~ωi/2 para ωi fijo, y solo ese oscilador quedara con energıa cuantica cero.

8.8. Evolucion temporal de los observables del oscilador armonico

Consideremos un oscilador armonico cuyo estado en t = 0 esta descrito por el estado normalizado

|ψ (0)〉 =∞∑

n=0

cn (0) |ϕn〉 (8.71)

como el sistema es conservativo, el estado en cualquier tiempo se obtiene empleando las Ecs. (5.66, 5.67).

|ψ (t)〉 =∞∑

n=0

cn (0) e−i(n+ 1

2)ωt |ϕn〉

el valor esperado de cualquier observable estara dado por

〈ψ (t)|A |ψ (t)〉 =

[ ∞∑

m=0

c∗m (0) ei(m+ 12)ωt 〈ϕm|

]A

[ ∞∑

n=0

cn (0) e−i(n+ 1

2)ωt |ϕn〉]

〈ψ (t)|A |ψ (t)〉 =

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0) ei(m−n)ωt 〈ϕm|A |ϕn〉

el valor esperado de A es entonces

〈ψ (t)|A |ψ (t)〉 =∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)Amnei(m−n)ωt ; Amn ≡ 〈ϕm|A |ϕn〉 (8.72)

puesto que m y n son enteros, la evolucion temporal de los valores esperados solo involucra frecuencias de la formakω/2π con k entero. Por tanto las frecuencias de Bohr estan constituıdas por “armonicos” que son multiplos enterosdel “armonico fundamental” ω/2π. Para el caso particular de los observables X y P estos valores esperados se

Page 288: Mecanica Cuantica: Notas de Clase

288 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

obtienen de (8.46, 8.72)

〈X〉 =

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)Xmnei(m−n)ωt

〈X〉 =

√~

2mω

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)[√n+ 1δm,n+1 +

√nδm,n−1

]ei(m−n)ωt

〈X〉 =

√~

2mω

∞∑

n=0

c∗n+1 (0) cn (0)[√n+ 1

]ei[(n+1)−n]ωt +

∞∑

m=0

c∗m (0) cm+1 (0)[√m+ 1

]ei[m−(m+1)]ωt

〈X〉 =√

~

2mω

∞∑

n=0

√n+ 1c∗n+1 (0) cn (0) e

iωt +

∞∑

n=0

√n+ 1c∗n (0) cn+1 (0) e

−iωt

donde hemos tenido en cuenta que los ındices m y n son mudos

〈X〉 =√

2~

∞∑

n=0

√n+ 1Re

[c∗n+1 (0) cn (0) e

iωt]

(8.73)

Vemos entonces que solo se incluyen ondas sinusoidales de frecuencia angular ω. Esto esta relacionado con lasolucion clasica del oscilador armonico la cual es monocromatica para la variable x. Para 〈P 〉 se obtiene unresultado similar.

Por otro lado, en la discusion del teorema de Ehrenfest de la seccion 5.7.1 vimos que la condicion de igualdadde los dos miembros en la Ec. (5.56) necesaria para obtener el lımite clasico adecuado, se cumple para todo estado|ψ〉, cuando se usa el potencial del oscilador armonico que corresponde a n = 2 en la Ec. (5.58). Por tanto, deacuerdo con las Ecs. (5.55, 5.52) se tiene que

d 〈X〉dt

=1

i~〈[X,H]〉 = 〈P 〉

md 〈P 〉dt

=1

i~〈[P,H]〉 = −mω2 〈X〉

integrando estas ecuaciones se obtiene

〈X〉 (t) = 〈X〉 (0) cosωt+ 1

mω〈P 〉 (0) sinωt (8.74)

〈P 〉 (t) = 〈P 〉 (0) cosωt−mω 〈X〉 (0) sinωt (8.75)

que es la forma sinusoidal que se obtuvo en (8.73), aunque escrita en terminos de otras condiciones iniciales, puestoque (8.73) esta escrita en terminos de los pesos iniciales del paquete de onda Ec. (8.71). En contraste, las Ecs.(8.74, 8.75) estan escritas en terminos de condiciones iniciales concernientes al valor esperado del momento y laposicion.

Es importante mencionar que este analogo clasico solo es valido si el estado |ψ (0)〉 descrito por (8.71) es unasuperposicion con al menos dos coeficientes no nulos, ya que si solo uno de ellos es no nulo el sistema estarainicialmente en un estado estacionario y los valores esperados no evolucionaran en el tiempo7. En consecuencia,cuando el oscilador esta en un estado estacionario el comportamiento cuantico sera muy diferente al clasico inclusosi n es muy grande. Si queremos un paquete de onda cuya posicion promedio oscile en el tiempo, deben superponersevarios estados estacionarios.

7Cuando solo uno de los coeficientes en (8.71) es no nulo, entonces al menos uno de los coeficientes cn (0) o cn+1 (0) es nulo paracada n en la Ec. (8.73), con lo cual 〈X〉 = 0. Similarmente 〈P 〉 = 0. Como en particular 〈X〉 (0) = 〈P 〉 (0) = 0, tambien se obtiene que〈X〉 (t) = 〈P 〉 (t) = 0 de las Ecs. (8.74, 8.75).

Page 289: Mecanica Cuantica: Notas de Clase

8.9. OSCILADOR ARMONICO CARGADO EN UN CAMPO ELECTRICO UNIFORME (OPCIONAL) 289

8.9. Oscilador armonico cargado en un campo electrico uniforme (Opcional)

Asumamos que un oscilador armonico unidimensional posee carga q y esta inmerso en un campo electricouniforme E en la direccion ux. Veremos como cambian los valores y vectores propios del oscilador armonico cuanticocuando se le anade al Hamiltoniano la energıa potencial asociada a esta nueva interaccion, la cual clasicamenteviene descrita por

w (E) = −qEx (8.76)

con lo cual el Hamiltoniano cuantico completo sera

H ′ (E) =P 2

2m+

1

2mω2X2 − qEX (8.77)

la ecuacion de valores propios sera

H ′ (E)∣∣ϕ′⟩ = E′ ∣∣ϕ′⟩

(− ~2

2m

d2

dx2+

1

2mω2x2 − qEx

)ϕ′ (x) = E′ϕ′ (x) (8.78)

completando el cuadrado con respecto a x al lado izquierdo de la ecuacion (8.78) queda[− ~2

2m

d2

dx2+

1

2mω2

(x− qE

mω2

)2

− q2E2

2mω2

]ϕ′ (x) = E′ϕ′ (x) (8.79)

realizando el cambio de variable

u = x− qE

mω2; du = dx (8.80)

la ecuacion (8.79) queda[− ~2

2m

d2

du2+

1

2mω2u2

]ϕ′ (u) =

(E′ +

q2E2

2mω2

)ϕ′ (u)

[− ~2

2m

d2

du2+

1

2mω2u2

]ϕ′ (u) = E′′ϕ′ (u) ; E′′ ≡ E′ +

q2E2

2mω2(8.81)

la ecuacion (8.81) coincide exactamente con la ecuacion (8.2) asociada a los estados estacionarios del osciladorarmonico simple (sin campo electrico). Por tanto los valores propios E′′ viene dados por la Ec. (8.19)

E′′ =

(n+

1

2

)~ω ; n = 0, 1, 2, 3, . . .

De la definicion de E′′ en (8.81) obtenemos los valores propios de nuestra ecuacion (8.78)

E′n =

(n+

1

2

)~ω − q2E2

2mω2; n = 0, 1, 2, 3, . . . (8.82)

ası mismo las funciones propias de (8.81) coincidiran con los estados estacionarios del oscilador armonico dadospor la Ec. (8.50)

ϕ′n (u) =

[1

n!

(~

2mω

)n] 12 (mω

π~

) 14

[(mω

~u− d

du

)]ne−

12mω~u2

y teniendo en cuenta el cambio de variable (8.80), la funcion propia de la Ec. (8.78) sera

ϕ′n (x) = ϕn

(x− qE

mω2

)(8.83)

Page 290: Mecanica Cuantica: Notas de Clase

290 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

Las ecuaciones (8.82) muestran que el efecto del campo electrico uniforme E sobre el espectro del osciladorarmonico consiste en un corrimiento constante del espectro por un cantidad q2E2/

(2mω2

). Por otro lado, la Ec.

(8.83) muestra que el efecto sobre el estado, es una traslacion de la funcion de onda estacionaria del osciladorarmonico simple en una cantidad qE/

(mω2

). Esta traslacion se debe a que el campo electrico ejerce una fuerza

constante sobre la partıcula, cuyo efecto neto es redefinir el punto de equilibrio del oscilador. Ya que usualmentedefinimos el origen en el punto de equilibrio, podemos decir que el unico efecto del campo electrico uniforme es elde cambiar el origen de x y de la energıa. Por ejemplo, si qE > 0, la traslacion en la funcion de onda se realiza enla direccion positiva de las x, que es la direccion de la fuerza ejercida por E. El caso qE < 0, es analogo.

Otra forma de ver el fenomeno es analizando la estructura del potencial con y sin campo electrico. El potencialclasico del oscilador armonico con campo electrico uniforme viene dado por

V ′ =1

2mω2x2 − qEx =

1

2mω2

(x− qE

mω2

)2

− q2E2

2mω2

V ′ = −V0 +1

2mω2 (x− x0)

2 ; V0 =q2E2

2mω2, x0 =

qE

mω2(8.84)

el potencial V sin campo electrico es una parabola centrada en cero y con mınimo V = 0 en x = 0. La Ec. (8.84)muestra que el potencial con la contribucion del campo es tambien una parabola asociada al mismo valor de ω,pero centrada en x0 y con mınimo en V = −V0. La Ec. (8.82) con n = 0, muestra que el proceso de cuantizacionincrementa el mınimo de la energıa en una cantidad ~ω/2, en virtud del principio de incertidumbre como ya sediscutio en la seccion 8.7.

8.9.1. Solucion utilizando el operador traslacion

El hecho de que la funcion de onda que se obtiene cuando se aplica el campo uniforme corresponde a unatraslacion de la funcion de onda sin campo, sugiere emplear el operador traslacion definido en la Ec. (1.211) Pag.106

〈q|S (Λ) |ψ〉 = 〈q − Λ|ψ〉 = ψ (q − Λ) ; S (Λ) ≡ e−iΛP/~ (8.85)

puesto que conocemos mejor la accion de los operadores creacion y destruccion sobre los estados del osciladorarmonico, sera conveniente escribir el operador traslacion S (Λ) en terminos de ellos usando la Ec. (8.9)

S (Λ) ≡ exp [−iΛP/~] = exp

[−iΛ

[i

√m~ω

2

(a† − a

)]/~

]= exp

√mω

2~

(a† − a

)]

S (λ) ≡ exp [−iΛP/~] ≡ exp[−λ(a− a†

)]; λ ≡ Λ

√mω

2~(8.86)

desarrollaremos algunas expresiones algebraicas relativas a S (λ), a y a† para propositos futuros. Dado que P eshermıtico es claro de (8.85) que S (λ) es unitario

S (λ) = e−λ(a−a†) ; S† (λ) = S−1 (λ) = eλ(a−a

†)

de la Ec. (8.10) es claro que tanto a como a† conmutan con el conmutador entre ambos. Por tanto, es aplicable laformula de Glauber (1.149) Pag. 79

S (λ) = e−λ(a−a†) = e−λa+λa

†= e−λaeλa

†e−

12 [−λa,λa†] = e−λaeλa

†e

12λ2[a,a†] = e−λaeλa

†e

12λ2

el adjunto se calcula similarmente y se obtiene

S (λ) = e12λ2e−λaeλa

†; S† (λ) = e−

12λ2e−λa

†eλa (8.87)

Page 291: Mecanica Cuantica: Notas de Clase

8.9. OSCILADOR ARMONICO CARGADO EN UN CAMPO ELECTRICO UNIFORME (OPCIONAL) 291

la misma condicion de que a y a† conmutan con su conmutador nos permite utilizar la primera de las Ecs. (1.140)Pag. 77, con a† = A y a = B, para calcular

[e−λa, a†

]= −

[a†, e−λa

]= −

[a†, a

] (e−λa

)′=[a, a†

] (−λe−λa

)= −λe−λa

de manera similar se obtiene el conmutador entre eλa†y a, obteniendose

[e−λa, a†

]= −λe−λa ;

[eλa

†, a]= −λeλa† (8.88)

a partir de las Ecs. (8.88) se obtiene

e−λaa†eλa =(e−λaa†

)eλa =

[e−λa, a†

]+ a†e−λa

eλa =

−λe−λa + a†e−λa

eλa = a† − λ

eλa†ae−λa

†=

(eλa

†a)e−λa

†=[eλa

†, a]+ aeλa

†e−λa

†=−λeλa† + aeλa

†e−λa

†= a− λ

quedando entonces

e−λaa†eλa = a† − λ ; eλa†ae−λa

†= a− λ (8.89)

Partiremos de la ecuacion de valores propios sin campo electrico

H |ϕ〉 = E |ϕ〉 (8.90)

y haremos una transformacion pasiva8 asociada al operador unitario S (λ). Para ello multiplicamos la ecuacionpor S (λ) e insertamos un operador identidad en la forma

S (λ)H[S† (λ)S (λ)

]|ϕ〉 = ES (λ) |ϕ〉 ⇒

[S (λ)HS† (λ)

][S (λ) |ϕ〉] = E [S (λ) |ϕ〉]

H |ϕ〉 = E |ϕ〉 ; H ≡ S (λ)HS† (λ) , |ϕ〉 ≡ S (λ) |ϕ〉 (8.91)

calcularemos la transformacion pasiva del Hamiltoniano del oscilador armonico sin campo Ec. (8.12)

H ≡ S (λ)HS† (λ) = ~ω S (λ)

(1

2+ a†a

)S† (λ) =

[1

2+ S (λ) a†aS† (λ)

]~ω

H =~ω

2+ ~ω S (λ) a†

[S† (λ)S (λ)

]aS† (λ) =

2+ ~ω

[S (λ) a†S† (λ)

] [S (λ) aS† (λ)

]

H =

(1

2+ a†a

)~ω ; a ≡ S (λ) aS† (λ) ; a† ≡ S (λ) a†S† (λ) (8.92)

utilizando las Ecs. (8.87) y (8.89), podemos calcular los operadores transformados a y a† en terminos de losoperadores originales

a ≡ S (λ) aS† (λ) =[e

12λ2e−λaeλa

†]a[e−

12λ2e−λa

†eλa]= e−λa

(eλa

†ae−λa

†)eλa

a = e−λa (a− λ) eλa = a− λ

y similarmente para a†, se obtiene entonces

a = a− λ ; a† = a† − λ (8.93)

8Sin embargo, esta transformacion no serıa un cambio de base, ya que el operador unitario en cuestion produce una traslacion (yno una rotacion) que conserva norma. Desde el punto de vista pasivo, serıa mas bien un cambio de origen.

Page 292: Mecanica Cuantica: Notas de Clase

292 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

sustituyendo (8.93) en (8.92) resulta

H =

(1

2+ a†a

)~ω = ~ω

[1

2+(a† − λ

)(a− λ)

]= ~ω

[1

2+ a†a− λ

(a+ a†

)+ λ2

]

H = H − λ~ω(a+ a†

)+ λ2~ω = H − λ~ω

√2mω

~X + λ2~ω

donde hemos usado las Ecs. (8.9). El Hamiltoniano transformado queda finalmente

H (λ) = H − λω√2m~ωX + λ2~ω (8.94)

teniendo en cuenta que H es el Hamiltoniano del oscilador armonico (sin trasladar) y comparando los Hamilto-nianos H y H ′ (E) Ecs. (8.77, 8.94), vemos que H coincide con H ′ (E) (excepto por una constante) si definimos elparametro λ en la forma

λE =qE

ω

√1

2m~ω(8.95)

en cuyo caso obtenemos

H (λE) = H − qEX +q2E2

2mω2= H ′ (E) +

q2E2

2mω2

H (λE) = H ′ (E) + κ1 ; κ ≡ q2E2

2mω2(8.96)

puesto que H (λE) y H ′ (E) solo difieren en un operador proporcional a la identidad, tendran los mismos auto-vectores y sus valores propios difieren por la constante de proporcionalidad κ. Adicionalmente, de las Ecs. (8.90,8.91) vemos que si los autovectores de H son los kets |ϕn〉, los autovectores de H estan dados por

|ϕn〉 = S (λ) |ϕn〉 (8.97)

y que los autovalores de H y H coinciden. Los estados estacionarios |ϕ′n〉 del oscilador armonico en presencia del

campo uniforme E, estaran dados entonces por los estados |ϕn〉 dados por la Ec. (8.97). De acuerdo con la Ec.(8.96) los autovalores de H ′ (E) estan dados por

E′n (E) =

(n+

1

2

)~ω − q2E2

2mω2

que coincide con la Ec. (8.82) obtenida por metodos directos. La expresion (8.97) para el autovector, viene dadapor

∣∣ϕ′n (E)

⟩= |ϕn (λE)〉 = S (λE) |ϕn〉 = exp

[− i

~ΛEP

]|ϕn〉 = exp

[− i

~λE

√2~

mωP

]|ϕn〉

= exp

[− i

~

(qE

ω

√1

2m~ω

)√2~

mωP

]|ϕn〉

∣∣ϕ′n (E)

⟩= exp

[− i

~

qE

mω2P

]|ϕn〉 (8.98)

donde hemos usado (8.86, 8.95). La ecuacion (8.85), nos dice que S (Λ) ≡ exp [−iΛP/~] es precisamente el operadortraslacion sobre una distancia Λ a lo largo de x, vemos de la Ec. (8.98) que |ϕ′

n (E)〉 se obtiene por una traslacionde |ϕn〉 en la cantidad qE/

(mω2

), en consistencia con la funcion de onda (8.83) calculada con los metodos

tradicionales.

Page 293: Mecanica Cuantica: Notas de Clase

Capıtulo 9

Estados coherentes cuasi-clasicos deloscilador armonico (opcional)

Ya hemos estudiado las propiedades de los estados estacionarios del oscilador armonico y hemos observado quesu comportamiento difiere significativamente del oscilador armonico clasico. Por ejemplo, los valores esperados deX y P son cero y no oscilantes como ocurre en el caso clasico (excepto en el caso en que la energıa clasica escero). Vimos tambien que para emular razonablemente el caso clasico, se necesita la superposicion de al menos dosestados estacionarios. Por otro lado, es de esperarse que en el lımite de energıas mucho mayores que ~ω (numeroscuanticos n muy grandes), las predicciones clasicas y cuanticas sean casi identicas, ya que al tener una enormecantidad de cuantos se enmascara su caracter discreto.

Hemos visto que muchos sistemas clasicos y cuanticos se pueden describir con el oscilador armonico al menosen primera aproximacion. Por esta razon es importante saber como pasar gradualmente de una descripcion clasicaa una descripcion cuantica o vice versa. En otras palabras es importante caracterizar ciertos parametros que nosindiquen como dicernir cuando los resultados clasicos o cuanticos sean adecuados para describir cierto sistema fısico.Un caso importante es la radiacion electromagnetica, hemos visto que para altas intensidades la descripcion clasicaes adecuada, en tanto que para bajas intensidades el caracter discreto de la radiacion se manifiesta claramente.

Lo anterior nos induce a indagar por la existencia de estados cuanticos que conduzcan a predicciones fısicas muysimilares a las clasicas, al menos para el oscilador armonico macroscopico. Veremos que los estados que cumplenesta condicion son superposiciones coherentes de los estados estacionarios |ϕn〉 del oscilador armonico. Por talrazon a dichos estados se les denomina como estados coherentes del oscilador armonico o tambien estadoscuasi-clasicos. Los estados coherentes de la radiacion electromagnetica permiten dicernir cuantitativamente laimportancia de los efectos cuanticos en la radiacion para cada sistema radiativo.

La idea es entonces encontrar estados para los cuales los valores de 〈X〉 , 〈P 〉 , y 〈H〉 sean semejantes a losvalores clasicos para todo tiempo. Adicionalmente, puesto que estos observables no son compatibles (no conmutanentre sı) no es posible construır un estado cuantico en donde las tres cantidades esten bien definidas. Los estadoscoherentes deben entonces lidiar inevitablemente con el principio de incertidumbre, de modo que tambien debenlograr que las desviaciones medias cuadraticas ∆X,∆P, ∆H sean despreciables en el lımite macroscopico.

9.1. Parametrizacion del oscilador clasico con parametros cuanticos

Tomemos como punto de partida las ecuaciones clasicas del oscilador armonico

dx (t)

dt=p (t)

m;dp (t)

dt= −mω2x (t) (9.1)

reescribiremos por conveniencia estas ecuaciones en variables adimensionales x y p definidas por

x (t) = βx (t) , p (t) =1

~βp (t) ; β =

√mω

~(9.2)

293

Page 294: Mecanica Cuantica: Notas de Clase

294 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

reemplazando (9.2) en (9.1) tenemos

dx (t)

dt= ωp (t) ;

dp (t)

dt= −ωx (t) (9.3)

notese que la “normalizacion” de las variables x y p se realizo con constantes que dependen de ~, de modo quefacilite la comparacion del oscilador clasico con el oscilador cuantico. El estado clasico esta determinado para todotiempo por las variables x (t) , p (t) o equivalentemente, por las variables x (t) y p (t). Estas a su vez se puedensintetizar en un numero complejo adimensional α (t) en la forma

α (t) =1√2[x (t) + ip (t)] (9.4)

y las ecuaciones (9.3) se pueden escribir como una unica ecuacion compleja en la forma

dα (t)

dt= −iω α (t) (9.5)

cuya solucion es

α (t) = α0e−iωt ; α0 = α (0) =

1√2[x (0) + ip (0)] ≡ |α0| eiδ (9.6)

siendo α0 un numero complejo que se puede escribir como α0 = |α0| eiδ , claramente la solucion representa un fasorde magnitud |α0| y cuya fase esta dada por δ−ωt. Es decir, el fasor rota con velocidad angular −ω (de modo quesi ω > 0 el giro es en direccion horaria alrededor de O).

Es claro ademas que las componentes cartesianas del fasor α (t) en cualquier instante, corresponden a x (t) /√2

y p (t) /√2. Vemos entonces que la descripcion completa del movimiento se obtiene a traves de la condicion inicial

descrita por α0, en la Ec. (9.6). Esta condicion inicial se expresa bien sea como posicion y momento inicial(componentes cartesianas adimensionales) o bien sea como |α0| y δ (parametros polares correspondientes a laamplitud adimensional de la oscilacion y fase inicial respectivamente). De las Ecs. (9.4, 9.6) se obtiene

x (t) =1√2

[α0e

−iωt + α∗0eiωt]=

√2Re

[α0e

−iωt] ; p (t) = − i√2

[α0e

−iωt − α∗0eiωt]=

√2Im

[α0e

−iωt] (9.7)

ahora escribiremos la energıa del sistema clasico H la cual es una constante de movimiento y por tanto coincidecon su valor inicial para todo tiempo

H =1

2m[p (0)]2 +

1

2mω2 [x (0)]2

H =~ω

2

[x (0)]2 + [p (0)]2

(9.8)

teniendo en cuenta la segunda de las Ecs. (9.6), la energıa queda en la forma

H = ~ω |α0|2 (9.9)

para un oscilador macroscopico es claro que la energıa es mucho mayor a la energıa del cuanto fundamental demodo que

|α0| ≫ 1 (9.10)

9.2. Construccion de los estados coherentes o cuasi-clasicos

Buscaremos estados mecano-cuanticos para los cuales los valores esperados 〈X〉 , 〈P 〉 y 〈H〉 sean muy simi-lares a los valores clasicos x, p,H. Para ello compararemos a X,P con las variables adimensionales x, p para lo

Page 295: Mecanica Cuantica: Notas de Clase

9.2. CONSTRUCCION DE LOS ESTADOS COHERENTES O CUASI-CLASICOS 295

cual definiremos los correspondientes observables adimensionales. Adicionalmente, escribiremos los observables enterminos de los operadores creacion y destruccion. De las Ecs. (8.8, 8.12) se obtiene

X = βX =1√2

(a+ a†

); P =

1

~βP = − i√

2

(a− a†

); H = ~ω

(a†a+

1

2

)(9.11)

si comparamos las Ecs. (9.11) con las Ecs. (9.7, 9.6) vemos que el operador a es el analogo de la cantidad clasicaα (t) y a† posee el papel de α∗ (t). Clasicamente hemos visto que la cantidad compleja α0 (condiciones iniciales)nos dictamina la evolucion temporal de los observables clasicos que se describen con α (t) en la Ec. (9.6), y dadoque a es el analogo cuantico de α, es natural continuar la analogıa calculando la evolucion temporal de 〈a〉 parael sistema en un estado arbitrario |ψ (t)〉. Tal evolucion se obtiene de la Ec. (5.52)

i~d

dt〈a〉 (t) = 〈[a,H]〉 (t) (9.12)

donde hemos tenido en cuenta que a es solo funcion de X y P y por tanto no depende explıcitamente del tiempo.El miembro derecho de (9.12) se escribe como

〈[a,H]〉 (t) = ~ω

⟨[a, a†a+

I

2

]⟩(t) = ~ω

⟨[a, a†a

]⟩(t) = ~ω

⟨[a, a†

]a⟩(t)

〈[a,H]〉 (t) = ~ω 〈a〉 (t)

donde hemos usado la Ec. (8.10) Pag. 272. Con lo anterior, la Ec. (9.12) queda

id

dt〈a〉 (t) = ω 〈a〉 (t) (9.13)

cuya solucion es

〈a〉 (t) = 〈a〉 (0) e−iωt (9.14)

la solucion para⟨a†⟩(t) es la compleja conjugada de (9.14)

⟨a†⟩(t) =

⟨a†⟩(0) eiωt = 〈a〉∗ (0) eiωt (9.15)

notese que las soluciones cuanticas (9.14, 9.15) son los analogos de la solucion clasica (9.6), como era de esperarseen virtud de la analogıa a, a† ↔ α,α∗. Sustituyendo (9.14) y (9.15) en (9.11) se obtiene

⟨X⟩(t) =

1√2

[〈a〉 (0) e−iωt + 〈a〉∗ (0) eiωt

]

⟨P⟩(t) = − i√

2

[〈a〉 (0) e−iωt − 〈a〉∗ (0) eiωt

](9.16)

el lımite clasico se obtiene igualando los valores esperados con las variables clasicas

⟨X⟩(t) = x (t) ;

⟨P⟩(t) = p (t) (9.17)

esta igualacion se realiza comparando las Ecs. (9.16) con las Ecs. (9.7). De esto se ve que la condicion necesaria ysuficiente para obtener el lımite clasico (9.17) es que en t = 0 se cumpla la condicion

〈a〉 (0) = α0 (9.18)

siendo α0 el parametro complejo que caracteriza al movimiento clasico que pretendemos emular cuanticamente, yviene dado por la segunda de las Ecs. (9.6). Debemos ahora obtener la condicion para la igualacion de las energıas

Page 296: Mecanica Cuantica: Notas de Clase

296 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

clasica y cuantica, para ello calculamos el valor esperado del Hamiltoniano cuantico, como este es constante demovimiento, se puede evaluar en cero

〈H〉 = ~ω⟨a†a⟩(0) +

2

debemos igualar esta energıa con su valor clasico H y obtener la condicion que se genera con tal igualacion. Paraello podemos despreciar el termino ~ω/2, ya que el lımite clasico corresponde a energıas mucho mayores que ~ω.Recordemos que el termino ~ω/2 es puramente cuantico en su origen. La igualacion de 〈H〉 ≃ ~ω

⟨a†a⟩(0) con el

valor clasico dado por la Ec. (9.9) nos lleva a la condicion

⟨a†a⟩(0) = |α0|2 (9.19)

recordando que hemos asumido un estado |ψ (t)〉 para el sistema, las condiciones (9.18, 9.19) se escriben como

〈ψ (0)| a |ψ (0)〉 = α0 ; 〈ψ (0)| a†a |ψ (0)〉 = |α0|2 (9.20)

veremos que las condiciones (9.20) son suficientes para determinar el estado normalizado |ψ (0)〉 excepto por unfactor de fase constante. Para verlo introducimos el operador b (α0) definido por

b (α0) ≡ a− α0

notese que este operador mide la “desviacion” entre el comportamiento del operador cuantico a y el de su analogoclasico α0 en el tiempo inicial, tenemos que

b† (α0) b (α0) =(a† − α∗

0

)(a− α0) = a†a− a†α0 − α∗

0a+ |α0|2

con lo cual

‖b (α0) |ψ (0)〉‖2 = 〈ψ (0)| b† (α0) b (α0) |ψ (0)〉 = 〈ψ (0)|a†a− a†α0 − α∗

0a+ |α0|2|ψ (0)〉

‖b (α0) |ψ (0)〉‖2 = 〈ψ (0)| a†a |ψ (0)〉 − α0 〈ψ (0)| a† |ψ (0)〉 − α∗0 〈ψ (0)| a |ψ (0)〉+ |α0|2

y usando las condiciones (9.20) tenemos que

‖b (α) |ψ (0)〉‖2 = |α0|2 − α0α∗0 − α∗

0α0 + |α0|2 = 0

como la norma del ket b (α) |ψ (0)〉 es nula entonces el ket como tal es nulo, por tanto

b (α) |ψ (0)〉 = 0 ⇒ (a− α0) |ψ (0)〉 = 0

a |ψ (0)〉 = α0 |ψ (0)〉 (9.21)

recıprocamente, si el ket normalizado |ψ (0)〉 satisface esta relacion, podemos devolvernos en los pasos y ver quelas condiciones (9.20) se satisfacen. Notese que el resultado b (α) |ψ (0)〉 = 0 es el esperado, ya que cuando el estado|ψ (0)〉 es cuasi-clasico, es razonable que la “desviacion” entre el comportamiento clasico y el cuantico se anule.

Lo anterior nos lleva a la conclusion de que el estado cuasi-clasico asociado con un movimiento clasico ca-racterizado por el parametro α0, es tal que el vector de estado |ψ (0)〉 en t = 0 es un autovector del operadordestruccion a con autovalor α0. Escribiremos los autovectores de a y su autovalores en la forma

a |α〉 = α |α〉 (9.22)

veremos ademas que la solucion de (9.22) es unica salvo constantes.

Page 297: Mecanica Cuantica: Notas de Clase

9.3. PROPIEDADES DE LOS ESTADOS |α〉 297

9.3. Propiedades de los estados |α〉Vamos a determinar las soluciones para el ket |α〉 de la Ec. (9.22). Para ello expandiremos el ket |α〉 en la base

de estados estacionarios del oscilador armonico

|α〉 =∞∑

n=0

cn (α) |ϕn〉 (9.23)

aplicando el operador destruccion a ambos lados de la expansion y usando la Ec. (8.41), se obtiene

a |α〉 =∞∑

n=0

cn (α) [a |ϕn〉] ⇒ a |α〉 =∞∑

n=0

cn (α)[√n |ϕn−1〉

](9.24)

sustituyendo la Ec. (9.24) en la Ec. (9.22) y usando (9.23) resulta

∞∑

n=0

√ncn (α) |ϕn−1〉 = α

∞∑

k=0

ck (α) |ϕk〉

reemplazando n→ k + 1 en el miembro izquierdo, se tiene

∞∑

k=0

√k + 1ck+1 (α) |ϕk〉 = α

∞∑

k=0

ck (α) |ϕk〉

notese que aunque la suma de la izquierda debe ir desde k = −1, este primer termino es nulo. Apelando a laindependencia lineal de los |ϕk〉 se obtiene

ck+1 (α) =α√k + 1

ck (α) (9.25)

utilizando esta relacion iterativamente tenemos

ck (α) =α√kck−1 (α) =

α√k

[α√k − 1

ck−2 (α)

]=

α2

√k (k − 1)

ck−2 (α)

ck (α) =α2

√k (k − 1)

[α√k − 2

ck−3 (α)

]=

α3

√k (k − 1) (k − 2)

ck−3 (α)

ck (α) =αk√

k (k − 1) (k − 2) . . .× 2× 1ck−k (α)

de modo que todos los coeficientes de la expansion de |α〉 se pueden generar a partir de c0 (α)

ck (α) =αk√k!c0 (α) (9.26)

Escogeremos a c0 (α) como real y positivo (fase cero). Adicionalmente, escogeremos c0 (α) de modo que |α〉 quedeadecuadamente normalizado. De acuerdo con (9.23), la normalizacion de |α〉 nos lleva a

1 = 〈α |α〉 =∞∑

k=0

c∗k (α)∞∑

n=0

cn (α) 〈ϕk |ϕn〉 =∞∑

k=0

∞∑

n=0

c∗k (α) cn (α) δkn

⇒∞∑

k=0

|ck (α)|2 = 1 (9.27)

Page 298: Mecanica Cuantica: Notas de Clase

298 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

reemplazando (9.26) en (9.27) se tiene

|c0 (α)|2∞∑

k=0

|α|2kk!

= 1 ⇒ |c0 (α)|2 e|α|2

= 1

c0 (α) = e−|α|22 (9.28)

reemplazando (9.26) y (9.28) en (9.23) queda finalmente

|α〉 =∞∑

n=0

cn (α) |ϕn〉 =∞∑

n=0

αn√n!c0 (α) |ϕn〉 =

∞∑

n=0

αn√n!e−

|α|22 |ϕn〉

|α〉 = e−|α|22

∞∑

n=0

αn√n!

|ϕn〉 (9.29)

9.3.1. Valores permitidos de la energıa para un estado coherente |α〉Los estados coherentes son autoestados de un operador que no es observable (el operador a no es hermıtico). Por

tanto sus valores propios pueden ser complejos y no corresponden a observables fısicos. Sin embargo, estos estadosson de cuadrado integrable y por tanto pertenecen al espacio de estados fısicos posibles. Asumamos entonces unoscilador en el estado |α〉 descrito por la Ec. (9.29). La probabilidad de obtener el valor Em = (m+ 1/2) ~ω parael sistema en el estado |α〉 se puede calcular de (9.29)

Pm (α) = |〈ϕm |α〉|2 =∣∣∣∣∣e

− |α|22

∞∑

n=0

αn√n!〈ϕm |ϕn〉

∣∣∣∣∣

2

Pm (α) = e−|α|2 |α|2mm!

es facil ver que la probabilidad anterior cumple con la condicion

Pm (α) =|α|2m

(e−|α|2 |α|2(m−1)

(m− 1)!

)⇒

Pm (α) =|α|2m

Pm−1 (α)

de modo que la distribucion de la probabilidad es del tipo Poisson. Se puede verificar que el maximo de estaprobabilidad se obtiene cuando

m = la parte entera de |α|2 (9.30)

calcularemos ahora el valor esperado de la energıa el cual debe ser comparado con la energıa clasica. Para ellonotemos primero que de la Ec. (9.22), se tiene que

‖a |α〉‖2 = ‖α |α〉‖2 ⇒ 〈α| a†a |α〉 = 〈α|α∗α |α〉 ⇒〈α| a†a |α〉 = |α|2 (9.31)

con lo cual

〈H〉α = ~ω 〈α|(a†a+

1

2

)|α〉

〈H〉α = ~ω

(|α|2 + 1

2

)(9.32)

Page 299: Mecanica Cuantica: Notas de Clase

9.3. PROPIEDADES DE LOS ESTADOS |α〉 299

teniendo en cuenta el resultado (9.30), vemos que si |α| ≫ 1 (como corresponde al lımite clasico), la cantidad〈H〉α es muy similar en valor relativo a la energıa En que corresponde al maximo de Pn (α). Con el fin de calcularel ancho ∆H calcularemos

⟨H2⟩α

⟨H2⟩α

= ~2ω2 〈α|(a†a+

1

2

)2

|α〉 = ~2ω2 〈α|[(a†a)(

a†a)+ a†a+

1

4

]|α〉

= ~2ω2 〈α|NN |α〉+ ~2ω2 〈α|[a†a+

1

4

]|α〉 = ~2ω2〈Nα |Nα〉+ ~2ω2

(|α|2 + 1

4

)

⟨H2⟩α

= ~2ω2 ‖|Nα〉‖2 + ~2ω2

(|α|2 + 1

4

)(9.33)

donde hemos usado la Ec. (9.31) y el hecho de que N = a†a es hermıtico. Multiplicando (9.22) por a† se tiene que

a†a |α〉 = αa† |α〉 ⇒ N |α〉 = αa† |α〉 ⇒ ‖N |α〉‖2 = |α|2∥∥∥a† |α〉

∥∥∥2

⇒ ‖N |α〉‖2 = |α|2 〈α| aa† |α〉 ⇒ ‖N |α〉‖2 = |α|2 〈α|(a†a+ 1

)|α〉

‖N |α〉‖2 = |α|2(|α|2 + 1

)(9.34)

donde hemos usado nuevamente (9.31). Reemplazando (9.34) en (9.33) se obtiene

⟨H2⟩α

= ~2ω2 |α|2(|α|2 + 1

)+ ~2ω2

(|α|2 + 1

4

)

⟨H2⟩α

= ~2ω2

[|α|4 + 2 |α|2 + 1

4

](9.35)

y el ancho se obtiene usando (9.32) y (9.35)

(∆Hα)2 =

⟨H2⟩α− 〈H〉2α = ~2ω2

[|α|4 + 2 |α|2 + 1

4

]−[~ω

(|α|2 + 1

2

)]2

(∆Hα)2 = ~2ω2

[|α|4 + 2 |α|2 + 1

4− |α|4 − |α|2 − 1

4

]= ~2ω2 |α|2

(∆Hα) = ~ω |α| (9.36)

en el lımite cuasi-clasico el ancho relativo debe ser mucho menor que uno, con el fin de poder afirmar que la energıaesta bien definida. El ancho relativo se puede calcular de (9.32) y (9.36)

∆Hα

〈H〉α=

|α|(|α|2 + 1

2

) (9.37)

para el lımite cuasi-clasico |α| ≫ 1, se tiene que

∆Hα

〈Hα〉≃ |α|

|α|2=

1

|α| ≪ 1 (9.38)

de modo que se puede considerar que la energıa esta bien definida en el lımite cuasi-clasico. Es inmediato ver que

〈N〉α = |α|2 ; ∆Nα = |α|

lo cual nos dice que para obtener un estado cuasi-clasico |α| ≫ 1, se debe suporponer un enorme numero deestados |ϕn〉 ya que ∆Nα ≫ 1. Sin embargo, el valor relativo de la dispersion sobre N tambien es muy pequeno

∆Nα

〈N〉α≃ 1

|α| ≪ 1

Page 300: Mecanica Cuantica: Notas de Clase

300 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

9.3.2. Calculo de los observables X,P en el estado |α〉Con el fin de realizar la comparacion con los valores clasicos, calcularemos 〈X〉 , 〈P 〉 , ∆X, ∆P . Para ello se

usan las expresiones de X y P en terminos de a y a† (ver Ecs. 8.9), junto con la Ec. (9.22)

〈X〉α =

√~

2mω〈α|(a† + a

)|α〉 =

√~

2mω

[〈α| a† |α〉+ 〈α| a |α〉

]=

√~

2mω(α∗ + α) =

√2~

mωRe (α)

〈P 〉α = i

√m~ω

2〈α|(a† − a

)|α〉 = i

√m~ω

2(α∗ − α) = (−2i) i

√m~ω

2

(α− α∗)2i

=√2m~ωIm (α)

⟨X2⟩α

=~

2mω〈α|(a† + a

)2|α〉 = ~

2mω〈α|[(a†)2

+ a2 + a†a+ aa†]|α〉 = ~

2mω〈α|[(a†)2

+ a2 + 2N + 1

]|α〉

=~

2mω

[α∗2 + α2 + 2 |α|2 + 1

]=

~

2mω

[(α∗ + α)2 + 1

]

⟨P 2⟩α

= −m~ω

2〈α|(a† − a

)2|α〉 = −m~ω

2〈α|[(a†)2

+ a2 − 2N − 1

]|α〉 = m~ω

2

[−α∗2 − α2 + 2 |α|2 + 1

]

=m~ω

2

[− (α− α∗)2 + 1

]

(∆Xα)2 =

⟨X2⟩α− 〈X〉2α =

~

2mω

[(α∗ + α)2 + 1

]− ~

2mω(α∗ + α)2 =

~

2mω

(∆Pα)2 =

⟨P 2⟩α− 〈P 〉2α =

m~ω

2

[− (α− α∗)2 + 1

]−[i

√m~ω

2(α∗ − α)

]2

=m~ω

2

[− (α− α∗)2 + 1

]+m~ω

2(α∗ − α)2 =

m~ω

2

resumiendo los anteriores resultados tenemos que

〈X〉α = 〈α|X |α〉 =√

2~

mωRe (α) ; 〈P 〉α = 〈α|P |α〉 =

√2m~ωIm (α) (9.39)

⟨X2⟩α

=~

2mω

[(α+ α∗)2 + 1

];⟨P 2⟩α=m~ω

2

[1− (α− α∗)2

](9.40)

∆Xα =

√~

2mω; ∆Pα =

√m~ω

2(9.41)

se observa que los anchos ∆Xα y ∆Pα no dependen de α y el producto de los anchos toma su valor mınimo

∆Xα ·∆Pα =~

2(9.42)

lo cual es muy deseable para un lımite cuasi-clasico.

9.4. Generador y funcion de onda de los estados coherentes

Teniendo en cuenta la Ec. (8.31) vemos que el estado coherente de la Ec. (9.29) se puede escribir en terminosdel operador construccion a partir del estado base del oscilador armonico

|α〉 = e−|α|22

∞∑

n=0

αn√n!

|ϕn〉 = e−|α|22

∞∑

n=0

αn√n!

(a†)n

√n!

|ϕ0〉 =[e−

|α|22

∞∑

n=0

(αa†)n

n!

]|ϕ0〉

|α〉 =

[e−

|α|22 eαa

†]|ϕ0〉 ≡ D (α) |ϕ0〉 (9.43)

Page 301: Mecanica Cuantica: Notas de Clase

9.4. GENERADOR Y FUNCION DE ONDA DE LOS ESTADOS COHERENTES 301

podemos generar a |α〉 a partir de |ϕ0〉 con un operador mas simetrico, para ello tenemos en cuenta que el operadordestruccion a aniquila el estado base, con lo cual tenemos que

e−α∗a |ϕ0〉 =

[1− α∗a+

α∗2

2!a2 + . . .

]|ϕ0〉 = |ϕ0〉 (9.44)

de la Ec. (9.44) podemos reescribir la Ec. (9.43) en la forma

|α〉 =[e−

|α|22 eαa

†e−α

∗a]|ϕ0〉

con lo cual se obtiene

|α〉 = D (α) |ϕ0〉 (9.45)

D (α) ≡ e−|α|2

2

eαa†e−α

∗a (9.46)

teniendo en cuenta que [αa†,−α∗a

]= −αα∗

[a†, a

]= |α|2 I

y usando la relacion (1.149), las Ecs. (9.45, 9.46) quedan

D (α) = eαa†−α∗a ; |α〉 = D (α) |ϕ0〉 (9.47)

este operador (conocido como operador de Weyl) es unitario

D† (α) = eα∗a−αa† ⇒ D (α)D† (α) = D† (α)D (α) = I

La Ec. (9.47) nos muestra que podemos ver al operador unitario D (α) como un operador “creacion” del estadocoherente |α〉 a partir del estado base del oscilador armonico. La Ec. (9.47) nos permite encontrar la funcion deonda asociada a los estados coherentes

ψα (x) = 〈x|α〉 = 〈x|D (α) |ϕ0〉 (9.48)

para calcular la funcion de onda, primero escribimos el operador αa† −α∗a en terminos de X y P usando las Ecs.(8.7)

αa† − α∗a =

√mω

~

(α− α∗√2

)X − i√

m~ω

(α+ α∗√2

)P

teniendo en cuenta que[√

~

(α− α∗√2

)X, − i√

m~ω

(α+ α∗√2

)P

]= − i

2√m~ω

√mω

~(α− α∗) (α+ α∗) [X,P ]

=1

2

[α2 − α∗2]

y usando de nuevo la relacion (1.149), el operador D (α) queda

D (α) = eαa†−α∗a = exp

[√mω

~

α− α∗√2

X

]exp

[− i√

m~ω

α+ α∗√2

P

]exp

[α∗2 − α2

4

]

sustituyendo este resultado en (9.48) se obtiene

ψα (x) = exp

[α∗2 − α2

4

]〈x| exp

[√mω

~

α− α∗√2

X

]exp

[− i√

m~ω

α+ α∗√2

P

]|ϕ0〉

ψα (x) = exp

[α∗2 − α2

4

]exp

[√mω

~

α− α∗√2

x

]〈x| exp

− i

~

[√~

2mω(α+ α∗)

]P

|ϕ0〉 (9.49)

Page 302: Mecanica Cuantica: Notas de Clase

302 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

ahora bien, el operador e−iλP/~ es el operador traslacion de λ a lo largo de x (siendo P la componente x delmomento) ver seccion 1.44.2 Ec. (1.211), pag 106, de modo que

〈x| exp− i

~

[√~

2mω(α+ α∗)

]P

=

⟨x−

√~

2mω(α+ α∗)

∣∣∣∣∣

con lo cual la Ec. (9.49) queda

ψα (x) = exp

[α∗2 − α2

4

]exp

[√mω

~

α− α∗√2

x

]ϕ0

(x−

√~

2mω(α+ α∗)

)(9.50)

si escribimos α y α∗ en terminos de 〈X〉α y 〈P 〉α segun las Ecs. (9.39), tenemos que

α− α∗ = 2i Im(α) = 2i〈P 〉α√2m~ω

; α+ α∗ = 2Re (α) = 2

√mω

2~〈X〉α (9.51)

α∗2 − α2 = − (α− α∗) (α+ α∗) = −2i〈X〉α 〈P 〉α

~(9.52)

reemplazando las Ecs. (9.51, 9.52) en la funcion de onda (9.50) tenemos que

ψα (x) = exp

[−i〈X〉α 〈P 〉α

2~

]exp

[√mω

~

2i 〈P 〉α√2√2m~ω

x

]ϕ0

(x−

√~

2mω

(2

√mω

2~〈X〉α

))

ψα (x) = eiθαei〈P 〉αx/~ϕ0 (x− 〈X〉α) ; θα ≡ −〈X〉α 〈P 〉α2~

(9.53)

la ecuacion (9.53) nos muestra que ψα (x) se puede obtener a partir de la funcion de onda ϕ0 (x) del estado basedel oscilador armonico en la siguiente forma: Se traslada esta funcion a lo largo de x en una cantidad 〈X〉α yse multiplica por la exponencial oscilante ei〈P 〉αx/~. El factor eiθa es irrelevante y puede ser omitido, notese sinembargo que el termino ei〈P 〉αx no es una fase global sino local ya que depende de x, y por tanto es relevante. Estaexponencial nos asegura que el valor promedio de P en el estado ψα (x) sea 〈P 〉α.

Si reemplazamos la forma explıcita de ϕ0 (x) (Ec. 8.48, Pag. 281), en la Ec. (9.53) obtenemos

ψα (x) =(mωπ~

) 14eiθαei〈P 〉αx/~ exp

−1

2

~(x− 〈X〉α)2

ψα (x) =(mωπ~

) 14eiθαei〈P 〉αx/~ exp

[1

2

√2mω

~(x− 〈X〉α)

]2

ψα (x) = eiθα(mωπ~

) 14exp

−[x− 〈X〉α2∆Xα

]2+ i 〈P 〉α

x

~

(9.54)

donde hemos usado tambien la Ec. (9.41). La forma del paquete de onda asociada con el estado |α〉 esta dada por

|ψα (x)|2 =√mω

π~exp

−1

2

[x− 〈X〉α∆Xα

]2(9.55)

con lo cual para cualquier estado coherente |α〉 obtenemos un paquete Gaussiano. Esto a su vez esta relacionadocon la propiedad de mınima incertidumbre que obtuvimos en la Ec. (9.42).

Page 303: Mecanica Cuantica: Notas de Clase

9.5. LOS ESTADOS COHERENTES SON COMPLETOS PERO NO ORTOGONALES 303

9.5. Los estados coherentes son completos pero no ortogonales

Los estados coherentes o cuasi-clasicos |α〉 son autovectores del operador a, el cual no es hermıtico1. Por tanto,no es claro si estos estados satisfacen relaciones de completez y ortogonalidad. Veremos que el conjunto de losestados coherentes |α〉 es completo pero no es ortogonal.

Consideremos primero el producto interno de dos estados cuasi-clasicos. Aplicando (9.29) tenemos

〈α∣∣α′⟩ =

[e−

|α|22

∞∑

m=0

α∗m√m!

〈ϕm|][

e−|α′|2

2

∞∑

n=0

α′n√n!

|ϕn〉]

= e−|α|22 e−

|α′|22

[ ∞∑

m=0

∞∑

n=0

α′n√n!

α∗m√m!

〈ϕm|ϕn〉]

= e−|α|22 e−

|α′|22

[ ∞∑

n=0

α′n√n!

α∗n√n!

]= e−

|α|22 e−

|α′|22

[ ∞∑

n=0

(α′α∗)n

n!

]

〈α∣∣α′⟩ = e−

|α|22 e−

|α′|22 eα

∗α′

con lo cual resulta ∣∣〈α∣∣α′⟩∣∣2 = e−|α−α′|2 (9.56)

de modo que este producto escalar nunca es cero. Los estados coherentes no son ortogonales.Veremos no obstante que los estados |α〉 poseen una relacion de completez de la forma

I ≡ 1

π

∫ ∫|α〉 〈α| d2α = 1 (9.57)

comenzaremos reemplazando |α〉 al lado izquierdo de (9.57) por su expresion en (9.29)

I ≡ 1

π

∫ ∫|α〉 〈α| d2α =

1

π

∫ ∫ [e−

|α|22

∞∑

n=0

αn√n!

|ϕn〉][

e−|α|22

∞∑

m=0

α∗m√m!

〈ϕm|]d2α

I =1

π

∫ ∫e−|α|2

[ ∞∑

n=0

∞∑

m=0

αnα∗m√n!√m!

|ϕn〉 〈ϕm|]d2α (9.58)

el complejo α lo podemos escribir como

α = ρeiϕ = x+ iy ; d2α = ρ dρ dϕ = dx dy = d Re (α) d Im (α) (9.59)

donde hemos tenido en cuenta la expresion del diferencial de area en coordenadas polares2. Sustituyendo laparametrizacion polar de la Ec. (9.59) en la integral (9.58), esta ultima queda como

I =1

π

∫ ∫e−|ρeiϕ|

2

[ ∞∑

n=0

∞∑

m=0

(ρeiϕ

)n (ρe−iϕ

)m√n!√m!

|ϕn〉 〈ϕm|]ρ dρ dϕ

I =1

π

∫ ∫e−|ρ|2

[ ∞∑

n=0

∞∑

m=0

ρn+mei(n−m)ϕ

√n!m!

|ϕn〉 〈ϕm|]ρ dρ dϕ

I =1

π

∞∑

n=0

∞∑

m=0

∫ ∞

0e−ρ

2ρn+m ρ dρ

1√n!m!

|ϕn〉 〈ϕm|∫ 2π

0dϕ ei(n−m)ϕ (9.60)

1De hecho el operador destruccion “a” no es ni siquiera normal, de modo que no es valido en general el teorema espectral para esteoperador.

2Combinando las Ecs. (9.39, 9.59), podemos ver que d2α = d Re (α) d Im (α) = 12~d 〈X〉α d 〈P 〉α, con lo cual la Ec. (9.57) que

expresa la completez de los estados coherentes, se puede interpretar como una integral sobre el espacio de fase clasico.

Page 304: Mecanica Cuantica: Notas de Clase

304 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

la integral sobre ϕ es inmediata ∫ 2π

0ei(n−m)ϕdϕ = 2πδnm

de modo que la Ec. (9.60) queda en la forma

I = 2

∞∑

n=0

∞∑

m=0

∫ ∞

0e−ρ

2ρn+m ρ dρ

1√n!m!

|ϕn〉 〈ϕm| δmn = 2

∞∑

n=0

∫ ∞

0e−ρ

2ρn+n ρ dρ

1√n!n!

|ϕn〉 〈ϕn|

I =∞∑

n=0

2

[∫ ∞

0e−ρ

2ρ2n ρ dρ

]1

n!|ϕn〉 〈ϕn|

haciendo el cambio de variable u = ρ2, du = 2ρ dρ tenemos

n

In1

n!|ϕn〉 〈ϕn| ; In = 2

∫ ∞

0ρ dρ e−ρ

2ρ2n =

∫ ∞

0du e−uun (9.61)

haciendo dV = du e−u y U = un integramos In por partes

In = −une−u∣∣∞0

−∫ ∞

0−e−u

(n un−1

)du = n

∫du e−uun−1

con lo cual encontramos una relacion de recurrencia para In

In = nIn−1

cuya solucion es

In = nIn−1 = n (n− 1) In−2 = n (n− 1) (n− 2) In−3 = . . . = [n× (n− 1)× (n− 2)× · · · × 2× 1] In−nIn = n!I0

de la Ec. (9.61) tenemos que

I0 =

∫ ∞

0du e−u = −e−u

∣∣∞0

= 1 ⇒

In = n!I0 = n!

que al sustituırlo en (9.61) nos da

I =∑

n

|ϕn〉 〈ϕn| = 1

donde hemos usado la completez de las autofunciones del oscilador armonico. Con esto se demuestra la Ec. (9.57),que nos expresa la completez de los estados coherentes |α〉.

9.6. Evolucion temporal de los estados coherentes

Consideremos un oscilador armonico que en t = 0 esta en un estado coherente dado |ψ (0)〉 = |α0〉. Veremosla evolucion temporal de este estado y de los observables mas importantes. Ya hemos visto que 〈X〉 (t) y 〈P 〉 (t)permanecen iguales a sus valores clasicos para todo tiempo. De hecho, esta caracterıstica fue la motivacion parala construccion de estos estados.

Para calcular la evolucion temporal del estado del sistema, expandimos el estado inicial en autoestados delHamiltoniano del oscilador armonico usando (9.29)

|ψ (0)〉 = |α0〉 =∑

n

cn (0) |ϕn〉 ; cn (0) ≡ e−|α0|2

2αn0√n!

(9.62)

Page 305: Mecanica Cuantica: Notas de Clase

9.6. EVOLUCION TEMPORAL DE LOS ESTADOS COHERENTES 305

Como el Hamiltoniano del oscilador armonico es independiente del tiempo, la evolucion temporal del estadose puede calcular con la Ec. (5.67)

|ψ (t)〉 =∑

n

cn (0) e−iEnt/~ |ϕn〉 = e−

|α0|22

n

αn0√n!

e−i(n+12)ωt |ϕn〉

|ψ (t)〉 = e−iωt2 e−

|α0|22

n

αn0√n!

e−inωt |ϕn〉 = e−iωt2 e−

|α0e−iωt|22

n

(α0e

−iωt)n√n!

|ϕn〉 (9.63)

comparando (9.63) con (9.62), vemos que el ket |ψ (t)〉 se obtiene del ket inicial |ψ (0)〉 = |α0〉 cambiando α0 por

α0e−iωt y multiplicando el ket resultante por la fase global (irrelevante) e−i

ωt2 , con lo cual |ψ (t)〉 se puede reescribir

como

|ψ (t)〉 = e−iωt/2∣∣α = α0e

−iωt⟩ ; |ψ (0)〉 = |α0〉 (9.64)

por tanto el estado cuasi-clasico continua siendo autovector del operador a, para todo tiempo t. Su autovalor esα0e

−iωt que es el parametro α (t) descrito por las ecuaciones (9.4, 9.6) y que geometricamente es un fasor que rotaen el plano complejo con velocidad angular −ω. Recordemos que este fasor caracteriza en todo tiempo al osciladorarmonico clasico cuya evolucion pretendemos reproducir a traves del estado |ψ (t)〉. Los valores esperados de 〈X〉y 〈P 〉 para todo tiempo se obtienen a partir de (9.64) y (9.39)

〈X〉α(t) (t) =√

2~

mωRe[α0e

−iωt] ; 〈P 〉α(t) (t) =√2m~ωIm

[α0e

−iωt] (9.65)

y tal como se predijo, estas ecuaciones son similares a la evolucion clasica Ecs. (9.7).Por otro lado, la energıa promedio es independiente del tiempo

〈H〉α(t) (t) = ~ω

[∣∣α0e−iωt∣∣2 + 1

2

]= ~ω

[|α0|2 +

1

2

](9.66)

finalmente, las raıces de las desviaciones medias cuadraticas ∆Hα(t),∆Xα(t) y ∆Pα(t) calculadas con las Ecs. (9.36,9.41) nos dan

∆H = ~ω |α0| ; ∆X =

√~

2mω; ∆P =

√m~ω

2(9.67)

vemos que los anchos no dependen del tiempo. En particular ∆X y ∆P permanecen siendo paquetes de mınimaincertidumbre para todo tiempo. No hay dispersion de los paquetes de onda. Veamos un poco mas en detalle laevolucion del paquete de onda, la funcion de onda ψ (x, t) para todo tiempo se puede calcular con las Ecs. (9.54,9.64)

ψ (x, t) = eiθα(mωπ~

)1/4e−iωt/2ei

x〈P 〉(t)~ e

−[x−〈X〉(t)

2∆X

]2

vemos que la forma del paquete es Gaussiana para todo tiempo t. Su forma no varıa en el tiempo puesto que

|ψ (t)|2 = |ϕ0 (x− 〈X〉 (t))|2

vemos que los estados cuasi-clasicos son tales que los anchos ∆X y ∆P permanecen como paquetes de mınimaincertidumbre y la forma del paquete permanece intacta cuando este se propaga. Esta ausencia de dispersion yde cambio del perfil del paquete es la que le da el nombre de “estados coherentes” a los estados cuasi-clasicos deloscilador armonico.

La Fig. 9.1 muestra el movimiento de un paquete de onda de un estado coherente. De acuerdo con la Ec.(9.65), el valor esperado de X oscila alrededor de x = 0 con periodo T = 2π/ω, y dado que el paquete de ondano se distorsiona, este sera tambien el movimiento del paquete como un todo. En contraste, vimos en la seccion2.15.1 que un paquete Gaussiano libre se distorsiona cuando se propaga, ya que su ancho aumenta a medida que se

Page 306: Mecanica Cuantica: Notas de Clase

306 CAPITULO 9. ESTADOS CUASI-CLASICOS DEL OSCILADOR ARMONICO

Figura 9.1: Propagacion de un paquete de onda Gaussiano sometido a un potencial parabolico y asociado a un estadocuasi-clasico. El paquete oscila alrededor del punto de equilibrio. La forma y el ancho del paquete Permanecenintactos en el tiempo.

propaga (dispersion del paquete de onda). Vemos en contraste que un paquete Gaussiano sometido a un potencialparabolico (oscilador armonico) no posee dispersion. Esto se debe a que la tendencia del paquete a dispersarsees compensada por el potencial, cuyo efecto es empujar al paquete hacia el origen desde regiones donde x (y portanto V (x)) es grande.

Adicionalmente, ya hemos visto en las secciones (9.3.1, 9.3.2) que cuando |α| ≫ 1, las raıces de las desviacionesmedias cuadraticas de X, P y H son mucho menores que sus valores esperados asociados, y ademas dichos valoresesperados emulan en todo tiempo la evolucion clasica. De modo que escogiendo un valor de |α| lo suficientementealto, obtenemos una evolucion temporal cuantica para la cual la posicion y momento de los osciladores son en valorrelativo, tan definidos como es posible, ya que los paquetes son de mınima incertidumbre, y su valor caracterısticotiene un comportamiento similar al clasico. Por tanto, en este lımite el estado |α〉 emula muy bien las propiedadesde un oscilador macroscopico (clasico) para el cual la posicion, momento y energıa estan bien definidos.

Page 307: Mecanica Cuantica: Notas de Clase

9.7. TRATAMIENTO MECANO-CUANTICO DE UN OSCILADOR ARMONICO MACROSCOPICO 307

9.7. Tratamiento mecano-cuantico de un oscilador armonico macroscopico

Consideraremos un ejemplo macroscopico que nos permita una apreciacion numerica de la discusion anterior.Sea un cuerpo de masa m = 1kg, suspendido de una cuerda de longitud l = 0,1m colocado en un campogravitacional g ≃ 10m/seg2. Sabemos que para pequenas oscilaciones el periodo de movimiento es

T = 2π

√l

g≃ 0,63seg ; ω = 10Rad/seg

asumamos que este oscilador realiza movimiento periodico de amplitud xM = 1cm. Nos preguntamos ahora porel estado mecano-cuantico que mejor representa esta oscilacion.

De acuerdo con la discusion anterior, dicho estado es del tipo |α〉. Combinando la relacion clasica entre energıay amplitud con la Ec. (9.32) (despreciando el factor 1/2 en esta ultima) se obtiene

E =1

2mω2x2M = ~ω |α|2 ⇒

|α| =

√mω

2~xM

en donde el argumento de α depende de la fase inicial de movimiento. Para nuestro caso tenemos las siguientesestimaciones numericas

|α| ≃√5× 1015 ≫ 1

∆X =

√~

2mω≃ 2,2× 10−18m≪ xM

∆P =

√m~ω

2≃ 2,2× 10−17kg m/s

la raız de la desviacion media cuadratica para la velocidad esta dada por

∆V ≃ 2,2× 10−17m/s

el valor maximo de la velocidad del oscilador es 0,1m/s y la raız del valor medio cuadratico es de este mismoorden de magnitud. Por tanto, las incertidumbres en la posicion y velocidad son completamente despreciables conrespecto a las cantidades involucradas en el problema. Por ejemplo ∆X es menor que un fermi (10−15m) quees el tamano aproximado de un nucleo atomico. Es claro que esta cantidad es despreciable para una longitudmacroscopica.

Finalmente, la energıa del oscilador se conoce con una excelente precision relativa, usando la Ec. (9.38) resulta

∆H

〈H〉 ≃ 1

|α| ≃ 0,4× 10−15 ≪ 1

todo esto nos muestra porque la mecanica clasica provee una adecuada descripcion del oscilador armonico ma-croscopico.

Page 308: Mecanica Cuantica: Notas de Clase

Capıtulo 10

Teorıa general del momento angular enmecanica cuantica

Es bien conocida la gran importancia que tiene el momento angular en mecanica clasica. En primer lugar esuna constante de movimiento cuando el sistema es aislado constituyendo uno de los principios de conservacionmas fundamentales en la teorıa clasica. Ademas, tambien es una cantidad conservada para una partıcula sometidaa una fuerza central, y trae como consecuencia el hecho de que el movimiento sea en un plano y que se conservela velocidad aerolar (segunda ley de Kepler).

Veremos que estas propiedades tienen su contrapartida cuantica. Por ejemplo, veremos mas adelante que parauna partıcula sometida a una interaccion central, los operadores L1, L2, L3 que surgen de cuantizar las cantidadesclasicas, son constantes de movimiento en el sentido cuantico, es decir no dependen explıcitamente del tiempoy conmutan con el Hamiltoniano. Veremos ademas que existe otro tipo de momento angular que no dependede R ni P ni de ninguna otra variable geometrica clasica. Estos momentos angulares que surgen directamentecomo observables cuanticos y no como la cuantizacion de observables clasicos se denominan momentos angularesintrınsecos. Este momento angular intrınseco (tambien conocido como espın), esta cuantizado desde el principioy es esencial para entender el mundo microscopico como veremos mas adelante.

De aquı en adelante denotaremos como momento angular orbital L a cualquier momento angular que provengade la cuantizacion de un momento angular clasico. Llamaremos momento angular de espın S o simplemente espın, acualquier momento angular intrınseco de una partıcula. Finalmente, en sistemas complejos como nucleos, atomos,moleculas, etc. los momentos angulares orbitales de sus constituyentes se combinan y tambien se combinan conlos espines de sus constituyentes para formar el momento angular total J. La notacion J representara entonces laresultante entre la suma de momentos orbitales e intrınsecos, pero tambien se usara para denotar un momentoangular generico cuando no hagamos distincion entre el momento angular intrınseco y orbital. Las reglas de adicionde los momentos angulares se estudiaran en capıtulos subsecuentes.

Existen una serie de propiedades de los momentos angulares que solo dependen de sus relaciones de conmutaciony que seran validas para cualquier momento angular sin importar su naturaleza. Veremos en particular, que todacomponente de un momento angular posee un espectro discreto, propiedad denominada “cuantizacion espacial”.Desarrollaremos en capıtulos posteriores, las aplicaciones concernientes tanto al momento angular orbital como alintrınseco.

308

Page 309: Mecanica Cuantica: Notas de Clase

10.1. DEFINICION DE MOMENTO ANGULAR POR SUS PROPIEDADES DE CONMUTACION 309

10.1. Definicion de momento angular por sus propiedades de conmutacion

10.1.1. Cuantizacion del momento angular orbital

Para obtener los tres observables L1, L2, L3 asociados a un momento angular orbital clasico de componentesL1,L2,L3, donde

−→L = r× p (10.1)

Li = εijkxjpk ; i, j, k = 1, 2, 3 (10.2)

simplemente reemplazamos cada componente xj, pk por los correspondientes operadores Xj , Pk. La cantidad εijkes el tensor de Levi Civita. Notese que aunque aparece un producto de estos operadores, no es necesaria unasimetrizacion puesto que en (10.2) solo sobreviven los terminos con j 6= k de modo que los operadores en elproducto conmutan segun las reglas canonicas de conmutacion (4.11). Por esta razon, no hay ambiguedad enel orden y el operador que se obtiene es automaticamente hermıtico. Visto de otra manera, la simetrizacion delproducto coincide con el producto original cuando los operadores conmutan. Los observables cuanticos son entonces

Li = εijkXjPk ; i, j, k = 1, 2, 3 (10.3)

L = R×P (10.4)

calculemos entonces los conmutadores entre los Li con base en las relaciones canonicas de conmutacion (4.11)

[L1, L2] = [X2P3 −X3P2,X3P1 −X1P3] = [X2P3,X3P1 −X1P3]− [X3P2,X3P1 −X1P3]

= [X2P3,X3P1]− [X2P3,X1P3]− [X3P2,X3P1] + [X3P2,X1P3]

= X2 [P3,X3P1] + [X2,X3P1]P3 −X2 [P3,X1P3]− [X2,X1P3]P3

−X3 [P2,X3P1]− [X3,X3P1]P2 +X3 [P2,X1P3] + [X3,X1P3]P2

[L1, L2] = X2 [P3,X3]P1 +X3 [X2, P1]P3 −X2 [P3,X1]P3 −X1 [X2, P3]P3

−X3 [P2,X3]P1 −X3 [X3, P1]P2 +X3 [P2,X1]P3 +X1 [X3, P3]P2

[L1, L2] = −i~X2P1 + i~X1P2 = i~ (R×P)3[L1, L2] = i~L3

procediendo de forma similar con los demas conmutadores se obtiene

[L1, L2] = i~L3 ; [L1, L3] = −i~L2 ; [L2, L3] = i~L1

o mas sinteticamente[Li, Lj ] = i~εijkLk (10.5)

este resultado se puede generalizar cuando tenemos N partıculas sin espın. El momento angular total del sistemaen mecanica cuantica es

L =N∑

i=1

L(i) ; L(i) ≡ R(i) ×P(i)

y cada momento angular individual L(i) satisface relaciones de conmutacion del tipo (10.5) y conmuta con L(j)

para i 6= j, ya que son operadores actuando en el espacio de estados de partıculas diferentes. Por tanto para Npartıculas tendrıamos [

L(m)i , L

(n)j

]= i~εijkδmnL

(m)k

Se puede demostrar adicionalmente que el origen de las reglas de conmutacion (10.5) yace en las propiedadesgeometricas de las rotaciones en tres dimensiones. Esto esta relacionado con el hecho de que en mecanica clasica,el momento angular junto con el torque forman las variables fundamentales de la dinamica rotacional.

Page 310: Mecanica Cuantica: Notas de Clase

310 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

10.1.2. Definicion de momento angular

De nuestro trabajo con el oscilador armonico hemos aprendido que muchas propiedades se pueden extraer de lasreglas de conmutacion entre los operadores sin utilizar una representacion especıfica. Esto nos induce a generalizarlos resultados anteriores para definir un operador momento angular como cualquier tripla de observables J =(J1, J2, J3), que satisface las relaciones

[Ji, Jj ] = i~εijkJk (10.6)

sera de gran utilidad el operador

J2 = J21 + J2

2 + J23

este operador es Hermıtico ya que cada componente es hermıtica. Vale la pena enfatizar que el caracter deobservable de los Ji forma parte esencial de la definicion de momento angular1. Calculemos primero el conmutadorde J2 con J, para lo cual calculamos para cada componente

[J2, J1

]=

[J21 + J2

2 + J23 , J1

]=[J22 , J1

]+[J23 , J1

]

= J2 [J2, J1] + [J2, J1]J2 + J3 [J3, J1] + [J3, J1]J3

= −i~J2J3 − i~J3J2 + i~J3J2 + i~J2J3[J2, J1

]= 0

y similarmente con las otras componentes de modo que

[J2,J

]= 0 (10.7)

toda la teorıa del momento angular en cuantica se basara completamente en las reglas de conmutacion (10.6,10.7). En particular, estas relaciones muestran que no es posible medir simultaneamente las tres componentesdel momento angular, pero sı es posible medir simultaneamente una sola componente y la cantidad J2. Es decircualquier componente de J es una variable compatible con J2. Esto implicara que si asumimos que J2 y Ji sonobservables, podemos encontrar una base comun de vectores propios para J2 y uno de los Ji. Es usual elegir lacomponente de J3, y decimos que tomamos a X3 como “eje de cuantizacion” de modo que construımos una baseque diagonalice simultaneamente a J2 y a J3.

10.2. Propiedades algebraicas del momento angular

Estudiaremos la estructura del espectro de J2 y J3 ası como la estructura de sus vectores propios comunes.Veremos que muchos de los argumentos se asemejan a los que se utilizaron para el oscilador armonico.

En primer lugar, inspirados por la definicion de los operadores a y a† en las Ecs. (8.6) introduciremos lossiguientes operadores

J+ ≡ J1 + iJ2 ; J− ≡ J1 − iJ2 (10.8)

J1 =1

2(J+ + J−) ; J2 =

1

2i(J+ − J−) (10.9)

y al igual que los operadores a y a†, los operadores J± no son hermıticos y son conjugados el uno del otro. En todoel estudio del momento angular trabajaremos con los operadores J2, J3, J+, J− por lo cual sera necesario encontrartodas las relaciones de conmutacion entre ellos

1Para un conjunto concreto de tres operadores, el caracter de observable solo podra verificarse cuando se sepa sobre que espacioactuan los operadores momento angular. Las reglas de conmutacion no especifican sobre que espacio actuan los momentos angulares.

Page 311: Mecanica Cuantica: Notas de Clase

10.3. ESTRUCTURA DE VALORES Y VECTORES PROPIOS 311

10.2.1. Algebra de los operadores J2, J3, J+, J−

Usando las Ecs. (10.6, 10.7, 10.8) podemos encontrar las relaciones de conmutacion requeridas

[J3, J±] = [J3, J1 ± iJ2] = [J3, J1]± i [J3, J2] = i~J2 ± i (−i~J1) = ~ iJ2 ± J1[J3, J+] = ~J+ ; [J3, J−] = −~J−

[J+, J−] = [J1 + iJ2, J1 − iJ2] = [J1, J1 − iJ2] + i [J2, J1 − iJ2]

= [J1, J1]− i [J1, J2] + i [J2, J1] + [J2, J2] = 2i [J2, J1] = 2i (−i~J3)[J+, J−] = 2~J3 (10.10)

[J2, J±

]=

[J2, J1 ± iJ2

]=[J2, J1

]± i[J2, J2

][J2, J±

]= 0

tambien seran utiles los siguientes productos

J+J− = (J1 + iJ2) (J1 − iJ2) = J21 + J2

2 + iJ2J1 − iJ1J2

= J21 + J2

2 + J23 − J2

3 + i [J2, J1] = J2 − J23 + i (−i~J3)

J+J− = J2 − J23 + ~J3 (10.11)

el producto J−J+ se puede obtener explıcitamente o usando las Ecs. (10.10, 10.11)

J−J+ = J+J− − [J+, J−] = J2 − J23 + ~J3 − 2~J3

J−J+ = J2 − J23 − ~J3

resumiremos el algebra encontrada hasta ahora. Tenemos las definiciones

J ≡ (J1, J2, J3) ; J2 ≡ J21 + J2

2 + J23 (10.12)

J+ ≡ (J1 + iJ2) ; J− ≡ (J1 − iJ2) (10.13)

donde los Ji son observables con las siguientes propiedades algebraicas

[Ji, Jj ] = i~εijkJk ;[J2,J

]= 0 (10.14)

[J3, J+] = ~J+ ; [J3, J−] = −~J− (10.15)

[J+, J−] = 2~J3 ;[J2, J±

]= 0 (10.16)

J+J− = J2 − J23 + ~J3 ; J−J+ = J2 − J2

3 − ~J3 (10.17)

10.3. Estructura de valores y vectores propios

10.3.1. Notacion

Dado que J2 es la suma de cuadrados de tres operadores hermıticos, tal operador es positivo

〈ψ|J2 |ψ〉 = 〈ψ|J21 |ψ〉+ 〈ψ| J2

2 |ψ〉+ 〈ψ| J23 |ψ〉 = 〈ψ| J†

1J1 |ψ〉+ 〈ψ| J†2J2 |ψ〉+ 〈ψ| J†

3J3 |ψ〉= ‖J1 |ψ〉‖2 + ‖J2 |ψ〉‖2 + ‖J3 |ψ〉‖2 ≥ 0

este resultado era de esperarse ya que la variable clasica es el modulo al cuadrado de un vector el cual es nonegativo. En particular eligiendo a |ψ〉 como un autovector de J2 vemos que

〈ψ|J2 |ψ〉 = 〈ψ| a |ψ〉 = a 〈ψ|ψ〉 = a ‖|ψ〉‖2 ≥ 0 ⇒ a ≥ 0

Page 312: Mecanica Cuantica: Notas de Clase

312 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

los autovalores deben ser no negativos (en analogıa con los autovectores de N en el oscilador armonico). Dadoque J tiene dimensiones de momento angular, el valor propio de J2 se puede parametrizar como a = µ~2 siendoµ una cantidad adimensional no negativa. Adicionalmente, se puede demostrar que para todo µ ≥ 0 la ecuacion

j (j + 1) = µ (10.18)

tiene una y solo una raız no negativa2. Por tanto la especificacion de µ determina completamente a j y viceversa.Por tanto, sin perdida de generalidad podemos denotar a los valores propios de J2 en la forma

J2 |ψ〉 = j (j + 1) ~2 |ψ〉 ; j ≥ 0

si consideramos que |ψ〉 es la base de vectores propios comunes a J2 y J3 denotaremos a los valores propios deJ3 en la forma

J3 |ψ〉 = m~ |ψ〉siendo m una cantidad adimensional.

Puesto que J2 y J3 son observables conmutantes, ellos hacen parte de un C.S.C.O pero no necesariamentelo constituyen por sı solos. Por esa razon denotaremos a los kets propios comunes a los dos con tres numeroscuanticos: j para rotular los valores propios de J2, m para rotular los valores propios de J3 y k asociado a ladegeneracion. Naturalmente, estos ındices pueden ser de momento contınuos o discretos y k podrıa simbolizarvarios ındices (los necesarios para completar un C.S.C.O.).

En sıntesis escribiremos la ecuacion de valores propios en la forma

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉 (10.19)

10.3.2. Caracterısticas generales de los valores propios de J2 y J3

Asumiremos que los estados propios estan normalizados y que J2 y J3 son observables. En analogıa con eloscilador armonico, vamos a caracterizar primero a los vectores J+ |j,m, k〉 y J− |j,m, k〉, por medio de sus normasal cuadrado

‖J+ |j,m, k〉‖2 = 〈j,m, k| J−J+ |j,m, k〉 ≥ 0 (10.20)

‖J− |j,m, k〉‖2 = 〈j,m, k| J+J− |j,m, k〉 ≥ 0 (10.21)

y usando las Ecs. (10.17, 10.19) resulta

‖J± |j,m, k〉‖2 = 〈j,m, k|(J2 − J2

3 ∓ ~J3)|j,m, k〉

= 〈j,m, k|j (j + 1) ~2 −m2~2 ∓m~2

|j,m, k〉

= j (j + 1) ~2 −m2~2 ∓m~2

‖J± |j,m, k〉‖2 = ~2 j (j + 1)−m (m± 1) (10.22)

reemplazando (10.22) en (10.20, 10.21) se tiene que

j (j + 1)−m (m+ 1) = (j −m) (j +m+ 1) ≥ 0 (10.23)

j (j + 1)−m (m− 1) = (j −m+ 1) (j +m) ≥ 0 (10.24)

asumamos que j −m < 0, dado que j ≥ 0 entonces m > 0 y j +m+ 1 > 0. Por tanto, (j −m) (j +m+ 1) < 0,contradiciendo la Ec. (10.23). Debemos rechazar la hipotesis de que j −m < 0.

Es necesario entonces que j −m ≥ 0, de esta hipotesis se obtiene que j −m+ 1 > 0, y para satisfacer la Ec.(10.24) se requiere que (j +m) ≥ 0, tenemos entonces que las condiciones

j −m ≥ 0 y j +m ≥ 0 (10.25)

2La Ec. (10.18) tiene como solucion j± =(−1±√

1 + 4µ)/2. Si µ ≥ 0, la unica solucion no negativa para j es j+.

Page 313: Mecanica Cuantica: Notas de Clase

10.3. ESTRUCTURA DE VALORES Y VECTORES PROPIOS 313

por construccion satisfacen (10.24). Solo falta ver que estas condiciones tambien cumplen con la desigualdad(10.23). Usando la segunda condicion j +m ≥ 0 vemos que implica j +m + 1 > 0, y esto junto con la primeracondicion en (10.25) nos satisface la Ec. (10.23). Vemos entonces que las condiciones (10.25) son necesarias ysuficientes para que se cumplan las desigualdades (10.23) y (10.24). Finalmente, y teniendo en cuenta que j es nonegativo, estas condiciones se pueden reescribir como

j −m ≥ 0 y j +m ≥ 0 ⇔ j ≥ m y j ≥ −m⇔ j ≥ |m| ⇔ −j ≤ m ≤ j

con lo cual obtenemos el siguiente lema

Lemma 4 Si j (j + 1) ~2 y m~ son valores propios de J2 y J3 asociados al ket propio comun |j,m, k〉 entonces jy m satisfacen la desigualdad

−j ≤ m ≤ j (10.26)

Ahora veremos con base en la Ec. (10.26), las caracterısticas de los kets J− |j,m, k〉 y J+ |j,m, k〉, siendo|j,m, k〉 autovector comun de J2 y J3.

En primer lugar, veremos las condiciones necesarias y suficientes para la nulidad del vector J− |j,m, k〉. Estose puede hacer con base en la Ec. (10.22)

J− |j,m, k〉 = 0 ⇔ ‖J− |j,m, k〉‖2 = 0 ⇔ ~2 j (j + 1)−m (m− 1) = 0

⇔ (j −m+ 1) (j +m) = 0

cuyas soluciones son m = −j (su mınimo valor posible) y m = j + 1. Pero la segunda solucion contradice al lema4 Ec. (10.26). Por tanto

m = −j ⇔ J− |j,m, k〉 = 0 (10.27)

por tanto si m > −j el vector J− |j,m, k〉 sera no nulo siempre que se cumpla la Ec. (10.26). Esto se puedecorroborar reemplazando m > −j en la Ec. (10.22) verificando que la norma de J− |j,m, k〉 no es nula. Ahorademostraremos que J− |j,m, k〉 es un ket propio de J2 y J3. Puesto que J2 y J− conmutan segun la Ec. (10.16),podemos escribir

[J2, J−

]|j,m, k〉 = 0 ⇒ J2J− |j,m, k〉 = J−J

2 |j,m, k〉 ⇒ J2J− |j,m, k〉 = J−j (j + 1) ~2 |j,m, k〉⇒ J2 [J− |j,m, k〉] = j (j + 1) ~2 [J− |j,m, k〉]

por tanto J− |j,m, k〉 es ket propio de J2 con valor propio j (j + 1) ~2. Este resultado esta relacionado con el hechode que J2 y J− conmutan, como se aprecia en el teorema 1.66, pag. 57. Ahora veremos que J− |j,m, k〉 es tambienket propio de J3, para lo cual empleamos la Ec. (10.15)

[J3, J−] |j,m, k〉 = −~J− |j,m, k〉 ⇒ J3J− |j,m, k〉 = (J−J3 − ~J−) |j,m, k〉 ⇒J3J− |j,m, k〉 = (J−m− J−)~ |j,m, k〉

⇒ J3 [J− |j,m, k〉] = (m− 1) ~ [J− |j,m, k〉]

de modo que J− |j,m, k〉 es autovector de J3 con autovalor (m− 1) ~. Los anteriores resultados se pueden resumiren el siguiente lema

Lemma 5 Sea |j,m, k〉 un vector propio comun a J2 y J3 con valores propios j (j + 1) ~2 y m~. Se tiene que (a)m = −j si y solo si J− |j,m, k〉 = 0. (b) Si m > −j entonces J− |j,m, k〉 6= 0 y es autovector de J2 y J3 convalores propios j (j + 1) ~2 y (m− 1) ~.

Page 314: Mecanica Cuantica: Notas de Clase

314 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

El siguiente paso natural es estudiar al vector J+ |j,m, k〉. De la Ec. (10.22) podemos ver las condicionesnecesarias y suficientes para que J+ |j,m, k〉 sea nulo.

J+ |j,m, k〉 = 0 ⇔ ‖J+ |j,m, k〉‖2 = 0 ⇔ ~2 j (j + 1)−m (m+ 1) = 0

⇔ (j +m+ 1) (j −m) = 0

las soluciones son m = j y m = − (j + 1) pero la segunda solucion es incompatible con el lema 4 Ec. (10.26). Portanto

m = j ⇔ J+ |j,m, k〉 = 0 (10.28)

si m < j, y usando (10.16, 10.15) obtenemos

[J2, J+

]|j,m, k〉 = 0 ⇒ J2J+ |j,m, k〉 = J+J

2 |j,m, k〉 ⇒J2 [J+ |j,m, k〉] = j (j + 1) ~2 [J+ |j,m, k〉]

[J3, J+] |j,m, k〉 = ~J+ |j,m, k〉 ⇒ J3J+ |j,m, k〉 = J+J3 |j,m, k〉 + ~J+ |j,m, k〉J3J+ |j,m, k〉 = m~J+ |j,m, k〉 + ~J+ |j,m, k〉

J3 [J+ |j,m, k〉] = (m+ 1) ~ [J+ |j,m, k〉]

por tanto J+ |j,m, k〉 es vector propio de J2 y de J3 con valores propios j (j + 1) ~2 y (m+ 1) ~. Tenemos entoncesel siguiente lema

Lemma 6 Sea |j,m, k〉 un vector propio comun a J2 y J3 con valores propios j (j + 1) ~2 y m~. Se tiene que (a)m = j si y solo si J+ |j,m, k〉 = 0. (b) Si m < j entonces J+ |j,m, k〉 6= 0 y es autovector de J2 y J3 con valorespropios j (j + 1) ~2 y (m+ 1) ~.

Veremos que estos lemas permiten encontrar el espectro de J2 y J3.

10.3.3. Determinacion de los valores propios de J2 y J3

Asumamos que |j,m, k〉 es un autovector de J2 y J3 con valores propios j (j + 1) ~2 y m~. El lema 4 nos diceque

−j ≤ m ≤ j

como el ket es fijo los valores de j y m son fijos. Es claro que existe un numero entero no negativo p, tal que

−j ≤ m− p < −j + 1 (10.29)

formamos ahora una sucesion de vectores|j,m, k〉 , J− |j,m, k〉 , (J−)2 |j,m, k〉 , . . . , (J−)p |j,m, k〉

(10.30)

demostraremos que estos son vectores propios no nulos de J2 y J3 y que para potencias mas altas de J−, seobtienen vectores nulos. Esto se realiza aplicando iterativamente el lema 5

Comenzamos aplicando el lema 5 a |j,m, k〉. Por hipotesis |j,m, k〉 es vector propio no nulo de J2 y J3 con valorespropios j (j + 1) ~2 y m~. Si m > −j podemos aplicar el lema 5 con lo cual J− |j,m, k〉 ≡ |j,m− 1, k〉 es vectorpropio no nulo de J2 y J3 con valores propios j (j + 1) ~2 y (m− 1) ~. Si m− 1 > −j podemos aplicar de nuevoel lema y J− |j,m− 1, k〉 = (J−)

2 |j,m, k〉 ≡ |j,m− 2, k〉 es vector propio no nulo de J2 y J3 con valores propios

j (j + 1) ~2 y (m− 2) ~. En general si m− (n− 1) > −j entonces J−[(J−)

n−1 |j,m, k〉]= J− |j,m− (n− 1) , k〉 =

(J−)n |j,m, k〉 ≡ |j,m− n, k〉 es vector propio no nulo de J2 y J3 con valores propios j (j + 1) ~2 y (m− n)~.

Page 315: Mecanica Cuantica: Notas de Clase

10.3. ESTRUCTURA DE VALORES Y VECTORES PROPIOS 315

Veremos que estas condiciones se satisfacen solo para n = 0, 1, . . . , p. Si asumimos que 0 ≤ n ≤ p entonces

m− (n− 1) = m− n+ 1 ≥ m− p+ 1 ≥ −j + 1

donde hemos usado la primera de las desigualdades (10.29) en el ultimo paso. Por tanto

m− (n− 1) ≥ −j + 1 > −j

de modo que la condicion m− (n− 1) > −j necesaria para aplicar el lema 5 se cumple cuando n = 0, 1, . . . , p.

Ahora veamos lo que ocurre con el vector (J−)p+1 |j,m, k〉 = J− [(J−)

p |j,m, k〉]. Puesto que (J−)p |j,m, k〉 es

autovector de J2 y J3 con valores propios j (j + 1) ~2 y (m− p)~, el lema 4 Ec. (10.26) nos dice que (m− p) ≥ −j.Asumamos de momento que

(m− p) > −juna aplicacion adicional del lema 5 nos dice que J− [(J−)

p |j,m, k〉] es autovector no nulo de J2 y J3 con valorespropios j (j + 1) ~2 y (m− p− 1) ~. Ahora aplicando la segunda de las desigualdades en la expresion (10.29), setiene que

m− p− 1 < −jlo cual contradice al lema 4 Ec. (10.26). Por tanto debemos rechazar la hipotesis m − p > −j. Solo nos quedaentonces que m− p = −j y al aplicar el lema 5 se obtiene

(J−)p+1 |j,m, k〉 = J− |j,m− p, k〉 = 0

y todas las potencias mayores tambien se anulan. Esta anulacion evita el conflicto con el lema 4.

De lo anterior se deduce que existe un entero no negativo p tal que

m− p = −j (10.31)

Por un razonamiento similar, existe un entero no negativo q, tal que

j − 1 < m+ q ≤ j

y se puede demostrar que para este entero no negativo q, la sucesion

|j,m, k〉 , J+ |j,m, k〉 , (J+)2 |j,m, k〉 , . . . , (J+)q |j,m, k〉

(10.32)

consiste de vectores no nulos, pero potencias mayores de J+ producen vectores nulos con lo cual se evita unacontradiccion con el lema 4. Esto implica a su vez que existe un entero no negativo q tal que

m+ q = j (10.33)

aquı aparece una diferencia con respecto al oscilador armonico, ya que ambos operadores J+ y J− tienen unasucesion limitada de potencias que generan vectores no nulos. En el oscilador armonico, la sucesion de a† no estalimitada. Esto tiene que ver con el hecho de que J+ ( J−) es un operador que incrementa (decrementa) el valorde m dejando j sin cambiar. Pero para un j dado, m tiene lımite superior e inferior, por tanto hay lımites tantopara el decremento como para el incremento. Otra diferencia importante es la degeneracion y el hecho de que elconjunto J2, J3 no forma en general un C.S.C.O.3

3La cuestion es que la teorıa del momento angular no parte de un Hamiltoniano definido ni tampoco de un espacio de Hilbertdefinido, a diferencia de la teorıa del oscilador armonico en donde el espacio de estados y el Hamiltoniano son bien especıficos. Por estarazon, la teorıa general del momento angular no nos puede decir a priori cual es el grado de degeneracion de los estados propios de J2

y J3.

Page 316: Mecanica Cuantica: Notas de Clase

316 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

Combinando las Ecs. (10.31, 10.33) se tiene que

p+ q = 2j ⇒ j =p+ q

2

pero p+ q es un entero no negativo. Por tanto, j solo puede adquirir valores enteros o semienteros no negativo

j = 0,1

2, 1,

3

2, 2,

5

2, . . .

Estos son los valores posibles pero no hemos demostrado que tenga que tomarlos todos (de hecho no es ası engeneral4). Adicionalmente, si existe un autovector no nulo |j,m, k〉 de J2 y J3, las sucesiones (10.30, 10.32) constande autovectores no nulos de J2 con valores propios j (j + 1) ~2 y tambien de J3 con autovalores dados por

mj = −j~, (−j + 1) ~, (−j + 2) ~, . . . , (j − 2) ~, (j − 1) ~, j~ (10.34)

es decir tenemos 2j+1 valores posibles de m para un j dado. Puesto que estos valores se obtienen de las sucesionesya mencionadas, todos los 2j + 1 valores de m posibles bajo la restriccion (10.26) son valores propios accesiblespara un valor dado de j. Adicionalmente, puesto que p y q son enteros no negativos, las Ecs. (10.31, 10.33) nosdicen que m es entero (semi-entero) si y solo si j es entero (semi-entero). Lo anterior nos dice que para un j dado,todos los valores de m expresados en la Ec. (10.34) estan asociados a un vector |j,m, k〉 y son ademas los unicosvalores accesibles de m para dicho valor de j.

Podemos sintetizar estos resultados en la siguiente forma: Sea J un momento angular arbitrario que obedecelas reglas de conmutacion (10.6). Si j (j + 1) ~2 y m~ denotan los autovalores de J2 y J3 asociados al ket comun|j,m, k〉. Tenemos que

Los unicos valores posibles de j son enteros o semienteros no negativos: 0, 12 , 1,32 , 2,

52 , . . .. No necesariamente

j debe tomar todos estos valores.

Para un valor dado de j existen 2j + 1 valores posibles de m: −j, − j + 1, − j + 2, . . . , j − 2, j − 1, j. Lacantidad m es entera si y solo si j es entera. Ası mismo, m es semi-entero si y solo si j es entero. Todos losvalores de m son permitidos si uno de ellos lo es.

10.4. Propiedades de los vectores propios de J2 y J3

Veremos que las propiedades algebraicas de los operadores J2, J3, J+, J−, nos permiten extraer informacionsobre los estados propios de J2 y J3 incluso sin especificar el espacio de Hilbert E sobre el cual actuan los operadores.Para ello solo requerimos dos hipotesis de trabajo: (1) Que J2 y J3 son observables con respecto al espacio E sobreel cual actuan, y (2) Que conocemos por algun medio experimental y/o teorico, los valores de j que son permitidosen nuestro sistema fısico (recordemos que j debe ser entero o semientero no negativo, pero no necesariamente debecubrir todos los valores enteros y semienteros no negativos).

Debemos recordar que para un j dado que este permitido, todos los valores de m permitidos por la Ec. (10.26)deben aparecer. En el oscilador armonico aprendimos que con un solo estado (el estado base) podemos generartodos los estados propios por medio del operador construccion. En esta seccion desarrollaremos un metodo paragenerar los autoestados de J2 y J3 a partir de un subconjunto de estos estados y de los operadores J+ y J−.

4Esto tambien esta relacionado con el hecho de que el Hamiltoniano y el espacio vectorial sobre el cual operan los Ji no estandefinidos.

Page 317: Mecanica Cuantica: Notas de Clase

10.4. PROPIEDADES DE LOS VECTORES PROPIOS DE J2 Y J3 317

10.4.1. Generacion de autoestados por medio de los operadores J+ y J−

Consideremos un operador momento angular J que actua sobre un espacio de estados E , y mostraremos unalgoritmo para construir una base ortonormal en E de vectores propios comunes a J2 y J3.

Tomemos un par de valores propios j (j + 1)~2 y m~ que sean realizables fısicamente para nuestro sistemafısico. Los autovectores asociados |j,m, k〉 pueden ser degenerados en j,m lo cual se indica con el ındice k. Losvectores propios asociados al par (j,m) forman un autosubespacio E (j,m) de dimension g (j,m). Si g (j,m) > 1para al menos un par (j,m), entonces el conjunto J2, J3 no forma un C.S.C.O. Escogeremos en E (j,m) una baseortonormal de vectores |j,m, k〉 con k = 1, . . . , g (j,m).

Si m 6= j existe un subespacio E (j,m+ 1) de E compuesto por autovectores de J2, J3 con valores propiosj (j + 1) ~2 y (m+ 1) ~. Analogamente, si m 6= −j existe un subespacio E (j,m− 1) con autovectores de J2, J3y valores propios j (j + 1) ~2, (m− 1) ~. Si m 6= j construiremos una base ortonormal en E (j,m+ 1) a partir dela base ya construıda para E (j,m). Similarmente, si m 6= −j generaremos una base ortonormal en E (j,m− 1)partiendo de la base en E (j,m).

En primer lugar mostraremos que si |j,m, k1〉 y |j,m, k2〉 son ortogonales para k1 6= k2, entonces los vectoresJ+ |j,m, k1〉 y J+ |j,m, k2〉 tambien son ortogonales. De igual forma se vera que J− |j,m, k1〉 y J− |j,m, k2〉 tambienson ortogonales. Para ello calculamos el producto interno entre los kets en cuestion utilizando las formulas (10.17)

(J± |j,m, k2〉 , J± |j,m, k1〉) = 〈j,m, k2| J∓J± |j,m, k1〉 = 〈j,m, k2|(J2 − J2

3 ∓ ~J3)|j,m, k1〉

=[j (j + 1)−m2 ∓m

]~2 〈j,m, k2| j,m, k1〉

(J± |j,m, k2〉 , J± |j,m, k1〉) = [j (j + 1)−m (m± 1)] ~2 〈j,m, k2| j,m, k1〉 (10.35)

y puesto que los vectores |j,m, ki〉 asociados a E (j,m) son ortonormales por hipotesis, se tiene

Theorem 10.1 Sean |j,m, k1〉 y |j,m, k2〉 dos autovectores ortogonales de J2 y J3 con valores propios j (j + 1) ~2,m~, y k1 6= k2. Entonces J± |j,m, k2〉 es ortogonal a J± |j,m, k1〉.

Si k1 = k2 ≡ k, la Ec. (10.35) nos permite calcular la norma de J± |j,m, k〉. Asumiendo que |j,m, k〉 estanormalizado se tiene

‖J± |j,m, k〉‖2 = [j (j + 1)−m (m± 1)] ~2

por tanto podemos construır vectores ortonormales asociados a |j,m± 1, k〉 para lo cual simplemente debemosnormalizar los vectores J± |j,m, k〉.

Comencemos con J+ |j,m, k〉, normalizando los vectores J+ |j,m, k〉 obtenemos un conjunto ortonormal enE (j,m+ 1) dado por

|j,m+ 1, k〉 ≡ J+ |j,m, k〉~√j (j + 1)−m (m+ 1)

(10.36)

multipliquemos (10.36) por J− usando (10.17)

J− |j,m+ 1, k〉 =J−J+ |j,m, k〉

~√j (j + 1)−m (m+ 1)

=

(J2 − J2

3 − ~J3)|j,m, k〉

~√j (j + 1)−m (m+ 1)

=[j (j + 1)−m (m+ 1)] ~ |j,m, k〉√

j (j + 1)−m (m+ 1)

J− |j,m+ 1, k〉 = ~√j (j + 1)−m (m+ 1) |j,m, k〉 (10.37)

Vamos a demostrar que el conjunto ortonormal |j,m+ 1, k〉 en E (j,m+ 1) generado por todos los elementosde la base |j,m, k〉 de E (j,m) a traves de (10.36), constituye una base para E (j,m+ 1). La demostracion sehara por contradiccion, es decir asumiendo que |j,m+ 1, k〉 no es una base, segun el teorema 1.23, Pag. 30, estanegacion equivale a decir que existe un vector no nulo |j,m+ 1, α〉 en E (j,m+ 1) ortogonal a todos los vectoresdel conjunto.

Page 318: Mecanica Cuantica: Notas de Clase

318 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

Asumamos que existe un vector no nulo |j,m+ 1, α〉 en E (j,m+ 1) ortogonal a todos los elementos del conjuntoortonormal |j,m+ 1, k〉. Por tanto, α 6= k para todos los k′s del conjunto anterior. Dado que m + 1 6= −j, elvector J− |j,m+ 1, α〉 es no nulo en virtud del lema 5, y dicho vector yace en E (j,m). Ahora bien, puesto queα 6= k, el teorema 10.1 dice que J− |j,m+ 1, α〉 sera ortogonal a todos los vectores J− |j,m+ 1, k〉. Por otrolado, la Ec. (10.37) nos dice que J− |j,m+ 1, k〉 es colineal con |j,m, k〉. En consecuencia, al barrer toda labase |j,m, k〉 obtenemos que el conjunto J− |j,m+ 1, k〉 generado de esta manera tambien es una base paraE (j,m). De lo anterior vemos que J− |j,m+ 1, α〉 es un vector no nulo de E (j,m), ortogonal a todos los vectoresde la base |j,m, k〉, pero esto es imposible en virtud del teorema 1.23. Por tanto, el conjunto de vectores|j,m+ 1, k〉 generado por la base |j,m, k〉 de E (j,m) por medio de (10.36) es completo.

De una forma similar se puede demostrar que cuando m 6= −j podemos definir vectores |j,m− 1〉 en la forma

|j,m− 1, k〉 ≡ J− |j,m, k〉~√j (j + 1)−m (m− 1)

(10.38)

para formar una base ortonormal en E (j,m− 1). Notese que (10.38) se obtiene de (10.37) reemplazandom→ m−1.Las Ecs. (10.36, 10.38) implican una escogencia de fase cero entre |j,m± 1, k〉 y el vector J± |j,m, k〉, de modo quela constante de proporcionalidad entre ambos es real y positiva. Esta convencion de fase cero es conocida comoconvencion de Cordon-Shortley.

En particular vemos que las Ecs. (10.36) establecen relaciones uno a uno y sobreyectivas entre las bases deE (j,m) y E (j,m+ 1). Igualmente las Ecs. (10.38) nos dan una relacion uno a uno y sobreyectiva entre las basesde E (j,m) y E (j,m− 1). En consecuencia, los espacios E (j,m) y E (j,m± 1) son de la misma dimensionalidad.Por induccion se obtiene entonces que la dimensionalidad de cualquier E (j,m) solo depende de j

g (j,m) = g (j)

describamos un procedimiento sistematico para generar una base ortonormal para el espacio completo E . Paraun valor accesible de j encontramos un subespacio de la forma E (j,m) digamos E (j, j), y encontramos una baseortonormal de dicho espacio |j, j, k〉 ; k = 1, . . . , g (j). Ahora usando (10.38) contruımos iterativamente las basespara E (j, j − 1) , E (j, j − 2) , . . . , E (j,−j). La union de las bases de los 2j + 1 subespacios asociados a j nos dauna base ortonormal para el subespacio E (j) dado por

E (j) = E (j, j) ⊕ E (j, j − 1)⊕ E (j, j − 2)⊕ . . .⊕ E (j,−j) (10.39)

es claro que el espacio E (j) es de dimensionalidad (2j + 1) g (j). Una vez generada la base para un E (j), cambiamosa otro valor accesible de j y repetimos el procedimiento, barriendo todos los valores accesibles de j. La baseortonormal para E se obtiene de la union de las bases asociadas a cada valor de j puesto que

E = E (j1)⊕ E (j2)⊕ E (j3)⊕ . . . (10.40)

siendo j1, j2, j3, . . . los valores accesibles de j en el sistema fısico considerado5. Insistimos que este debe ser unsubconjunto del conjunto de todos los enteros y semienteros no negativos. La tabla 10.1 describe esquematicamenteel algoritmo para generar una base para E (j) a partir de la base para E (j, j).

La base generada con este algoritmo se conoce como la base estandar del espacio de estados E , para la cualexisten relaciones de completez y ortonormalidad

〈j,m, k∣∣j′,m′, k′

⟩= δjj′δmm′δkk′ ;

j

+j∑

m=−j

g(j)∑

k=1

|j,m, k〉 〈j,m, k| = I (10.41)

Por supuesto podemos empezar por E (j,−j) y construır con base en J+. Finalmente, podemos empezar porun E (j,m) con −j < m < j, en tal caso habra que generar con J+ “hacia arriba” hasta j y con J− “hacia abajo”hasta −j.

5Notese que la Ec. (10.40) es cierta bajo la hipotesis de que los operadores Ji sean observables. Es decir, que los valores permitidosde j nos den una base para E .

Page 319: Mecanica Cuantica: Notas de Clase

10.5. CONSTRUCCION DE UNA BASE ESTANDAR CON BASE EN UN C.S.C.O 319

k = 1 k = 2 . . . k = g (j)E (j, j) |j, j, 1〉 |j, j, 2〉 . . . |j, j, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

E (j, j − 1) |j, j − 1, 1〉 |j, j − 1, 2〉 . . . |j, j − 1, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

......

......

E (j,m) |j, j −m, 1〉 |j, j −m, 2〉 . . . |j, j −m, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

......

......

E (j,−j) |j,−j, 1〉 |j,−j, 2〉 . . . |j,−j, g (j)〉E (j, k = 1) E (j, k = 2) E (j, k = g (j))

Cuadro 10.1: Construccion de la base estandar para E (j) de dimension (2j + 1) g (j). Comenzando con cadauno de los g (j) vectores |j, j, k〉 de la primera fila, usamos el operador J− para construır los 2j + 1 vectores decada columna. Los g (j) vectores de la m−esima fila, expanden al subespacio E (j,m). Los 2j + 1 vectores de lak−esima columna expanden al subespacio E (j, k). Hay un total de 2j + 1 subespacios de la forma E (j,m) y untotal de g (j) subespacios de la forma E (j, k). El espacio total se puede obtener por suma directa de los E (j,m),o alternativamente por suma directa de los E (j, k).

10.5. Construccion de una base estandar con base en un C.S.C.O

Un metodo muy utilizado para generar una base estandar consiste en usar un conjunto de observables

A1, A2, . . . , An

que junto con J2 y J3 formen un C.S.C.O. y que ademas conmuten con todas las componentes de J

[Ai,J] = 0 ; i = 1, . . . , n

un observable que conmute con las componentes de J se denomina un escalar. Por simplicidad asumiremos que unsolo escalar A es suficiente para formar un C.S.C.O con J2 y J3. Veamos la accion de A sobre un estado arbitrario|j,m, k〉 de E (j,m), definiendo |ψ〉 ≡ A |j,m, k〉 tenemos que

J2 |ψ〉 = J2A |j,m, k〉 = AJ2 |j,m, k〉 = j (j + 1) ~2A |j,m, k〉 = j (j + 1) ~2 |ψ〉J3 |ψ〉 = J3A |j,m, k〉 = AJ3 |j,m, k〉 = m~A |j,m, k〉 = m~ |ψ〉

donde hemos usado el hecho de que A conmuta con J2 y J3. Tenemos entonces que |ψ〉 ≡ A |j,m, k〉 es autovectorde J2 y J3 con autovalores j (j + 1) ~2 y m~, y por lo tanto pertenece a E (j,m). En consecuencia, cada subespacioE (j,m) es globalmente invariante bajo la accion de un operador A que conmute con J2 y J3. Si ahora escogemosun valor de j, el subespacio E (j, j) sera en particular invariante bajo A y podemos diagonalizar la restriccion deA sobre E (j, j), con cierta base ortonormal |j, j, k〉 de E (j, j),6 de modo que

A |j, j, k〉 = ajk |j, j, k〉 (10.42)

el conjunto |j, j, k〉 ; j fijo; k = 1, . . . , g (j) es una base ortonormal de E (j, j), a partir de la cual se puedeconstruır la base ortonormal para E (j). Aplicando este procedimiento para cada valor accesible de j obtenemosla base ortonormal |j,m, k〉 para el espacio completo E .

Los resultados anteriores no requieren que A sea escalar, solo requieren que conmute con J2 y J3. Sea |j,m, k〉la base de vectores de E (j,m) obtenida por la aplicacion sucesiva de J− sobre la base |j, j, k〉. Veremos que si

6Recordemos que A es hermıtico y por tanto normal. Para todo operador normal existe una representacion ortonormal que lodiagonaliza.

Page 320: Mecanica Cuantica: Notas de Clase

320 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

A es escalar y los elementos de la base |j, j, k〉 son autovectores de A, entonces los kets |j,m, k〉 (obtenidospor aplicacion sucesiva de J−) ademas de ser vectores propios de J2 y J3 tambien seran automaticamente vectorespropios de A. Para ver esto observemos que para un escalar A se tiene

[A, J−] = [A, J1 − iJ2] = [A, J1]− i [A, J2] = 0 (10.43)

al asumir que los elementos de la base |j, j, k〉 son autovectores de A, podemos usar la Ec. (10.42), la cualcombinada con la Ec. (10.43) nos da

A [J− |j, j, k〉] = J−A |j, j, k〉 = ajk [J− |j, j, k〉]

de modo que J− |j, j, k〉 es autovector de A con el mismo autovalor que |j, j, k〉 (teorema 1.66). Equivalentemente,|j, j − 1, k〉 es autovector de A con el mismo autovalor que |j, j, k〉. Aplicando sucesivamente este proceso vemosque los kets dados por

|j, j, k〉 , |j, j − 1, k〉 , . . . , |j,−j, k〉son vectores propios de A con valor propio ajk por tanto podemos escribir

A |j,m, k〉 = ajk |j,m, k〉 ; m = j, j − 1, . . . ,−j + 1, − j (10.44)

el espectro de A es entonces el mismo para todos los subespacios E (j,m) con j fijo, pero depende en general tantode j como de k, de modo que un conjunto de numeros cuanticos (j,m, k) define unıvocamente a un vector |j,m, k〉de E , como corresponde a un C.S.C.O.

Notese que un observable que conmute con J2 y J3 no necesariamente conmuta con J1 y J2. En particular, elconjunto (J2, J3, A) podrıa formar un C.S.C.O. sin que A conmute con J1 y/o J2. En tal caso sin embargo, J±no conmuta con A y por tanto J± |j,m, k〉 no necesariamente es autovector de A con el mismo valor propio de|j,m, k〉, incluso si |j, j, k〉 es autovector de A. Por tanto, cuando A conmuta con J2 y J3 pero no es escalar, labase |j,m, k〉 obtenida por aplicacion sucesiva de J− sobre |j, j, k〉 debe ser rotada a otra base |j,m, α〉 cadavez que se aplica J−, con el fin de diagonalizar a la restriccion de A sobre cada E (j,m). En cambio, cuando Aes escalar solo es necesaria la rotacion de los elementos |j, j, k′〉 para obtener autovectores de A como en la Ec.(10.42), y la aplicacion sucesiva de J− genera automaticamente autovectores de A.

10.5.1. Descomposicion de E en subespacios del tipo E (j, k)

En los procedimientos anteriores hemos descompuesto el espacio completo E en la forma dada por la combi-nacion de las Ecs. (10.39, 10.40)

E = E (j1, j1)⊕ E (j1, j1 − 1)⊕ E (j1, j1 − 2)⊕ . . .⊕ E (j1,−j1)⊕E (j2, j2)⊕ E (j2, j2 − 1)⊕ E (j2, j2 − 2)⊕ . . .⊕ E (j2,−j2)⊕E (j3, j3)⊕ E (j3, j3 − 1)⊕ E (j3, j3 − 2)⊕ . . .⊕ E (j3,−j3)⊕ . . .

siendo j1, j2, j3, . . . los valores permitidos de j para el sistema en estudio. Esta es una descomposicion en subespaciosdel tipo E (j,m). Sin embargo los subespacios E (j,m) tienen ciertas desventajas, por un lado su dimension g (j)depende del sistema fısico especıfico ya que esta dimension nos da cuenta de la degeneracion asociada al par (j,m),por tanto g (j) es desconocido al menos en el caso general. Adicionalmente un subespacio del tipo E (j,m) no esinvariante ante J, por ejemplo

J1 |j,m, k〉 =1

2(J+ + J−) |j,m, k〉 =

1

2c+ |j,m+ 1, k〉 + 1

2c− |j,m− 1, k〉 (10.45)

de acuerdo con (10.41) este estado es ortonormal a |j,m, k〉 y no es nulo ya que por lo menos uno de los estados|j,m+ 1, k〉 , |j,m− 1, k〉 tiene que ser no nulo y ambos son ortogonales entre sı.

Page 321: Mecanica Cuantica: Notas de Clase

10.6. REPRESENTACIONES MATRICIALES DE LOS OPERADORES MOMENTO ANGULAR 321

Examinando la tabla (10.1) vemos que cada subespacio del tipo E (j,m) es generado por la expansion de losg (j) vectores de la m−esima fila de la tabla (los g (j) valores posibles de k). Vemos sin embargo que hay otramanera de agrupar los vectores: podemos generar un subespacio con los (2j + 1) vectores de una columna fijade la tabla, con lo cual obtenemos un subespacio del tipo E (j, k) puesto que en este caso es el par (j, k) el quepermanece fijo en la expansion.

La descomposicion de E quedarıa en la forma

E = E (j1, k = 1)⊕ E (j1, k = 2)⊕ . . .⊕ E (j1, k = g (j1))⊕E (j2, k = 1)⊕ E (j2, k = 2)⊕ . . .⊕ E (j2, k = g (j2))⊕E (j3, k = 1)⊕ E (j3, k = 2)⊕ . . .⊕ E (j3, k = g (j3))⊕ . . . (10.46)

los subespacios E (j, k) poseen las propiedades siguientes: (a) la dimension de E (j, k) es 2j + 1 de modo que paraun j dado su dimension se conoce sin importar el sistema fısico que se este trabajando. (b) E (j, k) es globalmenteinvariante bajo J. Incluso se puede demostrar que E (j, k) es irreducible como subespacio invariante de J, es decirno hay un subespacio propio no nulo de E (j, k) que sea invariante bajo J.

Nos limitaremos a demostrar la invarianza de E (j, k) bajo J. Una base para este espacio es de la forma|j,m, k〉 ; m = −j,−j + 1, . . . , j − 1, j. Para J3 es inmediato, para J1 tomamos el resultado de la Ec. (10.45)notando que los dos kets son estados con el mismo valor de j, k y solo difieren en m. Por tanto J1 |j,m, k〉 pertenecea E (j, k). Para J2 el argumento es similar. En general E (j, k) sera invariante bajo cualquier funcion del tipo F (J),lo cual se puede ver simplemente de la expansion de Taylor de F (J) y de que E (j, k) es invariante ante cualquierpotencia de J.

10.6. Representaciones matriciales de los operadores momento angular

Los elementos matriciales de los Ji en la base estandar |j,m, k〉, se pueden calcular a traves de la accion delos operadores J3, J± sobre los kets propios |j,m, k〉 de J2 y J3 descritos por las Ecs. (10.19, 10.36, 10.38)

J3 |j,m, k〉 = m~ |j,m, k〉 ; J± |j,m, k〉 = ~√j (j + 1)−m (m± 1) |j,m± 1, k〉 (10.47)

combinando las Ecs. (10.9, 10.47) encontramos la accion de J1 y J2 sobre los kets de la base

J1∣∣j′,m′, k′

⟩=

1

2(J+ + J−)

∣∣j′,m′, k′⟩=

~

2

[√j′ (j′ + 1)−m′ (m′ + 1)

∣∣j′,m′ + 1, k′⟩

+√j′ (j′ + 1)−m′ (m′ − 1)

∣∣j′,m′ − 1, k′⟩]

(10.48)

J2∣∣j′,m′, k′

⟩=

1

2i(J+ − J−)

∣∣j′,m′, k′⟩=

~

2i

[√j′ (j′ + 1)−m′ (m′ + 1)

∣∣j′,m′ + 1, k′⟩

−√j′ (j′ + 1)−m′ (m′ − 1)

∣∣j′,m′ − 1, k′⟩]

(10.49)

de las Ecs. (10.47, 10.48, 10.49) y la ortonormalidad de la base, los elementos matriciales de Ji y J± quedan

〈j,m, k| J3∣∣j′,m′, k′

⟩= m~δkk′δjj′δmm′ (10.50)

〈j,m, k| J±∣∣j′,m′, k′

⟩= ~

√j (j + 1)−m′ (m′ ± 1)δkk′δjj′δm,m′±1 (10.51)

〈j,m, k| J1∣∣j′,m′, k′

⟩=

1

2〈j,m, k| (J+ + J−)

∣∣j′,m′, k′⟩=

~

2δkk′δjj′

[√j (j + 1)−m′ (m′ + 1)δm,m′+1

+√j (j + 1)−m′ (m′ − 1)δm,m′−1

](10.52)

Page 322: Mecanica Cuantica: Notas de Clase

322 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

〈j,m, k| J2∣∣j′,m′, k′

⟩=

1

2i〈j,m, k| (J+ − J−)

∣∣j′,m′, k′⟩=

~

2iδkk′δjj′

[√j (j + 1)−m′ (m′ + 1)δm,m′+1

−√j (j + 1)−m′ (m′ − 1)δm,m′−1

](10.53)

lo cual muestra que los elementos matriciales de J solo dependen de j y m pero no de k. Este hecho implica que larepresentacion matricial de las componentes de J en la base estandar |j,m, k〉 tiene una forma particularmentesimple cuando descomponemos E en subespacios del tipo E (j, k). Las Ecs. (10.50, 10.51, 10.52, 10.53) muestranque un operador Ji (o una funcion de la forma F (J)) tiene elementos matriciales nulos cuando el elemento enlazados kets base asociados a espacios E (j1, k1) y E (j2, k2) con j1 6= j2 y/o con k1 6= k2. Por tanto la matriz seradiagonal por bloques donde los bloques son todos de dimension 2j +1 (que es la dimension de un espacio E (j, k))en la forma

E (j, k) · · · E (j, k′) E (j′, k′) · · ·E (j, k)

matriz(2j + 1)× (2j + 1)

0 0 0

E (j, k′) 0matriz

(2j + 1)× (2j + 1)0 0

...

E (j′, k′) 0 0matriz

(2j′ + 1)× (2j′ + 1)0

... 0 0 0 0

(10.54)

comenzando por el valor de j1 mas bajo permitido construımos las matrices asociadas a E (j1, k1) para el k = k1 masbajo permitido, luego manteniendo j1 fijo recorremos los posibles valores de k, una vez terminado este recorrido,continuamos con el siguiente valor permitido j2 de j, recorriendo el ındice k nuevamente y ası sucesivamente. Lasmatrices asociadas a estos subespacios son de dimension 2ji + 1.

Por tanto, lo que debemos hacer es calcular las matrices de dimension finita (2j + 1)×(2j + 1) que representana cada operador en cada subespacio E (j, k). Adicionalmente, estas matrices no dependen de k y por tanto nodependen del sistema fısico bajo estudio. Solo dependen de j y del operador que se quiere representar.

En sıntesis, la representacion matricial de una componente Ji del momento angular en la base estandar, se puedecalcular dentro de un subespacio de la forma E (j, k) sin alusion alguna al sistema fısico que se esta trabajando.

La matrices del tipo (Ji)(j) son en consecuencia de caracter universal y representan al operador Ji dentro del

subespacio E (j, k) para todos los posibles valores de j es decir j = 0, 12 , 1, . . .. Cuando tenemos un sistema fısicoespecıfico, debemos determinar cuales de estos valores de j son permitidos y el numero de subespacios E (j, k)asociados con cada j, es decir el grado de degeneracion (2j + 1) g (j). La matriz representativa de Ji sera entoncesdiagonal por bloques con la estructura descrita en la Ec. (10.54), y se puede construır a partir de las matricesuniversales definidas para cada subespacio E (j, k). Para cada valor de j, tendremos g (j) bloques identicos de

(Ji)(j), es decir todos los valores posibles de k, una vez que para un j dado se barren los valores posibles de k, se

cambia al siguiente valor accesible j′ y se construyen g (j′) bloques identicos de (Ji)(j′) y ası sucesivamente.

10.6.1. Representaciones matriciales del tipo (Ji)(j) en la base estandar para j arbitrario

De lo anterior, los elementos matriciales para j arbitrario de un operador (Ji)(j) dentro de un subespacio

E (j, k) estan dados por

〈j,m, k| J3∣∣j′,m′, k′

⟩= m~δkk′δjj′δmm′ (10.55)

〈j,m, k| J2∣∣j′,m′, k′

⟩= j (j + 1) ~2δkk′δjj′δmm′ (10.56)

Page 323: Mecanica Cuantica: Notas de Clase

10.6. REPRESENTACIONES MATRICIALES DE LOS OPERADORES MOMENTO ANGULAR 323

〈j,m, k| J±∣∣j′,m′, k′

⟩= ~

√j (j + 1)−m′ (m′ ± 1)δkk′δjj′δm,m′±1 (10.57)

〈j,m, k| J1∣∣j′,m′, k′

⟩=

~

2δkk′δjj′

[√j (j + 1)−m′ (m′ + 1)δm,m′+1

+√j (j + 1)−m′ (m′ − 1)δm,m′−1

](10.58)

〈j,m, k| J2∣∣j′,m′, k′

⟩=

~

2iδkk′δjj′

[√j (j + 1)−m′ (m′ + 1)δm,m′+1

−√j (j + 1)−m′ (m′ − 1)δm,m′−1

](10.59)

vemos que la matriz de (J3)(j) es diagonal, esto se debe a que se eligio a X3 como el eje de cuantizacion (la

base estandar consta de vectores propios de J2 y J3), sus elementos son los 2j + 1 valores de m~. Para las

matrices (J1,2)(j) los unicos elementos no nulos son los que estan por encima y por debajo de la diagonal. (J1)

(j)

es una matriz simetrica y real en tanto que (J2)(j) es antisimetrica y puramente imaginaria. La matriz

(J2)(j)

esnaturalmente diagonal ya que esta es una base de vectores propios de J2, y ademas sus elementos diagonales son

identicos, de modo que(J2)(j)

es j (j + 1) ~2I, siendo I la matriz identidad de dimension (2j + 1)× (2j + 1). La

matriz (J+)(j) solo tiene elementos no nulos por encima de la diagonal, en tanto que la matriz (J−)

(j) solo tieneelementos no nulos por debajo de la diagonal.

Puesto que todas las direcciones del espacio son equivalentes, es claro que la eleccion del eje de cuantizaciones arbitraria. De esto se desprende que todos los Ji deben tener los mismos valores propios. Los vectores propiosseran sin embargo diferentes ya que los Ji no conmutan entre sı. En consecuencia, dentro de un subespacio dadoE (j, k) los autovalores de J1, J2, J3 son j~, (j − 1) ~, . . . , (−j + 1) ~,−j~. Estos tambien seran los valores propios decualquier componente de la forma Jn = J ·n siendo n un vector unitario de direccion arbitraria. Los autovectorescomunes de J2 y J1 son combinaciones lineales de los |j,m, k〉 con j y k fijos. Lo mismo ocurre con los vectorespropios comunes a J2 y J2.

En conclusion una base ortonormal |j,m, k〉 del espacio de estados compuesta por vectores comunes a J2 yJ3

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉

se denomina un base estandar si la accion de J± sobre estos vectores esta dada por

J± |j,m, k〉 = ~√j (j + 1)−m (m± 1) |j,m± 1, k〉

10.6.2. Representaciones matriciales en la base estandar para j = 0

Los subespacios E (j = 0, k) son de dimension 2 (0)+1 = 1. Y el unico valor posible de m es cero. Las matrices

(Ji)(j) son numeros y de acuerdo con las Ecs. (10.58, 10.59, 10.55) estos numeros son cero.

10.6.3. Representaciones matriciales en la base estandar para j = 1/2

Los subespacios E (j = 1/2, k) son de dimension 2 (1/2) + 1 = 2. Las matrices dentro de un subespacioE (j = 1/2, k) son de dimension 2 × 2 y los vectores base los elegiremos en el orden m1 = 1/2, m2 = −1/2.Las representaciones matriciales se obtienen usando las Ecs. (10.58, 10.59, 10.55, 10.56), teniendo en cuenta queestamos interesados en las representaciones dentro de un subespacio E (j = 1/2, k) de modo que k = k′. Con estas

Page 324: Mecanica Cuantica: Notas de Clase

324 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

consideraciones calcularemos la representacion matricial de J1 usando (10.58)

(J1)pq ≡⟨1

2,mp, k

∣∣∣∣ J1∣∣∣∣1

2,mq, k

⟩=

~

2δkkδ 1

2, 12

[√1

2

(1

2+ 1

)−mq (mq + 1) δmp,mq+1

+

√1

2

(1

2+ 1

)−mq (mq − 1) δmp,mq−1

]

(J1)pq =~

2

[√3

4−mq (mq + 1) δmp,mq+1 +

√3

4−mq (mq − 1) δmp,mq−1

]

de aquı en adelante se omite el ındice k ya que las representaciones matriciales no dependen de tal ındice. Estasexpresiones muestran que los elementos diagonales son cero, por tanto

(J1)(1/2)11 ≡

⟨1

2,1

2

∣∣∣∣J1∣∣∣∣1

2,1

2

⟩= 0

(J1)(1/2)22 ≡

⟨1

2,−1

2

∣∣∣∣J1∣∣∣∣1

2,−1

2

⟩= 0

y los terminos no diagonales son

(J1)(1/2)12 ≡

⟨1

2,1

2

∣∣∣∣ J1∣∣∣∣1

2,−1

2

⟩=

~

2

[√3

4−(−1

2

)(−1

2+ 1

)δ 1

2,− 1

2+1

+

√3

4−(−1

2

)(−1

2− 1

)δ 1

2,− 1

2−1

]

(J1)(1/2)12 =

~

2

√3

4+

1

4δ 1

2, 12=

~

2

(J1)(1/2)21 ≡

⟨1

2,−1

2

∣∣∣∣J1∣∣∣∣1

2,1

2

⟩=

~

2

[√3

4− 1

2

(1

2+ 1

)δ− 1

2, 12+1

+

√3

4− 1

2

(1

2− 1

)δ− 1

2, 12−1

]

(J1)(1/2)21 =

~

2

este elemento se podıa tambien calcular teniendo en cuenta que la matriz de J1 es simetrica real. La matrizrepresentativa queda entonces

(J1)(1/2) =

~

2

(0 11 0

)

de manera similar se calculan los elementos matriciales de los otros operadores, el resultado es

(J1)(1/2) =

~

2

(0 11 0

); (J2)

(1/2) =~

2

(0 −ii 0

); (J3)

(1/2) =~

2

(1 00 −1

)(10.60)

(J2)(1/2)

=3

4~2(

1 00 1

); (J+)

(1/2) = ~

(0 10 0

); (J−)

(1/2) = ~

(0 01 0

)(10.61)

Page 325: Mecanica Cuantica: Notas de Clase

10.6. REPRESENTACIONES MATRICIALES DE LOS OPERADORES MOMENTO ANGULAR 325

10.6.4. Representaciones matriciales en la base estandar para j = 1

Los subespacios E (j = 1, k) son de dimension 2 (1)+1 = 3. Las matrices son de dimension 3×3. Ordenaremoslos vectores base con m1 = 1, m2 = 0, m3 = −1.

Calculemos por ejemplo la representacion de J2 usando (10.59), esta ecuacion muestra que los terminos de ladiagonal son cero ası como aquellos en donde los ındices difieren en mas de una unidad, por tanto

(J2)(1)11 = (J2)

(1)22 = (J2)

(1)33 = (J2)

(1)13 = (J2)

(1)31 = 0

para los otros elementos usamos (10.59) con j = 1, k = k′, y omitimos k

〈1,mp|J2 |1,mq〉 =~

2i

[√1 (1 + 1)−mq (mq + 1) δmp,mq+1 −

√1 (1 + 1)−mq (mq − 1) δmp,mq−1

]

〈1,mp|J2 |1,mq〉 =~

2i

[√2−mq (mq + 1) δmp,mq+1 −

√2−mq (mq − 1) δmp,mq−1

]

teniendo en cuenta ademas que la matriz asociada a J2 es antisimetrica, solo tendremos que calcular dos terminos

(J2)(1)12 = 〈1,m1|J2 |1,m2〉 = 〈1, 1| J2 |1, 0〉 =

~

2i

[√2 δ1,0+1 −

√2 δ1,0−1

]=

~√2i

[δ1,1 − δ1,−1] =~√2i

(J2)(1)12 = − i~√

2= − (J2)

(1)21

(J2)(1)23 = 〈1,m2|J2 |1,m3〉 = 〈1, 0| J2 |1,−1〉 = ~

2i

[√2− (−1) [(−1) + 1] δ0,−1+1

−√

2− (−1) [(−1)− 1] δ0,−1−1

(J2)(1)23 =

~

2i

√2 ⇒

(J2)(1)23 = − i~√

2= − (J2)

(1)23 ⇒

la matriz queda entonces

(J2)(1) =

~√2

0 −i 0i 0 −i0 i 0

de manera similar se obtienen las otras matrices resultando

(J1)(1) =

~√2

0 1 01 0 10 1 0

; (J2)

(1) =~√2

0 −i 0i 0 −i0 i 0

(J3)(1) = ~

1 0 00 0 00 0 −1

;

(J2)(1)

= 2~2

1 0 00 1 00 0 1

(J+)(1) = ~

0√2 0

0 0√2

0 0 0

; (J−)

(1) = ~

0 0 0√2 0 0

0√2 0

se puede verificar que las representaciones matriciales construıdas obedecen las reglas de conmutacion (10.6).

Se puede verificar que los autovalores de las matrices (Ji)(1/2) son todos iguales y estan dados por ±~/2. Si-

milarmente, los valores propios de las matrices (Ji)(1) son todos iguales y corresponden a +~, 0,−~. En sıntesis

todas las caracterısticas generales discutidas al final de la seccion 10.6.1 se cumplen para las matrices calculadasexplıcitamente.

Page 326: Mecanica Cuantica: Notas de Clase

Capıtulo 11

Propiedades de los momentos angularesorbitales

Aplicaremos la teorıa general desarrollada en el capıtulo 10 al caso del momento angular orbital que sirviooriginalmente para encontrar el algebra con la cual se definio un momento angular generalizado. Utilizaremosla base |r〉 para mostrar que los valores propios de L2 son de la forma l (l + 1) ~2 con l entero no negativo.Es decir las consideraciones fısicas excluiran a los valores semienteros en tanto que todos los valores enteros nonegativos aparecen en el espectro. Encontraremos tambien las funciones propias en la base |r〉 y sus principalespropiedades.

En la representacion |r〉 los observables R y P corresponden a multiplicacion por r y al operador diferencial−i~∇ respectivamente. La cuantizacion de las tres componentes del momento angular en la base |r〉 se representacomo

L = R×P = −i~r×∇L1 =

~

i

(x2

∂x3− x3

∂x2

); L2 =

~

i

(x3

∂x1− x1

∂x3

); L3 =

~

i

(x1

∂x2− x2

∂x1

)(11.1)

L± ≡ L1 ± iL2 (11.2)

sera mas conveniente trabajar en coordenadas polares esfericas, ya que mas adelante veremos que el operadormomento angular solo operara sobre los angulos θ, ϕ y no sobre la variable r.

x1 = r sin θ cosϕ ; x2 = r sin θ sinϕ ; x3 = r cos θ

r ≥ 0 ; 0 ≤ θ ≤ π ; 0 ≤ ϕ < 2π (11.3)

un elemento de volumen d3r = dx dy dz en coordenadas esfericas esta dado por

d3r = r2 dr dΩ ; dΩ = sin θ dθ dϕ (11.4)

donde dΩ es un elemento diferencial de angulo solido en la direccion de los angulos θ y ϕ.

A partir de (11.3) calculamos las derivadas parciales

∂x1∂r

= sin θ cosϕ ;∂x1∂θ

= r cos θ cosϕ ;∂x1∂ϕ

= −r sin θ sinϕ∂x2∂r

= sin θ sinϕ ;∂x2∂θ

= r cos θ sinϕ ;∂x2∂ϕ

= r sin θ cosϕ

∂x3∂r

= cos θ ;∂x3∂θ

= −r sin θ ;∂x3∂ϕ

= 0

326

Page 327: Mecanica Cuantica: Notas de Clase

327

y las relaciones entre derivadas parciales esfericas y cartesianas nos dan

∂r=

∂x1∂r

∂x1+∂x2∂r

∂x2+∂x3∂r

∂x3= sin θ cosϕ

∂x1+ sin θ sinϕ

∂x2+ cos θ

∂x3∂

∂θ=

∂x1∂θ

∂x1+∂x2∂θ

∂x2+∂x3∂θ

∂x3= r cos θ cosϕ

∂x1+ r cos θ sinϕ

∂x2− r sin θ

∂x3∂

∂ϕ=

∂x1∂ϕ

∂x1+∂x2∂ϕ

∂x2+∂x3∂ϕ

∂x3= −r sin θ sinϕ ∂

∂x1+ r sin θ cosϕ

∂x2

en forma matricial

∂r∂θ∂ϕ

=

sin θ cosϕ sin θ sinϕ cos θr cos θ cosϕ r cos θ sinϕ −r sin θ−r sin θ sinϕ r sin θ cosϕ 0

∂1∂2∂3

calculando la inversa de esta matriz se obtiene

∂1∂2∂3

=

cosϕ sin θ cos θ cosϕr − sinϕ

r sin θ

sin θ sinϕ cos θ sinϕr

cosϕr sin θ

cos θ − sin θr 0

∂r∂θ∂ϕ

(11.5)

reemplazando (11.3, 11.5) en (11.1) obtenemos

i

~L1 = x2∂3 − x3∂2 = r sin θ sinϕ

(cos θ ∂r −

sin θ

r∂θ

)− r cos θ

(sin θ sinϕ ∂r +

cos θ sinϕ

r∂θ +

cosϕ

r sin θ∂ϕ

)

= − sin2 θ sinϕ ∂θ − cos2 θ sinϕ ∂θ −cos θ cosϕ

sin θ∂ϕ

i

~L1 = − sinϕ ∂θ −

cosϕ

tan θ∂ϕ (11.6)

y se proceden de forma similar con las otras componentes

i

~L2 = x3∂1 − x1∂3 = r cos θ

(cosϕ sin θ ∂r +

cos θ cosϕ

r∂θ −

sinϕ

r sin θ∂ϕ

)− r sin θ cosϕ

(cos θ ∂r −

sin θ

r∂θ

)

= cos2 θ cosϕ ∂θ − cos θsinϕ

sin θ∂ϕ + sin2 θ cosϕ ∂θ

i

~L2 = cosϕ ∂θ −

sinϕ

tan θ∂ϕ (11.7)

i

~L3 = x1∂2 − x2∂1 = r sin θ cosϕ

(sin θ sinϕ ∂r +

cos θ sinϕ

r∂θ +

cosϕ

r sin θ∂ϕ

)

−r sin θ sinϕ(cosϕ sin θ ∂r +

cos θ cosϕ

r∂θ −

sinϕ

r sin θ∂ϕ

)

= sin θ cos θ cosϕ sinϕ∂θ + cos2 ϕ ∂ϕ − sin θ cos θ sinϕ cosϕ ∂θ + sin2 ϕ ∂ϕi

~L3 = ∂ϕ (11.8)

con las Ecs. (11.6, 11.7, 11.8), se puede evaluar L2 =(L21 + L2

2 + L23

), lo cual es mas sencillo si lo ponemos actuar

sobre una funcion arbitraria ψ (r, θ, ϕ)

Page 328: Mecanica Cuantica: Notas de Clase

328 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

L2ψ =

[i~

(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)]2ψ +

[i~

(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)]2ψ +

[−i~ ∂

∂ϕ

]2ψ

= −~2(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

−~2(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)ψ − ~2

∂2ψ

∂ϕ2

= −~2 sinϕ∂

∂θ

(sinϕ

∂ψ

∂θ+

cosϕ

tan θ

∂ψ

∂ϕ

)− ~2

cosϕ

tan θ

∂ϕ

(sinϕ

∂ψ

∂θ+

cosϕ

tan θ

∂ψ

∂ϕ

)

+~2 cosϕ∂

∂θ

(− cosϕ

∂ψ

∂θ+

sinϕ

tan θ

∂ψ

∂ϕ

)− ~2

sinϕ

tan θ

∂ϕ

(− cosϕ

∂ψ

∂θ+

sinϕ

tan θ

∂ψ

∂ϕ

)− ~2

∂2ψ

∂ϕ2

= −~2 sinϕ

(sinϕ

∂θ

∂ψ

∂θ+ cosϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cosϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2cosϕ

tan θ

(∂ψ

∂θ

∂ϕsinϕ+ sinϕ

∂ϕ

∂ψ

∂θ+

1

tan θ

∂ψ

∂ϕ

∂ϕcosϕ+

cosϕ

tan θ

∂ϕ

∂ψ

∂ϕ

)

+~2 cosϕ

(− cosϕ

∂θ

∂ψ

∂θ+ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

sinϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2sinϕ

tan θ

(−∂ψ∂θ

∂ϕcosϕ− cosϕ

∂ϕ

∂ψ

∂θ+

1

tan θ

∂ψ

∂ϕ

∂ϕsinϕ+

sinϕ

tan θ

∂ϕ

∂ψ

∂ϕ

)− ~2

∂2ψ

∂ϕ2

L2ψ = −~2(sin2 ϕ

∂2ψ

∂θ2+ sinϕ cosϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

sinϕ cosϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2(cos2 ϕ

tan θ

∂ψ

∂θ+

cosϕ sinϕ

tan θ

∂ϕ

∂ψ

∂θ− cosϕ sinϕ

tan2 θ

∂ψ

∂ϕ+

cos2 ϕ

tan2 θ

∂2ψ

∂ϕ2

)

+~2(− cos2 ϕ

∂2ψ

∂θ2+ cosϕ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cosϕ sinϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2(sin2 ϕ

tan θ

∂ψ

∂θ− sinϕ cosϕ

tan θ

∂ϕ

∂ψ

∂θ+

sinϕ cosϕ

tan2 θ

∂ψ

∂ϕ+

sin2 ϕ

tan2 θ

∂2ψ

∂ϕ2

)− ~2

∂2ψ

∂ϕ2

agrupando derivadas se tiene

L2ψ

−~2= sin2 ϕ

∂2ψ

∂θ2+ cos2 ϕ

∂2ψ

∂θ2+

cos2 ϕ

tan2 θ

∂2ψ

∂ϕ2+

sin2 ϕ

tan2 θ

∂2ψ

∂ϕ2+∂2ψ

∂ϕ2

+sinϕ cosϕ

tan θ

∂θ

∂ψ

∂ϕ− sinϕ cosϕ

tan θ

∂ϕ

∂ψ

∂θ+

cosϕ sinϕ

tan θ

∂ϕ

∂ψ

∂θ− cosϕ sinϕ

tan θ

∂θ

∂ψ

∂ϕ

+sinϕ cosϕ∂ψ

∂ϕ

∂θ

1

tan θ− cosϕ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cos2 ϕ

tan θ

∂ψ

∂θ+

sin2 ϕ

tan θ

∂ψ

∂θ

−cosϕ sinϕ

tan2 θ

∂ψ

∂ϕ+

sinϕ cosϕ

tan2 θ

∂ψ

∂ϕ

L2ψ

−~2=

∂2ψ

∂θ2+

1

tan2 θ

∂2ψ

∂ϕ2+∂2ψ

∂ϕ2+

1

tan θ

∂ψ

∂θ

=

[∂2

∂θ2+

(1

tan2 θ+ 1

)∂2

∂ϕ2+

1

tan θ

∂θ

L2ψ

−~2=

[∂2

∂θ2+

1

sin2 θ

∂2

∂ϕ2+

1

tan θ

∂θ

]ψ (11.9)

Page 329: Mecanica Cuantica: Notas de Clase

11.1. MOMENTOS ANGULARES ORBITALES COMO OPERADORES DIFERENCIALES 329

11.1. Momentos angulares orbitales como operadores diferenciales en coor-denadas esfericas

Las Ecs. (11.6, 11.7, 11.8) nos dicen que las componentes del momento angular en coordenadas esfericas seescriben en la forma

L1 = i~

(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)(11.10)

L2 = i~

(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)(11.11)

L3 =~

i

∂ϕ(11.12)

y las Ecs. (11.9, 11.2) nos dicen que los operadores L2, L± quedan

L2 = −~2(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)(11.13)

L+ = ~eiϕ(∂

∂θ+ i cot θ

∂ϕ

)(11.14)

L− = ~e−iϕ(− ∂

∂θ+ i cot θ

∂ϕ

)(11.15)

en la representacion |r〉 las funciones propias asociadas a los valores propios l (l + 1) ~2 de L2 y m~ de L3

cumplen

L2ψ (r, θ, ϕ) = l (l + 1) ~2ψ (r, θ, ϕ) ; L3ψ (r, θ, ϕ) = m~ψ (r, θ, ϕ) (11.16)

y al reemplazar (11.13, 11.12) en las Ecs. (11.16) estas ultimas se convierten en ecuaciones diferenciales parcialescuya solucion son las funciones propias

−(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)ψ (r, θ, ϕ) = l (l + 1)ψ (r, θ, ϕ) (11.17)

−i ∂∂ϕ

ψ (r, θ, ϕ) = m~ψ (r, θ, ϕ) (11.18)

donde l es en general entero o semientero no negativo y m toma solo los valores −l,−l + 1, . . . , l − 1, l.

Notese que en las ecuaciones (11.17, 11.18) no hay operador derivada asociado a r. Por tanto r se puedeconsiderar un parametro y asumir una separacion de variables de la forma

ψlmk (r, θ, ϕ) = f (r)Ylm (θ, ϕ) (11.19)

insertando (11.19) en las ecuaciones diferenciales (11.17, 11.18) queda

−(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)Ylm (θ, ϕ) = l (l + 1)Ylm (θ, ϕ) (11.20)

−i~ ∂

∂ϕYlm (θ, ϕ) = m~Ylm (θ, ϕ) (11.21)

que estan expresando la ecuacion de valores propios

L2Ylm (θ, ϕ) = l (l + 1)Ylm (θ, ϕ) ; L3Ylm (θ, ϕ) = m~Ylm (θ, ϕ)

Page 330: Mecanica Cuantica: Notas de Clase

330 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

f (r) es una funcion de r que aparece como constante de integracion para las ecuaciones diferenciales (11.17,11.18). Es importante tener en cuenta que f (r) debe ser tal que ψl,m,k (r, θ, ϕ) = f (r)Ylm (θ, ϕ) sea de cuadradointegrable. El hecho de que f (r) sea arbitrario nos indica que L2 y L3 no forman un C.S.C.O. en el espacio Erde funciones de r es decir de funciones en r, θ, ϕ. En virtud de esto deberıamos introducir un ındice adicional enlas Ecs. (11.20, 11.21) para las soluciones indicando la posible degeneracion de estas. Sin embargo, veremos queestas soluciones seran unicas para l y m dados salvo por un factor constante. Esto indica que toda la degeneracionestara en el factor f (r) en la Ec. (11.19).

Para normalizar la funcion completa ψlmk (r, θ, ϕ) es conveniente normalizar la parte angular Ylm (θ, ϕ) y laparte radial f (r) separadamente. Estas relaciones de normalizacion se manifestaran en ecuaciones de la forma

∫ 2π

0dϕ

∫sin θ |Ylm (θ, ϕ)|2 dθ = 1

∫ ∞

0r2 |f (r)|2 dr = 1

11.2. Valores permitidos de l y m

La Ec. (11.21) para Ylm (θ, ϕ) muestra que Ylm (θ, ϕ) es igual a

Ylm (θ, ϕ) = Flm (θ) eimϕ (11.22)

podemos cubrir todo el espacio barriendo ϕ entre 0 y 2π. Notese que si Ylm (θ, ϕ) no fuera contınua en algun valorde θ, ϕ, no serıa diferenciable y no podrıa ser funcion propia de los operadores diferenciales L3 y L2. En particularla continuidad en ϕ = 0 nos lleva a

Ylm (θ, ϕ = 0) = Ylm (θ, ϕ = 2π)

que implica ademase2imπ = 1 (11.23)

m solo puede ser entero o semientero. Si m es semientero se puede parametrizar como m = (n+ 1/2) con n =0, 1, 2, . . ., en este caso se tiene

e2imπ = e2(n+12)iπ = e2niπeiπ = −1

de modo que si m es semientero viola la condicion (11.23). Por otro lado, sabemos que l y m son ambos enteros oambos semienteros. En consecuencia, tanto m como l solo pueden tomar valores enteros.

La siguiente pregunta natural es si l puede tomar todos los valores enteros no negativos. Para ello tendremosen cuenta que segun la teorıa general (lema 6, Pag. 314) se debe satisfacer

L+Yll (θ, ϕ) = 0 (11.24)

ahora reemplazando (11.14) y (11.22), en la Ec. (11.24) tenemos

~eiϕ(∂

∂θ+ i cot θ

∂ϕ

)[Fll (θ) e

ilϕ]

= 0

(∂Fll (θ)

∂θ+ i (il) cot θ Fll (θ)

)eilϕ = 0

finalmente d

dθ− l cot θ

Fll (θ) = 0 (11.25)

teniendo en cuenta que

cot θ dθ =d (sin θ)

sin θ(11.26)

Page 331: Mecanica Cuantica: Notas de Clase

11.3. PROPIEDADES FUNDAMENTALES DE LOS ARMONICOS ESFERICOS 331

la solucion general de la ecuacion esFll (θ) = cl (sin θ)

l (11.27)

siendo cl una constante de normalizacion. Se puede demostrar inversamente que esta funcion es funcion propia deL2 y L3 con autovalores l (l + 1) ~2 y l~. Usando (11.12) y (11.22) vemos que

L3Yll (θ, ϕ) =~

i

∂ϕ

[Fll (θ) e

ilϕ]=il~

iFll (θ) e

ilϕ

L3Yll (θ, ϕ) = l~Yll (θ, ϕ) (11.28)

multiplicando (11.24) por L− y usando (10.17) resulta

L−L+Yll (θ, ϕ) = 0 ⇒(L2 − L2

3 − ~L3

)Yll (θ, ϕ) = 0 ⇒

⇒ L2Yll (θ, ϕ) =(L23 + ~L3

)Yll (θ, ϕ) = (L3 + ~)L3Yll (θ, ϕ)

y usando (11.28) mostramos que

L2Yll (θ, ϕ) = (L3 + ~) (l~)Yll (θ, ϕ) = (l~+ ~) (l~)Yll (θ, ϕ)

L2Yll (θ, ϕ) = l (l + 1) ~2Yll (θ, ϕ)

por tanto para cada valor entero no negativo de l, existe una funcion Yll unica dentro de factores constantes de laforma

Yll (θ, ϕ) = cl (sin θ)l eilϕ

adicionalmente, el factor cl se determina por normalizacion. Es usual ademas elegir una fase 0 para l par y π paral impar, de modo que

|cl| =1

2ll!

√(2l + 1)!

4π; cl = (−1)l |cl|

quedando finalmente

Yll (θ, ϕ) = (−1)l1

2ll!

√(2l + 1)!

4π(sin θ)l eilϕ (11.29)

y a traves de la accion iterativa de L− podemos construır Yl,l−1, . . . , Yl,m, . . . , Yl,−l. En sıntesis, para cada par (l,m)con l entero no negativo y m entero con la condicion −l ≤ m ≤ l; existe una y solo una funcion Ylm (θ, ϕ) (dentrode factores constantes), que se puede calcular de (11.29) y que es funcion propia de L2 y L3 con valores propiosl (l + 1) ~2 y m~. A estas autofunciones se les denomina armonicos esfericos. La forma general de estas funcionesviene dada por

Ylm (θ, ϕ) =

√2l + 1

(l −m)!

(l +m)!Pml (cos θ) eimϕ (11.30)

Pml (x) =(−1)m

2l · l!(1− x2

)m/2 dl+m

dxl+m(x2 − 1

)l(11.31)

donde las funciones Pml (x) se conocen como polinomios asociados de Legendre.

11.3. Propiedades fundamentales de los armonicos esfericos

Algunas de las propiedades de los armonicos esfericos se pueden extraer de la teorıa general. Por ejemplo, dela Ec. (10.47) tenemos que

L±Ylm (θ, ϕ) = ~√l (l + 1)−m (m± 1)Yl,m±1 (θ, ϕ) (11.32)

Page 332: Mecanica Cuantica: Notas de Clase

332 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

utilizando las expresiones diferenciales de L± Ecs. (11.14, 11.15) junto con (11.22), expresamos esta propiedad enforma diferencial

eiϕ(∂

∂θ−m cot θ

)Ylm (θ, ϕ) =

√l (l + 1)−m (m+ 1)Yl,m+1 (θ, ϕ)

e−iϕ(− ∂

∂θ−m cot θ

)Ylm (θ, ϕ) =

√l (l + 1)−m (m− 1)Yl,m−1 (θ, ϕ)

11.3.1. Ortonormalidad y completez

Las Ecuaciones (11.20, 11.21) determinan a los armonicos esfericos salvo por un factor multiplicativo. Podemosescoger este factor de manera que se normalicen estas autofunciones. La condicion de ortonormalidad se escribecomo1 ∫

Y ∗l′m′ (θ, ϕ) Ylm (θ, ϕ) dΩ = δll′δmm′

teniendo en cuenta la expresion del angulo solido (11.4) esta se escribe como

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

l′m′ (θ, ϕ) Ylm (θ, ϕ) = δll′δmm′ (11.33)

es un hecho ademas que cualquier funcion de θ y ϕ que sea de cuadrado integrable, se puede expandir en terminosde los armonicos esfericos

f (θ, ϕ) =∞∑

l=0

+l∑

m=−lclmYlm (θ, ϕ) ; clm = 〈lm| f〉 =

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) f (θ, ϕ)

por tanto los armonicos esfericos son una base ortonormal en el espacio EΩ de funciones de θ y ϕ. Esto se expresacon relaciones de completez que aplican en este espacio

∞∑

l=0

+l∑

m=−lYlm (θ, ϕ)Y ∗

lm

(θ′, ϕ′) = δ

(cos θ − cos θ′

)δ(ϕ− ϕ′) = δ (θ − θ′) δ (ϕ− ϕ′)

sin θ

la inclusion de δ (cos θ − cos θ′) en la relacion de completez se debe a que el elemento diferencial de angulo solidose escribe como dΩ = sin θ dθ dϕ = −d (cos θ) dϕ. Notese que la completez no esta garantizada por la teorıageneral cuando el espacio vectorial es de dimension infinita, es de hecho una hipotesis de trabajo que debe serdemostrada explıcitamente.

11.3.2. Propiedades de paridad y conjugacion

El cambio r → −r en coordenadas cartesianas se expresa como (x1, x2, x3) → (−x1,−x2,−x3). En coordenadasesfericas esta transformacion de paridad se expresa en la forma

r → r , θ → π − θ , ϕ→ π + ϕ

se puede demostrar que

Ylm (π − θ, π + ϕ) = (−1)l Ylm (θ, ϕ) (11.34)

1La constante de normalizacion para Ylm (θ, ϕ) arbitrario se puede calcular determinando la constante de normalizacion paraYll (θ, ϕ) en la Ec. (11.29) y usando la Ec. (10.38) de la Pag. 318, que garantiza la normalizacion de cada Ylm (θ, ϕ) generado a travesde L− a partir de Yll (θ, ϕ). La ortogonalidad en l y m esta garantizada por el hecho de que si l 6= l′ tenemos dos vectores propiosasociados a valores propios diferentes del operador hermıtico L2, y si m 6= m′ tenemos dos vectores propios asociados a dos valorespropios diferentes del operador hermıtico L3.

Page 333: Mecanica Cuantica: Notas de Clase

11.3. PROPIEDADES FUNDAMENTALES DE LOS ARMONICOS ESFERICOS 333

de modo que los armonicos esfericos tienen paridad definida, la cual es independiente dem. Si l es par (impar) todossus 2l + 1 armonicos esfericos asociados son pares (impares). Tambien se puede demostrar que bajo conjugacionlos armonicos esfericos tienen la propiedad

Y ∗lm (θ, ϕ) = (−1)m Yl,−m (θ, ϕ) (11.35)

11.3.3. Armonicos esfericos de la forma Yl,0 (θ) y polinomios de Legendre

Para m = 0, los armonicos esfericos se vuelven independientes de ϕ, y adquieren la forma

Yl,0 (θ) =(−1)l

2ll!

√2l + 1

dl

d (cos θ)l(sin θ)2l (11.36)

Yl,0 (θ) =

√2l + 1

4πPl (cos θ) ; Pl (u) ≡

(−1)l

2ll!

dl

dul(1− u2

)l(11.37)

Pl (u) se denomina el polinomio de Legendre de grado l. Estos polinomios son ortogonales

∫ +1

−1du Pl (u) Pl′ (u) =

∫ π

0sin θ dθ Pl (cos θ) Pl′ (cos θ) =

2

2l + 1δll′ (11.38)

y generan una base para generar cualquier funcion de θ de cuadrado integrable

f (θ) =

∞∑

l=0

clPl (cos θ) ; cl =2l + 1

2

∫ π

0sin θ dθ Pl (cos θ) f (θ) (11.39)

por tanto, cuando el problema tiene simetrıa azimutal i.e. es independiente de ϕ, es usual utilizar polinomios deLegendre o armonicos esfericos del tipo Yl,0 (θ). De hecho, en una expansion de una funcion f (θ) en armonicosesfericos Yl,m (θ, ϕ), solo contribuiran los armonicos con m = 0. Otras propiedades de los polinomios de Legendreson

Pl (1) = 1 ; Pl (−u) = (−1)l Pl (u) (11.40)

notese que la paridad esta definida con respecto a la variable u. Al hacer u = cos θ esta propiedad de paridad semanifiesta en la variable espacial θ en la forma

Yl,0 (π − θ) = (−1)l Yl,0 (θ)

que es un caso especial de (11.34). La Ec. (11.38) nos muestra que los polinomios de Legendre son ortogonalespero no estan normalizados. En contraste, las funciones Yl,0 (θ) son ortonormales.

11.3.4. Teorema de adicion de los armonicos esfericos

Consideremos dos direcciones arbitrarias en el espacio cuyas orientaciones estan especificadas por los angulos(θ1, ϕ1) y (θ2, ϕ2), ası como por los vectores unitarios u1 (θ1, ϕ1) y u2 (θ2, ϕ2). El angulo entre los vectores u1 yu2 lo denotamos por α. Para esta situacion hay una relacion especıfica entre los armonicos esfericos asociados a(θ1, ϕ1) y (θ2, ϕ2) y los polinomios de Legendre asociados a α

2l + 1

4πPl (cosα) =

l∑

m=−l(−1)m Ylm (θ1, ϕ1)Yl,−m (θ2, ϕ2) =

l∑

m=−lYlm (θ1, ϕ1)Y

∗l,m (θ2, ϕ2) (11.41)

donde hemos utilizado tambien la propiedad (11.35). Esta relacion se conoce como teorema de adicion de losarmonicos esfericos.

Page 334: Mecanica Cuantica: Notas de Clase

334 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

11.4. Construccion de bases estandar de la funcion de onda espacial de unapartıcula sin espın

En general L2 y L3 no forman un C.S.C.O. de modo que los subespacios Er (l,m) no son en general unidimen-sionales. Por tanto aplicaremos el algoritmo descrito en la seccion 10.4.1 para construir una base estandar paraEr.

Comenzamos entonces por el subespacio Er (l, l) que serıa el espacio de las autofunciones de L2 y L3 con valorespropios l (l + 1) ~2 y l~. El punto de partida es construır una base ortonormal en Er (l, l) que denotaremos porψl,l,k (r) donde k es el ındice que recorre la base cuando L2 y L3 no forman un C.S.C.O.

El siguiente paso consiste en aplicar iterativamente el operador L− sobre todos los elementos ψl,l,k (r) deEr (l, l) para generar una base ortonormal sobre los subespacios

Er (l, l − 1) , Er (l, l − 2) , . . . , Er (l,m) , . . . , Er (l,−l + 1) , Er (l,−l)

Todos los elementos de estas bases cumplen con las Ecs. (10.19, 10.47), que en este contexto se escriben como

L2ψl,m,k (r) = l (l + 1) ~2ψl,m,k (r) ; L3ψl,m,k (r) = m~ψl,m,k (r) (11.42)

L±ψl,m,k (r) = ~√l (l + 1)−m (m± 1)ψl,m±1,k (r) (11.43)

pero ya hemos visto que todas las funciones propias de L2 y L3 correspondientes a un par especıfico (l,m) poseenla misma dependencia angular denotada por Ylm (θ, ϕ). Es decir la variacion de k para l,m fijos, solo hace que varıela dependencia radial de ψl,m,k (r). De las Ecuaciones (11.19) ya dedujimos que las funciones propias ψl,m,k (r)tienen la forma

ψl,m,k (r) = Rl,m,k (r) Ylm (θ, ϕ) (11.44)

apliquemos el operador L± sobre la Ec. (11.44) teniendo en cuenta que tales operadores solo actuan sobre lacomponente angular

L±ψl,m,k (r) = Rl,m,k (r) L±Ylm (θ, ϕ) = ~√l (l + 1)−m (m± 1)Rl,m,k (r) Yl,m±1 (r)

comparando con la Ec. (11.43) vemos que la funcion radial debe satisfacer para todo r la condicion

Rl,m±1,k (r) = Rl,m,k (r)

la aplicacion sucesiva de L± nos lleva a que R (r) no puede depender de m. Este resultado se puede enunciar de lasiguiente manera: Si ψl,m,k (r) constituye una base estandar de Er, su funcion radial asociada no puede dependerde m de modo que estas funciones se escriben como

ψl,m,k (r) = Rl,k (r) Ylm (θ, ϕ) (11.45)

Podrıamos estar tentados a pensar que la funcion radial solo depende de la degeneracion k. Sin embargo, lafuncion radial tambien depende en general de l por la siguiente razon: una funcion de la forma f (r) g (θ, ϕ) solopuede ser contınua en el origen (r = 0, θ y ϕ arbitrarios) si g (θ, ϕ) se reduce a una constante o si f (r) tiendea cero cuando r → 0 con f (0) = 0. Para ver esto, basta con observar que si g (θ, ϕ) es no trivial, entonces ellımite de f (r) g (θ, ϕ) cuando r → 0 dependera de la direccion por la cual nos aproximemos al origen si f (r) notiende a cero cuando r → 0. De lo anterior vemos que si requerimos que ψl,m,k (r) sea contınuo, entonces solo lasfunciones radiales con l = 0 pueden ser no nulas en el origen (puesto que Y00 es constante). Si ademas requerimosdiferenciabilidad hasta cierto orden en el origen obtendremos condiciones sobre Rl,k (r) que dependen de l.

Las relaciones de ortonormalidad de estas funciones se escriben en la forma∫d3r ψ∗

l,m,k (r) ψl′,m′,k′ (r) =

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r)

×∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ)Yl′m′ (θ, ϕ) = δkk′δll′δmm′

Page 335: Mecanica Cuantica: Notas de Clase

11.5. VALORES ESPERADOS Y DISPERSION PARA SISTEMAS EN UN ESTADO |L,M,K〉 335

y dado que los armonicos esfericos son ortonormales Ec. (11.33) tenemos que

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r)

[∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ)Yl′m′ (θ, ϕ)

]= δkk′δll′δmm′

δll′δmm′

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r) = δkk′δll′δmm′ (11.46)

∫ ∞

0r2 dr R∗

l,k (r)Rl,k′ (r) = δkk′ (11.47)

de modo que las funciones radiales Rl,k (r) estan normalizadas con respecto a r y dos funciones radiales asociadasal mismo valor de l pero con diferente valor de k son ortogonales.

Notese que la relacion (11.47) proviene del hecho de que las funciones ψl,l,k (r) = Rl,k (r)Yll (θ, ϕ) que seescogieron como base en el subespacio Er (l, l) son ortonormales. Por tal razon, es esencial que el ındice l seael mismo en ambas funciones radiales de la ecuacion (11.47). Si l 6= l′ entonces ψl,m,k y ψl′,m′,k′ deben serortogonales puesto que corresponden a funciones propias de L2 con diferente valor propio, pero la ortogonalidadde los armonicos esfericos ya garantiza la ortogonalidad de las ψ′s cuando l 6= l′, de modo que en general la integrala la izquierda de (11.47) toma cualquier valor, esto se puede apreciar haciendo l 6= l′ en (11.46).

11.5. Valores esperados y desviaciones medias cuadraticas de observablescuando el sistema esta en un estado |l, m, k〉

Supongamos que una partıcula sin espın esta en el estado |l,m, k〉 que es autoestado de L2 y L3 con valorespropios l (l + 1) ~2 y m~. Por tanto, el cuadrado de su momento angular y su proyeccion a lo largo de X3 estanbien definidos. Supongamos ahora que queremos medir las proyecciones a lo largo de los otros dos ejes L1 y L2;puesto que estos observables no conmutan con L3, los estados |l,m, k〉 no son en general autoestados de L1 ni deL2, por tanto las predicciones sobre sus autovalores seran solo probabilısticas.

Calculemos entonces los valores esperados y las raıces de las desviaciones medias cuadraticas de L1 y L2. Paraello expresamos estos observables en terminos de los operadores escalera L± invirtiendo las Ecs. (11.45)

L1 =1

2(L+ + L−) ; L2 =

1

2i(L+ − L−)

por tanto L1 |l,m, k〉 es una combinacion lineal de los estados |l,m+ 1, k〉 y |l,m− 1, k〉, similarmente ocurre conL2 |l,m, k〉, esto nos lleva por tanto a que

〈l,m, k|L1 |l,m, k〉 = 〈l,m, k|L2 |l,m, k〉 = 0 (11.48)

para calcular las desviaciones medias cuadraticas debemos calcular los valores esperados de L21, L

22

〈l,m, k|L21 |l,m, k〉 =

1

4〈l,m, k| (L+ + L−) (L+ + L−) |l,m, k〉

=1

4〈l,m, k|

[L2+ + L2

− + L+L− + L−L+

]|l,m, k〉

〈l,m, k|L22 |l,m, k〉 = −1

4〈l,m, k| (L+ − L−) (L+ − L−) |l,m, k〉

= −1

4〈l,m, k|

[L2+ + L2

− − L+L− − L−L+

]|l,m, k〉

Page 336: Mecanica Cuantica: Notas de Clase

336 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

los terminos con L2± no contribuyen puesto que L2

+ |l,m, k〉 = c± |l,m± 2, k〉. Por tanto ambos valores esperadosson identicos. Usando la Ec. (10.17) se obtiene

〈l,m, k|L21 |l,m, k〉 = 〈l,m, k|L2

2 |l,m, k〉 =1

4〈l,m, k| [L+L− + L−L+] |l,m, k〉

=1

4〈l,m, k|

[2L2 − 2L2

3

]|l,m, k〉 = ~2

2

[l (l + 1)−m2

](11.49)

las desviaciones medias cuadraticas son

(∆L1)2 = (∆L2)

2 = 〈l,m, k|L21 |l,m, k〉 − [〈l,m, k|L1 |l,m, k〉]2 =

~2

2

[l (l + 1)−m2

]

en resumen cuando la partıcula esta en el estado |l,m, k〉, los valores esperados y raıces de las desviaciones mediascuadraticas de L1 y L2 son

〈l,m, k|L1 |l,m, k〉 = 〈l,m, k|L2 |l,m, k〉 = 0 (11.50)

∆L1 = ∆L2 = ~

√1

2[l (l + 1)−m2] (11.51)

Este resultado posee el siguiente analogo clasico: asumamos un momento angular clasico de modulo |L| = L =~√l (l + 1) y cuya tercera componente L3 es igual a m~. Si graficamos a L en un espacio de configuracion con ejes

L1, L2, L3 colocando el vector L con la cola en el origen, podemos describir tal vector en coordenadas esfericascon angulo polar θ y angulo azimutal ϕ

L1 = L sin θ cosϕ ; L2 = L sin θ sinϕ ; L3 = L cos θ

L21 + L2

2 = L2 sin2 θ

de acuerdo con nuestras hipotesis

L = ~√l (l + 1) ; L3 = m~

por tanto

L21 + L2

2 = L2 − L23 = l (l + 1) ~2 −m2~2 =

[l (l + 1)−m2

]~2

√L21 + L2

2 = L sin θ = ~√

[l (l + 1)−m2]

y las componentes del momento angular son

L1 = L sin θ cosϕ = ~√

[l (l + 1)−m2] cosϕ

L2 = L sin θ sinϕ = ~√

[l (l + 1)−m2] sinϕ

L3 = L cos θ = ~√l (l + 1) cos θ

asumamos ahora que los valores de L y θ son conocidos y que el angulo azimutal ϕ es una variable aleatoria quepuede tomar cualquier valor en el intervalo [0, 2π) con igual probabilidad en todo el rango. Si promediamos sobreϕ tenemos

L1 =~

√[l (l + 1)−m2]

∫ 2π

0cosϕ dϕ = 0

L2 =~

√[l (l + 1)−m2]

∫ 2π

0sinϕ dϕ = 0

L1 = L2 = 0 (11.52)

Page 337: Mecanica Cuantica: Notas de Clase

11.6. PROBABILIDADES ASOCIADAS A LA MEDIDA DE L2 Y L3 EN UN ESTADO ARBITRARIO 337

adicionalmente

L21 =

~2

[l (l + 1)−m2

] ∫ 2π

0cos2 ϕ dϕ =

~2

2

[l (l + 1)−m2

]

L22 =

~2

[l (l + 1)−m2

] ∫ 2π

0sin2 ϕ dϕ =

~2

2

[l (l + 1)−m2

]

L21 = L2

2 =~2

2

[l (l + 1)−m2

](11.53)

vemos que los promedios clasicos de L1, L2, L21 , L

22 dados por las Ecs. (11.52, 11.53) son identicos a los valores

esperados cuanticos dados en las Ecs. (11.50, 11.51) para una partıcula en el estado |l,m, k〉. Por tanto, en loque concierne a los valores de 〈L1〉, 〈L2〉 ,

⟨L21

⟩,⟨L22

⟩, una partıcula cuantica en el estado |l,m, k〉 se comporta

de manera similar a una particula clasica con momento angular de magnitud L = ~√l (l + 1) y con tercera

componente L3 = m~ para el cual ϕ es una variable aleatoria con distribucion uniforme de probabilidad sobre elintervalo [0, 2π).

No obstante, este analogo clasico tambien tiene sus limitaciones. Por ejemplo en este modelo clasico puestoque ϕ es aleatoria y puede tomar cualquier valor en el contınuo nos lleva a que L1 y L2 puede tomar cualquiervalor entre −~

√[l (l + 1)−m2] y ~

√[l (l + 1)−m2]. En contraste, para el caso cuantico los valores accesibles

de todas las componentes para una medida individual de la partıcula en el estado |l,m, k〉 estan cuantizados.Especıficamente, hemos visto que los valores accesibles de L1 y L2 coinciden con los de L3, puesto que l es fijohay 2l + 1 valores accesibles que son l~, (l − 1) ~, . . . , (−l + 1) ~,−l~.

11.6. Probabilidades asociadas a la medida de L2 y L3 en un estado arbitrario

Consideremos una partıcula cuyo estado esta descrito por la funcion de onda normalizada dada por

〈r |ψ〉 = ψ (r) = ψ (r, θ, ϕ)

calcularemos ahora la probabilidad de obtener un valor especıfico l (l + 1) ~2 de L2 y/o un valor especıfico m~ deL3.

Puesto que L2 y L3 son variables compatibles, podemos hacer una medicion simultanea de estas cantidades.Denotaremos PL2,L3

(l,m) la probabilidad de obtener los valores l (l + 1) ~2 y m~ en una medicion simultaneade dichas cantidades. Para ello expandimos ψ (r) en autoestados de L2 y L3, para lo cual escogeremos una baseestandar de la forma (11.45)

ψl,m,k (r) = Rl,k (r)Ylm (θ, ϕ)

esta expansion es entonces

ψ (r) =∑

k

l

m

cl,m,kRl,k (r)Ylm (θ, ϕ) (11.54)

donde los coeficientes de Fourier de la expansion son los usuales

cl,m,k = 〈l,m, k |ψ〉 =∫d3r ψ∗

l,m,k (r) ψ (r)

=

∫ ∞

0r2dr R∗

l,k (r)

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ) (11.55)

de acuerdo con los postulados, la probabilidad PL2,L3(l,m) esta dada por

PL2,L3(l,m) =

k

|cl,m,k|2 (11.56)

Page 338: Mecanica Cuantica: Notas de Clase

338 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

si medimos L2 solamente, la probabilidad PL2 (l) de obtener l (l + 1) ~2 es

PL2 (l) =l∑

m=−lPL2,L3

(l,m) =∑

k

l∑

m=−l|cl,m,k|2 (11.57)

ahora, si medimos L3 unicamente, la probabilidad de obtener m~ es

PL3 (m) =∑

l≥|m|PL2,L3

(l,m) =∑

k

l≥|m||cl,m,k|2 (11.58)

estrictamente la condicion l ≥ |m| se satisface automaticamente ya que no hay coeficientes cl,k,m con l < |m|.Adicionalmente, si tenemos en cuenta que L2, Li, L± son operadores diferenciales que solo actuan sobre las

variables angulares, solo la dependencia angular en ψ (r) sera relevante para calcular estas probabilidades. Enconsecuencia, r se puede ver como un parametro para estos calculos (cantidad arbitraria pero fija). Si consideramosque ψ (r, θ, ϕ) es funcion de las variables θ, ϕ y que r es un parametro, entonces puesto que toda funcion de θ y ϕse podra expandir en armonicos esfericos con coeficientes que dependen del parametro r, tendremos

ψ (r, θ, ϕ) =∑

l

m

al,m (r)Ylm (θ, ϕ) (11.59)

alm (r) = 〈lm|ψ〉 =∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ) (11.60)

si comparamos las expansiones (11.54, 11.59) vemos que los cl,m,k son los coeficientes de la expansion de al,m (r)en las funciones Rl,k (r)

al,m (r) =∑

k

cl,m,kRl,k (r) (11.61)

usando (11.55) y (11.60) se obtiene

cl,m,k =

∫ ∞

0r2dr R∗

l,k (r)

[∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ)

]

cl,m,k =

∫ ∞

0r2 dr R∗

l,k (r) al,m (r) (11.62)

la Ec. (11.62) es la inversa de (11.61). De hecho la Ec. (11.62) se puede obtener multiplicando (11.61) por r2R∗l,k (r),

integrando en r y utilizando la relacion de ortonormalidad (11.47). Usando las Ecs. (11.47, 11.61) se obtiene

∫ ∞

0r2dr |al,m (r)|2 =

∫ ∞

0r2dr

[∑

k

c∗l,m,kR∗l,k (r)

][∑

k′cl,m,k′Rl,k′ (r)

]

∫ ∞

0r2dr |al,m (r)|2 =

k

k′c∗l,m,kcl,m,k′

∫ ∞

0r2dr R∗

l,k (r)Rl,k′ (r) =∑

k,k′c∗l,m,kcl,m,k′δkk′

∫ ∞

0r2dr |al,m (r)|2 =

k

|cl,m,k|2

por lo tanto, la probabilidad PL2,L3(l,m) descrita por la Ec. (11.56) se puede reescribir como

PL2,L3(l,m) =

∫ ∞

0r2 dr |al,m (r)|2 (11.63)

de lo cual se puede deducir las probabilidades PL2 (l) y PL3 (m)

PL2 (l) =

l∑

m=−l

∫ ∞

0r2dr |al,m (r)|2 ; PL3 (m) =

l≥|m|

∫ ∞

0r2dr |al,m (r)|2 (11.64)

Page 339: Mecanica Cuantica: Notas de Clase

11.6. PROBABILIDADES ASOCIADAS A LA MEDIDA DE L2 Y L3 EN UN ESTADO ARBITRARIO 339

en sıntesis, para calcular las probabilidades asociadas a las medidas de los observables L2 y L3 podemos considerara la funcion de onda solo como funcion de las variables θ, ϕ y expandir dicha funcion en armonicos esfericos comose ve en la Ec. (11.59). Los coeficientes de esta expansion se usan entonces para calcular las probabilidades comose ve en las Ecs. (11.63, 11.64).

Ahora bien, la Ec. (11.12) nos muestra que el operador L3 solo depende del angulo azimutal ϕ. Por tanto,para el calculo de PL3 (m) podemos considerar a ϕ como la unica variable en ψ (r) siendo r y θ parametros en lafuncion de onda. Para ver esto basta con observar que los armonicos esfericos son el producto de una funcion desolo θ por una funcion de solo ϕ

Ylm (θ, ϕ) = Zlm (θ)eimϕ√2π

(11.65)

con esta parametrizacion cada una de las funciones del producto esta normalizada, esto se ve teniendo en cuentaque ∫ 2π

0dϕe−imϕ√

eim′ϕ

√2π

= δmm′

si sustituımos esto en la relacion de ortonormalidad para los armonicos esfericos Ec. (11.33) encontramos que

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

l′m′ (θ, ϕ) Ylm (θ, ϕ) = δll′δmm′

∫ 2π

0dϕ

∫ π

0sin θ dθ

[Z∗l′m′ (θ)

e−im′ϕ

√2π

] [Zlm (θ)

eimϕ√2π

]= δll′δmm′

[∫ 2π

0

e−im′ϕ

√2π

eimϕ√2π

] ∫ π

0sin θ dθ Z∗

l′m′ (θ)Zlm (θ) = δll′δmm′

δmm′

∫ π

0sin θ dθ Z∗

l′m′ (θ)Zlm (θ) = δll′δmm′ (11.66)

∫ π

0sin θ dθ Z∗

l,m (θ)Zl′,m (θ) = δll′ (11.67)

notese que en esta relacion solo aparece un numero cuantico m ya que si m 6= m′ ambos miembros en (11.66) seanulan para cualquier valor de la integral que aparece a la izquierda de (11.66), de modo que a priori esta integralpuede tomar cualquier valor.

Tomaremos entonces para el calculo de PL3 a la funcion de onda ψ (r) como una funcion que solo depende deϕ como variable y que depende solo parametricamente de θ y r. Su expansion de Fourier sera

ψ (r, θ, ϕ) =∑

m

bm (r, θ)eimϕ√2π

; bm (r, θ) =1√2π

∫ 2π

0dϕ e−imϕψ (r, θ, ϕ) (11.68)

si reescribimos las Ecs. (11.59, 11.60) con la parametrizacion (11.65) obtenemos

ψ (r, θ, ϕ) =∑

l

m

al,m (r)Zlm (θ)eimϕ√2π

(11.69)

alm (r) = 〈lm|ψ〉 =∫ 2π

0dϕ

∫ π

0sin θ dθ Z∗

lm (θ)e−imϕ√

2πψ (r, θ, ϕ) (11.70)

si comparamos las Ecs. (11.68) con las Ecs. (11.69, 11.70) vemos que los alm con m fijo son los coeficientes de laexpansion de bm (r, θ) sobre las funciones Zlm (θ) para tal valor de m

bm (r, θ) =∑

l

al,m (r) Zlm (θ) ; alm (r) =

∫ π

0sin θ dθ Z∗

lm (θ) bm (r, θ) (11.71)

Page 340: Mecanica Cuantica: Notas de Clase

340 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

multiplicando a ambos lados de (11.71) por sin θ dθ y por el conjugado de cada miembro e integrando resulta

bm (r, θ) b∗m (r, θ) sin θ dθ =

[∑

l

al,m (r) Zlm (θ)

][∑

l′a∗l′,m (r) Z∗

l′m (θ)

]sin θ dθ

∫ π

0|bm (r, θ)|2 sin θ dθ =

l

l′al,m (r) a∗l′,m (r)

∫ π

0Zlm (θ) Z∗

l′m (θ) sin θ dθ

y usando (11.67) resulta

∫ π

0|bm (r, θ)|2 sin θ dθ =

l

l′al,m (r) a∗l′,m (r) δll′

∫ π

0|bm (r, θ)|2 sin θ dθ =

l

|al,m (r)|2 (11.72)

y sustituyendo (11.72) en la segunda de las ecuaciones (11.64), la probabilidad PL3 (m) queda en la forma

PL3 (m) =

∫ ∞

0r2dr

∫ π

0sin θ dθ |bm (r, θ)|2 (11.73)

Por lo tanto, en lo que respecta al calculo de PL3 (m) se puede considerar que para la funcion de onda, lascantidades r y θ son parametros y la unica variable es ϕ. Con esta consideracion, la expansion de Fourier se haceen la forma indicada en (11.68) y los coeficientes de la expansion se utilizan para calcular PL3 (m) como se observaen la Ec. (11.73).

Por otro lado, vemos que para calcular PL2 los dos angulos θ y ϕ son relevantes ya que el operador diferencialasociado (11.13) depende de ambos angulos. Por tanto la unica cantidad que se puede considerar como parametropara este calculo es r y debemos emplear la formula (11.64).

11.7. Ejemplos de calculos de probabilidad para L2 y L3

11.7.1. Funcion de onda parcialmente separable

Supongamos que la funcion de onda ψ (r) de una partıcula tiene la forma

ψ (r, θ, ϕ) = f (r) g (θ, ϕ) (11.74)

siempre es posible normalizar cada funcion por separado de modo que

∫ ∞

0r2 dr |f (r)|2 = 1 ;

∫ 2π

0dϕ

∫ π

0sin θ dθ |g (θ, ϕ)|2 = 1 (11.75)

la expansion (11.59, 11.60) se escribe entonces en la forma

f (r) g (θ, ϕ) =∑

l

m

al,m (r)Ylm (θ, ϕ) ; alm (r) = f (r)

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ)

f (r) g (θ, ϕ) = f (r)∑

l

m

dl,mYlm (θ, ϕ) ; alm (r) ≡ f (r) dlm (11.76)

quedando entonces

g (θ, ϕ) =∑

l

m

dl,mYlm (θ, ϕ) ; dlm ≡∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ)

Page 341: Mecanica Cuantica: Notas de Clase

11.7. EJEMPLOS DE CALCULOS DE PROBABILIDAD PARA L2 Y L3 341

usando la segunda Ec. (11.76), la probabilidad PL2,L3dada en (11.63) queda en la forma

PL2,L3(l,m) =

∫ ∞

0r2 dr |al,m (r)|2 = |dl,m|2

∫ ∞

0r2 dr |f (r)|2

PL2,L3(l,m) = |dl,m|2 ; dlm ≡

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ) (11.77)

donde hemos usado la condicion de normalizacion radial (11.75). Esta probabilidad es totalmente independientede la parte radial de la funcion de onda f (r).

11.7.2. Funcion de onda totalmente separable

Consideremos ahora el caso en el cual la funcion de onda admite una separacion total

ψ (r, θ, ϕ) = f (r)h (θ) k (ϕ) (11.78)

de nuevo asumimos que cada funcion esta normalizada por aparte

∫ ∞

0r2 dr |f (r)|2 =

∫ π

0sin θ dθ |h (θ)|2 =

∫ 2π

0dϕ |k (ϕ)|2 = 1 (11.79)

Por supuesto la Ec. (11.78) es un caso especial de (11.74) de modo que los resultados precedentes son validos aquı.Pero la separacion adicional nos permite simplificar el calculo de PL3 , pues la expansion (11.68) queda en estecaso en la forma

f (r)h (θ) k (ϕ) =∑

m

bm (r, θ)eimϕ√2π

; bm (r, θ) =1√2πf (r)h (θ)

∫ 2π

0dϕ e−imϕk (ϕ)

f (r)h (θ) k (ϕ) = f (r)h (θ)∑

m

cmeimϕ√2π

; bm (r, θ) ≡ cm f (r)h (θ) (11.80)

quedando finalmente

k (ϕ) =∑

m

cmeimϕ√2π

; cm ≡ 1√2π

∫ 2π

0dϕ e−imϕk (ϕ) (11.81)

ahora aplicando (11.80 y 11.81) a la Ec. (11.73) para el calculo de PL3 se obtiene

PL3 (m) =

∫ ∞

0r2dr

∫ π

0sin θ dθ |bm (r, θ)|2 =

∫ ∞

0r2dr

∫ π

0sin θ dθ |cm f (r)h (θ)|2

= |cm|2∫ ∞

0r2dr |f (r)|2

∫ π

0sin θ dθ |h (θ)|2

y usando las condiciones de normalizacion (11.79) se tiene

PL3 (m) = |cm|2 ; cm ≡ 1√2π

∫ 2π

0dϕ e−imϕk (ϕ) (11.82)

11.7.3. Comportamiento de la probabilidad con θ y ϕ

Hasta ahora solo se ha considerado una estructura especıfica de separacion de variables en la funcion de onda enforma de las Ecs. (11.74, 11.78). Tomaremos ahora ejemplos concretos que cumplan con alguna de estas ecuaciones,por ejemplo asumamos que la funcion de onda es de la forma (11.78) pero totalmente independiente de θ y ϕ

h (θ) =1√2

; k (ϕ) =1√2π

(11.83)

Page 342: Mecanica Cuantica: Notas de Clase

342 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

con lo cual la Ec. (11.78) se convierte en

ψ (r) = f (r)1√4π

= f (r)Y00 (θ, ϕ)

de modo que una medida de L2 y/o L3 da el valor cero con total certeza.Ahora modifiquemos solo la dependencia con θ

h (θ) =

√3

2cos θ ; k (ϕ) =

1√2π

ψ (r) = f (r)

√3

4πcos θ = Y10 (θ, ϕ)

de nuevo tenemos certeza total sobre los valores de L2 y L3 en una medida (l = 1,m = 0). Para L2 obtenemos2~2 y para L3 tendremos cero. Vemos que la modificacion de la dependencia de θ no modifica las prediccionesconcernientes a L3 puesto que tales predicciones solo dependen del angulo ϕ.

Ahora modificamos la dependencia de ϕ (con respecto al primer problema) de modo que

h (θ) =1√2

; k (ϕ) =eiϕ√2π

ψ (r) = f (r)eiϕ√4π

(11.84)

la dependencia angular ya no esta dada por un solo armonico esferico. Aplicando (11.82) vemos que PL3 (m) nosda

PL3 (m) = |cm|2 ; cm ≡ 1√2π

∫ 2π

0dϕ e−imϕk (ϕ) =

1

∫ 2π

0dϕ e−imϕeiϕ = δm1

PL3 (m) = δm1

por tanto m solo puede tomar el valor m = 1, vemos entonces que las predicciones sobre L3 han cambiado porla introduccion de la dependencia azimutal. Las predicciones sobre L2 cambian tambien con respecto a las dadaspor (11.83). Para calcular PL2 es necesario expandir eiϕ/

√4π en armonicos esfericos. Se puede verificar que todos

los armonicos con l impar y m = 1 aparecen en dicha expansion. Por tanto, ya no hay certeza en la medida de L2

sino una distribucion de probabilidad. Tal como ya se discutio, la dependencia de ϕ entra en las predicciones sobreL2. Notese que la Ec. (11.84) nos describe una autofuncion de L3 que no es autofuncion de L2. Esto no suponeninguna contradiccion, ya que esta garantizado que existe una base comun para ambos, pero esto no significa queno pueda existir una base (o en particular un vector) que consista de autovectores de solo uno de los operadores.

Page 343: Mecanica Cuantica: Notas de Clase

Capıtulo 12

Interacciones centrales en mecanicacuantica

En mecanica cuantica es frecuente encontrarse con el problema de dos partıculas interactuantes como es elcaso de la interaccion electron nucleo en un atomo hidrogenoide (sistema consistente en un nucleo y un electron).Cuando la interaccion entre las dos partıculas se puede describir por un potencial que solo depende de la posicionrelativa entre ambas, es posible demostrar al igual que en mecanica clasica, que el problema se puede reduciral estudio de una sola partıcula ficticia. Ademas cuando la interaccion entre las partıculas depende solo de ladistancia entre ellas, el sistema equivalente es la partıcula ficticia sujeta a un potencial central.

Una vez que el problema se reduce al problema equivalente de una partıcula, se consideraran las propiedadesmecano cuanticas de una partıcula sujeta a un potencial central V (r). Este problema esta ıntimamente relacionadocon el problema del momento angular, ya que el hecho de que V (r) sea invariante ante rotaciones alrededor delorigen significara que el Hamiltoniano H conmuta con todas las componentes del momento angular orbital L,es decir es un escalar. Esto simplificara considerablemente el problema de valores propios ya que sera posibleconstruır una base comun de funciones propias de H,L2 y L3. Esto a su vez permitira que la dependencia angularde la ecuacion de valores propios se convierta en el problema de valores propios del momento angular orbital queya se ha estudiado en detalle. Por tanto, el problema se reducira a encontrar la dependencia radial.

12.1. El problema de dos cuerpos y su reduccion al problema equivalente de

una partıcula en Mecanica Clasica

Consideremos un sistema de dos masas puntuales m1 y m2 como lo indica la Fig. 12.1, donde las unicas fuerzasque actuan sobre ellas son las debidas al potencial mutuo U . La isotropıa del espacio nos sugiere que si las masasno poseen alguna propiedad vectorial, la interaccion entre ellas debe ir dirigida a lo largo de la lınea que lasune, esto indica que el potencial debe ser funcion del valor absoluto de la coordenada relativa1 r2 − r1 ≡ r. Estesistema tiene seis grados de libertad y por tanto requiere de seis coordenadas generalizadas. Quizas el sistemade coordenadas generalizadas mas conveniente lo constituye las coordenadas de posicion del centro de masa R,y las coordenadas que determinan al vector relativo r. Estas coordenadas se pueden escribir en terminos de lascoordenadas de posicion de las partıculas r1 y r2

r ≡ r2 − r1 ; R ≡m1r1 +m2r2m1 +m2

(12.1)

1Esto adicionalmente es compatible con la homogeneidad del espacio ya que un cambio de origen no debe cambiar la naturaleza dela interaccion. Efectivamente, el vector r = r2 − r1 es invariante ante un cambio de origen.

343

Page 344: Mecanica Cuantica: Notas de Clase

344 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

Figura 12.1: Variables de posicion fundamentales en el problema de dos cuerpos.

estas ecuaciones se pueden invertir para obtener

r1 = R− m2

m1 +m2r

r2 = R+m1

m1 +m2r (12.2)

tambien son utiles las coordenadas de posicion de las partıculas relativas al centro de masa r′1 y r′2

r1 = R+ r′1 ; r2 = R+ r′2 (12.3)

con lo cual

r′1 = − m2

m1 +m2r

r′2 =m1

m1 +m2r (12.4)

En esta seccion consideraremos una situacion algo mas general en donde el potencial puede depender tambien delas derivadas temporales del vector relativo r. El Lagrangiano del sistema se puede escribir como

L = T(R, r

)− U (r, r, ..)

es bien sabido que la energıa cinetica de un sistema clasico de partıculas se puede escribir como la energıa cineticadel centro de masa mas la energıa cinetica con respecto al centro de masa

T(R, r

)=

1

2m1r

21 +

1

2m2r

22 =

1

2m1r

′21 +

1

2m2r

′22 +

1

2MR2 (12.5)

donde M ≡ m1 +m2. Usando (12.4) se puede escribir la energıa cinetica en terminos de las coordenadas genera-lizadas elegidas i.e. las componentes de R y r

T =1

2

m1m2

Mr2 +

1

2MR2

el Lagrangiano queda de la forma

L =1

2MR2 +

1

2

m1m2

Mr2 − U (r, r, ..) (12.6)

Page 345: Mecanica Cuantica: Notas de Clase

12.1. EL PROBLEMA DE DOS CUERPOS EN MECANICA CLASICA 345

se puede ver que las coordenadas de R son todas cıclicas, es decir no aparecen en el Lagrangiano pero sı aparecenlas coordenadas R. Si elegimos como coordenadas generalizadas las tres componentes cartesianas de R, vemosque los tres momentos lineales (que serıan los momentos canonicos) son constantes y por tanto, R = cte, de modoque el centro de masa esta en reposo o movimiento rectilıneo uniforme2

R = R0 + Rt (12.7)

si nuestro sistema original de referencia es inercial, entonces el sistema con origen en el centro de masa tambienlo es. Podemos entonces ver el movimiento a partir del centro de masa en cuyo caso el Lagrangiano queda

L =1

2µr2 − U (r, r, ..) (12.8)

donde hemos definidoµ ≡ m1m2

M(12.9)

como la masa reducida del sistema. El Lagrangiano (12.8) es el equivalente al Lagrangiano que se obtendrıasi tuvieramos una partıcula de masa µ sometida a una fuerza que apunta siempre hacia un punto fijo (fuerzacentral), y a una distancia r del centro de fuerza. Por lo tanto el problema de dos cuerpos sometidos a fuerzascentrales mutuas, se puede reducir a un problema de una sola partıcula que interactua con un centro de fuerzas.

No debemos olvidar sin embargo, que la partıcula equivalente a la cual esta asociada el Lagrangiano (12.8),NO existe, no hay ninguna partıcula de masa µ y las trayectorias que se encuentran son para esta partıculaimaginaria. Para encontrar la trayectoria de las partıculas originales con respecto al sistema inercial original, esnecesario devolverse tomando las Ecs. (12.2, 12.7) junto con las soluciones que encontremos para r. No obstante,si ocurre que m1 ≪ m2 entonces tanto la trayectoria como la masa imaginarias van a ser muy semejantes a latrayectoria y masa real de m1.

Ahora queremos construır un Hamiltoniano equivalente para cuantizar mas adelante. Usando (12.6) suponiendoque U solo depende de r, podemos calcular los momentos conjugados asociados a las componentes de R y de r,los cuales estan dados por

Pi =∂L

∂Xi

=∂

∂Xi

[1

2MXkXk +

1

2µxkxk − V (r)

]=

1

2MδikXk +

1

2MXkδik =MXi

pi =∂L

∂xi=

∂xi

[1

2MXkXk +

1

2µxkxk − V (r)

]= µxi

tenemos entonces que

P = MR = m1r1 +m2r2 = p1 + p2 (12.10)

p = µr =m1m2

m1 +m2(r2 − r1) =

m1m2r2 −m2m1r1m1 +m2

=m1p2 −m2p1

m1 +m2(12.11)

p

µ=

p2

m2− p1

m1(12.12)

P es el momento total y p es el momento relativo de las dos partıculas. El Hamiltoniano clasico se escribe como

H (R,P, r,p) =P2

2M+

p2

2µ+ V (r) (12.13)

empleando las ecuaciones de Hamilton encontramos que

P = 0 ; p = −∇V (r) (12.14)

2Desde el punto de vista Newtoniano esto se puede ver por el hecho de que el sistema esta aislado, de modo que el centro de masano puede estar acelerado. En terminos de simetrıas, se dice que el sistema tiene invarianza traslacional que conduce a la conservaciondel momento lineal.

Page 346: Mecanica Cuantica: Notas de Clase

346 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

la primera ecuacion nos dice que el centro de masa tiene movimiento rectilıneo uniforme como ya se habia obser-vado. La segunda ecuacion es la segunda ley de Newton aplicada a la partıcula imaginaria de masa µ. Puesto queel centro de masa es tambien inercial, podemos ubicarnos allı para ver las ecuaciones de movimiento, en cuyo casoel Hamiltoniano queda

H (r,p) =p2

2µ+ V (r) (12.15)

que es el equivalente al Lagrangiano (12.8) para la partıcula µ con posicion r y momento p (excepto que yaasumimos que el potencial solo depende de r). Notese que el primer termino a la derecha de las Ecs. (12.6, 12.13)junto con la primera de las Ecs. (12.14) nos permite interpretar al par R,P como variables conjugadas a unasegunda partıcula imaginaria de masa M y que viaja a la velocidad constante del centro de masa ocupando paratodo tiempo la posicion del centro de masa3.

Tambien se observa que la Ec. (12.12) nos dice que la velocidad p/µ de la partıcula imaginaria es igual a ladiferencia entre la velocidades de las dos partıculas es decir su velocidad relativa, lo cual es consistente con derivarla primera de las Ecs. (12.1) con respecto al tiempo.

12.2. Reduccion del problema de dos cuerpos en mecanica cuantica

Cuando se realiza un proceso de cuantizacion no es obvio a priori que el problema de dos cuerpos se reduzcaal problema de un solo cuerpo. La razon estriba en que debemos cuantizar las variables asociadas a las partıculasreales, es decir debemos cuantizar (R1,P1) y (R2,P2), despues de esto podemos pasar a las coordenadas de centrode masa que denotamos por (RC ,PC) y las coordenadas relativas (Rr,Pr). Sin embargo, para poder interpretarconsistentemente estas nuevas coordenadas como equivalentes a dos partıculas imaginarias, es necesario que dichasnuevas coordenadas sean canonicas (es decir que obedezcan las reglas canonicas de conmutacion). Adicionalmente,para que el movimiento de estas dos partıculas imaginarias se pueda desacoplar, es necesario que las variables(RC ,PC) conmuten con las variables (Rr,Pr). Veremos sin embargo, que estas condiciones sı se satisfacen para elproblema cuantico de dos cuerpos que interactuan con una fuerza central, de modo que la reduccion al problemade dos cuerpos desacoplados tambien es posible en mecanica cuantica.

Asociaremos los operadores R1,P1 y R2,P2 que describen la posicion y el momento de las dos partıculas yque satisfacen las relaciones canonicas

[P

(i)j , P (k)

m

]=[X

(i)j ,X(k)

m

]= 0 ;

[X

(i)j , P (k)

m

]= δjmδiki~ ; i, k = 1, 2 ; j,m = 1, 2, 3 (12.16)

donde i, k rotulan partıculas en tanto que j,m rotulan componentes. Definimos ahora los observables RC y Rr enforma analoga a las Ecs. (12.1)

RC =m1R1 +m2R2

m1 +m2; Rr = R2 −R1 (12.17)

y los momentos tienen expresiones de la forma (12.10, 12.11)

PC = P1 +P2 ; Pr =m1P2 −m2P1

m1 +m2(12.18)

los conmutadores entre las componentes de RC , Rr,PC ,Pr se pueden calcular con base en las definiciones (12.17,12.18) y las reglas de conmutacion (12.16) y se obtiene

[X

(i)j , X(k)

m

]=

[P

(i)j , P (k)

m

]= 0 ;

[X

(i)j , P (k)

m

]= δjmδiki~ ; i, k = 1, 2 ; j,m = 1, 2, 3

X(1)j ≡ (RC)j ; X

(2)j ≡ (Rr)j ; P

(1)j ≡ (PC)j ; P

(2)j ≡ (Pr)j

3En sıntesis hemos cambiado el problema de dos cuerpos (reales) acoplados por el problema de dos cuerpos (imaginarios) totalmentedesacoplados.

Page 347: Mecanica Cuantica: Notas de Clase

12.2. REDUCCION DEL PROBLEMA DE DOS CUERPOS EN MECANICA CUANTICA 347

es decir tanto el par RC ,PC , como el par Rr,Pr obedecen reglas canonicas de conmutacion. Ademas todoobservable del conjunto RC ,PC conmuta con todo observable del conjunto Rr,Pr.

Lo anterior nos permite interpretar al par RC ,PC , y al par Rr,Pr como los observables posicion y momentode dos partıculas ficticias distintas y desacopladas, al igual que en el caso clasico.

12.2.1. Autovalores y autofunciones del Hamiltoniano

Usando las reglas de cuantizacion, el Hamiltoniano para dos cuerpos sometidos a una fuerza central esta dadopor

H =P2

1

2m1+

P22

2m2+ V (R2 −R1)

teniendo en cuenta que este Hamiltoniano no acopla observables de momento con observables de posicion, el calculopara llegar del conjunto (R1,P1,R2,P2) al conjunto (RC ,PC ,Rr,Pr) es identico al del caso clasico puesto quetodos los productos que aparecen conmutan. El resultado es entonces totalmente analogo a (12.13)

H =P2C

2M+

P2r

2µ+ V (Rr)

este Hamiltoniano se puede separar en la forma

H = HC +Hr ; HC ≡ P2C

2M; Hr ≡

P2r

2µ+ V (Rr)

[HC ,Hr] = 0 ⇒ [HC ,H] = 0 ; [Hr,H] = 0

Asumiendo que H, HC , Hr son observables, tal conjunto tendra entonces una base comun de kets propios.

HC |ϕ〉 = EC |ϕ〉 ; Hr |ϕ〉 = Er |ϕ〉 ; H |ϕ〉 = E |ϕ〉H = HC +Hr ⇒ E = EC + Er (12.19)

consideremos la base |rC , rr〉, donde los elementos de esta base son vectores propios comunes a los observablesRC y Rr. En esta base, un estado se representa por la funcion de onda ϕ (rC , rr) que es funcion de seis variables.Los operadores RC y Rr se representan por multiplicacion de las funciones de onda por las variables rC y rrrespectivamente, en tanto que PC y Pr se representan por los gradientes

PC → −i~∇C ≡ −i~(

∂xC,1,

∂xC,2,

∂xC,3

)

Pr → −i~∇r ≡ −i~(

∂xr,1,

∂xr,2,

∂xr,3

)

el espacio de estados E puede ser considerado como el producto tensorial

E = ErC ⊗ Errdonde los espacios ErC , Err estan asociados a RC y Rr respectivamente. HC y Hr son entonces extensiones a Ede Hamiltonianos originalmente definidos en ErC y Err respectivamente. Podemos entonces encontrar una base |ϕ〉que cumple las Ecs. (12.19) en la forma siguiente4

|ϕ〉 = |ϕC〉 ⊗ |ϕr〉 ; |ϕC〉 ∈ ErC ; |ϕr〉 ∈ Err (12.20)

HC |ϕC〉 = EC |ϕC〉 ; Hr |ϕr〉 = Er |ϕr〉 ; H |ϕ〉 = (EC + Er) |ϕ〉 (12.21)

4El hecho de que |ϕ〉 sea el producto tensorial de un vector en EC por otro vector en Er, es consecuencia de que el estado resultantees una simple yuxtaposicion de los estados factor, debido a que las dos partıculas (ficticias) asociadas a cada estado |ϕC〉 y |ϕr〉 estandesacopladas, es decir no son interactuantes (ver seccion 6.1.1, pag. 245).

Page 348: Mecanica Cuantica: Notas de Clase

348 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

las dos primeras ecuaciones se pueden escribir en la base |rC〉 y |rr〉 respectivamente y se obtiene

− ~2

2M∇2CϕC (rC) = ECϕC (rC) (12.22)

[− ~2

2µ∇2

r + V (rr)

]ϕr (rr) = Erϕr (rr) (12.23)

la Ec. (12.22) muestra que la partıcula equivalente para la descripcion del centro de masa es libre como en lamecanica clasica. Sus soluciones son del tipo onda plana

ϕC (rC) =1

(2π~)3/2ei~pC ·rC ; EC =

p2C

2M≥ 0

el espectro de energıa es no negativo y contınuo y corresponde a la energıa cinetica del movimiento del sistemacomo un todo.

La Ec. (12.23) describe la dinamica de la partıcula imaginaria de masa µ con posicion equivalente a la posicionrelativa entre las dos partıculas. Describe entonces el comportamiento del sistema de dos partıculas en el sistemade referencia del centro de masa. Si el potencial solo depende de |r2 − r1| y no de la direccion de este vectorrelativo, la partıcula µ estara sujeta a un potencial central V (r). El problema se reduce entonces a resolver ladinamica de la partıcula µ.

El momento angular del sistema es

J = L1 + L2 ; L1 = R1 ×P1 ; L2 = R2 ×P2

se puede demostrar que este momento angular total tambien se puede escribir como

J = LC + Lr ; LC = RC ×PC ; Lr = Rr ×Pr

Adicionalmente, se puede demostrar que LC y Lr satisfacen las reglas de conmutacion de un momento angular.Naturalmente, las componentes de LC conmutan con las de Lr. Una vez mas, estas propiedades nos permiteninterpretar consistentemente a LC y a Lr como momentos angulares de dos partıculas cuanticas imaginariasdesacopladas.

12.3. El problema clasico de una partıcula sometida a una fuerza central

Asumamos una partıcula clasica sometida a una fuerza de la forma5

F = −∇V (r) = −dVdr

ur

dado que la fuerza es paralela al vector posicion (siempre que el origen se elija en el centro de fuerza) tenemosque ~τ = r × F = 0 y puesto que ~τ = dL/dt, se tiene que L = cte. El momento angular clasico es entonces unaconstante de movimiento para una partıcula clasica sometida a una fuerza central. La trayectoria esta contenidaentonces en un plano que pasa por el centro de fuerzas y que es perpendicular al momento angular. La velocidadse puede descomponer en una componente radial (paralela a r) y una transversal (perpendicular a r). La velocidadradial tiene como magnitud

vr =dr

dt

y la magnitud de la velocidad tangencial esta dada por

|vθ| = |v sin δ| = |ur × v| = 1

r|r× v|

5De aquı en adelante simplificaremos la notacion y usaremos r,p en lugar de rr y pr para las variables dinamicas fundamentalesdel problema de una partıcula.

Page 349: Mecanica Cuantica: Notas de Clase

12.3. EL PROBLEMA CLASICO DE UNA PARTICULA SOMETIDA A UNA FUERZA CENTRAL 349

siendo δ el angulo entre ur y v. El modulo del momento angular es

|L| = |r× µv| = µr |vθ| ⇒

|vθ| =|L|µr

la energıa total (cinetica mas potencial) es

E =1

2µv2 + V (r) =

1

2µv2

r +1

2µv2

θ + V (r)

E =1

2µv2

r +1

( |L|µr

)2

+ V (r)

E =1

2µv2

r +L2

2µr2+ V (r) (12.24)

El Hamiltoniano clasico en coordenadas esfericas se escribe como

H =p2r2µ

+1

2µr2

(p2ϕ

sin2 θ+ p2θ

)+ V (r)

L2 =p2ϕ

sin2 θ+ p2θ

La energıa cinetica en (12.24) se dividio en dos terminos: la energıa cinetica radial y la transversal. Notese que ladependencia angular del Hamiltoniano se puede absorber en L2 teniendo en cuenta que esta es una constante demovimiento

H =p2r2µ

+L2

2µr2+ V (r) (12.25)

la absorcion de los angulos y sus momentos conjugados en L2 esta relacionada con el hecho de que V (r) no dependede los angulos. El Hamiltoniano es la energıa del sistema en este caso como se aprecia al comparar (12.24) con(12.25). Podemos entonces tratar al Hamiltoniano como funcion solo de r y pr tomando a L2 como parametro.Tenemos entonces solo dos ecuaciones de Hamilton

r =∂H

∂pr; pr = −∂H

∂r

tomando el Hamiltoniano (12.25) estas ecuaciones quedan

dr

dt=

prµ

;dprdt

=L2

µr3− dV

dr

d2r

dt2=

1

µ

dprdt

; µd2r

dt2=

L2

µr3− dV

dr(12.26)

si definimos el potencial efectivo

Veff (r) = V (r) +L2

2µr2

el Hamiltoniano (12.25) y las ecuaciones de movimiento (12.26) quedan

H =p2r2µ

+ Veff (r) ; µd2r

dt2= −dVeff

dr

que es equivalente a un problema unidimensional sujeto a la interaccion descrita por el potencial efectivo (teniendoen cuenta que r va entre 0 e ∞). Veremos como se traducen estas caracterısticas en la mecanica cuantica.

Page 350: Mecanica Cuantica: Notas de Clase

350 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

12.4. Hamiltoniano cuantico

De aquı en adelante nos concentraremos en la ecuacion (12.23) de valores propios para el Hamiltoniano en larepresentacion de la coordenada relativa |rr〉. Por tanto simplificamos su notacion en la forma

[− ~2

2µ∇2 + V (r)

]ϕ (r) = Eϕ (r) (12.27)

puesto que el potencial V solo depende de la distancia r de la partıcula al origen, las coordenadas esfericas sonmas adecuadas para el problema. El Laplaciano en coordenadas esfericas se escribe

∇2 =1

r

∂2

∂r2r +

1

r2

(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)(12.28)

esta expresion da el Laplaciano solo para r 6= 0 y no esta definida para r = 0, lo cual se debe a la posicionprivilegiada del origen en coordenadas esfericas (el origen corresponde a r = 0 para cualquier valor de θ, ϕ), masadelante impondremos condiciones sobre la funcion de onda en el origen. De la Ec. (11.13) vemos que el Laplaciano(12.28) se puede escribir en terminos de L2

∇2 =1

r

∂2

∂r2r − L2

~2r2(12.29)

de modo que el Hamiltoniano cuantico se puede escribir

H = − ~2

2µ∇2 + V (r) = − ~2

(1

r

∂2

∂r2r − L2

~2r2

)+ V (r)

H = − ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r) (12.30)

que es el analogo del Hamiltoniano clasico (12.25). El operador diferencial L2 contiene toda la dependencia angular.El problema de valores propios del Hamiltoniano queda escrito en la forma

[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]ϕ (r, θ, ϕ) = E ϕ (r, θ, ϕ) (12.31)

12.5. Solucion general del problema de valores propios

Puesto que las componentes de L solo actuan en la variables angulares, conmutan con todos los operadoresque solo dependan de r. Ademas, sabemos que Li conmuta con L2. Por tanto de acuerdo con (12.30), las trescomponentes de L conmutan con el Hamiltoniano y como no dependen explıcitamente del tiempo, son todasconstantes de movimiento en el sentido cuantico (seccion 5.8.2)

[H,L] = 0 ;∂L

∂t=d 〈L〉dt

= 0

por tanto H es un operador escalar con respecto a las rotaciones alrededor del origen, lo cual proviene de lainvarianza del potencial bajo rotaciones alrededor del origen. Por supuesto H tambien conmuta con L2. Sinembargo, aunque tenemos a nuestra disposicion cinco constantes de movimiento (L, L2,H), no podemos usarlastodas para solucionar el problema de valores propios (12.31) ya que no todos estos operadores conmutan entresı. Solo podremos usar L2, L3 (u otra componente) y H. Si asumimos que H, L2, L3 son observables, existirauna base comun de funciones propias en el espacio Er de una partıcula. Por lo tanto podemos sin retringir lageneralidad del problema requerir que la funciones de onda en (12.31) tambien sean funciones de onda de L2 y L3

Hϕ (r) = Eϕ (r) ; L2ϕ (r) = l (l + 1) ~2ϕ (r) ; L3ϕ (r) = m~ϕ (r) (12.32)

Page 351: Mecanica Cuantica: Notas de Clase

12.5. SOLUCION GENERAL DEL PROBLEMA DE VALORES PROPIOS 351

pero ya conocemos la forma de la parte angular de las autofunciones comunes de L2 y L3 (seccion 11.4). La Ec.(11.45) nos indica que estas funciones son de la forma

ϕ (r) = Rlk (r)Ylm (θ, ϕ) (12.33)

donde este ϕ (r) es solucion de las dos ultimas ecuaciones (12.32) sin importar la forma de la parte radial. Portanto, solo queda resolver el problema de determinar R (r) a fin de que ϕ (r) sea autofuncion del Hamiltoniano.

12.5.1. La ecuacion radial

Si sustituımos (12.33) en la Ec. (12.31) de valores propios del Hamiltoniano

[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]Rlk (r)Ylm (θ, ϕ) = E Rlk (r)Ylm (θ, ϕ)

Ylm (θ, ϕ)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rlk (r) +Rlk (r)

L2Ylm (θ, ϕ)

2µr2= E Rlk (r)Ylm (θ, ϕ)

y teniendo en cuenta que los armonicos esfericos son autofunciones de L2 con valor propio l (l + 1) ~2 se tiene

Ylm (θ, ϕ)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rlk (r) +Rlk (r)

l (l + 1) ~2Ylm (θ, ϕ)

2µr2= E Rlk (r)Ylm (θ, ϕ)

la ecuacion radial toma finalmente la forma[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Rlk (r) = El,k Rlk (r) (12.34)

en realidad una solucion de (12.34), sustituıda en (12.33) no necesariamente representa una solucion de la ecuacionde valores propios (12.27) del Hamiltoniano. Esto se debe a que la expresion (12.28) para el Laplaciano no es nece-sariamente valida en r = 0. Debemos por tanto asegurarnos que la solucion R (r) de (12.34) sea lo suficientementeregular en el origen para que (12.33) sea en realidad solucion de (12.27). Notese ademas que aunque la Ec. (12.34)no depende de los angulos, sı depende de l, en realidad para cada valor de l tenemos un operador diferente en(12.34).

De las Ecs. (12.32), podemos decir que el problema de valores propios de L2, L3,H lo resolvemos para cada parde valores fijos de l y m. Esto implica que en el espacio de estados Er resolvemos el problema para cada subespacioE (l,m) asociado a valores fijos de l y m. La Ec. (12.34) nos muestra que cuando estudiamos la parte radial (que esla unica desconocida) de las funciones propias del Hamiltoniano, la ecuacion asociada depende de l pero no de m,es decir la ecuacion (12.34) es identica para todos los 2l + 1 subespacios E (l,m) con l fijo. Denotaremos por El,klos autovalores del operador Hl definido por (12.34) y que correspondera a los autovalores del Hamiltoniano dentrode un subespacio dado E (l,m). El ındice k (discreto o contınuo) indica los diferentes valores propios asociadosal mismo numero cuantico l, los valores posibles de k indican la dimensionalidad de cada subespacio E (l,m). En(12.34) hemos denotado las funciones propias de Hl con los ındices Rl,k (r). Debe notarse sin embargo que losındices de la funcion radial no tienen que ser los mismos de los valores propios El,k puesto que podrıamos tenervarias funciones radiales propias de Hl para un valor propio dado El,k en cuyo caso la funcion radial requerirıaun ındice adicional. Sin embargo, demostraremos mas adelante que para cada l, k solo existe una funcion radiallinealmente independiente.

Por otra parte, para la Ec. (12.34)

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Rlk (r) = El,k Rlk (r) (12.35)

Definimos el cambio de variable

Rl,k (r) =1

rul,k (r) (12.36)

Page 352: Mecanica Cuantica: Notas de Clase

352 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

y multiplicamos a ambos lados por r

r

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

] [1

rul,k (r)

]= rEl,k

1

rul,k (r)

r

− ~2

2µr

d2

dr2

[r1

rul,k (r)

]+l (l + 1) ~2

2µr2

[1

rul,k (r)

]+ V (r)

1

rul,k (r)

= El,k ul,k (r)

− ~2

d2

dr2ul,k (r) +

l (l + 1) ~2

2µr2ul,k (r) + V (r)ul,k (r)

= El,k ul,k (r)

quedando finalmente − ~2

d2

dr2+l (l + 1) ~2

2µr2+ V (r)

ul,k (r) = El,k ul,k (r) (12.37)

de nuevo la Ec. (12.37) es analoga a un problema unidimensional de un partıcula de masa µ sometida al potencialefectivo Veff definido por

Veff = V (r) +l (l + 1) ~2

2µr2(12.38)

teniendo en cuenta que r solo puede tomar valores no negativos. El termino l (l + 1) ~2/(2µr2

)es siempre positivo

de modo que si correspondiera a una interaccion real corresponderıa a una fuerza repulsiva, por este motivo seconoce como potencial centrıfugo. Debe tenerse en cuenta sin embargo, que el termino centrıfugo no corresponde auna verdadera interaccion sino a una porcion de la energıa cinetica (energıa cinetica transversal). Cuando l = 0 eltermino centrıfugo esta ausente. Para una interaccion Coulombiana V (r) = −e2/r, si l 6= 0 el termino centrıfugodomina para valores pequenos de r de modo que el potencial efectivo es repulsivo a cortas distancias.

12.5.2. Comportamiento de la solucion radial en el origen

Ya hemos mencionado que debemos examinar las soluciones R (r) de la ecuacion radial (12.34) en el origenpara garantizar que estas tambien sean soluciones de la Ec. (12.27) puesto que en el paso de (12.27) a (12.34) seha usado el Laplaciano en coordenadas esfericas (12.28) que no esta definido en el origen.

Asumiremos que el potencial V (r) es tal que

lımr→0

r2V (r) = 0 (12.39)

es decir, permanece finito o diverge menos rapido que 1/r2. Esta hipotesis es valida en la mayorıa de los casosy en particular para el potencial de Coulomb. Consideremos una solucion de la Ec. (12.34) asumamos que en elorigen se comporta en la forma

lımr→0

Rl,k (r) ∼ Crs (12.40)

sustituyendo (12.40) en (12.34) tenemos

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Crs = El,k Cr

s

− ~2

2µr

d2

dr2rs+1 +

l (l + 1) ~2

2µr2rs + V (r) rs = El,k r

s

−s (s+ 1)~2

2µrrs−1 +

l (l + 1) ~2

2µr2rs + V (r) rs = El,k r

s

−s (s+ 1)~2

2µrs−2 +

l (l + 1) ~2

2µrs−2 + [V (r)− El,k] r

s = 0

rs−2

−s (s+ 1)

~2

2µ+l (l + 1) ~2

2µ+ [V (r)− El,k] r

2

= 0

Page 353: Mecanica Cuantica: Notas de Clase

12.6. ESTADOS ESTACIONARIOS DE UNA PARTICULA EN UN POTENCIAL CENTRAL 353

asumimos que r 6= 0 de modo que

−s (s+ 1)~2

2µ+l (l + 1) ~2

2µ+ [V (r)− El,k] r

2 = 0

tomando el lımite cuando r → 0 y teniendo en cuenta la condicion (12.39)

−s (s+ 1) + l (l + 1) = 0

(l − s) (s+ l + 1) = 0 (12.41)

por tanto tenemos dos soluciones posibles

s = l o s = − (l + 1) (12.42)

es decir que para un valor propio dado El,k hay dos soluciones linealmente independientes de la ecuacion desegundo orden (12.34), que se comportan como rl y como 1/rl+1 en la vecindad del origen respectivamente. Lasolucion 1/rl+1 claramente diverge en el origen para todos los valores de l. Adicionalmente, se puede demostrarque la funcion Ylm (θ, ϕ) /rl+1 no es una solucion de la ecuacion de valores propios (12.27) para r = 0, esto se debea que el laplaciano de Ylm (θ, ϕ) /rl+1 involucra la l−esima derivada de δ (r). Por tales razones, la solucion 1/rl+1

debe ser descartada.De lo anterior las soluciones aceptables para (12.37) deben ir a cero en el origen para todo l ya que

lımr→0

ul,k (r) = lımr→0

[rRl,k (r)] ∼ Crl+1 (12.43)

de modo que a la Ec. (12.37) se le debe agregar la condicion

ul,k (0) = 0 (12.44)

en la Ec. (12.37) r va entre 0 e infinito. Sin embargo, es posible asumir el problema como un problema unidi-mensional equivalente en donde r tome todos los valores reales pero con potencial efectivo infinito para valoresnegativos de r. En tal caso, la funcion de onda toma valores identicamente ceros en la parte negativa de r y lacondicion (12.44) asegura la continuidad de la funcion de onda en r = 0.

12.6. Estados estacionarios de una partıcula en un potencial central

Hemos visto que cuando el potencial V (r) es independiente de θ y ϕ podemos requerir que las autofuncionesdel Hamiltoniano sean tambien autofunciones de L2 y L3. Esto permite aseverar que la dependencia angular vienedada por las autofunciones de L2 y L3 es decir los armonicos esfericos

ϕl,m,k (r) = Rl,k (r)Ylm (θ, ϕ) =1

rul,k (r)Ylm (θ, ϕ) (12.45)

por tanto, la ecuacion de valores propios del Hamiltoniano que involucra a r, θ, ϕ puede ser reemplazada por unaecuacion diferencial que solo involucra a r y que depende del parametro l, Ec. (12.37), dicha ecuacion junto conla condicion (12.44) nos dictamina la dependencia radial de la funcion de onda. Notese que estas caracterısticasemulan el comportamiento clasico.

Las funciones ϕl,m,k (r, θ, ϕ) deben ser de cuadrado integrable∫

|ϕl,m,k (r, θ, ϕ)|2 r2 dr dΩ = 1

la estructura de la funcion de onda Ec. (12.45) permite separar la parte radial y la angular∫

|ϕl,m,k (r, θ, ϕ)|2 r2 dr dΩ =

∫ ∞

0r2 dr |Rl,m,k (r)|2

∫|Ylm (θ, ϕ)|2 dΩ = 1

Page 354: Mecanica Cuantica: Notas de Clase

354 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

y puesto que los armonicos esfericos estan normalizados entonces la funcion radial esta normalizada por aparte

∫ ∞

0r2 dr |Rl,m,k (r)|2 =

∫ ∞

0dr |ul,m,k (r)|2 = 1 (12.46)

en realidad es conveniente aceptar en algunos casos autofunciones que no sean de cuadrado integrable. Esto ocurrecuando al menos parte del espectro de H es contınuo, en cuyo caso requerimos que las funciones de onda seanortonormales en el sentido extendido es decir

∫ ∞

0r2 dr R∗

l,k′ (r)Rl,k (r) =

∫ ∞

0dr u∗l,k′ (r)ul,k (r) = δ

(k − k′

)(12.47)

siendo k un ındice contınuo.En las Ecs. (12.46, 12.47), los integrandos convergen en su lımite inferior r = 0 debido a la condicion (12.44).

Esto es fısicamente necesario ya que la probabilidad de encontrar a la partıcula en cualquier volumen de dimensionfinita permanece finita (en particular para un volumen que contiene al origen)6. Por tanto, es solo debido alcomportamiento de la funcion de onda en r → ∞ que la integral (12.47) diverge en k = k′ cuando el espectro escontınuo.

Las Ecs. (12.45) nos dicen que las funciones propias del Hamiltoniano de una partıcula inmersa en un poten-cial central V (r) dependen de por lo menos tres ındices l,m, k (k podrıa representar varios ındices contınuos odiscretos). La funcion ϕl,m,k (r) en (12.45) es autofuncion simultanea de H,L2, L3 con autovalores El,k, l (l + 1) ~2

y m~. A k se le conoce como numero cuantico radial, l se denomina numero cuantico azimutal y m el numerocuantico magnetico. La parte radial Rl,k (r) = ul,k/r de la autofuncion ası como el autovalor El,k no dependen delnumero cuantico magnetico m y estan dadas por la ecuacion radial (12.37) junto con la condicion (12.44). Porotro lado, la parte angular de la funcion de onda (armonicos esfericos) depende de l y m pero no de k, dicha parteangular es independiente de la forma del potencial V (r).

12.6.1. Degeneracion de los niveles de energıa

Consideraremos ahora el problema de la degeneracion de los niveles de energıa. Las 2l+1 funciones ϕl,m,k (r, θ, ϕ)con l y k fijos y m variando entre −l y l son autofunciones de H con el mismo valor propio El,k, dado que estas2l+1 funciones corresponden a valores propios diferentes de L3 seran claramente ortogonales. En consecuencia haypor lo menos un degeneracion de orden 2l+1 del valor propio El,k, tal degeneracion es independiente de la formadel potencial y por esta razon se denomina una degeneracion esencial. La degeneracion esencial se debe al hechode que H contiene a L2 pero no a L3 y a que el Hamiltoniano es siempre invariante rotacional (escalar). Puestoque H contiene a L2 pero no a L3, se tiene que m no aparece en la ecuacion radial que proviene del problema devalores propios del Hamiltoniano pero sı aparece l.

No obstante, es posible que El,k correspondiente a la ecuacion radial con operador Hl coincida con El′,k′ de otraecuacion radial (l 6= l′). Esto ocurre para ciertos potenciales, y se conoce como degeneraciones accidentales. Enparticular, el potencial de Coulomb que describe a los atomos hidrogenoides exhibe degeneraciones accidentales.

La ecuacion radial (12.37) para un l fijo, al ser una ecuacion de segundo orden posee a priori dos solucioneslinealmente independientes. Sin embargo, la condicion (12.44) ha surgido de eliminar una de ellas puesto que sedescarto el comportamiento del tipo lımr→0Rl,k (r) = 1/rl+1. Por tanto solo tenemos una solucion linealmenteindependiente para cada El,k. Debemos tambien considerar el comportamiento de las soluciones para r → ∞. SiV (r) → 0 cuando r → ∞ los valores de El,k para los cuales la solucion clasica es acotada ( y que cuanticamentecumplen la condicion 12.44) forman un conjunto discreto, como veremos mas adelante para el atomo de Hidrogeno.

Si asumimos que los operadores H,L2 y L3 son observables, la discusion anterior nos muestra que constituyenun C.S.C.O. ya que para valores fijos de El,k solo hay una funcion radial linealmente independiente, y paral y m fijos la funcion angular (armonico esferico) es unica. Por tanto, para un conjunto dado de autovalores

6Notese que si no se hubiera descartado la posibilidad de que lımr→0Rl,k (r) ∼ 1/rl+1, hubiesemos tenido comportamiento divergenteen el origen.

Page 355: Mecanica Cuantica: Notas de Clase

12.6. ESTADOS ESTACIONARIOS DE UNA PARTICULA EN UN POTENCIAL CENTRAL 355

El,k, l (l + 1) ~2,m~ existe una unica funcion normalizada (dentro de factores de fase) del tipo ϕl,m,k (r). Elautovalor de L2 dictamina la forma especıfica de la ecuacion radial, el autovalor de H nos determina la funcionradial Rl,k (r) de forma unica y m determina junto con l el armonico esferico (solucion angular).

Page 356: Mecanica Cuantica: Notas de Clase

Capıtulo 13

Atomos hidrogenoides

El problema de mayor interes de la interaccion central entre dos cuerpos microscopicos lo constituyen los atomosHidrogenoides consistentes en un nucleo y un electron. Tal es el caso del atomo de Hidrogeno y sus isotopos eldeuterio y el tritio. Ası mismo tambien son atomos hidrogenoides los iones con un solo electron como el He+, Li++

etc. Veremos mas adelante que los atomos alcalinos (con un solo electron en el ultimo nivel de energıa) se puedentratar tambien como Hidrogenoides si consideramos que los electrones internos actuan como un apantallamientodel nucleo y que el sistema nucleo-electrones internos actua como un “nucleo efectivo” para el electron externo.De momento trabajaremos con el caso mas simple.

13.1. El atomo de Hidrogeno

El atomo de Hidrogeno consiste en un electron y un proton que interactuan de manera esencialmente elec-trostatica, es decir bajo un potencial de la forma

V (r) = − q2

4πε0r= −e

2

r;

q2

4πε0≡ e2

siendo r la distancia entre el proton y el electron, q corresponde a la carga electronica en unidades SI en tantoque e es el valor en unidades cgs. Numericamente tenemos los siguientes valores aproximados para la masa mp delproton, me del electron y la carga q del proton

mp = 1,7× 10−27kg ; me = 0,91× 10−30kg ; q = 1,6× 10−19Coulombs

puesto que se trata de dos partıculas sujetas a una interaccion central, podemos reducirlo al problema de unapartıcula libre con masa mp + me y con la dinamica del centro de masa, junto con una partıcula de masa µsometida a una fuerza central y donde el vector posicion de la partıcula µ, es el vector posicion relativo entre lasdos partıculas reales (las partıculas imaginarias estan desacopladas). Usaremos un Hamiltoniano del tipo (12.15)

H (r,p) =p2

2µ− e2

r(13.1)

puesto que mp ≫ me la masa reducida del sistema sera practicamente la masa del electron

µ ≡ memp

mp +me=

me

1 + memp

∼= me

(1− me

mp

)∼= me

y el centro de masa del sistema esta practicamente en la posicion del proton. Por tanto la partıcula imaginariaasociada al centro de masa, tiene practicamente las caracterısticas del proton (la masa del proton es casi la masatotal del sistema y el centro de masa esta practicamente en la posicion del proton). La partıcula imaginaria de

356

Page 357: Mecanica Cuantica: Notas de Clase

13.2. PROBLEMA DE VALORES PROPIOS DEL ATOMO DE HIDROGENO 357

masa reducida tiene practicamente las caracterısticas del electron, ya que la masa reducida del sistema es casila masa del electron y la posicion del electron con respecto al centro de masa es practicamente su posicion conrespecto al proton. Adoptaremos la posicion de que el proton esta en el centro de masa y que el electron es lapartıcula relativa.

Con el fin de fijar el valor de ciertos parametros, usaremos el modelo semi-clasico de Bohr que si bien no escompatible con nuestros postulados, permitira definir conceptos y parametros utiles para el estudio de los espectrosatomicos. Dentro de este modelo el electron viaja en una orbita circular de radio r alrededor del proton, la energıatotal es la energıa cinetica mas la potencial electrostatica y obedece la segunda ley de Newton. Adicionalmente,el momento angular del electron esta cuantizado en unidades de ~, estas suposiciones se condensan en

E =1

2µv2 + V (r) ; µ

v2

r= −∇V (r) ; l = n~ ; V (r) = −e

2

r

E =1

2µv2 − e2

r; µ

v2

r=e2

r2; µvr = n~ ; n entero positivo

las orbitas posibles son solo aquellas que cumplen la regla de cuantizacion del momento angular. Con este postuladoBohr explico la existencia de niveles discretos de energıa. Calculemos los valores cuantizados de En, rn y vn. Paraello primero se calcula la energıa de ionizacion EI que es la energıa que se le debe dar al atomo de Hidrogeno ensu estado base para remover su electron. Tambien se pueden estimar con base en el modelo, el radio del atomopara el estado base (radio de Bohr a0) y la velocidad del electron v0 en el estado base, tales cantidades dan

EI =µe4

2~2; a0 =

~2

µe2; v0 =

e2

~(13.2)

con estos parametros de entrada los valores cuantizados de En, rn y vn son

En = − 1

n2EI ; rn = n2a0 ; vn =

1

nv0 (13.3)

los valores experimentales de EI y de los niveles de energıa En estuvieron en concordancia con la teorıa de Bohr.Un estimativo de la energıa de ionizacion y del radio que caracteriza las dimensiones atomicas es

EI ∼= 13,6eV , a0 ∼= 0,52 A

puede verse que el principio de incertidumbre explica la existencia de un estado base estable y permite ademas laestimacion del orden de magnitud de la energıa base y de la extension espacial de su funcion de onda.

13.2. Problema de valores propios del atomo de Hidrogeno

Dado que el potencial es central, podemos aplicar los resultados del capıtulo 12. En la representacion |r〉, elHamiltoniano (13.1) cuantizado esta dado por

H = − ~2

2m∇2 − e2

r(13.4)

y la ecuacion de valores propios del Hamiltoniano es

[− ~2

2m∇2 − e2

r

]ϕ (r) = Eϕ (r)

la funcion propia ϕ (r) admite la forma

ϕl,m,k (r) =1

rul,k (r)Ylm (θ, ϕ)

Page 358: Mecanica Cuantica: Notas de Clase

358 CAPITULO 13. ATOMOS HIDROGENOIDES

donde ul,k (r) esta dado por la ecuacion (12.37)

[− ~2

d2

dr2+l (l + 1) ~2

2µr2− e2

r

]ul,k (r) = El,kul,k (r) (13.5)

a la cual le debemos agregar la condicion (12.44)

ul,k (0) = 0 (13.6)

El espectro de H posee una parte discreta (energıas negativas) y una parte contınua (energıas positivas). Elespectro contınuo esta asociado con el hecho de que para E > 0 la region accesible clasica no esta acotada, eneste caso las autofunciones asociadas no seran de cuadrado integrable. En contraste, para E < 0, la naturalezadiscreta del espectro esta asociada con el hecho de que la region accesible clasicamente es acotada, en tal caso lasfunciones propias son de cuadrado integrable.

Es comodo trabajar de modo que a0 y EI sean las unidades de longitud y energıa, lo cual se logra introduciendolos parametros adimensionales

ρ =r

a0; λl,k =

√−El,kEI

(13.7)

Vamos a examinar los estados acotados de energıa negativa por lo cual el signo negativo dentro del radical es dehecho necesario. Usando la primera de las Ecs. (13.7) en la ecuacion radial (13.5), esta se escribe como

[− ~2

d2

d (a0ρ)2 +

l (l + 1) ~2

2µ (a0ρ)2 − e2

a0ρ

]ul,k (ρ) = El,kul,k (ρ)

[− ~2

2µa20

d2

dρ2+l (l + 1) ~2

2µa20

1

ρ2− e2

a0ρ− El,k

]ul,k (ρ) = 0

multiplicando la ecuacion por −2µa20/~2 se obtiene

d2

dρ2− l (l + 1)

ρ2+

2µa0~2

e2

ρ+

2µa20~2

El,k

ul,k (ρ) = 0

y usando las Ecs. (13.2)

d2

dρ2− l (l + 1)

ρ2+

~2

(~2

µe2

)e2

ρ+

~2

(~2

µe2

)2

El,k

ul,k (ρ) = 0

d2

dρ2− l (l + 1)

ρ2+

2

ρ+

2~2

µe4El,k

ul,k (ρ) = 0

d2

dρ2− l (l + 1)

ρ2+

2

ρ−(−El,kEI

)ul,k (ρ) = 0

finalmente usando la segunda de las Ecs. (13.7) la ecuacion radial queda

[d2

dρ2− l (l + 1)

ρ2+

2

ρ− λ2l,k

]ul,k (ρ) = 0 (13.8)

Un analisis asintotico cualitativo del comportamiento de ul,k (ρ) nos permitira simplificar la forma de la Ec.(13.8). Cuando ρ → ∞, los terminos proporcionales a 1/ρ y 1/ρ2 se vuelven despreciables y la Ec. (13.8) seconvierte en [

d2

dρ2− λ2l,k

]ul,k (ρ) = 0

Page 359: Mecanica Cuantica: Notas de Clase

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 359

cuyas soluciones son e±ρλl,k . Sin embargo, mas adelante veremos que incluso en este lımite no se puede despreciarcompletamente a los terminos 1/ρ y 1/ρ2 lo cual nos llevara a soluciones del tipo ρne±ρλl,k .

No obstante, este analisis asintotico cualitativo permite encontrar una forma aproximada de la solucion espe-rada en la asıntota. Notese que la solucion eρλl,k es divergente en ρ → ∞ lo cual nos permite predecir que estetipo de solucion sera descartada. Todo lo anterior nos induce a realizar el siguiente cambio de variable

ul,k (ρ) = e−ρλl,kyl,k (ρ) (13.9)

naturalmente este cambio de variable no significa ninguna perdida de generalidad, ni descarta ningun tipo desolucion. Simplemente, parece simplificar a priori la forma funcional de la solucion que de antemano consideramoscomo aceptable. Realizando el cambio de variable (13.9) en la Ec. (13.8) nos queda

d2

dρ2

[e−ρλl,kyl,k (ρ)

]+

[− l (l + 1)

ρ2+

2

ρ− λ2l,k

]e−ρλl,kyl,k (ρ) = 0 (13.10)

calculamos la derivada

d2

dρ2

[e−ρλl,kyl,k (ρ)

]=

d

[−λl,ke−ρλl,kyl,k (ρ) + e−ρλl,k

dyl,k (ρ)

]

=

[(−λl,k)2 e−ρλl,kyl,k (ρ)− λl,ke

−ρλl,k dyl,k (ρ)

−λl,ke−ρλl,kdyl,k (ρ)

dρ+ e−ρλl,k

d2yl,k (ρ)

dρ2

]

= e−ρλl,k[λ2l,k − 2λl,k

d

dρ+

d2

dρ2

]yl,k (ρ)

reemplazando esta derivada en (13.10) se obtiene

e−ρλl,k[λ2l,k − 2λl,k

d

dρ+

d2

dρ2− l (l + 1)

ρ2+

2

ρ− λ2l,k

]yl,k (ρ) = 0

simplificando y reorganizando queda finalmente

d2

dρ2− 2λl,k

d

dρ+

[2

ρ− l (l + 1)

ρ2

]yl,k (ρ) = 0 (13.11)

y la condicion (13.6) queda

yl,k (0) = 0 (13.12)

13.3. Solucion de la ecuacion radial por series de potencias

13.3.1. Serie de potencias radial y relaciones de recurrencia

Consideraremos la expansion de yl,k (ρ) en series de potencias

yl,k (ρ) = ρs∞∑

q=0

cqρq (13.13)

donde por definicion c0 es el primer coeficiente no nulo en la expansion

c0 6= 0

Page 360: Mecanica Cuantica: Notas de Clase

360 CAPITULO 13. ATOMOS HIDROGENOIDES

La condicion (13.12) implica que s es estrictamente positivo. De modo que s es la mımima potencia de ρ queaparece en la expansion (13.13). Calculemos la primera y segunda derivada de la expansion (13.13)

dyl,k (ρ)

dρ=

d

∞∑

q=0

cqρq+s

=

∞∑

q=0

(q + s) cqρq+s−1 (13.14)

d2yl,k (ρ)

dρ2=

d

∞∑

q=0

(q + s) cqρq+s−1

=

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 (13.15)

reemplazando (13.13, 13.14, 13.15) en (13.11) resulta

d2yl,k (ρ)

dρ2− 2λl,k

dyl,k (ρ)

dρ+

[2

ρ− l (l + 1)

ρ2

]yl,k (ρ) = 0

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 − 2λl,k

∞∑

q=0

(q + s) cqρq+s−1 +

[2

ρ− l (l + 1)

ρ2

] ∞∑

q=0

cqρq+s = 0

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 − 2λl,k

∞∑

q=0

(q + s) cqρq+s−1 +

∞∑

q=0

2cqρq+s−1 − l (l + 1)

∞∑

q=0

cqρq+s−2 = 0

∞∑

q=0

[(q + s) (q + s− 1)− l (l + 1)] cqρq+s−2 +

∞∑

q=0

[2− 2λl,k (q + s)] cqρq+s−1 = 0

escribiendo separadamente el primer termino de la primera sumatoria

0 = [s (s− 1)− l (l + 1)] c0ρs−2 +

∞∑

q=1

[(q + s) (q + s− 1)− l (l + 1)] cqρq+s−2

+∞∑

q=0

[2− 2λl,k (q + s)] cqρq+s−1 (13.16)

para la primera sumatoria hacemos q′ = q − 1 de modo que

∞∑

q=1

[(q + s) (q + s− 1)− l (l + 1)] cqρq+s−2 =

∞∑

q′=0

[(q′ + s+ 1

) (q′ + s

)− l (l + 1)

]cq′+1ρ

q′+s−1 (13.17)

reemplazando (13.17) en (13.16) y teniendo en cuenta que los ındices son mudos resulta

0 = [s (s− 1)− l (l + 1)] c0ρs−2 +

∞∑

q=0

[(q + s+ 1) (q + s)− l (l + 1)] cq+1ρq+s−1

+

∞∑

q=0

2 [1− λl,k (q + s)] cqρq+s−1

[s (s− 1)− l (l + 1)] c0ρs−2 +

∞∑

q=0

[(q + s+ 1) (q + s)− l (l + 1)] cq+1 + 2 [1− λl,k (q + s)] cq ρq+s−1 = 0

para que la serie sea cero para todo ρ, es necesario y suficiente que cada coeficiente de la expansion sea cero locual nos conduce a

[s (s− 1)− l (l + 1)] c0 = 0

[(q + s+ 1) (q + s)− l (l + 1)] cq+1 + 2 [1− λl,k (q + s)] cq = 0 ; q = 0, 1, . . . ,∞

Page 361: Mecanica Cuantica: Notas de Clase

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 361

que se pueden reescribir como

(s− l − 1) (s+ l) c0 = 0 (13.18)

[(q + s+ 1) (q + s)− l (l + 1)] cq+1 = 2 [λl,k (q + s)− 1] cq ; q = 0, 1, . . . ,∞ (13.19)

y teniendo en cuenta que c0 6= 0 por definicion, la Ec. (13.18) nos dice que s solo puede tomar dos valores

s = l + 1 o s = −l

pero recordando que s debe ser estrictamente positivo para garantizar un comportamiento aceptable en el origen(condicion 13.12), el unico valor aceptable como solucion es

s = l + 1 (13.20)

Esto es consistente con la discusion de la seccion 12.5.2, Eq. (12.43). Reemplazando s = l+1 en (13.19) se obtiene

[(q + l + 2) (q + l + 1)− l (l + 1)] cq+1 = 2 [λl,k (q + l + 1)− 1] cq ; q = 0, 1, . . . ,∞

haciendo q′ = q + 1 esta relacion se convierte en

[(q′ + l + 1

) (q′ + l

)− l (l + 1)

]cq′ = 2

[λl,k

(q′ + l

)− 1]cq′−1 ; q′ = 1, 2, . . . ,∞

teniendo en cuenta que q′ es ındice mudo y reorganizando terminos se obtiene

q (q + 2l + 1) cq = 2 [(q + l)λl,k − 1] cq−1 ; q = 1, 2, . . . ,∞ (13.21)

la Ec. (13.21) define una relacion de recurrencia para los coeficientes de la expansion (13.13). Si fijamos c0 podemoscalcular todos los demas coeficientes con esta recurrencia. Por otro lado, de la Ec. (13.21) se obtiene

cqcq−1

=2 [(q + l)λl,k − 1]

q (q + 2l + 1)(13.22)

que claramente tiende a cero cuando q → 0, por tanto la serie converge para todo ρ (criterio del cociente paraseries). En consecuencia, hemos determinado para todo λl,k una solucion de (13.11) que satisface la condicion(13.12).

13.3.2. Condicion asintotica ρ → ∞ y truncamiento de la serie

Ya hemos mirado la condicion en el origen pero no en ρ → ∞. Si el termino entre parentesis a la derecha de(13.21) no es cero para ningun valor entero q, la expansion (13.13) sera una verdadera serie ya que la relacion derecurrencia generara infinitos coeficientes cq, para q grande podemos ver de (13.22) que

lımq→∞

cqcq−1

=2qλl,kq2

→ 2λl,kq

(13.23)

ahora la expansion en series de potencias de la funcion e2ρλl,k es

e2ρλl,k =

∞∑

q=0

dqρq ; dq =

(2λl,k)q

q!⇒ dq

dq−1=

2λl,kq

(13.24)

comparando (13.23) con (13.24) se puede demostrar que para valores grandes de ρ, la serie se comporta en laforma e2ρλl,k . De la Ec. (13.9), la funcion radial ul,k (r) se comporta como

ul,k (ρ) ∼ eρλl,k

Page 362: Mecanica Cuantica: Notas de Clase

362 CAPITULO 13. ATOMOS HIDROGENOIDES

la cual no es fısicamente aceptable1. Por tanto, no es aceptable una solucion en serie (cantidad infinita de terminosno nulos). En consecuencia, es necesario que la expansion (13.13) sea truncada y se convierta en una sumatoria(polinomio). En tal caso la Ec. (13.9) nos dice que el comportamiento asintotico de ul,k (r) es el producto de unpolinomio por una funcion e−ρλl,k el cual es aceptable.

Definiremos ck como el primer coeficiente nulo de la expansion. Esto equivale a decir que existe un valorentero positivo k tal que ck−1 6= 0, pero el termino entre parentesis a la derecha de (13.21) es cero para q = k. Ental caso, la relacion de recurrencia (13.21), nos indica que el coeficiente ck sera nulo y que los terminos subsecuentestambien seran nulos. La expansion (13.13) sera un polinomio ya que la relacion de recurrencia generara un numerofinito de coeficientes cq. Para un valor fijo de l, rotulamos el correspondiente valor de λl,k con este entero k. Esclaro que k ≥ 1, puesto que c0 6= 0. Igualando a cero el termino entre parentesis a la derecha de (13.21) cuandoq = k se obtiene

λl,k =1

l + k; k = 1, 2, 3, . . . (13.25)

reemplazando estos valores permitidos de λl,k en la Ec. (13.7) para la energıa se obtiene

1

l + k=

√−El,kEI

El,k = − EI

(l + k)2; k = 1, 2, 3, . . . (13.26)

Tomando en cuenta (13.13, 13.20), y el hecho de que cq = 0 para q ≥ k, la funcion yl,k (ρ) queda en la forma

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq (13.27)

tenemos entonces que yl,k (ρ) es un polinomio donde la menor potencia es ρl+1 y la maxima potencia es ρl+k.

13.3.3. Coeficientes del polinomio radial en terminos de c0

La relacion de recurrencia (13.21) permite encontrar los coeficientes del polinomio a partir de c0, reemplazando(13.25) en (13.21) la relacion de recurrencia queda

q (q + 2l + 1) cq = 2

[(q + l)

1

l + k− 1

]cq−1 =

2 (q + l)− 2 (l + k)

(l + k)cq−1

q (q + 2l + 1) cq =2q + 2l − 2l − 2k

(l + k)cq−1

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 (13.28)

demostraremos por induccion que

cq = (−1)q(

2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0 (13.29)

1Esta funcion radial diverge cuando ρ→ ∞. Ademas no es de cuadrado integrable, en tanto que para soluciones de energıa negativa(acotadas clasicamente), se esperan funciones de cuadrado integrable. Ademas, estas funciones ni siquiera son ortonormales en el sentidoextendido.

Page 363: Mecanica Cuantica: Notas de Clase

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 363

primero para q = 1, la relacion (13.28) nos dice que2

c1 = − 2 (k − 1)

1× (1 + 2l + 1) (l + k)c0 = −

(2

l + k

)(k − 1)

1

1× (1 + 2l + 1)c0

c1 = (−1)1(

2

l + k

)1 (k − 1)!

(k − 2)!

(2l + 1)!

1!× (1 + 2l + 1)!c0

c1 = (−1)1(

2

l + k

)1 (k − 1)!

(k − 1− 1)!

(2l + 1)!

1! (1 + 2l + 1)!c0 (13.30)

comparando (13.30) con (13.29) vemos que (13.29) se cumple para q = 1. Ahora asumimos que se cumple para qy demostraremos que se cumple para q + 1. Usando (13.28) con q → q + 1 se obtiene

cq+1 = − 2 (k − q − 1)

(q + 1) (q + 2l + 2) (l + k)cq

cq = −(q + 1) (q + 2l + 2) (l + k)

2 (k − q − 1)cq+1 (13.31)

reemplazando (13.31) en (13.29) tenemos

cq = (−1)q(

2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0

−(q + 1) (q + 2l + 2) (l + k)

2 (k − q − 1)cq+1 = (−1)q

(2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0

cq+1 = (−1) (−1)q2

(l + k)

(2

l + k

)q (k − 1)! (k − q − 1)

(k − q − 1)!

(2l + 1)!

q! (q + 1) (q + 2l + 1)! (q + 2l + 2)c0

cq+1 = (−1)q+1

(2

l + k

)q+1 (k − 1)!

(k − q − 2)!

(2l + 1)!

(q + 1)! (q + 2l + 2)!c0

cq+1 = (−1)q+1

(2

l + k

)q+1 (k − 1)!

[k − (q + 1)− 1]!

(2l + 1)!

(q + 1)! [(q + 1) + 2l + 1]!c0 (13.32)

comparando (13.32) con (13.29) vemos que si la relacion (13.29) se cumple para q entonces se cumple para q + 1,lo cual demuestra la validez de (13.29).

13.3.4. Calculo de c0 y de la funcion radial para l = 0, k = 1

Ahora falta evaluar a c0, lo cual se logra con la ecuacion de normalizacion (12.46). Notese que la Ec. (13.25)nos dice que l = k = 0 esta prohibido, ya que k ≥ 1. Por tanto, calcularemos explıcitamente la funcion radial massimple que es ul=0,k=1 (r). Comenzaremos empleando las ecuaciones (13.27) con l = 0, k = 1

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ⇒ y0,1 (ρ) = ρ0+1

0∑

q=0

cqρq = c0ρ

verifiquemos explıcitamente que ck = c1 = 0. Usando (13.28) para l = 0 y q = k = 1 se obtiene

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 ⇒ c1 = − 2 (1− 1)

1× [1 + 2 (0) + 1] (0 + 1)c0 = 0

2Tambien podemos ver que para q = 0, la Ec. (13.29) conduce a c0 = c0. Por tanto podemos comenzar la induccion con q = 0.

Page 364: Mecanica Cuantica: Notas de Clase

364 CAPITULO 13. ATOMOS HIDROGENOIDES

ahora usando (13.9, 13.25) y la relacion entre ρ y r Ec. (13.7)

u0,1 (ρ) = e−ρλ0,1y0,1 (ρ) ; λ0,1 =1

0 + 1= 1 ⇒ u0,1 (ρ) = c0ρe

−ρ

u0,1 (r) =c0a0re−r/a0

finalmente usamos la ecuacion de normalizacion (12.46) y elegimos c0 con fase cero (constante real positiva)

∫ ∞

0|ul,k (r)|2 dr = 1 ⇒

∫ ∞

0|u0,1 (r)|2 dr = 1 ⇒ c20

a20

∫ ∞

0r2e−2r/a0dr = 1

∫ ∞

0r2e−2r/a0dr = −1

4a0e

− 2a0r (a20 + 2a0r + 2r2

)∣∣∣∣∞

0

=1

4a30 ⇒

c20a30

4a20= 1 ⇒ c20a0

4= 1

c(0,1)0 =

2√a0

(13.33)

donde hemos tenido en cuenta que c0 en general depende de los valores de l y k. Finalmente la funcion radialRl,k (r) esta dada por (12.36), para el caso de l = 0, k = 1 se tiene que

R0,1 (r) =1

ru0,1 (r) =

1

r

c(0,1)0

a0re−r/a0 =

2√a0

1

a0e−r/a0

R0,1 (r) =2

a3/20

e−r/a0

13.3.5. Calculo de c0 y de la funcion radial para l = 0, k = 2

Calculemos ahora Rl,k (r) con l = 0, k = 2. Usando las Ecs. (13.27) con l = 0, k = 2

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ⇒ y0,2 (ρ) = ρ0+1

1∑

q=0

cqρq = ρ (c0 + c1ρ)

usando (13.28) para l = 0, k = 2, q = 1, 2 se obtiene

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 ⇒ c1 = − 2 (2− 1)

(1 + 1) (0 + 2)c0 = −1

2c0 ⇒

c2 = − 2 (2− 2)

2 (2 + 1) (0 + 2)c1 = 0

verificando una vez mas que ck = c2 = 0. Con estos coeficientes y0,2 (ρ) queda

y0,2 (ρ) = ρ

(c0 −

1

2c0ρ

)= c0ρ

(1− 1

)

y usando (13.9, 13.25, 13.7)

u0,2 (ρ) = e−ρλ0,2y0,2 (ρ) ; λ0,2 =1

0 + 2=

1

2⇒ u0,2 (ρ) = c0ρ

(1− 1

)e−

12ρ

u0,2 (r) = c0r

a0

(1− r

2a0

)e− r

2a0 (13.34)

Page 365: Mecanica Cuantica: Notas de Clase

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 365

ahora debemos calcular el c0 que normaliza a u0,2 (r) de acuerdo con las Ecs. (13.34, 12.46) eligiendo fase ceropara c0 ∫ ∞

0|u0,2 (r)|2 dr = 1 ⇒ c20

∫ ∞

0

(r

a0

)2(1− r

2a0

)2

e− ra0 dr = 1

evaluando la integral

∫ ∞

0

(r

a0

)2(1− r

2a0

)2

e− ra0 dr = − 1

4a30e− 1a0r (

8a40 + 8a30r + 4a20r2 + r4

)∣∣∣∣∞

0

= 2a0

por tanto

c20 (2a0) = 1 ⇒ c(0,2)0 =

1√2a0

reemplazando en (13.34) queda

u0,2 (r) =1√2a0

r

a0

(1− r

2a0

)e− r

2a0 =2r

(2a0)3/2

(1− r

2a0

)e− r

2a0

R0,2 (r) =2

(2a0)3/2

(1− r

2a0

)e− r

2a0

13.3.6. Calculo de c0 y de la funcion radial para l = k = 1

Como ultimo ejemplo evaluamos Rl,k (r) para l = k = 1. Usando (13.27) con l = k = 1

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ; y1,1 (ρ) = ρ1+1

0∑

q=0

cqρq

y1,1 (ρ) = c0ρ2

usando (13.9, 13.25, 13.7)

u1,1 (ρ) = e−ρλ1,1y1,1 (ρ) ; λ1,1 =1

1 + 1=

1

2⇒ u1,1 (r) = c0

r2

a20e− r

2a0 (13.35)

normalizando u1,1 (r) con las Ecs. (13.35, 12.46) con c0 positivo

∫ ∞

0|u1,1 (r)|2 dr = 1 ⇒ c20

∫ ∞

0

r4

a40e− ra0 dr = 1

evaluando la integral∫ ∞

0

(r4

a40e− ra0

)dr = − 1

a30e− ra0

(r4 + 4r3a0 + 12r2a20 + 24ra30 + 24a40

)∣∣∣∣∞

0

= 24a0

con lo cual resulta

c20 (24a0) = 1 ⇒ c(1,1)0 =

1√24a0

=1

2

1√6a0

quedando

u1,1 (r) =1

2

1√6a0

r2

a20e− r

2a0 =1

2√2√3

r2

a5/20

e− r

2a0 =1

(2a0)3/2 √3

r2

a0e− r

2a0

quedando finalmente

R1,1 (r) =1

(2a0)3/2

1√3

r

a0e− r

2a0

Page 366: Mecanica Cuantica: Notas de Clase

366 CAPITULO 13. ATOMOS HIDROGENOIDES

13.3.7. Estructura de los niveles de energıa

La Ec. (13.26) nos muestra que en el atomo de Hidrogeno, l y k no definen un nivel de energıa por separado,es conveniente introducir un numero cuantico de la forma

n ≡ l + k (13.36)

de modo que n determina unıvocamente el valor de la energıa segun se observa en (13.26) ya que en tal casotenemos

En = −EIn2

; n = 1, 2, 3, . . .

Puesto que determinar n y l es equivalente a determinar k y l, sera mas conveniente reemplazar a k por n. Enconsecuencia, utilizaremos los numeros cuanticos n, l,m en lugar de k, l,m de aquı en adelante. En virtud de quen define la energıa, se denomina el numero cuantico principal, de aquı en adelante citaremos los numeroscuanticos usando primero el numero cuantico principal, luego el numero cuantico azimutal y finalmente el numerocuantico magnetico i.e. n, l,m.

13.4. Parametros atomicos

Las formulas para la funcion de onda han sido escritas tomando a a0 (radio de Bohr) como unidad de longitudque nos dara una idea de la extension espacial de las funciones de onda de los estados acotados del atomo deHidrogeno. Similarmente, la energıa de ionizacion EI se utilizara para obtener el orden de magnitud de los nivelesde energıa. Las ecuaciones (13.2) se pueden reescribir como

EI =µe4

2~2=µe4c2

2~2c2=

1

2

(e2

~c

)2

µc2 ; a0 =~2

µe2=

~2c

µe2c=

~c

e2

(~

µc

)

que se pueden reescribir como

EI =1

2α2µc2 , a0 =

1

αλel ; α ≡ e2

~c=

q2

4πε0~c; λel ≡

~

µc(13.37)

la constante adimensional α se conoce como constante de estructura fina. Por otro lado puesto que µ ≃ me setiene que λel esta relacionada con la longitud de onda de compton del electron λC [ver Ec. (2.11) Pag. 114].Numericamente

α ≃ 1

137; λel ≡

λC2π

≃ ~

mec≃ 3,8× 10−3A (13.38)

la segunda de las Ecs. (13.37) nos dice que el radio de Bohr (radio atomico tıpico) es unas dos ordenes de magnitudmayor que la longitud de onda de Compton del electron. La primera de las Ecs. (13.37) se escribe numericamentecomo

EI ≃ 1

2α2mec

2 ≃ 1

2

(1

137

)2

mec2 ⇒ EI ≃ 2. 7 × 10−5mec

2

mec2 ≃ 0,5× 106eV

de modo que la energıa de enlace tıpica de un atomo es unas 10−5 veces menor que la energıa en reposo delelectron mec

2.EI ≪ mec

2

esta relacion es indispensable para poder justificar una aproximacion no relativista al problema. Los efectosrelativistas son pequenos pero observables. Debido a que los efectos relativistas son pequenos pueden calcularse atraves de la teorıa de perturbaciones.

Page 367: Mecanica Cuantica: Notas de Clase

13.5. RESUMEN DE RESULTADOS 367

13.5. Resumen de resultados

Para el atomo de Hidrogeno, que es un problema de dos cuerpos (un proton y un electron) reducimos el problemaal de una partıcula equivalente de masa aproximadamente igual a la masa me del electron (masa reducida µ delsistema) y en donde el centro de masa esta aproximadamente en la posicion del proton. Es conveniente expresar losresultados en terminos del radio de Bohr a0 y la energıa de ionizacion EI los cuales en terminos de las constantesfısicas universales vienen dados por

EI =µe4

2~2=

1

2α2µc2 ; a0 =

~2

µe2=

1

α

(~

µc

)≃ 1

αλel (13.39)

α ≡ e2

~c=

q2

4πε0~c; λel ≡

~

mec(13.40)

Siendo α la constante de estructura fina y λel la longitud de onda de Compton del electron. Teniendo en cuentala Ec. (13.36)

n ≡ l + k

enunciaremos los resultados en terminos de los numeros cuanticos n, l,m. Un estado sera rotulado usando el orden|n, l,m〉, es decir usando primero el numero cuantico principal n, luego el numero cuantico azimutal l y finalmenteel numero cuantico magnetico m.

La funcion de onda asociada es de la forma

ϕn,l,m (r, θ, ϕ) = Rn,l (r)Ylm (θ, ϕ) =un,l (r)

rYlm (θ, ϕ) (13.41)

un,l (ρ) = e−ρλnyn,l (ρ) ; ρ ≡ r

a0; λn ≡

√−EnEI

=1

n; Ylm (θ, ϕ) = Zl,m (θ)

eimϕ√2

(13.42)

y los valores de energıa son

En = −EIn2

; n = 1, 2, 3, . . . (13.43)

siendo Ylm (θ, ϕ) los armonicos esfericos. La solucion de la funcion radial yn,l (ρ) es un polinomio dado por

yn,l (ρ) = ρl+1n−l−1∑

q=0

cqρq (13.44)

donde los coeficientes cq se pueden encontrar a partir de c0, con la siguiente formula de recurrencia

cq = − 2 (n− l − q)

q (q + 2l + 1)ncq−1 (13.45)

cq = (−1)q(2

n

)q (n− l − 1)!

(n− l − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0 (13.46)

finalmente la constante c0 (que en general depende de los valores de n y l) se determina como constante denormalizacion para la funcion radial un,l (r)

∫ ∞

0|un,l (r)|2 dr = 1 (13.47)

a manera de ejemplo escribimos explıcitamente algunas funciones radiales

Rn=1,l=0 (r) = 2 (a0)−3/2 e−r/a0 ; R2,0 (r) = 2 (2a0)

−3/2

(1− r

2a0

)e− r

2a0 (13.48)

R2,1 (r) = (2a0)−3/2 1√

3

r

a0e− r

2a0 (13.49)

Page 368: Mecanica Cuantica: Notas de Clase

368 CAPITULO 13. ATOMOS HIDROGENOIDES

13.6. Discusion de los resultados

La Ec. (13.43) nos da el espectro de energıas del atomo de Hidrogeno

El,k = − EI

(l + k)2; k = 1, 2, 3, ... (13.50)

y nos muestra que para un l fijo existen infinitos valores de energıa asociados a k = 1, 2, 3, .... Adicionalmente,para cada par l, k la energıa posee al menos una degeneracion de orden 2l + 1 debido a los diferentes valoresde m asociados a l fijo, esta degeneracion debida a la ausencia del numero cuantico m en la ecuacion radial, sedenomina degeneracion esencial puesto que es propia de cualquier interaccion central. No obstante, tambien estanpresentes degeneraciones accidentales propias de la interaccion especıfica, ya que la Ec. (13.50) nos dice que dosautovalores El,k y El′,k′ asociados a ecuaciones radiales distintas (l 6= l′) seran iguales si l′ + k′ = l + k.

Usando ahora los numeros cuanticos n, l,m, la Ec. (13.50) queda

En = −EIn2

; n = 1, 2, 3, . . . (13.51)

utilizando la terminologıa espectroscopica un valor de n especifica una capa o nivel electronico.

Puesto que k es un entero positivo, hay un numero finito de valores de l asociados a un valor dado de n. Dela definicion de n Ec. (13.36) y los valores permitidos de k (1, 2, 3, ...) es claro que

l = 0, 1, 2, ..., n − 1 ; n = 1, 2, 3, ...

Cada combinacion especıfica n, l se denomina una subcapa o subnivel electronico. Puesto que hay n valores de lpara un n dado se dice que cada capa o nivel n contiene n subcapas o subniveles. Ahora bien, puesto que L2, L3 yH forman un C.S.C.O. se tiene que un estado esta definido unıvocamente por una tripla (n, l,m). En consecuencia,cada subnivel (n, l) contiene 2l + 1 estados diferentes asociados a los diferentes valores de m para l fijo.

Dado que n especifica unıvocamente a la energıa y (n, l,m) especifica completamente al estado, la degeneracionde la energıa para un n dado es el numero total de valores de l,m para dicho valor de n

gn =

n−1∑

l=0

(2l + 1) =

(2

n−1∑

l=0

l

)+ n =

2n (n− 1)

2+ n

gn = n2

veremos mas adelante que la presencia del momento angular intrınseco del electron nos duplica este valor. Sitenemos en cuenta adicionalmente el espın del proton, tendrıamos un factor de dos adicional.

Usando una vez mas la notacion espectroscopica, los valores de l se denotan con una letra del alfabeto en lasiguiente forma

l = 0 ↔ s , l = 1 ↔ p , l = 2 ↔ d , l = 3 ↔ f , l = 4 ↔ g

la notacion espectroscopica rotula un subnivel por el numero n seguido por la letra que caracteriza al valor de l.Por ejemplo, para el nivel base n = 1 (que no es degenerado segun la Ec. (13.51) y que se conoce como “nivelK”) solo l = 0 es posible, de modo que solo tiene el subnivel 1s. El primer estado excitado n = 2 (conocido como“nivel L”) permite l = 0, 1 de modo que contiene los subniveles 2s y 2p. El segundo estado excitado (“nivel M”)posee los subniveles 3s, 3p, 3d.

Hemos visto que un estado se especifica con los numeros cuanticos n, l,m. Donde n, l especifica la dependenciaradial y l,m la dependencia angular. Veamos ahora las caracterısticas de la dependencia angular.

Page 369: Mecanica Cuantica: Notas de Clase

13.6. DISCUSION DE LOS RESULTADOS 369

13.6.1. Dependencia angular

Si bien la funcion de onda

ϕ (r, θ, ϕ) = Rn,l (r)Ylm (θ, ϕ) = Rn,l (r)Zl,m (θ)eimϕ√

2

depende de ambos angulos, puesto que la mayorıa de observables dependen del modulo al cuadrado de la funcionde onda, debemos calcular la dependencia angular de |Ylm (θ, ϕ)|2 este modulo nos da

|Ylm (θ, ϕ)|2 =∣∣∣∣Zl,m (θ)

eimϕ√2

∣∣∣∣2

=1

2|Zl,m (θ)|2 (13.52)

vemos entonces que este modulo al cuadrado tiene simetrıa azimutal. Por tanto se obtiene una superficie derevolucion alrededor del eje X3 de cuantizacion. En particular, |Y00|2 es constante y por tanto esfericamente

simetrico. |Y1m (θ, ϕ)|2 es proporcional a cos2 θ; |Y2m (θ, ϕ)|2 es proporcional a(3 cos2 θ − 1

)2etc.

La funcion radial Rn,l (r) caracteriza a cada subnivel y se puede calcular con los resultados de la seccion 13.5introduciendo nuestro cambio de notacion de Rl,m,k (r) a Rn,l,m (r) .

El comportamiento de Rn,l (r) en la vecindad del origen es del tipo rl, de modo que solo los estados quepertenecen a un subnivel s (l = 0) tienen una densidad de probabilidad diferente de cero en el origen. A medidaque l aumenta, es mayor la region alrededor del proton para la cual la probabilidad de encontrar el electron esdespreciable, es de esperarse que esto aumente el valor esperado del radio atomico3. Esto tiene consecuencias enprocesos fısicos tales como la captura de electrones por nucleos y la estructura hiperfina de las lıneas espectrales.

Vale la pena recordar que el concepto de subnivel aparece en el modelo semiclasico de Sommerfeld que asignaa cada valor de n (numero cuantico de Bohr) un numero n de orbitas elıpticas de la misma energıa y diferentemomento angular. La orbita asociada al maximo momento angular para un n dado es circular. Puesto que elmodelo semiclasico de Sommerfeld fue exitoso para predecir la degeneracion de los niveles de energıa, es logicopensar que el modelo de Bohr se reproduce para los estados con l = n − 1 (maximo valor del momento angularpara n dado). En particular vamos a mostrar que para l = n − 1 se obtiene la segunda expresion (13.3) paralos radios de Bohr. La probabilidad de encontrar al electron en un volumen dV que en coordenadas esfericas secaracteriza por

dV = r2 dr sin θ dθ dϕ = r2dr dΩ

estara dada por

dPn,l,m (r, θ, ϕ) = |ϕn,l,m (r, θ, ϕ)|2 r2 dr dΩ = |Rn,l (r)|2 r2 dr × |Yl,m (θ, ϕ)|2 dΩ

si queremos calcular la probabilidad de encontrar al electron entre r y r + dr dentro de un cierto angulo solido,tenemos que esta probabilidad se obtiene usando (13.52)

dPn,l,m (r) = |Rn,l (r)|2 r2 dr ×1

2

∫ ϕ2

ϕ1

∫ θ2

θ1

|Zl,m (θ)|2 sin θ dθ

dPn,l,m (r) = Ml,m |Rn,l (r)|2 r2 dr ; Ml,m ≡ ϕ2 − ϕ1

2

∫ θ2

θ1

|Zl,m (θ)|2 sin θ dθ (13.53)

donde [ϕ1, ϕ2] y [θ1, θ2] definen el intervalo de los angulos que generan el angulo solido dentro del cual se quiereevaluar la probabilidad.

3Esto se asemeja al comportamiento clasico en el cual el aumento de la magnitud del momento angular produce un aumento en elradio promedio de una orbita cerrada. En particular, clasicamente un momento angular nulo significa que la velocidad inicial “apunta”hacia el centro de interaccion, lo cual indica que la trayectoria de la partıcula es una lınea recta que pasa en principio por este punto(el origen), pero si el momento angular es no nulo, la trayectoria no pasa por el origen o centro de fuerzas. La contrapartida cuanticaes el hecho de que solo para l = 0 tenemos una probabilidad no nula de que el electron se encuentre en el origen.

Page 370: Mecanica Cuantica: Notas de Clase

370 CAPITULO 13. ATOMOS HIDROGENOIDES

Ahora evaluaremos esta probabilidad para l = n− 1. Aplicando l = n− 1 en (13.44)

yn,n−1 (ρ) = ρ(n−1)+10∑

q=0

cqρq = c0ρ

n

Con esto y usando la primera y la tercera de las Ecs. (13.42) se calcula la funcion radial

un,n−1 (ρ) = e−ρλnc0ρn ; λn =

1

n

un,n−1 (ρ) = c0e− ρnρn = c0e

− ra0n

(r

a0

)n

Rn,n−1 (r) = c0e− ra0n

1

r

(r

a0

)n=c0a0e− ra0n

a0r

(r

a0

)n

Rn,n−1 (r) =c0a0

(r

a0

)n−1

e− ra0n (13.54)

finalmente la probabilidad se obtiene de (13.53) y (13.54)

dPn,n−1,m (r) = Mn−1,m |Rn,n−1 (r)|2 r2 dr ; Mn−1,m ≡ ϕ2 − ϕ1

2

∫ θ2

θ1

|Zn−1,m (θ)|2 sin θ dθ

dPn,n−1,m (r) = Mn−1,m

[c0a0

(r

a0

)n−1

e− ra0n

]2r2 dr = c20 Mn−1,m

[(r

a0

)n−1

e− ra0n

]2(r

a0

)2

dr

dPn,n−1,m (r) = c20 Mn−1,m e− 2ra0n

(r

a0

)2n

dr

la densidad de probabilidad radial para l = n− 1 es

ρn,n−1 (r) ≡dPn,n−1,m (r)

dr= c20 Mn−1,m

(r

a0

)2n

e− 2ra0n

esta densidad de probabilidad tiene un maximo en

r = rn = n2a0

que es el radio de Bohr para una orbita de energıa En.La tabla 13.1, ilustra los niveles de energıa y la degeneracion de algunos estados. La tabla 13.2 muestra las

expresiones de la funcion de onda para los primeros niveles de energıa.

Page 371: Mecanica Cuantica: Notas de Clase

13.6. DISCUSION DE LOS RESULTADOS 371

n→ ∞ E = 0 E = 0 E = 0 E = 0

n = 4 4s 4p 4d 4f

n = 3 3s 3p 3d

n = 2 2s 2p

n = 1 (E = EI) 1s

l = 0 (s) l = 1 (p) l = 2 (d) l = 3 (f)

Cuadro 13.1: Niveles de energıa (negativos) para estados acotados del atomo de hidrogeno. Los niveles sobre unafila poseen la misma energıa (mismo numero cuantico principal n). En n = 1 la energıa corresponde en valorabsoluto a la energıa de ionizacion, y para n muy grande la energıa tiende a cero por la izquierda. A medida quese incrementa n disminuye la brecha entre los valores de energıa permitidos.

nivel 1s ϕ1,0,0 (r) =1√πa30

e−r/a0

nivel 2s ϕ2,0,0 (r) =1√8πa30

(1− r

2a0

)e−r/2a0

nivel 2p

ϕ2,1,1 (r) = − 1

8√πa30

ra0e−r/2a0 sin θ eiϕ

ϕ2,1,0 (r) =1

4√

2πa30

ra0e−r/2a0 cos θ

ϕ2,1,−1 (r) =1

8√πa30

ra0e−r/2a0 sin θ e−iϕ

Cuadro 13.2: Funciones de onda asociadas al estado base (n = 1) y al primer estado excitado (n = 2).

Page 372: Mecanica Cuantica: Notas de Clase

Capıtulo 14

Corrientes de probabilidad en atomoshidrogenoides, acoples con camposmagneticos

14.1. Corrientes de probabilidad para las soluciones estacionarias del atomode Hidrogeno

Siguiendo los resultados de la seccion 3.3.5, expresamos la funcion de onda estacionaria en forma polar

ϕ (r) = α (r) eiξ(r) ; α (r) ≥ 0, 0 ≤ ξ (r) < 2π (14.1)

de modo que la densidad de probabilidad ρ (r) y la densidad de corriente de probabilidad J (r) estan dadas porlas Ecs. (3.34, 3.35)

ρ (r) = α2 (r) ; J (r) =~

µα2 (r) ∇ξ (r) (14.2)

Teniendo en cuenta la estructura de las soluciones estacionarias Ecs. (13.41, 13.42) el modulo α (r) y la fase ξ (r)para las soluciones hidrogenoides estacionarias estan dadas por

αn,l,m (r) = |Rn,l (r)| |Ylm (θ, ϕ)| = 1√2|Rn,l (r)| |Zlm (θ)| ; ξ (r) = mϕ (14.3)

es importante tener en cuenta que µ denota la masa y m denota el autovalor m~ de L3. Aplicando las Ecs. (14.2)y usando la expresion para el gradiente en coordenadas esfericas tenemos que:

Jn,l,m (r) =~

µα2 (r) ∇ξ (r) = ~

µρn,l,m (r)

[ur

∂r+ uθ

1

r

∂θ+ uϕ

1

r sin θ

∂ϕ

](mϕ)

Jn,l,m (r) =~

µρn,l,m (r)

m

r sin θuϕ (14.4)

donde uϕ es el vector unitario ortogonal al plano formado por r y u3 en el sentido en el cual se incrementa elangulo azimutal ϕ. La Ec. (14.4) nos dice que el sentido de rotacion de la corriente esta dictaminado por el signode m y de sin θ ya que las demas cantidades son todas positivas. La Ec. (14.4) nos dice que la corriente en cadapunto M definida por el vector posicion r, es perpendicular al plano definido por r y u3. El fluıdo de probabilidadrota alrededor del eje X3. Puesto que |J| no es proporcional a r sin θ ρ (r) el sistema no rota como un todo. Esdecir, la velocidad angular de la corriente es diferente en cada punto. Si queremos ver la estructura de la corrienteasociada a un estado estacionario para un plano perpendicular a u3 (es decir para θ fijo) vemos que si sin θ > 0,

372

Page 373: Mecanica Cuantica: Notas de Clase

14.1. CORRIENTES DE PROBABILIDAD PARA EL ATOMO DE HIDROGENO 373

tenemos rotacion del fluıdo de probabilidad alrededor de u3 en el sentido antihorario (horario) si m > 0, (m < 0).Si m = 0 no hay corriente de probabilidad en ningun punto del espacio.

Tomemos un elemento de volumen d3r situado en el punto r, su contribucion al momento angular con respectoal origen (en el centro del nucleo) es:

dL = r× dP = r× (dµ)v

donde dµ es la “fraccion de masa equivalente” que ocuparıa el volumen dV si la distribucion de probabilidad fueseuna distribucion de masa1. En consecuencia, dµ = µ ρ dV con lo cual

dL = µr× ρn,l,mv dV = µr× Jn,l,m (r) d3r (14.5)

el momento angular total se obtiene por integracion de la Ec. (14.5). Por simetrıa todas las componentes en X1 yX2 se anulan y solo sobrevive la componente sobre X3 la cual vendra dada por

L3 = µ

∫d3r u3 · [r× Jn,l,m (r)] = m~

∫d3r

ρn,l,m (r)

r sin θu3 · [r× uϕ] = m~

∫d3r

ρn,l,m (r)

r sin θuϕ · [u3 × r]

= m~

∫d3r

ρn,l,m (r)

r sin θuϕ · [r sin θ uϕ] = m~

∫d3r ρn,l,m (r) = m~

∫d3r |ψ (r)|2

L3 = m~

donde hemos usado la Ec. (14.4), la identidad a · (b× c) = c · (a× b), y la Ec. (3.27) para la densidad deprobabilidad. De lo anterior se concluye que el autovalor m~ de L3 puede interpretarse como el momento angularclasico asociado al movimiento rotacional del fluıdo de probabilidad.

14.1.1. Efecto sobre la corriente debido a la introduccion de un campo magnetico

Asumamos ahora que al atomo de Hidrogeno se le aplica un campo magnetico constante B. Tal campo puedeser descrito por el siguiente potencial vectorial

A (r) = −1

2r×B (14.6)

estudiaremos la corriente de probabilidad asociada al estado base. Por simplicidad asumiremos que el campomagnetico no modifica al estado base. Puesto que el Hamiltoniano H depende de B, esto no es del todo correcto,pero puede demostrarse que para B = Bu3 en el gauge descrito por la Ec. (14.6), las funciones ϕn,l,m (r) sonauto funciones de H dentro de terminos de segundo orden en B, los cuales son despreciables para campos tıpicosde laboratorio. Aplicaremos entonces la expresion de la densidad de corriente para una partıcula inmersa en uncampo electromagnetico descrita por las Ecs. (5.49, 5.50) donde hacemos φ (R, t) = 0, aplicaremos ademas lasEcs. (14.1, 14.2)

Jn,l,m =1

µRe

ϕ∗n,l,m (r)

[~

i∇− qA (r)

]ϕn,l,m (r)

=

1

µRe

α (r) e−iξ(r)

[~

i∇− qA (r)

]α (r) eiξ(r)

=1

µRe

α (r) e−iξ(r)

~

i∇[α (r) eiξ(r)

]− qα (r) e−iξ(r)A (r) α (r) eiξ(r)

=1

µRe

α (r) e−iξ(r) eiξ(r)

~

i∇α (r) + α2 (r) e−iξ(r)

~

i∇eiξ(r) − qα2 (r) A (r)

=1

µRe

~

iα (r) ∇α (r) + α2 (r) e−iξ(r)eiξ(r)

i~

i∇ξ (r)− qα2 (r) A (r)

=1

µRe−i~α (r) ∇α (r) + ~α2 (r) ∇ξ (r)− qα2 (r) A (r)

1Debe tenerse en cuenta sin embargo, que la nube electronica en cuantica no es una distribucion de masa que ocupa todo el espacio,sino una distribucion de probabilidad de que la masa se encuentra en cierta region del espacio. No obstante, esta distribucion de masaequivalente reproduce adecuadamente los valores de las cantidades globales (como las densidades volumetricas equivalentes).

Page 374: Mecanica Cuantica: Notas de Clase

374 CAPITULO 14. CORRIENTES DE PROBABILIDAD Y ACOPLES MAGNETICOS EN ATOMOS

y teniendo en cuenta que α (r) , ξ (r) y A (r) son cantidades reales, se obtiene que

Jn,l,m =α2 (r)

µ~ ∇ξ (r)− qA (r)

Jn,l,m =ρn,l,mµ

[~ ∇ξn,l,m (r)− qA (r)] (14.7)

sustituyendo (14.6) en la Ec. (14.7) con B = Bu3, el estado base tendra una corriente dada por

J1,0,0 =ρ1,0,0µ

[~ ∇ξ1,0,0 (r) +

qB

2r× u3

]=ρ1,0,0µ

~

[ur∂ (mϕ)

∂r+ uθ

1

r

∂ (mϕ)

∂θ+ uϕ

1

r sin θ

∂ (mϕ)

∂ϕ

]

m=0

+qB

2r× u3

= ρ1,0,0

~ [m]m=0

µ+ r×

(qB

2µu3

)=ρ1,0,02

(−qBµ

u3

)× r

J1,0,0 =ρ1,0,02

(~ωc × r) ; ~ωc ≡ −qBµ

u3 (14.8)

donde hemos usado la Ec. (14.3). El vector ~ωc es la frecuencia angular de ciclotron2. La velocidad equivalente delfluıdo esta dada por J1,0,0 = ρ1,0,0v1,0,0 con lo cual la velocidad equivalente nos da

v1,0,0 =~ωc2

× r ≡ ~ωf × r (14.9)

La Ec. (14.8) nos muestra que la corriente de probabilidad en el estado base no es cero en presencia de un campomagnetico, es claro que esta corriente se anula al hacer B = 0. Las Ecs. (14.8, 14.9) nos muestran que el fluıdo deprobabilidad, gira como un todo3 alrededor de B (o de u3) con un frecuencia angular4 ~ωf = ~ωc/2. Fısicamente,este resultado se debe a la presencia del campo electrico E (r) transiente que se induce cuando se “enciende” elcampo magnetico. Bajo la influencia de este campo electrico transitorio el electron permanece aproximadamenteen su estado base y comienza a rotar alrededor del proton, con una velocidad angular que depende solo del valorde B y no de la forma precisa en que se enciende el campo magnetico. Por supuesto, una vez que la corriente segenera (y desaparece el campo electrico transitorio), el campo magnetico permanente puede sostenerla via fuerzade Lorentz, ya que la carga ahora esta en movimiento.

Es importante mencionar que si usamos un gauge diferente al dado por la Ec. (14.6) las funciones de ondaserıan diferentes, y en la Ec. (14.7) existirıan otras contribuciones a primer orden en B. Sin embargo, en cualquiergauge se debe reproducir la Ec. (14.8) a primer orden en B, puesto que los resultados fısicos no pueden dependerdel gauge.

La Ec. (14.8), tambien se puede escribir en terminos de los parametros atomicos usando la funcion de ondaexplıcita del estado base del atomo de Hidrogeno que aparace en la tabla 13.2 pagina 371

J1,0,0 =|ϕ1,0,0|2

2(~ωc × r) =

e−2r/a0

2πa30

(−qBµ

u3 × r

)= −qB

µ

e−2r/a0

2πa30(r sin θ uϕ)

J1,0,0 = −qBe−2r/a0

2πµa30r sin θ uϕ (14.10)

aquı vemos ademas que la densidad de corriente es proporcional a ρ (r) r sin θ, lo cual nos ratifica que el fluıdo deprobabilidad gira como un todo.

2La frecuencia angular de ciclotron es la que tendrıa una carga q clasica que se mueve en una trayectoria circular debido a suinteraccion con un campo magnetico constante, cuando la velocidad inicial de dicha carga es perpendicular al campo magnetico.

3Es claro de las Ecs. (14.8, 14.9), que la velocidad angular ~ωf del fluıdo no depende de la posicion en este caso.4El hecho de que la corriente de la nube electronica tenga la mitad de la frecuencia de ciclotron, se debe al efecto adicional del

campo electrico generado por el nucleo.

Page 375: Mecanica Cuantica: Notas de Clase

14.2. ATOMO DE HIDROGENO EN UN CAMPO MAGNETICO UNIFORME 375

14.2. Atomo de hidrogeno en un campo magnetico uniforme: paramagnetis-mo, diamagnetismo y efecto Zeeman

Estudiaremos ahora los efectos que surgen cuando el atomo de hidrogeno esta inmerso en un campo magnetico.Para los campos magneticos tıpicos de laboratorio, el gradiente de dichos campos es tal que B no varıa aprecia-blemente en distancias comparables a la escala atomica. Por tanto, para muchos casos tomar este campo comouniforme sera una buena aproximacion, y ası lo haremos de aquı en adelante. Estudiaremos entonces el espectrode un electron sujeto a la interaccion electrica interna debida al nucleo y a un campo magnetico externo. Si bienla solucion exacta de la ecuacion de Schrodinger es muy compleja en este caso, esta sera soluble bajo ciertasaproximaciones.

Una aproximacion importante es la de ignorar los efectos debidos a la masa finita del nucleo, esta aproximacionesta justificada dado que el proton es mucho mas pesado que el electron. Es importante observar que bajo lainfluencia de un campo magnetico no es rigurosamente posible reducir el problema de dos cuerpos acoplados alproblema de dos cuerpos desacoplados uno en el centro de masa con la masa del sistema y otro con la masareducida del sistema y la dinamica del vector relativo5. Por tanto, al tener en cuenta los efectos de masa finita delnucleo no es suficiente con reemplazar la masa del electron por la masa reducida del sistema.

Usaremos ademas el hecho de que para campos magneticos tıpicos de laboratorio el corrimiento del espectroatomico debido al campo magnetico externo es mucho menor al causado por el campo electrico interno. Loscorrimientos de los niveles atomicos son mucho menores que las separaciones entre niveles del atomo libre.

El estudio de los efectos de introducir un campo magnetico nos permitira comprender como surge el paramag-netismo y el diamagnetismo en la mecanica cuantica

14.2.1. Hamiltoniano del sistema

Consideremos un electron sin espın de masa me y carga q sujeto a un potencial central V (r) y a un potencialvectorial magnetico A (r). Su Hamiltoniano es

H =1

2me[P− qA (R)]2 + V (R) (14.11)

si el campo magnetico B es uniforme, el potencial vectorial se puede escribir como

A (r) = −1

2r×B (14.12)

para introducir esta cantidad en el Hamiltoniano (14.11) calcularemos el siguiente factor

[P− qA (R)]2 =[P+

q

2R×B

]2= P2 +

q2

4(R×B)2 +

q

2[P · (R×B) + (R×B) ·P] (14.13)

ahora bien, B es un vector constante y no un operador, por tanto conmuta con todos los operadores. Adicional-mente, tenemos que

P · (R×B) = PiεijkRjBk ; (R×B) ·P = εijkRjBkPi ; (R×P)i = εijkRjPk

suma sobre ındices repetidos. Los unicos terminos no nulos de esta sumatoria corresponden a aquellos en dondetodos los ındices son diferentes, por tanto Rj conmuta con Pi para los terminos no nulos, de modo que

P · (R×B) = (R×B) ·P ; R×P = −R×P

5Debe tenerse en cuenta que la reduccion del problema de dos cuerpos acoplados al de dos cuerpos desacoplados, solo es en generalposible cuando la interaccion neta es central. Cuando superponemos el potencial Coulombiano debido al nucleo con la fuerza de Lorentzgenerada por el campo magnetico, la interaccion resultante deja de ser central.

Page 376: Mecanica Cuantica: Notas de Clase

376 CAPITULO 14. CORRIENTES DE PROBABILIDAD Y ACOPLES MAGNETICOS EN ATOMOS

En consecuencia, a las expresiones anteriores se les puede aplicar las identidades vectoriales usuales. Utilizando

a · (b× c) = c · (a× b)

(a× b) · (c× d) = (a · c) (b · d)− (a · d) (b · c)

en la Ec. (14.13) queda

[P− qA (R)]2 = P2 +q2

4(R×B) · (R×B) +

q

2[2P · (R×B)]

= P2 +q2

4[(R ·R) (B ·B)− (R ·B) (B ·R)] + q [B · (P×R)]

[P− qA (R)]2 = P2 +q2

4

[R2B2 − (R ·B)2

]− qB · (R×P) (14.14)

Ahora bien, la proyeccion r⊥ de un vector arbitrario r sobre un plano perpendicular a B se escribe

|r⊥| = |r| sin θ ⇒ r2⊥ = r2 sin2 θ = r2(1− cos2 θ

)= r2 − r2B2 cos2 θ

B2⇒

r2⊥ = r2 − (r ·B)2

B2

donde θ es el angulo entre r y B. Con base en esto definimos el operador vectorial R⊥ como la proyeccion de Rsobre un plano perpendicular a B

R2⊥ ≡ R2 − (R ·B)2

B2(14.15)

en particular si B = Bu3 tenemos que

R2⊥ = X2

1 +X22

reemplazando (14.15) en (14.14) y recordando que R×P es el momento angular orbital cuantico, tenemos

[P− qA (R)]2 = P2 +q2B2

4R2

⊥ − qL ·B (14.16)

reemplazando (14.16) en el Hamiltoniano (14.11) tenemos

H =1

2me

[P2 +

q2B2

4R2

⊥ − qL ·B]+ V (R)

H ≡ H0 +H1 +H2 ; H0 ≡P2

2me+ V (R) , H1 ≡ −µB

~[L ·B] , H2 ≡

q2B2

8meR2

⊥ (14.17)

µB ≡ q~

2me; R2

⊥ ≡ R2 − (R ·B)2

B2(14.18)

donde H0 es el Hamiltoniano “no perturbado” asociado al atomo de Hidrogeno libre. Notese que cuando B 6= 0 elmomento mecanico ya no es P sino [P− qA (R)], por tanto la energıa cinetica sera [P− qA (R)]2 /2me. Aun mas,el termino P2/2me depende del gauge escogido. Puede demostrarse que en el gauge definido por la Ec. (14.12)P2/2me es la energıa cinetica “relativa” Π2

R/2me donde ~ΠR es el momento mecanico de la partıcula con respectoa un sistema rotante de Larmor que rota alrededor de B con velocidad angular ωL = −qB/2me. Ası mismo, sepuede demostrar que el termino H2 corresponde a la energıa cinetica Π2

E/2me relativa a la velocidad de arrastre

de este marco de referencia, en tanto que el termino H1 esta asociado al termino cruzado ~ΠR · ~ΠE/me.

Page 377: Mecanica Cuantica: Notas de Clase

14.2. ATOMO DE HIDROGENO EN UN CAMPO MAGNETICO UNIFORME 377

14.2.2. Estimacion numerica de las contribuciones H0, H1 y H2

Haremos un estimativo numerico de las diferencias de energıa ∆E (y las frecuencias correspondientes ∆E/h),asociadas a cada Hamiltoniano. Hemos visto que las diferencias de energıa ∆E0 asociadas a H0 (atomo deHidrogeno libre) son del orden de magnitud de la energıa de ionizacion EI como se aprecia en la Ec. (13.43).Utilizando las Ecs. (13.39) se tiene que

∆E0 ≃ EI =me

2~2e4 =

me

2~2

(~2

mea0

)2

∆E0 ≃ ~2

2mea20;

∆E0

h≃ 1014Hz

ahora usando las Ecs. (14.17) para H1 y teniendo en cuenta que los momentos angulares son del orden de laconstante de Planck, se obtiene

∆E1

h≃ µB

~

[~B]

h= µB

B

h=

q~

2me

B

h=

qB

4πme=

1

qB

2me

∆E1

h≃ ωL

2π; ωL ≡ qB

2me

donde hemos tenido en cuenta (14.18). La cantidad ωL se refiere a la velocidad angular de Larmor. Podemos verque ωL/2π es la mitad de la frecuencia de ciclotron. Para campos tıpicos de laboratorio asumiremos B . 105gauss,con lo cual se obtiene

∆E1

h≃ ωL

2π. 1011Hz ⇒

∆E1 ≪ ∆E0

ahora evaluaremos el orden de magnitud de ∆E2 asociado a H2. Los elementos matriciales del operador R2⊥ =

X21 +X2

2 son de dimensiones atomicas y por tanto del orden de magnitud de a0 (radio de Bohr). Por tanto, de laEc. (14.17) se obtiene

∆E2 ≃ q2B2

8mea20 ⇒ ∆E2

∆E1≃ q2B2

8mea20

hωL=q2B2

8mea20

h

2me

qB⇒

∆E2

∆E1≃ πqBa20

2h

por otro lado∆E1

∆E0≃ h

qB

2me

2mea20

~2=qBa20~

=2πqBa20

h= 4

∆E2

∆E1

vemos que∆E2

∆E1∼ 1

4

∆E1

∆E0

de modo que las diferencias de energıa presentan una clara jerarquıa

∆E2 ≪ ∆E1 ≪ ∆E0

los efectos del campo magnetico son en la practica mucho menores que los del campo electrico interno, ademassera en general suficiente tener en cuenta solo el termino H1 y el termino H2 solo se tendra en cuenta cuando H1

se anule.Aunque el termino H1 es mas importante, analizaremos primero el termino H2 ya que esto permitira justificar

algunas aproximaciones que se usan cuando solo se considera H1

Page 378: Mecanica Cuantica: Notas de Clase

378 CAPITULO 14. CORRIENTES DE PROBABILIDAD Y ACOPLES MAGNETICOS EN ATOMOS

14.2.3. Termino diamagnetico

Hemos dicho que solo consideraremos el efecto de H2 cuando se anule el efecto de H1. Tal es el caso cuandotenemos un estado de momento angular cero en el atomo de Hidrogeno. En la seccion 14.1.1 vimos que la presenciade un campo magnetico uniforme modifica la corriente de probabilidad asociada al electron. Esta corriente tienesimetrıa axial con respecto al eje B. La corriente gira como un todo alrededor de B en la direccion horaria(antihoraria) cuando q > 0 (q < 0). La corriente electrica que se genera tiene asociado un momento magnetico〈M2〉 que como veremos es antiparalelo a B y por tanto esta asociado a una energıa de acople positiva que explicael origen del termino H2.

Para ver esto recurrimos a calcular clasicamente el momento magnetico M2 asociado a una carga q en movi-miento circular de radio r. Si la velocidad de la carga es v su movimiento equivale a una corriente de la forma

i = qv

2πr

la superficie definida por el circuito es S = πr2 de modo que el momento magnetico esta dado por

|M| = |i× S| = qrv

2(14.19)

ahora bien el momento angular ~λ viene dado por

~λ = r×mev = r× (P− qA (r)) = ~L − qr×A (r)

donde ~L es el momento angular canonico. Puesto que la velocidad es tangencial, la magnitud de ~λ esta dada por

|λ| =∣∣∣ ~L − qr×A (r)

∣∣∣ = merv

podemos escribir la Ec. (14.19) en la forma

~M =q

2me

~λ =q

2me

[~L − qr×A (r)

](14.20)

puesto que estamos estudiando el caso L = 0, usando el gauge (14.12) el momento magnetico queda6

~M2 = − q2

2mer×A (r) =

q2

4mer× (r×B) =

q2

4me

[(r ·B) r− r2B

]

vemos que ~M2 es proporcional a B. Por otro lado, si bien ~M2 no es colineal con B, es facil ver que en el estadobase del atomo de hidrogeno (en el cual ~L = 0), el valor esperado de M2 (donde M2 es la cuantizacion de ~M2) esantiparalelo a B. En consecuencia, ~M2 representa el momento magnetico inducido por B en el atomo7. Su energıade acople con B viene dada por

W2 = −∫ B

0

~M2

(B′) · dB′ = −1

2~M2 (B) ·B =− 1

2

q2

4me

[(r ·B) r− r2B

]·B

W2 =q2

8me

[r2B2 − (r ·B)2

]=q2B2

8me

[r2 − (r ·B)2

B2

]

6Debe tenerse en cuenta que cuando m = 0, el momento angular que se anula es el canonico y no el mecanico. Esto tiene que vercon el hecho de que es el momento angular canonico el que se cuantiza.

7Vale recordar que la modificacion de la corriente (con respecto a la que se genera para el atomo libre) se forma gracias al campoelectrico transiente que se induce cuando se conecta el campo magnetico. Ademas, en el estado base no hay corriente ni momentodipolar magnetico permanente.

Page 379: Mecanica Cuantica: Notas de Clase

14.2. ATOMO DE HIDROGENO EN UN CAMPO MAGNETICO UNIFORME 379

y usando la Ec. (14.18) tenemos

W2 =q2

8mer2⊥B

2

cuya cuantizacion conduce al Hamiltoniano H2 descrito en la Ec. (14.17). Vemos entonces que H2 describe elacople entre el campo B y el momento magnetico ~M2 inducido por B en el atomo. Puesto que de acuerdo con laley de Lenz el momento inducido se opone al campo aplicado8, la energıa de acople es positiva. H2 se denominael termino diamagnetico del Hamiltoniano.

14.2.4. Termino paramagnetico

Asumiremos ahora que ~L 6= 0 de modo que el Hamiltoniano H1 es el dominante (con respecto a H2). Larelacion (14.20) nos indica la relacion general entre el momento angular canonico λ y el momento magnetico ~M.Por otro lado, hemos demostrado que la contribucion de H2 sobre ~M esta dada por la Ec. (14.20) con ~L = 0. Portanto para ~L 6= 0 tal ecuacion se puede escribir como

~M = ~M1+ ~M2 ; ~M1 ≡q

2me

~L , ~M2 ≡ − q2

2mer×A (r)

pero el analisis numerico indica que para el atomo de hidrogeno, la contribucion del Hamiltoniano H1 dominasobre la contribucion de H2 siempre que la primera sea no nula (i.e. ~L 6= 0). Por lo tanto, si ~L 6= 0 podemosaproximar el momento magnetico en la forma

~M ≃ ~M1 =q

2me

~L (14.21)

de modo que ~L es practicamente paralelo a ~M y ambos son perpendiculares al plano de la orbita clasica. Laenergıa de acople con B esta dada por

W1 = − ~M1 ·B (14.22)

Al cuantizar las relaciones (14.21, 14.22) se obtiene

M1 =q

2meL ; H1 = −M1 ·B = − q

2meL ·B (14.23)

que coincide con la Ec. (14.17), de modo que el Hamiltoniano H1 corresponde al acople entre el campo magneticoB y el momento magnetico atomico permanente puesto que M1 es independiente de B, es decir M1 existe aunqueno exista campo magnetico. En consecuencia, M1 se genera a traves de la corriente asociada al atomo de Hidrogenolibre (ver seccion 14.1).

De acuerdo con la Ec. (14.23), los autovalores del operador M1 vienen dados por

(q

2me

)m~ ≡ mµB (14.24)

de modo que µB es el “cuanto fundamental” de momento magnetico como lo es ~ del momento angular. Es estehecho lo que le da relevancia al magneton de Bohr µB. Mas adelante veremos que ademas del momento angularorbital L, el electron posee un momento angular intrınseco o espın S, que tambien posee un momento magneticoasociado MS proporcional a S en la forma

MS = 2µB~

S

de hecho la necesidad de introducir este momento magnetico adicional para explicar la estructura fina del atomode Hidrogeno, es una de las evidencias experimentales de la existencia del espın del electron (ver seccion 15.4.2).

8En realidad se opone al cambio de flujo, pero cuando el campo se conecta aumenta desde cero hacia B de modo que el aumentode flujo va en la direccion del campo.

Page 380: Mecanica Cuantica: Notas de Clase

380 CAPITULO 14. CORRIENTES DE PROBABILIDAD Y ACOPLES MAGNETICOS EN ATOMOS

Finalmente, es importante mencionar que el dominio de los efectos paramagneticos sobre los diamagneticos(cuando los primeros son no nulos) se debe al pequeno tamano del radio atomico, que a su vez genera una superficiey un flujo muy pequenos. Por ejemplo, para un electron libre sometido a un campo magnetico, las contribucionesparamagnetica y diamagnetica tienen la misma importancia relativa.

14.3. Efecto Zeeman

Hemos visto los nuevos terminos que aparecen en el Hamiltoniano del atomo de Hidrogeno cuando se introduceun campo magnetico uniforme. A continuacion veremos como estos nuevos terminos modifican el espectro del atomode Hidrogeno. En particular, examinaremos la forma en que se modifica la emision de la lınea optica conocida

como la “lınea de resonancia” (λ ≃ 1200oA) con la inclusion del campo magnetico. Veremos que no solo se cambia

la frecuencia sino tambien la polarizacion de las lıneas atomicas. Esto se conoce como efecto Zeeman.Sin embargo, es necesario aclarar que para predecir el espectro real es necesario incluır el momento angular

intrınseco o espın del electron (e incluso del proton) del cual surge la estructura fina e hiperfina del espectro ymodifica sustancialmente las componentes de la lınea de resonancia. A esto se le conoce usualmente como efectoZeeman anomalo. No obstante, la discusion que realizaremos aquı sera valida cualitativamente.

14.3.1. Corrimiento de los niveles atomicos con la correccion paramagnetica

Estudiaremos la transicion entre el estado base y el estado mas bajo con momento angular no nulo es decirentre los niveles 1s (n = 1, l = m = 0) y 2p (n = 2, l = 1,m = 1, 0,−1)9. Esta transicion corresponde a la lınea deresonancia del atomo de hidrogeno. Aunque el momento angular en el estado base es cero, no lo es en el estado2p, por tanto despreciaremos la respuesta diamagnetica cuando se coloca un campo magnetico B, incluyendo sololas correcciones de H1. Si denotamos |ϕn,l,m〉 los estados comunes de H0, L

2 y L3, se puede ver de inmediato quesi B = Bu3 entonces |ϕn,l,m〉 tambien es autoestado del Hamiltoniano perturbado H0 +H1

(H0 +H1) |ϕn,l,m〉 =(H0 −

µB~

L ·B)|ϕn,l,m〉 =

(H0 −

µB~BL3

)|ϕn,l,m〉

(H0 +H1) |ϕn,l,m〉 = (En −mµBB) |ϕn,l,m〉por tanto si ignoramos el termino diamagnetico, los |ϕn,l,m〉 son aun estados estacionarios de H0 +H1, y solo semodifican los valores de energıa. Adicionalmente, vemos que el espectro se modifica de tal forma que dependeahora de dos numeros cuanticos n y m, removiendo parcialmente la degeneracion (aun existe degeneracion en l).El hecho de que el corrimiento de la energıa (con respecto a la energıa en ausencia de campo magnetico) dependadel numero cuantico m y del campo B, es la razon para denominar a m como numero cuantico magnetico.

Calculemos el espectro de los estados involucrados en la lınea de resonancia

(H0 +H1) |ϕ1,0,0〉 = E1 |ϕ1,0,0〉 = −EI |ϕ1,0,0〉

(H0 +H1) |ϕ2,1,m〉 = (E2 −mµBB) |ϕ2,1,m〉 =(−EI

4−mµBB

)|ϕ2,1,m〉

el nivel de energıa 2p en presencia de B suele escribirse en la forma

EB2p = −EI4

−mµBB = −EI +3

4EI −m

q~

2meB = −EI +

3EI4~

~+m~

(− qB

2me

)

EB2p = −EI + ~ (Ω +mωL) ; Ω ≡ 3EI4~

=E2 − E1

~

donde Ω es claramente la frecuencia de la lınea de resonancia en ausencia de B. En tanto que en presencia de Btal frecuencia de resonancia es (Ω +mωL).

9La transicion mas baja corresponde al paso de 1s a 2s, pero en este caso la respuesta diamagnetica es dominante, ya que el momentoangular es cero en ambos estados.

Page 381: Mecanica Cuantica: Notas de Clase

14.3. EFECTO ZEEMAN 381

14.3.2. Oscilaciones dipolares electricas

El momento dipolar electrico cuantizado del atomo esta dado por

D = qR

para calcular el valor esperado 〈D〉 calculamos los elementos matriciales de D. Bajo paridad el operador D setransforma a −D (ya que bajo paridad R → −R y q → q). El momento dipolar es por tanto un operador impar.Adicionalmente los estados ϕn,l,m (r) tiene paridad bien definida en la base |r〉, esto se debe a que los armonicosesfericos tiene paridad definida teniendo paridad +1 (−1) para l par (impar). En particular se tiene que

〈ϕ1,0,0|D |ϕ1,0,0〉 =⟨ϕ2,1,m′

∣∣D |ϕ2,1,m〉 = 0 ; ∀m,m′ (14.25)

los elementos de matriz no nulos asociados a la lınea de resonancia son entonces no-diagonales. Para calcular loselementos de matrix 〈ϕ2,1,m|D |ϕ1,0,0〉 = q 〈ϕ2,1,m|R |ϕ1,0,0〉 escribiremos a x1, x2, x3 en terminos de armonicosesfericos

x1 = r sin θ cosϕ = r

√2π

3[Y1,−1 (θ, ϕ)− Y1,1, (θ, ϕ)] (14.26)

x2 = r sin θ sinϕ = ir

√2π

3[Y1,−1 (θ, ϕ) + Y1,1 (θ, ϕ)] (14.27)

x3 = r cos θ = r

√4π

3Y1,0 (θ, ϕ) (14.28)

el calculo de los elementos matriciales involucra una integral radial y una angular, en virtud de la separabilidadde las funciones de onda estacionarias. La integral radial la definimos como una cantidad χ

χ ≡∫ ∞

0R2,1 (r)R1,0 (r) r

3 dr (14.29)

la parte angular consiste en productos escalares de armonicos esfericos que se pueden calcular facilmente debidoa sus propiedades de ortogonalidad. Por ejemplo, calculemos el elemento matricial 〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 en la base|r〉, para lo cual aplicamos la Ec. (5.3)

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = q 〈ϕ2,1,1|X1 |ϕ1,0,0〉 = q

∫ϕ∗2,1,1 (r) x1 ϕ1,0,0 (r) d

3r

= q

∫ [R2,1 (r) Y

∗1,1 (θ, ϕ)

]r

√2π

3[Y1,−1 (θ, ϕ)− Y1,1, (θ, ϕ)]

[R1,0 (r) Y0,0 (θ, ϕ)] r

2 dr dΩ

= q

√2π

3

[∫ ∞

0R2,1 (r)R1,0 (r) r

3 dr

]∫dΩ Y ∗

1,1 (θ, ϕ) [Y1,−1 (θ, ϕ)− Y1,1, (θ, ϕ)] Y0,0 (θ, ϕ)

= q

√2π

∫dΩ

[Y ∗1,1 (θ, ϕ)Y1,−1 (θ, ϕ)− Y ∗

1,1 (θ, ϕ)Y1,1, (θ, ϕ)] 1√

=q√6χ δ1,1δ1,−1 − δ1,1δ1,1

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = − q√6χ

donde hemos usado las Ecs. (14.26, 14.29) y la ortonormalidad de los armonicos esfericos. Procediendo de manerasimilar con los otros elementos matriciales se obtiene

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = −〈ϕ2,1,−1|Dx1 |ϕ1,0,0〉 = − qχ√6

; 〈ϕ2,1,0|Dx1 |ϕ1,0,0〉 = 0 (14.30)

〈ϕ2,1,1|Dx2 |ϕ1,0,0〉 = 〈ϕ2,1,−1|Dx2 |ϕ1,0,0〉 =iqχ√6

; 〈ϕ2,1,0|Dx2 |ϕ1,0,0〉 = 0 (14.31)

〈ϕ2,1,1|Dx3 |ϕ1,0,0〉 = 〈ϕ2,1,−1|Dx3 |ϕ1,0,0〉 = 0 ; 〈ϕ2,1,0|Dx3 |ϕ1,0,0〉 =qχ√3

(14.32)

Page 382: Mecanica Cuantica: Notas de Clase

382 CAPITULO 14. CORRIENTES DE PROBABILIDAD Y ACOPLES MAGNETICOS EN ATOMOS

se concluye que si el sistema esta en un estado estacionario, la cantidad 〈D〉 es cero ya que los elementos diagonalesse anulan. Supondremos entonces que el sistema esta inicialmente en una superposicion del estado base 1s y unode los estados 2p.

ψ (0) = cosα |ϕ1,0,0〉+ sinα |ϕ2,1,m〉donde m asume uno de sus valores permitidos 1, 0,−1. Consideraremos a α como un parametro real, aplicando laevolucion temporal de un sistema conservativo calculamos la evolucion temporal de este estado

|ψm (t)〉 = eiEI t/~ cosα |ϕ1,0,0〉+ ei[EI−~(Ω+mωL)] t/~ sinα |ϕ2,1,m〉= eiEI t/~

cosα |ϕ1,0,0〉+ e−i(Ω+mωL) t sinα |ϕ2,1,m〉

|ψm (t)〉 = cosα |ϕ1,0,0〉+ e−i(Ω+mωL) t sinα |ϕ2,1,m〉 (14.33)

donde hemos omitido la fase global irrelevante en el ultimo paso. Calcularemos 〈D〉 cuando el sistema esta en elestado |ψm (t)〉 en el tiempo t. Usando las Ecs. (14.25, 14.30, 14.31, 14.32, 14.33), obtendremos el valor esperadode D para los casos m = 1, 0,−1. Para m = 1 obtenemos

〈ψm=1 (t)|Dx1 |ψm=1 (t)〉 =[cosα 〈ϕ1,0,0|+ ei(Ω+ωL) t sinα 〈ϕ2,1,1|

]Dx1

×[cosα |ϕ1,0,0〉+ e−i(Ω+ωL) t sinα |ϕ2,1,1〉

]

= cos2 α 〈ϕ1,0,0|Dx1 |ϕ1,0,0〉+ e−i(Ω+ωL) t cosα sinα 〈ϕ1,0,0|Dx1 |ϕ2,1,1〉+ei(Ω+ωL) t sinα cosα 〈ϕ2,1,1|Dx1 |ϕ1,0,0〉+ sin2 α 〈ϕ2,1,1|Dx1 |ϕ2,1,1〉

= − qχ

2√6e−i(Ω+ωL) t sin 2α − qχ

2√6ei(Ω+ωL) t sin 2α

= − qχ√6sin 2α

[e−i(Ω+ωL) t + ei(Ω+ωL) t

2

]

〈ψm=1 (t)|Dx1 |ψm=1 (t)〉 = − qχ√6sin 2α cos [(Ω + ωL) t]

y se procede de manera similar com m = 0,−1. Los resultados son:

〈Dx1〉m=1 = − qχ√6sin 2α cos [(Ω + ωL) t] ; 〈Dx2〉m=1 = − qχ√

6sin 2α sin [(Ω + ωL) t] ; 〈Dx3〉1 = 0 (14.34)

〈Dx1〉m=0 = 〈Dx2〉m=0 = 0 ; 〈Dx3〉m=0 =qχ√3sin 2α cos Ωt (14.35)

〈Dx1〉m=−1 =qχ√6sin 2α cos [(Ω− ωL) t] ; 〈Dx2〉m=−1 = − qχ√

6sin 2α sin [(Ω− ωL) t] ; 〈Dx3〉m=−1 = 0(14.36)

estas ecuaciones muestran que: (a) El vector 〈D〉m=1 (t) rota en el plano X1X2 alrededor de X3, en direccionantihoraria con velocidad angular Ω + ωL.(b) El vector 〈D〉m=0 (t) oscila a lo largo de X3 con frecuencia angularΩ. (c) El vector 〈D〉m=−1 (t) rota en el plano X1X2 alrededor de X3 pero en direccion horaria con velocidadangular Ω− ωL.

14.3.3. Frecuencia y polarizacion de la radiacion emitida

En los tres casos m = 1, 0,−1; el valor medio del dipolo electrico es una funcion oscilante del tiempo. Por lotanto, dicho dipolo debe radiar.

Puesto que las dimensiones atomicas son mucho menores que la longitud de onda optica, la radiacion de losatomos a grandes distancias se puede tratar como la de un dipolo puntual. Asumiremos que la radiacion emi-tida o absorbida por el atomo durante la transicion entre el estado |ϕ2,1,m〉 y el estado base, se puede predecir

Page 383: Mecanica Cuantica: Notas de Clase

14.3. EFECTO ZEEMAN 383

correctamente utilizando la teorıa clasica de la radiacion. Un tratamiento riguroso del problema requiere la cuan-tizacion del campo electromagnetico (electrodinamica cuantica), que predice el comportamiento de los fotones yla forma en que estos se emiten en la radiacion. Sin embargo, los resultados obtenidos por el metodo semi-clasicoque abordaremos (en donde la materia se trata cuanticamente y la radiacion se trata clasicamente), predicen ladistribucion de la radiacion en muy buena aproximacion.

Supondremos que tenemos una muestra que contiene un gran numero de atomos de hidrogeno y que losexcitamos de alguna manera10 al estado 2p. En la mayorıa de experimentos la excitacion de los atomos es isotropicay los tres estados |ϕ2,1,m〉 ocurren con la misma probabilidad. En primer lugar, estudiaremos la distribucion angularde la radiacion y de la polarizacion para cada m fijo, y posteriormente se superponen los resultados para encontrarel espectro que se observa.

Cuando m = 1, la frecuencia angular de la radiacion emitida es Ω + ωL segun la Ec. (14.34). De modo queel campo magnetico corre ligeramente la frecuencia de la lınea optica (recordemos que Ω es la frecuencia de lalınea optica en ausencia de B). De acuerdo con la teorıa electromagnetica clasica, un dipolo rotante como 〈D〉1 (t)emite radiacion en la direccion u3 con polarizacion circular de helicidad positiva σ+. Por otro lado, la radiacionemitida en el plano X1X2 esta linealmente polarizada (paralela a este plano) en otras direcciones la polarizaciones elıptica.

Para m = 0, el dipolo oscila linealmente en la direccion u3. Las Ecs. (14.35) muestran que la frecuencia angulares Ω, es decir igual a la asociada a la ausencia de B, esto se debe a que el corrimiento de la frecuencia debidaal campo es proporcional a m. En este caso la electrodinamica clasica predice que su polarizacion es lineal entodas las direcciones. En particular, para una direccion de propagacion sobre el plano X1X2, esta polarizaciones paralela a u3 (polarizacion π). Ademas no se emite radiacion en la direccion u3, ya que un dipolo que oscilalinealmente no radıa en la direccion de su eje de oscilacion.

En el caso m = −1, las Ecs. (14.36) muestran que la frecuencia angular de la radiacion emitida es Ω− ωL. Ladistribucion angular de la radiacion es similar al caso m = 1. Sin embargo, puesto que el dipolo 〈D〉m=−1 gira enla direccion opuesta a 〈D〉m=1, la polarizacion elıptica y circular tiene helicidad opuesta a la correspondiente am = 1.

Si ahora asumimos que hay un numero igual de atomos conm = 1, 0,−1, tenemos que se emiten tres frecuenciasbien definidas en todas direcciones (Ω+mωL conm = 1, 0,−1). La polarizacion asociada am = 0 es lineal y la de lasotras dos es en general elıptica. Notese que en la direccion de propagacion perpendicular a B las tres polarizacionesson lineales, la de m = 0 esta polarizada en la direccion de B y las otras dos en direccion perpendicular a B.Las Ecs. (14.34, 14.35, 14.36) nos muestran ademas que la intensidad de la lınea central m = 0 es dos veces la decada una de las lıneas corridas. En la direccion paralela a B solo hay radiacion debida a m = ±1 con frecuencias(Ω± ωL) /2π, ambas asociadas a polarizacion circular pero de helicidad opuesta σ±.

Hemos visto que un campo magnetico constante remueve parcialmente la degeneracion asociada a la energıade un atomo de hidrogeno, ya que la energıa ahora depende de los numeros cuanticos n y m. Es este efecto el quele da el nombre de numero cuantico magnetico al valor propio de L3 (y de cualquier momento angular J3).

10Por ejemplo, haciendo incidir un haz de luz muy monocromatica cuyos fotones tengan una energıa igual a la necesaria para realizarla transicion 1s → 2p.

Page 384: Mecanica Cuantica: Notas de Clase

Capıtulo 15

Momento angular intrınseco

15.1. Comportamiento clasico de atomos paramagneticos inmersos en un

campo magnetico

Asumamos que el atomo bajo estudio es neutro de modo que no esta sujeto a la fuerza de Lorentz cuando sele aplica un campo magnetico B. Para una gran cantidad de atomos neutros inmersos en un campo magneticoB, es posible demostrar que cuando domina el termino paramagnetico, el momento dipolar magnetico electronico(primer termino en la expansion multipolar magnetica de la distribucion) es proporcional al momento angularelectronico para un nivel atomico dado1

~M = γL (15.1)

la constante de proporcionalidad se denomina factor giromagnetico del nivel bajo consideracion2. La fuerza re-sultante F sobre el atomo neutro paramagnetico, se puede obtener de la energıa potencial W dada en la Ec.(14.22)

W = − ~M·B ; F = ∇(~M·B

)

El torque asociado (tomando el origen en la posicion del centro del atomo) es

~τ = ~M×B

y puesto que el teorema del momento angular nos dice que

dL

dt= ~τ

se tiene quedL

dt= ~M×B = γL×B

esto nos muestra que L es perpendicular a su razon de cambio y adicionalmente, la razon de cambio es perpendicularal campo magnetico B. Si B es constante en el tiempo en el punto donde se evalua, esto indica que L no cambiade magnitud y precesa alrededor del eje definido por el campo magnetico, el angulo θ entre B y L permanececonstante y la velocidad angular de precesion es ω = γ |B|. Ahora bien, puesto que ~M es paralelo a L y susmagnitudes estan relacionadas por una constante, concluımos que tambien ~M conserva su magnitud y precesacon el mismo angulo θ y la misma velocidad angular ω alrededor de B.

Si definimos al eje X3 a lo largo de B, para calcular la fuerza F podremos en buena aproximacion despreciaren W los terminos proporcionales a M1 y M2 tomando a M3 como constante. Esto se debe a la tendencia natural

1Hemos visto esta caracterıstica para atomos de Hidrogeno en la seccion 14.2.4. Sin embargo, esto se puede extrapolar para atomosde varios electrones.

2Antes del advenimiento de la teorıa cuantica, la espectroscopıa permitıa distinguir entre diferentes estados de un atomo.

384

Page 385: Mecanica Cuantica: Notas de Clase

15.2. EXPERIMENTO DE STERN-GERLACH 385

de los atomos a alinear su momento magnetico con el campo magnetico, si bien existen componentes “laterales”M1 y M2 estas tienden a cancelarse cuando se toma un promedio temporal que comprenda muchos periodos deprecesion y dado que las frecuencias de precesion son tan altas, solo estos promedios temporales de M1 y M2

juegan un papel en W y estos promedios son cero, ya que todas las direcciones ocurren en la precesion con igualmagnitud. Adicionalmente, cuando se tiene en cuenta el efecto sobre muchas partıculas, la cancelacion estadısticafunciona aun mejor. La fuerza sera entonces aproximadamente

F = ∇ (M3B3) = M3∇B3

notese que la fuerza resultante serıa cero si el campo es uniforme independientemente de su intensidad. Por tanto,una fuerza significativa requiere un alto gradiente del campo. Si asumimos por simplicidad que B3 solo varıa a lolargo de X3, es decir si ∂B3/∂x1 = ∂B3/∂x2 = 0 la fuerza sobre el atomo sera paralela al eje X3 y proporcionala M3. Si asumimos que tenemos una gran cantidad de atomos, se espera que los momentos magneticos de estosesten orientados aleatoriamente antes de la aplicacion del campo, pues tales orientaciones estaran dictaminadaspor fluctuaciones termicas que son de naturaleza aleatoria3. Por tanto, antes de la aplicacion del campo todoslos valores de M3 entre − |M| y |M| estan presentes, en otras palabras, el angulo θ entre B y ~M puede tomarcualquier valor entre 0 y π.

15.2. Experimento de Stern-Gerlach

Figura 15.1: (a) En el experimento de Stern-Gerlach, los atomos de plata que se emiten a alta temperatura del hornoE son colimados en F para luego ser deflectados por el gradiente de campo magnetico creado por el electroiman A.Finalmente, el atomo es registrado en el punto N de la pantalla P. (b) Vista frontal del electroiman. El haz incidesobre el eje X2 perpendicular al papel.

3Esto implica despreciar posibles correlaciones entre los diferentes momentos magneticos de los atomos.

Page 386: Mecanica Cuantica: Notas de Clase

386 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

Stern y Gerlach realizaron un experimento en 1922 para estudiar la deflexion de un haz de atomos neutrosparamagneticos en un campo magnetico de alto gradiente.

El montaje se muestra en la Fig. 15.1a. En un horno E se colocan atomos neutros de plata (que son para-magneticos) y se calientan a alta temperatura, luego se dejan escapar por un pequeno agujero y se propagan enlınea recta en el alto vacıo del montaje. El agujero colimador permite solo el paso de atomos en cierta direccionque elegimos como eje X2. El haz colimado en esta forma entra entonces a un electroiman A para ser deflectadoantes de impactar la pantalla P .

De acuerdo con la teorıa clasica, si queremos producir una deflexion apreciable, el electroiman debe producirun campo B de alto gradiente. Una forma de lograrlo es a traves de un iman configurado como se ilustra en laFig. 15.1b. El campo magnetico generado tiene un plano de simetrıa (el plano X2X3) que contiene la direccioninicial del haz colimado. Si despreciamos efectos de borde el campo magnetico no tiene componente en la direccionX2, por tanto el efecto sobre el haz es el mismo en cualquier punto sobre el eje X2 dentro del electroiman. Lacomponente mas grande de B es en la direccion de X3, ademas la variacion del campo a lo largo de X3 es muyfuerte, esto ocurre gracias a la configuracion angulosa del polo norte que produce una gran acumulacion de lıneasde campo en la vecindad del angulo, en tanto que en el polo sur la densidad de lıneas es mucho menor. Puesto queel campo magnetico es solenoidal (∇ · B = 0), este debe adquirir una componente en la direccion X1 que varıacon la distancia x1 al plano de simetrıa X2X3.

La simetrıa del electroiman muestra claramente que ∂B3/∂x2 = 0 ya que el campo magnetico no depende dex2. Ademas ∂B3/∂x1 = 0 en todos los puntos del plano de simetrıa X2X3.

En virtud de que el experimento reune todas las condiciones descritas en la seccion 15.1, concluımos que ladeflexion HN de un atomo que golpea la pantalla es proporcional a M3 y por tanto a L3. En consecuencia,medir HN es equivalente a medir M3 o L3. Puesto que los momentos magneticos de los atomos de plata estabandistribuıdos isotropicamente antes de entrar en el electroiman, los valores de M3 toman todos los valores posibles(para una gran cantidad de atomos) entre − |M| y |M|. Por tanto, esperamos que se forme sobre la pantallaun patron contınuo simetrico con respecto a H, sobre la pantalla P . En otras palabras, se espera que hayaimpactos sobre todos los puntos en el intervalo N1, N2 de manera mas o menos uniforme, donde N1 (cota maxima)corresponde al caso en que M3 toma el valor maximo M3 = |M| y N2 corresponde al caso en el cual M3 toma elvalor mınimoM3 = − |M|. Desde el punto de vista experimental efectos tales como la dispersion de las velocidadesy el tamano finito del colimador ocasionaran que atomos con el mismo valor de M3 no golpeen en el mismo punto,sino en una vecindad de un punto que corresponde a la velocidad promedio de una partıcula que pasa por el centrodel colimador. Por tanto el resultado clasico predice una distribucion como la lınea punteada de la Fig. 15.2, queva un poco mas alla de N1 y N2 por aspectos experimentales.

15.3. Resultados del experimento y el momento angular intrınseco

En el experimento no se observo una distribucion homogenea a lo largo de [N1, N2] como predecıa el modeloclasico. Lo que se observo fueron dos manchas bien definidas centradas en N1 y N2 simetricas con respecto a H,como lo muestran las lıneas contınuas de la Fig. 15.2. Puesto que el ancho de estas manchas era mucho menor queel ancho de N1 y N2; esto hacıa sospechar que la deflexion estaba “cuantizada” en dos haces bien definidos. Estehecho se puede confirmar disminuyendo el tamano del colimador y/o disminuyendo la dispersion de velocidadesdel haz (con un filtro de velocidades colocado antes del electroiman). Si la cuantizacion existe, lo anterior debedisminuir el ancho de las manchas alrededor de N1 y N2. La formacion de dos zonas de impacto “cuantizadas”esta en franca contradiccion con la teorıa clasica.

Podrıa pensarse por ejemplo que esta cuantizacion proviene de la cuantizacion del momento angular clasico(que a su vez conducirıa a la cuantizacion de M si asumimos que se mantiene la relacion 15.1) hay varias razonespara rechazar este hipotesis como veremos a continuacion.

En primer lugar, mostraremos que bajo las condiciones de este experimento no es necesario tratar los grados delibertad de posicion y momento cuanticamente. Para esto debemos verificar que para describir el movimiento de losatomos de plata, es posible construır paquetes de onda cuyo ancho ∆x3 y cuya dispersion ∆p3 sean completamente

Page 387: Mecanica Cuantica: Notas de Clase

15.3. RESULTADOS DEL EXPERIMENTO Y EL MOMENTO ANGULAR INTRINSECO 387

Figura 15.2: La lınea contınua nos muestra las dos manchas bien localizadas alrededor de los puntos N1 y N2, quese obtuvieron en el experimento de Stern-Gerlach. La lınea punteada nos muestra la prediccion clasica.

despreciables con respecto a la escala de longitudes y momentos que se manejan en el experimento. Estos anchosdeben cumplir el principio de incertidumbre

∆x3∆p3 & ~

la masa M de un atomo de plata es de 1,8× 10−25kg. Los anchos ∆x3 y ∆v3 = ∆p3/M deben ser tales que

∆x3∆v3 &~

M≃ 10−9M.K.S.A. (15.2)

ahora veamos cuales son las longitudes y velocidades tıpicas en el experimento. El ancho del colimador F es deunos 10−4m, la separacion entre N1 y N2 entre las manchas es de varios milımetros. La distancia sobre la cualel campo magnetico varıa apreciablemente se puede deducir de los valores del campo en medio del electroiman(B ≃ 104gauss) y su gradiente (∂B/∂x3 ≃ 105gauss/cm), que nos da

B

∂B/∂x3≃ 10−3mt

ahora la velocidad de un atomo de plata que abandona el horno a una temperatura de 103K es del orden de500m/s. Para haces bien colimados, la dispersion de las velocidades a lo largo de X3 no es mucho menor a variosmetros por segundo. De lo anterior, es posible encontrar valores de ∆x3 y ∆v3 que satisfagan la relacion (15.2)

Page 388: Mecanica Cuantica: Notas de Clase

388 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

que proviene de la relacion de incertidumbre, y que al mismo tiempo sean mucho menores que todas las escalas delongitud y velocidad del experimento. Por tanto, los observables r y p se pueden tratar como clasicos y podemospensar en paquetes casi puntuales que se mueven sobre trayectorias clasicas. La cuantizacion de estos observables(o de otros que dependan de estos como el momento angular) darıa una enorme cantidad de valores propios quesimularıan un contınuo, esto estarıa muy lejos de explicar una cuantizacion tan drastica en tan solo dos estados.

Una segunda razon es que los momentos angulares orbitales cuanticos l (l + 1) ~2 solo pueden tener valores del enteros. Esto implica que el numero de proyecciones posibles a lo largo de X3 para un l dado, es siempre unnumero impar (2l+1) como se observa en la Ec. (14.24) Pag. 379. Lo anterior entrarıa en conflicto con la idea detener un numero par de “auto resultados” que en este caso son dos.

Si asumimos que la deflexion aun se da por el acople del campo con un momento angular (es decir que aunhay un momento angular que cumpla la Ec. 15.1) este momento angular debe tener solo dos proyecciones posiblesa lo largo de X3, es decir

2j + 1 = 2

lo cual nos lleva a j = 1/2. De esto se concluye que si el observable asociado a la deflexion observada es aunun momento angular, no puede ser un momento angular orbital, ya que para estos los valores semienteros estanexcluıdos por razones de periodicidad. El observable asociado no proviene entonces de la cuantizacion de unmomento angular clasico y se conoce como momento angular intrınseco o espın.

15.4. Evidencia experimental del momento angular intrınseco del electron

Existen numerosas evidencias experimentales de la existencia del espın en los electrones. En particular, laspropiedades magneticas de muchas sustancias requieren tener en cuenta esta propiedad. A manera de ejemplo, laexplicacion del ferromagnetismo requiere el espın del electron como componente esencial.

En esta seccion solo citaremos dos propiedades a nivel atomico que evidencian la existencia de un momentoangular intrınseco del electron: La estructura fina de las lıneas espectrales atomicas y el efecto Zeeman anomalo

15.4.1. Estructura fina de las lıneas espectrales

La teorıa del atomo de Hidrogeno desarrollada en el capıtulo 13 considero al electron como una partıculapuntual cuyo estado se puede describir con una funcion de onda espacial ϕ (x, y, z). Los resultados obtenidos enel capıtulo 13 describen el espectro de emision y absorcion del atomo de Hidrogeno con buena precision, ası comolos niveles de energıa y las reglas de seleccion que nos indican las frecuencias de Bohr permitidas en el espectro.

Sin embargo, un estudio de alta resolucion del espectro nos revela ciertas diferencias que aunque pequenas sonobservables. Estas diferencias se deben principalmente a dos aspectos: las correcciones relativistas y los efectos deintroducir un campo magnetico que interactue con el atomo.

En lo que respecta a la estructura fina del espectro del atomo de hidrogeno, se observo que cada lınea poseevarias componentes, es decir para un nivel de energıa dado n hay realmente varias energıas muy cercanas entre sı.Por supuesto, las diferencias entre energıas de un mismo nivel son mucho menores que las diferencias entre energıasde niveles distintos, razon por la cual la concordancia con los experimentos de baja resolucion era buena. Por lotanto, debe introducirse alguna correccion a la teorıa desarrollada en el capıtulo 13 para explicar el desdoblamientode las lıneas espectrales allı predichas.

15.4.2. Efecto Zeeman anomalo

En la seccion 14.3, vimos que cuando un atomo se coloca en un campo magnetico uniforme, cada una de laslıneas (es decir, cada componente de la estructura fina) se desdobla en ciertas lıneas equidistantes, donde la brechaes proporcional al campo magnetico y al numero cuantico magnetico, esto se conoce como efecto Zeeman. Losdesarrollos en la seccion 14.3, muestran que este efecto se puede explicar usando el formalismo cuantico hasta

Page 389: Mecanica Cuantica: Notas de Clase

15.5. MOMENTO ANGULAR INTRINSECO EN LA CUANTICA NO-RELATIVISTA 389

ahora descrito. La explicacion teorica se basa en la relacion del momento dipolar magnetico M con el momentoangular orbital del electron

M =µB~

L ; µB =q~

2me(15.3)

donde µB se conoce como el “magneton de Bohr”. Sin embargo, la teorıa presentada en el capıtulo 14 solo estaen concordancia con el experimento en algunos casos que llamaremos “efecto Zeeman” normal. En otros casos,sin embargo aparece un “efecto Zeeman anomalo” que resulta particularmente sustancial en atomos con numeroatomico impar (en particular, el atomo de Hidrogeno), ya que sus niveles se dividen en un numero par de subnivelesen tanto que la teorıa predice que el numero de subniveles debe ser impar ya que es igual a 2l+1 con l entero. Siasumimos que en el efecto Zeeman anomalo el desdoblamiento continua siendo generado por un momento angularJ2, es necesario que el valor propio j (j + 1) ~2 de este momento angular corresponda a j semi-entero para poderexplicar que el numero de subniveles 2j + 1 sea par.

Notese que un experimento del tipo Stern-Gerlach no serıa practico para la medicion del momento angularelectronico debido a que el electron tiene carga neta (monopolo electrico), y la interaccion del momento dipolarmagnetico del electron con el campo es mucho mas debil que la interaccion de Lorentz descrita por qv ×B.

15.5. Introduccion del momento angular intrınseco en el formalismo de la

mecanica cuantica no relativista

Para poder introducir el momento angular intrınseco en el formalismo no relativista de la mecanica cuanticasera necesario introducir algunos postulados adicionales. La teorıa no relativista para incorporar al espın fuedesarrollada por Pauli. Mas adelante, Dirac desarrollo una teorıa relativista que desemboco en la llamada ecuacionde Dirac, en la cual el espın aparece en forma natural debido a la covarianza de la ecuacion con el grupo detransformaciones de Lorentz. Si bien, el espın tambien se puede deducir de las transformaciones no relativistas delgrupo de Galileo, la aparicion del espın es mucho mas natural en las teorıas relativistas.

Sin embargo, dado que la teorıa de Pauli es mas simple que la de Dirac y que estamos desarrollando una teorıano relativista, introduciremos el espın con los postulados de Pauli.

Antes de Pauli, Uhlenbeck y Goudsmit en 1925 propusieron que el electron poseıa un efecto de rotacionque generaba un momento angular intrınseco que llamaron espın (del ingles spin que significa rotacion o giro).Se postula entonces que existe un momento dipolar magnetico MS que esta asociado con el momento angularintrınseco o espın (denotado por S) en la forma

MS = 2µB~

S (15.4)

que tiene la misma estructura que la relacion (15.3) para el momento angular orbital, pero con un factor dedos, que nos dice que el factor giromagnetico de espın es dos veces mayor que el factor giromagnetico orbital.Esta relacion se impuso por razones estrictamente fenomenologicas, con el fin de ajustar la concordancia teorıaexperimento.

Mas adelante, Pauli establecio una forma de incorporar este momento angular intrınseco en el formalismo dela mecanica cuantica no relativista agregando unos postulados sobre estos observables.

Hasta el momento, hemos cuantizado solo observables que dependen de los observables basicos R y P y quedenominaremos observables orbitales, los cuales actuan en el espacio de estados Er que es isometrico e isomorfocon el espacio F de las funciones de onda. Similarmente denominamos espacio orbital de estados a Er.

Dentro de los postulados de Pauli, anadiremos a estos observables orbitales un conjunto de observables deespın en la siguiente forma

(I) El operador de espın S ≡ (S1, S2, S3) es un momento angular, es decir cumple con las reglas de conmutacion(10.6)

[Si, Sj ] = i~εijkSk

Page 390: Mecanica Cuantica: Notas de Clase

390 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

(II) Estos operadores de espın actuan en un espacio de estados de espın Es, en el cual los observables S2

y S3 constituyen un C.S.C.O. Por tanto, Es es expandido por los estados propios comunes de S2 y S3

S2 |s,ms〉 = s (s+ 1) ~2 |s,ms〉 ; S3 |s,ms〉 = ms~ |s,ms〉

de acuerdo con la teorıa general del momento angular, sabemos que s debe ser entero o semientero y que ms tomatodos los valores incluıdos entre −s y s en saltos de unidad. Sabemos tambien que ms es entero (semi-entero) siy solo si s es entero (semi-entero).

III) Una partıcula dada esta caracterizada por un valor unico de espın s y diremos que esta partıcula tieneespın s.

Puesto que |s,ms〉 con s fijo es una base para el espacio de estados de espın Es, dicho espacio es de dimensionfinita 2s + 1. Notese ademas que todos los elementos de Es son estados propios de S2 con el mismo valor propios (s+ 1) ~2.

IV) El espacio de estados E de una partıcula es el producto tensorial4 de Er con Es

E = Er ⊗ Es

consecuentemente, todos los observables de espın conmutan con todos los observables orbitales. Ademas exceptopara s = 0, esto implica que para la caracterizacion del estado de una partıcula no sera suficiente especificar unket de Er. Por ejemplo, los observables X1,X2,X3 constituyen un C.S.C.O. en Er pero no en E , para formar unC.S.C.O. en E debemos agregar un C.S.C.O. del espacio Es, por ejemplo S2 y algun Si (usualmente S3).

Adicionalmente, de las propiedades del producto tensorial, el producto tensorial de los elementos de una base|ϕn〉 en Er con los elementos de una base χi en Es sera una base de E = Er ⊗ Es

|ϕn, χi〉 ≡ |ϕn〉 ⊗ |χi〉

Esto implica que todo estado de una partıcula es una combinacion lineal de estos productos tensoriales

|ψ〉 =∑

n

i

cn,i |ϕn, χi〉 =∑

n

i

cn,i |ϕn〉 ⊗ |χi〉 ; cn,i = 〈ϕn, χi |ψ〉

debemos recordar sin embargo, que no todo estado |ψ〉 ∈ E proviene del producto tensorial de un estado |ϕ〉 ∈ Ercon un estado |χ〉 ∈ Es. Es decir que la relacion

|ψ〉 = |ϕ〉 ⊗ |χ〉 ; |ϕ〉 ∈ Er ; |χ〉 ∈ Es ; |ψ〉 ∈ E (15.5)

no es valida en general. Sin embargo, cuando la relacion (15.5) es valida para un cierto |ψ〉 es claro que

|ψ〉 =∑

n

i

cn,i |ϕn, χi〉 ; cn,i = 〈ϕn |ϕ〉 〈χi |χ〉

Estos postulados conciernen a una teorıa general de espın. El siguiente postulado esta dirigido mas especifica-mente al espın del electron

(V) El electron es una partıcula de espın 1/2 (s = 1/2) y su momento dipolar magnetico intrınseco esta dadopor

MS = (2s + 1)µB~

S = 2µB~

S

que coincide con (15.4).Adicionalmente, los constituyentes nucleares (protones y neutrones) tambien son partıculas de espın 1/2 aunque

su factor giromagnetico es diferente al del electron. Tambien existen partıculas de espın 0, 1/2, 1, 3/2, 2, ...A priori podrıamos estar tentados a pensar que el espın es un efecto del tamano del electron que genera la

posibilidad de que esta partıcula produzca rotaciones. En tal caso, ademas de los observables de posicion (del

4Para detalles sobre productos tensoriales ver seccion 1.32, page 70.

Page 391: Mecanica Cuantica: Notas de Clase

15.6. PROPIEDADES DE UN MOMENTO ANGULAR 1/2 391

centro de masa del electron), sera necesario anadir tres observables asociados a la rotacion (por ejemplo unacuantizacion adecuada de los angulos de Euler). Sin embargo, las rotaciones espaciales deben cumplir relacionesde periodicidad similares a las que se imponen para los armonicos esfericos, lo cual nos exige que s sea entero.La presencia de espın semientero indica que este observable no tiene un origen rotacional, ni puede provenir de lacuantizacion de un momento angular clasico que sea funcion exclusiva de R y P. En el presente tratamiento, elelectron continua siendo una partıcula puntual y el espın no tiene analogo clasico.

15.6. Propiedades de un momento angular 1/2

Puesto que los electrones ası como los nucleones son partıcula de espın 1/2, el espacio de estados Es=1/2 mereceespecial atencion. En esta seccion nos ocuparemos de estudiar solo el espacio E1/2 y en el siguiente nos ocuparemosde caracterizar el espacio de estados completo E = E1/2 ⊗ Er

El espacio de estados E1/2 es de dimension dos. Los autoestados comunes de S2 y S3, que conforman una baseortonormal en E1/2 estan dados por

∣∣∣∣s =1

2, ms =

1

2

⟩,

∣∣∣∣s =1

2, ms = −1

2

⟩≡∣∣∣∣

1

2,1

2

⟩,

∣∣∣∣1

2, − 1

2

Simplificaremos la notacion para estos autoestados comunes de S2 y S3 en la forma∣∣∣∣1

2,1

2

⟩≡ |+〉 ;

∣∣∣∣1

2, − 1

2

⟩≡ |−〉

es comun referirse a los autoestados |±〉, como estado con espın “arriba” y “abajo” respectivamente5. Es claro que

S2 |±〉 =1

2

(1

2+ 1

)~2 |±〉 ; S3 |±〉 = ±1

2~ |±〉

S2 |±〉 =3

4~2 |±〉 ; S3 |±〉 = ±1

2~ |±〉 (15.6)

con relaciones de ortonormalidad y completez

〈+ |+〉 = 〈− |−〉 = 1 ; 〈+ |−〉 = 0 ; |+〉 〈+|+ |−〉 〈−| = Is (15.7)

el estado mas general de espın es entonces una combinacion lineal de esta base

|χ〉 = c+ |+〉+ c− |−〉 (15.8)

siendo c± numeros complejos. Dado que ambos estados |±〉 son autoestados de S2 con el mismo autovalor, cualquiercombinacion lineal de ellos tambien lo es. Por tanto, todos los estados de Es son autoestados de S2 con el mismovalor propio (3/4) ~2, esto implica que S2 es proporcional al operador identidad de Es

S2 =3

4~2Is (15.9)

definiendo los operadores escalera Ec. (10.13), tenemos

S± = S1 ± iS2 (15.10)

Invirtiendo la relaciones (15.10) escribimos

S1 =S+ + S−

2; S2 =

S+ − S−2i

(15.11)

5Este es por supuesto un abuso del lenguaje, ya que ambos estados poseen el mismo espın y se diferencian solo en su momentomagnetico intrınseco.

Page 392: Mecanica Cuantica: Notas de Clase

392 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

La accion de los operadores S± sobre los vectores base esta dada por las Ecs. (10.47) con j = s = 1/2

S+ |+〉 = S− |−〉 = 0 ; S+ |−〉 = ~ |+〉 ; S− |+〉 = ~ |−〉 (15.12)

Los operadores Si,S2, S± poseen el algebra de cualquier momento angular Ecs. (10.14-10.17). Sin embargo,

hay algunas propiedades algebraicas adicionales propias de j = s = 1/2. En lo que sigue tomaremos j = s = 1/2.Las expresiones (15.11) junto con (15.12) nos permiten demostrar ciertas propiedades de los Si y de S±.

Calculemos primero S21 , S

22 , S1S2, S2S1

S21 =

1

4

(S2+ + S2

− + S+S− + S−S+)

; S22 = −1

4

(S2+ + S2

− − S+S− − S−S+)

(15.13)

S1S2 =1

4i

(S2+ − S+S− + S−S+ − S2

−)

; S2S1 =1

4i

(S2+ + S+S− − S−S+ − S2

−)

S1S2 =S2+ − [S+, S−]− S2

−4i

; S2S1 =S2+ + [S+, S−]− S2

−4i

S1S2 =S2+ − 2~S3 − S2

−4i

; S2S1 =S2+ + 2~S3 − S2

−4i

(15.14)

donde hemos usado (10.16). Similarmente podemos calcular los otros productos

S1S3 =1

2(S+S3 + S−S3) ; S3S1 =

1

2(S3S+ + S3S−) (15.15)

S2S3 =1

2i(S+S3 − S−S3) ; S3S1 =

1

2i(S3S+ − S3S−) (15.16)

un estado arbitrario de Es esta dado por (15.8). Por tanto la accion de los operadores S± sobre un estado arbitrariode Es se obtiene combinando (15.12) con (15.8)

S2+ |χ〉 = S2

+ [c+ |+〉+ c− |−〉] = c−S2+ |−〉 = ~c−S+ |+〉 = 0

S2− |χ〉 = S2

− [c+ |+〉+ c− |−〉] = c+S2− |+〉 = ~c+S− |−〉 = 0

S+S− |χ〉 = S+S− [c+ |+〉+ c− |−〉] = c+S+S− |+〉 = ~c+S+ |−〉 = ~2c+ |+〉 = ~2P+ |χ〉S−S+ |χ〉 = S−S+ [c+ |+〉+ c− |−〉] = c−S−S+ |−〉 = ~c−S− |+〉 = ~2c− |−〉 = ~2P− |χ〉

(S+S− + S−S+) |χ〉 = ~2 [P+ + P−] |χ〉 = ~2 |χ〉

y como |χ〉 es arbitrario, se obtiene

S2+ = S2

− = 0 ; S+S− = ~2P+ ; S−S+ = ~2P− ; (S+S− + S−S+) = ~2Is (15.17)

donde hemos definido los proyectores P± de modo que

Es = E+ ⊕ E− ; |χ〉 = |χ〉+ + |χ〉− ; |χ〉± ∈ E± , |χ〉 ∈ EsP± |χ〉 = |χ〉± = c± |±〉

usando (15.17) en (15.13) se obtiene

S21 =

1

4

(S2+ + S2

− + S+S− + S−S+)=

1

4~2Is

S22 = −1

4

(S2+ + S2

− − S+S− − S−S+)=

1

4~2Is

S23 = S2 − S2

1 − S22 =

3

4~2Is −

1

4~2Is −

1

4~2Is =

1

4~2Is

⇒ S21 = S2

2 = S23 =

1

4~2Is (15.18)

Page 393: Mecanica Cuantica: Notas de Clase

15.6. PROPIEDADES DE UN MOMENTO ANGULAR 1/2 393

Ahora utilizando (15.17) en (15.14) se obtiene

S1S2 = − i

4

(S2+ − 2~S3 − S2

−)= i

~

2S3 ; S2S1 = − i

4

(S2+ + 2~S3 − S2

−)= −i~

2S3

⇒ S1S2 + S2S1 = 0 ; S1S2 =i~

2S3 (15.19)

empleando (15.12) en (15.15) tenemos

S1S3 |χ〉 =1

2(S+S3 + S−S3) [c+ |+〉+ c− |−〉] = 1

2(S+ + S−) [c+S3 |+〉+ c−S3 |−〉]

=~

4(S+ + S−) [c+ |+〉 − c− |−〉] = ~c+

4(S+ + S−) |+〉 − ~c−

4(S+ + S−) |−〉

=~2c+4

|−〉 − ~2c−4

|+〉

S1S3 |χ〉 =~2

4[c+ |−〉 − c− |+〉] (15.20)

S3S1 |χ〉 =1

2(S3S+ + S3S−) [c+ |+〉+ c− |−〉] = c+

2(S3S+ + S3S−) |+〉+ c−

2(S3S+ + S3S−) |−〉

=~c+2S3 |−〉+ ~c−

2S3 |+〉 = −~2c+

4|−〉+ ~2c−

4|+〉 = −~2

4[c+ |−〉 − c− |+〉]

S3S1 |χ〉 = −~2

4[c+ |−〉 − c− |+〉] (15.21)

comparando (15.20) con (15.21) teniendo en cuenta que |χ〉 es arbitrario se obtiene

S1S3 + S3S1 = 0

ahora miremos la accion de S2 sobre |χ〉

S2 |χ〉 =S+ − S−

2i[c+ |+〉+ c− |−〉] = c+

S+ − S−2i

|+〉+ c−S+ − S−

2i|−〉 = −c+

~

2i|−〉+ c−

~

2i|+〉

S2 |χ〉 =i~

2[c+ |−〉 − c− |+〉] (15.22)

comparando (15.22) con (15.21) resulta

S3S1 =i~

2S2 (15.23)

similarmente se puede demostrar que

S2S3 + S3S2 = 0 ; S2S3 =i~

2S1 (15.24)

15.6.1. Resumen de resultados

Los observables Si,S2, S± poseen el algebra de un momento angular Ecs. (10.14-10.17). Pero hay algunas

propiedades algebraicas adicionales especıficas de j = s = 1/2. Definiendo el anticonmutador de dos operadorescomo

A,B ≡ AB +BA

Este algebra especıfica esta dada por

S2+ = S2

− = 0 ; S+S− = ~2P+ ; S−S+ = ~2P− ; S+, S− = ~2Is (15.25)

S21 = S2

2 = S23 =

1

4~2Is ; SiSj =

i~

2εijkSk ; Si, Sj = 0 ; i 6= j (15.26)

vale la pena enfatizar que la ultima de las relaciones (15.26) nos dice que para s = 1/2, los operadores de espın Sison anticonmutantes.

Page 394: Mecanica Cuantica: Notas de Clase

394 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

15.6.2. Representacion matricial de los observables de espın

Un operador que actua en Es se puede representar en la base |+〉 , |−〉 con una matriz 2× 2. En particular,usando (15.6, 15.10, 15.12) se puede construır la representacion matricial de los S±, Si y S2 (ver tambien las Ecs.10.60, 10.61 Pag. 324). Esta representacion matricial se puede resumir en la forma

(S) =~

2σ ; σ1 =

(0 11 0

); σ2 =

(0 −ii 0

); σ3 =

(1 00 −1

)

(S2)

=3

4~2Is ≡

3

4~2σ0 ; (S+) = ~

(0 10 0

)≡ ~σ+ ; (S−) = ~

(0 01 0

)≡ ~σ−

puesto que las matrices (~/2) σi y las matrices ~σ± son representaciones de los operadores Si y S± deben cumplirel algebra de estos operadores Ecs. (15.25, 15.26)

[σi, σj ] = 2iεijkσk ; σ21 = σ22 = σ23 = 12×2

σi, σj = 0 ; σiσj = iεijkσk for i 6= j

σ2+ = σ2− = 0 ; σ+σ− = P+ ; σ−σ+ = P− ; σ+σ− + σ−σ+ = Is (15.27)

estas relaciones se pueden verificar explıcitamente. Tambien se puede verificar explıcitamente que

Trσi = 0 ; det (σi) = −1 ; i = 1, 2, 3 (15.28)

Las Ecs. (15.28) son independientes de la base ya que la traza y el determinante son invariantes ante transforma-ciones de similaridad. Podemos verificar tambien la siguiente identidad

(~σ·A) (~σ·B) = 12×2 (A ·B) + i~σ· (A×B) ; ~σ ≡ (σ1, σ2, σ3) (15.29)

donde A y B son vectores arbitrarios u operadores vectoriales cuyas tres componentes conmutan con las compo-nentes de S. No es necesario que A y B conmuten, pero si no conmutan, el orden de aparicion de los operadoresen (15.29) debe ser estricto. La Ec. (15.29) se puede demostrar usando las propiedades (15.27) y la hipotesis deque las componentes de A y B conmutan con las σi. Usaremos sımbolos explıcitos de sumatoria para efectos declaridad

(~σ·A) (~σ·B) =∑

m

n

(σmAm) (σnBn) =∑

m

(σmAm) (σmBm) +∑

m

n 6=m(σmAm) (σnBn)

=∑

m

σ2mAmBm +∑

m

n 6=mσmσnAmBn =

m

12×2AmBm +∑

m

n 6=m

[∑

k

iεmnkσk

]AmBn

= 12×2

m

AmBm + i∑

k

σk∑

m

n 6=mεmnkAmBn = 12×2 (A ·B) + i

k

σk (A×B)k

(~σ·A) (~σ·B) = 12×2 (A ·B) + i~σ· (A×B)

Finalmente, si definimos el conjunto de matrices

σµ ≡ (σ0, ~σ) = (I, σ1, σ2, σ3) (15.30)

cualquier matriz compleja 2× 2 se puede escribir como una combinacion lineal compleja de estas cuatro matrices

M2×2 = cµσµ ; µ = 0, 1, 2, 3

sumando sobre ındices repetidos. Esto se debe a que las cuatro matrices σµ son linealmente independientes yse necesitan cuatro elementos (complejos) para determinar una matriz compleja 2 × 2. Por lo tanto, las cuatro

Page 395: Mecanica Cuantica: Notas de Clase

15.7. DESCRIPCION NO-RELATIVISTA DE PARTICULAS CON ESPIN 1/2 395

matrices σµ forman una base para el espacio vectorial complejo de todas las matrices complejas 2 × 2. Para verla independencia lineal de las matrices, basta con escribir cada matriz compleja 2 × 2 como si fuera un vectorcomplejo de cuatro componentes

σ0 =

(1 00 1

)↔

1001

; σ1 =

(0 11 0

)↔

0110

σ2 =

(0 −ii 0

)↔

0−ii0

; σ3 =

(1 00 −1

)↔

100−1

y calculando el determinante de la matriz compleja 4× 4 que se forma con los vectores comlumna

det

1 0 0 10 1 −i 00 1 i 01 0 0 −1

= −4i 6= 0

de modo que los vectores columna (y por tanto las matrices complejas equivalentes) son linealmente independientes,de hecho son ortogonales, aunque no estan normalizados.

15.7. Descripcion no relativista completa de operadores y estados de partıcu-

las con espın 1/2

Hemos visto como se describen los estados y operadores de Er y de Es por aparte. Pero la descripcion completadel sistema cuantico requiere construır un unico espacio de estados para el formalismo. El espacio de estadoscompleto E para una partıcula de espın 1/2, se construye como el producto tensorial de Er y Es

E = Er ⊗ Es

15.7.1. Construccion de los estados

Si tenemos un operador definido en Er podemos extenderlo al espacio E mediante el producto tensorial con laidentidad de Es. Si A es un operador que transforma sobre Er podemos extenderlo a un operador A′ que transformasobre E en la forma

A′ ≡ A⊗ Is

similarmente un operador B de Es se puede extender a un operador sobre E con la prescripcion

B′ = Ir ⊗B

Sin embargo, no cambiaremos la notacion para estas extensiones y las seguiremos llamando A y B. En particular,podemos obtener un C.S.C.O. en E como la yuxtaposicion de un C.S.C.O. en Er con un C.S.C.O. en Es. Porejemplo, en Es el conjunto S2, S3 forma un C.S.C.O. a esto le podemos anadir un C.S.C.O. de Er para obtener unC.S.C.O. de E . Como ejemplos tenemos

X1,X2,X3,S

2, S3

;P1, P2, P3,S

2, S3

;L2, L3,H,S

2, S3

(15.31)

puesto que todos los kets de E son kets propios de S2, este operador podrıa ser omitido y aun tendrıamos unC.S.C.O. en E . Esto se debe a que estrictamente S3 por sı solo ya forma un C.S.C.O. en Es. Sin embargo, es usual

Page 396: Mecanica Cuantica: Notas de Clase

396 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

dejar S2 dentro del C.S.C.O. ya que si bien es deseable que este contenga el mınimo de operadores posible, no esobligatorio que ası sea.

Vamos a escribir las relaciones con el primero de los C.S.C.O. en la Ec. (15.31). Una base en E se obtiene comoel producto tensorial de las bases en cada espacio

|r, ε〉 ≡ |x1, x2, x3, ε〉 = |r〉 ⊗ |ε〉 , |ε〉 ∈ Es

las componentes xi varıan entre −∞ e ∞ y ε toma los valores +1 o −1 (ındice discreto que realmente significams = ±1/2). Por definicion |r, ε〉 es una base de autovectores comunes a

X1,X2,X3,S

2, S3en E

Xi |r, ε〉 = xi |r, ε〉 ; S2 |r, ε〉 = 3

4~2 |r, ε〉 ; S3 |r, ε〉 = ε

~

2|r, ε〉 ; ε ≡ ±1

puesto que esto es un C.S.C.O. cada |r, ε〉 es unico salvo factores constantes. Dado que |r〉 es ortonormal enEr en el sentido extendido, y |ε〉 es ortonormal en Es (ver Ecs. 15.7) entonces |r, ε〉 es ortonormal en E en elsentido extendido

〈r′ε′ |r, ε〉 =(⟨r′∣∣⊗⟨ε′∣∣) (|r〉 ⊗ |ε〉) = 〈r′ |r〉 〈ε′ |ε〉

〈r′ε′ |r, ε〉 = δ(r− r′

)δεε′

la relacion de completez que nos dice que |r, ε〉 es una base en E es

ε

∫d3r |r, ε〉 〈r, ε| =

∫d3r |r,+〉 〈r,+|+

∫d3r |r,−〉 〈r,−| = IE

por tanto, todo estado |ψ〉 ∈ E se puede expandir en |r, ε〉

|ψ〉 = IE |ψ〉 =∑

ε

∫d3r |r, ε〉 〈r, ε|ψ〉

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉 , ψε (r) ≡ 〈r, ε|ψ〉 (15.32)

donde ψε (r) son las coordenadas o componentes (transformadas de Fourier) en la base |r, ε〉. Estas coordenadaso componentes, dependen de tres ındices contınuos r y del ındice discreto ε. Por tanto, una funcion de onda en Ese especifica a traves de dos funciones de onda espaciales correspondientes a los dos estados de espın

ψ (r) = ψ+ (r) + ψ− (r) (15.33)

ψ± (r) ≡ 〈r,± |ψ〉 (15.34)

como ψ+ (r) y ψ− (r) son estados ortogonales, es usual escribirlos en forma de un arreglo de dos componentesconocido como espinor

[ψ] (r) =

(ψ+ (r)ψ− (r)

)(15.35)

el bra 〈ψ| asociado al espacio dual E∗ se obtiene con el hermıtico conjugado de la Ec. (15.32)

〈ψ| =∑

ε

∫d3r ψ∗

ε (r) 〈r, ε|

conjugando las Ecs. (15.33, 15.34) vemos que

ψ∗ (r) = ψ∗+ (r) + ψ∗

− (r) ; ψ∗± (r) ≡ 〈ψ |r,±〉

Page 397: Mecanica Cuantica: Notas de Clase

15.7. DESCRIPCION NO-RELATIVISTA DE PARTICULAS CON ESPIN 1/2 397

nos dice que el bra 〈ψ| esta representado por dos funciones ψ∗± (r) que se pueden escribir en forma de espinor como

el adjunto de (15.35)[ψ]† (r) =

(ψ∗+ (r) ψ∗

− (r))

(15.36)

el producto escalar entre dos estados |ψ〉 y |ϕ〉, se puede escribir como

〈ψ |ϕ〉 = 〈ψ| IE |ϕ〉 =∑

ε

∫d3r 〈ψ |r, ε〉 〈r, ε|ϕ〉 =

∫d3r

[∑

ε

〈ψ |r, ε〉 〈r, ε|ϕ〉]

〈ψ |ϕ〉 =

∫d3r [〈ψ |r,+〉 〈r,+|ϕ〉+ 〈ψ |r,−〉 〈r,−|ϕ〉]

〈ψ |ϕ〉 =

∫d3r

[ψ∗+ (r)ϕ+ (r) + ψ∗

− (r)ϕ− (r)]

esto tambien se puede escribir en la forma

〈ψ |ϕ〉 =

∫d3r

[(ψ∗+ (r) ψ∗

− (r))( ϕ+ (r)

ϕ− (r)

)]

〈ψ |ϕ〉 =

∫d3r [ψ]† (r) [ϕ] (r)

donde hemos usado (15.35, 15.36). Esta expresion se asemeja a la que se obtiene para el producto interno de dos ketsen Er, pero teniendo en cuenta que en vez de funciones de onda escalares tenemos espinores de dos componentes, demodo que se debe realizar la multiplicacion matricial antes de integrar en el espacio. En particular la normalizacionqueda en la forma

〈ψ |ψ〉 = |ψ|2 =∫d3r [ψ]† (r) [ψ] (r) =

∫d3r

[|ψ+ (r)|2 + |ψ− (r)|2

]= 1 (15.37)

hemos visto que un vector de E no necesariamente es el producto tensorial de un vector en Er por otro en Es. Sinembargo, esto es valido para algunos vectores (en particular los vectores base |r, ε〉), si el vector |ψ〉 en cuestiones de este tipo

|ψ〉 = |ϕ〉 ⊗ |χ〉 ; |ϕ〉 ∈ Er , |χ〉 ∈ Esel espinor asociado tendra una forma simple ya que

|ϕ〉 =∫d3r ϕ (r) |r〉 ; |χ〉 = c+ |+〉+ c− |−〉

usando las Ecs. (15.33, 15.34) se tiene que

ψ± (r) ≡ 〈r,± |ψ〉 = [〈r| ⊗ 〈±|] [|ϕ〉 ⊗ |χ〉] = 〈r |ϕ〉 〈± |χ〉 = ϕ (r) 〈±| [c+ |+〉+ c− |−〉]ψ± (r) = c±ϕ (r)

y los espinores dados en (15.35, 15.36) quedan

[ψ] (r) =

(c+ϕ (r)c−ϕ (r)

)= ϕ (r)

(c+c−

)

[ψ]† (r) = ϕ∗ (r)(c∗+ c∗−

)

si en particular |χ〉 = |+〉 entonces c+ = 1, c− = 0. Resultando

|ψ〉 = |ϕ〉 ⊗ |+〉 ⇒ ψ+ (r) ≡ 〈r |ϕ〉 〈+ |+〉 = ϕ (r) ; ψ− (r) ≡ 〈r |ϕ〉 〈− |+〉 = 0

[ψ] (r) = ϕ (r)

(10

); [ψ]† (r) = ϕ∗ (r)

(1 0

)

similarmente, si |χ〉 = |−〉[ψ] (r) = ϕ (r)

(01

); [ψ]† (r) = ϕ∗ (r)

(0 1

)

Page 398: Mecanica Cuantica: Notas de Clase

398 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

15.7.2. Construccion de operadores

Veremos como se puede caracterizar la accion de los operadores en E . Para ello trabajaremos primero operadoresoriginalmente definidos en Es, despues operadores definidos en Er y finalmente operadores mixtos.

Operadores espinoriales

Asumamos que el operador As esta definido originalmente solo por su accion sobre EsAs |ε〉 =

∣∣ε′⟩

; |ε〉 ,∣∣ε′⟩∈ Es

Su extension como operador sobre E se escribe

A′s ≡ As ⊗ Ir

definimos la accion del operador extendido en la forma

A′s |ψ〉 =

∣∣ψ′⟩ ; |ψ〉 ,∣∣ψ′⟩ ∈ E

expandiendo |ψ〉 en la base |r, ε〉

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉

A′s |ψ〉 =

ε

∫d3r ψε (r)

[A′s |r, ε〉

]

la accion de A′s sobre |r, ε〉 es muy clara, ya que

A′s |r, ε〉 = (As ⊗ Ir) [|r〉 ⊗ |ε〉] = (Ir |r〉)⊗ [As |ε〉] = |r〉 ⊗

∣∣ε′⟩

A′s |r, ε〉 =

∣∣r,ε′⟩

A′s |ψ〉 =

ε

∫d3r ψε (r)

∣∣r,ε′⟩

la extension del operador solo afectara a la parte espinorial de |r, ε〉 y la transformara de la misma forma que lohace el operador original, en tanto que la parte espacial permanece intacta. Estos operadores se pueden representarcomo matrices 2×2 y de aquı en adelante usamos A para denotar al operador extendido6. Tomemos como ejemploa S+, este operador actuando sobre un estado arbitrario |ψ〉 de E nos da

S+ |ψ〉 =∑

ε

∫d3r ψε (r) [S+ |r,ε〉] =

∫d3r ψ+ (r) [S+ |r,+〉] + ψ− (r) [S+ |r,−〉]

S+ |ψ〉 =

∫d3r ψ− (r) [S+ |r,−〉]

donde hemos usado que S+ |+〉 = 0 y por tanto S+ |r,+〉 = 0. Y como S+ |−〉 = ~ |+〉 se tiene finalmente

∣∣ψ′⟩ ≡ S+ |ψ〉 = ~

∫d3r ψ− (r) |r,+〉

las componentes espinoriales de |ψ′〉 son entonces

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = 〈r,+| ~∫d3r′ ψ−

(r′) ∣∣r′,+

⟩= ~

∫d3r′ ψ−

(r′)〈r,+

∣∣r′,+⟩= ~

∫d3r′ ψ−

(r′)〈r∣∣r′⟩〈+ |+〉

= ~

∫d3r′ ψ−

(r′)δ(r− r′

)= ~ψ− (r)

6Por supuesto la representacion matricial de A′s es estrictamente de dimension infinita, pero dado que A′

s = As ⊗ 1r, se tiene quela parte no trivial de la matriz es de dimension finita.

Page 399: Mecanica Cuantica: Notas de Clase

15.7. DESCRIPCION NO-RELATIVISTA DE PARTICULAS CON ESPIN 1/2 399

de manera similar podemos obtener ψ′− (r), con lo cual resulta

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = ~ψ− (r) ; ψ′− (r) ≡ 〈r,−

∣∣ψ′⟩ = 0

[ψ′] (r) = ~

(ψ− (r)

0

)

pero esto tambien se puede escribir como

[ψ′] (r) = ~

(0 10 0

)(ψ+ (r)ψ− (r)

)

[ψ′] (r) = ~σ+ [ψ] (r)

es decir la misma representacion matricial sirve para definir a S+ tanto en Es como en E . ¿Cual es la diferencia?.Formalmente, en Es cada elemento de la matriz es un numero. En cambio en E cada elemento matricial representa aun operador que actua sobre Er, por ejemplo, la matriz σ+ como representacion extendida, rigurosamente significalo siguiente

σ′+ =

(0r Ir0r 0r

)

es decir cada elemento matricial representa a los operadores nulo e identidad del espacio Er. No obstante, desdeel punto de vista practico, esta notacion es innecesaria.

Operadores orbitales

El procedimiento es similar. Asumamos Ax que actua sobre Er, definiendo su extension y su accion sobre unket |ψ〉 de E obtenemos

Ax |r〉 =∣∣r′⟩

; |r〉 ,∣∣r′⟩∈ Er

A′x ≡ Ax ⊗ Is ; A′

x |r, ε〉 =∣∣r′, ε

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉

∣∣ψ′⟩ ≡ A′x |ψ〉 =

ε

∫d3r ψε (r)

[A′x |r, ε〉

]=∑

ε

∫d3r ψε (r)

∣∣r′, ε⟩

∣∣ψ′⟩ ≡ A′x |ψ〉 =

∫d3r

ψ+ (r)

[A′x |r,+〉

]+ ψ− (r)

[A′x |r,−〉

]

como A′x |r,+〉 actua sobre un espacio identico a |r〉 (ya que actua sobre un subespacio unidimensional de Es),

podemos escribir Ax |r,+〉. Igual ocurre para Ax |r,−〉

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = 〈r,+|Ax |ψ〉 = 〈r,+|Ax∑

ε

∫d3x ψε (x) |x, ε〉 =

ε

∫d3x 〈r,+|Axψε (x) |x, ε〉

=∑

ε

∫d3x Ax (r) ψε (x) 〈r,+|x, ε〉 =

∫d3x Ax (r) ψ+ (x) 〈r,+|x,+〉+ ψ− (x) 〈r,+|x,−〉

=

∫d3x Ax (r)ψ+ (x) δ (r− x) = Ax (r)ψ+ (r)

donde Ax (r) denota la forma del operador Ax en la base |r〉, con un procedimiento similar se obtiene ψ′− (r) de

modo que

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = Ax (r)ψ+ (r)

ψ′− (r) ≡ 〈r,−

∣∣ψ′⟩ = Ax (r)ψ− (r)

Page 400: Mecanica Cuantica: Notas de Clase

400 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

[ψ′] (r) =

(Ax (r) 0

0 Ax (r)

)(ψ+ (r)ψ− (r)

)=[Ax (r)⊗ Is

][ψ] (r)

que nos muestra la forma correcta para la extension del operador AxPor tanto, la representacion matricial 2 × 2 del operador es proporcional a la identidad, puesto que no hay

cambio en los estados espinoriales. Los operadores actuan sobre la parte espacial tal como lo hace el operadororiginal. Tomemos como ejemplo a los operadores X1, P1

ψ′ε (r) = 〈r, ε|X1 |ψ〉 = x1ψε (r)

ψ′′ε (r) = 〈r, ε|P1 |ψ〉 =

~

i

∂x1ψε (r)

sus representaciones matriciales son

[X1] =

(x1 00 x1

); [P1] =

~

i

(∂∂x1

0

0 ∂∂x1

)

de nuevo cada elemento de la matriz es un operador sobre Er aunque esta vez es un operador no trivial. En estecaso el operador trivial es sobre los espinores y por eso la matriz es proporcional a la identidad7.

Operadores mixtos

Si un operador es de caracter mixto, sera una matriz 2 × 2 no trivial que actua sobre Es y en donde cadaelemento matricial es un operador no trivial sobre Er. Algunos ejemplos de operadores mixtos que aparecen encuantica son L3S3, S · P. De acuerdo con la teorıa de representaciones, las representaciones matriciales debenmanifestar la preservacion del producto

[L3S3] = [L3] [S3] =

[~

iIs∂

∂ϕ

] [~

2Irσ3

]

=

[~

i

(∂∂ϕ 0

0 ∂∂ϕ

)][~

2

(1 00 −1

)]

[L3S3] =~2

2i

(∂∂ϕ 0

0 − ∂∂ϕ

)

[S ·P] = [S1P1] + [S2P2] + [S3P3] = [S1] [P1] + [S2] [P2] + [S3] [P3]

=

[~

2σ1

] [~

i

∂x1

]+

[~

2σ2

] [~

i

∂x2

]+

[~

2σ3

] [~

i

∂x3

]

=~2

2i

(σ1

∂x1+ σ2

∂x2+ σ3

∂x3

)

[S ·P] =~2

2i

[(0 11 0

)∂

∂x1+

(0 −ii 0

)∂

∂x2+

(1 00 −1

)∂

∂x3

]

[S ·P] =~2

2i

[(0 ∂

∂x1∂∂x1

0

)+

(0 −i ∂

∂x2i ∂∂x2

0

)+

(∂∂x3

0

0 − ∂∂x3

)]

[S ·P] =~2

2i

(∂∂x3

∂∂x1

− i ∂∂x2

∂∂x1

+ i ∂∂x2

− ∂∂x3

)

7Para los operadores espinoriales, son los elementos de la matriz 2× 2 los que son proporcionales a la identidad.

Page 401: Mecanica Cuantica: Notas de Clase

15.8. REPRESENTACION EN LA BASE |P, ε〉 401

vale enfatizar que por construccion, operadores de espacios distintos conmutan.En sıntesis, para un operador arbitrario A de E tal que

A |ψ〉 =∣∣ψ′⟩

podemos asociarle una matriz 2× 2 en la forma

[ψ′] (r) = [A] [ψ] (r)

donde la estructura de la matriz representa la transformacion sobre el espacio de espines y cada elemento de lamatriz representa un operador en el espacio de coordenadas. Un elemento matricial 〈ψ|A |ϕ〉 estara dado por

〈ψ|A |ϕ〉 =∫d3r [ψ]† (r) [A] [ϕ] (r)

expresion similar a la que se encuentra para el espacio de coordenadas, pero teniendo en cuenta que en vez defunciones de onda escalares aquı tenemos espinores de dos componentes. Los productos matriciales deben hacersepara entonces evaluar la integral. Esta representacion solo se usara cuando sea particularmente simple. En generalal igual que en Er suele ser mejor trabajar con los operadores y estados en abstracto hasta donde sea posible.

15.8. Representacion en la base |p, ε〉Un tratamiento similar se puede desarrollar si escojemos los C.S.C.O como P1, P2, P3,S

2, S3. En tal caso labase es |p, ε〉 el producto escalar con la base |r, ε〉 nos da

〈r, ε∣∣p, ε′

⟩= 〈r |p〉 〈ε

∣∣ε′⟩=

eip·r~

(2π~)3/2δεε′ (15.38)

a cada vector |ψ〉 se le asocia un espinor de dos componentes

[ψ](p) ≡

(ψ+ (p)ψ− (p)

); ψ± (p) = 〈p,± |ψ〉

de acuerdo con (15.38) ψ± (p) es la transformada de Fourier de ψ± (r).

ψε (p) = 〈p, ε |ψ〉 =∑

ε′

∫d3r 〈p, ε

∣∣r, ε′⟩ ⟨

r, ε′∣∣ψ〉

ψε (p) =∑

ε′

∫d3r

e−ip·r~

(2π~)3/2δεε′ψε′ (r)

ψε (p) =1

(2π~)3/2

∫d3r e−i

p·r~ ψε (r)

los operadores tambien se representan por matrices 2×2. Cuando el operador original es espinorial la representacionmatricial es identica a la que se encontro para la base |r, ε〉.

15.9. Calculos de probabilidad para estados de espın 1/2

Aplicaremos los postulados de la mecanica cuantica para los observables sobre el espacio de estados E . Imagi-nemos que queremos medir simultaneamente la posicion y la componente del espın de un partıcula de espın 1/2 alo largo de X3. Puesto que R, S3 constituyen un C.S.C.O., hay un unico estado asociado a cada medida de estos

Page 402: Mecanica Cuantica: Notas de Clase

402 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

observables, x1, x2, x3,±~2 . La probabilidad dP (r,+) de que la partıcula se encuentre dentro de un volumen d3r

alrededor del punto r con su espın “arriba” (que es una forma de designar el caso en el cual la componente delespın a lo largo de X3 es +~/2), esta dada por

dP (r,+) = |〈r,+|ψ〉|2 d3r = |ψ+ (r)|2 d3r

donde hemos asumido que la funcion de onda esta normalizada en la forma (15.37). Similarmente la probabilidad deque la partıcula se encuentre dentro de un volumen d3r centrado en r con su espın “abajo” (es decir con lacomponente del espın a lo largo de X3 igual a −~/2), esta dada por

dP (r,−) = |〈r,−|ψ〉|2 d3r = |ψ− (r)|2 d3r

Si lo que queremos es medir la componente del espın a lo largo de X1, debemos tener en cuenta que los autoestados(normalizados) de S1 vienen dados por

|±〉S1=

1√2[|r,+〉 ± |r,−〉] (15.39)

siendo |±〉 los autoestados de S3. Podemos verificar que estos son autoestados de S1 en la siguiente forma

S1 |±〉S1=

1√2S1 [|r,+〉 ± |r,−〉] = 1

2√2(S+ + S−) [|r,+〉 ± |r,−〉] = 1

2√2[S− |r,+〉 ± S+ |r,−〉]

S1 |±〉S1=

~

2√2[|r,−〉 ± |r,+〉] = ± ~

2√2[|r,+〉 ± |r,−〉] = ±~

2|±〉S1

La probabilidad de encontrar al electron en el volumen d3r centrado en r y con componente positiva de espın a lolargo de X1 es

dPS1 (r,+) = |S1 〈r,+|ψ〉|2 d3r =∣∣∣∣1√2[〈r,+|+ 〈r,−|] |ψ〉

∣∣∣∣2

=1

2|[〈r,+|ψ〉+ 〈r,−|ψ〉]|2

dPS1 (r,+) =1

2|ψ+ (r) + ψ− (r)|2 d3r (15.40)

Por supuesto, podemos estar interesados en calcular la probabilidad de que la partıcula posea un momentocentrado en p en un volumen (de momento) d3p y con componente de espın a lo largo de X3 de ±~/2. Para ellousamos las componentes del estado |ψ〉 en la base |p, ε〉, que nos da las transformadas de Fourier de ψ± (r)

ψ± (p) ≡ 〈p,± |ψ〉

la probabilidad ya mencionada sera entonces

dP (p,±) = |〈p,± |ψ〉|2 d3p =∣∣ψ± (p)

∣∣2 d3p

Por otro lado, podemos estar interesados en hacer mediciones incompletas en el sentido de que los observablesasociados a las medidas no formen un C.S.C.O. es decir que las medidas no conducen a determinar el estado demanera unica. Cuando las medidas son incompletas hay varios estados ortogonales asociados al mismo resultadoy debe sumarse los cuadrados de los modulos de las amplitudes correspondientes.

Como ejemplo, si no nos interesa conocer el espın, la probabilidad dP (r) de encontrar a la partıcula en elvolumen d3r centrado en r es igual a

dP (r) =|〈r,+|ψ〉|2 + |〈r,−|ψ〉|2

d3r =

|ψ+ (r)|2 + |ψ− (r)|2

d3r

dado que los dos estados ortogonales |r,+〉 y |r,−〉 estan asociados al mismo resultado r donde sus amplitudes deprobabilidad son ψ+ (r) y ψ− (r).

Page 403: Mecanica Cuantica: Notas de Clase

15.9. CALCULOS DE PROBABILIDAD PARA ESTADOS DE ESPIN 1/2 403

Ahora supongamos que queremos saber la probabilidad de que la partıcula tenga componente S3 igual a +~/2,pero sin importar su ubicacion ni el valor de las demas variables orbitales. Hay un conjunto infinito de estadosortogonales |r,+〉 asociados a este resultado, cuyas probabilidades deben ser sumadas

P+ =

∫d3r |〈r,+|ψ〉|2 =

∫d3r |ψ+ (r)|2

si por ejemplo queremos encontrar la probabilidad de obtener un espın +~/2 a lo largo de X1, debemos integrarla Ec. (15.40) en todo el espacio.

Page 404: Mecanica Cuantica: Notas de Clase

Capıtulo 16

Adicion de momentos angulares

16.1. El problema clasico de la adicion del momento angular

Cuando tenemos un sistema de partıculas el momento angular total del sistema es la suma de los momentosangulares individuales

L =n∑

i=1

ri × pi (16.1)

cuando no hay fuerzas externas, el torque externo sobre el sistema es cero, y el momento angular total es constantede movimiento. Algo similar ocurre cuando el torque neto con respecto a un origen dado es cero, ya que el momentoangular alrededor del mismo origen sera constante de movimiento. En el ultimo caso sin embargo, hay que teneren cuenta que en general al cambiar el origen, el torque puede ser diferente de cero y el momento angular ya nosera constante de movimiento.

Cuando el sistema este aislado, el momento angular total se conserva, sin embargo no necesariamente seconservara el momento angular de cada partıcula, si hay fuerzas internas ellas causaran un cambio en los momentosangulares individuales, de forma que la suma total sea constante. Solo cuando las partıculas no son interactuantespodemos garantizar la conservacion de los momentos angulares individuales, ya que en este caso cada partıculaforma un sistema aislado.

Otro escenario en donde se conserva el momento angular, es en fuerzas centrales. Si tenemos dos partıculas nointeractuantes cada una interactuando con el mismo centro de fuerzas (originada por una tercera partıcula muchomas masiva que las otras), el momento angular de cada partıcula se conserva puesto que cada una esta sometidaa una fuerza central. Pero si hay una interacciona entre las dos partıculas, la fuerza neta sobre la partıcula 1ya no es en general central, por tanto su momento angular ya no necesariamente es constante de movimiento,similarmente ocurre para la partıcula 2. No obstante, si se cumple el principio de accion y reaccion en su formafuerte, el momento angular total de las dos partıculas se conserva por la cancelacion de los torques internos. Enconclusion, en un sistema aislado de partıculas interactuantes solo el momento angular total se conserva pero nolos momentos individuales. Veremos que este fenomeno tiene su contrapartida cuantica.

16.2. Momento angular total en mecanica cuantica

16.2.1. Dos partıculas sin espın bajo una interaccion central

Trabajaremos el sistema de dos partıculas sin espın en mecanica cuantica. Primero asumiremos que no soninteractuantes. El Hamiltoniano en la base de |r1, r2〉 esta dado por

H0 = H1 +H2

H1 = − ~2

2µ1∇2

1 + V (r1) ; H2 = − ~2

2µ2∇2

2 + V (r2) (16.2)

404

Page 405: Mecanica Cuantica: Notas de Clase

16.2. MOMENTO ANGULAR TOTAL EN MECANICA CUANTICA 405

donde µi son las masas, V (r) el potencial central al cual estan sometidas, y ∇2i indica el Laplaciano tomado con

las coordenadas de la partıcula i. Del capıtulo 12 sabemos que L(1) conmuta con H1, y teniendo en cuenta quetodos los observables relacionados con una partıcula conmutan con todos los observables relacionados con la otra,se obtiene [

L(1),H1

]=[L(1),H2

]= 0 (16.3)

argumento similar se tiene para L(2). Estos nos indica que

[L(1),H0

]=[L(2),H0

]= 0

y como L(α) no depende explıcitamente del tiempo, se tiene que cada momento angular es constante de movimientopor aparte, tal como en el caso clasico. Ahora asumimos que las dos partıculas interactuan por medio de unpotencial W (|r2 − r1|) que solo depende de la distancia entre las partıculas, esto implica por supuesto asumir lavalidez de la ley de accion y reaccion. La distancia |r2 − r1| se escribe

|r2 − r1| =√(

x(1)i − x

(2)i

)(x(1)i − x

(2)i

)(16.4)

suma sobre ındices repetidos, el Hamiltoniano se escribe como

H = H1 +H2 +W (|r2 − r1|) (16.5)

con Hi dados por (16.2). Las relaciones (16.3) nos dan

[L(1),H

]=[L(1),H1 +H2 +W (|r2 − r1|)

]=[L(1),W (|r2 − r1|)

]

analicemos por ejemplo la componente L(1)3 , para calcular el conmutador con W debemos aplicar el conmutador

a una funcion de onda arbitraria ψ (r)

[L(1)3 ,W

]ψ (r) =

~

i

(x(1)1

∂x(1)2

− x(1)2

∂x(1)1

)(Wψ)−W

~

i

(x(1)1

∂x(1)2

− x(1)2

∂x(1)1

=~

i

(x(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)ψ +

~

i

(x(1)1

∂ψ

∂x(1)2

− x(1)2

∂ψ

∂x1

)W

−W ~

i

(x(1)1

∂ψ

∂x(1)2

− x(1)2

∂ψ

∂x(1)1

)

=~

i

(x(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)ψ (r)

y como ψ (r) es arbitraria se concluye que

[L(1)3 ,W (|r2 − r1|)

]=

~

i

(x(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)

esta expresion no es necesariamente cero, de modo que L(1) no es en general constante de movimiento. Ahora bien,si definimos el momento angular total L con una expresion analoga al caso clasico Ec. (16.1) tenemos

L = L(1) + L(2)

Page 406: Mecanica Cuantica: Notas de Clase

406 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

obtenemos un operador cuyas tres componentes son constantes de movimiento. Por ejemplo, se ve que

[L3,H] =[L(1)3 + L

(2)3 ,H

]

[L3,H] =~

i

(x(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

+ x(2)1

∂W

∂x(2)2

− x(2)2

∂W

∂x(2)1

)(16.6)

y puesto que W solo depende de |r2 − r1| dada por (16.4) tenemos que

∂W

∂x(1)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(1)i

=∂W

∂ |r2 − r1|

√(x(1)k − x

(2)k

)(x(1)k − x

(2)k

)

∂x(1)i

=∂W

∂ |r2 − r1|2(x(1)k − x

(2)k

)∂

∂x(1)i

(x(1)k − x

(2)k

)

2

√(x(1)m − x

(2)m

)(x(1)m − x

(2)m

) =∂W

∂ |r2 − r1|

(x(1)k − x

(2)k

)δik

√(x(1)m − x

(2)m

)(x(1)m − x

(2)m

)

∂W

∂x(1)i

=∂W

∂ |r2 − r1|x(1)i − x

(2)i

|r2 − r1|

similarmente se calcula ∂W/∂x(2)i se obtiene entonces

∂W

∂x(1)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(1)i

=∂W

∂ |r2 − r1|x(1)i − x

(2)i

|r2 − r1|

∂W

∂x(2)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(2)i

=∂W

∂ |r2 − r1|x(2)i − x

(1)i

|r2 − r1|(16.7)

reemplazando (16.7) en (16.6), resulta

[L3,H] =~

i

1

|r2 − r1|∂W

∂ |r2 − r1|[x(1)1

(x(1)2 − x

(2)2

)− x

(1)2

(x(1)1 − x

(2)1

)

+x(2)1

(x(2)2 − x

(1)2

)− x

(2)2

(x(2)1 − x

(1)1

)]

por tanto tenemos que[L3,H] = 0

y similarmente para las otras componentes. En consecuencia podemos escribir

[L,H] = 0 ; L ≡ L(1) + L(2) (16.8)

De modo que aunque L(1) y L(2) no son individualmente constantes de movimiento, sı lo es su suma L(1) + L(2)

definida como el momento total del sistema, al igual que en el caso clasico.

16.2.2. Una partıcula con espın bajo una interaccion central

En lo anterior asumimos que las partıculas no tienen espın. Vamos a tomar como segundo ejemplo a unapartıcula con espın sujeta a una interaccion de tipo central. El Hamiltoniano para una partıcula sin espın sometidaa una fuerza central Ec. (12.27), conmuta con el momento angular orbital L de la partıcula, y como todos losoperadores de espın conmutan con todos los operadores orbitales, entonces S tambien conmuta con el Hamiltoniano.Por tanto, L y S son cada una constantes de movimiento, cuando el Hamiltoniano de una partıcula bajo una fuerza

Page 407: Mecanica Cuantica: Notas de Clase

16.2. MOMENTO ANGULAR TOTAL EN MECANICA CUANTICA 407

central es puramente orbital. Sin embargo, puede demostrarse que las correcciones relativistas introducen en elHamiltoniano un acoplamiento espın-orbita que es un termino de la forma

HSO = ξ (r)L · S

siendo ξ (r) una funcion conocida de la variable r. Por el momento no analizaremos la procedencia fısica de estetermino, pero sı sus consecuencias. El Hamiltoniano ahora es

H ′ = H + ξ (r)L · S

Y se puede ver que ni L ni S conmutan con el nuevo Hamiltoniano[L3,H

′] = [L3,H +HSO] = [L3,HSO] = ξ (r) [L3, L1S1 + L2S2 + L3S3][L3,H

′] = ξ (r) [L3, L1S1 + L2S2] = ξ (r) [L3, L1]S1 + ξ (r) [L3, L2]S2[L3,H

′] = i~ξ (r) L2S1 − L1S2

similarmente[S3,H

′] = [S3,HSO] = ξ (r) [S3, L1S1 + L2S2 + L3S3][S3,H

′] = ξ (r) [S3, L1S1 + L2S2] = ξ (r)L1 [S3, S1] + ξ (r)L2 [S3, S2][S3,H

′] = i~ξ (r) L1S2 − L2S1 = −[L3,H

′]

vemos entonces que [S3 + L3,H

′] = 0

e igualmente para las otras componentes. De esto se deduce que

J ≡ L+ S

es una constante de movimiento a pesar de que L y S no lo son. Llamaremos a J el momento angular total delsistema.

16.2.3. Analisis general de dos momentos angulares asociados a una fuerza central

Hay varias semejanzas entre los dos ejemplos realizados. En ambos tenemos dos momentos angulares parcialesJ(1) y J(2) que conmutan entre sı. En ambos casos conocemos una base |j1, j2;m1,m2〉 de autovectores de

J2(1), J

(1)3 ,J2

(2), J(2)3 . Tambien ocurre en los dos ejemplos que cada momento angular no es constante de movimiento

(cuando los subsistemas uno y dos se acoplan) pero su suma sı lo es, definiendo

J ≡ J(1) + J(2)

J conmuta con el Hamiltoniano del sistema. Notese que la base de autovectores (conocida) de J2(1), J

(1)3 ,J2

(2), J(2)3

no diagonaliza al Hamiltoniano puesto que este no conmuta con J(1)3 ni con J

(2)3 . En contraste J2 y J3 sı conmutan

con el Hamiltoniano, por tanto una base comun de J2 y J3 hara que la matriz del Hamiltoniano sea diagonal porbloques1, tantos bloques como autosubespacios asociados a los conjuntos de autovalores de J2 y J3. Por tanto,la estructura de la matriz sera mas simple en la base de vectores propios comunes a J2 y J3 que en la base de

vectores comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 .

Puesto que el punto de partida es la base conocida de vectores propios comunes de J2(1), J

(1)3 ,J2

(2), J(2)3 nuestra

tarea sera entonces construır a partir de esta, una nueva base de vectores comunes a J2 y J3, esto nos enfrentaracon el problema de las reglas de adicion o composicion de los momentos angulares J(1) y J(2). Comenzaremos poranalizar algunas propiedades generales de la adicion de dos momentos angulares.

1De hecho existira una base que diagonaliza a los tres operadores simultaneamente.

Page 408: Mecanica Cuantica: Notas de Clase

408 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

16.3. La adicion de dos momentos angulares es otro momento angular

Si tenemos dos momentos angulares arbitrarios J(1) y J(2) ambos sobre espacios diferentes, la suma (de losoperadores extendidos) es tambien un momento angular. Como cada J(α) es un momento angular, se tiene que

[J(1)i , J

(1)j

]= iεijkJ

(1)k ;

[J(2)i , J

(2)j

]= iεijkJ

(2)k

ahora se tiene que

[Ji, Jj ] =[J(1)i + J

(2)i , J

(1)j + J

(2)j

]=[J(1)i , J

(1)j + J

(2)j

]+[J(2)i , J

(1)j + J

(2)j

]

[Ji, Jj ] =[J(1)i , J

(1)j

]+[J(1)i , J

(2)j

]+[J(2)i , J

(1)j

]+[J(2)i , J

(2)j

]

dado que los momentos angulares J(1) y J(2) conmutan por ser de espacios diferentes, se tiene que

[Ji, Jj ] =[J(1)i , J

(1)j

]+[J(2)i , J

(2)j

]= iεijkJ

(1)k + iεijkJ

(2)k = iεijk

[J(1)k + J

(2)k

]

[Ji, Jj ] = iεijkJk

lo cual muestra que si J(1) y J(2) son dos momentos angulares arbitrarios que conmutan entre sı, entonces eloperador

J ≡ J(1) + J(2)

tambien es un momento angular. Todas las propiedades generales de un momento angular seran validas entoncespara J. Tendremos ademas otras propiedades para conmutadores mixtos (que involucren por ejemplo un momentoangular total y un momento angular parcial). En particular, veamos las propiedades de conmutacion de J2

J2 =(J(1) + J(2)

)2= J2

(1) + J2(2) + 2J(1) · J(2) (16.9)

donde hemos tenido en cuenta que J(1) y J(2) conmutan. El producto escalar se puede expresar en terminos de los

operadores escalera J(1)± ,J

(2)± y los operadores J

(1)3 y J

(2)3 .

J(1) · J(2) = J(1)1 J

(2)1 + J

(1)2 J

(2)2 + J

(1)3 J

(2)3 (16.10)

=1

4

(J(1)+ + J

(1)−)(

J(2)+ + J

(2)−)+

1

4i2

(J(1)+ − J

(1)−)(

J(2)+ − J

(2)−)+ J

(1)3 J

(2)3

=1

4

[J(1)+ J

(2)+ + J

(1)+ J

(2)− + J

(1)− J

(2)+ + J

(1)− J

(2)− − J

(1)+ J

(2)+ + J

(1)+ J

(2)−

+J(1)− J

(2)+ − J

(1)− J

(2)−]+ J

(1)3 J

(2)3

J(1) · J(2) =1

2

(J(1)+ J

(2)− + J

(1)− J

(2)+

)+ J

(1)3 J

(2)3 (16.11)

La idea ahora es comparar los conjuntos conmutantesJ2(1), J

(1)3 , J2

(2), J(2)3

;J2, J3

(16.12)

con el fin de averiguar si al conjuntoJ2, J3

de variables conmutantes, le podemos agregar algunos momentos

angulares parciales de modo que aun formen un conjunto conmutante. Es claro que el primer conjunto de operadoresen (16.12) consiste de momentos angulares parciales y el segundo de momentos angulares totales. Puesto que J(1)

y J(2) conmutan con J2(1) y J2

(2), tambien conmuta J

[J,J2

(1)

]=[J,J2

(2)

]= 0

Page 409: Mecanica Cuantica: Notas de Clase

16.4. ADICION DE DOS MOMENTOS ANGULARES CON J(1) = J(2) = 1/2 409

en particular J2 y J3 conmutan con J2(1) y J2

(2)

[J3,J

2(1)

]=

[J3,J

2(2)

]= 0 (16.13)

[J2,J2

(1)

]=

[J2,J2

(2)

]= 0 (16.14)

por otro lado, es obvio que J3 conmuta con J(1)3 y J

(2)3

[J3, J

(1)3

]=[J3, J

(2)3

]= 0 (16.15)

pero J2 no conmuta ni con J(1)3 ni con J

(2)3 , lo cual vemos usando (16.9, 16.10)

[J2, J

(1)3

]=

[J2(1) + J2

(2) + 2J(1) · J(2), J(1)3

]= 2

[J(1) · J(2), J

(1)3

]

[J2, J

(1)3

]= 2

[J(1)1 J

(2)1 + J

(1)2 J

(2)2 , J

(1)3

]= 2

[J(1)1 J

(2)1 , J

(1)3

]+ 2

[J(1)2 J

(2)2 , J

(1)3

]

= 2J(1)1

[J(2)1 , J

(1)3

]+ 2

[J(1)1 , J

(1)3

]J(2)1 + 2J

(1)2

[J(2)2 , J

(1)3

]+ 2

[J(1)2 , J

(1)3

]J(2)2[

J2, J(1)3

]= −2i~J

(1)2 J

(2)1 + 2i~J

(1)1 J

(2)2

quedando finalmente [J2, J

(1)3

]= 2i~

[J(1)1 J

(2)2 − J

(1)2 J

(2)1

](16.16)

y puesto que J es un momento angular, se cumple que

[J2,J

]= 0

y por tanto [J2, J

(1)3 + J

(2)3

]= 0 ⇒

[J2, J

(1)3

]= −

[J2, J

(2)3

]

el analisis anterior nos muestra que el siguiente conjunto de operadores conmuta entre sı

J2, J3, J

2(1), J

2(2)

Abordaremos inicialmente el problema de la adicion de dos momentos angulares con j(1) = j(2) = 1/2.

16.4. Adicion de dos momentos angulares con j(1) = j(2) = 1/2

Cada espacio E(k)1/2 asociado a j(k) fijo, es un espacio de dos dimensiones. Por tanto, su producto tenso-

rial E = E(1)1/2 ⊗ E(2)

1/2 sera de 4 dimensiones. Denotaremos a la base ortonormal “natural” en este espacio por

|ε1〉 ⊗ |ε2〉 ≡ |ε1, ε2〉 y en forma explıcita escribimos

|ε1, ε2〉 = |+,+〉 , |+,−〉 , |−,+〉 , |−,−〉 (16.17)

estos vectores son autoestados de los observables J2(1), J

(1)3 ,J2

(2), J(2)3 . Estrictamente estos operadores deben ser las

extensiones tensoriales de los operadores originales.

J2(1) |ε1, ε2〉 = J2

(2) |ε1, ε2〉 =3

4~2 |ε1, ε2〉 (16.18)

J(1)3 |ε1, ε2〉 = ε1

~

2|ε1, ε2〉 ; J

(2)3 |ε1, ε2〉 = ε2

~

2|ε1, ε2〉 (16.19)

Page 410: Mecanica Cuantica: Notas de Clase

410 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

el conjunto

J2(1), J

(1)3 ,J2

(2), J(2)3 (16.20)

forma para el espacio E = E(1)1/2 ⊗ E(2)

1/2, un C.S.C.O. “natural”, en el sentido de que este es el C.S.C.O. que

se desprende de la base “natural” de E . En otras palabras, la base (16.17) esta compuesta por vectores propios

comunes al C.S.C.O.J2(1), J

(1)3 ,J2

(2), J(2)3

. Estrictamente J2

(1),J2(2) pueden ser excluıdos ya que son proporcionales

a la identidad2.Tambien hemos visto que los 4 observables

J2(1),J

2(2),J

2, J3 (16.21)

conmutan entre sı. Veremos ahora que este conjunto tambien es un C.S.C.O. en E = E(1)1/2 ⊗ E(2)

1/2. Adicionar dos

momentos angulares implica construır el sistema ortonormal de autovectores comunes al conjunto (16.21). Este

conjunto diferira de (16.17) ya que J2 no conmuta con J(1)3 ,J

(2)3 . Denotaremos los vectores de la nueva base en

la forma |J,M〉 donde los autovalores de J2(1),J

2(2) (que permanecen iguales) estan implıcitos3. Estos vectores

satisfacen las relaciones

J2(1) |J,M〉 = J2

(2) |J,M〉 = 3

4~2 |J,M〉 (16.22)

J2 |J,M〉 = J (J + 1) ~2 |J,M〉 (16.23)

J3 |J,M〉 = M~ |J,M〉 (16.24)

ya que J es un momento angular, entonces J debe ser entero o semientero no negativo, M debe estar entre −J yJ variando en saltos unidad. El problema es entonces encontrar los valores que J y M pueden tomar con base enlos valores de j1, j2 y m1,m2, ası como expresar la base |J,M〉 en terminos de la base conocida (16.17).

A continuacion resolveremos el problema diagonalizando las matrices 4×4 que representan a J2 y a J3 en labase |ε1, ε2〉. Mas adelante se empleara un metodo mas general que se puede usar en espacios vectoriales dedimension arbitraria.

16.4.1. Autovalores de J3 y su degeneracion

Notese que para los observables J2(1,2) todos los vectores en el espacio E = E(1)

1/2 ⊗ E(2)1/2 son autovectores, por

tanto |J,M〉 ya son autovectores de estos observables.Por otro lado, las Ecs. (16.13, 16.15) nos dicen que J3 conmuta con los cuatro observables del C.S.C.O. dados

por la Ec. (16.20). Por tanto, esperamos que los vectores base |ε1, ε2〉 sean automaticamente autovectores deJ3. Usando (16.19) se encuentra que

J3 |ε1, ε2〉 =(J(1)3 + J

(2)3

)|ε1, ε2〉 = (ε1 + ε2)

~

2|ε1, ε2〉

vemos entonces que |ε1, ε2〉 es autovector de J3 con autovalor

M~ =1

2(ε1 + ε2) ~ (16.25)

puesto que ε1 y ε2 toman los valores ±1, vemos que M toma los valores +1, 0,−1.

2Notese que la ecuacion (16.18) nos dice que J2(1) = J2

(2), entendidos como extensiones sobre el espacio tensorial, ya que actuan demanera identica sobre todos los elementos de la base. Esto tambien se puede ver teniendo en cuenta que ambos son proporcionalesa la identidad en sus respectivos espacios, y con la misma constante de proporcionalidad. En consecuencia, sus extensiones son

J2(1) =

(3/4~2E(1)

)⊗ E(2) y J2

(2) = E(1) ⊗(3/4~2E(2)

)de modo que J2

(1) = J2(2) = 3/4~2E(1×2).

3La notacion completa serıa∣∣J,M

(j(1), j(2)

)⟩= |J,M (1/2, 1/2)〉.

Page 411: Mecanica Cuantica: Notas de Clase

16.4. ADICION DE DOS MOMENTOS ANGULARES CON J(1) = J(2) = 1/2 411

Los valoresM = ±1 son no degenerados. Solo un autovector corresponde a cada uno de ellos: |+,+〉 correspondea +1 y |−,−〉 corresponde a −1. En otras palabras para que M = +1 solo hay una posibilidad ε1 = ε2 = +1, elcaso M = −1 solo es posible si ε1 = ε2 = −1. En contraste, M = 0 tiene degeneracion dos, a el corresponden losestados |+,−〉 y |−,+〉. Esto se traduce en que hay dos soluciones para M = 0, ε1 = −ε2 = 1 y ε1 = −ε2 = −1.Cualquier combinacion lineal de los vectores |+,−〉 y |−,+〉 es un autoestado de J3 con autovalor M = 0.

Estos resultados se ven claramente en la representacion matricial de J3 en la base |ε1, ε2〉. Ordenando losvectores en la forma de la Ec. (16.17) esta matriz es

(J3) = ~

1 0 0 00 0 0 00 0 0 00 0 0 −1

16.4.2. Diagonalizacion de J2

Aplicaremos J2 a los vectores de la base (16.17), para lo cual usaremos las Ecs. (16.9, 16.11)

J2 =(J(1) + J(2)

)2= J2

(1) + J2(2) + J

(1)+ J

(2)− + J

(1)− J

(2)+ + 2J

(1)3 J

(2)3

los 4 vectores |ε1, ε2〉 son autovectores de J2(1), J2

(2), J(1)3 y J

(2)3 como se ve en la Ecs. (16.18, 16.19), y la accion

de los operadores escalera viene dada por la Ecs. (15.12), por tanto podemos evaluar J2 |ε1, ε2〉 para todos loselementos de la base |ε1, ε2〉

J2 |+,+〉 =

(3

4~2 +

3

4~2)|+,+〉+ 1

2~2 |+,+〉

= 2~2 |+,+〉 (16.26)

J2 |+,−〉 =

(3

4~2 +

3

4~2)|+,−〉 − 1

2~2 |+,−〉+ ~2 |−,+〉

= ~2 [|+,−〉+ |−,+〉] (16.27)

J2 |−,+〉 =

(3

4~2 +

3

4~2)|−,+〉 − 1

2~2 |−,+〉+ ~2 |+,−〉

= ~2 [|+,−〉+ |−,+〉] (16.28)

J2 |−,−〉 =

(3

4~2 +

3

4~2)|−,−〉+ 1

2~2 |−,−〉

= 2~2 |−,−〉 (16.29)

la matriz representativa de J2 en la base |ε1, ε2〉 en el orden dado por (16.17) esta dada por

(J2)= ~2

2 0 0 00 1 1 00 1 1 00 0 0 2

puesto que J2 conmuta con J3, la matriz tendra elementos no cero solo entre autovectores de J3 asociados conel mismo autovalor, lo cual explica los ceros de la matriz. De acuerdo con los resultados de la seccion 16.4.1,los unicos elementos no diagonales de J2 que son diferentes de cero, son aquellos que relacionan a los vectores|+,−〉 , |−,+〉, los cuales estan asociados al mismo valor de M (M = 0).

Page 412: Mecanica Cuantica: Notas de Clase

412 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Ahora para diagonalizar esta matriz podemos tener en cuenta que es diagonal por bloques partiendose en tressubmatrices

A1×1 0 00 B2×2 00 0 C1×1

La matrices unidimensionales son las asociadas a los vectores |±,±〉 que son autovectores de J2, como se ve enlas Ecs. (16.26, 16.29). Los autovalores asociados son 2~2. Ahora debemos diagonalizar la submatriz

B2×2 = ~2(

1 11 1

)

que representa a J2 dentro del subespacio dos dimensional generado por |+,−〉 , |−,+〉, es decir el autosubespaciode J3 que corresponde a M = 0. Los autovalores λ~2 = J (J + 1) ~2 de esta matriz se encuentran con la ecuacioncaracterıstica

(1− λ)2 − 1 = 0

cuyas raıces son λ = 0 y λ = 2. Esto nos da los ultimos autovalores de J2: 0 y 2~2, es decir J = 0 y 1. Losautovectores nos dan

|J = 1,M = 0〉 =1√2[|+,−〉+ |−,+〉] (16.30)

|J = 0,M = 0〉 =1√2[|+,−〉 − |−,+〉] (16.31)

como siempre, se puede colocar una fase global si se desea.

Vemos entonces que J2 tiene dos autovalores diferentes: 0 y 2~2. El autovalor nulo es no degenerado y tienecomo unico vector asociado a (16.31). Por otro lado, el valor propio 2~2 tiene degeneracion triple, ya que estaasociado a los vectores |+,+〉 , |−−〉 y a la combinacion lineal (16.30).

16.4.3. Autoestados de J2 y J3: singlete y triplete

Hemos obtenido entonces los autovalores de J2 y J3 ası como un conjunto completo de autovectores comunesde J2 y J3 (que automaticamente son autoestados de J2

(1) y J2(2)). Expresaremos los autoestados en la notacion

(16.22-16.24).

El numero cuantico J de (16.23) puede tomar dos valores: 0 y 1. El primero esta asociado con un unico vector,que es tambien autovector de J3 con autovalor cero, el cual denotamos por

|0, 0〉 = 1√2[|+,−〉 − |−,+〉] (16.32)

en tanto que para J = 1 hay tres vectores asociados con tres valores distintos de M

|1, 1〉 = |+,+〉 ; |1, 0〉 = 1√2[|+,−〉+ |−,+〉] ; |1,−1〉 = |−−〉 (16.33)

se puede chequear facilmente que los cuatro vectores dados en (16.32, 16.33) son ortonormales. La especificacionde J y M determina a un vector de esta base unıvocamente, de modo que J2 y J3 forman un C.S.C.O.. Aunqueno es necesario, a este C.S.C.O se le pueden agregar los operadores J2

(1) y J2(2).

Por tanto cuando adicionamos dos momentos angulares con j1 = j2 = 1/2 (por ejemplo dos espınes), el numeroJ que caracteriza al autovalor J (J + 1) ~2 del operador J2 puede ser igual a cero o igual a uno. Con cada unode estos valores se asocia una familia de (2J + 1) vectores ortogonales (tres para J = 1, uno para J = 0) quecorresponden a los 2J + 1 valores de M para J fijo.

Page 413: Mecanica Cuantica: Notas de Clase

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 413

A la familia (16.33) de tres vectores asociados a J = 1 se le denomina un triplete. Al vector |0, 0〉 asociadoa J = 0 se le denomina un singlete. La Ec. (16.33) nos muestra que los estados del triplete son simetricoscon respecto al intercambio de dos momentos angulares (por ejemplo espınes), en tanto que el estado singlete Ec.(16.32) es antisimetrico. Es decir si cada vector |ε1, ε2〉 se reemplaza por |ε2, ε1〉, las expresiones (16.33) permaneceninvariantes en tanto que (16.32) cambia de signo. Esto tendra gran importancia cuando las partıculas cuyos espinesse adicionan sean identicas. Ademas esto nos indica la combinacion lineal de |+,−〉 con |−,+〉 que se requierepara completar el triplete (debe ser simetrica). La parte singlete serıa entonces la combinacion lineal antisimetricade |+,−〉 con |−,+〉 la cual es ortogonal a la parte simetrica y por supuesto a los demas estados del triplete.

16.5. Metodo general de adicion de dos momentos angulares arbitrarios

Consideraremos un sistema fısico descrito por el espacio E , y J un momento angular relativo a este sistema.J puede ser un momento angular parcial o el momento angular total del sistema. Vimos en la seccion 10.4.1, quesiempre es posible construır una base estandar |j,m, k〉 compuesta de autovectores comunes a J2 y J3

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉 (16.34)

de modo que la accion de los operadores escalera sobre esta base estandar esta dada por las Ecs. (10.47)

J± |j,m, k〉 = ~√j (j + 1)−m (m± 1) |j,m± 1, k〉 (16.35)

denotamos como E (j, k) al autosubespacio expandido por vectores de la base estandar con j, k fijos. Este espacioes de dimension 2j + 1 correspondiente a los valores de m para un j dado. La dimension no depende de k. LasEcs. (16.34, 16.35) nos dicen que los 2j + 1 vectores de la base para E (j, k) se transforman entre sı por mediode los operadores J2, J3, J+, J−. Es decir, el autosubespacio E (j, k) es globalmente invariante bajo estos cuatrooperadores y mas en general es globalmente invariante bajo la accion de una funcion F (J). El espacio completoE se puede escribir como una suma directa de subespacios ortogonales E (j, k) como se ve en la Ec. (10.46)

E = E (j1, k = 1)⊕ E (j1, k = 2)⊕ . . .⊕ E (j1, k = g (j1))⊕E (j2, k = 1)⊕ E (j2, k = 2)⊕ . . .⊕ E (j2, k = g (j2))⊕E (j3, k = 1)⊕ E (j3, k = 2)⊕ . . .⊕ E (j3, k = g (j3))⊕ . . . (16.36)

debido a la invariancia de estos subespacios bajo los operadores J2, J3, J+, J−, F (J) estos operadores tendranuna representacion matricial en la base estandar donde los elementos matriciales no nulos estan dentro de cadasubespacio E (j, k). Ademas dentro de cada subespacio E (j, k) los elementos de matriz de una funcion del tipoF (J) son independientes de k.

Recordemos ademas que si a J2 y J3 le agregamos los operadores necesarios para formar un C.S.C.O. podemosdar un significado fısico a k construyendo los vectores propios comunes a todo el C.S.C.O. si por ejemplo solo serequiere un operador A para formar el C.S.C.O. y asumimos que A conmuta con J (escalar), podemos requerirque los autovectores |j,m, k〉 tambien sean autovectores de A

A |j,m, k〉 = aj,k |j,m, k〉 (16.37)

de modo que la base estandar |j,m, k〉 estara determinada por las Ecs. (16.34, 16.35, 16.37). Cada E (j, k) estambien autosubespacio de A y el ındice k discrimina entre los diferentes autovalores aj,k asociados a cada valorde k. Cuando se requiere mas de un operador para formar el C.S.C.O. el ındice k corresponde realmente a variosındices.

Page 414: Mecanica Cuantica: Notas de Clase

414 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

16.5.1. Formacion del sistema a partir de dos subsistemas

Asumamos que nuestro sistema fısico se forma por la union de dos subsistemas (por ejemplo un sistema dedos partıculas o la union del sistema orbital con el de espın para una sola partıcula). Usaremos los ındices (1) y(2) para denotar cantidades relativas a cada subsistema.

Asumiremos que para el espacio de estados E1 del subsistema (1) conocemos una base estandar |j1,m1, k1〉de vectores propios comunes a J2

(1) y J(1)3 siendo J(1) el momento angular asociado al subsistema (1) por tanto las

Ecs. (16.34, 16.35) nos dan

J2(1) |j1,m1, k1〉 = j1 (j1 + 1) ~2 |j1,m1, k1〉 ; J

(1)3 |j1,m1, k1〉 = m1~ |j1,m1, k1〉

J(1)± |j1,m1, k1〉 = ~

√j1 (j1 + 1)−m1 (m1 ± 1) |j1,m1 ± 1, k1〉

y similarmente para la base estandar |j2,m2, k2〉 del espacio E2 asociado al subsistema (2)

J2(2) |j2,m2, k2〉 = j2 (j2 + 1) ~2 |j2,m2, k2〉 ; J

(2)3 |j2,m2, k2〉 = m2~ |j2,m2, k2〉

J(2)± |j2,m2, k2〉 = ~

√j2 (j2 + 1)−m2 (m2 ± 1) |j2,m2 ± 1, k2〉

el espacio de estados del sistema completo es el producto tensorial de los espacios E1 y E2

E = E1 ⊗ E2

y sabemos que el producto tensorial de las bases de E1 y E2 formara una base en E . Denotamos esta base como

|j1,m1, k1〉 ⊗ |j2,m2, k2〉 ≡ |j1, j2;m1,m2; k1, k2〉 (16.38)

los espacios E1 y E2 son sumas directas de subespacios del tipo E1 (j1, k1) y E2 (j2, k2) respectivamente. Estas sumasestan descritas por la Ec. (16.36)

E1 = E1(j(1)1 , k(1) = 1

)⊕ E1

(j(1)1 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)1 , k(1) = g

(j(1)1

))⊕

E1(j(1)2 , k(1) = 1

)⊕ E1

(j(1)2 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)2 , k(1) = g

(j(1)2

))⊕

E1(j(1)3 , k(1) = 1

)⊕ E1

(j(1)3 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)3 , k(1) = g

(j(1)3

))⊕ . . . (16.39)

y similarmente para el sistema (2). En este caso la notacion j(m)i representa diversos valores de j para el subsistema

m. No obstante, esta notacion no sera necesaria de aquı en adelante y usaremos jm para denotar el valor de jasociado al subsistema m. Estas sumas las resumimos en la forma

E1 =∑

⊕E1 (j1, k1) ; E2 =

⊕E2 (j2, k2)

por lo tanto E sera la suma directa de subespacios E (j1, j2; k1, k2) obtenido por el producto tensorial de lossubespacios E1 (j1, k1) y E2 (j2, k2)

E =∑

⊕E (j1, j2; k1, k2) ; E (j1, j2; k1, k2) = E1 (j1, k1)⊗ E2 (j2, k2) (16.40)

la dimension del subespacio E (j1, j2; k1, k2) es (2j1 + 1) (2j2 + 1). Este subespacio sera globalmente invariante antecualquier funcion de F (J1) y F (J2), donde naturalmente J1 y J2 son las extensiones de los operadores definidosoriginalmente en cada subsistema.

Page 415: Mecanica Cuantica: Notas de Clase

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 415

16.5.2. Momento angular total y sus relaciones de conmutacion

Vimos en la seccion 16.3 que la suma de los momentos angulares

J = J(1) + J(2)

es tambien un momento angular siendo J(1) y J(2) las extensiones adecuadas. Por tanto J al igual que J(1) y J(2)

satisface las propiedades algebraicas de un momento angular. No obstante, tambien hay algunas relaciones deconmutacion entre momentos angulares totales y parciales que son de importancia en nuestra discusion (verseccion 16.3). Vimos que J(1) y J(2) conmutan con J2

(1) y J2(2) y por tanto tambien con J. En particular J2 y J3

conmutan con J2(1) y J2

(2). Ademas es inmediato que J(1)3 y J

(2)3 conmutan con J3, por tanto

[J3,J

2(1)

]=[J3,J

2(2)

]=[J2,J2

(1)

]=[J2,J2

(2)

]=[J(1)3 , J3

]=[J(2)3 , J3

]= 0 (16.41)

sin embargo, J(1)3 y J

(2)3 no conmutan con J2 lo cual se pudo ver partiendo de las Ecs. (16.9, 16.11)

J2 = J2(1) + J2

(2) + 2J(1) · J(2) (16.42)

J2 = J2(1) + J2

(2) + 2J(1)3 J

(2)3 + J

(1)+ J

(2)− + J

(1)− J

(2)+ (16.43)

con lo cual se llega a la Ec. (16.16)

[J2, J

(1)3

]= −

[J2, J

(2)3

]= 2i~

[J(1)1 J

(2)2 − J

(1)2 J

(2)1

](16.44)

16.5.3. Cambio de base a realizar

Un vector de la base

|j1,m1, k1〉 ⊗ |j2,m2, k2〉 ≡ |j1, j2;m1,m2; k1, k2〉 (16.45)

es autoestado simultaneo de los observables

J2(1), J

2(2), J

(1)3 , J

(2)3

con autovalores j1 (j1 + 1) ~2, j2 (j2 + 1) ~2, m1~, m2~. Se observa entonces que la base (16.45) es adecuada parael estudio de los momentos angulares individuales J(1) y J(2) de cada subsistema. Ahora bien, las Ecs. (16.41) nosdicen que el conjunto de observables

J2(1),J

2(2),J

2, J3

tambien conmutan entre sı. Observese que si construımos una base comun a estos observables, serıa mas adecuadapara el estudio del momento angular total del sistema ya que un vector de esta base permitirıa extraer los valorespropios de J2 y J3. Esta base debe ser diferente a la anterior puesto que segun la Ec. (16.44), J2 no conmuta con

J(1)3 ni con J

(2)3 . Una motivacion adicional para encontrar una base comun a J2 y J3, es el hecho de que para

un sistema sujeto a una interaccion central que posee dos momentos angulares acoplados, se tiene que J total esconstante de movimiento aunque los momentos angulares parciales no lo son (ver secciones 16.2.1, 16.2.2, 16.2.3).

Ademas los ındices k1 y k2 tienen un significado fısico que es extension natural del procedimiento para cada

subsistema. SiA1,J

2(1), J

(1)3

forma un C.S.C.O. en E1 donde A1 conmuta con J(1) entonces podemos escoger

una base estandar |j1,m1, k1〉 consistente en los vectores ortonormales completos comunes a estos observables.

Si algo similar ocurre con un conjunto de observablesA2,J

2(2), J

(2)3

en E2 entonces el conjunto

A1, A2;J2(1),J

2(2);J

(1)3 , J

(2)3

Page 416: Mecanica Cuantica: Notas de Clase

416 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

forma un C.S.C.O. en E cuyos autovectores estan dados por la Ec. (16.45). Por otro lado, puesto que A1 conmutacon J(1) y con J(2) entonces conmutara con J. Esto a su vez implica que A1 conmuta con J2 y J3. Lo mismo ocurrepara el observable A2, por tanto los observables en el conjunto

A1, A2;J2(1),J

2(2);J

2,J3

conmutan entre ellos. Puede demostrarse que ademas forman un C.S.C.O. y la nueva base que buscaremos es unsistema ortonormal de vectores propios comunes de este C.S.C.O.

Ahora bien, el subespacio E (j1, j2; k1, k2) definido en (16.40) es globalmente invariante bajo la accion de unoperador que sea funcion de J(1) o que sea funcion de J(2). Por tanto, es globalmente invariante ante la accionde un F (J). Esto implica que los observables J2 y J3 que pretendemos diagonalizar, tienen elementos matricialesno nulos solo dentro de cada espacio E (j1, j2; k1, k2). Las matrices de dimension infinita que representan a J2 yJ3 en la base (16.45) son diagonales por bloques y se pueden escribir como suma directa de submatrices cadauna asociado a un subespacio de la forma E (j1, j2; k1, k2). Por tanto, el problema se reduce a diagonalizar lassubmatrices asociadas a cada subespacio E (j1, j2; k1, k2) cuya dimension es (2j1 + 1) (2j2 + 1).

Por otro lado, los elementos matriciales en la base (16.45) para cualquier funcion F(J(1)

)o F

(J(2)

)son

independientes de k1 y k2 (solo los elementos matriciales de A1 dependen de k1 y los de A2 dependen de k2).Por tanto, esto tambien vale para J2 y J3. En consecuencia, la diagonalizacion de estos dos operadores dentro detodos los subespacios E (j1, j2; k1, k2) con el mismo valor de j1 y j2, se realiza de forma identica. Por esta razonhablamos de adicion de los momentos angulares sin hacer referencia a los otros numeros cuanticos. Simplificaremosla notacion omitiendo los ındices k1 y k2 escribiendo entonces

E (j1, j2) ≡ E (j1, j2; k1, k2) ; |j1, j2;m1,m2〉 ≡ |j1, j2;m1,m2; k1, k2〉puesto que J es un momento angular y E (j1, j2) es invariante ante F (J) entonces E (j1, j2) es una suma directade subespacios ortogonales E (J, k) cada uno de los cuales es invariante ante la accion de J2, J3, J±

E (j1, j2) =∑

⊕E (J, k) (16.46)

de aquı surgen las siguientes preguntas, dado un par j1 y j2 ¿Cuales son los valores de J que contribuyen en lasuma directa (16.46)? y ¿Cuantos subespacios E (J, k) estan asociados con un J dado?.

Dado que tenemos una base conocida (16.45) esta sera nuestro punto de partida para llegar a la base asociadaa J2 y J3. Surge entonces el problema de expandir los autovectores de la base buscada asociados a E (j1, j2) enterminos de los autovectores de la base conocida (16.45).

Es importante mencionar que si tenemos mas momentos angulares podemos adicionar los dos primeros y alresultado le adicionamos un tercero y ası sucesivamente. Esto solo es posible puesto que el algoritmo de suma esconmutativo y asociativo como veremos mas adelante.

16.5.4. Autovalores de J2 y J3 : Caso de dos espines j1 = j2 = 1/2.

En este caso cada espacio E1 y E2 contiene solo un subespacio invariante ya que estan asociados cada uno a unvalor fijo de j. El producto tensorial E = E1 ⊗ E2 esta asociado a un solo subespacio E (j1, j2) con j1 = j2 = 1/2.

De acuerdo con la descomposicion (16.46), el espacio E (1/2, 1/2) es la suma directa de subespacios del tipoE (J, k) de dimension 2J + 1. Cada uno de estos subespacios contiene uno y solo un autovector de J3 asociadoa cada uno de los valores de M tal que |M | ≤ J . Hemos visto en la seccion 16.4.1 que M solo toma los valores1, 0,−1; donde el primero y el tercero no son degenerados en tanto que M = 0 es doblemente degenerado. De estose concluye que:

1. Valores de J > 1 estan excluıdos. Por ejemplo para que J = 2 fuera posible tendrıa que existir al menos unautovector de J3 con M = 2. Esto se debe a que la teorıa del momento angular nos dice que para un j dadolos valores permitidos de m consisten en todos los valores enteros o semienteros que cubren el intervalo−j ≤ m ≤ j en saltos unidad.

Page 417: Mecanica Cuantica: Notas de Clase

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 417

2. E (J = 1, k) aparece solo una vez (es decir k es unico), puesto que M = ±1 solo aparece una vez, es decirM = ±1 es no degenerado.

3. E (J = 0, k) aparece una sola vez. Esto se debe a que M = 0 es dos veces degenerado pero uno de losautovectores con M = 0 esta en el subespacio con J = 1, de modo que solo un autovector con M = 0 estaasociado a un subespacio con J = 0.

Por tanto, el espacio 4-dimensional E (1/2, 1/2) se descompone en subespacios del tipo E (J, k) segun la Ec.(16.46) en la forma

E(1

2,1

2

)= E (J = 1)⊕ E (J = 0)

que son de dimension 3 y 1 respectivamente. Veremos ahora como extender estas conclusiones al caso general.

16.5.5. Autovalores de J3 y su degeneracion: Caso general

Figura 16.1: (a) Ilustracion de las reglas de adicion para momentos angulares en el caso general. (b) Pares deposibles valores de (m,m′) = (m1,m2) para el caso especıfico j = j1 = 2, j′ = j2 = 1. En ambos casos, los puntosasociados con un valor dado de M = m+m′ = m1 +m2 estan localizados sobre una lınea recta de pendiente −1pintada como lınea punteada. Hemos supuesto que j = j1 ≥ j′ = j2, con lo cual el ancho del rectangulo es mayoro igual a su altura.

Consideremos un subespacio de la forma E (j1, j2) de dimension (2j1 + 1) (2j2 + 1). Asumiremos que j1 y j2estan rotulados de modo que

j1 ≥ j2 (16.47)

los vectores base |j1, j2;m1,m2〉 de este subespacio (que se construyen con el producto tensorial de las bases delos espacios factor) ya son autovectores de J3

J3 |j1, j2;m1,m2〉 =(J(1)3 + J

(2)3

)|j1, j2;m1,m2〉 = (m1 +m2) ~ |j1, j2;m1,m2〉

≡ M~ |j1, j2;m1,m2〉

de modo que el correspondiente autovalor de M~ es tal que

M = m1 +m2 (16.48)

de lo cual, M toma los valores

M = j1 + j2, j1 + j2 − 1, j1 + j2 − 2, . . . ,− (j1 + j2) (16.49)

Page 418: Mecanica Cuantica: Notas de Clase

418 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Denotaremos el grado de degeneracion de cadaM en el subespacio E (j1, j2), en la forma gj1,j2 (M). Para encontraresta degeneracion usaremos el siguiente procedimiento geometrico: realizamos un diagrama en dos dimensionesasociando a cada vector |j1, j2;m1,m2〉 un par ordenado donde el eje de abcisas se asocia con m1 y el eje deordenadas con m2

|j1, j2;m1,m2〉 ≡ (m1,m2)

todos los puntos asociados a estos vectores estan ubicados en el borde o interior de un rectangulo cuyos verticesestan en (j1, j2) , (j1,−j2) , (−j1,−j2) y (−j1, j2). La Fig. 16.1 representa los puntos asociados a una configuracionarbitraria (izquierda) y una configuracion con j1 = 2, j2 = 1 (derecha). Si partimos de un punto dado (vector)del tipo P = (m1,m2) es claro que estados “vecinos” del tipo P± ≡ (m1 ± 1,m2 ∓ 1) poseen el mismo valor deM = m1 +m2 siempre y cuando existan los valores incrementados y decrementados de m1 y m2. Cuando algunode los valores incrementados o decrementados no exista, es por que el estado (m1,m2) se encuentra en alguno delos bordes del rectangulo (o en una esquina). Para estados P en el interior del rectangulo, existe tanto P+ comoP−. Dos puntos vecinos definidos con esta relacion estan unidos por una recta de pendiente −1

pendiente =(m2 ∓ 1)−m2

(m1 ± 1)−m1= −1

En conclusion, los puntos situados a lo largo de las lıneas punteadas de las Figs. 16.1a, y 16.1b, de pendiente −1,corresponden a los vectores con el mismo valor de M = m1 +m2. El numero de puntos (vectores) unidos por unalınea define el grado de degeneracion gj1,j2 (M) del valor de M asociado.

Consideremos ahora los diferentes valores de M en orden descendente Ec. (16.49). Observaremos el patron delas lıneas punteadas a medida que disminuye M . Empezando por el maximo M = j1 + j2 vemos que este valor esno-degenerado, ya que la lınea que lo cruza pasa solo por la esquina superior derecha (es en realidad un punto),cuyas coordenadas son (j1, j2). Vemos entonces que

gj1,j2 (j1 + j2) = 1 (16.50)

para el siguiente M = j1 + j2 − 1 la degeneracion es doble (a menos que j1 y/o j2 sean nulos), ya que la lıneacorrespondiente contiene los puntos (j1, j2 − 1) y (j1 − 1, j2). Entonces

gj1,j2 (j1 + j2 − 1) = 2 , si j1 6= 0 y j2 6= 0 (16.51)

La degeneracion aumenta una unidad por cada decremento de M en una unidad, hasta que se alcanza la esquinainferior derecha (j1,−j2) del rectangulo4, que corresponde al valor M = j1 − j2 ≥ 0 ya que suponemos siempreque j1 ≥ j2. El numero de puntos llega entonces a su maximo (que es el numero de puntos que miden “la altura”del rectangulo) y es igual a

gj1,j2 (j1 − j2) = 2j2 + 1 (16.52)

si continuamos decrementando M , el numero de puntos permanece constante en 2j2 + 1 siempre que la lıneaasociada a M cruce al rectangulo tocando sus lados superior (m2 = j2) e inferior (m2 = −j2). Esto ocurre hastaque la lınea asociada alcanza la esquina superior izquierda (−j1, j2) del rectangulo, para el cualM = −j1+ j2 ≤ 0.Por tanto, el numero maximo de puntos 2j2 + 1 se mantiene en un intervalo para M dado por

gj1,j2 (M) = 2j2 + 1 para − (j1 − j2) ≤M ≤ j1 − j2 (16.53)

finalmente, para valores deM menores que − (j1 − j2), la lınea asociada a cadaM ya no intersecta la lınea superiordel rectangulo (m2 = j2) y gj1,j2 (M) decrece monotonamente en la unidad por cada decremento unidad de M ,

4Como estamos asumiendo que j1 ≥ j2, siempre se alcanza la esquina inferior derecha (j1,−j2) antes que la esquina superiorizquierda (−j1, j2) en esta secuencia. A lo mas ocurre que las dos esquinas se alcanzan al mismo tiempo cuando j1 = j2, en cuyo casotenemos un cuadrado.

Page 419: Mecanica Cuantica: Notas de Clase

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 419

alcanzando el valor 1 nuevamente cuando M = − (j1 + j2), correspondiente a la esquina inferior izquierda delrectangulo. Por lo tanto

gj1,j2 (−M) = gj1,j2 (M) (16.54)

estos resultados se resumen en la figura 16.2 para el caso j1 = 2 y j2 = 1, esta figura muestra g2,1 (M) comofuncion de M .

Figura 16.2: Grafica del grado de degeneracion gj1,j2 (M) versus M , para el caso j1 = 2, j2 = 1 ilustrado enla Fig. 16.1b. El grado de degeneracion se obtiene por simple conteo del numero de puntos que toca cada lıneapunteada en la Fig. 16.1b. Adicionalmente, esta figura muestra la simetrıa expresada por la Ec. (16.54).

16.5.6. Autovalores de J2 : caso general

De la Ec. (16.49) vemos que los valores de M son enteros si j1 y j2 son ambos enteros o ambos semi-enteros.Ası mismo, los valores M son semi-enteros si uno de los ji es entero y el otro semientero. Por otro lado, la teorıageneral del momento angular nos dice que J es entero (semi-entero) si y solo siM es entero (semi-entero). Podemosentonces distinguir dos situaciones (1) j1 y j2 son ambos enteros o semi-enteros, (2) Uno de los ji es entero y elotro semientero. El primer caso conduce a pares (J,M) enteros y el segundo caso a pares (J,M) semi-enteros.

Puesto que el maximo valor de M es j1 + j2, tenemos que J > j1 + j2 no aparece en E (j1, j2) y por tantono aparece en la suma directa (16.46). Esto se debe a que para este valor J > j1 + j2 tendrıa que existir elcorrespondiente valor de M = J segun la teorıa general del momento angular. Para J = j1+ j2 hay un subespacioinvariante asociado E (J = j1 + j2), puesto queM = j1+j2 existe, pero este subespacio es unico ya queM = j1+j2es no-degenerado. En este subespacio hay uno y solo un vector asociado aM = j1+j2−1, y dado queM = j1+j2−1es doblemente degenerado en E (j1, j2), tenemos que J = j1 + j2 − 1 tambien esta presente y a el corresponde ununico subespacio invariante E (J = j1 + j2 − 1).

En un contexto general denotaremos como pj1,j2 (J) el numero de subespacios E (J, k) de E (j1, j2) asociados aun J dado. En otras palabras, este es el numero de diferentes valores de k para el valor dado de J (siendo j1 y j2fijos desde el principio).

Veremos que pj1,j2 (J) y gj1,j2 (M) estan asociados de manera sencilla. Consideremos un valor particular deM , a este valor de M esta asociado uno y solo un vector en cada subespacio E (J, k) siempre que J ≥ |M |. Sugrado de degeneracion esta dado entonces por

gj1,j2 (M) = pj1,j2 (J = |M |) + pj1,j2 (J = |M |+ 1) + pj1,j2 (J = |M |+ 2) + . . .+ pj1,j2 (J = j1 + j2)

Page 420: Mecanica Cuantica: Notas de Clase

420 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Invirtiendo esta relacion, se obtiene a pj1,j2 (J) en terminos de gj1,j2 (M)

pj1,j2 (J) = gj1,j2 (M = J)− gj1,j2 (M = J + 1)

= gj1,j2 (M = −J)− gj1,j2 (M = −J − 1) (16.55)

es de resaltar que en la Ec. (16.55), J es fijo y los valores de M no estan asociados al valor fijo de J , sino a todoslos valores permitidos de M en E (j1, j2). Por esta razon, los valores de gj1,j2 (M = J + 1) y gj1,j2 (M = −J − 1)pueden ser no nulos.

Teniendo en cuenta la degeneracion de los valores deM estudiada en la seccion 16.5.5, podemos determinar losvalores del numero cuantico J que ocurren en E (j1, j2) y el numero de subespacios invariantes E (J, k) asociadoscon cada uno de ellos. En primer lugar tenemos que

pj1,j2 (J) = 0 para J > j1 + j2

ya que gj1,j2 (M) = 0 para |M | > j1 + j2. Si ahora aplicamos las Ecs. (16.50, 16.51) tenemos que

pj1,j2 (J = j1 + j2) = gj1,j2 (M = j1 + j2)− gj1,j2 (M = j1 + j2 + 1)

pj1,j2 (J = j1 + j2) = gj1,j2 (M = j1 + j2) = 1

pj1,j2 (J = j1 + j2 − 1) = gj1,j2 (M = j1 + j2 − 1)− gj1,j2 (M = j1 + j2) = 2− 1

pj1,j2 (J = j1 + j2 − 1) = 1

por tanto todos los valores de pj1,j2 (J) se pueden encontrar por iteracion

pj1,j2 (J = j1 + j2 − 2) = 1, . . . , pj1,j2 (J = j1 − j2) = 1

finalmente, aplicando la Ec. (16.53) tenemos

pj1,j2 (J) = 0 para J < j1 − j2 = |j1 − j2|

la ultima igualdad se obtiene recordando que hemos mantenido la suposicion j1 ≥ j2 en todo el tratamiento. Parael caso j2 ≥ j1 solo hay que invertir los ındices 1 y 2.

En conclusion, para valores fijos de j1 y j2, es decir dentro de un subespacio E (j1, j2) de dimension (2j1 + 1) (2j2 + 1),los autovalores de J2 son tales que

J = j1 + j2, j1 + j2 − 1, j1 + j2 − 2, . . . , |j1 − j2| (16.56)

y cada valor de J esta asociado a un unico subespacio invariante E (J, k) en la suma directa dada por la Ec.(16.46), la cual se reduce a

E (j1, j2) =

j1+j2∑

⊕J=|j1−j2|E (J) (16.57)

de modo que el ındice k es realmente innecesario. Esto implica en particular que si tomamos un valor fijo de J y unvalor fijo deM compatible con J (|M | ≤ J), existe un unico vector |J,M〉 (salvo constantes) en E (j1, j2) asociadoa estos numeros cuanticos. La especificacion de J es suficiente para determinar el subespacio invariante, y laespecificacion de M me lleva a un unico vector (excepto por una constante) en dicho subespacio. En consecuenciaJ2 y J3 forman un C.S.C.O. en E (j1, j2).

A manera de consistencia, podemos mostrar que el numero N de pares (J,M) encontrados para E (j1, j2)coincide con la dimension (2j1 + 1) (2j2 + 1) de E (j1, j2), puesto que el conjunto |J,M〉 constituye una base

Page 421: Mecanica Cuantica: Notas de Clase

16.6. AUTOVECTORES COMUNES DE J2 Y J3 421

para E (j1, j2). Asumiremos por simplicidad que j1 ≥ j2. Puesto que cada subespacio E (J) es de dimension 2J +1(es decir tiene 2J + 1 valores diferentes de M), la suma directa (16.57) nos dice que

N =

j1+j2∑

J=j1−j2(2J + 1) (16.58)

si reemplazamos

J = j1 − j2 + i

podemos calcular (16.58)

N =

j1+j2∑

J=j1−j2(2J + 1) =

2j2∑

i=0

[2 (j1 − j2 + i) + 1] = [2 (j1 − j2) + 1]

2j2∑

i=0

1 + 2

2j2∑

i=0

i

= [2 (j1 − j2) + 1] (2j2 + 1) + 22j2 (2j2 + 1)

2= (2j1 − 2j2 + 1) (2j2 + 1) + 2j2 (2j2 + 1)

= [(2j1 − 2j2 + 1) + 2j2] (2j2 + 1) = (2j1 + 1) (2j2 + 1)

16.6. Autovectores comunes de J2 y J3

La base “natural” de E (j1, j2) es la base de los productos tensoriales entre las bases de E (j1) y E (j2) denotada

por |j1, j2,m1,m2〉. Esta es la base de vectores propios comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 . Ahora bien, los vectores

propios comunes a J2, J3,J2(1),J

2(2) seran denotados por |JM〉. Estrictamente la notacion deberıa incluir los valores

j1 y j2 de donde proviene el producto tensorial. Sin embargo, esta notacion se omitira ya que j1 y j2 son fijos entodo el proceso. Por la misma razon, se simplificara la notacion de la base natural escribiendola simplemente como|m1,m2〉. Cuando sea necesario se distinguiran ambas bases por un subındice en la forma |JM〉J y |m1,m2〉j. Latransformacion de la base |m1,m2〉 a la base |JM〉, se debe realizar con una transformacion unitaria, puestoque ambas bases son ortonormales. Como los |JM〉 son autovectores comunes de J2, J3,J

2(1),J

2(2) tenemos que

J2 |JM〉 = J (J + 1) ~2 |JM〉 ; J3 |JM〉 =M~ |JM〉J2(1) |JM〉 = j1 (j1 + 1) ~2 |JM〉 ; J2

(2) |JM〉 = j2 (j2 + 1) ~2 |JM〉

16.6.1. Caso especial j1 = j2 = 1/2

En la seccion 16.4, hemos encontrado los vectores propios |J,M〉 en E (1/2, 1/2) a traves de la diagonalizacionde las representaciones matriciales. En este caso recurriremos a la generacion de los diferentes vectores por mediode operadores escalera J±. La ventaja de este metodo es que es mas facil de generalizar y de manejar cuandotenemos valores altos de los momentos angulares.

En primer lugar el ket |1/2, 1/2〉 ≡ |++〉 es el unico vector propio de J3 en E (1/2, 1/2) que corresponde aM = 1. Puesto que J2 y J3 conmutan, y el valor M = 1 es no degenerado, el teorema 1.66 pagina 57 nos dice que|++〉 tambien tiene que ser autovector de J2. Siguiendo los razonamientos de la seccion 16.5.4 el valor propio paraJ2 tiene que ser J = 1. Por tanto, podemos escoger la fase del vector |J = 1,M = 1〉 para que coincida con |++〉

|1, 1〉 = |++〉 (16.59)

los otros estados del triplete J = 1 se obtienen por aplicacion sucesiva del operador J− tal como se describio enla seccion 10.4.1. Usando la Ec. (10.47), tenemos entonces

J− |1, 1〉 = ~√

1 (1 + 1)− 1 (1− 1) |1, 0〉 = ~√2 |1, 0〉

Page 422: Mecanica Cuantica: Notas de Clase

422 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

con lo cual se tiene

|1, 0〉 = 1

~√2J− |1, 1〉 = 1

~√2J− |++〉

para calcular |1, 0〉 en terminos de la base original |m1,m2〉 basta recordar que

J− = J(1)− + J

(2)−

con lo cual

|1, 0〉 =1

~√2

(J(1)− + J

(2)−)|++〉 = 1

~√2(~ |−+〉+ ~ |+−〉)

|1, 0〉 =1√2(|−+〉+ |+−〉) (16.60)

ahora aplicamos J− a |1, 0〉 para obtener el ultimo elemento |1,−1〉 del triplete.

J− |1, 0〉 = ~√2 |1,−1〉 (16.61)

combinando las Ecs. (16.60, 16.61) tenemos

|1,−1〉 =1

~√2J− |1, 0〉 = 1

~√2

(J(1)− + J

(2)−

)[ 1√2(|−+〉+ |+−〉)

]

=1

2~

[(J(1)− + J

(2)−)|−+〉+

(J(1)− + J

(2)−)|+−〉

]=

1

2~

[J(2)− |−+〉+ J

(1)− |+−〉

]

=1

2~[~ |−−〉+ ~ |−−〉]

|1,−1〉 = |−−〉

notese que el estado |−−〉 se pudo haber extraıdo con un argumento similar al usado para encontrar |++〉, ya queel estado con M = −1 al igual que el asociado a M = 1 es no degenerado. El procedimiento anterior tiene sinembargo la ventaja de mostrar el algoritmo general y ademas nos permite ajustar las convenciones de fases quepodrıan aparecer en |1, 0〉 y |1,−1〉. Existen dos lugares en el procedimiento en donde se fijan las fases, en la Ec.(16.59) se puede colocar una fase arbitraria, y en las Ecs. (10.47) para J± se pueden colocar fases que dependande m.

Finalmente, encontraremos el estado singlete |J = 0,M = 0〉 , que es el unico vector del subespacio unidi-mensional E (J = 0). Este se puede encontrar dentro de fases constantes, con la condicion de ser ortonormal altriplete.

Al ser ortonormal a |1, 1〉 = |++〉 y a |1,−1〉 = |−−〉, se tiene que |0, 0〉 debe ser una combinacion lineal de|+−〉 y |−+〉

|0, 0〉 = α |+−〉+ β |−+〉 (16.62)

〈0, 0 |0, 0〉 = |α|2 + |β|2 = 1 (16.63)

en donde hemos agregado la condicion de normalizacion. Teniendo en cuenta que |0, 0〉 tambien debe ser ortogonala |1, 0〉, las Ecs. (16.60, 16.62) nos dan

〈1, 0 |0, 0〉 =1√2[〈−+|+ 〈+−|] [α |+−〉+ β |−+〉] = 0

⇒ α 〈−+|+−〉+ β 〈−+| −+〉+ α 〈+−|+−〉+ β 〈+−| −+〉 = 0

β + α = 0 (16.64)

Page 423: Mecanica Cuantica: Notas de Clase

16.7. AUTOVECTORES DE J2 Y J3 : CASO GENERAL 423

combinando las Ecs. (16.63, 16.64) tenemos

α = −β ⇒ |α|2 = |β|2 ⇒ 2 |α|2 = 1 ⇒ |α| = 1√2

con lo cual

α = −β =1√2eiχ

siendo χ cualquier numero real. Eligiendo χ = 0, tenemos

|0, 0〉 = 1√2[|+−〉 − |−+〉] (16.65)

es importante observar que con este metodo no fue necesario recurrir a las representaciones matriciales de losoperadores, en particular de J2 (que fue la que se tuvo que diagonalizar).

16.7. Autovectores de J2 y J3 : Caso general

Hemos visto en la seccion 16.5.6, Ec. (16.57) que la descomposicion de E (j1, j2) como suma directa de subes-pacios invariantes E (J) esta dada por

E (j1, j2) = E (j1 + j2)⊕ E (j1 + j2 − 1)⊕ . . .⊕ E (|j1 − j2|) (16.66)

determinaremos los vectores |J,M〉 para cada uno de estos subespacios

16.7.1. Determinacion de los vectores |JM〉 del subespacio E (j1 + j2)

El ket |m1 = j1,m2 = j2〉 es el unico autovector de J3 en E (j1, j2) con M = j1 + j2. Puesto que J2 y J3conmutan y M = j1 + j2 es no-degenerado, el teorema 1.66 pagina 57 nos dice que |m1 = j1,m2 = j2〉 tambientiene que ser autovector de J2. De acuerdo con (16.66) el valor asociado de J solo puede ser J = j1 + j2. Podemosescoger el factor de fase de manera que

|J = j1 + j2, M = j1 + j2〉 = |m1 = j1,m2 = j2〉

que tambien denotaremos por

|j1 + j2, j1 + j2〉J = |j1, j2〉j (16.67)

la aplicacion reiterada de J− permitira encontrar todos los vectores del tipo |J,M〉 asociados a J = j1 + j2.Aplicando las Ecs. (10.47), tenemos

J− |j1 + j2, j1 + j2〉J = ~√

2 (j1 + j2) |j1 + j2, j1 + j2 − 1〉J|j1 + j2, j1 + j2 − 1〉J =

1

~√

2 (j1 + j2)J− |j1 + j2, j1 + j2〉J (16.68)

para escribir el vector |j1 + j2, j1 + j2 − 1〉J en terminos de la base original |m1,m2〉j , debemos escribir el termino

de la derecha en la Ec. (16.68) en la base original, para lo cual tenemos en cuenta que J− = J(1)− + J

(2)− y que

|j1 + j2, j1 + j2〉J = |j1, j2〉j ; con lo cual la Ec. (16.68) queda

|j1 + j2, j1 + j2 − 1〉J =

(J(1)− + J

(2)−

)|j1, j2〉j

~√

2 (j1 + j2)=

~√2j1 |j1 − 1, j2〉j + ~

√2j2 |j1, j2 − 1〉j

~√

2 (j1 + j2)

Page 424: Mecanica Cuantica: Notas de Clase

424 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

obteniendo finalmente

|j1 + j2, j1 + j2 − 1〉J =

√j1

j1 + j2|j1 − 1, j2〉j +

√j2

j1 + j2|j1, j2 − 1〉j (16.69)

notese ademas que la combinacion lineal de vectores originales que me forma a |j1 + j2, j1 + j2 − 1〉J esta au-tomaticamente normalizada.

Para obtener |j1 + j2, j1 + j2 − 2〉J , aplicamos J− a ambos lados de la Ec. (16.69) escribiendo tal operador

como J− = J(1)− +J

(2)− a la derecha de dicha ecuacion. Podemos repetir este procedimiento sistematicamente, hasta

llegar al estado |j1 + j2, − (j1 + j2)〉J , el cual se puede ver que es igual a |−j1,−j2〉j por un argumento similaral que nos llevo a la Ec. (16.67), puesto que M = −j1 − j2 tambien es no-degenerado.

Al finalizar este proceso hemos encontrado todos los 2 (j1 + j2) + 1 vectores de la forma |J = j1 + j2, M〉, loscuales expanden el subespacio E (J = j1 + j2) de E (j1, j2).

16.7.2. Determinacion de los vectores |JM〉 en los otros subespacios

Definiremos ahora a G (j1 + j2) como el suplemento o complemento ortogonal de E (j1 + j2) en E (j1, j2). Deacuerdo con la Ec. (16.66), tal complemento ortogonal estara dado por

G (j1 + j2) = E (j1 + j2 − 1)⊕ E (j1 + j2 − 2)⊕ . . . ⊕ E (|j1 − j2|)

y aplicamos a G (j1 + j2) un analisis analogo al realizado en la seccion 16.7.1 para E (j1 + j2).

En G (j1 + j2) el grado de degeneracion g′j1,j2 (M) de un valor dado de M es menor en la unidad que ladegeneracion en el espacio completo E (j1, j2)

g′j1,j2 (M) = gj1,j2 (M)− 1 (16.70)

esto se debe a que E (j1 + j2) posee uno, y solo un vector asociado a cada valor accesible de M en E (j1, j2). Esdecir, para cadaM en el intervalo − (j1 + j2) ≤M ≤ j1+j2 hay uno y solo un vector en E (j1 + j2). En particular,M = j1 + j2 ya no existe en G (j1 + j2), y por tanto el valor maximo de M en G (j1 + j2) es M = j1 + j2 − 1,como este era doblemente degenerado en E (j1, j2), sera no-degenerado en G (j1 + j2). Por argumentos similaresa los de la seccion 16.7.1, el vector asociado a M = j1 + j2 − 1 en este subespacio, debe ser proporcional a|J = j1 + j2 − 1,M = j1 + j2 − 1〉. Queremos ahora encontrar su expansion en terminos de la base |m1,m2〉. Envirtud del valor de M = j1 + j2 − 1, la expansion debe ser de la forma

|j1 + j2 − 1, j1 + j2 − 1〉J = α |j1, j2 − 1〉j + β |j1 − 1, j2〉j ; |α|2 + |β|2 = 1 (16.71)

donde ademas requerimos la normalizacion. Adicionalmente, este estado debe ser ortogonal a |j1 + j2, j1 + j2 − 1〉J ∈E (j1 + j2), i.e. al estado del complemento ortogonal de G (j1 + j2) con el mismo valor de M = j1 + j2− 1. Usandolas expresiones (16.69, 16.71) para este vector, dicha ortogonalidad se escribe como

J〈j1 + j2, j1 + j2 − 1 |j1 + j2 − 1, j1 + j2 − 1〉J = 0[√

j1j1 + j2

j 〈j1 − 1, j2|+√

j2j1 + j2

j 〈j1, j2 − 1|] [α |j1, j2 − 1〉j + β |j1 − 1, j2〉j

]= 0

β

√j1

j1 + j2j 〈j1 − 1, j2| j1 − 1, j2〉j + α

√j2

j1 + j2j 〈j1, j2 − 1| j1, j2 − 1〉j = 0

β

√j1

j1 + j2+ α

√j2

j1 + j2= 0 (16.72)

Page 425: Mecanica Cuantica: Notas de Clase

16.8. TRANSFORMACION DE LA BASE DESACOPLADA A LA BASE ACOPLADA 425

la condicion de normalizacion (16.71) junto con la Ec. (16.72) nos permiten encontrar α y β dentro de un factorde fase. Escogiendo α real y positivo, la Ec. (16.72) nos dice que β es real y toma el valor

β = −α√j2j1

⇒ α2 + β2 = α2

[1 +

j2j1

]= 1 ⇒ α2

[j1 + j2j1

]= 1

α =

√j1

j1 + j2; β = −α

√j2j1

= −√

j2j1 + j2

Con lo cual la Ec. (16.71) queda

|j1 + j2 − 1, j1 + j2 − 1〉J =

√j1

j1 + j2|j1, j2 − 1〉j −

√j2

j1 + j2|j1 − 1, j2〉j (16.73)

este es el primer vector de una nueva familia caracterizada por J = j1+j2−1, de forma similar al vector asociado aJ = j1+ j2 en la seccion 16.7.1. Los otros vectores de esta nueva familia se pueden generar por aplicacion sucesivadel operador J−. De esta forma, obtenemos [2 (j1 + j2 − 1) + 1] vectores del tipo |J = j1 + j2 − 1,M〉 donde J yM toman los valores

J = j1 + j2 − 1 ; M = j1 + j2 − 1, j1 + j2 − 2, . . . ,− (j1 + j2 − 1)

estos vectores nos permiten expandir al subespacio E (j1 + j2 − 1).Ahora bien, si j1+j2−2 ≥ |j1 − j2| podemos formar el suplemento de la suma directa E (j1 + j2)⊕E (j1 + j2 − 1)

en el espacio E (j1, j2)

G (j1 + j2, j1 + j2 − 1) = E (j1 + j2 − 2)⊕ E (j1 + j2 − 3)⊕ . . . ⊕ E (|j1 − j2|)

en el suplemento G (j1 + j2, j1 + j2 − 1), la degeneracion de cada valor deM decrece en una unidad con respecto ala degeneracion en el suplemento anterior G (j1 + j2). En particular, el maximo valor deM es ahoraM = j1+j2−2y es no-degenerado. El vector asociado en G (j1 + j2, j1 + j2 − 1) sera |J = j1 + j2 − 2, M = j1 + j2 − 2〉.

Para calcular al vector |j1 + j2 − 2, j1 + j2 − 2〉J en terminos de la base |m1,m2〉, basta notar que este debeser una combinacion lineal de tres vectores

|j1 + j2 − 2, j1 + j2 − 2〉J = α1 |j1, j2 − 2〉j + α2 |j1 − 1, j2 − 1〉j + α3 |j1 − 2, j2〉j (16.74)

los tres coeficientes se fijan dentro de un factor de fase por la condicion de normalizacion y de ortogonalidad conlos vectores (ya conocidos) dados por: |j1 + j2, j1 + j2 − 2〉 , |j1 + j2 − 1, j1 + j2 − 2〉. Es decir, los vectores en elcomplemento ortogonal de G (j1 + j2, j1 + j2 − 1), con el mismo valor de M = j1 + j2 − 2. Una vez determinadoslos coeficientes en (16.74), podemos encontrar los demas vectores de esta tercera familia, por aplicacion sucesivade J−. Estos vectores nos permiten expandir a E (j1 + j2 − 2).

El procedimiento se puede repetir hasta abarcar todos los valores de M mayores o iguales a |j1 − j2|, y envirtud de la Ec. (16.54) tambien todos los valores correspondientes a M menores o iguales a − |j1 − j2|. De estaforma determinamos todos los vectores |J,M〉 en terminos de la base original |m1,m2〉.

16.8. Transformacion de la base desacoplada a la base acoplada y coeficientes

de Clebsch-Gordan

En el espacio E (j1, j2), los autovectores comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 , y que denotamos (en notacion completa)

por |j1, j2;m1,m2〉 forman una base ortonormal conocida como la base “desacoplada” en el sentido de que estabase nos da informacion directa de los numeros cuanticos individuales de cada partıcula (o de cada grado de

Page 426: Mecanica Cuantica: Notas de Clase

426 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

libertad). Por otra parte, los autovectores comunes a J2, J3,J2(1),J

2(2), y que denotamos (en notacion completa)

por |j1, j2;J,M〉 forman una base ortonormal conocida como la base “acoplada” ya que esta base nos dainformacion directa de los numeros cuanticos asociados al sistema como un todo.

La transformacion que nos lleva desde la base desacoplada hasta la base acoplada es unitaria puesto que es unatransformacion de una base ortonormal a otra base tambien ortonormal. Esta transformacion unitaria se escribefacilmente usando la completez en E (j1, j2) de la base desacoplada

|j1, j2;J,M〉 =j1∑

m1=−j1

j2∑

m=−j2|j1, j2;m1,m2〉 〈j1, j2;m1,m2| J,M〉 (16.75)

cambiaremos ligeramente la notacion para los coeficientes de esta expansion en la forma

〈j1, j2;m1,m2|J,M〉 ≡ 〈m1,m2 (j1, j2) J,M〉 (16.76)

con lo cual la expansion (16.75) se escribe como

|j1, j2;J,M〉 =j1∑

m1=−j1

j2∑

m=−j2|j1, j2;m1,m2〉 〈m1,m2 (j1, j2) J,M〉 (16.77)

los coeficientes 〈m1,m2 (j1, j2) J,M〉 de la expansion, que son elementos de la matriz unitaria de transformacion,se conocen como coeficientes de Clebsch-Gordan. Los numeros cuanticos de la izquierda indican un ket de labase desacoplada, los de la derecha indica un ket de la base acoplada y los numeros cuanticos (j1, j2) del centro,indican los momentos angulares j1 y j2 que se estan acoplando. Un aspecto importante es que la notacion original|j1, j2;m1,m2; k1, k2〉 , |j1, j2;J,M ; k1, k2〉 para las bases no es necesaria dado que los productos internos sonindependientes de k1 y k2, y dentro del espacio E (j1, j2) los k

′s toman un solo valor, de modo que dentro de estesubespacio este numero cuantico no discrimina diferentes estados.

No es posible dar expresiones generales para los coeficientes de Clebsch-Gordan. Estos coeficientes se puedengenerar con el algoritmo explicado en las secciones anteriores. Adicionalmente, existen tablas numericas de estoscoeficientes. Por ejemplo, las Ecs. (16.67, 16.69, 16.73) nos permiten encontrar algunos coeficientes de Clebsch-Gordan

〈j1, j2 (j1, j2) j1 + j2, j1 + j2〉 = 1

〈j1 − 1, j2 (j1, j2) j1 + j2, j1 + j2 − 1〉 =

√j1

j1 + j2

〈j1, j2 − 1 (j1, j2) j1 + j2, j1 + j2 − 1〉 =

√j2

j1 + j2

〈j1, j2 − 1 (j1, j2) j1 + j2 − 1, j1 + j2 − 1〉 =

√j1

j1 + j2

〈j1 − 1, j2 (j1, j2) j1 + j2 − 1, j1 + j2 − 1〉 = −√

j2j1 + j2

Es importante mencionar que para determinar estos coeficientes en forma unica, deben escogerse ciertas con-venciones de fases. Lo usual es definir estos coeficientes como reales. Sin embargo, la escogencia de ciertas fasesdictamina el signo de algunos coeficientes. Por supuesto, los signos relativos de los coeficientes que aparecen en laexpansion del mismo vector |J,M〉 estan fijos, solo se puede escoger en forma arbitraria el signo global.

Adicionalmente, la reglas de adicion que hemos obtenido muestran que estos coeficientes tienen unas reglas deseleccion: el coeficiente 〈j1, j2;m1,m2|J,M〉 ≡ 〈m1,m2 (j1, j2) J,M〉 es diferente de cero solo si

M = m1 +m2 ; |j1 − j2| ≤ J ≤ j1 + j2 (16.78)

Page 427: Mecanica Cuantica: Notas de Clase

16.8. TRANSFORMACION DE LA BASE DESACOPLADA A LA BASE ACOPLADA 427

donde J debe ser del mismo tipo (entero o semi-entero) que los valores j1+ j2 y |j1 − j2|. La segunda condicion en(16.78) se conoce usualmente como “regla del triangulo” ya que expresa el hecho de que si la condicion se satisface,debe poderse formar un triangulo con tres segmentos de longitud j1, j2 y J . En otras palabras, la segunda ecuacion(16.78) expresa el conocido teorema que nos dice que un lado J de un triangulo es menor que la suma de los otrosdos lados y mayor que su diferencia.

Naturalmente la relacion inversa de la expresada en (16.77) se puede obtener usando la completez de la baseacoplada

|j1, j2;m1,m2〉 =j1+j2∑

J=j1−j2

J∑

M=−J|J,M〉 〈J,M |j1, j2;m1,m2〉 ≡

j1+j2∑

J=j1−j2

J∑

M=−J|J,M〉 〈J,M (j1, j2) m1,m2〉

(16.79)dado que los coeficientes de C-G son elementos de una matriz unitaria y se eligen como reales, la matriz seraortogonal real, por tanto se cumple la condicion

〈m1,m2 (j1, j2) J,M〉 = 〈J,M (j1, j2) m1,m2〉 (16.80)

En sıntesis, los coeficientes de Clebsch-Gordan determinan la transformacion de la base desacoplada a la baseacoplada y viceversa.

Page 428: Mecanica Cuantica: Notas de Clase

Capıtulo 17

Propiedades generales de los sistemas dedos estados

Si por ejemplo consideramos los estados propios de los operadores de espın S2 y S3 para una partıcula de espıns = 1/2, tenemos que hay solo dos autoestados de S2 y S3 que usualmente denotamos |±〉. Si estamos interesadosen informacion concerniente solo a variables de espın, por ejemplo la probabilidad de que el momento magneticode espın sea +1/2 en una medida de espın (sin importar los valores que tomen las variables espaciales), entoncespodemos por simplicidad considerar un espacio vectorial (espinorial) de solo dos dimensiones para realizar loscalculos, tal que los dos estados |±〉 formaran una base para dicho espacio.

Existen otros escenarios en los cuales los sistemas de dos estados resultan relevantes en mecanica cuantica.Consideremos un sistema para el cual existen dos estados con energıas muy cercanas entre sı, y que son muydiferentes a las energıas de los otros autoestados de energıa del sistema. Asumamos que queremos evaluar elefecto de una perturbacion externa o de una perturbacion interna previamente ignorada. Si la intensidad de laperturbacion es suficientemente pequena, se puede demostrar que su efecto sobre los dos estados “cercanos”, sepuede calcular en primera aproximacion ignorando los otros niveles de energıa. De modo que todos los calculosinvolucran un espacio de dos dimensiones.

17.1. Formulacion del problema

Consideremos un sistema fısico cuyo espacio de estados es de dos dimensiones. Como ya se menciono estoes usualmente solo una aproximacion, en la cual asumimos que hay un subespacio dos dimensional del espaciocompleto de estados que esta casi desacoplado de su complemento ortogonal. Es decir, la probabilidad de obtenervalores de energıa diferentes a las de los dos estados en una medicion es mucho menor que la probabilidad deobtener alguna de las dos energıas de los dos estados en cuestion. De acuerdo con el quinto postulado, esto implicaque la probabilidad de que el sistema este en una combinacion lineal que involucra solo a los dos estados es casiuno.

Definamos un Hamiltoniano H0 que denominaremos Hamiltoniano no perturbado, y usaremos la base de susvectores propios |ϕ1〉 , |ϕ2〉 para realizar los calculos. Sus niveles de energıa seran E1 y E2 de modo que

H0 |ϕ1〉 = E1 |ϕ1〉 ; H0 |ϕ2〉 = E2 |ϕ2〉 , 〈ϕi |ϕj〉 = δij , i, j = 1, 2 (17.1)

ahora queremos tener en cuenta una perturbacion externa o interaccion interna previamente ignorada. Tal per-turbacion (tambien llamado acople) sera simbolizada como W , y el Hamiltoniano perturbado H viene dado por

H = H0 +W (17.2)

denotaremos a los autoestados y autovalores de H como |ψ±〉 y E± respectivamente

H |ψ+〉 = E+ |ψ+〉 ; H |ψ−〉 = E− |ψ−〉 (17.3)

428

Page 429: Mecanica Cuantica: Notas de Clase

17.2. EFECTO DEL ACOPLE SOBRE LA ENERGIA Y LOS ESTADOS ESTACIONARIOS 429

asumiremos que W es independiente del tiempo. Expresaremos matricialmente a la perturbacion W usando labase no perturbada |ϕ1〉 , |ϕ2〉 (i.e. la base de vectores propios del Hamiltoniano no perturbado H0)

W =

(〈ϕ1|W |ϕ1〉 〈ϕ1|W |ϕ2〉〈ϕ2|W |ϕ1〉 〈ϕ2|W |ϕ2〉

)=

(W11 W12

W21 W22

), Wij =W ∗

ji (17.4)

de modo que W11 y W22 son reales y W12 =W ∗21. En ausencia del acople o perturbacionW , las energıas accesibles

del sistema son E1 y E2, siendo |ϕ1〉 , |ϕ2〉 los estados estacionarios del sistema, de modo que si en t = 0 el sistemaesta en uno de estos dos estados, permanecera en el indefinidamente. Veremos entonces como se modifican lasenergıas y estados estacionarios cuando se introduce el acople W .

17.2. Consecuencias de la introduccion del acople sobre los niveles de energıay los estados estacionarios

Al introducir el acople, el Hamiltoniano del sistema sera el descrito en la Ec. (17.2). Por tanto, de acuerdo conlos postulados, los niveles de energıa y estados estacionarios seran ahora los descritos en la Ec. (17.3). Una medidade la energıa solo podra dar alguno de los valores E+ o E− y los estados estacionarios seran sus autoestadosasociados |ψ+〉 y |ψ−〉. Esto implica en particular que E1 y E2 ya no son energıas permitidas en el sistema y losestados |ϕ1〉 y |ϕ2〉 ya no seran estados estacionarios (pues estos no son en general autovalores ni autoestados delHamiltoniano perturbado H). Esto implica que si el sistema esta inicialmente en el estado |ϕ1〉 la introduccion dela perturbacion genera una evolucion temporal y por tanto hay cierta probabilidad P12 (t) de encontrar al sistemaen el estado |ϕ2〉 en el tiempo t. Decimos entonces que W induce transiciones entre los estados no perturbados.Por esta razon decimos que W actua como un acople entre |ϕ1〉 y |ϕ2〉.

17.2.1. Efecto del acople sobre los estados estacionarios del sistema

La representacion matricial del Hamiltoniano perturbado en la base |ϕ1〉, |ϕ2〉 sera

H =

(E1 +W11 W ∗

21

W21 E2 +W22

)

los valores y vectores propios de esta matriz se realizaron en detalle en la seccion 1.45.3. Las Ecs. (1.229, 1.230,1.231) nos muestran tales autovalores y autovectores

E± =1

2(E1 +W11 + E2 +W22)±

1

2

√(E1 +W11 − E2 −W22)

2 + 4 |W12|2 (17.5)

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉+ sin

θ

2eiϕ/2 |ϕ2〉 (17.6)

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉+ cos

θ

2eiϕ/2 |ϕ2〉 (17.7)

donde los angulos θ y ϕ estan dados por la Ecs. (1.232)

tan θ =2 |W21|

E1 +W11 − E2 −W22, W21 = |W21| eiϕ ; 0 ≤ θ < π , 0 ≤ ϕ < 2π (17.8)

Es facil ver que si W12 = 0, los autoestados de H son los autoestados de H0 y los nuevos niveles de energıason simplemente E1 + W11 y E2 + W22. Por tanto, los efectos interesantes surgen cuando W posee elementosno-diagonales W12 = W ∗

21. Para simplificar la discusion asumimos que la matriz de W en la base |ϕ1〉 , |ϕ2〉 es

Page 430: Mecanica Cuantica: Notas de Clase

430 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

puramente no-diagonal1. Haciendo W11 =W22 = 0 en las Ecs. (17.5, 17.8) obtenemos

E± =1

2(E1 + E2)±

1

2

√(E1 − E2)

2 + 4 |W12|2 (17.9)

tan θ =2 |W21|E1 − E2

, 0 ≤ θ < π ; W21 = |W21| eiϕ (17.10)

es conveniente definir las siguientes variables

Em ≡ 1

2(E1 + E2) ; ∆ ≡ 1

2(E1 − E2) (17.11)

que corresponden al promedio y el desdoblamiento de los niveles no perturbados. Sustituyendo (17.11) en las Ecs.(17.9, 17.10) tenemos que

E+ = Em +

√∆2 + |W21|2 ; E− = Em −

√∆2 + |W21|2 ; tan θ =

|W21|∆

(17.12)

Las Ecs. (17.12) muestran que cuando Em cambia, la variacion de E± es equivalente a correr el origen a lo

Figura 17.1: Variacion de las energıas E± con respecto al desdoblamiento ∆ ≡ (E1 −E2) /2. Hemos definido elcero del eje de energıa en Em. En ausencia de acoplamiento los niveles se cruzan en el origen como lo muestranlas lıneas rectas punteadas. Al introducir el acople W no-diagonal, los dos niveles perturbados se “repelen uno aotro” y se obtienen curvas de E+ y E− que no se cruzan. Tales curvas son ramas hiperbolicas (lıneas solidas en lafigura) cuyas asıntotas son los niveles no perturbados.

largo del eje de energıa. Adicionalmente, las Ecs. (17.6, 17.7, 17.10, 17.12) muestran que los autovectores |ψ±〉 nodependen de Em sino solo del desdoblamiento ∆. Es interesante mostrar el comportamiento de las energıas E1,2 y

1Si W11 y W22 son no nulos, podemos definir E1 = E1 +W11 y E2 = E2 +W22. Todos los resultados que se obtendran en estaseccion seran validos en este caso, haciendo los reemplazos E1 → E1 y E2 → E2.

Page 431: Mecanica Cuantica: Notas de Clase

17.2. EFECTO DEL ACOPLE SOBRE LA ENERGIA Y LOS ESTADOS ESTACIONARIOS 431

E± en un diagrama de ∆ versus energıa. La Fig. 17.1 muestra que tal diagrama para las energıas E± correspondea ramas hiperbolicas simetricas con respecto a los ejes coordenados (en donde el zero del eje vertical se ubicoen Em), y cuyas asıntotas son las lıneas rectas punteadas que describen el comportamiento de las energıas E1 yE2. La Fig. 17.1 tambien muestra que la separacion mınima entre las ramas hiperbolicas es 2 |W21|. Puede verseentonces que en ausencia de acople, los niveles de energıa E1 y E2 se cruzan en ∆ = 0 (como se ve tambien enlas Ecs. 17.11). Con la introduccion del acople, los niveles de energıa “se repelen” es decir tienden a alejarse. Poresta razon se suele hablar de diagramas anti-cruzantes, para curvas del tipo mostrado por E±. Se observa ademasque cuando W → 0 tenemos que E± → E1,2 si E1 > E2 en tanto que E± → E2,1 si E2 > E1. De las Ecs. (17.11,17.12) vemos que

|E+ − E−| = 2

√∆2 + |W21|2 > 2∆ ; |E1 − E2| ≡ 2∆ ⇒ (17.13)

|E+ − E−| > |E1 − E2| (17.14)

donde el aumento en el desdoblamiento es mayor a medida que crece el acople. Vemos entonces que el acoplesepara la frecuencias normales, situacion que aparece en muchos escenarios fısicos.

Es necesario poder discriminar cuando podemos hablar de un acople “fuerte” o “debil”. Para ello vemos quelas Ecs. (17.12) se pueden reescribir como

E± = Em ±∆√1 +K2 ; K ≡

∣∣∣∣W21

∣∣∣∣ , ∆ 6= 0 (17.15)

de modo que la intensidad del acople se puede medir en terminos de K

K ≡∣∣∣∣W21

∣∣∣∣≪ 1 ⇒ acople debil

K ≡∣∣∣∣W21

∣∣∣∣≫ 1 ⇒ acople fuerte

17.2.2. Efecto de un acople debil sobre los niveles de energıa y estados estacionarios

El acople debil esta caracterizado por |∆| ≫ |W21|. La Fig. 17.1 nos muestra que en este lımite todas las energıasse comportan aproximadamente como las asıntotas. Puesto que K ≪ 1, las Ecs. (17.15) se pueden expandir enseries de potencias de K

E± = Em ±∆

(1 +

1

2

∣∣∣∣W21

∣∣∣∣2

+ . . .

)(17.16)

adicionalmente, la Ec. (17.12) nos dice que θ ≃ 0 en este lımite. Por tanto tan θ ≃ θ ≃ sin θ, de modo que a primerorden obtenemos

cosθ

2≃ 1 ; sin

θ

2≃ θ

2≃ tan θ

2=

|W21|2∆

reemplazando estas aproximaciones en las Ecs. (17.6, 17.7), los autoestados en el lımite de acople debil quedan

|ψ+〉 ≃ e−iϕ/2 |ϕ1〉+|W21|2∆

eiϕ/2 |ϕ2〉 ; |ψ−〉 ≃ −|W21|2∆

e−iϕ/2 |ϕ1〉+ eiϕ/2 |ϕ2〉 (17.17)

|ψ+〉 ≃ e−iϕ/2[|ϕ1〉+

|W21|2∆

eiϕ |ϕ2〉]

; |ψ−〉 ≃[−|W21|

2∆e−iϕ |ϕ1〉+ |ϕ2〉

]eiϕ/2 (17.18)

puesto que las fases globales son irrelevantes, vemos que un acople debil genera estados perturbados muy similaresa los estados no perturbados como era de esperarse. Por ejemplo, el estado |ψ+〉 se puede ver como el estado |ϕ1〉ligeramente “contaminado” por una pequena contribucion del estado |ϕ2〉. Similarmente, |ψ−〉 es casi el estado|ϕ2〉 con una pequena contribucion de |ϕ1〉.

Page 432: Mecanica Cuantica: Notas de Clase

432 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

17.2.3. Efecto de un acople fuerte sobre los niveles de energıa y estados estacionarios

El acople fuerte se caracteriza por |∆| ≪ |W21|. La Fig. 17.1 nos muestra que este lımite corresponde alcomportamiento de las energıas alrededor de ∆ = 0. En particular, si tomamos ∆ = 0 el acople se considera fuertepara cualquier valor no nulo de W21. En el lımite E1 = E2 i.e. ∆ = 0, las Ecs. (17.12) quedan en la forma

E± = Em ± |W21| (17.19)

y vemos entonces que el efecto del acople es mas mucho mas importante cuando los dos niveles no perturbadostienen la misma energıa (por ejemplo por degeneracion). Las Ecs. (17.19) muestran que este efecto es de primerorden, en tanto que en el lımite de acople debil el efecto es de segundo orden como se aprecia en la Ec. (17.16).Cuando ∆ = 0 vemos de (17.12) que θ = π/2 y los autoestados (17.6, 17.7) quedan

|ψ+〉 = cosπ

4e−iϕ/2 |ϕ1〉+ sin

π

4eiϕ/2 |ϕ2〉 ; |ψ−〉 = − sin

π

4e−iϕ/2 |ϕ1〉+ cos

π

4eiϕ/2 |ϕ2〉 (17.20)

|ψ+〉 =1√2

[e−iϕ/2 |ϕ1〉+ eiϕ/2 |ϕ2〉

]; |ψ−〉 =

1√2

[−e−iϕ/2 |ϕ1〉+ eiϕ/2 |ϕ2〉

](17.21)

de modo que en el lımite de acople fuerte, los estados |ψ±〉 difieren radicalmente de |ϕ1,2〉 como se esperaba. Vemosque |ψ±〉 son superposiciones de |ϕ1〉 y |ϕ2〉 con coeficientes del mismo modulo. Podemos decir que |ψ±〉 son estadosde “maxima mezcla” de los estados |ϕ1〉 y |ϕ2〉.

17.3. Evolucion temporal del vector de estado: oscilacion del sistema entredos estados sin perturbar

La evolucion del estado |ψ (t)〉 del sistema de dos estados esta governada por la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 = (H0 +W ) |ψ (t)〉 (17.22)

y dado que |ψ (t)〉 es una superposicion de los estados |ϕ1〉 y |ϕ2〉 para todo tiempo tenemos que

|ψ (t)〉 = a1 (t) |ϕ1〉+ a2 (t) |ϕ2〉 (17.23)

insertando la expansion (17.23) en la ecuacion de Schrodinger (17.22), aplicando el bra 〈ϕ1| y usando la Ec. (17.4)con W11 =W22 = 0, resulta

i~ 〈ϕ1|d

dt[a1 (t) |ϕ1〉+ a2 (t) |ϕ2〉] = 〈ϕ1| (H0 +W ) [a1 (t) |ϕ1〉+ a2 (t) |ϕ2〉]

i~d

dt[a1 (t) 〈ϕ1 |ϕ1〉+ a2 (t) 〈ϕ1 |ϕ2〉] = a1 (t) 〈ϕ1| (H0 +W ) |ϕ1〉+ a2 (t) 〈ϕ1| (H0 +W ) |ϕ2〉

i~d

dta1 (t) = a1 (t) (E1 +W11) + a2 (t) [E2〈ϕ1 |ϕ2〉+W12]

i~d

dta1 (t) = E1a1 (t) +W12a2 (t)

donde hemos asumido que H0 es conservativo y por tanto |ϕ1〉 es independiente del tiempo. Un procedimientosimilar aplicando el bra 〈ϕ2| nos lleva a las ecuaciones

i~d

dta1 (t) = E1 a1 (t) +W12 a2 (t) (17.24)

i~d

dta2 (t) = W21 a1 (t) + E2 a2 (t) (17.25)

Page 433: Mecanica Cuantica: Notas de Clase

17.3. EVOLUCION DEL VECTOR DE ESTADO: OSCILACION ENTRE DOS ESTADOS 433

si W12 6= 0, tenemos una sistema de dos ecuaciones diferenciales homogeneas acopladas.La evolucion temporal de |ψ (t)〉 se puede obtener utilizando el metodo descrito en la seccion 5.8. Esto es, se

escribe la expansion de |ψ (0)〉 en terminos de los autoestados |ψ±〉 del Hamiltoniano H

|ψ (0)〉 = λ |ψ+〉+ µ |ψ−〉 (17.26)

de modo que la evolucion temporal vendra dada por

|ψ (t)〉 = λe−iE+t/~ |ψ+〉+ µe−iE−t/~ |ψ−〉 (17.27)

lo cual nos permite obtener a1 (t) y a2 (t) aplicando los bras 〈ϕ1| y 〈ϕ2| a ambos lados de la Ec. (17.27).Dado que los estados |ϕ1〉 y |ϕ2〉 ya no son estacionarios, es de esperarse que incluso si el estado inicial es por

ejemplo |ϕ1〉 el sistema evolucione temporalmente. Veremos de hecho que si el estado del sistema esta descrito porla Ec. (17.27), el sistema oscila entre los estados no perturbados |ϕ1〉 y |ϕ2〉. Para verlo asumiremos que en t = 0el sistema esta en el estado |ϕ1〉

|ψ (0)〉 = |ϕ1〉ahora debemos expandir este estado inicial en terminos de |ψ±〉 como en la Ec. (17.26). Para ello invertimos lasEcs. (17.6, 17.7). Esto se realiza multiplicando la Ec. (17.6) por cos (θ/2) y la Ec. (17.7) por − sin (θ/2) y sumando

cosθ

2|ψ+〉 − sin

θ

2|ψ−〉 = cos2

θ

2e−iϕ/2 |ϕ1〉+ sin2

θ

2e−iϕ/2 |ϕ1〉 = e−iϕ/2 |ϕ1〉

|ϕ1〉 = |ψ (0)〉 = eiϕ/2[cos

θ

2|ψ+〉 − sin

θ

2|ψ−〉

](17.28)

comparando la Ec. (17.28) con la Ec. (17.26) vemos que λ = eiϕ/2 cos (θ/2) y µ = −eiϕ/2 sin (θ/2), con lo cual laEc. (17.27) queda

|ψ (t)〉 = eiϕ/2[cos

θ

2e−iE+t/~ |ψ+〉 − sin

θ

2e−iE−t/~ |ψ−〉

](17.29)

si el sistema evoluciona bajo el Hamiltoniano perturbado hasta el tiempo t, el sistema estara en este tiempo en elestado |ψ (t)〉 descrito por la Ec. (17.29). Asumamos ahora que la perturbacion W se “desconecta” en el tiempo t.Si justo despues de desconectar la perturbacion medimos la energıa, obtendremos E1 o E2 (ya que estos vuelvena ser los valores de energıa accesibles del sistema), y la probabilidad de obtener cada uno de estos valores vienedada por

PEi = |〈ϕi |ψ (t)〉|2 ; i = 1, 2 (17.30)

pero esto es equivalente a decir que esta es la probabilidad de que el sistema quede preparado en el estado |ϕi〉.Por esta razon, suele decirse que |〈ϕi |ψ (t)〉|2 es la probabilidad de encontrar al sistema en el tiempo t en |ϕi〉.No obstante, vale la pena mencionar que esta afirmacion solo es valida si: (a) Se desconecta la perturbacion en eltiempo t y (b) Justo despues de desconectar la perturbacion, se hace la medida del observable H (si se mide otroobservable, el sistema queda preparado en un autoestado de ese otro observable). Notese que si la perturbacion nose desconecta en t, una medicion del observable H solo puede dar E+ o E− lo cual a su vez implica que el sistemaquedara preparado en el estado |ψ+〉 o en el estado |ψ−〉 y no hay posibilidad de que quede en el estado |ϕi〉. Deotra parte, si no se realiza ninguna medicion, el sistema evoluciona de acuerdo con la ecuacion de Schrodinger yno podemos hablar de la probabilidad de obtener un estado (ya que la ecuacion de Schrodinger es determinista).

La anterior discusion nos muestra que si no se realiza ninguna medida en el tiempo t, la cantidad 〈ϕi |ψ (t)〉 ≡ aies simplemente el coeficiente de Fourier de la expansion de |ψ (t)〉 en terminos de |ϕ1〉 y |ϕ2〉. En otras palabras,el coeficiente ai nos dice el “peso” con el cual contribuye cada estado |ϕi〉 al estado |ψ (t)〉 con la restriccion deque |a1|2 + |a2|2 = 1.

Con estas aclaraciones interpretaremos de aquı en adelante a |〈ϕ2 |ψ (t)〉|2 como la probabilidad de encontraral sistema en el tiempo t en |ϕ2〉. La amplitud de probabilidad asociada esta dada por

〈ϕ2 |ψ (t)〉 = eiϕ/2[cos

θ

2e−iE+t/~〈ϕ2 |ψ+〉 − sin

θ

2e−iE−t/~〈ϕ2 |ψ−〉

](17.31)

Page 434: Mecanica Cuantica: Notas de Clase

434 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

de las Ecs. (17.6, 17.7) tenemos que

〈ϕ2 |ψ+〉 = cosθ

2e−iϕ/2〈ϕ2 |ϕ1〉+ sin

θ

2eiϕ/2〈ϕ2 |ϕ2〉 ; 〈ϕ2 |ψ−〉 = − sin

θ

2e−iϕ/2〈ϕ2 |ϕ1〉+ cos

θ

2eiϕ/2〈ϕ2 |ϕ2〉

〈ϕ2 |ψ+〉 = sinθ

2eiϕ/2 ; 〈ϕ2 |ψ−〉 = cos

θ

2eiϕ/2 (17.32)

reemplazando (17.32) en (17.31), la probabilidad de encontrar al sistema en el tiempo t en |ϕ2〉 queda

P12 (t) = |〈ϕ2 |ψ (t)〉|2 =∣∣∣∣eiϕ/2

[cos

θ

2e−iE+t/~ sin

θ

2eiϕ/2 − sin

θ

2e−iE−t/~ cos

θ

2eiϕ/2

]∣∣∣∣2

=

∣∣∣∣eiϕ

2

[sin θ e−iE+t/~ − sin θ e−iE−t/~

]∣∣∣∣2

=1

4sin2 θ

∣∣∣e−iE+t/~ − e−iE−t/~∣∣∣2

P12 (t) =1

4sin2 θ

(e−iE+t/~ − e−iE−t/~

)(eiE+t/~ − eiE−t/~

)=

1

4sin2 θ

[1− e−i(E+−E−)t/~ − ei(E+−E−)t/~ + 1

]

=1

4sin2 θ

2−

[e−i(E+−E−)t/~ + ei(E+−E−)t/~

]=

1

4sin2 θ

2− 2 cos

((E+ − E−) t

~

)

teniendo en cuenta que 1− cos θ = 2 sin2 (θ/2), tenemos finalmente

P12 (t) =1

2sin2 θ

1− cos

((E+ − E−) t

~

)

P12 (t) = sin2 θ sin2[(E+ − E−) t

2~

](17.33)

usando la Ec. (1.223), Pag. 108, tenemos que

sin2 θ = 1− cos2 θ = 1− (H11 −H22)2

(H11 −H22)2 + 4 |H21|2

= 1− (E1 − E2)2

(E1 − E2)2 + 4 |W21|2

sin2 θ =4 |W21|2

(E1 −E2)2 + 4 |W21|2

(17.34)

reemplazando las Ecs. (17.34, 17.9) en la Ec. (17.33) podemos escribir P12 en terminos de los elementos matricialesWij y de las energıas no perturbadas E1 y E2

P12 (t) =4 |W21|2

(E1 − E2)2 + 4 |W21|2

sin2

√4 |W12|2 + (E1 − E2)

2

2~t

(17.35)

la Ec. (17.35) es conocida como Formula de Rabi.

La Ec. (17.33) nos muestra que P12 (t) oscila en el tiempo con una frecuencia (E+ − E−) /h, que correspondea la unica frecuencia de Bohr del sistema. P12 (t) varıa desde cero hasta sin2 θ, este valor maximo se alcanza paratiempos

tk =(2k + 1) π~

E+ − E−, k = 0, 1, 2, . . .

la frecuencia de oscilacion y el maximo sin2 θ de la probabilidad dependen de |W21| y de ∆ ≡ E1 − E2. Usando(17.12), con ∆ = 0 tenemos que

∆ = 0 ⇒ E+ − E−h

=2 |W21|h

, sin2 θ = 1

Page 435: Mecanica Cuantica: Notas de Clase

17.3. EVOLUCION DEL VECTOR DE ESTADO: OSCILACION ENTRE DOS ESTADOS 435

de modo que en un tiempo tk = (2k+1)π~2|W21| el sistema (cuyo estado inicial es |ϕ1〉) estara en el estado |ϕ2〉 . En

consecuencia, todo acople entre dos estados de igual energıa hace que el sistema oscile completamente de unestado a otro con una frecuencia proporcional al acople.

Notese que este fenomeno es analogo al que ocurre con dos pendulos acoplados de la misma frecuencia natural.Si el pendulo 1 se desplaza dejando fijo al pendulo 2, el primero comienza a oscilar pero su oscilacion disminuyeen tanto que va aumentando la del pendulo 2 hasta que se llega a la condicion opuesta para un cierto tiempo, enel cual el pendulo 2 oscila y el pendulo 1 esta instantaneamente en reposo. Luego comienza la transferencia deenergıa al pendulo 1 de nuevo y ası sucesivamente. Similarmente, cuando aumenta el acople (constante del resorteque acopla a los pendulos), disminuye el tiempo de transferencia.

Por otro lado, cuando ∆ ≡ E1 − E2 aumenta, la frecuencia (E+ − E−) /h tambien aumenta (ver Ecs. 17.13,17.14) en tanto que sin2 θ disminuye como se aprecia en la Ec. (17.34). Para un acople debil |∆| = |E1 − E2| ≫|W21|, se observa de las Ecs. (17.13, 17.14) que el desdoblamiento E+ −E− de los niveles perturbados solo difiereligeramente del desdoblamiento ∆ de los estados no perturbados. Se puede ver tambien de la Ec. (17.34) que lacantidad sin2 θ es muy pequena en tal lımite. Esto es de esperarse ya que en el lımite de acople debil |ψ+〉 es muysimilar a |ϕ1〉, con lo cual el sistema estarıa en t = 0 en un estado cuasi-estacionario.

Page 436: Mecanica Cuantica: Notas de Clase

Capıtulo 18

Teorıa cuantica de la dispersion

Un experimento tıpico de dispersion (scattering) consiste en un haz de partıculas que se utilizan como proyecti-les (usualmente en un acelerador) y se proyectan sobre un blanco (otro conjunto de partıculas) que con frecuenciaesta en reposo en el sistema de referencia de laboratorio1. Este tipo de experimentos se realizan usualmente conalguno de estos objetivos: (a) Caracterizar la interaccion que hay entre los proyectiles y el blanco, o (b) Conociendoel tipo de interaccion entre el proyectil y el blanco, obtener informacion sobre la distribucion de masa del blan-co. Cualquiera de estos objetivos se realiza midiendo la desviacion del haz de proyectiles despues de interactuarcon el blanco. Primero describiremos brevemente el escenario clasico de la teorıa de la dispersion, puesto que losconceptos basicos son mas faciles de construır y asimilar en un escenario clasico. Para posteriormente mostrar laimagen cuantica del fenomeno.

18.1. Teorıa clasica de la dispersion

Imaginemos una partıcula incidente (proyectil) sobre un centro dispersor (blanco) que viene desde una distanciaconsiderable (r → ∞, t → −∞). Es decir la partıcula incidente es esencialmente libre en este regimen asintoticocon r → ∞, t → −∞, y por tanto se mueve en lınea recta. Definiremos el origen O, sobre el blanco o centrodispersor, y el eje Z sera una lınea paralela a la lınea de propagacion de la partıcula incidente, que pasa por elorigen O. El parametro de impacto de la partıcula se define como la distancia entre la lınea de propagacionasintotica incidente de la partıcula y el eje Z. En el regimen asintotico incidente, la partıcula viene con una energıay momento lineal E y p, bien definidos, y con un parametro de impacto b. A medida que la partıcula se acercaal blanco, la interaccion con este se vuelve considerable de modo que su trayectoria ya no es una lınea recta, ala region donde esta interaccion es considerable se le denomina la region de colision o region de dispersion.Por convencion, se asume que t ∼ 0 cuando el proyectil esta dentro de la region de colision. Cuando el proyectilse aleja bastante del blanco, este vuelve a ser libre y su trayectoria sera nuevamente una lınea recta, la regionasintotica saliente esta entonces caracterizada por r → ∞ y t → ∞. Sin embargo, la direccion saliente seraen general diferente a la direccion incidente de la partıcula, ya que la interaccion con el blanco en la region decolision se manifiesta en una deflexion de la trayectoria del proyectil. El angulo θ entre la direccion entrante (oincidente) y la direccion saliente se denomina angulo de dispersion de la partıcula. Este angulo es el quecontiene informacion sobre la dispersion y que nos puede arrojar luces sobre la interaccion entre el proyectil y elblanco, o la distribucion de masa del blanco. La Fig. 18.1 muestra la dispersion de un proyectil por un blanco fijo.

En un experimento real no utilizamos un solo proyectil ni un solo blanco, sino un haz de partıculas incidentessobre una serie de blancos. A manera de ejemplo, en el experimento de Rutherford se utilizaron como proyectiles

1En muchos experimentos reales con aceleradores de partıculas, no hay un blanco fijo con respecto al laboratorio, sino que se ponena colisionar dos haces que se aproximan frontalmente. Esto se hace con el fin de aumentar la energıa cinetica total de la colision. Sinembargo, si los haces no presentan mucha dispersion en sus velocidades, siempre es posible pasar a un sistema de referencia en el cuallas partıculas de uno de los haces estan en reposo.

436

Page 437: Mecanica Cuantica: Notas de Clase

18.1. TEORIA CLASICA DE LA DISPERSION 437

Figura 18.1: Ilustracion del parametro de impacto b y del angulo de dispersion θ, en el problema clasico de ladispersion.

un haz de partıculas α (nucleos de He4) emitidos en un decaimiento radiactivo. Por otro lado, los blancos eranatomos de oro en forma de una delgada lamina de dicho elemento. La distribucion angular de las partıculasα, dio una evidencia clara de que la carga positiva del atomo de oro estaba concentrada en un nucleo dondese encontraba casi toda la masa de dicho atomo. En el caso del experimento de Rutherford, el objetivo eracaracterizar la distribucion de masa de los blancos asumiendo conocida la interaccion entre los proyectiles y losblancos (interaccion de Coulomb).

Es claro que la deflexion de la partıcula va a depender tanto de la energıa E como del parametro de impactob. Adicionalmente, puesto que no tenemos un solo proyectil, es importante caracterizar la intensidad (tambiendenominada luminosidad o flujo) del haz incidente i.e. la cantidad de partıculas por unidad de area por unidad detiempo que cruzan un area perpendicular a la direccion de propagacion del haz. Recordemos que por convencion,la direccion de propagacion incidente es uz. Puesto que el haz posee un tamano o ancho, tendremos proyectiles condiferentes parametros de impacto (incluso si todos se preparan con la misma energıa) y por tanto no tendremosun angulo especıfico de dispersion, sino mas bien una distribucion angular que se debe medir con algun detector.El detector de las partıculas salientes debe estar ubicado a una distancia suficientemente lejana para que se puedaconsiderar que esta en la region asintotica saliente (lejos de la region de colision).

Notese que un haz muy intenso producirıa dispersion debida a la interaccion entre los proyectiles, incluso enlas “regiones asintoticas” incidente y saliente. Esto es indeseable para la mayoria de experimentos en donde sepretende caracterizar solo la interaccion proyectil-blanco. Por otro lado, haces de muy baja intensidad produciranuna estadıstica muy pobre debido al bajo numero de eventos detectados. Esto puede compensarse usando hacesde baja intensidad enviando una serie de haces en tiempos prolongados, a fin de mantener baja la interaccionentre los proyectiles y al mismo tiempo acumular la estadıstica suficiente. Esto implica retos experimentales queno trataremos aquı.

La Fig. 18.2, muestra que las partıculas incidentes dentro de un “parche” infinitesimal de area transversal dσ,se dispersaran en un angulo solido infinitesimal asociado dΩ centrado alrededor de cierta direccion Ω ≡ (θ, ϕ).

Page 438: Mecanica Cuantica: Notas de Clase

438 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

Figura 18.2: Las partıculas que inciden en el area dσ, se dispersan dentro del angulo solido dΩ centrado en ladireccion (θ, ϕ).

A mayor dσ le correspondera un mayor angulo solido dΩ, al factor de proporcionalidad entre ambos D (Ω) se leconoce como la seccion eficaz diferencial2 en la direccion Ω ≡ (θ, ϕ)

dσ ≡ D (Ω) dΩ ; D (Ω) ≡ dσ

dΩ(18.1)

Adicionalmente, si dn es el numero de partıculas que cruza el area dσ por unidad de tiempo, por definicion deintensidad se tiene que

I ≡ dn

dσ⇒ dn = I dσ

por lo tanto, la seccion eficaz diferencial se puede definir como el factor de proporcionalidad que conecta a dn conla intensidad del haz y el angulo solido dΩ (centrado en la direccion Ω ≡ (θ, ϕ)) asociado a dn y dσ

dn = I dσ = I D (Ω) dΩ ⇒ D (Ω) dΩ ≡ dn

I(18.2)

en palabras decimos que

D (Ω) dΩ ≡

numero de partıculas dispersadas por unidad de tiempo enun angulo solido dΩ centrado en la direccion Ω ≡ (θ, ϕ)

Intensidad incidente(18.3)

dn tiene dimensiones de tiempo−1, dΩ es adimensional, e I tiene dimensiones de area−1 × tiempo−1. Por tanto,D (Ω) tiene dimensiones de area. Para experimentos de dispersion a escala atomica es usual tomar la unidad basicabarn como medida de la seccion eficaz diferencial

1barn = 10−24cm2

La definicion (18.3) implica que se tiene en cuenta solo las partıculas que se deflectan. El flujo de estas partıculasal alcanzar el detector D es inversamente proporcional al cuadrado de la distancia entre el detector y el centrodispersor, ya que el detector (centrado en una direccion dada (θ, ϕ)) tiene una superficie fija y por tanto el angulosolido ∆Ω que subtendiende con respecto a O, disminuye con la distancia al blanco como r−2. En la practica, elancho del haz esta acotado lateralmente, pero este ancho suele extenderse mas alla de la region de influencia de

2El termino seccion eficaz diferencial no es muy apropiado, puesto que D (Ω) definido en (18.3) no es una cantidad diferencial(infinitesimal) sino finita. Es una derivada mas no un diferencial.

Page 439: Mecanica Cuantica: Notas de Clase

18.2. DIFERENTES TIPOS DE COLISIONES 439

la interaccion, es decir que en los “bordes exteriores” del haz, no hay una interaccion considerable con el blanco yno hay deflexion de los proyectiles. Sin embargo, el detector suele estar fuera de la trayectoria de estas partıculasque no se deflectan, de modo que solo recibe partıculas deflectadas. Con este arreglo experimental, no es posiblemedir la seccion eficaz en la direccion frontal (θ = 0) ya que a ella contribuyen las partıculas con parametro deimpacto cero o muy grande (al menos para potenciales con simetrıa esferica). Usualmente la seccion eficaz frontal,se obtiene por extrapolacion de los valores de D (θ, ϕ) para valores pequenos de θ.

Por otro lado, de la Fig. 18.2 vemos que el diferencial de area dσ viene dado por

dσ = b |db| dϕ

siendo ϕ el angulo azimutal (ya explicaremos la razon para introducir el valor absoluto de db), y puesto que eldiferencial del angulo solido es dΩ = sin θ dθ dϕ, la Ec. (18.1) nos da3

D (Ω) =b

sin θ

∣∣∣∣db

∣∣∣∣ (18.4)

notese que D (Ω) puede depender de θ y ϕ si el parametro de impacto es funcion de θ y ϕ. En la expresion (18.4) seha colocado un valor absoluto debido a que b es tıpicamente una funcion decreciente de θ y por tanto, la derivadaes tıpicamente negativa.

Definiremos ademas la seccion eficaz total en la forma

σ ≡∫

ΩD (Ω) dΩ

dicho en terminos muy generales, σ corresponde al area total del haz incidente que es dispersada por el blanco.

18.2. Diferentes tipos de colisiones

En algunos experimentos de colision es posible que no se conserve el numero y/o la identidad de las partıculas.Por ejemplo, en la colision algunas partıculas se pueden fusionar o fragmentar, de modo que cambia la identidady tal vez el numero de partıculas salientes. Esto ocurre en particular cuando las partıculas que forman el proyectily/o el blanco no son elementales, sino que estan compuestas de otras partıculas mas pequenas. En este tipode colisiones, la energıa interna de las partıculas involucradas cambia de modo que la energıa cinetica inicial esdiferente a la energıa cinetica total final (colisiones inelasticas).

De otra parte, en un regimen relativista, es posible que se creen o aniquilen partıculas a expensas de laenergıa de las partıculas entrantes gracias a la equivalencia masa-energıa. Por ejemplo, en Fısica de partıculas unelectron y un positron (la antipartıcula del electron) colisionando a altas energıas se pueden convertir en un parmuon-antimuon. El muon es una partıcula con caracterısticas similares al electron pero con masa en reposo unasdoscientas veces mayor, este proceso se simboliza como

e−e+ → µ−µ+ (18.5)

en esta colision cambia la naturaleza de las partıculas salientes. Notese que el producto final es de partıculas muchomas masivas, que se pueden crear a expensas de la energıa cinetica de las partıculas incidentes. Tambien existenen Fısica de partıculas los decaimientos, en los cuales una partıcula se fragmenta en dos o mas. Por ejemplo, unmuon µ− puede decaer en dos electrones y un positron

µ− → e−e−e+ (18.6)

en particular es posible que se de el proceso (18.5) y el muon resultante decaiga como en (18.6) resultando

e−e+ → µ−µ+ → e−e−e+µ+

3Para construır dΩ, los diferenciales dϕ y dθ se definen positivos.

Page 440: Mecanica Cuantica: Notas de Clase

440 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

que en forma efectiva se puede ver como

e−e+ → e−e−e+µ+

en esta colision cambio tanto el numero de partıculas como su naturaleza. Este tipo de colisiones las llamamosgenericamente reacciones. En la dispersion o scattering el estado final y el inicial estan compuestos de las mismaspartıculas en numero y en identidad. Nos limitaremos a este tipo de reacciones. Sin embargo, el concepto deseccion eficaz puede extrapolarse a reacciones generales.

Normalmente denominamos dispersion o scattering a aquellas colisiones en las cuales el numero y la identidadde las partıculas se conserva. Si ademas se conserva la energıa cinetica total, es decir si no hay cambios en laenergıa interna de las partıculas, decimos que la dispersion es elastica. En el presente contexto nos limitaremos aestudiar el fenomeno de la dispersion elastica.

18.3. Ejemplos de dispersion en mecanica clasica

18.3.1. Dispersion elastica por esfera rıgida

Figura 18.3: Dispersion de una masa puntual por una esfera rıgida. El angulo de incidencia α, coincide con elangulo de reflexion.

Esta dispersion puede simular la colision elastica de una esfera rıgida de masa m y radio r como proyectil,que choca con otra esfera rıgida en reposo de masa M ≫ m y de radio R ≫ r. Podemos por simplicidad tratarel proyectil como puntual, y considerar que el blanco no recula en el choque. Si la colision es elastica el angulode incidencia α es igual al angulo de reflexion (medidos con respecto a la normal a la superficie del blanco) comose ve en la Fig. 18.3. Siendo θ el angulo de dispersion y b el parametro de impacto, de la Fig. 18.3 son claras lasrelaciones

b = R sinα ; θ = π − 2α siempre que b ≤ R

θ = 0 siempre que b > R

Tendremos entonces que

b = R sin

2− θ

2

)= R cos

θ

2(18.7)

Page 441: Mecanica Cuantica: Notas de Clase

18.3. EJEMPLOS DE DISPERSION EN MECANICA CLASICA 441

notese que para definir b como funcion de θ asignamos unicamente el valor b = R para θ = 0. Tenemos entoncesque

db

dθ= −1

2R sin

2

)(18.8)

puesto que θ esta entre cero y π, la derivada (18.8) es negativa como se anticipo. Sustituyendo (18.7) y (18.8) enla Ec. (18.4) nos queda

D (θ) =R cos θ2sin θ

∣∣∣∣−1

2R sin

2

)∣∣∣∣ =R2 cos θ2 sin

(θ2

)

2 sin θ=R2 sin θ

2

2 sin θ

D (θ) =R2

4

en este caso la seccion eficaz diferencial es independiente de θ. La seccion eficaz total estara dada por

σ =

ΩD (Ω) dΩ =

R2

4

ΩdΩ = πR2 (18.9)

habıamos dicho que en terminos muy generales, σ corresponde al area total del haz incidente que es dispersadapor el blanco. Efectivamente, en este caso σ es el area transversal del blanco y solo proyectiles que incidan dentrode este area golpearan el blanco y se dispersaran, los que vengan fuera de este area (b > R) no se dispersan en loabsoluto.

El lector puede verificar que si consideramos el tamano del proyectil, definiendo R1 y R2 como los radios delblanco y el proyectil respectivamente, la seccion eficaz diferencial toma la forma

D (θ) =(R1 +R2)

2

4; σ = π (R1 +R2)

2

donde vemos que la expresion para D (θ) es simetrica con respecto a los radios del proyectil y el blanco (ver porejemplo la Ref. [6], Sec. 9.9).

18.3.2. Dispersion de Rutherford

Si un proyectil muy liviano de carga q1 y energıa cinetica E, se dispersa por un blanco fijo muy pesado decarga q2, podemos utilizar la ley de Coulomb como ley de interaccion4. El parametro de impacto en terminos delangulo de dispersion y de la energıa E esta dado por

b =q1q28πǫ0E

cotθ

2(18.10)

y la seccion eficaz diferencial viene dada por

D (θ) =

[q1q2

16πǫ0E sin2(θ2

)]2

(18.11)

al integrar sobre el angulo solido, puede verse que la seccion eficaz total es infinita. Esto se debe a que la interaccioncoulombiana es de alcance infinito, de modo que para un haz de cualquier area transversal todas sus partıculasson dispersadas.

El calculo de las ecuaciones (18.10, 18.11) es extenso y el lector lo puede consultar en cualquier texto demecanica clasica (ver por ejemplo la Ref. [6], Sec. 9.10).

4Esta es la situacion por ejemplo, cuando los proyectiles son electrones y los blancos son nucleos.

Page 442: Mecanica Cuantica: Notas de Clase

442 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

18.4. Teorıa cuantica de la dispersion

En escala atomica, nuclear o subnuclear, los efectos cuanticos son considerables y de hecho resulta inapropiadoutilizar la teorıa clasica. En los modelos clasicos las partıculas poseen posicion y momento bien definidos, confi-gurando trayectorias bien definidas. En el escenario cuantico, las partıculas y sus trayectorias son reemplazadaspor funciones de onda que se propagan (usualmente en forma de paquetes de onda) y que ademas obedecen a unprincipio de incertidumbre que prohibe localizar el paquete y definir su momento simultaneamente, con precisionindefinida. Notese que a pesar de que ya no tenemos trayectorias asociadas a las partıculas, sı tenemos direccionesde propagacion de las ondas asociadas, lo cual nos permite definir aun un angulo de dispersion θ, de maneracoherente. Un aspecto sobresaliente que surge de la cuantizacion, es la posibilidad de que las ondas asociadas a laspartıculas incidentes interfieran con las ondas asociadas a las partıculas salientes. Tal fenomeno de interferenciapuede generar diferencias significativas con respecto a las predicciones clasicas.

Asumiremos el escenario mas simple de dispersion elastica de partıculas incidentes que rotulamos con (1)debidas a la interaccion con partıculas blanco que denotamos por (2). Supondremos ademas que el blanco esmucho mas masivo que los proyectiles de modo que no recula. Es decir que asumiremos blanco fijo a lo largo detodo el proceso. Tambien haremos las siguientes aproximaciones adicionales.

1. Supondremos que las partıculas (1) y (2) no poseen espın. Esto simplificara considerablemente el problema.Sin embargo, en un escenario cuantico realista el espın juega un papel muy importante en la dispersion.

2. Asumiremos que el blanco es lo suficientemente delgado para que no ocurra dispersion multiple. Es decirprocesos en los que una partıcula incidente se dispersa varias veces antes de abandonar la region de colision.Por ejemplo, en el experimento de Rutherford (estrictamente, de Geiger y Marsden 1909), la lamina de oroposeıa un espesor de unos 10−4cm. El numero promedio de atomos atravesados por la partıcula α, estaaproximadamente dado por el espesor de la lamina dividido por el diametro de un atomo (∼ 10−8cm). Esdecir que el proyectil atraviesa unos 104 atomos de oro, de modo que es de esperarse que existan dispersionesmultiples. Estas dispersiones multiples requieren un tratamiento estadıstico que no estudiaremos aquı.

3. Ignoraremos la posibilidad de coherencia entre las ondas dispersadas por las diferentes partıculas que cons-tituyen el blanco. Esta aproximacion se justifica si el ancho del paquete asociado a las partıculas (1) espequeno comparado con la distancia promedio entre las partıculas (2). De modo que solo tendremos encuenta procesos de dispersion de una partıcula (1) del haz por una partıcula (2) del blanco. Cuando estascoherencias son despreciadas, el flujo de partıculas detectadas es la suma de los flujos dispersados por cadauna de las N partıculas del blanco. Es decir N veces el flujo dispersado por cualquiera de las partıculas delblanco. Notese que la posicion del proyectil dentro del blanco no es relevante siempre y cuando las dimensio-nes del blanco y de la region de colision sean mucho menores que la distancia entre el blanco y el detector.Esta condicion asintotica de hecho es fundamental en los experimentos de dispersion. Esta aproximacionexcluye por ejemplo el scattering coherente de electrones en un cristal (que forma los patrones de difraccionde Bragg)5.

4. Supondremos que la interaccion entre proyectiles (1) y blancos (2) se describe mediante un potencialV (r) ≡ V (r1 − r2) que depende solo de la posicion relativa r entre las partıculas proyectil y blanco. Noconsideraremos la interaccion entre proyectiles o entre blancos. Como se vio en las secciones 12.1, 12.2, enel sistema de referencia centro de masa, este problema se reduce al estudio de la dispersion de una partıculasometida a un potencial V (r) de masa

µ =m1m2

(m1 +m2)

si asumimos que el blanco no recula, podemos asumir que el sistema de referencia del laboratorio y el delcentro de masa son aproximadamente iguales.

5En la difraccion de Bragg, las dimensiones tıpicas de la onda (longitud de onda), son comparables a la distancia promedio entrelos blancos (distancias interatomicas en el cristal), de lo cual surge el fenomeno de la difraccion.

Page 443: Mecanica Cuantica: Notas de Clase

18.5. ESTADOS ESTACIONARIOS DE DISPERSION 443

18.5. Estados estacionarios de dispersion

Asumiremos que se conoce la estructura del paquete de onda incidente, esto es para r → ∞ y t → −∞,ya que estas son las condiciones iniciales en las que se prepara el experimento. La interaccion de los proyectilescon el blanco se modelara por medio de un potencial central V (r), y colocamos por conveniencia el origen enel centro dispersor. La idea es describir el scattering calculando la evolucion temporal del paquete de onda delproyectil. Puesto que todo paquete de onda se puede escribir como una superposicion de estados estacionarios, ladeterminacion de dichos estados sera un buen punto de partida. Comenzaremos por tanto, estudiando la ecuacionde valores propios del Hamiltoniano asociado al proyectil

H = H0 + V (r) =P2

2µ+ V (r)

estrictamente, basaremos nuestros razonamientos en el comportamiento de las soluciones estacionarias en lugar delos paquetes de ondas. Esta forma de razonamiento fue la que se utilizo en las secciones 3.4-3.8, para potenciales“rectangulares” en una dimension, y consistio en considerar el flujo estacionario de probabilidad asociado al estadoestacionario, para estudiar las corrientes de probabilidad que genera. Aunque este tratamiento no es riguroso,es posible probar que se obtienen los mismo resultados que en el caso mas realista en el cual se estudia elcomportamiento del paquete de onda completo6.

Puesto que el potencial V (r) no depende explıcitamente del tiempo, existe un conjunto de soluciones ψ (r, t)de la ecuacion de Schrodinger, que admite separacion de variables [ver seccion 3.2, Ecs. (3.15, 3.16) Pag. 159], enla forma

ψ (r, t) = η (r) e−iEt/~ (18.12)

donde η (r) es la solucion de la ecuacion de valores propios

[− ~

2µ∇2 + V (r)

]η (r) = Eη (r) (18.13)

ademas los estados estacionarios (18.12) describen un autoestado de energıa E. Asumiremos que el potencialdecrece mas rapido que 1/r. Por tanto, la interaccion tipo Coulomb debe tratarse por aparte. Puesto que la colisiones elastica y los estados que consideraremos son de energıa bien definida, tenemos que la energıa se conserva y esigual a la energıa de la partıcula incidente, la cual es puramente cinetica. En consecuencia, estaremos interesadossolo en las soluciones de energıa positiva de (18.13), asociadas a partıcula libre

E =~2k2

2µ(18.14)

redefiniendo el potencial en la forma

V (r) =~2

2µU (r) (18.15)

podemos reescribir la Ec. (18.13) en terminos del numero de onda k

[∇2 + k2 − U (r)

]η (r) = 0 (18.16)

Para un valor fijo de k (i.e. de la energıa), hay infinitas soluciones linealmente independientes para la Ec. (18.16), esdecir cada valor positivo de la energıa esta infinitamente degenerado7. Debemos entonces seleccionar las solucionesque satisfagan las condiciones fısicas del problema en cuestion. Este fue el procedimiento que se siguio en lassecciones 3.4-3.8. A manera de ejemplo, en la seccion 3.6 se supone que la onda reflejada solo surge en la interfase

6Una demostracion de este hecho para el scattering de una partıcula en un potencial unidimensional particular, se puede encontraren el complemento JI del Volumen 1 de la Ref. [4].

7Adicionalmente, puesto que el problema es no acotado, el espectro es a priori contınuo.

Page 444: Mecanica Cuantica: Notas de Clase

444 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

entre las dos regiones y por tanto, la solucion estacionaria en la region II consta solo de una onda transmitida,esto nos lleva a su vez a la condicion descrita por la Ec. (3.63), Pag. 171. En el presente contexto la determinacionde las soluciones fısicas sera mas compleja debido a que es un problema tridimensional y ademas el potenciales en principio arbitrario. A pesar de que usaremos soluciones estacionarias, utilizaremos algunas condicionesasociadas a las propiedades de los paquetes de onda. Los estados estacionarios que surjan cuando se imponganestas condiciones en las soluciones de la Ec. (18.16) se denominaran estados estacionarios de dispersion, y sufuncion de onda espacial se denotara por ηk (r).

Para valores negativos grandes de t, el paquete de onda esta en sus condiciones iniciales. Lo usual es prepararel proyectil en un estado bien definido de momento, es decir una onda plana. Por tanto, en t → −∞, el estadoestacionario η (r) que buscamos debe contener una onda incidente con momento bien definido que se propaga endireccion Z, i.e. eikz. Cuando el paquete se aproxima a la region de dispersion, se deforma de una manera engeneral compleja y que depende de la forma especıfica del potencial. Sin embargo, para t → ∞, el paquete se haalejado bastante de la region de dispersion y por tanto su perfil se simplifica de nuevo. El paquete saliente debeposeer una onda eikz que continua propagandose en la direccion positiva de Z (como si no existiera potencial), y unpaquete dispersado por el potencial. Por tanto, el paquete de onda completo (al menos en las regiones asintoticas)que representa a la solucion estacionaria de dispersion para una energıa dada E = ~2k2/2µ, sera la superposicionde una onda plana y una onda dispersada

lımr→∞

ηk (r) → η(k)inc (r) + η(k)sc (r) = Ceikz + η(k)sc (r) (18.17)

donde η(k)inc (r), η

(k)sc (r) representan la onda incidente y dispersada respectivamente. Puesto que esta solucion es

valida solo en las regiones asintoticas en donde el proyectil es libre, entonces η(k)sc (r) es solucion de la ecuacion

(18.13)8 pero con V (r) = 0. Realizaremos un ansatz de separacion de variables similar al de las Ecs. (12.33, 12.36),Pag. 351

η(k)sc (r) = fk (θ, ϕ)Rk (r) ≡ fk (θ, ϕ)uk (r)

r(18.18)

la Ec. (18.13) en coordenadas esfericas esta dada por la Ec. (12.31) Pag. 350[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]η (r, θ, ϕ) = E η (r, θ, ϕ) (18.19)

insertando el ansatz (18.18) en (18.19), se obtiene[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]fk (θ, ϕ)Rk (r) = E fk (θ, ϕ)Rk (r)

fk (θ, ϕ)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rk (r) +Rk (r)

L2fk (θ, ϕ)

2µr2= E fk (θ, ϕ)Rk (r)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rk (r) +

Rk (r)

2µr2L2fk (θ, ϕ)

fk (θ, ϕ)= E Rk (r) (18.20)

y teniendo en cuenta que L2 es un operador diferencial que solo involucra a los angulos, podemos definir unafuncion angular

Hk (θ, ϕ) ≡L2fk (θ, ϕ)

fk (θ, ϕ)(18.21)

con lo cual la Ec. (18.20) queda[− ~2

2µr

∂2

∂r2r + V (r) +

Hk (θ, ϕ)

2µr2

]Rk (r) = E Rk (r)

8Naturalmente, la solucion completa de la ecuacion (18.13) con V (r) = 0, debe ser (18.17). Pero dado que Ceikz ya es solucion ypuesto que esta ecuacion es lineal, se deduce que cada sumando en (18.17) es solucion de la Ec. (18.13) con V (r) = 0.

Page 445: Mecanica Cuantica: Notas de Clase

18.5. ESTADOS ESTACIONARIOS DE DISPERSION 445

haciendo V (r) = 0 (ya que estamos buscando la solucion en la region asintotica), y escribiendo Rk (r) = uk (r) /r,con un procedimiento similar al usado para llegar de la Ec. (12.35) a la Ec. (12.37) obtenemos9

− ~2

d2

dr2+Hk (θ, ϕ)

2µr2

uk (r) = Ek uk (r) (18.22)

ahora, puesto que las soluciones que buscamos son para r → ∞, despreciaremos el termino proporcional a 1/r2,de modo que buscaremos la solucion de la ecuacion

− ~2

d2uk (r)

dr2= Ek uk (r) (18.23)

La solucion de la Ec. (18.23) tiene la forma

uk (r) = Aeikr +Be−ikr ; k ≡√

2µE

~2(18.24)

de la Ec. (18.14) vemos que esta k corresponde efectivamente al numero de onda asociado a partıcula libre. Teniendoen cuenta que la solucion completa debe tener el termino temporal e−iEt/~, dicha solucion es una superposicion

de los dos terminos ei(±kr−Et~). Ahora bien, el estado asintotico saliente debe mantener fase constante, por tanto

el termino ±kr−Et/~ debe permanecer acotado para r → +∞ y t→ +∞ (es claro que cuando el tiempo crece ladistancia r al origen tambien crece), pero esto solo es posible eligiendo el termino con signo positivo (el terminocon signo negativo claramente tiende a −∞ cuando el tiempo crece). En consecuencia, solo la parte con eikr

corresponde a la onda dispersada. Las condiciones fısicas nos llevan entonces a

uk (r) = Aeikr ; k ≡√

2µE

~2(18.25)

sustituyendo (18.25) en (18.18) y esta a su vez en (18.17) tenemos que

lımr→∞

ηk (r) → η(k)inc (r) + η(k)sc (r) = Ceikz + fk (θ, ϕ)

eikr

r(18.26)

donde el factor A de la Ec. (18.25) se absorbio en la funcion angular fk (θ, ϕ). Notese que a pesar de la simetrıaesferica del potencial puede aparecer una dependencia angular en la funcion de onda estacionaria de dispersion,debido a que la direccion del haz rompe la simetrıa esferica del potencial, reduciendola a una simetrıa cilındrica.No obstante, de la simetrıa cilındrica remanente se espera que la dependencia angular sea solo en θ, pero no en elangulo azimutal ϕ. Si adicionalmente el potencial no es central, tambien se rompe la simetrıa cilındrica y esperamosque haya dependencia con el angulo azimutal ϕ. De hecho la funcion fk (θ, ϕ) conocida como la amplitud dedispersion es la unica en la Ec. (18.26) que depende de la forma especıfica del potencial. La Fig. 18.4 muestralas ondas planas incidentes, ası como las ondas esfericas salientes o dispersadas.

18.5.1. Condiciones fısicas sobre el paquete de ondas

A pesar de que utilizaremos estados estacionarios, es necesario verificar que la solucion real (paquete de ondas)satisface ciertas condiciones fısicas que analizaremos en forma semi-cuantitativa. Consideremos el paquete real

9El procedimiento es similar al que nos llevo a la Ec. (12.37) Pag. 352, con V (r) = 0. Sin embargo, si se compara la ecuacion(18.22) con la Ec. (12.37), vemos que en (18.22) no desaparece la dependencia angular en contraste con (12.37). Esto se debe a que enla separacion de variables (18.18), las fk (θ, ϕ) no son funciones propias del operador momento angular, como sı ocurre en la separacionde variables de las Ecs. (12.33, 12.36). De hecho para llegar a las ecuaciones (12.33, 12.36) se exigio que las funciones en cuestion fueranfunciones propias simultaneas de H , L2 y L3.

Page 446: Mecanica Cuantica: Notas de Clase

446 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

Figura 18.4: Dispersion elastica de ondas planas incidentes por un potencial central. La figura ilustra las ondasplanas incidentes y las ondas esfericas dispersadas o salientes.

ψ (r, t) escrito en terminos de las soluciones estacionarias fısicas ψk (r, t) (autoestados del Hamiltoniano total H)10

lımr→∞

ψ (r, t) →∫ ∞

0dk g (k) ψk (r, t) =

∫ ∞

0dk g (k) ηk (r) e

−iEkt/~ (18.27)

lımr→∞

ψ (r, t) →∫ ∞

0dk g (k) eikz e−iEkt/~ +

∫ ∞

0dk g (k) fk (θ, ϕ)

eikr

re−iEkt/~ ; Ek =

~2k2

2µ(18.28)

para que estas sean soluciones validas en ambos regımenes asintoticos (t→ ∞ y t→ −∞) es necesario probar quela onda dispersada tiende a cero para valores grandes de −t, ya que en el regimen incidente la onda todavıa no se hadispersado con el potencial11. Tomaremos como hipotesis que la funcion g (k) es real, con un pico muy pronunciadoalrededor de k = k0 y simetrica alrededor de este punto. Es decir que la mayor parte de la contribucion esta en unaregion muy cercana a k = k0. La posicion del maximo de cada paquete se puede calcular utilizando la condicionde fase estacionaria discutida en las secciones 2.11.2, 2.1312. Para el paquete de ondas planas la condicion de faseestacionaria nos dice que el maximo del paquete esta ubicado en

zM (t) = vGt ; vG =~k0µ

(18.29)

10Notese que en este caso, hemos escrito el paquete en terminos de autoestados de H en lugar de ondas planas. Con respecto a talesestados, incluso la onda plana pura incidente es “policromatica”.

11Aquı hemos despreciado una posible dispersion en la orientacion del vector de onda k. Es decir, hemos supuesto que la ondaincidente va en direccion uz perfectamente definida, y toda la dispersion se la endilgamos al modulo de k, o equivalentemente a laenergıa incidente.

12Ver en particular las discusiones alrededor de las Ecs. (2.64, 2.83) Pags. 140, 149 respectivamente.

Page 447: Mecanica Cuantica: Notas de Clase

18.5. ESTADOS ESTACIONARIOS DE DISPERSION 447

en tanto que para el paquete de ondas dispersadas, dicho maximo en la direccion (θ, ϕ) se ubica a una distanciadel origen dada por

rM (θ, ϕ, t) = − dαk (θ, ϕ)

dk

∣∣∣∣k=k0

+ vGt ; fk (θ, ϕ) = |fk (θ, ϕ)| eiαk(θ,ϕ) (18.30)

es importante tener presente que las Ecs. (18.29, 18.30) solo son validas para valores grandes de |t|. De la Ec.(18.30) se observa que para valores grandes de −t, necesariamente estamos muy lejos de la condicion de maximopara r, ya que tal ecuacion muestra que para lograr una interferencia constructiva que nos conduzca a un maximodel paquete de ondas dispersadas en t → −∞, requerirıamos valores negativos de r los cuales estan fuera deldominio de la coordenada r. Por tanto, el paquete de onda (18.28) es tal que para t → −∞ solo contribuyen lasondas planas incidentes, y de acuerdo con la Ec. (18.29), el maximo del paquete esta ubicado en zM → −∞ comodebe ser. En cambio, para valores grandes positivos de t podemos encontrar maximos tanto en el paquete de ondasplanas como en el paquete de ondas dispersadas (naturalmente, ambos maximos no necesariamente coinciden enel tiempo, y por tanto el maximo de la suma podrıa estar a su vez en otro tiempo), mostrando que en el regimenasintotico saliente ambas ondas son relevantes como esperabamos.

Asumiendo que g (k) es aproximadamente gaussiano, podemos suponer (aproximadamente) paquetes de mınimaincertidumbre. Por tanto, la extension espacial ∆z del paquete de ondas (18.27) esta relacionada con la dispersiondel momento p = ~k en la forma

∆z ∆p ≃ ~ ⇒ ∆z ≃ 1

∆k

hemos hecho la hipotesis de que g (k) es una distribucion muy “aguda” i.e. ∆k muy pequeno. De hecho asumiremosque ∆k es lo suficientemente pequeno13 para que ∆z sea mucho mayor que las dimensiones lineales de la region dedispersion14. Bajo estas condiciones, el paquete de onda que se mueve a una velocidad vG hacia el origen, cruzarala region de dispersion en un tiempo

∆T ≃ ∆z

vG≃ 1

vG∆k(18.31)

es razonable tomar este como un “tiempo caracterıstico de dispersion”15. Si definimos t = 0 cuando el paquetede ondas cruza el origen, podemos decir que existe onda dispersada para t & −∆T/2 que es cuando el extremofrontal del paquete incidente ha llegado a la region de influencia del potencial. Para t = 0, la parte mas distanteal origen del paquete dispersado esta a una distancia del orden de ∆z/2.

Cualitativamente, este problema se asemeja al siguiente: supongamos un potencial de la forma V (r) f (t), enel cual f (t) se incrementa lentamente desde 0 hasta 1 en el intervalo [−∆T/2, 0], y el potencial es cero parat < −∆T/2. Supongamos que la partıcula esta descrita por una onda plana en todo el espacio. La onda plana seempieza a modificar para t & ∆T/2, y se puede demostrar que la dispersion en t = 0 se asemeja a la de nuestroproblema.

En nuestro problema tenemos dispersion por un potencial constante en el tiempo y la amplitud del paquete seincrementa gradualmente entre −∆T/2 y cero. En el problema analogo, la onda plana es de amplitud constantey lo que se aumenta gradualmente en el intervalo [−∆T/2, 0] es el modulo del potencial.

Esta analogıa es particularmente interesante cuando examinamos el lımite con ∆k → 0, de manera que g (k) →δ (k − k0). En este lımite, la descripcion de nuestro problema por estados estacionarios se vuelve exacta. Por otrolado, la Ec. (18.31) nos dice que en este lımite ∆T → ∞, y el comportamiento analogo del potencial dependientedel tiempo correspondera a que el “encendido” del potencial sea infinitamente lento i.e. “adiabatico”. Por esta

13Puesto que las condiciones iniciales experimentales suelen ser preparar casi un autoestado de momento, esta suposicion es muyrazonable si los coeficientes g (k) no cambian mucho en el tiempo.

14Esto no necesariamente entra en contradiccion con nuestra suposicion de que el ancho del paquete incidente es pequeno comparadocon la separacion promedio entre las partıculas del blanco (ver Pag. 442). Es plausible que la distancia promedio d entre partıculasdel blanco sea mucho mayor que la mayor longitud L asociada a la region de dispersion. El ancho ∆z del paquete debe ser tal queL << ∆z << d, para que nuestros argumentos sean validos.

15Esto nos permite definir tiempo grandes y pequenos, el comportamiento asintotico se da entonces para |t| >> ∆T .

Page 448: Mecanica Cuantica: Notas de Clase

448 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

razon, podemos decir que la descripcion de la dispersion por medio de estados estacionarios es muy semejante ala que se obtiene imponiendo un potencial que se modula adiabaticamente sobre una onda plana libre.

18.6. Calculo de la seccion eficaz usando corrientes de probabilidad

Ya hemos dicho que la dispersion del paquete de ondas la simularemos como una dispersion de estados esta-cionarios. Para calcular la seccion eficaz, debemos suplantar las trayectorias clasicas que describen las propiedadesde propagacion de las partıculas, por alguna propiedad de propagacion asociada a la ecuacion de Schrodinger.Clasicamente, la intensidad era el numero de partıculas por unidad de area por unidad de tiempo que cruza unarea perpendicular a la direccion de propagacion, y se le puede asignar la direccion de propagacion de las partıcu-las incidentes. El analogo cuantico, es la densidad de corriente de probabilidad que va en la direccion incidente ydescribe la propagacion de la distribucion de probabilidad. No obstante, debe tenerse en cuenta que los detectoresno registran probabilidades sino partıculas, por lo cual debemos enlazar la densidad de corriente de probabilidadcon una densidad de corriente (flujo) asociada a las partıculas.

En virtud de lo anterior, consideraremos que los estados estacionarios describen un flujo de probabilidadestacionario, con lo cual calculamos la seccion eficaz para las corrientes incidente y dispersada. Este metodo esanalogo al que utilizamos en los problemas unidimensionales con potenciales rectangulares, en los cuales calculamoslas corrientes incidentes, reflejadas y transmitidas para obtener los coeficientes de reflexion y transmision. Ya hemosobtenido la expresion para la densidad de corriente de probabilidad asociada a estados estacionarios Ec. (3.33),Pag. 164

J (r) =1

µRe

[η∗ (r)

~

i∇η (r)

](18.32)

para la onda incidente tenemos que η(k)inc (r) = Ceikz con lo cual la densidad de corriente de probabilidad incidente

Jinc vendra dada por

Jinc (r) =|C|2µRe

[e−ikz

~

i∇eikz

]=

|C|2µRe

[e−ikz

~

iuz∂eikz

∂z

]=

|C|2µ

uzRe[e−ikz~keikz

]

Jinc (r) = |C|2 ~kµuz (18.33)

puesto que |C|2 es la densidad de probabilidad de la onda incidente y p = ~k, esta corriente tiene la forma ρv, en

la direccion uz de propagacion. Para la onda dispersada tenemos η(k)sc (r) = fk (θ, ϕ) e

ikr/r, de modo que debemosexpresar el gradiente en (18.32) en coordenadas esfericas

Jsc =1

µRe

f∗k (θ, ϕ)

e−ikr

r

~

i∇[fk (θ, ϕ)

eikr

r

]

Jsc =1

µrRe

f∗k (θ, ϕ) e

−ikr ~i∇[fk (θ, ϕ)

eikr

r

](18.34)

calcularemos cada componente de la densidad de corriente dispersada (18.34) por aparte

(Jsc)r =1

µrRe

f∗k (θ, ϕ) e

−ikr ~ifk (θ, ϕ)

∂r

[eikr

r

]=

1

µrRe

|fk (θ, ϕ)|2 e−ikr

~

i

[−e

ikr

r2+ik eikr

r

]

=1

µr2Re

|fk (θ, ϕ)|2 ~

[− 1

ir+ k

]=

1

µr2Re

i~ |fk (θ, ϕ)|2

r+ |fk (θ, ϕ)|2 ~k

(Jsc)r =~k

µ

1

r2|fk (θ, ϕ)|2 (18.35)

Page 449: Mecanica Cuantica: Notas de Clase

18.6. CALCULO DE LA SECCION EFICAZ USANDO CORRIENTES DE PROBABILIDAD 449

(Jsc)θ =1

µrRe

f∗k (θ, ϕ) e

−ikr ~i

1

r

∂θ

[fk (θ, ϕ)

eikr

r

]=

1

µrRe

f∗k (θ, ϕ) e

−ikr ~i

eikr

r2∂fk (θ, ϕ)

∂θ

(Jsc)θ =~

µ

1

r3Re

1

if∗k (θ, ϕ)

∂fk (θ, ϕ)

∂θ

(18.36)

(Jsc)ϕ =1

µrRe

f∗k (θ, ϕ) e

−ikr ~i

1

r sin θ

∂ϕ

[fk (θ, ϕ)

eikr

r

]=

1

µrRe

f∗k (θ, ϕ)

~

i

1

r2 sin θ

∂fk (θ, ϕ)

∂ϕ

(Jsc)ϕ =~

µ

1

r3 sin θRe

1

if∗k (θ, ϕ)

∂fk (θ, ϕ)

∂ϕ

(18.37)

A partir de las Ecs. (18.35, 18.36, 18.37), la densidad de corriente dispersada queda

Jsc = (Jsc)r ur + (Jsc)θ uθ + (Jsc)ϕ uϕ ; (Jsc)r =~k

µ

1

r2|fk (θ, ϕ)|2 (18.38)

(Jsc)θ =~

µ

1

r3Re

1

if∗k (θ, ϕ)

∂fk (θ, ϕ)

∂θ

; (Jsc)ϕ =

~

µ

1

r3 sin θRe

1

if∗k (θ, ϕ)

∂fk (θ, ϕ)

∂ϕ

(18.39)

para valores muy grandes de r las componentes angulares son mucho menores que la radial ya que las primeras vancomo r−3 y la radial como r−2. Por tanto en el regimen asintotico saliente, la corriente dispersada es practicamenteradial

lımr→∞t→∞

Jsc ≃~k

µ

1

r2|fk (θ, ϕ)|2 ur (18.40)

Ahora bien, el haz incidente consta de partıculas independientes ya que hemos despreciado la interaccion entreproyectiles. Puesto que asumimos que todos los proyectiles se preparan en el mismo estado inicial, enviar si-multaneamente un gran numero de estos proyectiles es equivalente a repetir el mismo experimento con una solapartıcula un gran numero de veces bajo las mismas condiciones iniciales. Si el estado estacionario en el que sepreparan las partıculas es ηk (r), el flujo de partıculas incidente ‖Finc‖ (numero de partıculas del haz incidente quecruzan una superficie unidad perpendicular a uz por unidad de tiempo) debe ser proporcional al flujo de probabi-lidad incidente ‖Jinc‖ (probabilidad por unidad de area por unidad de tiempo que se propaga en la direccion uz).Por supuesto ambos vectores son paralelos (en la direccion de propagacion uz de las partıculas y la probabilidad).Usando la Ec. (18.33) tenemos

‖Finc‖ = K ‖Jinc‖ = K |C|2 ~kµ

⇒ Finc = K |C|2 ~kµuz (18.41)

ahora bien, si tenemos un detector ubicado a una distancia r del origen, un parche de superficie dS del detectornormal a la direccion ur, subtiende un angulo solido dΩ dado por

dΩ =dS

r2

por otro lado, el numero de partıculas dn que golpeara la superficie dS del detector por unidad de tiempo, es igualal flujo de partıculas que atravieza dicha superficie

dn = Fsc · dS = K Jsc · dS

donde hemos usado el hecho de que la constante de proporcionalidad entre flujo de probabilidad y flujo de partıculases universal e independiente del valor de tales flujos. Si suponemos que el detector tiene superficie esferica concentro en el origen entonces

dS = dS ur = r2dΩ ur (18.42)

Page 450: Mecanica Cuantica: Notas de Clase

450 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

y por tanto

dn = K (Jsc)r dS = K

(~k

µ

1

r2|fk (θ, ϕ)|2

)r2dΩ = K

~k

µ|fk (θ, ϕ)|2 dΩ (18.43)

donde hemos usado (18.38, 18.42). Vale decir que incluso si el parche no es un sector esferico, para valoressuficientemente grandes de r podemos usar la aproximacion (18.40) y dn serıa independiente de r. Esta condicionde hecho se debe cumplir en los experimentos. Insertando las Ecs. (18.41, 18.43) en la definicion de la seccioneficaz diferencial Ec. (18.2) resulta

dn = ‖Finc‖ D (Ω) dΩ ⇒ K~k

µ|fk (θ, ϕ)|2 dΩ = K |C|2 ~k

µD (Ω) dΩ

de lo cual resulta

D (Ω) =

∣∣∣∣1

Cfk (θ, ϕ)

∣∣∣∣2

(18.44)

de modo que la seccion eficaz diferencial es esencialmente el cuadrado del modulo de la amplitud de dispersion.Notese que hemos omitido la contribucion a la corriente asociada al estado estacionario ηk (r) que proviene

de la interferencia entre la onda plana y la onda dispersada. De hecho la expresion correcta para la densidad decorriente (18.32) involucra al termino estacionario completo y debe escribirse en la forma

J (r) =1

µRe

[η∗ (r)

~

i∇η (r)

]=

1

µRe

[η∗inc (r) + η∗sc (r)]

~

i∇ [ηinc (r) + ηsc (r)]

(18.45)

de modo que en los calculos hemos omitido los terminos de interferencia de la forma

J (r) =1

µRe

[η∗inc (r)

~

i∇ηsc (r) + η∗sc (r)

~

i∇ηinc (r)

]

sin embargo, veremos que esta interferencia solo contribuye en la direccion frontal de dispersion (θ = 0). LaFig. 18.5 muestra la colision en terminos de paquetes de onda. En esta figura se observa que en la practica, elpaquete incidente tiene un ancho lateral finito. Inicialmente, el paquete se mueve hacia la region de dispersion (Fig.18.5.a), despues de la colision tenemos dos paquetes: el paquete de ondas planas que resulta de la propagacionde la onda incidente como si no hubiese potencial dispersor, y el dispersado que se propaga desde el origen entodas direcciones. En consecuencia, la onda transmitida se forma con la interferencia entre el paquete plano y eldispersado. Sin embargo como ya se discutio, el detector se coloca fuera de la seccion transversal del haz incidentede modo que no es golpeado por partıculas transmitidas, por tanto el detector solo observa el paquete de ondadispersado, por lo cual no se requiere considerar los terminos de interferencia entre la onda plana y la dispersada.La Fig. 18.5b. nos muestra que en la direccion frontal debe tenerse en cuenta tal interferencia, ya que en este casoambos paquetes ocupan la misma region del espacio, y la onda transmitida es el resultado de esta interferencia.Adicionalmente, la amplitud de la onda transmitida debe ser menor que la de la onda incidente por conservacionde la probabilidad total (que se manifiesta en conservacion del numero de partıculas). Esto se puede ver teniendoen cuenta que las partıculas dispersadas abandonan el haz y por tanto el haz transmitido debe atenuarse conrespecto al incidente. Tambien puede verse como que el flujo de probabilidad incidente se debe repartir en unflujo transmitido y otro dispersado, de modo que el flujo transmitido debe ser menor al incidente. Debe existirentonces una interferencia destructiva entre los paquetes plano y dispersado frontalmente, para dar cuenta de laconservacion de la probabilidad i.e. del numero total de partıculas.

18.7. Ecuacion integral de dispersion

18.7.1. Ecuacion integral y funcion de Green

La ecuacion (18.16) de valores propios de H(∇2 + k2

)η (r) = U (r) η (r) (18.46)

Page 451: Mecanica Cuantica: Notas de Clase

18.7. ECUACION INTEGRAL DE DISPERSION 451

Figura 18.5: (a) El frente de onda plano incidente se acerca a la region de dispersion. Se observa que el ancholateral del paquete es en la practica finito. (b) La onda transmitida se forma con la interferencia entre la ondaplana que no se dispersa y la onda dispersada en la direccion frontal. Se observa que tıpicamente el detector secoloca fuera de la region de la onda transmitida, en una region en la cual solo contribuye la onda dispersada.

se puede resolver alternativamente utilizando la funcion de Green G (r) asociada a dicha ecuacion

(∇2 + k2

)G (r) = δ (r) (18.47)

en terminos eurısticos la funcion de Green asociada al operador ∇2+k2, puede verse como una especie de “inverso”de dicho operador, puesto que la funcion delta de Dirac actua como una identidad en el contınuo. Sea η0 (r) unasolucion de la ecuacion homogenea asociada a (18.46)

(∇2 + k2

)η0 (r) = 0 (18.48)

Es posible demostrar que si una funcion η (r) satisface la identidad

η (r) = η0 (r) +

∫d3r′ G

(r− r′

)U(r′)η(r′)

(18.49)

entonces esta funcion es solucion de la Ec. (18.46). Recıprocamente, puede demostrarse que toda solucion de laEc. (18.46) debe satisfacer (18.49).

Para ver que la funcion definida en (18.49) es solucion de la Ec. (18.46) aplicaremos el operador ∇2 + k2 aambos lados de (18.49) asumiendo que dicho operador puede entrar en la integral. Debe tenerse en cuenta que ∇2

es una derivada con respecto a r pero no con respecto a r′

(∇2 + k2

)η (r) =

(∇2 + k2

)η0 (r) +

∫d3r′

(∇2 + k2

) [G(r− r′

)U(r′)η(r′)]

=

∫d3r′ U

(r′)η(r′) (

∇2 + k2)G(r− r′

)=

∫d3r′ U

(r′)η(r′)δ(r− r′

)

(∇2 + k2

)η (r) = U (r) η (r)

donde hemos usado (18.47, 18.48). No probaremos rigurosamente que toda solucion de (18.46) es de la forma(18.49). Sin embargo, vale la pena observar que la solucion (18.49) consiste en la suma de la solucion de la

Page 452: Mecanica Cuantica: Notas de Clase

452 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

ecuacion homogenea asociada (18.48), mas una solucion particular de la ecuacion inhomogenea (18.46), comocorresponde en la teorıa de ecuaciones diferenciales. Por tanto la ecuacion diferencial (18.46) es equivalente a laecuacion integral (18.49).

Por supuesto, ni la solucion de η0 (r) de la ecuacion homogenea, ni la funcion de Green son unicas, ya que nohemos fijado condiciones de frontera. En realidad, no determinaremos nuestra solucion por condiciones de fronterasino por condiciones asintoticas. De hecho, la ventaja del uso de la formulacion integral consiste en la facilidadde escoger valores adecuados de η0 (r) y de G (r) para que la solucion η (r) posea el comportamiento asintoticodeseado. Adicionalmente, la funcion de Green no depende de la parte inhomogenea de la Ec. (18.46) como se vede su definicion Ec. (18.47).

18.7.2. Determinacion de la funcion de Green

En lo que sigue utilizaremos la identidad

∇2

(1

|r− r′|

)= −4πδ

(r− r′

)(18.50)

y la forma del laplaciano en coordenadas esfericas para una funcion que solo depende de r

∇2f (r) =1

r2∂

∂r

r2∂f (r)

∂r

(18.51)

observese que la ecuacion de Green (18.47) nos dice que(∇2 + k2

)G (r) debe ser cero en toda region que no

incluya al origen. Por otro lado, el hecho de que f (θ, ϕ) eikr/r, se encontro como solucion de la Ec. (18.16) conU (r) = 0 16, nos muestra que

(∇2 + k2

) eikrr

= 0 ; para r 6= 0

y nos sugiere que dicha funcion puede ser la funcion de Green adecuada. Utilizando las identidades (18.50, 18.51),vemos que

∇2

[e±ikr

r

]=

1

r2∂

∂r

r2∂

∂r

[e±ikr

r

]=

1

r2∂

∂r

r2[e±ikr

∂r

(1

r

)+

1

r

∂re±ikr

]

=1

r2∂

∂r

r2e±ikr

∂r

(1

r

)+ r

∂re±ikr

=

1

r2

∂r

[e±ikrr2

∂r

(1

r

)]± ∂

∂r

(ikre±ikr

)

=1

r2

e±ikr

∂r

[r2∂

∂r

(1

r

)]+ r2

[∂

∂r

(1

r

)]∂

∂r

[e±ikr

]±[ike±ikr ± (ik)2 re±ikr

]

= e±ikr1

r2∂

∂r

[r2∂

∂r

(1

r

)]+

[∂

∂r

(1

r

)] [±ike±ikr

]± e±ikr

r2[ik ∓ k2r

]

aplicando (18.51) a la funcion 1/r, y usando nuevamente (18.50), se tiene

∇2

[e±ikr

r

]= e±ikr∇2

(1

r

)+

[− 1

r2

] [±ike±ikr

]± ike±ikr

r2− k2e±ikr

r

∇2

[e±ikr

r

]= −4πe±ikrδ (r)− k2

e±ikr

r

teniendo en cuenta que δ (r) = 0 para r 6= 0 y que e±ikr = 1 en r = 0, se deduce que

e±ikrδ (r) = δ (r) (18.52)

16Ver comentarios arriba de la Ec. (18.18).

Page 453: Mecanica Cuantica: Notas de Clase

18.7. ECUACION INTEGRAL DE DISPERSION 453

Por tanto17

∇2

[e±ikr

r

]= −4πδ (r)− k2

e±ikr

r

[∇2 + k2

] e±ikrr

= −4πδ (r) (18.53)

Las Ecs. (18.47, 18.53) nos sugieren dos funciones de Green dadas por

(∇2 + k2

)G± (r) = δ (r) ; G± (r) ≡ − 1

e±ikr

r(18.54)

Por razones que veremos mas adelante, G+ y G− se denominan funcion de Green saliente y funcion deGreen entrante respectivamente.

18.7.3. Solucion de la ecuacion integral

El comportamiento asintotico que buscamos Ec. (18.26), nos sugiere usar la onda plana Ceikz como la solucionη0 (r) de la ecuacion homogenea18 , y la funcion de Green saliente G+ (r) en la Ec. (18.54) como la funcion deGreen para nuestra ecuacion integral. Con estas asignaciones la ecuacion integral (18.49) queda en la forma

ηk (r) = Ceikz +

∫d3r′ G+

(r− r′

)U(r′)ηk(r′)= Ceikz − 1

∫d3r′

eik|r−r′|

|r− r′| U(r′)ηk(r′)

(18.55)

veremos que esta solucion nos reproduce el comportamiento asintotico esperado Ec. (18.26).

Por construccion esta ya es una solucion de la ecuacion diferencial (18.46). Probaremos ahora que cumple conel comportamiento asintotico requerido Ecs. (18.26). Para verlo definamos un punto M de posicion r en la regionasintotica, de modo que su distancia al origen O, es mucho mayor que todas las dimensiones lineales de la regionde dispersion (ver Fig. 18.6). Sea P un punto de posicion r′ dentro de la region de dispersion. Si definimos a Lcomo el orden de magnitud de la longitud lineal maxima de la region de dispersion, tendremos que se cumplen lasrelaciones

r ≫ L, r′ . L, r ≫ r′

si α es el angulo entre MO y MP , es claro que α ≪ 1. Si MQ define la proyeccion de MP sobre MO, tenemosque

|MQ| = |MP | cosα ≃ |MP | =∣∣r− r′

∣∣

ahora bien si δ es el angulo entre OP y OQ (i.e. entre r y r′), tenemos por otro lado

|MQ| = |MO| − |QO| = r −∣∣r′∣∣ cos δ = r − ur · r′

combinando estas dos expresiones resulta

∣∣r− r′∣∣ ≃ r − ur · r′ ; r ≫ r′

17Estrictamente, por el caracter de distribucion de la delta de Dirac tenemos que

lımε→0+

∫ ε

−εe±ikrδ (r) f (r) dr = lım

ε→0+

∫ ε

−εδ (r) f (r) dr

de lo cual se deduce (18.52).18Se puede verificar que esta onda plana es solucion de la Ec. homogenea (18.48). De hecho, la onda plana es una solucion de partıcula

libre, i.e. con U (r) = 0.

Page 454: Mecanica Cuantica: Notas de Clase

454 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

Figura 18.6: M define un punto en la region asintotica, en tanto que P define un punto dentro de la region de dis-persion. Con respecto al origen O, la posicion de los puntos M y P se define por los vectores r y r′respectivamente.

por tanto para un punto de posicion r en la region asintotica y un punto r′ dentro de la region de dispersion, sepuede hacer la siguiente aproximacion para la funcion de Green saliente:

G+

(r− r′

)= − 1

eik|r−r′|

|r− r′| ∼r→∞

− 1

eik[r−ur·r′]

|r − ur · r′|= − 1

eikr

r∣∣1− r′

r cos δ∣∣e

−ik(ur ·r′)

G+

(r− r′

)= − 1

eik|r−r′|

|r− r′| ∼r→∞

− 1

eikr

re−ik(ur ·r

′) (18.56)

insertando la aproximacion (18.56) en la solucion integral (18.55) resulta

ηk (r) ∼r→∞

Ceikz − 1

eikr

r

∫d3r′ e−ik(ur ·r

′)U(r′)ηk(r′)

(18.57)

notese que la integral solo es funcion de r a traves del vector unitario ur. Precisamente el caracter unitario de urme dice que este vector solo depende de la orientacion de r i.e. ur = ur (θ, ϕ). Es claro entonces que la integralsolo depende de θ y ϕ por tanto podemos escribir la Ec. (18.57) en la forma

ηk (r) ∼r→∞

Ceikz +eikr

rfk (θ, ϕ) ; fk (θ, ϕ) ≡ − 1

∫d3r′ e−ik(ur·r

′)U(r′)ηk(r′)

(18.58)

Page 455: Mecanica Cuantica: Notas de Clase

18.8. APROXIMACION DE BORN 455

que claramente cumple las condiciones asintoticas (18.26).

18.8. Aproximacion de Born

La aproximacion de Born es una estrategia para encontrar una solucion aproximada a la ecuacion integralde dispersion. Definimos al vector de onda incidente ki como un vector en la direccion del haz incidente demodulo k tal que la energıa de una partıcula incidente es E = ~2k2/2m

ki ≡ kuz ⇒ eikz = eiki·r (18.59)

puesto que la colision es elastica, el vector de onda dispersado ks posee el mismo modulo, pero su direccionur esta caracterizada por los angulos θ, ϕ, siendo θ el angulo de dispersion y ϕ el angulo azimuthal

ks = kur ; ur≡ ur (θ, ϕ) (18.60)

finalmente, se puede definir el vector de onda de dispersion o vector de onda transferido en la direccion(θ, ϕ) como el vector diferencia entre los anteriores

K = ks − ki (18.61)

a partir de la Ec. (18.59), podemos escribir la ecuacion integral de dispersion (18.55) en la forma

ηk (r) = Ceiki·r +∫d3r1 G+ (r− r1)U (r1) ηk (r1) (18.62)

la idea es resolver la ecuacion por iteracion. Para ello hacemos el cambio de variables r → r1, r1 → r2 en la Ec.(18.62) para escribir

ηk (r1) = Ceiki·r1 +∫d3r2 G+ (r1 − r2)U (r2) ηk (r2) (18.63)

Al reemplazar (18.63) en (18.62) resulta

ηk (r) = Ceiki·r +∫d3r1 G+ (r− r1)U (r1)

[Ceiki·r1 +

∫d3r2 G+ (r1 − r2)U (r2) ηk (r2)

]

ηk (r) = Ceiki·r + C

∫d3r1 G+ (r− r1)U (r1) e

iki·r1

+

∫d3r1

∫d3r2 G+ (r− r1)U (r1)G+ (r1 − r2)U (r2) ηk (r2) (18.64)

notese que los dos primeros terminos a la derecha de (18.64) son conocidos, y solo el tercero contiene a la cantidaddesconocida ηk (r2). Por supuesto, la iteracion puede continuar hasta el orden deseado. Usando el cambio devariables r1 → r2, r2 → r3 en la Ec. (18.63) y reemplazando en (18.64) obtenemos

ηk (r) = Ceiki·r + C

∫d3r1 G+ (r− r1)U (r1) e

iki·r1 +

+

∫d3r1

∫d3r2 G+ (r− r1)U (r1)G+ (r1 − r2)U (r2)

[Ceiki·r2 +

∫d3r3 G+ (r2 − r3)U (r3) ηk (r3)

]

ηk (r) = Ceiki·r +C

∫d3r1 G+ (r− r1)U (r1) e

iki·r1 +

+C

∫d3r1

∫d3r2 G+ (r− r1)U (r1)G+ (r1 − r2)U (r2) e

iki·r2

+

∫d3r1

∫d3r2

∫d3r3 G+ (r− r1)U (r1)G+ (r1 − r2)U (r2)G+ (r2 − r3)U (r3) ηk (r3) (18.65)

Page 456: Mecanica Cuantica: Notas de Clase

456 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

en esta expresion los tres primeros terminos de la derecha son conocidos y el termino desconocido ηk (r3) soloaparece en el cuarto termino de la derecha. Estas iteraciones constituyen la expansion de Born del estadoestacionario de dispersion. Comparando las Ecs. (18.62, 18.64, 18.65), vemos que el termino que posee la cantidaddesconocida ηk, es proporcional a una potencia de U (r) mas alta en cada iteracion19. Si el potencial es debil, cadapotencia mas alta sera menor que la anterior, de modo que para un numero suficientemente grande de iteraciones,podemos despreciar el ultimo termino que contiene la cantidad desconocida, y calcular ηk (r) en terminos decantidades conocidas.

Ahora bien, si sustituımos la expansion de ηk (r) (hasta cierto orden de iteracion), en la expresion (18.58)para fk (θ, ϕ), obtendremos la expansion de Born de la amplitud de dispersion. En particular, si reemplazamos laiteracion a orden cero Ec. (18.62) al lado derecho de (18.58) tenemos que

fk (θ, ϕ) ≡ − 1

∫d3r1 e

−ik(ur ·r1)U (r1)

[Ceiki·r1 +

∫d3r2 G+ (r1 − r2)U (r2) ηk (r2)

]

si queremos calcular solo a primer orden en U (r), esta expresion queda

f(B)k (θ, ϕ) = − C

∫d3r1 e

−ik(ur·r1)U (r1) eiki·r1 (18.66)

que equivale a reemplazar ηk (r′) por Ceiki·r

′al lado derecho de (18.58). Usando las definiciones (18.60, 18.61) de

numero de onda dispersado y transferido tenemos que

f(B)k (θ, ϕ) = − C

∫d3r1 e

−iks·r1U (r1) eiki·r1 = − C

∫d3r1 e

−i(ks−ki)·r1U (r1)

f(B)k (θ, ϕ) = − C

∫d3r1 e

−iK·r1U (r1) (18.67)

Esta es la aproximacion de Born para fk (θ, ϕ). De las Ecs. (18.44, 18.67) podemos escribir la seccion eficazdiferencial en dicha aproximacion

D(B)k (Ω) =

∣∣∣∣1

Cfk (θ, ϕ)

∣∣∣∣2

=

∣∣∣∣1

∫d3r1 e

−iK·r1U (r1)

∣∣∣∣2

=

∣∣∣∣1

~2

∫d3r1 e

−iK·r1 ~2

2µU (r1)

∣∣∣∣2

D(B)k (Ω) =

µ2

4π2~4

∣∣∣∣∫d3r1 e

−iK·r1V (r1)

∣∣∣∣2

; K ≡ ks − ki (18.68)

donde hemos usado la Ec. (18.15), para escribir D (Ω) en terminos del potencial V (r). Vemos que en aproximacionde Born, la seccion eficaz diferencial es directamente proporcional a la norma al cuadrado de la transformada deFourier del potencial. Las Ecs. (18.59, 18.60, 18.61) muestran que el vector de onda transferido K es funcion delmodulo k de los vectores ki y ks, ası como de la direccion (θ, ϕ) de ks. Por tanto, para un valor fijo de k (y por

tanto, de la energıa) D(B)k (Ω) varıa con la orientacion Ω ≡ (θ, ϕ). Similarmente, para una orientacion fija (θ, ϕ), la

seccion eficaz diferencial cambia con k y por tanto con la energıa. En consecuencia, la Ec. (18.68) nos dice que en

la aproximacion de Born, el estudio de la dependencia de D(B)k (Ω) con la orientacion y con la energıa, nos puede

dar informacion sobre el potencial V (r).A la formula (18.64), podemos darle una interpretacion fısica que nos brinda una vez mas una fuerte analogıa

entre la mecanica cuantica y la optica ondulatoria. Vamos a considerar a la region de influencia del potencialcomo un medio dispersivo cuya densidad es proporcional a U (r). La funcion de Green G+ (r− r1) dada por laEc. (18.54), representa la amplitud en el punto r de la onda radiada desde el punto fuente en la posicion r1.

De esta forma, los dos primeros terminos a la derecha de (18.64) describen la onda total en el punto r queresulta de superponer la onda incidente eiki·r con una infinidad de ondas provenientes de fuentes secundarias

19Si definimos las Ecs. (18.62, 18.64) como las iteraciones de orden cero y uno respectivamente, entonces el termino desconocido enla n−esima iteracion contiene U (r) a la potencia n+ 1.

Page 457: Mecanica Cuantica: Notas de Clase

18.8. APROXIMACION DE BORN 457

inducidas en el medio dispersivo por la onda incidente. Esto se ve del hecho de que hay una integral sobre r1, demodo que contribuyen las ondas secundarias que provienen de cada punto en la region de dispersion. Sin embargo,en esta integral cada onda secundaria tiene un peso diferente, de hecho la amplitud de la onda secundaria generadaen cada punto r1 es proporcional a la onda incidente en ese punto eiki·r1 y la densidad del material dispersor U (r1)en dicho punto. Esta interpretacion esta ilustrada en la Fig. 18.7a y nos evoca el principio de Huygens.

Figura 18.7: Interpretacion Fısica de la Ec. (18.64). (a) Los dos primeros terminos a la derecha en (18.64)corresponden a la onda incidente llegando directamente al punto r, mas la contribucion de las ondas dispersadasdesde algun punto r1 interior a la region de dispersion. En el segundo termino de la Ec. (18.64) se integra sobrer1 de modo que se toman todas las fuentes secundarias en la region de dispersion. (b) Representacion esquematicadel tercer termino en la Ec. (18.64) y que es de segundo orden en U (r) en la expansion de Born. En tal terminose consideran ondas que se dispersan dos veces en la region de dispersion. Se integra sobre r1 y r2 es decir sobretodas las fuentes secundarias posibles que contribuyen a la doble dispersion.

Adicionalmente, hay un tercer termino en (18.64). Puesto que el medio de dispersion se extiende sobre ciertaregion, en la superposicion de la ondas sobre el punto r pueden contribuir ondas secundarias que han sido dis-persadas dos veces por el potencial: la onda incidente es dispersada en el punto r2 y luego en el punto r1 (ambosdentro de la region de dispersion) para finalmente llegar a r, como se ilustra en la Fig. 18.7b. Cada fuente r1 y r2contribuye con su peso proporcional a eiki·r y U (r) evaluados en cada punto. Si realizamos mas iteraciones, losterminos sucesivos de la expansion de Born implicaran mas dispersiones dentro de la region del potencial. Si ladensidad del medio dispersivo es baja [U (r) pequeno] entonces podemos despreciar la contribucion de las ondassecundarias, o considerarlas solo en sus primeros ordenes.

Es importante no confundir esta interpretacion de los terminos de alto orden en la expansion de Born, con losprocesos de dispersion multiple que ocurren cuando el blanco es grueso. En nuestro contexto estamos considerandoprocesos de dispersion de una partıcula del haz con una sola partıcula del blanco. La dispersion multiple implicainteracciones sucesivas de la misma partıcula incidente con varias (diferentes) partıculas del blanco.

18.8.1. Rango de validez de la aproximacion de Born

Un estimativo aproximado del rango de validez de la aproximacion de Born (18.67) se puede obtener teniendoen cuenta que en (18.67) hemos reemplazado el estado asintotico completo ηk (r) por solo la parte incidente

η(k)inc (r) = Ceiki·r [ver comentario despues de la ecuacion (18.66)]. Por tanto, requerimos que se cumpla la condicion

∣∣∣∣∣η(k)sc (r)

η(k)inc (r)

∣∣∣∣∣≪ 1

Page 458: Mecanica Cuantica: Notas de Clase

458 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

dentro de la region de dispersion, ya que la integral sobre r1 en (18.67) solo es significativa dentro de dicha region.Por definicion, la region de dispersion esta alrededor de r = 0. Esta condicion sera entonces aproximadamenteequivalente a ∣∣∣∣∣

η(k)sc (0)

η(k)inc (0)

∣∣∣∣∣≪ 1 (18.69)

si asumimos que el potencial es central, en el regimen de altas energıas (k → ∞), la Ec. (18.69) nos lleva a lacondicion

V0E

≪ 1 (18.70)

es decir que la energıa del haz incidente debe ser mucho mayor a la magnitud del potencial. Ası mismo, para bajasenergıas (k → 0), la Ec. (18.69) conduce a

µV0L2

~2≪ 1 (18.71)

donde L es el rango o alcance del potencial. Sin embargo, en la practica la condicion (18.71) es mucho masrestrictiva que (18.70), razon por la cual la aproximacion de Born se utiliza principalmente en el regimen de altasenergıas. Para detalles sobre este analisis el lector puede consultar la Ref. [8], seccion 13.2

18.8.2. Aproximacion de Born para el potencial de Yukawa

En 1935, Hideki Yukawa propuso un modelo para la interaccion entre los constituyentes del nucleo atomico onucleones. Segun este modelo, la interaccion entre nucleones se da a traves de un cuanto (que hace el rol del fotonen la interaccion electromagnetica), que se denomina el pion o meson π (descubierto en 1947 por C. Powell y suscolaboradores). Sin embargo, a diferencia de la interaccion electromagnetica, esta interaccion es de corto alcancey la partıcula intermediaria tiene masa en reposo no nula. No entraremos en detalles sobre la construccion delmodelo de Yukawa, el lector interesado puede consultar la bibliografıa asociada (por ejemplo las Refs. [1, 10]). Demomento solo mencionaremos que las consideraciones fenomenologicas hechas por Yukawa, lo llevaron a modelarla interaccion entre nucleones con un potencial de la forma

V (r) = V0e−αr

r; U (r) =

~2V0e−αr

r(18.72)

donde V0 y α son constantes reales. El potencial puede ser atractivo o repulsivo de acuerdo con el signo de V0.La intensidad del potencial esta determinada por |V0| y el alcance esta regulado por la constante positiva α. Paradefinir un alcance caracterıstico (y por tanto un orden de magnitud para las dimensiones lineales de la region dedispersion), es usual tomar un r0 definido por

r0 =1

α(18.73)

puede verse que el potencial ha decrecido sustancialmente y se hace practicamente cero para r & 2r0. El alcancede las fuerzas que el potencial de Yukawa describe esta en el orden de los fermis (1fm = 10−15m). Observeseque para α = 0 se reproduce el potencial de Coulomb, que en este contexto se denomina el potencial de Yukawade rango infinito. La presencia de α > 0, hace que el potencial de Yukawa decrezca mucho mas rapido que el deCoulomb.

Calculo de la amplitud de dispersion y la seccion eficaz con el potencial de Yukawa

Asumiremos que la intensidad |V0| caracterıstica del potencial es suficientemente pequena para utilizar laaproximacion de Born. Sustituyendo (18.72) en (18.67), obtenemos la amplitud de dispersion para el potencial deYukawa en aproximacion de Born.

f(B)k (θ, ϕ) = − C

∫d3r1 e

−iK·r1U (r1) = −µCV02π~2

∫d3r1 e

−iK·r1 e−αr1

r1(18.74)

Page 459: Mecanica Cuantica: Notas de Clase

18.8. APROXIMACION DE BORN 459

donde K es el numero de onda transferido en la direccion (θ, ϕ). La expresion (18.74) es basicamente la transfor-mada de Fourier del potencial de Yukawa. Como este potencial solo depende de |r| = r, podemos aplicar la Ec.(1.196), Pag. 103. Para ello escribimos la Ec. (18.74) con P = ~K

f(B)k (θ, ϕ) = −µCV0

2π~2

∫d3r e−i

P~·r e

−αr

r= −µCV0

(2π

~

)1/2[(

1

2π~

)3/2 ∫d3r e−i

P~·r e

−αr

r

]

= −µCV0(2π

~

)1/2 [ 1√2π~

2

P

∫ ∞

0r dr

e−αr

rsin

(Pr

~

)]

= −µCV0[1

~

2

P

∫ ∞

0r dr

e−αr

rsinKr

]

f(B)k (θ, ϕ) = −2µCV0

~2K

∫ ∞

0dr e−αr sinKr =

2µCV0~2K

[e−rα

K2 + α2(K cosKr + α sinKr)

]∞

0

f(B)k (θ, ϕ) =

2µCV0~2K

[− e−rα

K2 + α2(K cosKr + α sinKr)

]

r=0

= −2µCV0~2K

[K

K2 + α2

]

obteniendose finalmente

f(B)k (θ, ϕ) = − 2µCV0

~2 (K2 + α2)(18.75)

ahora bien teniendo en cuenta que K+ki = ks, y que ‖ki‖ = ‖ks‖ = k, los vectores K,ki,ks forman un trianguloisosceles, donde el angulo de dispersion θ, es el angulo entre los dos lados iguales. La Fig 18.8 nos muestra que

Figura 18.8: Los vectores K, ki y ks forman un triangulo isosceles en donde el angulo de dispersion θ, es el anguloentre los dos lados de igual longitud. Esta figura ilustra la validez geometrica de (18.76).

sinθ

2=K/2

k⇒ K = 2k sin

θ

2(18.76)

por tanto, podemos escribir f(B)k (θ, ϕ) de la Ec. (18.75) en terminos de k y θ que son los parametros que se miden

en un experimento.

f(B)k (θ) = − 2µCV0

~2(α2 + 4k2 sin2 θ2

)

y la seccion eficaz diferencial Ec. (18.44), Pag. 450, en aproximacion de Born queda

D(B) (θ) =4µ2V 2

0

~4[α2 + 4k2 sin2 θ2

]2 (18.77)

Page 460: Mecanica Cuantica: Notas de Clase

460 CAPITULO 18. TEORIA CUANTICA DE LA DISPERSION

esta seccion eficaz tiene simetrıa azimutal como se previo para potenciales esfericamente simetricos. Ahora bien,para una energıa dada (valor fijo de k), la seccion eficaz depende de θ. En particular la seccion eficaz frontal(θ = 0) es mayor que la seccion eficaz de retroceso (θ = π). Por otro lado, para un valor fijo de θ, la seccion eficazes una funcion decreciente de la energıa. Finalmente, puede verse que D (θ) no es sensible al signo de V0 i.e. no essensible al caracter repulsivo o atractivo de la interaccion, al menos en la aproximacion de Born.

Podemos calcular la seccion eficaz total

σ(B) =

ΩD(B) (θ) dΩ =

∫ 2π

0dϕ

∫ π

0dθ sin θ D(B) (θ) = 2π

4µ2V 20

~4

∫ π

0

sin θ dθ[α2 + 4k2 sin2 θ2

]2

σ(B) =8πµ2V 2

0

~4

∫ π

0

sin θ dθ

α4[1 + 4k2

α2 sin2 θ2

]2 =8πµ2V 2

0

~42

α2 (α2 + 4k2)

σ(B) =16πµ2V 2

0

~4α2 (α2 + 4k2)(18.78)

vemos que en este caso la seccion eficaz total no diverge (en contraste con el caso de la interaccion coulombiana),debido a que este potencial decae mucho mas rapido que el coulombiano. En virtud de la convergencia de la seccioneficaz total, se suele decir que este potencial es de alcance finito, si bien estrictamente hablando no es exactamentecero para ningun valor de r.

Lımite de Coulomb, o de rango infinito

Hemos visto que con α = 0, el potencial tipo Yukawa se convierte en un potencial tipo Coulomb. Para obtenerel potencial tipo Coulomb entre dos partıculas de cargas Z1q y Z2q (siendo q la carga del electron), debemos hacerlas asignaciones

α = 0 ; V0 = Z1Z2e2 ; e2 =

q2

4πǫ0

con lo cual la Ec. (18.77) se convierte en

D(B)C (θ) =

4µ2

~4Z21Z

22e

4

16k4 sin4 θ2=

Z21Z

22e

4

16 sin4 θ2

(2µ

~2k2

)2

=Z21Z

22e

4

16 sin4 θ2

(p2

)−2

D(B)C (θ) =

Z21Z

22e

4

16E2 sin4 θ2(18.79)

la expresion (18.79) coincide con la formula de Rutherford Ec. (18.11) Pag. 441, que nos da la seccion eficazasociada al potencial de Coulomb. Este es un resultado un tanto sorprendente ya que por un lado, la formulacionaquı presentada solo vale para potenciales que decrecen mas rapido que r−1, de modo que la interaccion deCoulomb queda excluıda de la formulacion, y por otro lado el resultado para la interaccion de Yukawa esta en uncontexto aproximado (aproximacion de Born).

La seccion eficaz total diverge cuando α = 0, como ocurre con el caso clasico, tambien debido al alcance infinitode la interaccion. Sin embargo, en la realidad nunca se observa el potencial de Coulomb puro, ya que el potencialcreado por una carga esta siempre modificado por la presencia de otras cargas alrededor, que usualmente sonde carga opuesta de modo que generan un apantallamiento. En consecuencia, aun para una interaccion de tipoelectrico esperamos que para el potencial resultante (potencial efectivo), el apantallamiento decaiga mas rapidoque 1/r y/o presente una carga efectiva menor que la del blanco.

Page 461: Mecanica Cuantica: Notas de Clase

Capıtulo 19

Teorıa cuantica de la dispersion II:Descomposicion en ondas parciales para ladispersion por un potencial central

Hemos visto que la aproximacion de Born funciona primordialmente a altas energıas (ver seccion 18.8.1). Laexpansion por ondas parciales es un acercamiento alternativo que funciona mejor a bajas energıas, por lo cual encierto modo es complementario a la aproximacion de Born.

En la seccion 12.5 vimos que en el caso de un potencial central, el momento angular orbital es constante demovimiento ya que conmuta con el Hamiltoniano y no depende explıcitamente del tiempo. Esto indica que existenautoestados comunes para los observables H, L2 y L3. Fısicamente, indica que existen estados estacionarios (deenergıa bien definida) en los cuales el momento angular tambien esta bien definido. Las funciones de onda asociadasa los estados estacionarios de momento angular bien definido, se denominan ondas parciales y las denotaremospor ϕk,l,m (r). Recordando que los resultados de la seccion 12.5 solo dependıan del caracter central del potencial,vemos que la dependencia angular de las ondas parciales estara dada siempre por los armonicos esfericos Ylm (θ, ϕ),y el potencial V (r) solo modifica la componente radial de tales estados.

Es de esperarse que para valores grandes de r, el comportamiento de las ondas parciales sea similar al delos autoestados comunes a H0, L

2 y L3, siendo H0 el hamiltoniano de partıcula libre. Comenzaremos entonces

estudiando las ondas parciales asociadas a partıcula libre ϕ(0)k,l,m (r), que denominaremos ondas libres esfericas.

Su dependencia angular continua siendo descrita por los armonicos esfericos ya que el potencial no afecta ladependencia angular. En cuanto a su dependencia radial, veremos que para valores grandes de r las ondas esfericasestaran constituıdas por la superposicion de una onda entrante e−ikr/r y una onda saliente eikr/r con una diferenciade fase bien definida entre ambas.

Por otro lado, las ondas parciales ϕk,l,m (r) asociadas al potencial V (r), tambien seran la superposicion de unaonda entrante y una saliente, pero la diferencia de fase entre estas dos ondas es diferente de la que se obtiene paralas ondas esfericas libres. El potencial V (r) introduce un corrimiento de fase adicional δl. Veremos ademas que

este corrimiento extra δl es la unica diferencia entre los estados asintoticos obtenidos con ϕk,l,m (r) y con ϕ(0)k,l,m (r).

Ahora bien, con el fin de calcular la seccion eficaz expresaremos los estados estacionarios de dispersion ηk (r),como una combinacion lineal de ondas parciales con la misma energıa pero diferentes momentos angulares. Veremospor argumentos fısicos y con un calculo explıcito que tales coeficientes coinciden con los de la expansion de laonda plana eikz en terminos de ondas esfericas libres. El uso de ondas parciales permitira escribir la amplitud dedispersion y la seccion eficaz en terminos de los corrimientos de fase δl. Veremos que el metodo es particularmenteutil cuando el rango del potencial no es mucho mayor a la longitud de onda de la partıcula en movimiento, ya queen estos casos la seccion eficaz dependera de unos pocos corrimientos de fase δl.

461

Page 462: Mecanica Cuantica: Notas de Clase

462 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

19.1. Estados estacionarios de partıcula libre

En mecanica clasica, las partıculas libres se propagan en lınea recta con velocidad constante. Su energıa,momento lineal y momento angular estan bien definidos y son constantes de movimiento.

En mecanica cuantica los operadoresP y L ≡ R×P, no conmutan y por tanto no pueden estar simultaneamentebien definidos. El Hamiltoniano de partıcula libre esta dado por

H0 ≡P2

sin embargo, H0 no constituye un C.S.C.O. en el espacio Er, sus valores estan infinitamente degenerados1. Porotra parte, para el caso de partıcula libre, los observables

H0, P1, P2, P3 (19.1)

forman un C.S.C.O. y los estados estacionarios comunes a estos observables poseen momento bien definido. Porotro lado, si aplicamos los resultados de la seccion 12.5 para potencial cero, deducimos que para una partıculalibre los observables

H0, L2, L3 (19.2)

tambien forman un C.S.C.O. En este caso los estados estacionarios poseeran momento angular bien definido.Vale decir que momento angular bien definido significa que los valores de L2 y de una de las componentes de L(usualmente L3) estaran bien definidos. Recordemos que las componentes del momento angular son incompatibles(ver Ec. 10.5, Pag. 309) y por tanto no pueden estar simultaneamente bien definidas.

Es claro sin embargo que los estados estacionarios definidos por los C.S.C.O de las Ecs. (19.1) y (19.2) serandiferentes puesto que los observables P y L son incompatibles2. Vamos a estudiar estas bases y la manera de pasarde la una a la otra.

19.2. Estados estacionarios de partıcula libre con momento bien definido:Ondas planas

Ya hemos visto que los observables P1, P2, P3 forman un C.S.C.O. en el espacio orbital de estados. Sus estadospropios comunes |p〉 forman una hiperbase del espacio orbital

P |p〉 = p |p〉

y puesto que H0 conmuta con estos observables, se puede agregar al C.S.C.O. y los estados |p〉 tambien sonautoestados de H0

H0 |p〉 =P2

2µ|p〉 = p2

2µ|p〉 (19.3)

el espectro de H0 es entonces contınuo e incluye todos los valores no-negativos de energıa. Cada autovalor esinfinitamente degenerado, puesto que a un valor dado de energıa le corresponden infinitos kets |p〉 linealmenteindependientes. Esto puede verse teniendo en cuenta que un valor dado de energıa E solo impone la ligadura2µE = p21 + p22 + p23 lo cual deja aun un numero infinito contınuo de grados de libertad, i.e. todos los puntos deuna superficie esferica de radio

√2µE. Por tanto un valor dado de la energıa nos deja con el conjunto de todos los

kets |p〉 cuyo modulo es|p| =

√2µE

1En este capıtulo, cuando hablemos de un C.S.C.O. sera con respecto al espacio orbital Er, puesto que no hemos incluıdo al espınen la formulacion.

2Desde el punto de vista experimental, es importante saber como se preparo el sistema (cuales son las condiciones iniciales).Cuanticamente, podemos preparar un estado de partıcula libre con momento lineal bien definido, o con momento angular bien definido,pero no ambos al tiempo.

Page 463: Mecanica Cuantica: Notas de Clase

19.3. ESTADOS ESTACIONARIOS DE PARTICULA LIBRE CONMOMENTOANGULAR BIEN DEFINIDO: ONDAS

las funciones de onda asociadas a estos estados |p〉 son las ondas planas (ver Ec. 1.182, Pag. 97)

〈r|p〉 =(

1

2π~

)3/2

eip·r/~

tambien podemos caracterizar estos estados estacionarios a traves del vector de onda k

k =p

~; |k〉 = ~3/2 |p〉

estos estados poseen el mismo contenido fısico que los estados |p〉, ya que para partıcula libre un vector de ondabien definido es equivalente a un momento bien definido

H0 |k〉 =~2k2

2µ|k〉 ; P |k〉 = ~k |k〉

los estados |k〉 son ortonormales y completos en el sentido extendido

〈k|k′〉 = δ(k− k′) ;

∫d3k |k〉 〈k| = I

19.3. Estados estacionarios de partıcula libre con momento angular bien

definido: Ondas esfericas libres.

En la seccion 12.5, ya caracterizamos los estados estacionarios comunes a H, L2 y L3 para un potencial centralV (r). Podemos entonces retomar los resultados de dicha seccion para V (r) = 0 i.e. para H = H0. Por tanto, losestados propios comunes a H0, L

2 y L3 (ondas esfericas libres) tienen la forma de la Ec. (12.33), Pag. 351

ϕ(0)k,l,m (r) = R

(0)k,l (r)Ylm (θ, ϕ) (19.4)

donde la funcion radial es una solucion de la Ec. (12.35), Pag. 351 con V (r) = 0

[− ~2

1

r

d2

dr2r +

l (l + 1) ~2

2µr2

]R

(0)k,l (r) = Ek,lR

(0)k,l (r) (19.5)

siendo Ek,l el valor propio de H0 asociado a ϕ(0)k,l,m (r). Si hacemos un cambio de variable similar a la Ec. (12.36),

Pag. 351

R(0)k,l (r) =

1

ru(0)k,l (r) (19.6)

la funcion u(0)k,l (r) esta dada por la Ec. (12.37) Pag. 352 con V (r) = 0

[d2

dr2− l (l + 1)

r2+

2µEk,l~2

]u(0)k,l (r) = 0 (19.7)

y se debe cumplir la relacion asintotica en el origen dada por la Ec. (12.44), Pag. 353

u(0)k,l (0) = 0 (19.8)

La combinacion de las Ecs. (19.7, 19.8) nos permite encontrar el espectro de H0 que como veremos coincide conel que se obtiene con las ondas planas Ec. (19.3). Dado que el mınimo de nuestro potencial es cero (de hecho elpotencial es nulo), entonces no habra estados estacionarios de energıa negativa. Consideraremos entonces valoresno-negativos de Ek,l en la Ec. (19.7), e introducimos el parametro real k en la forma

k =1

~

√2µEk,l (19.9)

Page 464: Mecanica Cuantica: Notas de Clase

464 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

en la region asintotica con r muy grande, el termino centrıfugo l (l + 1) /r2 se puede despreciar en la Ec. (19.7)para obtener [

d2

dr2+ k2

]u(0)k,l (r) ≃

r→∞0 (19.10)

donde hemos tenido en cuenta la definicion (19.9). Ya examinamos la solucion general de esta ecuacion [Ver Ecs.(18.23, 18.24), Pag. 445] obteniendose

u(0)k,l (r) ≃

r→∞Aeikr +Be−ikr (19.11)

en la seccion 12.6 tambien se concluyo que la ecuacion (19.7) junto con la condicion asintotica en el origen (19.8)nos lleva a una unica solucion. Por tanto, las Ecs. (19.7, 19.8) nos llevaran a una unica solucion del tipo (19.11).

Vemos por otro lado, que la energıa no depende de l, y por tanto omitiremos este ındice en los valores de laenergıa. Ahora bien, las soluciones aceptables del tipo (19.11) incluyen todos los valores positivos de k y por tantode acuerdo con la Ec. (19.9), la energıa toma todos los valores no negativos.

Ek =~2k2

2µ; k ≥ 0

cada energıa dada es infinitamente degenerada. Para un valor fijo de k, existen soluciones fısicamente aceptables

u(0)k,l (r) de la ecuacion radial para todos los valores permitidos (enteros no-negativos) de l. Adicionalmente, la

solucion completa ϕk,l,m (r) en la Ec. (19.4) anade una degeneracion (2l + 1) veces mayor, para una funcion

radial u(0)k,l (r) dada. Al igual que en la seccion 12.6, vemos que en este caso los observables H0, L

2 y L3 forman unC.S.C.O. en Er, de modo que la especificacion de los ındices k, l,m nos da la informacion suficiente para determinarde manera unica el estado estacionario normalizado asociado (excepto por una fase irrelevante).

19.4. Caracterizacion de las ondas esfericas libres

En la presente seccion construiremos las funciones propias de H0, L2 y L3, definiendo unos generadores que

permiten encontrar dichas funciones con base en la funcion esferica libre mas simple ϕ(0)k,0,0 (r). Una vez determi-

nadas las ondas esfericas libres debidamente ortonormalizadas, se estudiara su comportamiento asintotico (parar → 0 y para r → ∞), su relacion con las ondas planas, y finalmente su interpretacion fısica.

19.4.1. Algebra de generadores de ondas esfericas

Con una estrategia similar a la utilizada para construir los operadores escalera de momento angular [ver seccion10.2, Ecs. (10.8), Pag. 310], construiremos una serie de operadores que permitiran generar las funciones propiascomunes de H0,L

2, L3, a partir de las autofunciones asociadas al autovalor con l = 0 de L2. Tendremos en cuentaque H0 conmuta con L y P

[H0,L] = 0 ; [H0,P] = 0 (19.12)

Comenzaremos definiendo el operadorP+ ≡ P1 + iP2 (19.13)

queremos encontrar las relaciones de conmutacion de este operador con los observables H0,L2, L3, cuyas funciones

propias comunes queremos encontrar. A partir de las relaciones canonicas de conmutacion entre observables deposicion y momento [Ecs. (1.193), Pag. 101] podemos obtener las relaciones de conmutacion entre Li y Pi

[Li, Pj ] = [εimnRmPn, Pj ] = εimn [RmPn, Pj ] = εimn (Rm [Pn, Pj ] + [Rm, Pj ]Pn)

= εimn [Rm, Pj ]Pn = i~δmjεimnPn

[Li, Pj ] = i~εijnPn (19.14)

Page 465: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 465

Con estas relaciones, se pueden obtener los conmutadores de L3 y L2 con P+

[Li, P+] = [Li, P1 + iP2] = [Li, P1] + i [Li, P2] = i~εi1nPn + i (i~εi2kPk)

[Li, P+] = ~ (iεi1nPn − εi2kPk)

para cada componente i = 1, 2, 3 se tiene

[L1, P+] = −~ε123P3 = −~P3 ; [L2, P+] = i~ε213P3 = −i~P3

[L3, P+] = ~ (iε312P2 − ε321P1) = ~ (iP2 + P1) = ~P+

⇒ [L1, P+] = −~P3 ; [L2, P+] = −i~P3 ; [L3, P+] = ~P+ (19.15)

tambien necesitaremos el conmutador de L+ con P3 para lo cual usamos las Ecs. (19.14)

[L+, P3] = [L1 + iL2, P3] = [L1, P3] + i [L2, P3] = i~ε132P2 + i (i~ε231P1)

= −i~P2 − ~P1 = −~ (iP2 + P1)

[L+, P3] = −~P+ (19.16)

finalmente calculamos el conmutador de L2 con P+

[L2, P+

]= [LiLi, P+] = Li [Li, P+] + [Li, P+]Li

= L1 [L1, P+] + L2 [L2, P+] + L3 [L3, P+] + [L1, P+]L1 + [L2, P+]L2 + [L3, P+]L3

= −~L1P3 − i~L2P3 + ~L3P+ − ~P3L1 − i~P3L2 + ~P+L3

= −~ (L1 + iL2)P3 + ~L3P+ − ~P3 (L1 + iL2) + ~P+L3

= −~L+P3 − ~P3L+ + ~L3P+ + ~P+L3

sumando y restando terminos adecuadamente y aplicando las Ecs. (19.15, 19.16), se obtiene

[L2, P+

]= −~L+P3 + (~P3L+ − ~P3L+)− ~P3L+ + ~L3P+ + (−~P+L3 + ~P+L3) + ~P+L3

= −~L+P3 + ~P3L+ − 2~P3L+ + ~L3P+ − ~P+L3 + 2~P+L3

= −~ [L+, P3]− 2~P3L+ + ~ [L3, P+] + 2~P+L3

= ~2P+ − 2~P3L+ + ~2P+ + 2~P+L3[L2, P+

]= 2~ (P+L3 − P3L+) + 2~2P+ (19.17)

Por comodidad, condensaremos las relaciones algebraicas anteriores

[H0,L] = [H0,P] = 0 ; [Li, Pj ] = i~εijnPn ; P+ ≡ P1 + iP2 (19.18)

[L1, P+] = −~P3 ; [L2, P+] = −i~P3 ; [L3, P+] = ~P+ ; [L+, P3] = −~P+ (19.19)[L2, P+

]= 2~ (P+L3 − P3L+) + 2~2P+ (19.20)

19.4.2. Relaciones de recurrencia para las ondas esfericas libres

Teniendo en cuenta que ϕ(0)k,l,m (r) tiene la estructura dada en las Ecs. (19.4, 19.6) y que los operadores momento

angular solo actuan sobre variables angulares, tenemos que

L+ϕ(0)k,l,m (r) = Rk,l (r) L+Ylm (θ, ϕ) = ~

√l (l + 1)−m (m+ 1)Rk,l (r)Yl,m+1 (θ, ϕ)

L+ϕ(0)k,l,m (r) = ~

√l (l + 1)−m (m+ 1)ϕ

(0)k,l,m+1 (r)

donde hemos usado la forma en que L+ actua sobre los autoestados de L2 y L3 Ec. (10.47), Pag. 321. Esta

ecuacion muestra que L+ϕ(0)k,l,m = 0 si m = l. Para m 6= l, tenemos que L+ϕ

(0)k,l,m (r) es tambien autoestado de H0

Page 466: Mecanica Cuantica: Notas de Clase

466 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

y L2 con el mismo valor de energıa Ek y de l (esto tambien se puede ver del hecho de que L+ conmuta con H0

y con L2 usando el teorema 1.66, Pag. 57). Ası mismo, L+ϕ(0)k,l,m (r) es autoestado de L3 con autovalor (m+ 1) ~.

Similarmente es facil ver la accion de L−, L3 y L2 sobre ϕ(0)k,l,m (r)

L3ϕ(0)k,l,m (r) = m~ϕ

(0)k,l,m (r) ; L2ϕ

(0)k,l,m (r) = l (l + 1) ~2ϕ

(0)k,l,m (r) (19.21)

L±ϕ(0)k,l,m (r) = ~

√l (l + 1)−m (m± 1)ϕ

(0)k,l,m±1 (r) (19.22)

Ahora aplicamos el operador P+ sobre ϕ(0)k,l,m (r). Teniendo en cuenta que P+ conmuta con H0, tenemos que

P+ϕ(0)k,l,m (r) es funcion propia de H0 con la misma energıa Ek. Con respecto al operador L3, el comportamiento

de este estado, se obtiene aplicando la Ec. (19.19)

[L3, P+]ϕ(0)k,l,m (r) = ~P+ϕ

(0)k,l,m (r) ⇒ L3P+ϕ

(0)k,l,m (r) = P+L3ϕ

(0)k,l,m (r) + ~P+ϕ

(0)k,l,m (r)

L3P+ϕ(0)k,l,m (r) = m~P+ϕ

(0)k,l,m (r) + ~P+ϕ

(0)k,l,m (r)

L3

[P+ϕ

(0)k,l,m (r)

]= (m+ 1) ~

[P+ϕ

(0)k,l,m (r)

]

de modo que P+ϕ(0)k,l,m (r) es autofuncion de L3 con valor propio (m+ 1) ~. El siguiente paso natural es caracterizar

al estado P+ϕ(0)k,l,m (r) con respecto a L2. La presencia del termino P3L+ en el conmutador de L2 con P+ Ec. (19.20),

nos dice que P+ϕ(0)k,l,m (r) no es en general funcion propia de L2. Sin embargo, debido a que L+ϕ

(0)k,l,l (r) = 0, el

termino P3L+ se anula cuando m = l

[L2, P+

]ϕ(0)k,l,l (r) = 2~ (P+L3 − P3L+)ϕ

(0)k,l,l (r) + 2~2P+ϕ

(0)k,l,l (r)

L2P+ϕ(0)k,l,l (r) = P+

[L2ϕ

(0)k,l,l (r)

]+ 2~P+

[L3ϕ

(0)k,l,l (r)

]− 2~P3

[L+ϕ

(0)k,l,l (r)

]+ 2~2P+ϕ

(0)k,l,l (r)

L2P+ϕ(0)k,l,l (r) = l (l + 1) ~2P+ϕ

(0)k,l,l (r) + 2l~2P+ϕ

(0)k,l,l (r) + 2~2P+ϕ

(0)k,l,l (r) = [l (l + 1) + 2l + 2] ~2P+ϕ

(0)k,l,l (r)

L2P+ϕ(0)k,l,l (r) = (l + 1) (l + 2) ~2P+ϕ

(0)k,l,l (r)

por tanto, P+ϕ(0)k,l,l (r) es funcion propia comun de H0, L3 y L2 con valores propios Ek, (l + 1) ~ y (l + 1) (l + 2) ~2

respectivamente. Puesto que estos tres observables forman un C.S.C.O. en el espacio orbital, existe una unicaautofuncion espacial normalizada (excepto por una fase) asociada a estos tres valores propios

P+ϕ(0)k,l,l (r) =Mk,lϕ

(0)k,l+1,l+1 (r) (19.23)

usaremos las relaciones de recurrencia (19.22, 19.23) para construir la baseϕ(0)k,l,m (r)

de ondas esfericas a partir

de las funciones ϕ(0)k,0,0 (r), ya que el operador P+ permite incrementar el numero cuantico l, en tanto que los

operadores L± permiten generar las funciones para todos los valores posibles de m con k y l fijos. Para ello

primero tenemos que encontrar las funciones ϕ(0)k,0,0 (r) .

Un comentario final, a priori podrıa pensarse que el operador P− ≡ P1− iP2, permite bajar el numero cuanticol hasta cero. Sin embargo, este no es el caso, puede mostrarse con un procedimiento similar al aquı mostrado quela accion de P− esta dada por

P−ϕ(0)k,l,−l (r) =M ′

klϕ(0)k,l+1,−(l+1) (r) (19.24)

19.4.3. Solucion de la ecuacion radial para l = 0

La funcion ϕ(0)k,0,0 (r) viene dada por

ϕ(0)k,0,0 (r) =

1

ru(0)k,0 (r)Y00 (θ, ϕ) =

1√4π

1

ru(0)k,0 (r)

Page 467: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 467

por tanto, debemos determinar la funcion radial u(0)k,0 (r). Usando las Ecs. (19.7, 19.8) y (19.9) con l = 0 tenemos

que [d2

dr2+ k2

]u(0)k,0 (r) = 0 ; u

(0)k,0 (0) = 0 (19.25)

la solucion del tipo (19.11) que se anula en el origen esta dada por

u(0)k,0 (r) = ak sin kr (19.26)

de modo que la funcion de onda ϕ(0)k,0,0 (r) viene dada por

ϕ(0)k,0,0 (r) =

1

ru(0)k,0 (r)Y00 (θ, ϕ) =

ak√4π

sin kr

r(19.27)

la constante ak se escoge real positiva y de modo que la funcion de onda completa sea ortonormal en el sentidoextendido, puesto que k es un ındice contınuo

〈k, 0, 0| k′, 0, 0〉 =∫d3r ϕ

(0)∗k,0,0 (r) ϕ

(0)k′,0,0 (r) = δ

(k − k′

)(19.28)

reemplazando la Ec. (19.27) en la integral de la Ec. (19.28) tenemos que

I ≡∫d3r ϕ

(0)∗k,0,0 (r) ϕ

(0)k′,0,0 (r) =

a2k4π

∫ ∞

0r2 dr

sin kr

r

sin k′rr

∫dΩ = a2k

∫ ∞

0dr sin kr sin k′r

I = a2k

∫ ∞

0dr

(eikr − e−ikr

)

2i

(eik

′r − e−ik′r)

2i= −a

2k

4

∫ ∞

0dr(ei(k+k

′)r + e−i(k+k′)r − ei(k−k

′)r − e−i(k−k′)r)

I =a2k4

∫ ∞

0dr ei(k−k

′)r +a2k4

∫ ∞

0dr e−i(k−k

′)r − a2k4

∫ ∞

0dr ei(k+k

′)r − a2k4

∫ ∞

0dr e−i(k+k

′)r

haciendo el cambio de variable r → −r en la segunda y cuarta integral, tenemos que

I =a2k4

∫ ∞

0dr ei(k−k

′)r − a2k4

∫ −∞

0dr ei(k−k

′)r − a2k4

∫ ∞

0dr ei(k+k

′)r +a2k4

∫ −∞

0dr ei(k+k

′)r

=a2k4

∫ ∞

0dr ei(k−k

′)r +a2k4

∫ 0

−∞dr ei(k−k

′)r − a2k4

∫ ∞

0dr ei(k+k

′)r − a2k4

∫ 0

−∞dr ei(k+k

′)r

= 2πa2k4

1

∫ ∞

−∞dr[ei(k−k

′)r − ei(k+k′)r]

I = a2kπ

2

[δ(k − k′

)− δ

(k + k′

)]

donde hemos usado el equivalente unidimensional de la delta de Dirac de la Ec. (1.117), Pag. 68. Ahora bien,puesto que k y k′ son ambos positivos, k + k′ es siempre diferente de cero y por tanto δ (k + k′) no contribuye enla integral, quedando ∫

d3r ϕ(0)∗k,0,0 (r) ϕ

(0)k′,0,0 (r) = a2k

π

2δ(k − k′

)

y exigiendo la ortonormalidad extendida (19.28) tenemos que ak =√

2/π, por tanto la funcion ϕ(0)k,0,0 (r) de la Ec.

(19.27) queda finalmente

ϕ(0)k,0,0 (r) =

1

π√2

sin kr

r(19.29)

Page 468: Mecanica Cuantica: Notas de Clase

468 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

19.4.4. Generacion de ondas esfericas libres con l 6= 0, a traves de P+ y L±

La Ec. (19.23) nos permite generar ϕ(0)k,1,1 (r) a partir de ϕ

(0)k,0,0 (r)

P+ϕ(0)k,0,0 (r) =Mk,1ϕ

(0)k,1,1 (r) ; (P1 + iP2)ϕ

(0)k,0,0 (r) =Mk,1ϕ

(0)k,1,1 (r)

escribiremos los operadores P1 y P2 en la base de las |r〉

P+ =~

i

(∂

∂x1+ i

∂x2

)=

(−i~ ∂

∂x1+ ~

∂x2

)

y lo expresamos en coordenadas esfericas, para ello utilizamos la Ec. (11.5) Pag. 327

∂1∂2∂3

=

cosϕ sin θ cos θ cosϕr − sinϕ

r sin θ

sin θ sinϕ cos θ sinϕr

cosϕr sin θ

cos θ − sin θr 0

∂r∂θ∂ϕ

(19.30)

con lo cual P+ en coordenadas esfericas queda

P+ = −i~ cosϕ sin θ∂

∂r− i~

cos θ cosϕ

r

∂θ+ i~

sinϕ

r sin θ

∂ϕ+ ~ sin θ sinϕ

∂r+ ~

cos θ sinϕ

r

∂θ+ ~

cosϕ

r sin θ

∂ϕ

P+ = ~ sin θ (sinϕ− i cosϕ)∂

∂r+

~ cos θ

r(sinϕ− i cosϕ)

∂θ+

~

r sin θ(cosϕ+ i sinϕ)

∂ϕ

P+ = −i~ sin θ (i sinϕ+ cosϕ)∂

∂r− i

~ cos θ

r(i sinϕ+ cosϕ)

∂θ+

~eiϕ

r sin θ

∂ϕ

P+ = −i~ sin θ eiϕ ∂∂r

− i~ cos θ

reiϕ

∂θ+

~eiϕ

r sin θ

∂ϕ(19.31)

de las Ecs. (19.31) y (19.29) se obtiene

P+ϕ(0)k,0,0 (r) = P+

(1

π√2

sin kr

r

)= −i~ sin θ eiϕ ∂

∂r

(1

π√2

sin kr

r

)= − i~ sin θ

π√2

eiϕ(k cos kr

r− sin kr

r2

)

P+ϕ(0)k,0,0 (r) = − i~k

2

π√2sin θ eiϕ

(cos kr

kr− sin kr

(kr)2

)

es conveniente escribir el operador diferencial radial en coordenadas cartesianas

P+f (r) = −i~ sin θ eiϕ∂f (r)∂r

= −i~ sin θ (cosϕ+ i sinϕ)∂f (r)

∂r

P+f (r) = ~

(−ir sin θ cosϕ

r+r sin θ sinϕ

r

)∂f (r)

∂r= ~

(−ix1

r+x2r

) ∂f (r)∂r

P+f (r) = − i~r(x1 + ix2)

∂f (r)

∂r(19.32)

la expresion (19.32) permite calcular P 2+ϕ

(0)k,0,0 (r) de una manera muy simple, teniendo en cuenta que ϕ

(0)k,0,0 (r)

solo depende de r, y que P+ cumple la relacion de conmutacion

[P+,X1 + iX2] = [P1 + iP2,X1 + iX2] = 0 (19.33)

en particular la relacion (19.33) se cumple en la base |r〉, de modo que

ϕ(0)k,2,2 (r) ∝ P 2

+

sin kr

kr∝ P+

[(x1 + ix2)

r

∂r

(sin kr

kr

)]= (x1 + ix2)P+

[1

r

∂r

(sin kr

kr

)]

∝ (x1 + ix2)2 1

r

∂r

[1

r

∂r

(sin kr

kr

)]= (x1 + ix2)

2

(1

r

∂r

)2 [sin krkr

]

Page 469: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 469

donde hemos omitido las constantes de proporcionalidad, debido a que estas se pueden absorber en la constantede normalizacion. Aplicando sucesivamente P+ con este procedimiento, es facil ver que

ϕ(0)k,l,l (r) ∝ (x1 + ix2)

l

(1

r

∂r

)l(sin kr

kr

)(19.34)

la dependencia angular de ϕ(0)k,l,l (r) esta contenida en el factor cartesiano

(x1 + ix2)l = (r sin θ cosϕ+ ir sin θ sinϕ)l = rl (sin θ)l (cosϕ+ i sinϕ)l

(x1 + ix2)l = rl (sin θ)l eilϕ = (−1)l rl

Yll (θ, ϕ)

|cl|; |cl| =

1

2ll!

√(2l + 1)!

4π(19.35)

donde hemos usado la Ec. (11.29) Pag. 331. Vemos que el factor angular es proporcional a Yl,l (θ, ϕ) como es-perabamos. Sustituyendo (19.35) en (19.34) tendremos entonces que

ϕ(0)k,l,l (r) ∝ (−1)l

Yl,l (θ, ϕ)

|cl|rl(1

r

∂r

)l(sin kr

kr

)=

kl

|cl|(−1)l Yl,l (θ, ϕ) (kr)l

(1

kr

∂ (kr)

)l (sin kr

kr

)

ϕ(0)k,l,l (r) ∝ (−1)l Yl,l (θ, ϕ) (kr)l

(1

kr

∂ (kr)

)l (sin kr

kr

)(19.36)

Donde el factor kl/ |cl| lo hemos absorbido en el factor de normalizacion. Definiremos la funcion esferica deBessel de orden l, en la forma

jl (ρ) ≡ (−1)l ρl(1

ρ

d

)l sin ρρ

(19.37)

es claro que para k, l dados, se pueden generar todas las autofunciones asociadas a todos los valores permitidosde m por medio de los operadores L±. Sin embargo, estos valores solo generan la dependencia angular que yaconocemos previamente (armonicos esfericos). Por tanto, combinando las ecuaciones (19.36, 19.37), vemos que lasondas esfericas libres se escriben en la forma

ϕ(0)k,l,m (r) = Ck,l jl (kr)Ylm (θ, ϕ) (19.38)

donde la constante de normalizacion no depende de m, puesto que los armonicos esfericos ya estan adecuadamentenormalizados. Solo queda encontrar la constante de normalizacion en terminos de k y l asociada a las funcionesde Bessel esfericas.

19.4.5. Ondas esfericas libres normalizadas

Definiremos a las Ck,l como constantes positivas. La constante de proporcionalidad la elegimos para que secumpla la relacion de ortonormalidad

∫d3r ϕ

(0)∗k,l,m (r)ϕ

(0)k′,l′,m′ (r) = δ

(k − k′

)δll′δmm′ (19.39)

y la relacion de completez∫ ∞

0dk

∞∑

l=0

l∑

m=−lϕ(0)k,l,m (r)ϕ

(0)∗k,l,m

(r′)= δ

(r− r′

)(19.40)

La constante de normalizacion da cuenta de la normalizacion de las funciones esfericas de Bessel, puesto que losarmonicos esfericos ya estan normalizados. Para encontrar esta constante de normalizacion, comenzaremos porcalcular el factor exacto en la Ec. (19.23), para ello necesitaremos calcular las derivadas de jl (kr) y de Yl,l (θ, ϕ),y algunas de sus propiedades

Page 470: Mecanica Cuantica: Notas de Clase

470 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

d

dρjl (ρ) =

d

[(−1)l ρl

(1

ρ

d

)l sin ρρ

]=

d

[(−1)l ρl

](1

ρ

d

)l sin ρρ

+ (−1)l ρld

[(1

ρ

d

)l sin ρρ

]

= (−1)l lρl−1

(1

ρ

d

)l sin ρρ

− (−1)l+1 ρl+1

(1

ρ

d

)[(1

ρ

d

)l sin ρρ

]

=l

ρ(−1)l ρl

(1

ρ

d

)l sin ρρ

− (−1)l+1 ρl+1

(1

ρ

d

)l+1 sin ρ

ρ=l

ρjl (ρ)− jl+1 (ρ)

∂Yll (θ, ϕ)

∂θ=

(−1)l

2ll!

√(2l + 1)!

4πeilϕ

∂θ

[(sin θ)l

]=l (−1)l

2ll!

√(2l + 1)!

4πcos θ eilϕ (sin θ)l−1

∂Yll (θ, ϕ)

∂θ=

l (−1)l

2ll!

√(2l + 1)!

cos θ

sin θeilϕ (sin θ)l = l

cos θ

sin θYl,l (θ, ϕ)

∂Yll (θ, ϕ)

∂ϕ=

(−1)l

2ll!

√(2l + 1)!

4π(sin θ)l

∂ϕeilϕ = il

(−1)l

2ll!

√(2l + 1)!

4π(sin θ)l eilϕ

∂Yll (θ, ϕ)

∂ϕ= ilYl,l (θ, ϕ)

Yl+1,l+1 (θ, ϕ) =(−1)l+1

2l+1 (l + 1)!

√[2 (l + 1) + 1]!

4π(sin θ)l+1 ei(l+1)ϕ

=(−1) sin θ eiϕ

√(2l + 2) (2l + 3)

2 (l + 1)

[(−1)l

2ll!

√[2l + 1]!

4π(sin θ)l eilϕ

]

Yl+1,l+1 (θ, ϕ) =(−1) sin θ eiϕ

√(2l + 2) (2l + 3)

(2l + 2)Yl,l (θ, ϕ) = (−1) sin θ eiϕ

√(2l + 3)

(2l + 2)Yl,l (θ, ϕ)

condensaremos estas propiedades en la forma

d

dρjl (ρ) =

l

ρjl (ρ)− jl+1 (ρ) ; Yl+1,l+1 (θ, ϕ) = (−1) sin θ eiϕ

√(2l + 3)

(2l + 2)Yl,l (θ, ϕ) (19.41)

∂Yll (θ, ϕ)

∂θ= l

cos θ

sin θYl,l (θ, ϕ) ;

∂Yll (θ, ϕ)

∂ϕ= ilYl,l (θ, ϕ) (19.42)

Tomaremos como hipotesis que la constante de normalizacion Ck,l en la Ec. (19.38) solo depende de k, i.e. Ck,l ≡ Ck,y demostraremos por induccion que si ϕk,l,l (r) esta normalizado con este Ck, entonces ϕk,l+1,l+1 (r) tambien

lo estara y puesto que para ϕ(0)k,0,0 (r) la constante de normalizacion solo dependıa de k, esta misma constante

normaliza a todos los ϕk,l,l (r). Usando la forma explıcita de P+ y de ϕ(0)k,l,l (r), Ecs. (19.31, 19.38) junto con las

Page 471: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 471

propiedades (19.41, 19.42), se obtiene

P+ϕ(0)k,l,l (r) = Ck

[−i~ sin θ eiϕ ∂

∂r− i~ cos θ

reiϕ

∂θ+

~eiϕ

r sin θ

∂ϕ

]jl (kr)Yll (θ, ϕ)

= Ck

[−i~Yll (θ, ϕ) sin θ eiϕk

∂ (kr)jl (kr)−

i~ cos θ

reiϕjl (kr)

∂Yll (θ, ϕ)

∂θ+

~eiϕ

r sin θjl (kr)

∂Yll (θ, ϕ)

∂ϕ

]

= Ck

−i~Yll (θ, ϕ) sin θ eiϕk

[l

krjl (kr)− jl+1 (kr)

]− i~ cos θ

reiϕjl (kr)

[lcos θ

sin θYl,l (θ, ϕ)

]

+jl (kr)~eiϕ

r sin θilYl,l (θ, ϕ)

= Ck

i~k

[sin θ eiϕYll (θ, ϕ)

]jl+1 (kr)− i~

Yll (θ, ϕ)

r sin θeiϕ jl (kr)

[l sin2 θ

]

−i~Yl,l (θ, ϕ)r sin θ

eiϕjl (kr)[l cos2 θ

]+ i~

Yl,l (θ, ϕ)

r sin θeiϕjl (kr) l

= Ck

i~k

[(−1)

√(2l + 2)

(2l + 3)Yl+1,l+1 (θ, ϕ)

]jl+1 (kr)− i~

Yll (θ, ϕ)

r sin θeiϕ jl (kr)

[l sin2 θ + l cos2 θ − l

]

P+ϕ(0)k,l,l (r) = −i~k

√(2l + 2)

(2l + 3)CkYl+1,l+1 (θ, ϕ) jl+1 (kr)

quedando finalmente

P+ϕ(0)k,l,l (r) = −i~k

√2l + 2

2l + 3ϕ(0)k,l+1,l+1 (r) (19.43)

con lo cual hemos encontrado el factor de proporcionalidad Mk,l de la Ec. (19.23).

19.4.6. Ortonormalidad de las funciones esfericas libres

En la relacion de ortonormalidad (19.39) los factores δll′δmm′ provienen de la ortonormalidad de las funciones

angulares (armonicos esfericos) la cual ya esta garantizada. Como consecuencia, podemos ver que si ϕ(0)k,l,l (r) esta

normalizada, entonces ϕ(0)k,l,m (r) tambien lo esta para todo m

⟨ϕ(0)k,l,m

∣∣∣ ϕ(0)k′,l,m

⟩≡

∫d3r ϕ

(0)∗k,l,m (r)ϕ

(0)k′,l,m (r) = C2

k

∫r2dr dΩ j∗l (kr)Y

∗l,m (θ, ϕ) jl

(k′r)Yl,m (θ, ϕ)

= C2k

[∫r2dr j∗l (kr) jl

(k′r)] ∫

Y ∗l,m (θ, ϕ)Yl,m (θ, ϕ) dΩ

⟨ϕ(0)k,l,m

∣∣∣ ϕ(0)k′,l,m

⟩= C2

k

[∫r2dr j∗l (kr) jl

(k′r)]

(19.44)

La Ec. (19.44) nos muestra que este producto interno no depende de m. Como caso particular, se tiene que

⟨ϕ(0)k,l,l

∣∣∣ ϕ(0)k′,l,l

⟩=⟨ϕ(0)k,l,m

∣∣∣ ϕ(0)k′,l,m

⟩= C2

k

[∫r2dr j∗l (kr) jl

(k′r)]

(19.45)

y puesto que los armonicos esfericos ya garantizan la ortogonalidad en los numeros cuanticos l,m, sera suficiente

mostrar la ortonormalizacion en el sentido extendido sobre la variable k, para las funciones del tipo ϕ(0)k,l,l

Il(k, k′

)≡∫d3r ϕ

(0)∗k,l,l (r)ϕ

(0)k′,l,l (r) =

⟨ϕ(0)k,l,l

∣∣∣ ϕ(0)k′,l,l

⟩(19.46)

Page 472: Mecanica Cuantica: Notas de Clase

472 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

demostraremos que si Il (k, k′) esta ortonormalizada entonces Il+1 (k, k

′) tambien lo esta. Partimos entonces de lahipotesis

Il(k, k′

)=⟨ϕ(0)k,l,l

∣∣∣ ϕ(0)k′,l,l

⟩= δ

(k − k′

)(19.47)

utilizando (19.43) en la integral (19.46) para l + 1, tenemos que

Il+1

(k, k′

)=

⟨ϕ(0)k,l+1,l+1

∣∣∣ ϕ(0)k′,l+1,l+1

⟩=

1

~2kk′2l + 3

2l + 2

⟨P+ϕ

(0)k,l,l

∣∣∣ P+ϕ(0)k′,l,l

Il+1

(k, k′

)= Al,k,k′

⟨ϕ(0)k,l,l

∣∣∣P−P+

∣∣∣ϕ(0)k′,l,l

⟩; Al,k,k′ ≡

2l + 3

~2kk′ (2l + 2)(19.48)

donde P †+ ≡ P− = P1 − iP2, vemos que

P−P+ = P 21 + P 2

2 = P2 − P 23 (19.49)

puesto que las ondas esfericas libres ϕ(0)k,l,l (r), son autoestados de H0 = P2/2µ, son tambien autoestados de P2,

con valor propio 2µEk = ~2k2. Adicionalmente, puesto que P3 es hermıtico, podemos escribir

Il+1

(k, k′

)= Al,k,k′

⟨ϕ(0)k,l,l

∣∣∣(P2 − P 2

3

) ∣∣∣ϕ(0)k′,l,l

⟩= Al,k,k′

⟨ϕ(0)k,l,l

∣∣∣(~2k′2 − P 2

3

) ∣∣∣ϕ(0)k′,l,l

= Al,k,k′~2k′2

⟨ϕ(0)k,l,l

∣∣∣ ϕ(0)k′,l,l

⟩−Al,k,k′

⟨ϕ(0)k,l,l

∣∣∣P †3P3

∣∣∣ϕ(0)k′,l,l

Il+1

(k, k′

)= Al,k,k′~

2k′2Il(k, k′

)−Al,k,k′

⟨P3ϕ

(0)k,l,l

∣∣∣ P3ϕ(0)k′,l,l

⟩(19.50)

ahora debemos calcular la accion de P3 sobre las funciones esfericas libres, para lo cual usamos las ecuaciones(19.30, 19.41, 19.42)

P3ϕ(0)k,l,l (r) = −i~

∂ϕ(0)k,l,l (r)

∂x3= −i~

(cos θ

∂r− sin θ

r

∂θ

)ϕ(0)k,l,l (r)

= −i~Ck[k cos θ Yl,l (θ, ϕ)

∂jl (kr)

∂ (kr)− sin θ

rjl (kr)

∂Yl,l (θ, ϕ)

∂θ

]

= −i~Ckk cos θ Yl,l (θ, ϕ)

[l

krjl (kr)− jl+1 (kr)

]− sin θ

rjl (kr)

[lcos θ

sin θYl,l (θ, ϕ)

]

= −i~Ckl

rcos θ Yl,l (θ, ϕ) jl (kr)− k cos θ Yl,l (θ, ϕ) jl+1 (kr)−

l

rcos θ Yl,l (θ, ϕ) jl (kr)

P3ϕ(0)k,l,l (r) = i~k cos θ CkYl,l (θ, ϕ) jl+1 (kr) (19.51)

Para propositos de la demostracion es conveniente escribir el miembro derecho de (19.51) en terminos de ϕ(0)k,l+1,l (r).

Para hacerlo debemos escribir el miembro derecho de (19.51) en terminos de Yl+1,l (θ, ϕ). De la Ec. (11.32), Pag.331 con m = l se tiene

L−Yl,l (θ, ϕ) = ~√l (l + 1)− l (l − 1) Yl,l−1 (θ, ϕ) = ~

√2l Yl,l−1 (θ, ϕ)

usando la forma explıcita de L− en la base de las |r〉, Ec. (11.15) Pag. 329, nos queda

Yl,l−1 (θ, ϕ) =1

~√2lL−Yl,l (θ, ϕ) =

1

~√2l~e−iϕ

(−∂Yl,l (θ, ϕ)

∂θ+ i

cos θ

sin θ

∂Yl,l (θ, ϕ)

∂ϕ

)

=e−iϕ√2l

[−lcos θ

sin θYl,l (θ, ϕ) + i

cos θ

sin θ(ilYl,l (θ, ϕ))

]= −2l

e−iϕ√2l

cos θ

sin θYl,l (θ, ϕ)

Yl,l−1 (θ, ϕ) = −√2l e−iϕ

cos θ

sin θYl,l (θ, ϕ) (19.52)

Page 473: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 473

con la sustitucion l → l + 1 en la ecuacion (19.52) y usando la Ec. (19.41) tenemos

Yl+1,l (θ, ϕ) = −√

2 (l + 1) e−iϕcos θ

sin θYl+1,l+1 (θ, ϕ) = −

√2l + 2 e−iϕ

cos θ

sin θ

[(−1) sin θ eiϕ

√(2l + 3)

(2l + 2)Yl,l (θ, ϕ)

]

Yl+1,l (θ, ϕ) = cos θ√(2l + 3)Yl,l (θ, ϕ) (19.53)

sustituyendo (19.53) en (19.51) se obtiene

P3ϕ(0)k,l,l (r) = i~k cos θCk

[Yl+1,l (θ, ϕ)

cos θ√(2l + 3)

]jl+1 (kr) =

i~k√(2l + 3)

CkYl+1,l (θ, ϕ) jl+1 (kr)

P3ϕ(0)k,l,l (r) =

i~k√(2l + 3)

ϕ(0)k,l+1,l (r) (19.54)

y ahora sustituyendo (19.54) en (19.50) tenemos que

Il+1

(k, k′

)= Al,k,k′~

2k′2Il(k, k′

)−Al,k,k′

⟨i~k√(2l + 3)

ϕ(0)k,l+1,l

∣∣∣∣∣i~k′√(2l + 3)

ϕ(0)k′,l+1,l

= Al,k,k′~2k′2Il

(k, k′

)−Al,k,k′

(−i~k√(2l + 3)

)i~k′√(2l + 3)

⟨ϕ(0)k,l+1,l

∣∣∣ ϕ(0)k′,l+1,l

usando la forma explıcita de Al,k,k′, ecuacion (19.48), ası como la Ec. (19.45) tenemos que

Il+1

(k, k′

)=

2l + 3

~2kk′ (2l + 2)~2k′2Il

(k, k′

)− 2l + 3

~2kk′ (2l + 2)

(~2kk′

(2l + 3)

)⟨ϕ(0)k,l+1,l+1

∣∣∣ ϕ(0)k′,l+1,l+1

Il+1

(k, k′

)=

k′ (2l + 3)

k (2l + 2)Il(k, k′

)− 1

(2l + 2)Il+1

(k, k′

)

aplicando la hipotesis (19.47) resulta

Il+1

(k, k′

)=

k′ (2l + 3)

k (2l + 2)δ(k − k′

)− 1

(2l + 2)Il+1

(k, k′

)

[1 +

1

(2l + 2)

]Il+1

(k, k′

)=

k′ (2l + 3)

k (2l + 2)δ(k − k′

)

[(2l + 2) + 1

(2l + 2)

]Il+1

(k, k′

)=

k′ (2l + 3)

k (2l + 2)δ(k − k′

)

la anterior expresion muestra que Il+1 (k, k′) es cero si k 6= k′ por tanto

[2l + 3

(2l + 2)

]Il+1

(k, k′

)=

k (2l + 3)

k (2l + 2)δ(k − k′

)

Il+1

(k, k′

)= δ

(k − k′

)

por tanto hemos demostrado que si Il (k, k′) esta ortonormalizado con el factor Ck, entonces Il+1 (k, k

′) tambien lo

esta. Por ultimo, hallamos el factor Ck por medio de la funcion esferica libre mas simple ϕ(0)k,0,0 (r). Comenzamos

reescribiendo la Ec. (19.29) (que ya esta debidamente normalizada) en la forma

ϕ(0)k,0,0 (r) =

k

π√2

sin kr

kr= k

√2

π

sin kr

kr

1√4π

= k

√2

πj0 (kr)Y00 (θ, ϕ)

ϕ(0)k,0,0 (r) = Ck j0 (kr)Y00 (θ, ϕ) ; Ck ≡ k

√2

π

Page 474: Mecanica Cuantica: Notas de Clase

474 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

la expresion final para las ondas esfericas libres Ec. (19.38), sera entonces

ϕ(0)k,l,m (r) = k

√2

πjl (kr)Ylm (θ, ϕ) (19.55)

19.4.7. Comportamiento asintotico de las ondas esfericas libres

Estudiaremos el comportamiento de jl (ρ) cerca al origen y para r muy grande. Utilizando la expansion desin ρ/ρ en serie de potencias

sin ρ

ρ=

∞∑

p=0

(−1)pρ2p

(2p + 1)!(19.56)

y aplicando el operador (−1)l ρl(ρ−1∂ρ

)lobtenemos jl (ρ) segun la definicion (19.37)

jl (ρ) = (−1)l ρl(1

ρ

d

)l sin ρρ

= (−1)l ρl∞∑

p=0

(−1)p

(2p+ 1)!

(1

ρ

d

)lρ2p (19.57)

podemos ver que

(1

ρ

d

)lρ2p =

(1

ρ

d

)l−1 [(1

ρ

d

)ρ2p]= 2p

(1

ρ

d

)l−1

ρ2(p−1)

= 2p

(1

ρ

d

)l−2 [(1

ρ

d

)ρ2(p−1)

]= 2p [2 (p− 1)]

(1

ρ

d

)l−3 [(1

ρ

d

)ρ2(p−2)

]

(1

ρ

d

)lρ2p = 2p [2 (p− 1)] [2 (p− 2)]

(1

ρ

d

)l−3

ρ2(p−3)

de lo cual ya podemos ver la secuencia

(1

ρ

d

)lρ2p = 2p [2 (p− 1)] [2 (p− 2)] · · · 2 [p− (l − 1)] ρ2(p−l)

(1

ρ

d

)lρ2p = 2p (2p− 2) (2p − 4) · · · [2p− 2 (l − 1)] ρ2(p−l) (19.58)

sustituyendo (19.58) en (19.57) tenemos

jl (ρ) = (−1)l ρl∞∑

p=0

(−1)p2p (2p− 2) (2p− 4) · · · [2p − 2 (l − 1)]

(2p+ 1)!ρ2(p−l) (19.59)

es claro que el factor2p (2p− 2) (2p − 4) · · · [2p − 2 (l − 1)]

(2p+ 1)!

es nulo para p = 0, 1, 2, . . . , l − 1. Por tanto la Ec. (19.59) queda en la forma

jl (ρ) = (−1)l ρl∞∑

p=l

(−1)p2p (2p− 2) (2p − 4) · · · [2p − 2 (l − 1)]

(2p+ 1)!ρ2p−2l (19.60)

en el lımite cuando ρ→ 0, podemos quedarnos solo con el primer termino de la expansion (19.60)

jl (ρ) ∼ρ→0

(−1)l ρl (−1)l2l (2l − 2) (2l − 4) · · · × 4× 2

(2l + 1)!= ρl

2l (2l − 2) (2l − 4) · · · × 4× 2

(2l + 1) (2l) (2l − 1) (2l − 2) · · · 3× 2× 1

=ρl

(2l + 1) (2l − 1) (2l − 3) · · · × 3× 1

Page 475: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 475

jl (ρ) ∼ρ→0

ρl

(2l + 1)!!(19.61)

con lo cual ϕk,l,m (r) es proporcional a rl en el lımite de ρ = kr muy pequeno. Sustituyendo (19.61) en (19.55)resulta

ϕ(0)k,l,m (r) ∼

r→0k

√2

πYlm (θ, ϕ)

(kr)l

(2l + 1)!!(19.62)

veamos ahora el lımite para ρ muy grande. De la definicion de jl (ρ) se tiene

jl (ρ) = (−1)l ρl(1

ρ

d

)l sin ρρ

= (−1)l ρl(1

ρ

d

)l−1 [(1

ρ

d

)sin ρ

ρ

]= (−1)l ρl

(1

ρ

d

)l−1 [cos ρρ2

− sin ρ

ρ3

]

el segundo termino en parentesis cuadrados es mucho menor que el primero cuando ρ → ∞. Tenemos entoncesque

jl (ρ) ∼ρ→∞

(−1)l ρl(1

ρ

d

)l−1 cos ρ

ρ2= (−1)l ρl

(1

ρ

d

)l−1 [ 1

ρ2d

dρsin ρ

]

Adicionalmente, al aplicar de nuevo el operador ρ−1∂ρ, tenemos

jl (ρ) ∼ρ→∞

(−1)l ρl(1

ρ

d

)l−2 [(1

ρ

d

)cos ρ

ρ2

]= (−1)l ρl

(1

ρ

d

)l−2 [−sin ρ

ρ3− 2 cos ρ

ρ4

]

jl (ρ) ∼ρ→∞

(−1)l ρl(1

ρ

d

)l−2 [−sin ρ

ρ3

]= (−1)l ρl

(1

ρ

d

)l−2 [ 1

ρ3d2

dρ2sin ρ

]

el termino dominante continua siendo el termino proveniente de la derivada de la funcion sin ρ. Por tanto, jl (ρ)se comporta en la forma

jl (ρ) ∼ρ→∞

(−1)l ρl1

ρl+1

(d

)lsin ρ

jl (ρ) ∼ρ→∞

(−1)l1

ρ

(d

)lsin ρ

y teniendo en cuenta que (d

)lsin ρ = (−1)l sin

(ρ− π

2l)

obtenemos finalmente

jl (ρ) ∼ρ→∞

1

ρsin(ρ− π

2l)

(19.63)

en este punto recalcamos la importancia de la condicion uk,l (0) = 0. Por ejemplo, si hacemos kr = ρ en la ecuacionradial (19.5) obtenemos

[− ~2

k2

kr

d2

d (kr)2(kr) +

k2l (l + 1) ~2

2µ (kr)2

]R

(0)k,l (ρ) =

~2k2

2µR

(0)k,l (ρ)

~2k2

[−1

ρ

d2

dρ2ρ+

l (l + 1)

ρ2− 1

]R

(0)k,l (ρ) = 0

[1

ρ

d2

dρ2ρ+ 1− l (l + 1)

ρ2

]R

(0)l (ρ) = 0 (19.64)

Page 476: Mecanica Cuantica: Notas de Clase

476 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

en el ultimo paso hemos suprimido la dependencia de k como numero cuantico en Rk,l (ρ), puesto que dichonumero cuantico se factorizo por completo del operador (por supuesto Rl (ρ) depende de k a traves del factor denormalizacion Ck y de la relacion ρ ≡ kr). Por otro lado

1

ρ

d2

dρ2

[ρR

(0)l (ρ)

]=

1

ρ

d

[R

(0)l (ρ) + ρ

d

dρR

(0)l (ρ)

]=

1

ρ

[d

dρR

(0)l (ρ) +

d

dρR

(0)l (ρ) + ρ

d2

dρ2R

(0)l (ρ)

]

1

ρ

d2

dρ2

[ρR

(0)l (ρ)

]=

[2

ρ

d

dρR

(0)l (ρ) +

d2

dρ2R

(0)l (ρ)

](19.65)

sustituyendo (19.65) en (19.64) queda finalmente[d2

dρ2+

2

ρ

d

dρ+

(1− l (l + 1)

ρ2

)]R

(0)l (ρ) = 0 (19.66)

esta es la ecuacion de Bessel esferica de orden l. Dicha ecuacion posee dos soluciones linealmente independientes,que se pueden distinguir en particular por su comportamiento en el origen. Una de ellas es la funcion de Besselesferica jl (ρ) que satisface las condiciones asintoticas (19.61, 19.63). Para la otra solucion linealmente indepen-diente se pueden elegir las funciones esfericas de Neumann de orden l, denotadas por ηl (ρ), que poseen elsiguiente comportamiento asintotico

ηl (ρ) ∼ρ→0

(2l − 1)!!

ρl+1; ηl (ρ) ∼

ρ→∞1

ρcos(ρ− π

2l)

(19.67)

para ver si la solucion es fısicamente aceptable, examinamos el lımite de r pequeno para uk,l (ρ) para el cualtendrıamos

lımρ→0

u(0)k,l (ρ) = lım

ρ→0rR

(0)k,l (ρ) = lım

ρ→0

ρ

kη(0)l (ρ) =

(2l − 1)!!

kρl

este lımite no es nulo para ningun l, y de hecho diverge para l 6= 0. Por tanto, no se cumple la condicion (19.8)con lo cual la solucion es fısicamente descartable.

19.4.8. Relacion entre las ondas esfericas libres y las planas

Tanto las ondas esfericas libresϕ(0)k,l,m (r)

como las ondas planas

η(0)k (r)

son bases para el espacio orbital

Er. Por tanto, cada base se puede expresar en terminos de la otra. Comenzaremos por expresar las ondas planas en

terminos de las ondas esfericas libres. Puesto que la onda plana η(0)k (r), es funcion propia de H0 con valor propio

~2k2/2µ, su expansion solo incluira a las ondas ϕk,l,m (r) que corresponden a esta energıa, es decir aquellas quecumplen la condicion

|k| =√2µE

~

de manera que la expansion tendra la forma

η(0)k (r) = eik·r =

∞∑

l=0

l∑

m=−lcl,m (k)ϕ

(0)k,l,m (r) (19.68)

comenzaremos por simplicidad con el caso en el cual k = ku3. Definiendo θ como el angulo entre r y el eje Z,vamos a expandir la funcion

eikz = eikr cos θ (19.69)

puesto que esta funcion es independiente de ϕ, solo contribuyen los armonicos esfericos con m = 0. Por tanto laEc. (19.68) quedara en la forma

eikz = eikr cos θ =∞∑

l=0

cl,0 (k)ϕ(0)k,l,0 (r) =

∞∑

l=0

cl (k) jl (kr) Yl,0 (θ) (19.70)

Page 477: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 477

si consideramos a eikr cos θ como funcion de θ, asumiendo a r como un parametro, podemos considerar a cl (k) jl (kr)como un coeficiente y expandirlo en la base ortonormal de los armonicos esfericos3. Multiplicando la Ec. (19.70)por Y ∗

l,0 (θ) dΩ, integrando en el angulo solido y utilizando la ortonormalidad de los armonicos esfericos, tenemos

∫eikr cos θY ∗

l,0 (θ) dΩ =

∞∑

l′=0

cl′ (k) jl′ (kr)

∫Yl′,0 (θ)Y

∗l,0 (θ) dΩ =

∞∑

l′=0

cl′ (k) jl′ (kr) δll′ = cl (k) jl (kr)

cl (k) jl (kr) =

∫eikr cos θY ∗

l,0 (θ) dΩ (19.71)

por otro lado, Yl,0 (θ) se puede escribir en terminos de Yl,l (θ, ϕ) aplicando l−veces el operador escalera L−.. De laEc. (11.32), Pag. 331 vemos que

L−Yl,m (θ, ϕ) = ~√l (l + 1)−m (m− 1)Yl,m−1 (θ, ϕ)

que reescribiremos en la forma

L−Yl,l−k (θ, ϕ) = ~√l (l + 1)− (l − k) (l − k − 1) Yl,l−k−1 (θ, ϕ) = ~

√(2l − k) (k + 1) Yl,l−k−1 (θ, ϕ)

L−Yl,l−k (θ, ϕ) = ~√

(k + 1)√

(2l − k) Yl,l−k−1 (θ, ϕ) ; 0 ≤ k ≤ 2l (19.72)

si aplicamos l veces el operador L− al armonico Yl,l (θ, ϕ) entonces k pasara por los valores

k = 0, 1, 2, . . . , (l − 3) , (l − 2) , (l − 1) (19.73)

y combinando la Ec. (19.72) con (19.73) vemos que

(L−)l Yl,l (θ, ϕ) = ~l

√1 · 2 · . . . · (l − 1) · l

√(2l) (2l − 1) (2l − 2) . . . (l + 2) (l + 1) Yl,0 (θ, ϕ)

(L−)l Yl,l (θ, ϕ) = ~l

√(2l)! Yl,0 (θ, ϕ) (19.74)

sustituyendo (19.74) en (19.71) se obtiene

cl (k) jl (kr) =

∫Y ∗l,0 (θ) e

ikr cos θ dΩ =1√(2l)!

∫ [(L−~

)lYl,l (θ, ϕ)

]∗eikr cos θ dΩ

=1√(2l)!

⟨(L−~

)l(l, l) |k〉 = 1√

(2l)!〈l, l|

[(L−~

)l]†|k〉 (19.75)

=1√(2l)!

∫Y ∗l,l (θ, ϕ)

[(L−~

)l]†eikr cos θ dΩ

cl (k) jl (kr) =1√(2l)!

∫Y ∗l,l (θ, ϕ)

[(L+

~

)leikr cos θ

]dΩ (19.76)

donde hemos usado el hecho de que L+ es el adjunto de L−. Por otro lado, de la forma explıcita de L± Ecs. (11.14,11.15), Pag. 329 se puede probar que

L±[einϕF (θ)

]= ∓~ei(n±1)ϕ (sin θ)1±n

d

d (cos θ)

[(sin θ)∓n F (θ)

](19.77)

a partir de lo cual se puede demostrar por recurrencia que

(L±)p [einϕF (θ)

]= (∓~)p ei(n±p)ϕ (sin θ)p±n

dp

d (cos θ)p[(sin θ)∓n F (θ)

](19.78)

3De hecho, los armonicos esfericos de la forma Yl,0 (θ) son una base ortonormal para funciones de la variable θ.

Page 478: Mecanica Cuantica: Notas de Clase

478 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

aplicando (19.78) con p = l y con n = 0, tenemos que(L+

~

)leikr cos θ = (−1)l eilϕ (sin θ)l

dl

d (cos θ)leikr cos θ

= (−1)l eilϕ (sin θ)l (ikr)l eikr cos θ

(L+

~

)leikr cos θ = (ikr)l

√4π

(2l + 1)!2ll! Yl,l (θ, ϕ) e

ikr cos θ (19.79)

donde hemos utilizado la expresion (11.29) Pag. 331 para Yl,l (θ, ϕ). Aplicando la Ec. (19.79) en (19.76) resulta

cl (k) jl (kr) = (ikr)l

√4π

(2l + 1)!

2ll!√(2l)!

∫|Yl,l (θ, ϕ)|2 eikr cos θ dΩ (19.80)

ahora bien, puesto que cl (k) es independiente de r podemos tomar cualquier valor dado de r para evaluar cl (k) enla expresion (19.80). Tomaremos r → 0, con lo cual la funcion esferica de Bessel jl (kr) adquiere el valor asintotico(19.61). En este lımite, la Ec. (19.80) queda en la forma

cl (k)(kr)l

(2l + 1)!!= (ikr)l

√4π

(2l + 1)!

2ll!√(2l)!

∫|Yl,l (θ, ϕ)|2 dΩ

cl (k) = il (2l + 1)!!

√4π

(2l + 1)!

2ll!√(2l)!

donde hemos tenido en cuenta que los armonicos esfericos estan normalizados. El coeficiente cl es entonces inde-pendiente de k y viene dado por

cl = il (2l + 1)!!

√4π

(2l + 1)!

√2l + 1

(2l + 1)!2ll! = il

(2l + 1)!!

(2l + 1)!

√4π (2l + 1) 2ll!

cl = il√

4π (2l + 1)2ll!

(2l)!!(19.81)

es facil ver que

(2l)!! = [2l] [2l − 2] [2l − 4] [2l − 6] ... [2l − 2 (l − 1)] = [2l] [2 (l − 1)] [2 (l − 2)] [2 (l − 3)] ... [2 (l − (l − 1))]

= 2l · l (l − 1) (l − 2) (l − 3) ... (l − (l − 1))

(2l)!! = 2l · l!con lo cual (19.81) se reduce a

cl = il√

4π (2l + 1) (19.82)

por tanto, la expansion de eikz Ec. (19.70) queda en la forma

eikz =

∞∑

l=0

il√

4π (2l + 1) jl (kr)Yl,0 (θ) =

∞∑

l=0

il (2l + 1) jl (kr)Pl (cos θ) (19.83)

donde Pl (cos θ) es el polinomio de Legendre de grado l. Es bien sabido que los polinomios de Legendre son unabase para cualquier funcion del angulo polar θ. Por otro lado, podemos escribir la expansion (19.83) en terminosde las ondas esfericas libres (19.55)

eikz =1

k

√π

2

∞∑

l=0

il√4π (2l + 1)

[k

√2

πjl (kr)Yl,0 (θ)

]

eikz =1

k

√π

2

∞∑

l=0

il√4π (2l + 1) ϕ

(0)k,l,0 (r) (19.84)

Page 479: Mecanica Cuantica: Notas de Clase

19.4. CARACTERIZACION DE LAS ONDAS ESFERICAS LIBRES 479

Ahora bien, podemos sin perdida de generalidad definir al vector k en la direccion u3. Por otro lado, θ es elangulo entre u3 y r o equivalentemente el angulo entre k y r. Adicionalmente, la expresion (19.83) depende unica-mente del angulo entre k y r sin importar la direccion de los vectores individuales. Por conveniencia, redefinimoscomo α al angulo entre k y r, de modo que la expresion (19.83) para direcciones arbitrarias de k y r se escribe enla forma

eik·r =∞∑

l=0

il (2l + 1) jl (kr)Pl (cosα) (19.85)

La direccion (arbitraria) de k la definimos con los angulos (θk, ϕk), y la direccion arbitraria de r con los angulos(θ, ϕ). Ahora bien, puesto que α es el angulo entre k y r, podemos utilizar el teorema de adicion de los armonicosesfericos Ec. (11.41), Pag. 333 para obtener

eik·r = 4π

∞∑

l=0

l∑

m=−lil jl (kr) Y

∗lm (θk, ϕk) Yl,m (θ, ϕ) =

k

√π

2

∞∑

l=0

l∑

m=−lil Y ∗

lm (θk, ϕk) ϕ(0)k,l,m (r) (19.86)

donde hemos utilizado la expresion (19.55) para las ondas esfericas libres. Por supuesto, es posible invertir la Ec.(19.86), con el fin de obtener las ondas esfericas libres ϕk,l,m (r) en terminos de ondas planas. Multiplicando la Ec.(19.86) por Ylm (θk, ϕk) dΩk, integrando y usando la ortonormalidad de los armonicos esfericos, se tiene que

∫eik·rYlm (θk, ϕk) dΩk = 4π

∞∑

l′=0

l′∑

m′=−l′il

′jl′ (kr) Yl′,m′ (θ, ϕ)

∫Y ∗l′m′ (θk, ϕk)Ylm (θk, ϕk) dΩk

= 4π

∞∑

l′=0

l′∑

m′=−l′il

′jl′ (kr) Yl′,m′ (θ, ϕ) δll′δmm′ = 4πil jl (kr) Ylm (θ, ϕ)

∫eik·rYlm (θk, ϕk) dΩk =

4πil

k

√π

2

[k

√2

πjl (kr) Ylm (θ, ϕ)

]=

(−i)l k

√π

2ϕ(0)k,l,m (r)

quedando finalmente

ϕ(0)k,l,m (r) =

(−1)l ilk

√2

π

∫eik·rYlm (θk, ϕk) dΩk (19.87)

La Ec. (19.86) nos dice que un estado con momento lineal bien definido, involucra todos los valores posibles delmomento angular orbital. Recıprocamente, la Ec. (19.87) nos dice que un estado con momento angular orbitalbien definido, involucra todas las ondas planas con la misma energıa. Esto es, todas las ondas planas tales que~ |k| = √

2µE, incluyendo todas las direcciones posibles (θk, ϕk).

19.4.9. Interpretacion fısica de las ondas esferica libres

Hemos visto que la dependencia angular de la onda esferica esta dada por los armonicos esfericos. Por lotanto, la dependencia angular esta completamente fijada por los autovalores de L2 y L3, pero es completamenteindependiente de k, y por tanto de la energıa. Por ejemplo, una onda esferica libre tipo s (i.e. con l = 0) esisotropica sin importar su energıa.

Consideremos un angulo solido infinitesimal dΩ0 centrado en cierta direccion Ω0 ≡ (θ0, ϕ0). Cuando la partıcula

esta en el estado ϕ(0)k,l,m (r) descrito por la Ec. (19.55), la probabilidad de encontrar a la partıcula en un intervalo

radial entre r y r + dr y un intervalo angular dΩ0 esta dada por

dP =∣∣∣ϕ(0)k,l,m (r)

∣∣∣2r2 dr dΩ0 =

2k2

πj2l (kr) |Yl,m (θ0, ϕ0)|2 r2 dr dΩ0 =

2

π(kr)2 j2l (kr) |Yl,m (θ0, ϕ0)|2

d (kr)

kdΩ0

dP =2

π

ρ2

kj2l (ρ) |Yl,m (θ0, ϕ0)|2 dρ dΩ0 ; ρ ≡ kr (19.88)

Page 480: Mecanica Cuantica: Notas de Clase

480 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

De la forma explıcita de los armonicos esfericos Eq. (11.30) pag. 331, vemos que esta probabilidad es independientede ϕ, de modo que tiene simetrıa azimutal. Adicionalmente, en virtud del comportamiento asintotico de jl (ρ) cercaal origen Ec. (19.61), vemos que la probabilidad (19.88) en la vecindad del origen se comporta en la forma

dP ∼r→0

2

π

ρ2

k

ρ2l

[(2l + 1)!!]2|Yl,m (θ0, ϕ0)|2 dρ dΩ0

dP ∼r→0

2

π

1

k

ρ2l+2

[(2l + 1)!!]2dρ

|Yl,m (θ0, ϕ0)|2 dΩ0

por tanto al incrementar l, disminuye mas rapidamente la probabilidad a medida que nos acercamos al origen. Dela Ec. (19.88), es claro que el comportamiento radial de la probabilidad esta regulado por la funcion ρ2j2l (ρ). Elcomportamiento de esta funcion se grafica en la Fig. 19.1. Tal figura muestra que esta funcion permanece pequenaen el intervalo

ρ <√l (l + 1)

podemos entonces asumir que la probabilidad es practicamente cero para

Figura 19.1: Comportamiento de ρ2j2l (ρ) con respecto a ρ. Aquı se grafica para l = 4.

r <1

k

√l (l + 1) (19.89)

lo anterior implica que una partıcula en el estado ϕk,l,m (r) practicamente no se afecta por lo que ocurra en elinterior de la esfera centrada en el origen O y de radio

bl (k) =1

k

√l (l + 1) (19.90)

lo anterior posee un interesante analogo semi-clasico. En mecanica clasica una partıcula libre de momento p ymomento angular L, se mueve en lınea recta con parametro de impacto

b =|L||p| (19.91)

y el parametro de impacto crece con el modulo de L y decrece con el modulo de p (y por tanto con la energıa).Si reemplazamos |L| por ~

√l (l + 1) y |p| por ~k, la Ec. (19.91) se convierte en (19.90). Puesto que clasicamente

el parametro de impacto es la distancia de maximo acercamiento al origen, vemos que tambien clasicamente, la“esfera de exclusion” de la partıcula aumenta con el aumento del modulo del momento angular y disminuye conel aumento de la energıa (i.e. del modulo de p).

Page 481: Mecanica Cuantica: Notas de Clase

19.5. ONDAS PARCIALES EN EL POTENCIAL V (R) 481

A priori parece extrano que exista una esfera de exclusion alrededor del origen. Despues de todo, si las partıculasson libres el origen no es un punto privilegiado, ya que no hay un centro dispersor. Sin embargo, debe tenerse encuenta que el momento angular es una cantidad que se mide con respecto a cierto origen. En el analogo clasico,un alto valor del momento angular (con respecto a un origen dado) significa un alto parametro de impacto, esdecir la distancia de mayor aproximacion al origen es grande. Cuanticamente, esto se manifiesta en el crecimientode la esfera de exclusion cuando aumenta el momento angular.

Como en cualquier experimento de dispersion, el lımite mas importante es el lımite asintotico con r → ∞.

Usando tal lımite en la funcion esferica de Bessel Ec. (19.63), vemos que el comportamiento de ϕ(0)k,l,m (r) en este

regimen asintotico, vendra dado por

ϕ(0)k,l,m (r) = k

√2

πjl (kr)Ylm (θ, ϕ) ∼

r→∞−k√

2

π

1

ρsin(π2l − ρ

)Ylm (θ, ϕ)

= −k√

2

π

1

ρ

ei(π2l−ρ) − e−i(

π2l−ρ)

2iYlm (θ, ϕ) = −k

√2

πYlm (θ, ϕ)

ei(π2l−kr) − e−i(

π2l−kr)

2ikr

quedando finalmente

ϕ(0)k,l,m (r) ∼

r→∞−k√

2

πYlm (θ, ϕ)

e−ikreilπ2 − eikre−il

π2

2ikr

ϕ(0)k,l,m (r) ∼

r→∞−k√

2

πYlm (θ, ϕ)

[e−ikreilπ − eikr

2ikr

]e−il

π2 (19.92)

con lo cual en el infinito vemos que la funcion de onda esferica libre puede verse como la superposicion de unaonda entrante r−1e−ikr y una onda saliente r−1eikr, cuyas amplitudes difieren por una diferencia de fase de lπ.

Si se construye un paquete de ondas esfericas libres, todas correspondientes al mismo valor de l y m (es decirbarriendo valores de k), podemos realizar una analisis similar al de la seccion 18.5.1, y se concluye que parat → −∞, solo existe un paquete de ondas entrante y para t → ∞ solo existe un paquete de ondas saliente.De esta manera podemos pensar en la evolucion temporal de una onda esferica libre en la siguiente forma: Ent→ −∞ tenemos una onda entrante que converje hacia el origen O. A medida que se aproxima al origen comienzaa distorsionarse4 y vuelve sobre sus pasos cuando esta a una distancia del orden de bl (k) dada por (19.90), de locual surge una onda saliente con corrimiento de fase lπ con respecto a la onda entrante.

19.5. Ondas parciales en el potencial V (r)

A continuacion estudiaremos los estados propios simultaneos de H (el Hamiltoniano total con interaccion) L2

y L3. Tales estados se denominan ondas parciales y se denotan por ϕk,l,m (r). Ya vimos que para un potencialcentral V (r) las ondas parciales tienen la forma

ϕk,l,m (r) = Rk,l (r)Ylm (θ, ϕ) =1

ruk,l (r)Ylm (θ, ϕ) (19.93)

siendo uk,l (r) la solucion de la ecuacion radial

[− ~2

d2

dr2+l (l + 1) ~2

2µr2+ V (r)

]uk,l (r) =

~2k2

2µuk,l (r) (19.94)

uk,l (0) = 0 (19.95)

este problema es analogo al de un problema unidimensional de una partıcula de masa µ, bajo la influencia de unpotencial efectivo. Es claro que la variable r es no negativa en coordenadas esfericas. Sin embargo, en el problema

4Debemos tener en cuenta que esta distorsion se debe a una barrera centrıfuga y no a un potencial real.

Page 482: Mecanica Cuantica: Notas de Clase

482 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

unidimensional equivalente, es conveniente ver a r como una variable que puede tomar valores negativos perotal que hay una barrera de potencial de altura infinita para r < 0, que excluye esta region (tanto clasica comocuanticamente). El potencial efectivo se escribira entonces en la forma

Veff (r) =

V (r) + l(l+1)~2

2µr2para r > 0

∞ para r < 0

para valores grandes de r, la Ec. (19.94) se reduce a[d2

dr2+ k2

]uk,l (r) ≃

r→∞0 (19.96)

cuya solucion general tiene la formauk,l (r) ≃

r→∞Aeikr +Be−ikr (19.97)

pero como uk,l (r) debe satisfacer la condicion (19.95) A y B no son independientes. En el problema unidimensionalequivalente, la condicion (19.95) esta asociada al hecho de que al aproximarnos al origen nos aproximamos a labarrera infinita de potencial y la Ec. (19.97) representa en este problema equivalente la superposicion de una onda“incidente” plana e−ikr viniendo de la derecha (a lo largo del eje en el cual se mueve la partıcula unidimensionalfictisia equivalente)5, y una onda plana “reflejada” eikr que se propaga de izquierda a derecha. Puesto que no puedehaber una onda “transmitida” (en r < 0) debido a la barrera infinita de potencial, la intensidad de la corriente“reflejada” debe ser igual a la “incidente”. En consecuencia, la condicion (19.95) implica que en la expresionasintotica (19.97) tenemos que

|A| = |B| (19.98)

aunque puede haber en general, una diferencia de fase entre ambas amplitudes

A = |A| eiϕA ; B = |A| eiϕB (19.99)

con lo cual la Ec. (19.97) queda

uk,l (r) ≃r→∞

|A|[eiϕAeikr + eiϕBe−ikr

]

que se puede reescribir en la formauk,l (r) ≃

r→∞C0 sin (kr − βl) (19.100)

donde la fase βl se puede determinar completamente imponiendo continuidad entre la solucion asintotica (19.100)y la solucion completa de (19.94) que se anula en el origen. En la seccion 19.4.9 vimos que para potencial nulo, βlera lπ/2. En consecuencia, es conveniente utilizar este valor como punto de referencia y reescribir la Ec. (19.100)en la forma

uk,l (r) ≃r→∞

C0 sin(kr − l

π

2+ δl

)(19.101)

a la cantidad δl definida ası, se le denomina el corrimiento de fase de la onda parcial ϕk,l,m (r) con respecto a la

onda esferica libre ϕ(0)k,l,m (r). Este corrimiento de fase depende obviamente de k y l i.e. de la energıa y el momento

angular.De las Ecs. (19.93, 19.101) podemos escribir el comportamiento asintotico de la onda parcial en la forma

ϕk,l,m (r) =1

ruk,l (r)Ylm (θ, ϕ) ≃

r→∞1

rC0 sin

(kr − l

π

2+ δl

)Ylm (θ, ϕ)

=C0

rYlm (θ, ϕ)

ei(kr−lπ2+δl) − e−i(kr−l

π2+δl)

2i= −C0Ylm (θ, ϕ)

e−i(kr−lπ2+δl) − ei(kr−l

π2+δl)

2ir5En mecanica clasica ocurre un fenomeno similar. En el problema unidimensional equivalente al problema de Kepler podemos pensar

en una partıcula fictisia que se mueve en una dimension en la coordenada r con puntos de retorno en r. Sin embargo, la partıculareal se mueve en dos dimensiones y los puntos de retorno son puntos en donde se invierte el crecimiento de la coordenada r, pero noimplican un retorno en la trayectoria.

Page 483: Mecanica Cuantica: Notas de Clase

19.5. ONDAS PARCIALES EN EL POTENCIAL V (R) 483

ϕk,l,m (r) ≃r→∞

−kC0Ylm (θ, ϕ)e−ikrei(l

π2−δl) − eikre−i(l

π2−δl)

2ikr(19.102)

la onda parcial al igual que la onda esferica libre esta constituıda por la superposicion de una onda entrante y unasaliente. Para facilitar la comparacion entre las ondas parciales y las ondas esfericas libres, podemos modificar laonda entrante de (19.102) para que quede casi identica a la dada por la Ec. (19.92). Para ello definimos una nuevaonda parcial ϕk,l,m (r) multiplicando ϕk,l,m (r) por una fase global eiδl que claramente no altera el contenido fısicodel estado, y redefiniendo la constante C0 de modo que

ϕk,l,m (r) ≡ eiδlϕk,l,m (r) ≃r→∞

−kC0Ylm (θ, ϕ)e−ikreil

π2 − eikre−i(l

π2−2δl)

2ikr

= −k[√

2

πC0

]Ylm (θ, ϕ)

e−ikreilπ2 − eikre−i(l

π2−2δl)

2ikr

ahora bien, el factor k√

2/π garantiza la normalizacion de la funcion [ya que la funcion (19.55) esta debidamentenormalizada]. En consecuencia, C0 tiene modulo unidad y por tanto es una fase global constante que se puederemover. Tenemos finalmente

ϕk,l,m (r) ≃r→∞

−k√

2

πYlm (θ, ϕ)

[e−ikreilπ − eikre2iδl

2ikr

]e−il

π2 (19.103)

comparando las Ecs. (19.92, 19.103), podemos entonces interpretar esta expresion en la siguiente forma: Comen-zamos con la misma onda entrante que en el caso de las ondas esfericas libres. A medida que se acerca al origen(region de dispersion) esta onda entrante es cada vez mas perturbada por el potencial. Despues de reflejarse trans-formada en una onda saliente, ha acumulado un corrimiento de fase de 2δl, con respecto a la onda saliente libreque hubiera resultado en ausencia del potencial. Por tanto, el factor e2iδl (que varıa con l y k) sintetiza el efectototal del potencial sobre la partıcula de momento angular l y energıa ~2k2/2µ.

La anterior discusion es valida cuando tenemos un paquete de ondas compuesto por la superposicion de ondasparciales ϕk,l,m (r) todas con los mimos valores de l,m en las cuales la distribucion de las k esta muy concentradaalrededor de cierto valor k0. El analisis de este tipo de paquete muestra que para t→ −∞, solo tenemos un paquetede onda entrante que posteriormente interactua con el potencial para dar paso al paquete saliente. Tambien sepuede hacer una analogıa semejante a la realizada en la seccion 18.5.1. El fenomeno antes descrito es similar alque se obtendrıa si ponemos a interactuar a las ondas esfericas libres con un potencial dependiente del tiempo quese “enciende” lentamente (adiabaticamente), tal potencial generarıa las ondas parciales ϕk,l,m (r).

19.5.1. Ondas parciales en potenciales de rango finito

Supongamos que tenemos un potencial de rango finito r0 definido por

V (r) = 0 para r > r0 (19.104)

ya hemos concluıdo que las ondas esfericas libres ϕ(0)k,l,m (r) casi no penetran la zona interior a la esfera de radio

bl (k) dada por la Ec. (19.90). Esto implica que el potencial definido por (19.104) practicamente no influye sobrelos estados para los cuales

bl (k) ≫ r0 (19.105)

debido a que las ondas entrantes asociadas, retroceden antes de alcanzar la zona de influencia de V (r). Por tanto,para cada valor de la energıa existe un momento angular crıtico lM que de acuerdo con (19.90, 19.105) viene dadopor √

lM (lM + 1) ≃ kr0 (19.106)

de modo que los corrimientos de fase δl solo son apreciables para valores de l del orden de lM o menores. Esclaro que para potenciales de menor alcance, el valor de lM para una energıa incidente dada es menor. Ası mismo,

Page 484: Mecanica Cuantica: Notas de Clase

484 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

para un potencial dado, lM decrece a medida que decrece la energıa incidente. Por tanto, puede ocurrir que loscorrimientos de fase significativos sean solo aquellos que esten asociados a las primeras ondas parciales. Para muybajas energıas puede ser razonable incluır solo la onda s (i.e. l = 0), para energıas un poco mayores se incluirıanlas ondas parciales s y p (l = 0, 1) etc. Por esta razon, el metodo de ondas parciales adquiere su importanciapractica en un regimen de bajas energıas, que conduzca a un valor de lM no mucho mayor a la unidad. Cuandoesta condicion se cumple, pueden tomarse pocas ondas parciales en buena aproximacion, y el metodo es manejable.

Por otro lado, puesto que lM ∼ kr0 = 2πr0/λ, vemos que lM es del orden del cociente entre el rango r0 delpotencial y la longitud de onda de la partıcula incidente.

Finalmente, el argumento aquı presentado se puede extender al caso de potenciales de rango infinito si existealguna longitud caracterıstica luego de la cual el potencial se pueda considerar despreciable. Tal longitud carac-terıstica harıa las veces del rango r0, y la discusion anterior serıa valida aunque solo en forma aproximada. Estees el caso de la longitud r0 definida en la Ec. (18.73) Pag. 458, para el potencial de Yukawa.

19.5.2. Seccion eficaz en terminos de los corrimientos de fase δl

La informacion de la interaccion con el potencial de estados con momento angular bien definido esta guardadaen las fases δl. Ahora bien, si expresamos los estados estacionarios de dispersion ηk (r) en terminos de ondasparciales, podemos calcular la amplitud de scattering y la seccion eficaz con tal expansion. Como resultado, lainteraccion con el potencial se vera reflejada en la superposicion de los corrimientos de fase δl, presentes en laexpansion. Es importante mencionar que si existen estados acotados para la partıcula bajo el potencial V (r)(estados estacionarios de energıa negativa como en el atomo de hidrogeno), el conjunto de las ondas parcialesno constituira una base para expandir estos estados, ya que las ondas parciales solo abarcan estados de energıapositiva6. En tal caso, sera necesario anadir a las ondas parciales, funciones de onda de estados acotados.

Ya que los estados estacionarios de dispersion deben cumplir la condicion asintotica (18.26) Pag. 445, seranecesario verificar que la superposicion de ondas parciales que los genera cumple dicha condicion. Puesto que losestados estacionarios de dispersion ηk (r), son autoestados del Hamiltoniano, la expansion de ηk (r) solo involucraondas parciales con la misma energıa ~2k2/2µ, de modo que no hay suma sobre k. Por otro lado, si el potencial escentral el problema tiene simetrıa azimutal ya que es simetrico con respecto a la rotacion alrededor del eje OZ.Por tanto, solo contribuiran ondas parciales con m = 0. Con estas consideraciones, tal expansion toma la forma

ηk (r) =∞∑

l=0

clϕk,l,0 (r) (19.107)

ahora debemos encontrar los coeficientes cl. Comencemos considerando el caso en que V (r) = 0, de modo que

ηk (r) se reduce a la onda plana eikz, y las ondas parciales se reducen a ondas esfericas libres ϕ(0)k,l,m (r), en tal caso

la expansion (19.107) se convierte en la expansion (19.84)

η(0)k (r) = Ceikz =

C

k

√π

2

∞∑

l=0

il√

4π (2l + 1) ϕ(0)k,l,0 (r) (19.108)

para el potencial no nulo V (r), se debe incluir la onda esferica dispersada ademas de la onda plana. Por otrolado, hemos visto que en su comportamiento asintotico, la onda parcial ϕk,l,0 (r) descrita por (19.103), difiere de

la onda esferica libre ϕ(0)k,l,m (r) descrita por (19.92) solo por la presencia de una onda esferica saliente, que tiene

la misma dependencia radial que la onda dispersada. En consecuencia, es de esperarse que los coeficientes cl de laexpansion (19.107) sean identicos a los de la expansion (19.108) esto es

ηk (r) =C

k

√π

2

∞∑

l=0

il√

4π (2l + 1) ϕk,l,0 (r) (19.109)

6En tal sentido las ondas parciales no son una base de Er.

Page 485: Mecanica Cuantica: Notas de Clase

19.5. ONDAS PARCIALES EN EL POTENCIAL V (R) 485

esto tambien se puede ver con un argumento similar a los de las secciones 19.5, 18.5.1. Si tenemos una ondaplana cuya expansion viene dada por (19.108) y “encendemos” el potencial V (r) adiabaticamente, la onda plana

se transforma en la onda estacionaria de dispersion ηk (r). Similarmente, cada onda esferica libre ϕ(0)k,l,0 (r) se

transforma en la onda parcial ϕk,l,0 (r) cuando el potencial se activa, y teniendo en cuenta la linealidad de laecuacion de Schrodinger, se tiene que cuando el potencial se activa la expresion (19.108) se mantiene en la misma

forma reemplazando η(0)k (r) ≡ Aeikz por ηk (r) y cada onda esferica libre ϕ

(0)k,l,m (r) por la onda parcial ϕk,l,0 (r).

De esta forma obtenemos la expresion (19.109).Ahora debemos verificar que (19.109) cumpla con los requisitos de un estado estacionario de dispersion. En

primer lugar, puesto que cada onda parcial en la suma corresponde a un estado de energıa bien definida ytodos corresponden a la misma energıa ~2k2/2µ, tenemos que la superposicion continua siendo un autoestado delHamiltoniano i.e. un estado estacionario. Adicionalmente, debemos verificar que la expansion (19.109) cumple conlas condiciones asintoticas (18.26) Pag. 445, para estados estacionarios de dispersion. Para verlo, utilizaremos laEc. (19.103)

ηk (r) =C

k

√π

2

∞∑

l=0

il√

4π (2l + 1) ϕk,l,0 (r) ≃r→∞

−C∞∑

l=0

il√

4π (2l + 1) Yl,0 (θ)e−ikreil

π2 − eikre−il

π2 e2iδl

2ikr(19.110)

para examinar este lımite asintotico usaremos la identidad

e2iδl = 1 + 2ieiδl sin δl (19.111)

y separando los terminos que son independientes de δl se obtiene

ηk (r) ≃r→∞

−C∞∑

l=0

il√

4π (2l + 1) Yl,0 (θ)

[e−ikreil

π2 − eikre−il

π2

(1 + 2ieiδl sin δl

)

2ikr

]

ηk (r) ≃r→∞

−C∞∑

l=0

il√

4π (2l + 1) Yl,0 (θ)

[e−ikreil

π2 − eikre−il

π2

2ikr− 2ieikre−il

π2 eiδl sin δl

2ikr

]

ηk (r) ≃r→∞

−C∞∑

l=0

il√

4π (2l + 1) Yl,0 (θ)

[e−ikreil

π2 − eikre−il

π2

2ikr− 1

k

eikr

re−il

π2 eiδl sin δl

](19.112)

teniendo en cuenta las Ecs. (19.92, 19.84) la expresion (19.112) queda

ηk (r) ≃r→∞

C

k

√π

2

∞∑

l=0

il√

4π (2l + 1) ϕ(0)k,l,0 (r) + C

∞∑

l=0

il√4π (2l + 1) Yl,0 (θ)

1

k

eikr

re−il

π2 eiδl sin δl

ηk (r) ≃r→∞

C

k

√π

2

∞∑

l=0

il√

4π (2l + 1) ϕ(0)k,l,0 (r) + C

∞∑

l=0

(eiπ2

)l√4π (2l + 1) Yl,0 (θ)

1

k

eikr

re−il

π2 eiδl sin δl

ηk (r) ≃r→∞

Ceikz +eikr

r

C

k

∞∑

l=0

eilπ2

√4π (2l + 1) Yl,0 (θ) e

−il π2 eiδl sin δl

quedando finalmente

ηk (r) ≃r→∞

Ceikz +eikr

rfk (θ) ; fk (θ) ≡

C

k

∞∑

l=0

√4π (2l + 1) Yl,0 (θ) e

iδl sin δl (19.113)

con lo cual demostramos que la expansion (19.109) cumple con la condicion asintotica (18.26). Adicionalmente, laEc. (19.113) nos brinda la forma explıcita de la amplitud de dispersion fk (θ) en terminos de los corrimientos de

Page 486: Mecanica Cuantica: Notas de Clase

486 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

fase δl. Con la amplitud de dispersion podemos proceder a calcular la seccion eficaz diferencial a traves de la Ec.(18.44), Pag. 450

D (θ) =

∣∣∣∣1

Cfk (θ)

∣∣∣∣2

=1

k2

∣∣∣∣∣∞∑

l=0

√4π (2l + 1) Yl,0 (θ) e

iδl sin δl

∣∣∣∣∣

2

D (θ) =1

k2

∞∑

l=0

∞∑

l′=0

4π√

(2l + 1) (2l′ + 1) Y ∗l′,0 (θ)Yl,0 (θ) e

i(δl−δl′ ) sin δl sin δl′ (19.114)

y la seccion eficaz total la obtenemos integrando D (θ) sobre todo el angulo solido

σ =

∫dΩ D (θ) =

1

k2

∞∑

l=0

∞∑

l′=0

4π√

(2l + 1) (2l′ + 1) ei(δl−δl′) sin δl sin δl′∫dΩ Y ∗

l′,0 (θ)Yl,0 (θ)

σ =1

k2

∞∑

l=0

∞∑

l′=0

4π√

(2l + 1) (2l′ + 1) ei(δl−δl′ ) sin δl sin δl′ δll′

σ =4π

k2

∞∑

l=0

(2l + 1) sin2 δl (19.115)

notese que en virtud de la ortonormalidad de los armonicos esfericos, los terminos de interferencia asociados adiferentes momentos angulares y que estan presentes en la seccion eficaz diferencial (19.114), estan ausentes en laseccion eficaz total (19.115). Vemos ademas que para cualquier potencial central V (r), la contribucion asociada acada l a la seccion eficaz total es positiva

k2(2l + 1) sin2 δl ≥ 0

y tiene una cota superior para una energıa dada (k dado):

k2(2l + 1) sin2 δl ≤

k2(2l + 1) (19.116)

Vemos que las expresiones (19.114, 19.115) requieren conocer en principio todos los corrimientos de fase δl. En laseccion 19.5 vimos que si el potencial V (r) es conocido, estos corrimientos de fase se calculan de la ecuacion radialasociada (19.94). La ecuacion radial (19.94) debe ser solucionada para cada l por aparte. Por lo anterior, el metodode ondas parciales es atractivo en la practica cuando hay un numero suficientemente pequeno de corrimientos defase δl que adquieren un valor considerable y los demas son despreciables. En la seccion 19.5.1, vimos que parael caso de potenciales de rango finito, los corrimientos de fase δl son despreciables cuando l > lM , siendo lM unmomento angular crıtico dado por la formula (19.106), y que los argumentos allı discutidos se pueden extenderpara potenciales de rango infinito, siempre y cuando podamos definir un rango o alcance caracterıstico para lainteraccion.

Sin embargo, en muchos experimentos de dispersion, el potencial es desconocido y de hecho muchos experimen-tos se disenan para modelarlo. En tal caso, usualmente se procura reproducir las curvas experimentales de seccioneficaz diferencial a una energıa fija introduciendo un pequeno numero de corrimientos de fase δl. Con frecuenciala dependencia con θ de D (θ) sugiere el mınimo numero de fases a utilizar. Por ejemplo, si la seccion eficaz esaproximadamente isotropica, esto sugiere que solo la onda s (l = 0) contribuye significativamente, ya que Y00 esconstante. Una vez que determinamos las fases δl que contribuyen a diferentes valores de energıa, podemos buscarmodelos de potenciales que reproduzcan las fases para cada energıa dada. Es decir, las fases y su dependencia conla energıa.

La dependencia de la seccion eficaz con la energıa es tan importante como su dependencia angular. En algunoscasos se observa una rapida variacion de la seccion eficaz total cuando nos movemos en cierta vecindad del rango

Page 487: Mecanica Cuantica: Notas de Clase

19.5. ONDAS PARCIALES EN EL POTENCIAL V (R) 487

de energıa. Por ejemplo, si una de las fases δl toma el valor π/2 para E = E0, la contribucion asociada a σ adquieresu cota superior (ver Ec. 19.116), y la seccion eficaz puede mostrar un pico agudo en E = E0. Este fenomenose conoce como resonancia en la dispersion. Este fenomeno es similar a la resonancia en la transmision queocurre en una barrera de potencial unidimensional, como se discutio en la seccion 3.7.1, Pag. 177.

19.5.3. Dispersion por esfera rıgida

Ya vimos la dispersion clasica por esfera rıgida en la seccion 18.3.1, Pag. 440. Cuanticamente, la esfera rıgidade radio r0 la simulamos con el potencial

V (r) =

0 si r > r0∞ si r ≤ r0

este es un caso tıpico de potencial de rango finito (con rango r0) como se discutio en la seccion 19.5.1. Asumiremosque la energıa de la partıcula incidente es suficientemente pequena de modo que se cumple la condicion

kr0 ≪ 1 (19.117)

Combinando la condicion (19.117) con (19.106) vemos que lM ≪ 1, y debido al caracter discreto de l, se concluyeque lM = 0. Como consecuencia, podemos despreciar todos los corrimientos de fase δl, excepto el asociado a laonda s con l = 0. En tal caso, la amplitud de dispersion (19.113) viene dada por

fk (θ) =C

k

√4π Y0,0 (θ) e

iδ0 sin δ0

fk (θ) =C

keiδ0(k) sin δ0 (k)

y la seccion eficaz diferencial resulta isotropica

D (θ) =

∣∣∣∣1

Cfk (θ)

∣∣∣∣2

=1

k2sin2 δ0 (k)

por otro lado, la seccion eficaz total (19.115) queda en la forma

σ =4π

k2sin2 δ0 (k) (19.118)

solo nos queda calcular el corrimiento de fase δ0 (k), resolviendo la ecuacion radial (19.94) para l = 0

[d2

dr2+ k2

]uk,0 (r) = 0 para r > r0 (19.119)

ademas debe cumplirse la condicionuk,0 (r) = 0 para r ≤ r0 (19.120)

dado que el potencial es infinito para r ≤ r0 y por tanto la esfera de radio r0 centrada en el origen, es una esferade exclusion total [en particular se cumple la condicion uk,0 (0) = 0, requerida en la Ec. (19.95)]. Solo hay unasolucion linealmente independiente de las Ecs. (19.119, 19.120)

uk,0 (r) =

A sin (kr − kr0) para r > r00 para r ≤ r0

(19.121)

por definicion, el corrimiento de fase δ0 esta dado por la forma asintotica de uk,0 (r), Ec. (19.101), Pag. 482

uk,0 (r) ∼r→∞

A sin (kr + δ0) (19.122)

Page 488: Mecanica Cuantica: Notas de Clase

488 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

comparando (19.122) con la solucion (19.121) vemos que

δ0 (k) = −kr0 (19.123)

insertando (19.123) en (19.118) y teniendo en cuenta que kr0 ≪ 1, la seccion eficaz total queda

σ =4π

k2sin2 kr0 ≃

k2(kr0)

2

σ ≃ 4πr20 (19.124)

vemos que σ es independiente de la energıa, aunque debe mantenerse la condicion (19.117). Y es igual a cuatroveces la seccion transversal que ven las partıculas del haz (i.e. cuatro veces el resultado clasico Ec. 18.9). Ladesviacion con respecto al resultado clasico se debe a que en el caso cuantico estudiamos la evolucion de la ondaasociada a las partıculas incidentes, y el cambio abrupto de V (r) en r = r0, produce un fenomeno analogo a ladifraccion de una onda de luz. De hecho, el lımite (19.117) nos dice que la longitud de onda de las partıculasincidentes es mucho mayor que r0 de modo que en tal lımite el fenomeno es notoriamente ondulatorio, por lo cuales de esperarse una fuerte desviacion con respecto al resultado de partıcula clasica.

Se puede demostrar que en el lımite

kr0 ≫ 1 (19.125)

la seccion eficaz total toma el valor

σ ∼k→∞

2πr20 (19.126)

puesto que este lımite corresponde al caso en el cual la longitud de onda de las partıculas incidentes es despreciablecon respecto a r0, podrıa pensarse a priori que debe emularse el comportamiento corpuscular clasico. Sin embargo,la comparacion entre los resultados clasico (18.9) y cuantico (19.126) muestra que no es ası. Esto se debe al hechode que el potencial es discontınuo en r = r0 y por tanto varıa apreciablemente dentro de un intervalo mas pequenoque la longitud de onda de las partıculas (ver discusion en la seccion 3.4, Pag. 165), de modo que tambien semanifiesta fuertemente el caracter cuantico de la interaccion.

19.6. Colisiones con absorcion

Hasta ahora hemos trabajado colisiones elasticas en las cuales no cambia ni el numero ni la naturaleza de laspartıculas que se dispersan. Sin embargo, en la seccion 18.2 vimos que existe una amplia variedad de reaccionesque pueden ocurrir para que se genere creacion y/o destruccion de partıculas durante la dispersion. Con frecuenciaocurre que en los experimentos solo podemos detectar las partıculas dispersadas elasticamente. En tal caso, si ladispersion no es elastica observaremos que algunas partıculas del haz incidente “desaparecen”, de modo que no seencuentran ni en el haz transmitido ni entre las partıculas elasticamente dispersadas. Se dice que estas partıculashan sido absorbidas durante la colision. En esta seccion estudiaremos el proceso de absorcion en el contexto massimple posible, en el cual no nos enfocamos en las reacciones detalladas que ocurren, sino que nos concentramosen la absorcion global, vista como la diferencia entre las partıculas incidentes y las detectadas. Veremos que elmetodo de ondas parciales es muy conveniente para esta descripcion.

Supondremos que la interaccion responsable de la desaparicion de las partıculas incidentes, es invariante bajorotaciones con respecto al origen O. Por tanto, la amplitud de dispersion podra siempre descomponerse en ondasparciales cada una de ellas asociada a un momento angular bien definido7.

En la seccion 19.5, interpretamos las ondas parciales diciendo que una onda entrante libre penetra la region dedispersion en la cual se ve perturbada por el potencial. Posteriormente, se genera la onda saliente que naturalmentedebe estar modificada con respecto a la que se obtendrıa en ausencia de potencial. El efecto neto del potencialsobre la onda saliente es un corrimiento de fase 2δl con respecto al caso de ondas esfericas libres. Vemos que al

7Si el potencial no es central, no hay una base comun de vectores propios de H, L2 y L3.

Page 489: Mecanica Cuantica: Notas de Clase

19.6. COLISIONES CON ABSORCION 489

multiplicar la onda saliente libre por e2iδl (que es como se obtiene la onda saliente con potencial), no se alterala amplitud de esta y por tanto la onda saliente tiene la amplitud de la entrante, ya que tal factor tiene modulounidad (ver Ec. 19.98, Pag. 482). Esto implica que el flujo total de la onda entrante es igual al de la onda saliente,con lo cual la probabilidad se conserva durante la dispersion y por tanto el numero de partıculas es constante.

La discusion anterior sugiere que los procesos de absorcion se pueden incluır introduciendo un factor de la formae2iδl de modulo menor que la unidad, para lo cual serıa necesario que δl ya no sea una fase real sino compleja

δl = αl + iβl ⇒ e2iδl = e2i(αl+iβl) = e−2βle2iαl

siendo αl y βl numeros reales. Para que∣∣e2iδl

∣∣ < 1 es necesario que βl (la parte imaginaria de δl) sea positiva.Con esto la amplitud de la onda saliente con momento angular l, es mas pequena que la de la onda entrante dela cual se origina. Esto se traduce en una disminucion del flujo de probabilidad saliente con respecto al flujo deprobabilidad entrante que expresa la “desaparicion” de algunas de las partıcula incidentes.

Con base en las anteriores consideraciones calcularemos las secciones eficaces de dispersion y absorcion. Sinembargo, este es un acercamiento puramente fenomenologico, y los parametros con los cuales describimos laabsorcion (modulo de e2iδl para cada onda parcial l) solo nos dan cuenta del fenomeno de absorcion en formaglobal. Si por ejemplo se pueden detectar las partıculas de naturaleza distinta a las incidentes, es posible obtenerinformacion sobre las reacciones especıficas que ocurren en el proceso de colision. En este ultimo caso, el presenteformalismo no es adecuado. De hecho, el formalismo cuantico seguido a lo largo de todo el texto, no es el masadecuado para tratar problemas en donde la probabilidad no se conserva. Para tales problemas es mucho masadecuado el uso de la teorıa cuantica de campos.

19.6.1. Seccion eficaz en procesos absortivos

Para dar cuenta de las posibles reacciones diferentes a la dispersion elastica, retornaremos a los calculosrealizados en la seccion 19.5.2, en donde definiremos

ξl ≡ e2iδl ; |ξl| ≤ 1 (19.127)

donde la condicion sobre el modulo nos dara cuenta del fenomeno absortivo. En el lımite elastico este modulo seraigual a la unidad. Tomando la forma asintotica del estado estacionario de dispersion ηk (r), bajo el potencial V (r)ecuacion (19.110) Pag. 485, en terminos de ξl tenemos

ηk (r) ∼r→∞

−C∞∑

l=0

il√

4π (2l + 1) Yl,0 (θ)e−ikreil

π2 − ξle

ikre−ilπ2

2ikr(19.128)

la identidad (19.111) continua siendo valida para δl complejo, y por tanto la amplitud de dispersion fk (θ) continuasiendo la indicada en (19.113) que en terminos de ξl se escribe

fk (θ) ≡ C

k

∞∑

l=0

√4π (2l + 1) Yl,0 (θ) e

iδl sin δl =C

k

∞∑

l=0

√4π (2l + 1) Yl,0 (θ)

e2iδl − 1

2i

fk (θ) =C

k

∞∑

l=0

√4π (2l + 1) Yl,0 (θ)

ξl − 1

2i(19.129)

con lo cual se obtiene la seccion eficaz diferencial para la parte elastica del proceso, la cual viene dada por

Del (θ) =

∣∣∣∣fk (θ)

C

∣∣∣∣2

=1

4k2

∣∣∣∣∣∞∑

l=0

√4π (2l + 1) Yl,0 (θ) (ξl − 1)

∣∣∣∣∣

2

(19.130)

Page 490: Mecanica Cuantica: Notas de Clase

490 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

y la seccion eficaz total elastica sera

σel =

ΩDel (θ) dΩ =

1

4k2

∞∑

l=0

∞∑

l′=0

√4π (2l + 1)

√4π (2l′ + 1) (ξl − 1) (ξ∗l′ − 1)

ΩYl,0 (θ)Y

∗l′,0 (θ) dΩ

k2

∞∑

l=0

∞∑

l′=0

√(2l + 1) (2l′ + 1) (ξl − 1) (ξ∗l′ − 1) δll′

quedando finalmente

σel =π

k2

∞∑

l=0

(2l + 1) |1− ξl|2 (19.131)

de acuerdo con nuestra discusion, la absorcion de la onda l, alcanza su maximo cuando ξl = 0. Sin embargo, laEc. (19.131) nos indica que aun en este lımite, la onda l contribuye a la seccion eficaz elastica. Es decir, inclusosi la region de interaccion es perfectamente absorbente, produce dispersion elastica. Este fenomeno es analogo alcomportamiento de una onda luminosa que incide en un medio absorbente. Incluso si la absorcion es total (porejemplo una esfera o disco perfectamente negros) se observa una onda difractada concentrada en un angulo solidoque disminuye a medida que la superficie del disco aumenta. Este fenomeno no tiene analogo en la dispersionclasica de partıculas ya que depende del comportamiento ondulatorio de estas. La dispersion elastica producidapor una interaccion totalmente absorbente se denomina dispersion de sombra.

Ahora bien, ası como se definio la seccion eficaz de dispersion como un cociente entre numero de partıculasdispersadas por unidad de tiempo y flujo incidente, definiremos la seccion eficaz de absorcion como el cocienteentre el numero de partıculas absorbidas por unidad de tiempo y el flujo incidente.

Para calcular esta seccion eficaz calcularemos la cantidad total de probabilidad ∆P que “desaparece” porunidad de tiempo, la cual es proporcional a la cantidad total de partıculas incidentes que “desaparecen” porunidad de tiempo. Esta probabilidad se puede obtener a traves de la densidad de corriente J asociada con lafuncion de onda (19.128). La cantidad ∆P corresponde a la diferencia entre el flujo de la onda entrante atravesde una esfera S de radio muy grande R0 y la de la onda saliente sobre la misma superficie. Por tanto, ∆P es iguala menos el flujo neto del vector J que sale de la esfera8

∆P = −∫

J · dS ; J = Re

[η∗k (r)

~

iµ∇ηk (r)

]

puesto que para la esfera de radio muy grande R0 se tiene que dS = R20dΩ ur, entonces solo la componente radial

de la corriente Jr contribuye a la integral. Tendremos entonces que

∆P = −∫

r=R0

Jr r2dΩ ; Jr = Re

[η∗k (r)

~

∂rηk (r)

]

teniendo en cuenta que R0 corresponde a radio muy grande, podemos usar el lımite asintotico (19.128) y tenemos

8El signo menos se debe a que el diferencial de superficie se define hacia afuera de la esfera y nos interesa medir el flujo neto haciaadentro.

Page 491: Mecanica Cuantica: Notas de Clase

19.6. COLISIONES CON ABSORCION 491

que

Jr = 4π |C|2∞∑

l,l′=0

√(2l + 1)

√(2l′ + 1) Y ∗

l,0 (θ)Yl′,0 (θ)

×Re

(eikre−il

π2 − ξ∗l e

−ikreilπ2

)

(−2ikr)

~

∂r

(e−ikreil

′ π2 − ξl′e

ikre−il′ π2

2ikr

)

Jr =π~ |C|2k2µ

∞∑

l,l′=0

√(2l + 1) (2l′ + 1)Y ∗

l,0 (θ)Yl′,0 (θ)Ml,l′ (r)

Ml,l′ (r) ≡ Re

[1

r

(eikre−il

π2 − ξ∗l e

−ikreilπ2

) ∂

∂r

(e−ikreil

′ π2 − ξl′e

ikre−il′ π2

ir

)](19.132)

al realizar la integral sobre el angulo solido y usar la ortonormalidad de los armonicos esfericos queda

∆P = −∫

r=R0

Jr r2dΩ = −π~ |C|2

k2µ

∞∑

l,l′=0

√(2l + 1) (2l′ + 1) R2

0Ml,l′ (R0)

ΩY ∗l,0 (θ)Yl′,0 (θ)dΩ

∆P = −π~ |C|2k2µ

∞∑

l=0

(2l + 1) R20Ml,l (R0) (19.133)

de modo que solo tenemos que calcular Ml,l (r) de la Ec. (19.132)

Ml,l (r) = Re Hl,l (r)

Hl,l (r) =1

r

(eikre−il

π2 − ξ∗l e

−ikreilπ2

) ∂

∂r

(e−ikreil

π2 − ξle

ikre−ilπ2

ir

)

=1

r

(eikre−il

π2 − ξ∗l e

−ikreilπ2

)(−ik e

−ikreilπ2 + ξle

ikre−ilπ2

ir− e−ikreil

π2 − ξle

ikre−ilπ2

ir2

)

=1

r2

(eikre−il

π2 − ξ∗l e

−ikreilπ2

)−k

(e−ikreil

π2 + ξle

ikre−ilπ2

)+ i

(e−ikreil

π2 − ξle

ikre−ilπ2

)

r

=k

r2

(ξ∗l e

−ikreilπ2 − eikre−il

π2

)(e−ikreil

π2 + ξle

ikre−ilπ2

)

+i

r3

(eikre−il

π2 − ξ∗l e

−ikreilπ2

)(e−ikreil

π2 − ξle

ikre−ilπ2

)

=k

r2

[ξ∗l e

−2ikreilπ + |ξl|2 − 1− ξle2ikre−ilπ

]+

i

r3

[1− ξle

2ikre−ilπ − ξ∗l e−2ikreilπ + |ξl|2

]

Hl,l (r) =k

r2

[−2i Im

(ξle

2ikre−ilπ)+ |ξl|2 − 1

]+

i

r3

[1 + |ξl|2 − 2Re

(ξle

2ikre−ilπ)]

tomando la parte real de Hl,l (r) queda

Ml,l (r) = Re Hl,l (r) =k

r2

[|ξl|2 − 1

](19.134)

sustituyendo (19.134) en (19.133) resulta

∆P = −π~ |C|2k2µ

∞∑

l=0

(2l + 1) R20

k

R20

[|ξl|2 − 1

]

∆P =~k |C|2µ

π

k2

∞∑

l=0

(2l + 1)[1− |ξl|2

](19.135)

Page 492: Mecanica Cuantica: Notas de Clase

492 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

la seccion eficaz total de absorcion σabs es por tanto la probabilidad por unidad de tiempo ∆P, dividida por lacorriente incidente ~k |C|2 /µ

σabs =π

k2

∞∑

l=0

(2l + 1)[1− |ξl|2

](19.136)

vemos que si |ξl| = 1 para cada l, la seccion eficaz total de absorcion es cero. De acuerdo con (19.127), estocorresponde al caso en el cual todos los corrimientos de fase δl son reales y por tanto la dispersion es completamenteelastica, en cuyo caso el flujo neto de probabilidad que sale de la esfera de radio R0 es cero. La probabilidad totaltransportada por la onda entrante es totalmente transferida a la onda saliente (no hay “perdida” de probabilidad,y por tanto la probabilidad se conserva).

Notese que si ξl = 0, la contribucion de la onda parcial (l) a la seccion eficaz de absorcion es maxima. En estecaso, el calculo de (19.135) nos muestra que la expresion

∆Pl ≡~k |C|2µ

π

k2(2l + 1)

es la cantidad de probabilidad entrante por unidad de tiempo, que surge de la onda parcial (l). Si dividimos estacantidad por la corriente incidente ~k |C|2 /µ, obtenemos una superficie denominada seccion eficaz entrantepara la onda parcial (l).

σl =π

k2(2l + 1) (19.137)

la expresion (19.137) posee un analogo semi-clasico interesante. Podemos considerar que la onda incidente planadescribe un haz de partıculas de densidad uniforme9, con momento ~ku3. ¿Que proporcion de estas partıculas al-canzan el potencial dispersor con momento angular

√l (l + 1)~?. Para verlo usaremos la relacion entre el momento

angular y el parametro de impacto en mecanica clasica Ec. (19.91)

‖L‖ = b ‖p‖ = ~kb

si pintamos un anillo circular centrado en O y perpendicular al eje OZ, de radio interior bl−∆bl/2 y radio exteriorbl + ∆bl/2, podemos ver que una partıcula con momento angular ~

√l (l + 1) tendrıa parametro de impacto bl

dado por~√l (l + 1) = ~kbl (19.138)

el anillo tiene radio promedio bl y ancho ∆bl correspondiente a ∆l = 1 (debido a la cuantizacion del numerocuantico l) en la expresion (19.138). Todas las partıculas que cruzan esta superficie alcanzan el potencial dispersorcon un momento angular dado por ~

√l (l + 1) dentro de ~ [es decir dentro del intervalo (l − 1, l + 1)]. De la Ec.

(19.138) podemos ver que10

bl =1

k

√l (l + 1) ≃ 1

k

(l +

1

2

)si l ≫ 1 (19.139)

y por tanto

∆bl =bl+1 − bl−1

2=

1

2

1

k

[(l + 1) +

1

2

]− 1

k

[(l − 1) +

1

2

]

∆bl =1

k9Sin embargo debe tenerse cuidado con la analogıa, ya que cuanticamente la onda plana representa una sola partıcula, cuyo estado

se describe como la superposicion de muchas ondas parciales.10Si hacemos x = l−1 y usamos la expansion

√1

x

(1

x+ 1

)=

1

x+

1

2− 1

8x+

1

16x2 + . . .

para x << 1, obtenemos (19.139).

Page 493: Mecanica Cuantica: Notas de Clase

19.6. COLISIONES CON ABSORCION 493

el area del anillo circular es por tanto

∆A ≃ 2πbl ∆bl ≃ 2π1

k

(l +

1

2

)1

k

∆A ≃ π

k2(2l + 1)

con lo cual encontramos de nuevo σl en forma simple.

19.6.2. Teorema optico

Cuando una colision da lugar a diversas reacciones o fenomenos de dispersion, la seccion eficaz total σtot sedefine como la suma de las secciones eficaces (integradas sobre todas las direcciones del espacio) correspondientesa todos estos procesos. La seccion eficaz total es entonces el numero de partıculas por unidad de tiempo queparticipan en una u otra de las posibles reacciones, dividida por el flujo incidente. En el presente contexto, hemostratado todas las reacciones en forma global de modo que la seccion eficaz total es la suma de la seccion eficazelastica mas la absortiva

σtot = σel + σabs

de las Ecs. (19.131, 19.136) se obtiene

σtot =π

k2

∞∑

l=0

(2l + 1)|1− ξl|2 +

[1− |ξl|2

]

teniendo en cuenta que

|1− ξl|2 +[1− |ξl|2

]= (1− ξl) (1− ξ∗l ) + 1− |ξl|2 = 1− ξ∗l − ξl + |ξl|2 + 1− |ξl|2

|1− ξl|2 +[1− |ξl|2

]= 2− 2Re ξl

se obtiene

σtot =2π

k2

∞∑

l=0

(2l + 1) (1−Re ξl) =2π

k2

∞∑

l=0

(2l + 1)Re (1− ξl) (19.140)

Por otro lado, teniendo en cuenta que

Yl,0 (0) =

√2l + 1

4π(19.141)

podemos calcular la amplitud de dispersion elastica Ec. (19.129), en la direccion frontal (θ = 0).

fk (0) =C

k

∞∑

l=0

√4π (2l + 1) Yl,0 (0)

ξl − 1

2i=C

k

∞∑

l=0

√4π (2l + 1)

√2l + 1

Reξl + i Imξl − 1

2i

fk (0) =C

k

∞∑

l=0

(2l + 1)−iRe ξl + Imξl + i

2=C

k

∞∑

l=0

(2l + 1)Imξl + i (1−Re ξl)

2

la parte imaginaria de la amplitud de dispersion elastica en la direccion frontal, estara dada por

Imfk (0) =C

k

∞∑

l=0

(2l + 1)1−Re ξl

2(19.142)

al comparar (19.142) con la Ec. (19.140) nos da

σtot =4π

CkImfk (0)

Page 494: Mecanica Cuantica: Notas de Clase

494 CAPITULO 19. TEORIA CUANTICA DE LA DISPERSION II: ONDAS PARCIALES

esta relacion entre la seccion eficaz total y la parte imaginaria de la amplitud de dispersion elastica en la direccionfrontal es valida en un contexto muy general y se conoce como teorema optico.

Es claro que el teorema optico es valido en el caso especial de dispersion puramente elastica en el cual σabs = 0y σtot = σel. En este caso el hecho de que fk (0) (y por tanto la onda dispersada en la direccion frontal) esterelacionada con la seccion eficaz total se puede deducir de los argumentos de la seccion 18.6. En la direccionfrontal, tenemos una interferencia entre la onda plana incidente y la onda dispersada, tal interferencia nos dacuenta de la atenuacion del haz transmitido, debido a la dispersion de partıculas en todas las direcciones delespacio.

Page 495: Mecanica Cuantica: Notas de Clase

Capıtulo 20

Teorıa estacionaria de perturbaciones

La ecuacion de Schrodinger para sistemas conservativos se resuelve por medio de la ecuacion de valores propiosdel Hamiltoniano. Existen algunos problemas que involucran Hamiltonianos independientes del tiempo que sepueden resolver analıticamente en forma exacta, como ocurre con el oscilador armonico y el atomo de Hidrogeno.Sin embargo, son pocos los problemas que en la practica se pueden resolver analıticamente en forma exacta. Porejemplo, el atomo de Helio que consta de dos electrones no tiene solucion analıtica exacta, y menos aun los atomosde mas electrones. Cuando al atomo de Hidrogeno se le agregan las correcciones relativistas, tampoco se puederesolver el problema en forma exacta.

Por esta razon, suele recurrirse a los metodos numericos computacionales. No obstante, existen algunos metodosanalıticos para resolver el problema de valores propios. En este capıtulo estudiaremos uno de estos metodosconocido como teorıa estacionaria de perturbaciones.

Este metodo se basa en una estrategia segun la cual comenzamos estudiando los efectos principales o dominantessobre el sistema fısico. Una vez que entendemos estos efectos, procedemos a enfocarnos en efectos mas pequenosque fueron despreciados en la primera aproximacion. Es en el tratamiento de estos efectos secundarios en elque la teorıa de perturbaciones entra en accion. En capıtulos subsecuentes veremos aplicaciones de la teorıa deperturbaciones en fısica atomica y molecular.

20.1. Descripcion del problema

La teorıa de perturbaciones es aplicable cuando el Hamiltoniano H del sistema bajo estudio tiene la forma

H = H0 +W (20.1)

en dondeH0 es el Hamiltoniano “no perturbado” que da cuenta de los efectos principales y cuyos valores y vectorespropios son conocidos. El termino W conocido como la “perturbacion” se asume mucho mas pequeno que H0,lo cual significa que en la base de autoestados de H0, los elementos matriciales de W son mucho mas pequenosque los de H0. De hecho, veremos mas adelante que se requiere una condicion mas fuerte, y es que los elementosde matriz de W deben ser mucho menores que las diferencias entre los autovalores de H0 correspondientes. Parahacer mas explıcita esta “pequenez” escribiremos

W = λW ; λ≪ 1. (20.2)

siendo λ un parametro adimensional mucho menor que 1, y el operador W tiene elementos matriciales comparablesa los de H0. En nuestra presente formulacion asumiremos que tanto H0 como W son independientes del tiempo,razon por la cual hablamos de teorıa estacionaria de perturbaciones. La idea es encontrar la forma en que Wcambia los niveles de energıa y los estados estacionarios del sistema. La teorıa de perturbaciones consistira enexpandir estas cantidades en potencias de λ, conservando solo las primeras potencias. Consideraremos que los

495

Page 496: Mecanica Cuantica: Notas de Clase

496 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

niveles de energıa E0p asociados a H0 son conocidos y discretos, ası como los estados estacionarios

∣∣ϕip⟩

H0

∣∣ϕip⟩= E0

p

∣∣ϕip⟩

y los estados estacionarios de H0 son ortonormales y completos

〈ϕip∣∣ϕjn⟩= δpnδij ;

p

i

∣∣ϕip⟩ ⟨ϕip∣∣ = 1

sustituyendo (20.2) en (20.1) podemos considerar al Hamiltoniano H “de perturbacion” como una funcion contınuadel parametro λ, el cual regula la intensidad de la perturbacion

H (λ) = H0 + λW (20.3)

es obvio que H (λ = 0) = H0. Los autovalores perturbados E dependen de λ, y es claro que para λ = 0, el valorpropio E (λ) debe coincidir con algun valor propio de H0, digamos E0

n. El valor propio perturbado E (λ) puedecomportarse de diversas formas con respecto a λ. Por ejemplo, supongamos que un valor propio E0

n de H0 esdegenerado, y esta asociado a los estados

∣∣ϕin⟩. Si “prendemos” de forma contınua la perturbacion aumentando

contınuamente el parametro λ desde cero, es posible que la degeneracion se levante total o parcialmente, de maneraque varios niveles distintos de energıa E (λ) surgen a partir de E0

n cuando se incrementa λ desde cero (ver Fig.20.1). En la Fig. 20.1 se muestra que tambien es posible que la degeneracion se mantenga de modo que no seseparan varias curvas a partir de E0

n cuando se incrementa λ. Adicionalmente, la Fig. 20.1 muestra que puedeocurrir que las curvas que parten desde distintos niveles de energıa no perturbados E0

n y E0p se corten en algun

punto fijo λ1, en cuyo caso es la perturbacion la que esta generando una degeneracion.

Figura 20.1: Comportamiento de E (λ) con respecto a λ para diferentes valores del nivel no perturbado. Las curvasque parten de los niveles E0

1 y E02 corresponden a estados no degenerados. La curva de E0

3 , corresponde a un nivelno perturbado doblemente degenerado, cuya degeneracion se levanta para λ 6= 0 por efecto de la perturbacion. Elnivel asociado a E0

4 es doblemente degenerado y la perturbacion conserva la degeneracion. Vemos ademas que doscurvas asociadas a E0

2 y E03 se cruzan en λ = λ1 produciendo una degeneracion accidental.

Dado que H (λ) es un observable, el conjunto de todos sus kets propios linealmente independientes sera unabase para el espacio de estados. Cuando λ→ 0 todas las cantidades tienden a sus valores no perturbados.

Page 497: Mecanica Cuantica: Notas de Clase

20.2. SOLUCION APROXIMADA PARA LOS VALORES PROPIOS DE H (λ) 497

20.2. Solucion aproximada para los valores propios de H (λ)

La ecuacion de valores propios perturbada es

H (λ) |ψ (λ)〉 = E (λ) |ψ (λ)〉 (20.4)

asumiremos que E (λ) y |ψ (λ)〉 se pueden expandir en potencias de λ, de la forma

E (λ) = ε0 + λε1 + λ2ε2 + . . .+ λqεq + . . . (20.5)

|ψ (λ)〉 = |0〉+ λ |1〉+ λ2 |2〉+ . . .+ λq |q〉+ . . . (20.6)

por supuesto es necesario garantizar la convergencia de estas series. En la practica, estas series convergen rapida-mente para una gran cantidad de problemas fısicos siempre que λ ≪ 1. Si sustituımos estas expansiones al igualque la definicion (20.3) en la ecuacion de valores propios perturbada (20.4) tenemos que

(H0 + λW

)

∞∑

q=0

λq |q〉

=

[ ∞∑

m=0

λmεm

]

∞∑

q=0

λq |q〉

(20.7)

ahora bien, esta ecuacion debe ser valida para λ pequeno pero por lo demas arbitrario. Por tanto, debemos igualarcoeficientes asociados a la misma potencia en la Ec. (20.7). En la practica, nos interesa simplificar el problematomando solo algunos terminos en las series dadas en la Ec. (20.7). Puesto que se deben igualar coeficientesasociados a potencias iguales de λ en ambos miembros de la Ec. (20.7), es necesario asegurarse de incluir todaslas contribuciones que se generan para cada potencia de λ. Si nos interesa incluir los terminos hasta un potenciaλp, entonces debemos convertir cada serie de (20.7) en una sumatoria desde q = 0 hasta q = p, y al realizar lasmultiplicaciones no se consideraran los terminos con potencias mayores a p.

De las anteriores consideraciones, si queremos calcular las contribuciones a orden cero (para potencias hastaλ0) debemos reemplazar las series en (20.7) por las sumatorias1

H0

0∑

q=0

λq |q〉

=

[0∑

m=0

λmεm

]

0∑

q=0

λq |q〉

H0 |0〉 = ε0 |0〉 a orden cero en λ (20.8)

a primer orden en λ, la Ec. (20.7) queda en la forma

(H0 + λW

)

1∑

q=0

λq |q〉

=

[1∑

m=0

λmεm

]

1∑

q=0

λq |q〉

(H0 + λW

)[|0〉+ λ |1〉] = [ε0 + λε1] [|0〉+ λ |1〉]

H0 |0〉+ λH0 |1〉+ λW |0〉+O(λ2)

= ε0 |0〉+ λε1 |0〉+ λε0 |1〉+O(λ2)

donde O(λ2)denota terminos de orden cuadratico en λ o mayor. A primer orden en λ tenemos entonces

H0 |0〉 − ε0 |0〉+ λH0 |1〉 − λε0 |1〉+ λW |0〉 − λε1 |0〉 = 0 , a primer orden en λ

λH0 |1〉 − λε0 |1〉+ λW |0〉 − λε1 |0〉 = 0 , a primer orden en λ

(H0 − ε0) |1〉+(W − ε1

)|0〉 = 0 , a primer orden en λ (20.9)

1Ası mismo, el Hamiltoniano H0 + λW a orden cero es simplemente H0, ya que el otro termino es de primer orden en λ.

Page 498: Mecanica Cuantica: Notas de Clase

498 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

donde hemos usado la expresion (20.8) a orden cero. En el metodo perturbativo, es importante que las condicionesque impongamos sean validas en cada orden, por esta razon asumimos que la condicion (20.8) obtenida a ordencero, sigue siendo valida a primer orden. Para la aproximacion de segundo orden la Ec. (20.7) queda

(H0 + λW

)

2∑

q=0

λq |q〉

=

[2∑

m=0

λmεm

]

2∑

q=0

λq |q〉

(H0 + λW

) [|0〉+ λ |1〉+ λ2 |2〉

]=

[ε0 + λε1 + λ2ε2

] [|0〉+ λ |1〉+ λ2 |2〉

]

H0 |0〉+ λH0 |1〉+ λ2H0 |2〉+ λW |0〉+ λ2W |1〉+O(λ3)

= ε0 |0〉+ λε1 |0〉+ λ2ε2 |0〉+ λε0 |1〉+λ2ε1 |1〉+ λ2ε0 |2〉+O

(λ3)

a segundo orden en λ resulta entonces

[(H0 − ε0) |0〉] + λ[(H0 − ε0) |1〉+

(W − ε1

)|0〉]+ λ2

(H0 − ε0) |2〉+

(W − ε1

)|1〉 − ε2 |0〉

= 0 (20.10)

una vez mas tenemos en cuenta que las expresiones obtenidas a orden cero y uno, tambien deben ser validas asegundo orden2. Por tanto, los terminos entre parentesis cuadrados se anulan en virtud de las ecuaciones (20.8,20.9), quedando

(H0 − ε0) |2〉+(W − ε1

)|1〉 − ε2 |0〉 = 0 ; a segundo orden en λ (20.11)

el lector puede comprobar que a un orden arbitrario q en λ se obtiene la ecuacion

(H0 − ε0) |q〉+(W − ε1

)|q − 1〉 − ε2 |q − 2〉 . . .− εq |0〉 = 0 ; q − esimo orden en λ (20.12)

En este contexto estudiaremos las contribuciones hasta de segundo orden en λ. Puesto que la ecuacion (20.4)solo define a los kets |ψ (λ)〉 dentro de un factor constante, fijaremos su valor exigiendo que todos los |ψ (λ)〉 estennormalizados. Adicionalmente, escogeremos su fase de tal modo que se cumpla la condicion

〈0 |ψ (λ)〉 ∈ R (20.13)

es decir elegimos que |ψ (λ)〉 este en fase con |0〉 para todo λ. De nuevo la relacion (20.13) ası como la condicionde normalizacion, deben ser validas a todos los ordenes en teorıa de perturbaciones. En particular, a orden cero laEc. (20.6) implica que |ψ (λ)〉 ≃ |0〉, de modo que la condicion de normalizacion de |ψ (λ)〉 a orden cero requiereque el ket |0〉 este normalizado

‖|0〉‖2 = 〈0 |0〉 = 1 (20.14)

sin embargo, la fase de |0〉 aun permanece arbitraria. Mas adelante veremos como fijar la fase de este ket. Deacuerdo con la Ec. (20.6), a primer orden la norma al cuadrado de |ψ (λ)〉 esta dada por

‖|ψ (λ)〉‖2 = 〈ψ (λ) |ψ (λ)〉 = [〈0|+ λ 〈1|] [|0〉+ λ |1〉] +O(λ2)

= 〈0 |0〉+ λ [〈0 |1〉+ 〈1 |0〉] +O(λ2)

usando (20.14) vemos que |ψ (λ)〉 estarıa normalizado a primer orden si

〈0 |1〉+ 〈1 |0〉 = 0 (20.15)

Ahora aplicamos la convencion de fases (20.13) a primer orden

〈0| [|0〉+ λ |1〉] = 〈0 |0〉+ λ 〈0| 1〉 = 1 + λ 〈0| 1〉 ∈ R

2Alternativamente podemos decir que un serie de potencias en λ solo puede ser cero para λ arbitrario, si los coeficientes de cadapotencia de λ son cero. Por tanto los coeficientes asociados a λ0, λ y λ2 en la Ec. (20.10) deben ser cada uno igual a cero.

Page 499: Mecanica Cuantica: Notas de Clase

20.2. SOLUCION APROXIMADA PARA LOS VALORES PROPIOS DE H (λ) 499

y puesto que λ es real, 〈0 |1〉 es real de modo que 〈0 |1〉 = 〈1 |0〉. Este hecho junto con la Ec. (20.15) nos da

〈0 |1〉 = 〈1 |0〉 = 0 (20.16)

para segundo orden podemos hacer un procedimiento similar

‖|ψ (λ)〉‖2 = 〈ψ (λ) |ψ (λ)〉 =[〈0|+ λ 〈1|+ λ2 〈2|

] [|0〉+ λ |1〉+ λ2 |2〉

]+O

(λ3)

= 〈0 |0〉+ λ [〈0 |1〉+ 〈1 |0〉] + λ2 [〈2 |0〉+ 〈0 |2〉+ 〈1 |1〉] +O(λ3)

aplicando las Ecs. (20.14, 20.16) (que son producto de la exigencia de normalizacion de |ψ (λ)〉 y convencion defase a orden cero y uno) nos da

‖|ψ (λ)〉‖2 = 1 + λ2 [〈2 |0〉+ 〈0 |2〉+ 〈1 |1〉] +O(λ3)

la convencion de fase (20.13) a segundo orden junto con la Ec. (20.16) nos llevan a

〈0|[|0〉+ λ |1〉+ λ2 |2〉

]= 〈0 |0〉+ λ 〈0| 1〉+ λ2 〈0| 2〉 = 1 + λ2 〈0| 2〉 ∈ R

y puesto que λ es real, se tiene que 〈0| 2〉 es real. Esto junto con la exigencia de normalizacion para |ψ (λ)〉 asegundo orden, nos da

〈2 |0〉 = 〈0 |2〉 ; 〈2 |0〉+ 〈0 |2〉+ 〈1 |1〉 = 0 ⇒〈2 |0〉 = 〈0 |2〉 = −1

2〈1 |1〉 (20.17)

y a orden q se obtiene la condicion

〈0 |q〉 = 〈q |0〉 = −1

2[〈q − 1 |1〉+ 〈q − 2 |2〉+ . . .+ 〈2 |q − 2〉+ 〈1 |q − 1〉] (20.18)

En resumen, si tenemos un Hamiltoniano dado por

H = H0 +W ≡ H0 + λW (20.19)

La ecuacion de valores propios perturbada es

H (λ) |ψ (λ)〉 = E (λ) |ψ (λ)〉 (20.20)

y si asumimos que el espectro E (λ) y los kets propios |ψ (λ)〉 de H se pueden expandir como una serie de potenciasen λ

E (λ) = ε0 + λε1 + λ2ε2 + . . .+ λqεq + . . . =∞∑

q=0

λqεq (20.21)

|ψ (λ)〉 = |0〉+ λ |1〉+ λ2 |2〉+ . . .+ λq |q〉+ . . . =

∞∑

q=0

λq |q〉 (20.22)

las ecuaciones perturbativas a diversos ordenes en λ viene dadas por

H0 |0〉 = ε0 |0〉 , orden cero en λ (20.23)

(H0 − ε0) |1〉+(W − ε1

)|0〉 = 0 , primer orden en λ (20.24)

(H0 − ε0) |2〉+(W − ε1

)|1〉 − ε2 |0〉 = 0 , segundo orden en λ (20.25)

(H0 − ε0) |q〉+(W − ε1

)|q − 1〉 − ε2 |q − 2〉 . . .− εq |0〉 = 0 ; q − esimo orden en λ (20.26)

Page 500: Mecanica Cuantica: Notas de Clase

500 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

ası mismo se exige que |ψ (λ)〉 este normalizado y que cumpla la convencion de fase

〈0 |ψ (λ)〉 ∈ R (20.27)

la exigencia de que tanto la normalizacion como la convencion de fase deben cumplirse a cada orden en teorıa deperturbaciones, nos lleva a las siguientes condiciones

‖|0〉‖2 = 〈0 |0〉 = 1 (20.28)

〈0 |1〉 = 〈1 |0〉 = 0 (20.29)

〈2 |0〉 = 〈0 |2〉 = −1

2〈1 |1〉 (20.30)

〈0 |q〉 = 〈q |0〉 = −1

2[〈q − 1 |1〉+ 〈q − 2 |2〉+ . . . + 〈2 |q − 2〉+ 〈1 |q − 1〉] (20.31)

Las ecuaciones de perturbacion hasta segundo orden son por tanto (20.23, 20.24, 20.25) y con nuestra conven-cion de normalizacion y de fases deben agregarse las Ecs. (20.28, 20.29, 20.30). La ecuacion (20.23) nos dice que|0〉 es un autovector de H0 con valor propio ε0. Por tanto, ε0 es parte del espectro de H0, esto era de esperarseya que cuando λ → 0 cada autovalor de H (λ) se convierte en un autovalor de H (0) = H0. En consecuencia,escogiendo un ε0 particular, es decir un cierto autovalor E0

n de H0, podemos calcular E (λ).Como ya mencionamos, es posible que diferentes valores de E (λ) converjan en el mismo valor ε0 = E0

n. Consi-deremos el conjunto de autoestados linealmente independientes de H (λ) correspondientes a los varios autovaloresque converjen en un mismo valor propio E0

n de H0 cuando λ → 0. Estos autoestados expanden un subespaciovectorial cuya dimension no puede cambiar discontınuamente cuando λ se barre de manera contınua en la vecindadderecha de cero. Por tanto, esta dimension debe ser independiente de λ y en particular se puede calcular en λ = 0.De esto se concluye que la dimension de este espacio es el grado de degeneracion gn de E0

n. En particular, si E0n es

no degenerado, solo generara un autovalor E (λ) de H (λ), de modo que esta energıa tampoco estara degenerada.Estudiaremos primero el caso en el cual el nivel asociado de H0 es no degenerado.

20.3. Perturbacion de un nivel no degenerado

Consideremos un nivel no degenerado E0n correspondiente a un autoestado |ϕn〉 que es unico salvo un factor

constante. La idea es determinar la modificacion que la perturbacion W hace sobre el nivel E0n y el autoestado

|ϕn〉. Para calcularlo utilizamos las ecuaciones (20.23, 20.24, 20.25), junto con las convenciones de normalizaciony fase (20.28, 20.29, 20.30). Para el autovalor de H (λ) cuando λ→ 0 es claro que

ε0 = E0n (20.32)

esta ecuacion junto con (20.23) implican que |0〉 debe ser proporcional a |ϕn〉 3. Puesto que ambos vectores estannormalizados es natural escoger

|0〉 = |ϕn〉 (20.33)

de modo que cuando λ → 0 encontraremos el autoestado sin perturbar |ϕn〉 (con la misma norma y la mismafase)4.

Denominamos E (λ) al valor propio de H (λ) que toma el valor de E0n cuando λ → 0. Asumiremos que λ es

suficientemente pequeno para que permanezca no degenerado para todo λ, recordemos que es posible que las curvasde E (λ) vs λ asociadas a dos estados no perturbados distintos E0

n y E0p se crucen en algun punto λ1 produciendo

una degeneracion accidental (ver Fig. 20.1, Pag 496). En tal caso debemos imponer que λ < λ1. Comenzaremoscon la correccion de la energıa a primer orden.

3Notese que esta afirmacion depende del caracter no degenerado de E0n, ya que de lo contrario el ket asociado a tal valor propio no

es unico.4Recordemos que la fase del ket |0〉 estaba aun sin determinar. La Ec. (20.33), nos determina dicha fase.

Page 501: Mecanica Cuantica: Notas de Clase

20.3. PERTURBACION DE UN NIVEL NO DEGENERADO 501

20.3.1. Correccion de primer orden para la energıa

Calculando la proyeccion de la Ec. (20.24) sobre el autoestado |ϕn〉, se obtiene

〈ϕn| (H0 − ε0) |1〉+ 〈ϕn|(W − ε1

)|0〉 = 0

〈ϕn|(E0n − E0

n

)|1〉+ 〈ϕn|

(W − ε1

)|ϕn〉 = 0

〈ϕn|(W − ε1

)|ϕn〉 = 0

donde hemos usado las Ecs. (20.32, 20.33), ası como el hecho de que H0 puede actuar sobre el bra debido a sucaracter hermıtico. Esta ecuacion se puede reescribir como

ε1 = 〈ϕn| W |ϕn〉 (20.34)

Sustituyendo (20.32) y (20.34) en (20.21) resulta

En (λ) = E0n + λ 〈ϕn| W |ϕn〉 = E0

n + 〈ϕn|W |ϕn〉 (20.35)

con lo cual cuando el estado no perturbado E0n es no degenerado, el autovalor E (λ) de H asociado a E0

n puede

escribirse a primer orden en la perturbacion W = λW en la forma (20.35). Vemos que la correccion a primerorden de un nivel no degenerado E0

n es igual al valor esperado del termino de perturbacion W en el estado noperturbado |ϕn〉.

20.3.2. Correccion de primer orden para el autovector

Para obtener la informacion completa contenida en la ecuacion de perturbacion, tenemos que realizar lasproyecciones de la Ec. (20.24) sobre todos los autoestados

∣∣ϕip⟩de H0. Realizando estas proyecciones sobre todos

los vectores∣∣ϕip

⟩diferentes a |ϕn〉 se obtiene

⟨ϕip∣∣ (H0 − ε0) |1〉+

⟨ϕip∣∣(W − ε1

)|0〉 = 0 ; (p 6= n)

⟨ϕip∣∣ (E0

p − E0n

)|1〉+

⟨ϕip∣∣ W |ϕn〉 − ε1

⟨ϕip∣∣ϕn〉 = 0 ; (p 6= n) (20.36)

donde hemos usado las Ecs. (20.32, 20.33). El ındice i indica que otros valores propios pueden ser degenerados.Puesto que vectores propios asociados a valores propios distintos son ortogonales, se tiene que

⟨ϕip∣∣ϕn〉 = 0. Por

tanto, la Ec. (20.36) queda (E0p − E0

n

) ⟨ϕip∣∣ 1〉+

⟨ϕip∣∣ W |ϕn〉 = 0 ; (p 6= n)

esto nos da los coeficientes de Fourier de la expansion de |1〉 sobre toda la base no perturbada excepto |ϕn〉

⟨ϕip∣∣ 1〉 =

⟨ϕip∣∣ W |ϕn〉(

E0n − E0

p

) ; (p 6= n)

el coeficiente 〈ϕn| 1〉 es cero en virtud de la condicion (20.29) y de la Ec. (20.33)

〈0| 1〉 = 〈ϕn| 1〉 = 0 (20.37)

puesto que conocemos la expansion de |1〉 en la base∣∣ϕip

⟩el vector se puede escribir en esta base en la forma

|1〉 =∑

p

i

∣∣ϕip⟩ ⟨ϕip∣∣ 1〉 =

p 6=n

i

∣∣ϕip⟩⟨ϕip∣∣ W |ϕn〉(

E0n − E0

p

) (20.38)

Page 502: Mecanica Cuantica: Notas de Clase

502 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

y aplicando (20.22) vemos que el autovector |ψn (λ)〉 de H asociado a el estado no perturbado |ϕn〉, se escribe a

primer orden en la perturbacion W = λW en la forma

|ψn (λ)〉 = |ϕn〉+ λ∑

p 6=n

i

∣∣ϕip⟩⟨ϕip∣∣ W |ϕn〉(

E0n − E0

p

) +O(λ2)

(20.39)

la correccion a primer orden del vector de estado es una superposicion de todos los estados no perturbadosexcepto su autoestado no perturbado asociado. Se dice entonces que la perturbacion W produce una “mezcla” delestado |ϕn〉 con los otros autoestados de H0. La contribucion de un estado

∣∣ϕip⟩sera nula si el elemento matricial⟨

ϕip∣∣ W |ϕn〉 es cero. En general la mezcla con el estado

∣∣ϕip⟩aumenta con el aumento del acople

⟨ϕip∣∣ W |ϕn〉 entre

los estados |ϕn〉 y∣∣ϕip⟩, y tambien aumenta al disminuir el desdoblamiento E0

n − E0p entre los niveles asociados.

De la discusion anterior y la Ec. (20.39) se desprende que no es suficiente que los elementos matriciales de Wsean mucho menores que los de H0, para que la contribucion de W sea pequena. Para que la correccion de primerorden al vector de estado sea pequena, es necesario ademas que los elementos no diagonales de la matriz W seanmucho mas pequenos que el desdoblamiento de los niveles de energıa asociados.

20.3.3. Correccion de segundo orden para la energıa

Para calcular ε2 se proyecta la ecuacion (20.25) asociada al segundo orden con el ket |ϕn〉, aplicando ademaslas Ecs. (20.32, 20.33, 20.37)

〈ϕn| (H0 − ε0) |2〉+ 〈ϕn|(W − ε1

)|1〉 − ε2〈ϕn |0〉 = 0

〈ϕn|(E0n − E0

n

)|2〉+ 〈ϕn| W |1〉 − ε1 〈ϕn| 1〉 − ε2〈ϕn |ϕn〉 = 0

〈ϕn| W |1〉 = ε2 (20.40)

Sustituyendo (20.38) en (20.40) se obtiene

ε2 = 〈ϕn| W |1〉 = 〈ϕn| W∑

p 6=n

i

∣∣ϕip⟩⟨ϕip∣∣ W |ϕn〉(

E0n − E0

p

) =∑

p 6=n

i

〈ϕn| W∣∣ϕip⟩ ⟨ϕip∣∣ W |ϕn〉(

E0n − E0

p

)

ε2 =∑

p 6=n

i

∣∣∣⟨ϕip∣∣ W |ϕn〉

∣∣∣2

(E0n − E0

p

) (20.41)

reemplazando (20.32, 20.34, 20.41) en (20.21) tenemos a segundo orden

En (λ) = ε0 + λε1 + λ2ε2 +O(λ3)= E0

n + λ 〈ϕn| W |ϕn〉+ λ2∑

p 6=n

i

∣∣∣⟨ϕip∣∣ W |ϕn〉

∣∣∣2

(E0n −E0

p

) +O(λ3)

En (λ) = E0n + 〈ϕn|W |ϕn〉+

p 6=n

i

∣∣⟨ϕip∣∣W |ϕn〉

∣∣2(E0n − E0

p

) +O(λ3)

(20.42)

notese que la correccion a segundo orden de la energıa (no degenerada) asociada al estado no perturbado |ϕn〉,contiene contribuciones de todos los otros estados

∣∣ϕip⟩. La contribucion del estado

∣∣ϕip⟩tiene el signo del desdo-

blamiento(E0n −E0

p

). Ademas tal contribucion crece con el tamano del “acople”

⟨ϕip∣∣W |ϕn〉 y con la disminucion

del desdoblamiento(E0n − E0

p

).

Page 503: Mecanica Cuantica: Notas de Clase

20.3. PERTURBACION DE UN NIVEL NO DEGENERADO 503

20.3.4. Correccion de segundo orden para el estado

La expresion a segundo orden para el autovector de H (λ) se puede obtener proyectando la Ec. (20.25) sobreel autoestado no perturbado

∣∣ϕip⟩y utilizando las condiciones (20.30). De esta manera se obtiene el ket |2〉 con el

cual se calcula |ψ (λ)〉 a segundo orden por medio de la ecuacion (20.22). Se deja este procedimiento como ejerciciopara el lector.

Por otro lado, puede verse de la Ec. (20.35), que la correccion a primer orden de la energıa depende de lacorreccion a orden cero del autoestado (es decir del autoestado no perturbado). Similarmente, la Ec. (20.42)muestra que la correccion a segundo orden de la energıa depende de la correccion a primer orden al autoestado,por esta razon las Ecs. (20.38, 20.41) son muy similares. Este hecho se puede generalizar: si se proyecta la Ec.(20.26) sobre |ϕn〉, el primer termino se anula, con lo cual εq estara en terminos de las correcciones de orden q−1,q − 2,. . . del autovector. Por esta razon, es usual que se haga la correccion hasta orden q de la energıa y hastaorden q − 1 en el autovector. En esta tonica, nosotros calcularemos en el presente texto correcciones hasta deprimer orden en el autoestado y hasta de segundo orden en la energıa.

20.3.5. Cota superior para ε2

Cuando se calcula la correccion perturbativa de la energıa a primer orden, podemos encontrar una cota superiorpara la correccion de segundo orden que nos da una idea aproximada del error cometido. Definiremos ∆E como elvalor absoluto de la diferencia entre el nivel E0

n que se pretende corregir, con el nivel no perturbado mas cercano.Por definicion tenemos entonces que ∣∣E0

n − E0p

∣∣ ≥ ∆E ; p 6= n (20.43)

de las Ecs. (20.41, 20.43) obtenemos entonces una cota superior para ε2

|ε2| ≤ 1

∆E

p 6=n

i

∣∣∣⟨ϕip∣∣ W |ϕn〉

∣∣∣2=

1

∆E

p 6=n

i

〈ϕn| W∣∣ϕip⟩ ⟨ϕip∣∣ W |ϕn〉

|ε2| ≤ 1

∆E〈ϕn| W

p 6=n

i

∣∣ϕip⟩ ⟨ϕip∣∣ W |ϕn〉 (20.44)

en virtud de la completez de∣∣ϕip

⟩tenemos

|ϕn〉 〈ϕn|+∑

p 6=n

i

∣∣ϕip⟩ ⟨ϕip∣∣ = 1 (20.45)

sustituyendo (20.45) en (20.44) queda

|ε2| ≤ 1

∆E〈ϕn| W [1− |ϕn〉 〈ϕn|] W |ϕn〉 =

1

∆E

[〈ϕn| W 2 |ϕn〉 − 〈ϕn| W |ϕn〉 〈ϕn| W |ϕn〉

]

|ε2| ≤ 1

∆E

[〈ϕn| W 2 |ϕn〉 −

∣∣∣〈ϕn| W |ϕn〉∣∣∣2]=

1

∆E

(∆W

)2n

∣∣λ2ε2∣∣ ≤ 1

∆E(∆W )2n (20.46)

donde (∆W )2n es la desviacion media cuadratica del observable W evaluada en el estado |ϕn〉 asociada al nivel (nodegenerado) de energıa E0

n cuya correccion se esta evaluando. La Ec. (20.46) nos da una idea del orden de magnitudde la correccion de segundo orden y por tanto del error cometido al considerar solo la correccion de primer orden.Debe advertirse sin embargo, que esta desigualdad solo nos da informacion sobre el orden de magnitud de lacorreccion a segundo orden y no de los ordenes superiores. Solo si el comportamiento perturbativo es bueno (demodo que los ordenes superiores son mucho menores) podemos decir que este orden de magnitud corresponde aun estimado aproximado del error total.

Page 504: Mecanica Cuantica: Notas de Clase

504 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

20.4. Perturbacion de un nivel degenerado

Asumamos que el nivel E0n tiene degeneracion de grado gn de modo que hay gn vectores linealmente indepen-

dientes∣∣ϕin

⟩que son vectores propios asociados a E0

n y que expanden un subespacio E0n del espacio orbital y de

dimension gn. En este caso la escogenciaε0 = E0

n

no es suficiente para determinar al ket |0〉, ya que la Ec. (20.23) se satisface para cualquier combinacion lineal deautovectores de E0

n. Por el momento solo podemos decir que |0〉 es un ket del autosubespacio E0n. Veremos que bajo

la perturbacion W , el nivel E0n genera varios subniveles, siendo el numero de subniveles menor o igual a gn. Si el

numero fn de subniveles es menor que gn, algunos de estos niveles deben estar degenerados puesto que el numerototal de vectores ortogonales de H asociados con los fn subniveles debe ser siempre igual a gn. Nos limitaremosen esta discusion al calculo del autoestado a orden cero y de la energıa a primer orden.

Para determinar ε1 y |0〉 comenzamos proyectando la ecuacion (20.24) sobre los gn autovectores∣∣ϕin

⟩, de lo

cual se obtienen las relaciones

⟨ϕin∣∣ (H0 − ε0) |1〉+

⟨ϕin∣∣(W − ε1

)|0〉 = 0

⟨ϕin∣∣ (E0

n − E0n

)|1〉+

⟨ϕin∣∣ W |0〉 − ε1

⟨ϕin∣∣ 0〉 = 0

⟨ϕin∣∣ W |0〉 = ε1

⟨ϕin∣∣ 0〉

al insertar un operador identidad y teniendo en cuenta que |0〉 debe ser ortogonal a cualquier vector de la forma∣∣∣ϕjp⟩con p 6= n (ya que |0〉 ∈ E0

n y por tanto es ortogonal a E0p con p 6= n), nos queda

p

gp∑

j=1

⟨ϕin∣∣ W

∣∣ϕjp⟩〈ϕjp |0〉 = ε1

⟨ϕin∣∣ 0〉

gn∑

j=1

⟨ϕin∣∣ W

∣∣ϕjn⟩〈ϕjn |0〉 = ε1

⟨ϕin∣∣ 0〉 (20.47)

ahora consideramos las cantidades⟨ϕin∣∣ W

∣∣∣ϕjn⟩como elementos de una matriz gn×gn con ındice de fila “i” e ındice

de columna “j”. Las cantidades⟨ϕin∣∣ W

∣∣∣ϕjp⟩son los elementos de la representacion matricial del operador W en

la base∣∣ϕip

⟩del espacio Er. Por tanto, los elementos

⟨ϕin∣∣ W

∣∣∣ϕjn⟩corresponden a la restriccion (o submatriz)

correspondiente al subespacio E0n de Er. Denotaremos esta submatriz como W (n). Notese entonces que la Ec.

(20.47) nos dice que el vector columna definido por ϕ(n)k =

⟨ϕkn∣∣ 0〉 que pertenece a E0

n, es autovector de W(n) con

autovalor ε1. Por supuesto ϕ(n)k es la representacion del vector |0〉 en la base

∣∣ϕip⟩

5. La Ec. (20.47) se puedeescribir entonces

W(n)ij ϕ

(n)j = ε1ϕ

(n)i (20.48)

En vista de lo anterior, si definimos W (n) como la restriccion del operador W al subespacio E0n (ver seccion

1.33, Pag. 74 y Ec. 1.129), podemos ver la Ec. (20.47) como una ecuacion de valores propios para dicho operadorrestringido en el espacio E0

n. La Ec. (20.47) puede escribirse tambien en la forma

W (n) |0〉 = ε1 |0〉 (20.49)

debe enfatizarse sin embargo, que la restriccion W (n) del operador W al subespacio E0n es diferente del operador

en sı, y que la ecuacion (20.49) esta definida en E0n y no en el espacio orbital completo Er.

5Notese que el vector |0〉 pertenece a E0n de modo que las componentes asociadas a cada

∣∣ϕip⟩con p 6= n, son nulas. En este sentido,

la restriccion del vector |0〉 al subespacio E0n, coincide con el vector en sı.

Page 505: Mecanica Cuantica: Notas de Clase

20.4. PERTURBACION DE UN NIVEL DEGENERADO 505

Por tanto, para calcular los autovalores a primer orden y los autoestados a orden cero del Hamiltoniano asociadoa un estado no perturbado degenerado E0

n, debemos diagonalizar la matriz W (n) que representa la restriccion del

operador de perturbacion W al subespacio E0n de dimension gn generado por el autovalor E0

n. La Ec.(20.49) oequivalentemente la Ec. (20.48) nos generan un polinomio caracterıstico de grado gn, con gn raıces reales (ya que

la restriccion de un operador hermıtico tambien es un operador hermıtico6). Definamos εj1 con j = 1, 2, . . . , f(1)n

como las f(1)n raıces distintas de la ecuacion caracterıstica para W (n). De acuerdo con el teorema fundamental

del algebra, la suma de las degeneraciones de estas raıces debe ser gn. En otras palabras, si el valor propio εj1 tienedegeneracion bj tenemos que

f(1)n∑

j=1

bj = gn ; f (1)n ≤ gn (20.50)

cada autovalor εj1 para j dado introduce una correccion diferente al nivel de energıa. Usando la Ec. (20.21) vemosque

En,j (λ) = E0n + λεj1 ; j = 1, 2, . . . , f (1)n ≤ gn (20.51)

que nos muestra que bajo la influencia de la perturbacionW = λW , el nivel degenerado se desdobla a primer orden

en f(1)n subniveles distintos dados por la Ec. (20.51). Cada subnivel En,j (λ) tendra una degeneracion bj y se debe

cumplir la relacion (20.50). En particular, si f(1)n = gn, se dice que a primer orden, la perturbacion W remueve

por completo la degeneracion de E0n, ya que en este caso bj = 1 para todo j y los subniveles seran no degenerados.

Si f(1)n < gn, habra por lo menos un bj tal que bj > 1, de modo que la degeneracion solo se remueve parcialmente.

Finalmente, sin f(1)n = 1, el grado de degeneracion no cambia en lo absoluto, y solo aparece correccion a E0

n perono hay subniveles distintos asociados a el.

Ahora nos ocuparemos de la determinacion del vector |0〉. Para ello, nos enfocamos en un εj1 fijo. Si esteautovalor es no degenerado, el autovector |0〉 asociado por medio de (20.49) es unico salvo un factor constante.Existe entonces un unico autovalor E (λ) de H (λ) dado por (20.51), de modo que En,j (λ) es no degenerado. Por

otro lado, si el autovalor εj1 es bj−degenerado (con bj > 1), entonces la Ec. (20.49) solo nos dice que el autovector

asociado |0〉, pertenece al subespacio E(1)n,j ⊆ E0

n, de dimension bj ≤ gn.Es notable la simplificacion del problema de calcular las energıas degeneradas por metodo perturbativo es-

tacionario a primer orden. Para verlo, notese que para una energıa no perturbada dada E0n, hemos cambiado

el problema de diagonalizar el Hamiltoniano de perturbacion W en un espacio de dimension infinita Er, por elproblema de diagonalizar la restriccion de este operador en el autoespacio E0

n de dimension finita gn, generado porE0n. En particular, si el nivel no es degenerado el autosubespacio asociado es de dimension 1, y no es necesaria

ninguna diagonalizacion.

20.4.1. Comportamiento de subniveles degenerados a mas alto orden en perturbaciones

Cuando un determinado autovalor εj1 tiene degeneracion de grado bj > 1 en un calculo perturbativo a primerorden, es natural preguntarse si esta degeneracion es esencial, o si solo es caracterıstica de la aproximacion deprimer orden en λ. Para verlo, debemos examinar el calculo a mas altos ordenes en λ. Pueden ocurrir dos casos.

1. Supongamos que hay una sola energıa exacta E (λ), que es igual a primer orden a E0n + λεj1 y que esta

energıa es bj−degenerada (en la Fig. 20.1 corresponderıa a la energıa E (λ) que parte desde E04 , la cual tiene

degeneracion doble para todo λ). Por tanto, para todo valor de λ tenemos un autosubespacio de dimensionbj generado por E (λ), de modo que la degeneracion que aparece a primer orden no se removera a ningunorden en λ y es una degeneracion esencial. En tal caso, el vector a orden cero |0〉 no puede especificarsecompletamente, puesto que la unica condicion impuesta sobre tal vector es que pertenezca a un subespacioque es el lımite cuando λ → 0, del autoespacio bj−dimensional de H (λ) asociado a E (λ). Este serıa el

6Esto se puede ver de la definicion (1.129) Pag. 75, y del caracter hermıtico de los operadores proyeccion.

Page 506: Mecanica Cuantica: Notas de Clase

506 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

autoespacio E(1)n,j de W (n) asociado al autovalor εj1 escogido. Este caso surge usualmente cuando H0 y W

poseen propiedades de simetrıa comunes, que implican una degeneracion esencial en H (λ), que por tantodebe prevalecer a todos los ordenes de perturbacion en λ.

2. Para un valor fijo de n y j, puede ocurrir que varias energıas distintas En,j,k (λ) coincidan entre sı, en unaaproximacion de primer orden. Por tanto, la diferencia entre estas energıas solo aparece en un calculo a

segundo orden o mas alto. En tal caso, el subespacio E(1)n,j obtenido a primer orden es solo la suma directa

de los lımites cuando λ→ 0 de varios autosubespacios asociados a estas energıas distintas En,j,k (λ)

E(1)n,j = E(1)

n,j,1 ⊕ E(1)n,j,2 ⊕ . . .⊕ E(1)

n,j,knj

Donde knj denota el numero de energıas distintas que surgen a mas alto orden en teorıa de perturbaciones

para valores dados de n y j. Por supuesto, es posible que uno o mas de los autoespacios E(1)n,j,p sea de mas de

una dimension (es decir que knj sea menor que la dimension del subespacio E(1)n,j ), en cuyo caso la degeneracion

se ha reducido pero no se ha removido completamente a ningun orden en teorıa de perturbaciones. En vistade lo anterior, todos los autovectores de H (λ) asociados a estas energıas En,j,k (λ) (con n y j fijos) seran

kets de E(1)n,j , pero no necesariamente un ket de E(1)

n,j correspondera a el lımite |0〉 de un autoestado de H (λ).Cuando este es el caso, las correcciones de segundo o mas orden no solo aumentan la precision con que secalculan las energıas, sino que permiten determinar los kets de orden cero7 |0〉. En la practica sin embargo,se suele utilizar solo la informacion parcial contenida en (20.49) a primer orden.

20.5. Consideraciones generales sobre teorıa estacionaria de perturbaciones

La diagonalizacion del problema de valores propios (20.49) restringida al autosubespacio E0n requiere encontrar

una base canonica

∣∣∣ϕjn⟩D

en donde el operador W (n) adquiera forma diagonal. Con este proposito, es conve-

niente tomar como punto de partida una base que simplifique al maximo la forma matricial del operador W (n).Para este fin, es usual emplear observables que conmuten tanto con H0 como con W (aunque en general H0 y Wno conmutan entre sı). Supongamos que tenemos un observable A que conmuta con H0 y W . Es posible encontraruna base

∣∣ϕin⟩

de E0n de autoestados comunes a H0 y A. Por otro lado, debido a que A conmuta con W , el

teorema 1.68, Pag. 58 nos dice que los elementos matriciales de W son cero entre autovectores de A asociados aautovalores distintos. En tal caso, la matriz W (n) contendra bastantes ceros, lo cual facilita la diagonalizacion. Enparticular si H0 y W conmutan, se puede buscar una base de vectores propios comunes a ambos para diagonalizara W y no sera necesario el uso de un observable extra.

Para el caso de niveles degenerados al igual que para el caso no degenerado, el estudio de las correccionesperturbativas a mas alto orden, revela que este metodo es valido solo si los elementos matriciales deW son muchomenores que las diferencias entre las energıas del nivel bajo estudio y aquellas asociadas a los otros niveles. Noobstante, es posible extender este metodo al caso en el cual hay un grupo de niveles no perturbados muy cercanosentre sı (pero diferentes) y que esta lejos de los demas niveles del sistema. Esto significa que los elementosmatriciales de W son del mismo orden de magnitud que las diferencias de energıa dentro del grupo, pero son engeneral mucho menores que las diferencias entre un nivel fuera del grupo y un nivel dentro del grupo. En estasituacion, podemos determinar la influencia de W , diagonalizando la matriz que representa a H = H0+W dentrodel grupo de niveles cercanos. Esta fue la linea de razonamientos utilizada en el capıtulo 17 para estudiar sistemasde dos estados.

7Por supuesto la determinacion unıvoca de estos kets |0〉 solo es posible para los autosubespacios E (1)n,j,p que son unidimensionales.

Page 507: Mecanica Cuantica: Notas de Clase

20.6. PERTURBACIONES ESTACIONARIAS SOBRE EL OSCILADOR ARMONICO 507

20.6. Perturbaciones estacionarias sobre el oscilador armonico

Ilustraremos la teorıa de perturbaciones estacionaria considerando el efecto de potenciales proporcionales a x,x2 y x3, sobre el oscilador armonico unidimensional. Este es un caso de perturbaciones sobre estados no degenerados(mas adelante veremos aplicaciones en Fısica Atomica para el caso degenerado). Los primeros dos casos se puedensolucionar de manera exacta y nos serviran mas para probar la consistencia del metodo. El caso de potencialproporcional a x3 es muy importante, dado que si hacemos la expansion de Taylor de un potencial V (x) alrededorde un mınimo local de dicho potencial, el primer termino no trivial es el termino armonico (proporcional a x2) y elsiguiente termino no trivial es proporcional a x3, razon por la cual lo denominamos primer termino anarmonico. Portanto, este suele ser el termino dominante cuando queremos estudiar las desviaciones de los fenomenos vibratorios(clasicos o cuanticos) con respecto al comportamiento armonico.

20.6.1. Orden de magnitud de los observables no perturbados

Antes de introducir la perturbacion, conviene determinar el orden de magnitud de algunos observables asociadosal problema no perturbado, con el fin de parametrizar la perturbacion adecuadamente. Nuestro Hamiltoniano “noperturbado” sera el asociado al oscilador armonico simple unidimensional

H0 =P 2

2m+

1

2mω2X2

las energıas no perturbadas seran entonces

E0n =

(n+

1

2

)~ω ; n = 0, 1, 2, 3, . . .

teniendo en cuenta las Ecs. (8.3, 8.5) Pag. 271, veremos que el operador adimensional X es del orden de uno.Puesto que el Hamiltoniano no perturbado H0 claramente es del orden de ~ω (orden de magnitud de sus valorespropios), la Ec. (8.5) nos dice que

∣∣∣H0

∣∣∣ =∣∣∣∣H0

∣∣∣∣ ≈ 1 ;∣∣∣H0

∣∣∣ ≡ 1

2

∣∣∣X2 + P 2∣∣∣ ≈ 1 (20.52)

para estimar el orden de magnitud de X2 y P 2 podemos sustituir estos operadores adimensionales por sus valores

esperados teniendo en cuenta que⟨X⟩=⟨P⟩= 0 segun la Ec. (8.54). Por tanto

⟨X2⟩=(∆X

)2;⟨P 2⟩=(∆P

)2

utilizando las definiciones (8.3) y las Ecs. (8.64) resulta

⟨X2⟩=mω

~(∆X)2 =

~

(n+

1

2

)~

mω;⟨P 2⟩=

(∆P )2

m~ω=

(n+ 1

2

)m~ω

m~ω

para valores no muy grandes de n (i.e. estados no muy excitados), podemos escribir

⟨X2⟩

≈ mω

~

(1

2

~

)=

1

2;⟨P 2⟩≈

12m~ω

m~ω=

1

2⟨X2⟩

≈⟨P 2⟩≈ 1

2(20.53)

sustituyendo⟨X2⟩≈⟨P 2⟩en (20.52) resulta

∣∣∣H0

∣∣∣ ≈ 1

2

(⟨X2⟩+⟨P 2⟩)

≈⟨X2⟩≈ 1 (20.54)

Page 508: Mecanica Cuantica: Notas de Clase

508 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

esta aproximacion es consistente con la obtenida en la Ec. (20.53) si tenemos en cuenta que solo es una estimaciondel orden de magnitud. Tomaremos entonces la aproximacion8

∣∣∣O∣∣∣ ≈

√⟨O2⟩≈ 1 ; O ≡ X, P , H0

20.6.2. Parametrizacion de la perturbacion al oscilador con potencial lineal adicional

En virtud de las estimaciones anteriores, parametrizaremos la perturbacion lineal en la forma

W = λ~ωX = λω√m~ω X (20.55)

esta forma de parametrizar la perturbacion es muy logica ya que el operador X es del orden de uno y ~ω es delorden de H0, de modo que W ≡ ~ωX es del orden de H0, que es lo que se busca para el operador W . Por tanto,la expansion perturbativa con W = λW funciona solo si λ ≪ 1 para asegurar que W ≪ H0. El Hamiltonianocompleto es entonces

H = H0 +W = H0 + λW =P 2

2m+

1

2mω2X2 + λ~ωX

sin embargo, debemos tener presente que las estimaciones en orden de magnitud que se hicieron solo son validassi el numero cuantico n no es mucho mayor que uno. Por tanto, para estados altamente excitados es posible quelas predicciones de la expansion perturbativa fallen.

Solucion exacta del oscilador con potencial lineal adicional

Para encontrar la solucion exacta, podemos utilizar los resultados de la seccion 8.9, en la cual se estudio eloscilador armonico simple unidimensional sometido a un campo electrico uniforme E, cuyo potencial asociado esde la forma W = −qEX. Comparando tal potencial con la Ec. (20.55) vemos que la solucion se obtiene con elreemplazo

−qE ≡ λω√m~ω ⇒ λ ≡ − qE

ω√m~ω

(20.56)

empleando la definicion (20.56) en la ecuacion (8.82) el espectro del oscilador con potencial lineal adicional queda

En (λ) =

(n+

1

2

)~ω −

(−λω

√m~ω

)2

2mω2

En (λ) =

(n+

1

2

)~ω − λ2

2(20.57)

Por otro lado, la Ec. (8.98), Pag. 292, se puede reescribir en terminos de operadores creacion y destruccionusando las Ecs. (8.9), Pag. 272

|ϕn (λ)〉 = exp

[− i

~

qE

mω2P

]|ϕn〉 = exp

− i

~

qE

mω2

[i

√m~ω

2

(a† − a

)]|ϕn〉 = exp

qE√

2 ω√m~ω

[a† − a

]|ϕn〉

y usando nuestra asignacion de λ ecuacion (20.56) se obtiene

|ϕn (λ)〉 = exp

[− λ√

2

(a† − a

)]|ϕn〉 (20.58)

8Es mejor tomar el orden de magnitud del operador como la raız cuadrada del promedio cuadratico, ya que lo que nos interesa esun promedio de su magnitud y no de su valor. De hecho, el promedio lineal de los operadores X y P es nulo.

Page 509: Mecanica Cuantica: Notas de Clase

20.6. PERTURBACIONES ESTACIONARIAS SOBRE EL OSCILADOR ARMONICO 509

Expandiendo la Ec. (20.58) a primer orden en λ, y utilizando las Ecs. (8.41) Pag. 280, tenemos

|ϕn (λ)〉 =

[1− λ√

2

(a† − a

)+O

(λ2)]

|ϕn〉 = |ϕn〉 −λ√2a† |ϕn〉+

λ√2a |ϕn〉+O

(λ2)

|ϕn (λ)〉 = |ϕn〉 − λ

√n+ 1

2|ϕn+1〉+ λ

√n

2|ϕn−1〉+O

(λ2)

(20.59)

Expansion perturbativa con potencial lineal

Escribiendo el Hamiltoniano de perturbacion W en terminos de operadores creacion y destruccion, tenemos

W = λ~ωX = λ~ω√2

(a+ a†

)

Por tanto W mezcla al estado |ϕn〉 solo con los estados |ϕn±1〉, de modo que los unicos elements de matriz nonulos son

〈ϕn+1|W |ϕn〉 = λ~ω√2〈ϕn+1|

(a+ a†

)|ϕn〉 = λ

~ω√2〈ϕn+1| a† |ϕn〉 = λ

~ω√n+ 1√2

〈ϕn+1| ϕn+1〉 = λ~ω

√n+ 1√2

〈ϕn−1|W |ϕn〉 = λ~ω√2〈ϕn−1|

(a+ a†

)|ϕn〉 = λ

~ω√2〈ϕn−1| a |ϕn〉 = λ

~ω√n√

2〈ϕn−1| ϕn−1〉 = λ

~ω√n√

2

quedando finalmente

〈ϕn+1|W |ϕn〉 = λ

√n+ 1

2~ω ; 〈ϕn−1|W |ϕn〉 = λ

√n

2~ω (20.60)

utilizando la expresion (20.42) para la correccion de E (λ) a segundo orden se tiene

En (λ) = E0n + 〈ϕn|W |ϕn〉+

m6=n

|〈ϕm|W |ϕn〉|2E0n − E0

m

+O(λ3)

= E0n + 0 +

|〈ϕn+1|W |ϕn〉|2E0n − E0

n+1

+|〈ϕn−1|W |ϕn〉|2E0n − E0

n−1

+O(λ3)

En (λ) =

(n+

1

2

)~ω +

∣∣∣λ√

n+12 ~ω

∣∣∣2

[n− (n+ 1)] ~ω+

∣∣λ√

n2 ~ω

∣∣2

[n− (n− 1)] ~ω+O

(λ3)

=

(n+

1

2

)~ω − λ2 (n+ 1) ~ω

2+λ2n~ω

2+O

(λ3)

quedando finalmente

En (λ) =

(n+

1

2

)~ω − λ2

2+O

(λ3)

vemos que la expansion perturbativa del autovalor a segundo orden en λ, coincide con el resultado exacto Ec.(20.57). De hecho, puede demostrarse que todos los terminos de orden superior a dos se anulan en la expansionperturbativa. Adicionalmente, se observa que no hay contribucion de primer orden, en virtud de que los elementosdiagonales 〈ϕn|W |ϕn〉 son nulos.

Page 510: Mecanica Cuantica: Notas de Clase

510 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

Por otra parte, la expansion del autoestado a primer orden lo da la Ec. (20.39)

|ϕn (λ)〉 = |ϕn〉+∑

m6=n

〈ϕm|W |ϕn〉E0n − E0

m

|ϕm〉+O(λ2)

= |ϕn〉+〈ϕn+1|W |ϕn〉E0n − E0

n+1

|ϕn+1〉+〈ϕn−1|W |ϕn〉E0n − E0

n−1

|ϕn−1〉+O(λ2)

= |ϕn〉+λ√

n+12 ~ω

−~ω|ϕn+1〉+

λ√

n2 ~ω

~ω|ϕn−1〉+O

(λ2)

|ϕn (λ)〉 = |ϕn〉 − λ

√n+ 1

2|ϕn+1〉+ λ

√n

2|ϕn−1〉+O

(λ2)

que coincide con la expansion a primer orden de la solucion exacta Ec. (20.59).

20.6.3. Perturbacion al oscilador armonico con potencial cuadratico

En este caso la perturbacion se escribira como

W =1

2λ~ωX2 =

1

2λmω2X2 (20.61)

siendo λ el parametro perturbativo que debe ser mucho menor que 1. El Hamiltoniano perturbado queda

H = H0 +W =P 2

2m+

1

2mω2 (1 + λ)X2

H =P 2

2m+

1

2mω′2X2 ; ω′2 = ω2 (1 + λ) (20.62)

por tanto, el Hamiltoniano sigue estando asociado a un oscilador armonico simple, y el efecto de la perturbaciones simplemente un cambio en la frecuencia angular al valor ω′ definido en (20.62). Estudiaremos solo el cambio enlos autovalores. El espectro del Hamiltoniano perturbado es claramente

En =

(n+

1

2

)~ω′ =

(n+

1

2

)~ω

√1 + λ

expandiendo el radical se obtiene

En =

(n+

1

2

)~ω

[1 +

1

2λ− 1

8λ2 +O

(λ3)]

(20.63)

ahora reproduciremos el espectro (20.63) utilizando teorıa de perturbaciones estacionaria. El Hamiltoniano deperturbacion (20.61) se puede escribir como

W =1

2λ~ωX2 =

1

2λ~ω

(a† + a√

2

)2

primero calculamos(a† + a

)2

(a† + a

)2= a†2 + a2 + a†a+ aa† = a†2 + a2 + a†a+

[a, a†

]+ a†a

(a† + a

)2= a†2 + a2 + 2a†a+ 1 (20.64)

Page 511: Mecanica Cuantica: Notas de Clase

20.6. PERTURBACIONES ESTACIONARIAS SOBRE EL OSCILADOR ARMONICO 511

con lo cual queda

W =1

4λ~ω

a†2 + a2 + 2a†a+ 1

en consecuencia, los unicos elementos matriciales no nulos de W con respecto a |ϕn〉 son

〈ϕn|W |ϕn〉 = 〈ϕn|(1

4λ~ω

a†2 + a2 + 2a†a+ 1

)|ϕn〉 =

1

4λ~ω 〈ϕn|

(2a†a+ 1

)|ϕn〉 =

1

4λ~ω (2n+ 1)

〈ϕn|W |ϕn〉 =1

2λ~ω

(n+

1

2

)

〈ϕn+2|W |ϕn〉 =1

4λ~ω 〈ϕn+2|

(a†2)|ϕn〉 =

1

4λ~ω

√n+ 1 〈ϕn+2| a† |ϕn+1〉 =

1

4λ~ω

√n+ 1

√n+ 2 〈ϕn+2|ϕn+2〉

〈ϕn+2|W |ϕn〉 =1

4λ~ω

√(n+ 1) (n+ 2)

〈ϕn−2|W |ϕn〉 =1

4λ~ω 〈ϕn−2| a2 |ϕn〉 =

1

4λ~ω

√n 〈ϕn−2| a |ϕn−1〉 =

1

4λ~ω

√n√n− 1 〈ϕn−2|ϕn−2〉

〈ϕn−2|W |ϕn〉 =1

4λ~ω

√n (n− 1)

Evaluando la contribucion de segundo orden para la energıa a traves de la Ec. (20.42), obtenemos

En = E0n + 〈ϕn|W |ϕn〉+

p 6=n

|〈ϕp|W |ϕn〉|2E0n − E0

p

+O(λ3)

=

(n+

1

2

)~ω +

1

2λ~ω

(n+

1

2

)+

|〈ϕn+2|W |ϕn〉|2E0n − E0

n+2

+|〈ϕn−2|W |ϕn〉|2E0n − E0

n−2

+O(λ3)

=

(n+

1

2

)~ω

[1 +

1

]+

116λ

2~2ω2 (n+ 1) (n+ 2)

−2~ω+

116λ

2~2ω2n (n− 1)

2~ω+O

(λ3)

=

(n+

1

2

)~ω

[1 +

1

]− λ2~ω

32(n+ 1) (n+ 2) +

λ2~ω

32n (n− 1) +O

(λ3)

En =

(n+

1

2

)~ω

[1 +

1

]+λ2~ω

32[n (n− 1)− (n+ 1) (n+ 2)] +O

(λ3)

=

(n+

1

2

)~ω

[1 +

1

]− λ2~ω

32[4n+ 2] +O

(λ3)

=

(n+

1

2

)~ω

[1 +

1

]− 4λ2

32~ω

[n+

1

2

]+O

(λ3)

En =

(n+

1

2

)~ω

[1 +

1

2λ− λ2

8

]+O

(λ3)

que coincide con la expansion (20.63).

20.6.4. Perturbacion del oscilador armonico por un potencial cubico

Tomaremos un potencial de la formaW = λ~ωX3

En mecanica clasica, la partıcula con energıa total E sometida al potencial V = mω2x2/2 + Cx3 oscila entre dospuntos de retorno xa y xb que no estan ubicados simetricamente con respecto al origen, ya que el potencial totalno tiene paridad definida. El movimiento sigue siendo periodico pero ya no es sinusoidal (i.e. no es armonico). Dehecho, en la expansion de Fourier de x (t), aparecen una serie de armonicos de la frecuencia fundamental. Por talrazon a este sistema se le denomina oscilador anarmonico. Adicionalmente, el periodo del movimiento ya no es

Page 512: Mecanica Cuantica: Notas de Clase

512 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

independiente de la energıa (y por tanto no es independiente de la amplitud), decimos entonces que el osciladoranarmonico ya no es isocrono.

Expansion perturbativa

Nuevamente escribimos el potencial de perturbacion en terminos de operadores creacion y destruccion. Primero

calculamos(a+ a†

)3teniendo en cuenta (20.64)

(a+ a†

)3=

(a+ a†

)2 (a+ a†

)=(a†2 + a2 + 2a†a+ 1

)(a+ a†

)=(a†2 + a2 + 2N + 1

)(a+ a†

)

= a†2a+ a3 + 2Na+ a+ a†3 + a2a† + 2Na† + a†

= a†(a†a)+ a3 + 2Na+ a+ a†3 + a

(aa†)+ 2Na† + a†

= a†N + a3 + 2Na+ a+ a†3 + a([a, a†

]+ a†a

)+ 2Na† + a†

= a†N + a3 + 2Na+ a+ a†3 + a (1 +N) + 2Na† + a†

= a†3 + a3 + a†N + 2Na† + aN + 2Na+ 2a+ a†

= a†3 + a3 +[a†, N

]+Na† + 2Na† + [a,N ] +Na+ 2Na+ 2a+ a†

= a†3 + a3 − a† +Na† + 2Na† + a+Na+ 2Na+ 2a+ a†(a+ a†

)3= a†3 + a3 + 3Na† + 3Na+ 3a

donde hemos usado las Ecs. (8.13). Pag. 273. Con esto el potencial de perturbacion queda

W = λ~ωX3 = λ~ω

(a+ a†√

2

)3

W =λ~ω

23/2

[a†3 + a3 + 3Na† + 3 (N + 1) a

]

Los unicos elementos de matriz de W no nulos asociados con |ϕn〉 son

〈ϕn+3|W |ϕn〉 =λ~ω

23/2〈ϕn+3|

[a†3 + a3 + 3Na† + 3 (N + 1) a

]|ϕn〉 =

λ~ω

23/2〈ϕn+3| a†3 |ϕn〉

=λ~ω

23/2

√n+ 1 〈ϕn+3| a†2 |ϕn+1〉 =

λ~ω

23/2

√n+ 1

√n+ 2 〈ϕn+3| a† |ϕn+2〉

〈ϕn+3|W |ϕn〉 =λ~ω

23/2

√(n+ 1) (n+ 2) (n+ 3)

〈ϕn−3|W |ϕn〉 =λ~ω

23/2〈ϕn−3| a3 |ϕn〉 =

λ~ω

23/2√n 〈ϕn−3| a2 |ϕn−1〉 =

λ~ω

23/2

√n (n− 1) 〈ϕn−3| a |ϕn−2〉

〈ϕn−3|W |ϕn〉 =λ~ω

23/2

√n (n− 1) (n− 2)

Page 513: Mecanica Cuantica: Notas de Clase

20.6. PERTURBACIONES ESTACIONARIAS SOBRE EL OSCILADOR ARMONICO 513

〈ϕn+1|W |ϕn〉 =λ~ω

23/2〈ϕn+1|

[a†3 + a3 + 3Na† + 3 (N + 1) a

]|ϕn〉 =

λ~ω

23/2〈ϕn+1|

[3Na†

]|ϕn〉

= 3λ~ω

23/2

√n+ 1 〈ϕn+1|N |ϕn+1〉 = 3

λ~ω

23/2

√n+ 1 (n+ 1) 〈ϕn+1|ϕn+1〉

〈ϕn+1|W |ϕn〉 =3λ~ω

23/2(n+ 1)3/2

〈ϕn−1|W |ϕn〉 =λ~ω

23/2〈ϕn−1|

[a†3 + a3 + 3Na† + 3 (N + 1) a

]|ϕn〉 =

λ~ω

23/2〈ϕn−1| [3 (N + 1) a] |ϕn〉

=3λ~ω

23/2√n 〈ϕn−1| [(N + 1)] |ϕn−1〉 = 3

λ~ω

23/2[(n− 1) + 1]

√n 〈ϕn−1|ϕn−1〉

〈ϕn−1|W |ϕn〉 =3λ~ω

23/2n3/2

quedando finalmente

〈ϕn+3|W |ϕn〉 = λ~ω

√(n+ 1) (n+ 2) (n+ 3)

8; 〈ϕn−3|W |ϕn〉 = λ~ω

√n (n− 1) (n− 2)

8

〈ϕn+1|W |ϕn〉 = 3λ~ω

(n+ 1

2

)3/2

; 〈ϕn−1|W |ϕn〉 = 3λ~ω(n2

)3/2(20.65)

la energıa se calcula por medio de (20.42)

En = E0n + 〈ϕn|W |ϕn〉+

p 6=n

|〈ϕp|W |ϕn〉|2E0n − E0

p

+O(λ3)

En = E0n +

|〈ϕn+3|W |ϕn〉|2E0n − E0

n+3

+|〈ϕn−3|W |ϕn〉|2E0n − E0

n−3

+|〈ϕn+1|W |ϕn〉|2E0n − E0

n+1

+|〈ϕn−1|W |ϕn〉|2E0n − E0

n−1

+O(λ3)

En =

(n+

1

2

)~ω +

λ2~2ω2 (n+1)(n+2)(n+3)8

−3~ω+λ2~2ω2 n(n−1)(n−2)

8

3~ω

+9λ2~2ω2

(n+12

)3

−~ω+

9λ2~2ω2(n2

)3

~ω+O

(λ3)

En =

(n+

1

2

)~ω − (n+ 1) (n+ 2) (n+ 3)

24λ2~ω +

n (n− 1) (n− 2)

24λ2~ω

−9 (n+ 1)3

8λ2~ω +

9n3

8λ2~ω +O

(λ3)

En =

(n+

1

2

)~ω +

[n (n− 1) (n− 2)

24− (n+ 1) (n+ 2) (n+ 3)

24+

9n3

8− 9 (n+ 1)3

8

]λ2~ω

+O(λ3)

calcularemos la cantidad entre parentesis cuadrados

kn =1

24

[−9n2 − 9n− 6 + 27n3 − 27 (n+ 1)3

]=

1

24

[−9n2 − 9n− 6− 81n2 − 81n− 27

]

= − 1

24

[90n2 + 90n + 33

]= −90

24

[n2 + n+

33

90

]= −15

4

[n2 + n+

11

30

]

= −15

4

[(n+

1

2

)2

− 1

4+

11

30

]= −15

4

[(n+

1

2

)2

+7

60

]

kn = −15

4

(n+

1

2

)2

− 7

16

Page 514: Mecanica Cuantica: Notas de Clase

514 CAPITULO 20. TEORIA ESTACIONARIA DE PERTURBACIONES

con lo cual el espectro a segundo orden queda

En =

(n+

1

2

)~ω − 15

4

(n+

1

2

)2

λ2~ω − 7

16λ2~ω +O

(λ3)

notese que no hay contribucion de primer orden de modo que la correccion debida a W requiere como mınimocalcular el espectro a segundo orden. Por efecto de W , los niveles decrecen sin importar el signo de λ. Ademas elcorrimiento se incrementa con n. La diferencia entre dos niveles adyacentes a segundo orden es

En − En−1 = ~ω

[1− 15

2λ2n

]

de nuevo valores de n muy grandes (tales que 15λ2n/2 & 1), invalidarıan este calculo perturbativo. Notese que ladistancia entre niveles adyacentes depende ahora de n. Los niveles de energıa consecutivos ya no son equidistantes,y estan mas cerca a medida que crece n.

De las Ecs. (20.39, 20.65), el estado perturbado a primer orden nos da

|ψn (λ)〉 = |ϕn〉+∑

p 6=n

i

∣∣ϕip⟩⟨ϕip∣∣W |ϕn〉(

E0n − E0

p

) +O(λ2)

= |ϕn〉+ |ϕn+1〉〈ϕn+1|W |ϕn〉(E0n − E0

n+1

) + |ϕn−1〉〈ϕn−1|W |ϕn〉(E0n − E0

n−1

)

+ |ϕn+3〉〈ϕn+3|W |ϕn〉(E0n −E0

n+3

) + |ϕn−3〉〈ϕn−3|W |ϕn〉(E0n − E0

n−3

) +O(λ2)

|ψn (λ)〉 = |ϕn〉 − 3λ

(n+ 1

2

)3/2

|ϕn+1〉+ 3λ(n2

)3/2|ϕn−1〉

−λ3

√(n+ 1) (n+ 2) (n+ 3)

8|ϕn+3〉+

λ

3

√n (n− 1) (n− 2)

8|ϕn−3〉+O

(λ2)

Page 515: Mecanica Cuantica: Notas de Clase

Capıtulo 21

Metodo variacional

21.1. Descripcion del metodo

Supongamos que tenemos un Hamiltoniano independiente del tiempo H, con espectro discreto

H |ϕpn〉 = En |ϕpn〉

Si el Hamiltoniano no puede resolverse analıticamente en forma exacta, el metodo variacional es otra alternativa desolucion aproximada. El metodo consiste en escoger una familia de kets, asociados con un conjunto de parametrosα

|ψ (α)〉 = |ψ (α1, α2, . . . , αn)〉conocidas como funciones de prueba. Aunque estas funciones se pueden elegir en forma arbitraria, una aproxima-cion razonablemente buena solo se obtendra si las funciones de prueba se eligen con algun criterio Fısico. La ideaes entonces calcular el valor esperado del Hamiltoniano 〈H〉 (α) en estos estados y minimizar tal valor esperadocon respecto a los parametros α. El valor mınimo obtenido de esta forma constituye una aproximacion para elvalor del estado base E0 del sistema. Este metodo de minimizacion es una variante del calculo funcional cono-cida como metodo de variacion de parametros. De allı que el metodo de aproximacion se conozca como metodovariacional. Veremos que ademas es posible obtener con el metodo variacional una aproximacion a los estadosexcitados, aunque en la practica solo es viable para los primeros estados excitados.

21.2. Implementacion del metodo variacional

El metodo variacional se basa en los siguientes resultados

Theorem 21.1 Dado un ket arbitrario |ψ〉 del espacio de estados del sistema, el valor medio del Hamiltonianocon respecto a dicho estado cumple la condicion

〈H〉 = 〈ψ|H |ψ〉〈ψ|ψ〉 ≥ E0 (21.1)

siendo E0 el autovalor mas pequeno de H (estado base de H)1. La igualdad se obtiene si y solo si el ket |ψ〉 es unautoestado de H con autovalor E0.

Por simplicidad asumiremos que la base |ϕpn〉 de vectores propios de H es ortonormal, es decir que tambienes ortonormal la base de cada subespacio En generado por cada valor propio En. Puesto que los resultados finales

1La expresion (21.1) tiene en cuenta que en general el estado |ψ〉 no esta normalizado.

515

Page 516: Mecanica Cuantica: Notas de Clase

516 CAPITULO 21. METODO VARIACIONAL

son independientes de la base, esto no le quita generalidad al teorema. Para probarlo expandimos al estado |ψ〉 enla base de los estados propios |ϕpn〉 de H

|ψ〉 =∞∑

n=0

gn∑

p=1

cpn |ϕpn〉 (21.2)

con lo cual

〈ψ|H |ψ〉 =∞∑

m=0

gm∑

q=1

∞∑

n=0

gn∑

p=1

cq∗mcpn 〈ϕqm|H |ϕpn〉 =

m,n

q,p

Encq∗mc

pnδmnδqp

〈ψ|H |ψ〉 =

∞∑

n=0

gn∑

p=1

|cpn|2En ≥ E0

∞∑

n=0

gn∑

p=1

|cpn|2 (21.3)

por otro lado, de la Ec. (21.2) la norma al cuadrado de |ψ〉 nos da

〈ψ|ψ〉 =∞∑

n=0

gn∑

p=1

|cpn|2 (21.4)

y la combinacion de las Ecs. (21.3, 21.4) nos da la Ec. (21.1). De la expresion (21.2) vemos que el estado |ψ〉pertenece al subespacio E0 generado por el estado base E0, si y solo si cpn = δn0c

p0, y al utilizar esta condicion en

(21.3) se obtiene la igualdad en dicha expresion. Recıprocamente, si asumimos la igualdad en la expresion (21.3),dicha igualdad se puede escribir como

∞∑

n=0

gn∑

p=1

|cpn|2 (En − E0) = 0 ⇒∞∑

n=1

gn∑

p=1

|cpn|2 |En − E0| = 0

donde hemos tenido en cuenta que En−E0 > 0 para n ≥ 1. Por tanto, la igualdad es posible si y solo si cpn = δn0cp0

o equivalentemente si el estado |ψ〉 pertenece a E0. En conclusion, la igualdad en (21.3) ocurre si y solo si |ψ〉 esautoestado de H con autovalor E0.

Por simplicidad escribiremos los gn vectores linealmente independientes asociados a un valor propio En en unanotacion condensada de la siguiente manera

|ϕgnn 〉 ≡

∣∣ϕ1n

⟩,∣∣ϕ2n

⟩, . . . , |ϕgnn 〉

De los resultados anteriores se deriva un teorema que permite acotar los estados excitados

Theorem 21.2 Sea∣∣ϕg0

0

⟩,∣∣ϕg1

1

⟩,∣∣ϕg2

2

⟩, . . .

la secuencia ordenada de los estados propios (discretos) del Ha-

miltoniano H, asociados a valores propios E0, E1, E2, . . . colocados en orden ascendente En < En+1. Si |ψ〉 esun ket ortogonal a los kets

∣∣ϕg00

⟩,∣∣ϕg1

1

⟩, . . . ,

∣∣ϕgkk

⟩, el valor esperado de H asociado a dicho estado cumple la

condicion

〈H〉 = 〈ψ|H |ψ〉〈ψ|ψ〉 ≥ Ek+1 (21.5)

y la igualdad se obtiene si y solo si |ψ〉 es autoestado de H con valor propio Ek+1.

Para probarlo, basta observar que la ortogonalidad de |ψ〉 con los estados asociados a los primeros k valorespropios Ei, nos lleva a que los terminos de la expansion asociados a los k primeros valores propios en (21.2) debenser nulos

|ψ〉 =∞∑

n=k+1

gn∑

p=1

cpn |ϕpn〉 (21.6)

Page 517: Mecanica Cuantica: Notas de Clase

21.2. IMPLEMENTACION DEL METODO VARIACIONAL 517

con el mismo procedimiento que nos lleva a las Ecs. (21.3, 21.4), obtenemos

〈ψ|H |ψ〉 =∞∑

n=k+1

gn∑

p=1

|cpn|2En ≥ Ek+1

∞∑

n=k+1

gn∑

p=1

|cpn|2 ; 〈ψ|ψ〉 =∞∑

n=k+1

gn∑

p=1

|cpn|2

combinando estas dos ecuaciones obtenemos (21.5). De nuevo la igualdad se obtiene si y solo si cpn = δn,k+1cpk+1,

con lo cual la Ec. (21.6) nos dice que |ψ〉 ∈ Ek+1, o equivalentemente que |ψ〉 es autoestado de H con valor propioEk+1.

Otro resultado fundamental es el siguiente

Theorem 21.3 (Ritz) El valor medio del Hamiltoniano 〈H〉|ψ〉 es estacionario si y solo si el vector de estado |ψ〉en el cual se evalua, es autovector de H. Ademas los valores estacionarios de 〈H〉 son los valores propios de H,esto es

H |ψ〉 = 〈H〉 |ψ〉 (21.7)

se dice tambien que el valor esperado de H solo es estacionario en la vecindad de sus estados propios discretos.

Para verlo tenemos en cuenta que el valor esperado del Hamiltoniano es

〈H〉 = 〈ψ|H |ψ〉〈ψ|ψ〉 (21.8)

es claro entonces que este valor esperado es un funcional del estado |ψ〉. Vamos a calcular el incremento δ〈H〉cuando el estado |ψ〉 sufre el cambio infinitesimal al estado |ψ〉+ |δψ〉. Para calcular el variacional de 〈H〉 debidoal cambio infinitesimal en el estado, escribimos la Ec. (21.8) en la forma

〈H〉 〈ψ|ψ〉 = 〈ψ|H |ψ〉

y calculando el variacional a ambos lados tenemos

〈ψ|ψ〉δ〈H〉 + 〈H〉 [〈δψ|ψ〉+ 〈ψ| δψ〉] = 〈δψ|H |ψ〉+ 〈ψ|H |δψ〉

y teniendo en cuenta que 〈H〉 es un numero

〈ψ|ψ〉δ〈H〉 = 〈δψ| [H − 〈H〉] |ψ〉+ 〈ψ| [H − 〈H〉] |δψ〉 (21.9)

buscaremos las condiciones para que δ 〈H〉 se anule, es decir las condiciones para que se anule el lado derecho dela ecuacion (21.9)

〈δψ| [H − 〈H〉] |ψ〉+ 〈ψ| [H − 〈H〉] |δψ〉 = 0 (21.10)

definiendo|ϕ〉 ≡ [H − 〈H〉] |ψ〉 (21.11)

la relacion (21.10) se escribe como〈δψ|ϕ〉+ 〈ϕ| δψ〉 = 0 (21.12)

la condicion (21.12) se debe cumplir para cualquier ket infinitesimal |δψ〉, ya que la condicion de estacionaridadrequiere que δ 〈H〉 = 0, sin importar la forma de la variacion de |ψ〉, con la unica condicion de que esta variacionsea infinitesimal. En particular, la expresion (21.12) se debe cumplir para la variacion infinitesimal dada por

|δψ〉 = (δλ) |ϕ〉

siendo δλ un numero real infinitesimal, para este ket la Ec. (21.12) queda en la forma

2 〈ϕ|ϕ〉 δλ = 0

Page 518: Mecanica Cuantica: Notas de Clase

518 CAPITULO 21. METODO VARIACIONAL

de modo que la norma del ket (y por lo tanto el ket) debe ser nulo i.e. |ϕ〉 = 0. Aplicando esta condicion en ladefinicion (21.11) resulta

H |ψ〉 = 〈H〉 |ψ〉 (21.13)

mostrando que la Ec. (21.13) es una condicion de necesidad para la anulacion de δ 〈H〉. La demostracion de lasuficiencia se obtiene simplemente reemplazando la condicion (21.13) en la Ec. (21.9).

El anterior teorema implica que el metodo variacional se puede generalizar para aplicarlo a la determinacionaproximada de algunos valores propios de H. Si la funcion 〈H〉 (α) obtenida por medio de los kets de prueba|ψ (α)〉 tiene varios extremos, estos nos daran un valor aproximado de algunos de los autovalores En.

Notese que en los anteriores teoremas no es estrictamente necesario que el observable sea el Hamiltoniano.Un repaso cuidadoso le muestra al lector que las demostraciones anteriores quedan intactas si en lugar del Ha-miltoniano utilizamos cualquier observable (operador hermıtico completo) cuyo espectro sea discreto y acotadoinferiormente (es decir que exista un valor propio que sea menor que todos los demas valores propios del espectro).En consecuencia, los teoremas anteriores se pueden generalizar para cualquier observable con espectro discretoacotado inferiormente.

21.3. Funciones de prueba restringidas a un subespacio de ESi elegimos los kets de prueba como el conjunto de kets en un subespacio F ⊆ E , entonces el metodo variacional

se reduce a la resolucion de la ecuacion de valores propios del Hamiltoniano H dentro del subespacio F y no enel espacio vectorial E . Esto se puede ver aplicando los argumentos de la seccion 21.2, pero restringidos a vectores|ψ〉 que pertenecen a F . Los maximos y mınimos que encontramos con la condicion de estacionaridad δ 〈H〉 = 0,se obtienen cuando |ψ〉 es un autovector de H que pertenece a F . Los autovalores ası obtenidos constituyen unaaproximacion variacional para los autovalores de H en E que son los que estamos buscando.

Cuando se utiliza la restriccion del problema de valores propios de H a un subespacio F ⊆ E , el problema sesimplifica considerablemente. Sin embargo, es importante mencionar que incluso la solucion exacta del problemade valores propios restringido a F , constituye solo una aproximacion al problema de valores propios en E . Esto sedebe a que la restriccion de un operador a un subespacio cambia la naturaleza del operador como tal (ver seccion1.33, Pag. 74), de modo que la restriccion H del Hamiltoniano es un operador diferente al Hamiltoniano en sı.

Esta aproximacion de cambiar el problema de valores propios del Hamiltoniano H sobre E , por el problemade valores propios de su restriccion H a un subespacio F ⊆ E , es razonable solo si los elementos matriciales de laforma 〈ϕ|H |ψ〉 con |ϕ〉 y |ψ〉 dentro de F son mucho mayores (en valor absoluto) que los elementos matricialesde la forma 〈χ|H |ψ〉 con |ψ〉 ∈ F y con |χ〉 /∈ F . Esta hipotesis fue la que se supuso para asumir que existensistemas cuanticos que pueden tratarse como sistemas de dos estados (ver Cap. 17). En algunos casos es posibleasumir que el sistema se puede tratar aproximadamente como un sistema de n estados con n finito. Es en estosescenarios en los cuales el metodo variacional restringido a un subespacio de E , adquiere importancia practica.

Por tanto, para que el problema de valores propios de H restringido a un subespacio F de E , nos de unabuena aproximacion de los valores propios del Hamiltoniano considerado como operador de E , es necesario queel subespacio F se escoja adecuadamente. En fısica molecular, utilizaremos el metodo de combinacion linealde orbitales atomicos (L.C.A.O por sus siglas en ingles) que consiste en determinar la funcion de onda de loselectrones en una molecula en forma de combinaciones lineales de autofunciones asociadas a cada uno de losatomos que constituyen la molecula, tratados como si fueran aislados. Los coeficientes de la combinacion linealseran los parametros variacionales y el conjunto de todos los orbitales linealmente independientes solo expandeun subespacio de E . Observese que la teorıa de perturbaciones a primer orden se ajusta a este metodo variacionalparticular, siendo F un autosubespacio del Hamiltoniano sin perturbar H0.

Ahora bien, lo usual en el metodo variacional es tomar un conjunto de funciones de prueba de la formaψ (α1, . . . , αn) con el fin de encontrar los valores de los parametros αk que minimicen la distancia entre la funcionde prueba y la solucion de la funcion de onda. Es tambien usual que estas funciones cumplan ciertas ligaduras(por ejemplo ser de cuadrado integrable, tener norma unidad, paridad definida etc.). Cuando barremos todos

Page 519: Mecanica Cuantica: Notas de Clase

21.4. ESPECTRO DEL OSCILADOR ARMONICO POR METODOS VARIACIONALES 519

los valores posibles del conjunto de n parametros (compatibles con las ligaduras) se generan un conjunto defunciones linealmente independientes que usualmente no forman una base del espacio de Hilbert completo sino deun subespacio propio de este2. Por esta razon aun la solucion exacta del problema variacional no es una solucionexacta del problema de valores propios en el espacio de Hilbert completo. De hecho en la practica es muy difıcildeterminar cual subespacio es el mas pequeno que contiene a esta familia de soluciones.

21.4. Espectro del oscilador armonico por metodos variacionales

21.4.1. Estimacion del estado base

Utilizaremos el oscilador armonico unidimensional para ilustrar las ideas inherentes al metodo variacional.Partimos entonces del Hamiltoniano

H = − ~2

2m

d2

dx2+

1

2mω2x2

puesto que este Hamiltoniano es par, puede demostrarse que el estado base debe estar representado por una funcionde onda par. Por tanto, debemos elegir funciones de prueba pares. Tomaremos entonces la familia uniparametricade funciones

ψα (x) = e−αx2

; α > 0 (21.14)

esta funcion es par, y la condicion α > 0 se requiere para que ψα (x) sea de cuadrado integrable. El cuadrado dela norma del ket viene dado por

〈ψα |ψα〉 =∫ ∞

−∞e−2αx2 dx =

√π

2α(21.15)

y el elemento matricial 〈ψα|H |ψα〉 queda

I ≡ 〈ψα|H |ψα〉 =∫ ∞

−∞dx e−αx

2

[− ~2

2m

d2

dx2+

1

2mω2x2

]e−αx

2

=

∫ ∞

−∞dx e−αx

2

~2

2m

d

dx

[2αxe−αx

2]+

1

2mω2x2e−αx

2

=

∫ ∞

−∞dx

α~2

m− 4α2x2

~2

2m+

1

2mω2x2

e−2αx2 =

∫ ∞

−∞dx

α~2

m+

[1

2mω2 − 2α2~2

m

]x2e−2αx2

I = α~2

m

∫ ∞

−∞dx e−2αx2 +

[1

2mω2 − 2α2~2

m

] ∫ ∞

−∞dx x2e−2αx2 (21.16)

por otro lado, integrando x2e−2αx2 por partes resulta

u = x , dv = xe−2αx2 dx ; du = dx , v = − 1

4αe−2αx2

∫x2e−2αx2 dx = − x

4αe−2αx2 +

1

∫e−2αx2dx

∫ ∞

−∞x2e−2αx2 dx =

1

∫ ∞

−∞e−2αx2dx (21.17)

sustituyendo (21.17) en (21.16), la integral I queda

I =

[α~2

m+mω2

8α− α~2

2m

] ∫ ∞

−∞e−2αx2dx

2De hecho el conjunto de todas las funciones que se obtienen al barrer los parametros, no necesariamente forma un espacio vec-torial. Podrıa ser solo un subconjunto propio del espacio vectorial generado por todas las funciones linealmente independientes antesmencionadas.

Page 520: Mecanica Cuantica: Notas de Clase

520 CAPITULO 21. METODO VARIACIONAL

con lo cual el elemento matricial 〈ψα|H |ψα〉 queda finalmente

〈ψα|H |ψα〉 =[~2

2mα+

mω2

] ∫ ∞

−∞dx e−2αx2 =

[~2

2mα+

mω2

]〈ψα |ψα〉

donde hemos usado (21.15). Aplicando la Ec. (21.8) tenemos

〈H〉 (α) = 〈ψα|H |ψα〉〈ψα |ψα〉

=

[~2

2mα+

mω2

](21.18)

calculamos el valor (o valores) de α para el cual 〈H〉 (α) se convierte en un extremo

∂ 〈H〉 (α)∂α

=~2

2m− mω2

8α2= 0

⇒ ~2

2mα2 − mω2

8= 0

las soluciones son α1,2 = ±mω/2~, pero recordemos que α debe ser positivo para que la funcion de prueba (21.14)sea de cuadrado integrable. Por tanto, el valor de α ≡ α0 para el cual 〈H〉 (α) es estacionario esta dado por

α0 =mω

2~(21.19)

sustituyendo (21.19) en (21.18) obtenemos el valor estacionario de 〈H〉 (α0)

〈H〉 (α0) =~2

2mα0 +

mω2

8α0=

~2

2m

2~+

2~mω2

8mω=

4+

4

〈H〉 (α0) =~ω

2

en este caso, el valor mınimo de 〈H〉 (α) coincide exactamente con la energıa base del problema ya conocidodel oscilador armonico unidimensional. Esto se debe a que la funcion de onda exacta (sin normalizar) coincideexactamente con la funcion de onda de prueba para un valor especıfico del parametro α, como se puede ver alcomparar la Ec. (8.48), Pag. 281 con la Ec. (21.14). El hecho de que la condicion de estacionaridad de 〈H〉 (α)nos lleve al valor de α que iguala las ecuaciones (8.48, 21.14) se debe precisamente al teorema 21.1.

21.4.2. Estimacion del primer estado excitado

Si queremos calcular en forma aproximada el valor del primer estado excitado E1, debemos buscar funcionesde prueba que sean ortogonales a la funcion de onda del estado base. En tal caso segun el teorema 21.2, el valoresperado 〈H〉 nos provee de una cota superior para el estado E1. Utilizaremos entonces una funcion de pruebaimpar y que sea ortogonal al estado base

ψα (x) = xe−αx2

(21.20)

en cuyo caso tenemos

〈ψα |ψα〉 =∫ ∞

−∞x2e−2αx2 dx

y el elemento matricial 〈ψα|H |ψα〉 queda

〈ψα|H |ψα〉 =

∫ ∞

−∞dx xe−αx

2

[− ~2

2m

d2

dx2+

1

2mω2x2

](xe−αx

2)=

[3~2

2mα+

3mω2

] ∫ ∞

−∞dx x2e−2αx2

〈ψα|H |ψα〉 =

[3~2

2mα+

3mω2

]〈ψα |ψα〉

Page 521: Mecanica Cuantica: Notas de Clase

21.5. ESPECTRO DEL OSCILADOR ARMONICO CON OTRAS FUNCIONES DE PRUEBA 521

el valor esperado de H queda entonces

〈H〉 (α) = 〈ψα|H |ψα〉〈ψα |ψα〉

=3~2

2mα+

3mω2

8α(21.21)

la condicion estacionaria nos da

∂ 〈H〉∂α0

=3~2

2m− 3mω2

8α20

= 0 ⇒ 3~2

2mα20 =

3mω2

8

α0 =mω

2~

por tanto 〈H〉 (α) presenta un mınimo en el mismo valor α0 que para el caso del estado base como se ve en la Ec.(21.19). Con este valor de α0, la Ec. (21.21) queda

〈H〉 (α0) =3~2

2mα0 +

3mω2

8α0=

3~2

2m

2~+

6~mω2

8mω

〈H〉 (α0) =3~ω

2

una vez mas se obtiene el valor exacto de E1 para el oscilador armonico unidimensional, debido a que la familiade funciones de prueba (21.20) incluye a la solucion exacta (sin normalizar) dada en la Ec. (8.51), Pag. 282.

21.5. Espectro del oscilador armonico con otras funciones de prueba

Aunque los calculos de la seccion 21.4 nos permiten familiarizarnos con el metodo variacional, no nos permitentener una idea de la efectividad de la aproximacion, puesto que las funciones de prueba propuestas incluyen lasolucion exacta. Usaremos entonces funciones de prueba diferentes, aunque mantendremos la idea de que seanfunciones pares de cuadrado integrable para el estado base. Otra familia de funciones que cumple con dichaspropiedades es la siguiente

ψα (x) =1

x2 + α; α > 0

la norma de estas funciones de prueba esta dada por

〈ψα |ψα〉 =∫ ∞

−∞

dx

(x2 + α)2=

π

2α√α

el valor esperado queda finalmente

〈H〉 (α) = ~2

2m

1

α+

1

2mω2α

esta funcion adquiere su valor mınimo en α = α0 dado por

α0 =1√2

~

mω⇒ 〈H〉 (α0) =

~ω√2

el error porcentual cometido en este caso se puede evaluar dado que conocemos el valor exacto de E0

〈H〉 (α0)− 12~ω

~ω=

√2− 1

2≈ 20%

????????????????????????

Page 522: Mecanica Cuantica: Notas de Clase

Capıtulo 22

Teorıa de perturbaciones dependiente deltiempo

Al igual que en la teorıa de perturbaciones estacionaria, vamos a suponer que tenemos un Hamiltoniano H0

no perturbado cuya solucion conocemos. Por simplicidad asumiremos que el espectro de H0 es discreto y nodegenerado

H0 |ϕn〉 = En |ϕn〉sera facil generalizar las formulas obtenidas para el caso degenerado. Asumiremos que el Hamiltoniano no pertur-bado es independiente del tiempo, con lo cual los autoestados |ϕn〉 tampoco dependen del tiempo. En consecuencia,los estados |ϕn〉 son estacionarios1. En el tiempo t = 0, se aplica una perturbacion al sistema parametrizada en laforma

H = H0 +W (t) ≡ H0 + λW (t)

donde λ es un parametro adimensional mucho menor que la unidad y W (t) es un observable que puede dependerexplıcitamente del tiempo y que es del mismo orden de magnitud de H0 en el intervalo de tiempo involucrado. Seasume que W (t) = 0 para t < 0.

Se asume ademas que el sistema esta inicialmente en el estado estacionario |ϕk〉 de H0 asociado a la energıaEk. Si no existiera la perturbacion este estado no evolucionarıa en el tiempo, pero al introducir la perturbacionen t = 0, el estado |ϕk〉 no sera en general autoestado de H de modo que deja de ser un estado estacionario,y comenzara a evolucionar en el tiempo. Nuestro objetivo sera calcular la probabilidad de transicion Pif (t) deencontrar al sistema en otro autoestado |ϕf 〉 de H0 en el tiempo t. Es decir queremos estudiar las transicionesque se inducen a traves de W (t) entre los estados estacionarios de H0. Debemos recordar que la probabilidad detransicion entre |ϕk〉 y |ϕf 〉 realmente significa la probabilidad de obtener la medida Ef de la energıa cuando laperturbacion W (t) se activa en t = 0 y se desactiva en t (es decir en el tiempo en el cual se ejecuta la medicionde la energıa), teniendo a |ϕk〉 como estado inicial [ver discusion en la seccion 17.3, particularmente despues de laEc. (17.30), Pag. 4332].

Entre los tiempos 0 y t, el sistema evoluciona de acuerdo con la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 =

[H0 + λW (t)

]|ψ (t)〉 (22.1)

con la condicion inicial

|ψ (t = 0)〉 = |ϕi〉 (22.2)

1Cuando el Hamiltoniano es dependiente del tiempo sus autoestados ya no son estacionarios. Esto es una manifestacion de la noconservacion de la energıa, cuando el Hamiltoniano depende explıcitamente del tiempo (ver seccion 3.2 Pag. 158 y seccion 5.8 Pag.225).

2De hecho la discusion en el presente capıtulo constituye una generalizacion de los resultados obtenidos para sistemas de dos estados,en el capıtulo 17.

522

Page 523: Mecanica Cuantica: Notas de Clase

22.1. SOLUCION PERTURBATIVA DE LA ECUACION DE SCHRODINGERDEPENDIENTE DEL TIEMPO523

la solucion de la ecuacion de Schrodinger (22.1) con la condicion inicial (22.2) es unica de modo que la evoluciondel estado es determinista en tanto no se realice una medida. La probabilidad Pif (t) que buscamos esta dada por

Pif (t) = |〈ϕf |ψ (t)〉|2 (22.3)

por tanto el problema se reduce a encontrar la solucion |ψ (t)〉 de la ecuacion de Schrodinger (22.1) con la condicioninicial (22.1). No obstante, para la mayorıa de problemas reales esta solucion no se puede encontrar en formaexacta, por lo cual recurriremos a una solucion aproximada utilizando series de potencias en λ de forma similara la teorıa de perturbaciones estacionaria. Como antes, la solucion es aproximadamente correcta cuando λ ≪ 1.Encontraremos |ψ (t)〉 y Pif (t) a primer orden en λ. Estudiaremos un caso de particular importancia en el cual laperturbacion es una funcion sinusoidal del tiempo, del cual surgiran fenomenos de resonancia. Se estudiara el casoen el cual el espectro de H0 es discreto y aquel en el cual el estado inicial esta acoplado a un contınuo de estadosfinales. En el ultimo caso probaremos una importante relacion conocida como la regla de oro de Fermi.

22.1. Solucion perturbativa de la ecuacion de Schrodinger dependiente deltiempo

Para resolver la ecuacion de Schrodinger es necesario utilizar una base. Puesto que esperamos que las solucionesno sean muy diferentes a los estados estacionarios, es razonable utilizar estos ultimos como base para resolver laecuacion de Schrodinger. Comenzamos entonces expandiendo el estado a resolver en terminos de los autoestadosde H0

|ψ (t)〉 =∑

m

cm (t) |ϕm〉 ; cm (t) = 〈ϕm|ψ (t)〉 (22.4)

para escribir la ecuacion de Schrodinger en la base |ϕn〉, multiplicamos la ecuacion (22.1) por el bra 〈ϕn|,insertando una identidad asociada a la completez de los estados estacionarios

i~d

dt〈ϕn |ψ (t)〉 = 〈ϕn|H0 |ψ (t)〉+ λ 〈ϕn| W (t)

(∑

k

|ϕk〉 〈ϕk|)|ψ (t)〉

i~d

dt〈ϕn |ψ (t)〉 = En〈ϕn |ψ (t)〉+ λ

k

〈ϕn| W (t) |ϕk〉 〈ϕk |ψ (t)〉

notese que hemos usado el hecho de que 〈ϕn| no depende del tiempo (lo cual a su vez proviene de que H0 nodependa del tiempo). Utilizando la Ec. (22.4), la ecuacion queda finalmente

i~d

dtcn (t) = En cn (t) + λ

k

Wnk (t) ck (t) ; Wnk (t) ≡ 〈ϕn| W (t) |ϕk〉 (22.5)

el conjunto de ecuaciones (22.5) para todo n es un conjunto de ecuaciones diferenciales lineales acopladas de primerorden en t, que nos determinan las componentes cn (t) de la expansion (22.4) del estado que buscamos. Notese

que el acople surge debido a la presencia de los elementos matriciales no diagonales Wnk (t) de la perturbacion

W (t) en la base de los estados estacionarios. El elemento Wnk (t) acopla la evolucion de la componente cn (t) con

la evolucion de ck (t). Vemos entonces que si W es nulo, o si solo son no nulos los elementos diagonales Wnn (t),las ecuaciones (22.5) se desacoplan3. Esto es de esperarse ya que en este caso los estados |ϕn〉 continuan siendoestacionarios despues de la introduccion de la perturbacion, produciendo solo un corrimiento del espectro. Enparticular cuando W (t) = 0, las ecuaciones (22.5) se desacoplan generando la solucion

cn (t) = bne−iEnt/~ (22.6)

3Recordemos que W es diagonal en la base de autovectores de H0 si y solo si H0 conmuta con W .

Page 524: Mecanica Cuantica: Notas de Clase

524 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

siendo bn constantes que dependen de las condiciones iniciales. Si asumimos que λW (t) es muy pequeno, lassoluciones para cn (t) no deben diferir mucho de aquellas dadas por (22.6). En consecuencia, si parametrizamoslas soluciones de cn (t) en presencia de la perturbacion en la forma

cn (t) = bn (t) e−iEnt/~ (22.7)

es de esperarse que la evolucion temporal de bn (t) sea suave. Si sustituımos las Ecs. (22.7) en las ecuaciones (22.5)obtenemos un conjunto de ecuaciones diferenciales acopladas para los bn (t)

i~d

dt

[bn (t) e

−iEnt/~]

= En bn (t) e−iEnt/~ + λ

k

Wnk (t) bk (t) e−iEkt/~

i~e−iEnt/~dbn (t)

dt+ Enbn (t) e

−iEnt/~ = En bn (t) e−iEnt/~ + λ

k

Wnk (t) bk (t) e−iEkt/~

i~e−iEnt/~dbn (t)

dt= λ

k

Wnk (t) bk (t) e−iEkt/~ (22.8)

multiplicando a ambos lados de (22.8) por eiEnt/~, y recordando la definicion de la frecuencias de Bohr Ec. (5.74),Pag. 228, usamos las frecuencias angulares de Bohr (aunque sin valor absoluto)

ωnk =En − Ek

~(22.9)

y la Ec. (22.8) se convierte en

i~dbn (t)

dt= λ

k

Wnk (t) bk (t) eiωnkt (22.10)

debemos enfatizar que hasta el momento no se han realizado aproximaciones. La Ec. (22.10) es totalmente equiva-lente a la ecuacion de Schrodinger, al igual que la ecuacion (22.5). Sin embargo, la Ec. (22.10) tiene la ventaja conrespecto a (22.5) de que para los bn (t) esperamos un comportamiento suave. En consecuencia, se obtendra unamejor aproximacion si tratamos los bn (t) perturbativamente (en lugar de los cn (t)). Por lo tanto, realizaremosuna expansion en potencias de λ de los bn (t)

bn (t) = b(0)n (t) + λb(1)n (t) + λ2b(2)n (t) + . . . =

∞∑

q=0

λqb(q)n (t) (22.11)

sustituyendo la expansion (22.11) en (22.10) tenemos

i~d

dt

∞∑

q=0

λqb(q)n (t) = λ∑

k

Wnk (t)

∞∑

p=0

λpb(p)k (t)

eiωnkt

i~

∞∑

q=0

λqdb

(q)n (t)

dt=

k

∞∑

p=0

Wnk (t) λp+1b

(p)k (t) eiωnkt

donde hemos usado el hecho de que λ no depende del tiempo. Reasignando q ≡ p + 1 en el lado derecho de estaecuacion se obtiene

i~

∞∑

q=0

λqdb

(q)n (t)

dt=∑

k

∞∑

q=1

Wnk (t) λqb

(q−1)k (t) eiωnkt

Page 525: Mecanica Cuantica: Notas de Clase

22.1. SOLUCION PERTURBATIVA DE LA ECUACION DE SCHRODINGERDEPENDIENTE DEL TIEMPO525

e igualando potencias de λ encontramos

i~db

(0)n (t)

dt= 0 (22.12)

i~db

(q)n (t)

dt=

k

eiωnktWnk (t) b(q−1)k (t) ; q ≥ 1 (22.13)

vemos entonces que a partir de la solucion a orden cero Ec. (22.12) y las condiciones iniciales, la relacion derecurrencia (22.13) nos permite obtener la solucion a primer orden, luego de lo cual la recurrencia (22.13) nospermite obtener la solucion de segundo orden con base en la solucion de primer orden. En general, la recurrencia(22.13) nos permite obtener la solucion de orden q con base en la solucion de orden q − 1.

22.1.1. Estado del sistema a primer orden en λ

Asumiremos que el estado es |ϕi〉 para todo t < 0. En tal caso, la solucion (22.6) es valida para t < 0, portanto se tiene que

bn (t) = δni para t < 0

en t = 0 se “enciende” la perturbacion λW de modo que el potencial es discontınuo en t = 0. No obstante, puestoque λW permanece acotado (y por tanto el potencial total), la solucion de la ecuacion de Schrodinger es contınuaen t = 0 (ver discusion en la seccion 3.5.1, Pag. 167), de lo cual se sigue que

bn (t = 0) = δni

y puesto que esta relacion es valida para todo λ, los coeficientes de la expansion (22.11) deben cumplir la relacion

b(0)n (t = 0) = δni , b(q)n (t = 0) = 0 ; q ≥ 1 (22.14)

La ecuacion (22.12) nos dice que b(0)n (t) es constante, por tanto

b(0)n (t) = δni

que determina completamente la solucion a orden cero. Como era de esperarse, esto nos indica que la solucion aorden cero coincide con |ϕi〉. Ahora utilizamos la recurrencia (22.13) para evaluar la contribucion a primer orden

i~db

(1)n (t)

dt=

k

eiωnktWnk (t) b(0)k (t)

i~db

(1)n (t)

dt=

k

eiωnktWnk (t) δki (22.15)

i~db

(1)n (t)

dt= eiωnitWni (t) (22.16)

que junto con las condiciones iniciales (22.14) nos da

b(1)n (t) =1

i~

∫ t

0eiωnit

′Wni

(t′)dt′ (22.17)

y sustituyendo (22.17) en (22.7) obtenemos

c(1)n (t) = b(1)n (t) e−iEnt/~ =e−iEnt/~

i~

∫ t

0eiωnit

′Wni

(t′)dt′ (22.18)

finalmente, sustituyendo (22.18) en (22.4) encontramos el estado |ψ (t)〉 a primer orden en λ

∣∣∣ψ(1) (t)⟩=∑

n

c(1)n (t) |ϕn〉 =1

i~

n

[e−iEnt/~ |ϕn〉

∫ t

0eiωnit

′Wni

(t′)dt′]

(22.19)

Page 526: Mecanica Cuantica: Notas de Clase

526 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

22.1.2. Probabilidad de transicion a segundo orden en λ

De acuerdo con la expresion (22.3) y la definicion (22.4) de los coeficientes de Fourier cn (t) tenemos que

Pif (t) = |cf (t)|2

por otro lado la Ec. (22.7) nos dice que bn (t) y cn (t) tienen el mismo modulo. En consecuencia

Pif (t) = |bf (t)|2 =∣∣∣b(0)f (t) + λb

(1)f (t) + λ2b

(2)f (t) + . . .

∣∣∣2

(22.20)

donde hemos usado la expansion (22.11). De aquı en adelante asumiremos que los estados inicial |ϕi〉 y final

|ϕf 〉 son diferentes. Por tanto nos enfocaremos solo en las transiciones inducidas por λW (t) entre dos estados

estacionarios distintos de H0. En este caso la Ec. (22.14) nos dice que b(0)f (t) = 0, con lo cual la probabilidad de

transicion (22.20) a segundo orden en λ nos da

P(2)if (t) = λ2

∣∣∣b(1)f (t)∣∣∣2

; i 6= f (22.21)

vemos que la primera contribucion no trivial a Pif (t) es de segundo orden en λ dado que es un producto interno

al cuadrado4. Sustituyendo (22.17) en (22.21) y reemplazando λW (t) por W (t) resulta

P(2)if (t) =

1

~2

∣∣∣∣∫ t

0eiωfit

′Wfi

(t′)dt′∣∣∣∣2

(22.22)

ya hemos dicho que para que la probabilidad de transicion tenga sentido, debe ocurrir lo siguiente: (a) La per-turbacion debe “conectarse” en t = 0 y “desconectarse” en el tiempo t, y (b) En el tiempo t (justo despues dedesconectar la perturbacion) debemos realizar una medicion de la energıa para determinar si el sistema quedopreparado en el estado |ϕf 〉. La Ec. (22.22) nos muestra que Pif (t) es proporcional al modulo al cuadrado de latransformada de Fourier de la perturbacion Wfi. La frecuencia angular con que se evalua la transformada es lafrecuencia angular de Bohr Ec. (22.9) asociada a las energıas Ei y Ef . Notese que la probabilidad de transicion asegundo orden es cero si Wfi (t) es cero para todo t.

Si comparamos las Ecs. (22.10) con las Ecs. (22.15), vemos que la aproximacion de primer orden en bn (t)equivale a reemplazar en la sumatoria los bk (t) por sus valores iniciales bk (0) = δki. Por tanto, la aproximaciona primer orden para bn (t) sera valida para tiempos suficientemente cortos de modo que bk (t) no haya variadomucho con respecto a bk (0). Para valores suficientemente largos del tiempo esta condicion puede violarse y engeneral requeriremos tomar ordenes mas altos en λ. De hecho tiempos muy largos podrıan hacer que se pierda elcaracter perturbativo de W , en tal caso debemos recurrir a otros metodos.

Por otro lado, puede demostrarse que a primer orden en |ψ (t)〉 para tiempos t′′ mayores que t, la probabilidades la misma que para el tiempo t

P(2)if

(t′′)= P

(2)if (t) si t′′ ≥ t (22.23)

para verlo observemos que si no se realiza una medicion en el tiempo t, el estado evoluciona desde el estado inicial|ψ (t)〉 hasta el estado final |ψ (t′′)〉 bajo el Hamiltoniano H0 (ya que la perturbacion ha sido desconectada). Elestado inicial (a primer orden en λ) viene dado por (22.19)

∣∣∣ψ(1) (t)⟩=∑

n

c(1)n (t) |ϕn〉

4Notese que si el estado inicial no es autoestado de H0, o si consideramos el caso i = f , tendremos contribucion a primer orden enλ puesto que en tales casos b

(0)f (t) es diferente de cero y por tanto aparece contribucion de primer orden en la Ec. (22.20) a traves del

producto cruzado entre b(0)f (t) y λb

(1)f (t).

Page 527: Mecanica Cuantica: Notas de Clase

22.2. PERTURBACIONES SINUSOIDALES Y CONSTANTES 527

y como ahora el Hamiltoniano es independiente del tiempo podemos aplicar la ecuacion (3.18) para la evoluciontemporal del estado, donde t es el tiempo inicial y t′′ el tiempo final, de modo que

∣∣∣ψ(1)(t′′)⟩

=∑

n

c(1)n (t) |ϕn〉 e−iEn(t′′−t)/~

de modo que la probabilidad de transicion Pif (t′′) estara dada por

P(2)if

(t′′)

=∣∣∣〈ϕf

∣∣∣ψ(1)(t′′)⟩∣∣∣

2=

∣∣∣∣∣∑

n

c(1)n (t) 〈ϕf |ϕn〉 e−iEn(t′′−t)/~

∣∣∣∣∣

2

=

∣∣∣∣∣∑

n

c(1)n (t) δnf e−iEn(t′′−t)/~

∣∣∣∣∣

2

=∣∣∣c(1)f (t) e−iEf (t

′′−t)/~∣∣∣2

P(2)if

(t′′)

=∣∣∣c(1)f (t)

∣∣∣2= Pif (t)

por tanto, esta probabilidad (a segundo orden en λ) solo es funcion del tiempo en el cual se desconecta laperturbacion, pero no es funcion del tiempo en el cual se mide la energıa, siempre y cuando la medida seaposterior a la desconexion de la perturbacion.

22.2. Perturbaciones sinusoidales y constantes

Asumiremos que W (t) tiene la siguiente forma

W (t) = λW (t) = λW sinωt (22.24)

W (t) = λW (t) = λW cosωt (22.25)

donde W es un observable independiente del tiempo y ω una frecuencia angular constante. Este tipo de perturba-ciones es frecuente en Fısica. Por ejemplo, puede describir un campo electromagnetico monocromatico externo defrecuencia ω. Calcularemos la probabilidad de transicion Pif (t) entre los estados |ϕi〉 y |ϕf 〉. Para una perturbacionde la forma (22.24) el elemento matricial Wfi (t) estarıa dado por

Wfi (t) = λ 〈ϕf | W sinωt |ϕi〉 = λ 〈ϕf | W |ϕi〉 sinωt

Wfi (t) = λWfi sinωt =λWfi

2i

(eiωt − e−iωt

)(22.26)

siendo Wfi un numero complejo independiente del tiempo. Vamos a calcular la probabilidad de transicion a ordenλ2. Sustituyendo (22.26) en (22.17) se obtiene

b(1)n (t;ω) =1

i~

∫ t

0eiωnit

′Wni

(t′)dt′ =

1

i~

∫ t

0eiωnit

[Wni

2i

(eiωt

′ − e−iωt′)]

dt′

= −Wni

2~

∫ t

0

[ei(ωni+ω)t

′ − ei(ωni−ω)t′]dt′ = −Wni

2~

[ei(ωni+ω)t

i (ωni + ω)− ei(ωni−ω)t

i (ωni − ω)

]t

0

b(1)n (t;ω) =Wni

2i~

[1− ei(ωni+ω)t

(ωni + ω)− 1− ei(ωni−ω)t

(ωni − ω)

]

y la probabilidad de transicion se puede obtener de (22.21)

Pif (t;ω) = λ2∣∣∣b(1)f (t;ω)

∣∣∣2=

|Wfi|24~2

∣∣∣∣∣1− ei(ωfi+ω)t

(ωfi + ω)− 1− ei(ωfi−ω)t

(ωfi − ω)

∣∣∣∣∣

2

(22.27)

Page 528: Mecanica Cuantica: Notas de Clase

528 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

para una perturbacion cosenoidal como la de la Ec. (22.25) se obtiene un resultado similar

P if (t;ω) =|Wfi|24~2

∣∣∣∣∣1− ei(ωfi+ω)t

(ωfi + ω)+

1− ei(ωfi−ω)t

(ωfi − ω)

∣∣∣∣∣

2

(22.28)

la perturbacion cosenoidal (22.25) se vuelve constante cuando ω = 0. Por tanto, la probabilidad de transicion paraperturbacion constante se obtiene como caso especial de (22.28) cuando ω → 0

P if (t;ω = 0) =|Wfi|24~2

∣∣∣∣1− eiωfit

ωfi+

1− eiωfit

ωfi

∣∣∣∣2

=|Wfi|24~2

∣∣∣∣2(1− eiωfit

ωfi

)∣∣∣∣2

=|Wfi|2~2ω2

fi

∣∣1− eiωfit∣∣2 = |Wfi|2

~2ω2fi

(1− eiωfit

) (1− eiωfit

)∗=

|Wfi|2~2ω2

fi

(1− eiωfit

) (1− e−iωfit

)

=|Wfi|2~2ω2

fi

[2−

(eiωfit + e−iωfit

)]=

|Wfi|2~2ω2

fi

[2− 2 cos ωfit] =|Wfi|2~2ω2

fi

[4(1− cosωfit)

2

]

=|Wfi|2~2ω2

fi

[4 sin2

(ωfit

2

)]=

|Wfi|2~2

[sin (ωfit/2)

ωfi/2

]2

quedando finalmente para perturbacion constante

P if (t;ω = 0) =|Wfi|2~2

F (t, ωfi) ; F (t, ωfi) ≡[sin (ωfit/2)

ωfi/2

]2(22.29)

para interpretar las ecuaciones (22.27, 22.28, 22.29) vamos a considerar dos casos: (i) cuando |ϕi〉 y |ϕf 〉 sondos niveles discretos y (ii) cuando |ϕf 〉 pertenece a un conjunto contınuo de estados. En el primer caso Pif (t;ω)realmente representa una probabilidad de transicion que se puede medir. En el segundo caso, Pif (t;ω) representauna densidad de probabilidad y las cantidades que se pueden medir involucran una integracion sobre cierto conjuntode estados finales.

22.3. Perturbacion senoidal entre dos estados discretos: resonancias

Para la probabilidad de transicion Pif (t;ω) entre dos estados discretos |ϕi〉 y |ϕf 〉, consideraremos a t comoparametro fijo y estudiaremos su comportamiento con la variable ω. Asumiremos que ω ≥ 0, y estudiaremos elcaso en el cual ωfi > 0, el caso de ωfi < 0 se puede realizar con un proceso analogo. La idea es encontrar el valorde ω para el cual Pif (t;ω) es maximo, es decir buscaremos las resonancias en la probabilidad.

Para encontrar las resonancias observamos que las Ecs. (22.27, 22.28) constan del modulo al cuadrado de lasuma de dos numeros complejos

Pif (t;ω) =|Wfi|24~2

|A+ −A−|2 ; P if (t;ω) =|Wfi|24~2

|A+ +A−|2 (22.30)

A+ ≡ 1− ei(ωfi+ω)t

(ωfi + ω); A− ≡ 1− ei(ωfi−ω)t

(ωfi − ω)(22.31)

usando la identidad1− eix = eix/2

[e−ix/2 − eix/2

]= −2ieix/2 sin [x/2]

las cantidades A± dadas en (22.31), se pueden escribir en la forma

A+ (ω) = −iei(ωfi+ω)t/2 sin [(ωfi + ω) t/2]

(ωfi + ω) /2(22.32)

A− (ω) = −iei(ωfi−ω)t/2 sin [(ωfi − ω) t/2]

(ωfi − ω) /2(22.33)

Page 529: Mecanica Cuantica: Notas de Clase

22.3. PERTURBACION SENOIDAL ENTRE DOS ESTADOS DISCRETOS: RESONANCIAS 529

El denominador de A− se anula para ω = ωfi, y el denominador de A+ se anula para ω = −ωfi, y dado que elmodulo del numerador de ambos esta acotado, tendremos que para ω cercano a ωfi solo sera importante el terminoA−. Por esta razon llamamos a A− el termino resonante y a A+ el termino anti-resonante. Consideraremosel caso en el cual

|ω − ωfi| ≪ |ωfi| (22.34)

despreciando el termino anti-resonante A+ (discutiremos la validez de esta aproximacion en la seccion 22.3.2), lasEcs. (22.30, 22.33) nos dan

Pif (t;ω) = P if (t;ω) =|Wfi|24~2

|A−|2 =|Wfi|24~2

∣∣∣∣−iei(ωfi−ω)t/2 sin [(ωfi − ω) t/2]

(ωfi − ω) /2

∣∣∣∣2

Pif (t;ω) = P if (t;ω) =|Wfi|24~2

F (t, ω − ωfi) ; F (t, ω − ωfi) ≡∣∣∣∣sin [(ω − ωfi) t/2]

(ω − ωfi) /2

∣∣∣∣2

(22.35)

de modo que en la aproximacion (22.34), la probabilidad tiene el mismo comportamiento en el caso senoidal ycosenoidal. La Fig. 22.1 muestra el comportamiento de Pif (t;ω) con ω para tiempo fijo. Esta figura muestra elcomportamiento resonante de la transicion de probabilidad. La resonancia ocurre para ω = ωfi (i.e. en la frecuenciaangular de Bohr asociada a los estados final e inicial) en cuyo caso la probabilidad es5

Pmaxif (t;ω) = Pif (t;ωfi) =|Wfi|24~2

t2 (22.36)

a medida que nos alejamos de ωfi en cualquier direccion, la probabilidad decrece alcanzando el valor cero cuandose cumple la condicion

|ω − ωfi| =2π

t

cuando continuamos aumentando |ω − ωfi|, la probabilidad oscila entre |Wfi|2 /[~2 (ω − ωfi)

2]y cero mostrando

un “patron de difraccion”.Dado que hemos asumido que ωfi > 0, la relacion (22.9) nos indica que Ef > Ei. Por tanto, en presencia de

la perturbacion el sistema parte de un estado Ei de menor energıa y termina en un estado Ef de mayor energıaen virtud de la absorcion resonante de un cuanto de energıa ~ω.

El caso ωfi < 0, se puede resolver analogamente y corresponde al caso en el cual la perturbacion resonantegenera el paso del sistema desde un nivel Ei mas alto a un nivel Ef mas bajo, acompanado por la emision inducidade un cuanto de energıa ~ω. En este caso la resonancia se obtiene en ω → −ωfi.

22.3.1. Ancho de resonancia e incertidumbre energıa tiempo

Ya hemos visto que el maximo absoluto de Pif (t) se obtiene cuando ω = ωfi y esta dado por (22.36)

Pmaxif (t;ω) = Pif (t;ωfi) =|Wfi|24~2

t2

es facil ver que el primer maximo secundario se obtiene cuando

(ω − ωfi) t

2=

2

y tiene el valor

P seg maxif (t;ω) =|Wfi|29π2~2

t2

5Notese que la funcion F (t, ω − ωfi) definida en (22.35) tiene una singularidad removible en ω = ωfi, de manera que la reemplazamospor el lımite ω → ωfi, con lo cual obtenemos el comportamiento resonante (22.36).

Page 530: Mecanica Cuantica: Notas de Clase

530 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

Figura 22.1: Probabilidad de transicion Pif (t;ω) a primer orden como funcion de ω para tiempo fijo. Aparece unaresonancia para ω ≃ ωfi proporcional a t2. El ancho de la resonancia es inversamente proporcional a t.

de modo que al comparar los dos maximos se obtiene

P seg maxif (t;ω)

Pmaxif (t;ω)=

4

9π2= 4. 5%

esto justifica el hecho de considerar que casi toda la probabilidad esta en el intervalo comprendido entre los dosprimeros ceros de Pif (t) alrededor de ωfi. A su vez, esto hace razonable considerar ∆ω como la distancia entredichos ceros, por tanto

∆ω ≃ 4π

t(22.37)

y vemos que el ancho disminuye al aumentar el tiempo de “encendido” de la perturbacion. El resultado (22.37)tiene cierta similaridad con la relacion de incertidumbre entre tiempo y energıa [ver seccion 5.8.4, Ec. (5.77),Pag. 230]. Supongamos que queremos medir la diferencia de energıa Ef − Ei = ~ωfi aplicando una perturbacionsenoidal cuya frecuencia angular ω podemos modular para encontrar la resonancia. De acuerdo con la Ec. (22.37),si la perturbacion actua durante un tiempo t, la incertidumbre ∆E sobre la diferencia Ef − Ei sera del orden de

∆E = ~ ∆ω ≃ 4π~

t

de lo cual el producto de ∆E por el tiempo no puede ser menor que 4π~. Esta relacion guarda cierta similitud con larelacion de incertidumbre energıa-tiempo. No obstante, tal analogıa debe tomarse con cuidado ya que en este caso,el tiempo es una cantidad impuesta externamente por la perturbacion y no corresponde a un tiempo caracterısticode evolucion del sistema libre [que es el caso de ∆t en la relacion de incertidumbre (5.77)]. Adicionalmente, ∆Ees una incertidumbre asociada a una brecha de energıa y no a un valor especıfico de la energıa.

22.3.2. Condiciones para la validez del metodo perturbativo

Para examinar la validez de los calculos que nos llevaron a la Ec. (22.35) es necesario evaluar por un ladola aproximacion de resonancia que consistio en despreciar el termino anti-resonante A+, y por otro lado, laaproximacion perturbativa a primer orden en el estado (que corresponde a segundo orden en la probabilidad).

Page 531: Mecanica Cuantica: Notas de Clase

22.3. PERTURBACION SENOIDAL ENTRE DOS ESTADOS DISCRETOS: RESONANCIAS 531

Aproximacion de resonancia

Hemos despreciado A+ con respecto a A− bajo la hipotesis de que ω ≃ ωfi. Para justificarlo debemos compararlos modulos de A±. El factor |A− (ω)|2 esta relacionado con Pif (t) de la Ec. (22.35) por un factor constante [yaque en la Ec. (22.35) se desprecio A+], por tanto la forma de la curva que describe a |A− (ω)|2 es la mostrada enla Fig. 22.1. Ahora bien, las Ecs. (22.32, 22.33) nos muestran que

|A+ (ω)|2 = |A− (−ω)|2 (22.38)

por lo tanto la curva de |A+ (ω)|2 es la “imagen especular” de la curva de |A− (ω)|2 con respecto al eje verticalcon ω = 0. Ambas curvas tienen el mismo ancho ∆ω. Para poder despreciar A+ en las vecindades de ω = ωfi,es claro que ambas curvas deben tener un traslapamiento despreciable. En otras palabras, la distancia entre loscentros ±ωfi de ambas curvas debe ser mucho mayor al ancho tıpico ∆ω de estas

2 |ωfi| ≫ ∆ω (22.39)

notese que esta condicion permite ademas despreciar el traslapamiento de modo que

|A+ (ω)±A− (ω)|2 ≈ |A+ (ω)|2 + |A− (ω)|2

combinando (22.39) con (22.37) resulta

2 |ωfi| ≫ 4π

t⇒ t≫ 2π

|ωfi|=

1

|νfi|

t ≫ 1

|νfi|≃ 1

ν= τ (22.40)

por tanto el resultado (22.35) es valido siempre y cuando la perturbacion sinusoidal actue un tiempo t largocomparado con el periodo τ de la perturbacion. Esto significa que la perturbacion debe realizar muchas oscilacionespara que la aproximacion de resonancia sea valida. Si por ejemplo tomamos el otro extremo en el cual t ≪ 1/ν,la perturbacion dura un tiempo mucho menor que una oscilacion y su comportamiento es practicamente lineal enel tiempo en el caso senoidal y practicamente constante en el caso cosenoidal.

Notese que para una perturbacion constante nunca se satisface la condicion (22.40) puesto que ω (y portanto ν) se hace nulo. Esto es de esperarse ya que las ecuaciones (22.32, 22.33) muestran que en este lımiteA+ = A− de modo que nunca podemos despreciar el termino anti-resonante. En realidad en la expresion (22.29)para perturbacion constante, ambos terminos fueron incluıdos en el calculo.

Si para una perturbacion constante Ec. (22.29), hacemos una grafica de Pif (t) versus la frecuencia de Bohr ωficon tiempo fijo (Fig. 22.2), vemos que esta probabilidad es maxima (resonante) cuando ωfi = 0, es decir cuandolos niveles estan degenerados, y el valor de la probabilidad nos da

P if (t;ωfi = 0) =|Wfi|2 t2

~2; ∆ω ≃ 4π

t

podemos decir tambien que la resonancia ocurre para el caso de conservacion de la energıa. Notese que el anchode la curva es el mismo que en el caso senoidal pero el valor de la probabilidad es cuatro veces mayor. Esto sedebe a que para perturbacion constante (ω = 0) tenemos que A+ = A− de modo que

|A+ +A−|2 = |2A−|2 = 4 |A−|2

en tanto que en el caso senoidal solo consideramos la contribucion de |A−|2. Puede verse sin embargo que losperfiles de las figuras 22.1, 22.2 son muy similares y presentan los mismos rasgos generales. Debemos tener encuenta sin embargo que en la Fig. 22.1 se grafica con respecto a una variable externa ω, en tanto que en la Fig.22.2 se grafica con respecto a una variable del sistema ωfi.

Page 532: Mecanica Cuantica: Notas de Clase

532 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

Figura 22.2: Probabilidad de transicion Pif (t) versus la frecuencia angular de Bohr ωfi para tiempo fijo a pri-mer orden con perturbacion constante. Aparece una resonancia para ωfi = 0 proporcional a t2. El ancho de laresonancia es el mismo que en la Fig. 22.1, pero con una intensidad cuatro veces mayor.

Lımite al calculo de primer orden para el estado

Ya habıamos mencionado que el calculo de primer orden falla cuando el tiempo que dura la perturbacion sehace muy largo (y de hecho podrıa ser que el metodo perturbativo como tal no sea valido). Si tomamos la ecuacion(22.36) en la resonancia

Pif (t;ω = ωfi) =|Wfi|24~2

t2 (22.41)

esta funcion tiende a infinito cuando t → ∞, lo cual es una contradiccion puesto que una probabilidad debe sermenor o igual que uno. En la practica, para que el calculo valga en la resonancia, es necesario que la probabilidaden (22.41) sea mucho menor que uno, es decir

t≪ ~

|Wfi|(22.42)

En conclusion, para que nuestro calculo a primer orden con la aproximacion de resonancia sea valido, se necesitaun tiempo de conexion de la perturbacion que sea “largo” en el sentido de la ecuacion (22.40) y “corto” en elsentido de la ecuacion (22.42). Por tanto, la validez de este calculo implica combinar ambas condiciones

τ ≪ t≪ ~

|Wfi|(22.43)

la combinacion entre las condiciones (22.40, 22.42) tambien conduce a la relacion

1

|ωfi|≪ ~

|Wfi|⇒ ~ |ωfi| ≫ |Wfi| (22.44)

esta desigualdad implica que la diferencia de energıas |Ef − Ei| = ~ |ωfi| es mucho mayor que el elemento dematriz de W (t) entre los estados |ϕi〉 y |ϕf 〉. Condicion similar a la que vimos para la teorıa estacionaria deperturbaciones (ver seccion 20.3.2).

Page 533: Mecanica Cuantica: Notas de Clase

22.4. ACOPLAMIENTOS CON ESTADOS DEL ESPECTRO CONTINUO 533

Finalmente, el calculo a ordenes superiores a partir de (22.13), muestra que la condicion (22.42) es necesariapero no suficiente. Por ejemplo, la Ec. (22.13) muestra que a ordenes superiores aparecen elementos matricialesWkn diferentes a Wfi, sobre los cuales tambien hay que imponer condiciones para que la correccion se mantengapequena.

22.4. Acoplamientos con estados del espectro contınuo

Puede ocurrir que el estado final pertenezca al espectro contınuo de H0. En tal caso no podemos medir laprobabilidad de que el sistema quede en un estado bien definido |ϕf 〉 con energıa Ef . De acuerdo con el cuartopostulado para el caso contınuo [ver Ec. 4.9, Pag. 198], la cantidad |〈ϕf |ψ (t)〉|2 es una densidad de probabilidad.Lo que se puede predecir y medir en este caso es la probabilidad de que al realizar la medicion el sistema quededentro de cierto intervalo o “volumen” finito6 de estados finales. Por tanto, debemos realizar un proceso deintegracion sobre el volumen dentro del cual se quiere evaluar la probabilidad.

Veremos primero un ejemplo concreto antes de abordar el caso general. Supongamos que una partıcula demasa m sin espın se dispersa en un potencial central W (R) (ver Capıtulo 18). El estado |ψ (t)〉 de la partıcula enel tiempo t, se puede expandir en estados contınuos de momento bien definido |p〉 y energıa

E =p2

2m(22.45)

las funciones de onda asociadas son ondas planas [Ec. (1.182), Pag. 97]

〈r |p〉 =(

1

2π~

)3/2

eip·r/~ (22.46)

la densidad de probabilidad asociada a la medida del momento para un sistema en el estado normalizado |ψ (t)〉esta dada por |〈p |ψ (t)〉|2. Un detector en un experimento de dispersion [por ejemplo el que se ilustra en la Fig.18.5, Pag. 451], subtiende un angulo solido finito de apertura δΩf y emite una senal cuando el momento p de lapartıcula esta en una direccion dentro del angulo solido δΩf subtendido por el detector, y su energıa esta dentro deun intervalo de energıa δEf centrado en Ef = p2

f/2m. Si denotamos por Df el dominio o “volumen en el espaciode momentos” antes definido, la probabilidad de obtener una senal en el detector sera

δP (pf , t) =

p∈Dfd3p |〈p |ψ (t)〉|2 (22.47)

escribiremos el diferencial de volumen d3p en el espacio de los momentos en coordenadas esfericas

d3p = p2dp dΩ (22.48)

es conveniente reemplazar las variables de momento por variables de energıa, ya que las probabilidades de transicionque calcularemos solo tienen sentido si se mide el observable energıa. Para ello sustituımos (22.45) en (22.48)

d3p = p2dp dΩ = 2mp2

2m

dp

dEdE dΩ =

[2mE

d

dE

(√2mE

)]dE dΩ =

[2mE

√m

2E

]dE dΩ

d3p =[m√2mE

]dE dΩ

de lo cual podemos definir una densidad de estados finales ρ (E), asociados a la energıa E, en la forma

d3p = ρ (E) dE dΩ ; ρ (E) = m√2mE (22.49)

y la probabilidad (22.47) queda en la forma

δP (pf , t) =

Ω∈δΩf , E∈δEfdΩ dE ρ (E) |〈p |ψ (t)〉|2 ; ρ (E) = m

√2mE

6Este es un intervalo o volumen generalizado, ya que la variable a medir puede no ser una variable de posicion. Lo importante esque la variable se defina con uno o mas rotulos contınuos que generen un conjunto continuo de estados.

Page 534: Mecanica Cuantica: Notas de Clase

534 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

22.4.1. El caso general

Supongamos que H0 posee ciertos autoestados rotulados con un conjunto de ındices contınuos, y que el sistemafısico esta en el estado |ψ (t)〉 en el tiempo t. Queremos calcular la probabilidad δP (αf , t) de encontrar al sistemaen un cierto grupo de estados finales despues de desconectar la perturbacion y hacer una medicion de la energıa.Caracterizaremos los autoestados contınuos de H0 con kets |α〉 ortonormales en el sentido generalizado

〈α∣∣α′⟩ = δ

(α− α′)

donde α puede simbolizar varios ındices contınuos. Al grupo de estados finales lo caracterizamos por un dominioDf de valores de los parametros α centrados en αf , y asumimos que sus energıas forman un contınuo. Aplicandolos postulados de la mecanica cuantica obtenemos

δP (αf , t) =

α∈Dfdα |〈α |ψ (t)〉|2

en lugar de los ındices α, usaremos un conjunto de ındices que contengan a la energıa como parte de sus variables

|α〉 → |β,E〉

donde los otros parametros β son necesarios si H0 no forma por sı solo un C.S.C.O. Expresaremos entonces dα enterminos de dE y dβ, por medio de una funcion densidad ρ (β,E)

dα = ρ (β,E) dβ dE

si denotamos por δβf y δEf al rango de valores de los parametros β y E definidos por Df , obtenemos

δP (αf , t) =

β∈δβf , E∈δEfdβ dE ρ (β,E) |〈β,E |ψ (t)〉|2 (22.50)

22.4.2. Regla de oro de Fermi

Al igual que en el estudio de transiciones entre dos estados discretos, asumiremos que el sistema esta original-mente en un autoestado de H0 bien definido |ϕi〉. Por supuesto esto implica que |ϕi〉 debe pertenecer al espectrodiscreto de H0, pues de lo contrario, el sistema no podrıa estar en ese estado bien definido.

Notese que los calculos de la seccion 22.1, permanecen validos para el caso de transicion a un conjunto deautoestados contınuos de H0. La unica diferencia es que la cantidad (22.3) que se calcula en dicha seccion deja deser una probabilidad, para convertirse en una densidad de probabilidad. Si asumimos que la perturbacion W esconstante, las Ecs. (22.29) nos dan la densidad de probabilidad que nos interesa

|〈β,E |ψ (t)〉|2 = 1

~2|〈β,E|W |ϕi〉|2 F (t, ωi) ; F (t, ωi) ≡

[sin (ωit/2)

ωi/2

]2, ωi ≡

E − Ei~

(22.51)

donde E y Ei son las energıas en los estados |β,E〉 y |ϕi〉 respectivamente. Sustituyendo (22.51) en la probabilidad(22.50) tenemos

δP (ϕi, αf , t) =1

~2

β∈δβf , E∈δEfdβ dE ρ (β,E) |〈β,E|W |ϕi〉|2 F

(t,E − Ei

~

)(22.52)

la notacion δP (ϕi, αf , t) enfatiza el hecho de que esta probabilidad depende del estado inicial |ϕi〉.La figura 22.2, Pag. 532, muestra que la funcion F (t, ω) varıa rapidamente alrededor de ωi = 0 i.e. alrededor de

E = Ei. Si t es suficientemente largo, esta funcion se puede aproximar dentro de factores constantes a δ (E − Ei).

Page 535: Mecanica Cuantica: Notas de Clase

22.4. ACOPLAMIENTOS CON ESTADOS DEL ESPECTRO CONTINUO 535

Para verlo utilizamos el hecho de que una de las sucesiones que converge a la distribucion delta de Dirac esta dadapor

lımn→∞

1

sin2 (nx)

x2= δ (x) (22.53)

ası como la propiedad

δ (cx) =1

|c|δ (x) (22.54)

aplicando las propiedades (22.53, 22.54) a la funcion F (t, ωi) de la Ec. (22.51), obtenemos

lımt→∞

F (t, ωi) = πt1

sin2 [t (ωi/2)]

(ωi/2)2 = πt δ

(ωi2

)= πt δ

(E − Ei

2~

)

lımt→∞

F

(t,E −Ei

~

)= 2π~t δ (E − Ei) (22.55)

por otro lado, la funcion ρ (β,E) |〈β,E|W |ϕi〉|2 generalmente varıa de una manera mucho mas suave queF (t, ωi) con respecto a E. Asumiremos que t es suficientemente grande para que la variacion de esta funcion sobreun intervalo de energıa de ancho 4π~/t centrado en E = Ei, sea despreciable (es decir, sobre un intervalo de ancho∆E asociado a ∆ω en una grafica similar a la Fig. 22.2). La variacion con la energıa de ρ (β,E) |〈β,E|W |ϕi〉|2debe ser suficientemente pequena para que existan valores de t que cumplan la anterior condicion, pero ademasla funcion como tal debe ser suficientemente pequena para que el tratamiento perturbativo sobre W sea valido.Asumiremos ademas que

δEf ≫ 4π~

t= ~ ∆ω

y que δβf es lo suficientemente pequeno para despreciar la variacion del integrando con este parametro. Bajo estasaproximaciones podemos escribir

δP (ϕi, αf , t) ≃ 2π~t

~2

β∈δβfdβ

[∫

E∈δEfdE ρ (β,E) |〈β,E|W |ϕi〉|2 δ (E − Ei)

]

≃ 2πt

~

β∈δβfdβ[ρ (β,Ef = Ei) |〈β,Ef = Ei|W |ϕi〉|2

]

≃ 2πt

~

[ρ (βf , Ef = Ei) |〈βf , Ef = Ei|W |ϕi〉|2

]δβf (22.56)

debemos tener en cuenta sin embargo, que la delta de Dirac nos dice que esta integral se anula si la energıa delestado inicial Ei no pertenece al dominio de estados finales. El resultado final es entonces

δP (ϕi, αf , t) ≃

δβf2π~t[ρ (βf , Ef = Ei) |〈βf , Ef = Ei|W |ϕi〉|2

]si Ei ∈ δEf

0 si Ei /∈ δEf(22.57)

Lo cual concuerda con la discusion en la seccion 22.3.2, segun la cual, para una perturbacion constante el com-portamiento resonante (en el caso discreto) se obtiene cuando los niveles estan degenerados Ei = Ef . En el casoen que los estados finales estan en el contınuo, una perturbacion constante puede inducir transiciones solo entreestados de la misma energıa (dentro de una intervalo 2π~/t). Por esta razon la probabilidad de transicion es cerosi Ei esta fuera del dominio δEf .

La probabilidad (22.57), se incrementa linealmente con el tiempo7, por tanto la probabilidad de transicionpor unidad de tiempo definida por

δW (ϕi, αf ) =d

dtδP (ϕi, αf , t) ≃ δβf

~

[ρ (βf , Ef = Ei) |〈βf , Ef = Ei|W |ϕi〉|2

](22.58)

7Naturalmente, esto no implica que la probabilidad pueda llegar a ser mayor que uno, ya que para estos rangos el calculo perturbativoha perdido su validez.

Page 536: Mecanica Cuantica: Notas de Clase

536 CAPITULO 22. TEORIA DE PERTURBACIONES DEPENDIENTE DEL TIEMPO

es independiente del tiempo. Introduciremos la densidad de probabilidad de transicion por unidad de tiempo ypor unidad de “volumen” δβf , asociado a los parametros remanentes

w (ϕi, αf ) =δW (ϕi, αf )

δβf(22.59)

que de acuerdo con la Ec. (22.58) vienen dada por

w (ϕi, αf ) =2π

~|〈βf , Ef = Ei|W |ϕi〉|2 ρ (βf , Ef = Ei) (22.60)

resultado conocido como regla de oro de Fermi.

22.4.3. Probabilidad de transicion hacia el contınuo para perturbacion senoidal

Sea W una perturbacion senoidal de la forma (22.24) o (22.25), que acopla un estado discreto |ϕi〉 con unconjunto de estados contınuos |βf , Ef 〉 con energıas Ef cercanas a Ei + ~ω (siendo ω la frecuencia angular de laperturbacion). Comenzando con la Ec. (22.35) podemos realizar el mismo procedimiento de la seccion 22.4.2, paraencontrar

w (ϕi, αf ) =π

2~|〈βf , Ef = Ei + ~ω|W |ϕi〉|2 ρ (βf , Ef = Ei + ~ω) (22.61)

22.4.4. Dispersion y regla de oro de Fermi

Retomaremos el problema de la dispersion de una partıcula por un potencial W (r). Asumamos que el estadoinicial del proyectil es un autoestado de momento

|ψ (t = 0)〉 = |pi〉

y calcularemos la probabilidad de que la partıcula incidente de momento pi se disperse dentro de un grupo deestados de momento p definidos en un “volumen de momento” δpf centrado en pf , con la restriccion |pi| = |pf |(colision elastica). En este caso la energıa esta determinada por el modulo del momento, de modo que los parametrosβ remanentes son los angulos que determinan al vector p. En consecuencia, δβf ≡ δΩf es un angulo solido. Laregla de oro de Fermi (22.60) nos da la probabilidad w (pi,pf ) por unidad de tiempo por unidad de angulo solidoalrededor de p = pf

w (pi,pf ) =2π

~|〈θf , ϕf ; |pf | = |pi||W |pi〉|2 ρ (θf , ϕf ; |pf | = |pi|)

naturalmente el ket |θf , ϕf ; |pf |〉 es simplemente el ket |pf 〉, donde tendremos en cuenta la restriccion |pi| = |pf |

w (pi,pf ) =2π

~|〈pf |W |pi〉|2 ρ (Ef = Ei) (22.62)

Primero calculamos el elemento matricial 〈pf |W |pi〉

〈pf |W (r) |pi〉 =

∫d3r d3r′ 〈pf | r〉 〈r|W

∣∣r′⟩ ⟨

r′ |pi〉

=

∫d3r d3r′

[(1

2π~

)3/2

e−ipf ·r/~][W (r) 〈r| r′

⟩][(

1

2π~

)3/2

eipi·r′/~

]

=

(1

2π~

)3 ∫d3r d3r′ eipi·r

′/~e−ipf ·r/~[W (r) δ

(r− r′

)]

〈pf |W (r) |pi〉 =

(1

2π~

)3 ∫d3r W (r) e

i~(pi−pf)·r (22.63)

Page 537: Mecanica Cuantica: Notas de Clase

22.4. ACOPLAMIENTOS CON ESTADOS DEL ESPECTRO CONTINUO 537

utilizando la expresion (22.49) para ρ (E), ası como la Ec. (22.63), la expresion (22.62) queda en la forma

w (pi,pf ) =2π

~

(1

2π~

)6 ∣∣∣∣∫d3r W (r) e

i~(pi−pf)·r

∣∣∣∣2

m√

2mEi (22.64)

notese que la integral al lado derecho de esta ecuacion es la transformada de Fourier del potencial W (r), evaluadaen p ≡ pi − pf .

Podemos observar que aquı se ha estudiado un proceso de transicion entre un estado (bien definido) del contınuohacia un conjunto de estados en el contınuo. La regla de oro de Fermi se desarrollo para transiciones entre unestado discreto hacia un conjunto de estados del contınuo. No obstante, a pesar de que el estado inicial (impropio)|pi〉 no es normalizable (y por tanto no representa estrictamente un estado fısico) la expresion a la derecha de(22.64) posee un valor finito. Es entonces de suponer que se puede obtener un resultado fısico razonablementeacertado de este calculo. Teniendo en cuenta la definicion de seccion eficaz diferencial de dispersion Ec. (18.3) Pag.438, podemos obtener tal cantidad si dividimos la densidad de probabilidad w (pi,pf ) por la corriente incidentede probabilidad Ji [asociada a |pi〉, i.e. a una onda plana Ec. (18.33), Pag. 448]

Ji =

(1

2π~

)3~kim

=

(1

2π~

)3 |pi|m

=

(1

2π~

)3√

2Eim

con lo cual la seccion eficaz diferencial de dispersion queda

D (Ω) =w (pi,pf )

Ji=

m2

4π2~4

∣∣∣∣∫d3r W (r) e

i~(pi−pf)·r

∣∣∣∣2

que es la expresion para dicha cantidad en la aproximacion de Born, Ec. (18.68) Pag. 456.Vemos entonces que la seccion eficaz diferencial de dispersion se puede obtener de un formalismo dependiente

del tiempo como es la regla de oro de Fermi, a pesar de que el calculo implica utilizar como estado inicial a unestado impropio en lugar de un estado discreto.

Page 538: Mecanica Cuantica: Notas de Clase

Capıtulo 23

Estructura fina e hiperfina del atomo deHidrogeno

Las interacciones mas importantes en los atomos son las interacciones electrostaticas coulombianas. En elcapıtulo 13, estudiamos al atomo de hidrogeno descrito por el Hamiltoniano

H0 =P 2

2µ+ V (R) ; V (R) ≡ − q2

4πε0

1

R= −e

2

R(23.1)

donde el primer termino representa la energıa cinetica del atomo en el sistema de referencia centro de masa siendoµ la masa reducida del sistema. El potencial V (R) describe la energıa de interaccion electrostatica entre el protony el electron.

No obstante, en el Hamiltoniano (23.1) se han ignorado todos los efectos relativistas, esta aproximacion estabien justificada si tenemos en cuenta que en el modelo de Bohr la velocidad v asociada a la primera orbita n = 1satisface la condicion (2.18), Pag. 117

v

c=e2

~c≡ α =

1

137≪ 1 (23.2)

los efectos relativistas aparecen como acoples del espın del electron y del proton con campos magneticos y sonmucho menores que el efecto generado por la interaccion electrostatica. Sin embargo, dada la alta resolucionde los experimentos espectroscopicos estos efectos son observables. Por tanto, daremos cuenta de estos efectosincluyendolos en un termino W en el Hamiltoniano

H = H0 +W

donde W es mucho mas pequeno que H0, razon por la cual podemos utilizar teorıa estacionaria de perturbacionespara el calculo de estos efectos. Como resultado, surgira la llamada “estructura fina” ası como la “estructurahiperfina” de los niveles de energıa. Estos desdoblamientos adicionales del atomo de Hidrogeno se han medido congran precision. De hecho la estructura hiperfina del estado 1s del atomo de Hidrogeno es una de las cantidadesfısicas mejor medidas que existen. Los conceptos que se introduciran en este capıtulo son fundamentales en Fısicaatomica.

23.1. El Hamiltoniano de estructura fina

El espın aparece de manera natural cuando establecemos una ecuacion para el electron que satisfaga lospostulados de la relatividad especial y de la mecanica cuantica. Esto nos conduce a la denominada ecuacion deDirac, la cual genera los terminos de la estructura fina y ademas predice la existencia del positron (la antipartıculadel electron).

538

Page 539: Mecanica Cuantica: Notas de Clase

23.1. EL HAMILTONIANO DE ESTRUCTURA FINA 539

En rigor, se debe plantear la ecuacion de Dirac para un electron sometido al potencial coulombiano V (r) creadopor el proton, considerando a este ultimo como infinitamente pesado y por tanto fijo en un sistema coordenadoinercial. Despues se analiza el lımite de bajas velocidades en el cual los efectos relativistas aparecen a primer ordenen v/c. Cuando se realiza este procedimiento, se encuentra que el estado electronico se debe describir como unespinor de dos componentes, con lo cual los operadores de espın S1, S2, S3 aparecen en forma natural.

En este contexto no estudiaremos la ecuacion de Dirac, y nos limitaremos a escribir los primeros terminos enla serie de potencias en v/c de W junto con su interpretacion

H = mec2 +H0 +Wf ; Wf =Wmv +WSO +WD + . . . , H0 =

P 2

2me+ V (R) (23.3)

Wmv = − P 4

8m3ec

2; WSO =

1

2m2ec

2

1

R

dV (R)

dRL · S ; WD =

~2

8m2ec

2∇2V (R) (23.4)

los dos primeros terminos corresponden a la autoenergıa o energıa en reposo del electron mec2 y el Hamiltoniano

no-relativista H0 que se estudio en el capıtulo 13. Los demas son terminos relativistas que conducen a la estructurafina del espectro.

Vale anotar que la ecuacion de Dirac se puede resolver en forma exacta para un electron inmerso en unpotencial coulombiano. Sin embargo, el uso de la teorıa de perturbaciones (que es un metodo aproximado) permitirafamiliarizarnos con los procedimientos que se utilizan para atomos de muchos electrones, para los cuales no sabemoscomo escribir la ecuacion relativista asociada, ni tenemos soluciones exactas.

23.1.1. Orden de Magnitud de H0

Con el fin de comparar los terminos perturbativos con el Hamiltoniano no perturbado H0, es necesario calcularel orden de magnitud de H0 numericamente. Sin embargo, la comparacion se facilita si escribimos dicho orden demagnitud en terminos de cantidades fısicas universales. Para el Hamiltoniano dado por (23.1)

H0 =P 2

2µ+ V (R) ; V (R) ≡ − q2

4πε0

1

R= −e

2

R

el orden de magnitud de la energıa cinetica se puede extraer de (23.2)

∣∣∣∣P 2

∣∣∣∣ ≃m2ev

2

2me≃ mec

2

2α2 =

mee4

2~2(23.5)

el orden de magnitud de la energıa potencial se puede obtener reemplazando R por el radio de Bohr, y utilizandola Ec. (13.2), Pag. 357

|V (R)| ≃ e2

a0=mee

4

~2(23.6)

comparando (23.5) con (23.6) vemos que en orden de magnitud la energıa cinetica y potencial tienen valoressimilares. Como nuestro proposito es solo comparar ordenes de magnitud, es razonable suponer que H0 tiene elmismo orden de magnitud que la energıa cinetica y la potencial, escribiremos entonces

|H0| ≈∣∣∣∣P 2

2me

∣∣∣∣ ≈ |V (R)| ≈ mec2α2 =

mee4

~2=e2

a0≈ 10eV (23.7)

utilizaremos las aproximaciones (23.7) a nuestra conveniencia.

Page 540: Mecanica Cuantica: Notas de Clase

540 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

23.1.2. Termino de correccion cinetica Wmv

Si comenzamos con la expresion relativista de la energıa de una partıcula clasica de masa en reposo me ymomento p

E = c√

p2 +m2ec

2 = mec2

√1 +

(p

mec

)2

= mec2

[1 +

1

2

(p

mec

)2

− 1

8

(p

mec

)4

+ . . .

]

E = mec2 +

p2

2me− p4

8m3ec

2+ . . .

los dos primeros terminos en la expansion de E en potencias de (p/mec)2, corresponden a la energıa en reposo y

el termino cinetico no relativista. El tercer termino proporcional a p4 es la primera correccion relativista asociadaa la variacion de la masa con la velocidad. Podemos evaluar el orden de magnitud relativo de esta contribuciontomando el cociente

Wmv

H0≃ p4/

(8m3

ec2)

p2/ (2me)=

p2

4m2ec

2=

m2ev

2

4m2ec

2

Wmv

H0≃ 1

4

(vc

)2≃ 1

4α2 ≃ 1

4

(1

137

)2

(23.8)

donde hemos usado las aproximaciones (23.2, 23.7). En numeros se tiene que H0 ≃ 10eV de modo que Wmv ≃10−3eV .

23.1.3. Acoplamiento espın-orbita WSO

El electron se mueve a una velocidad v = p/m, en el campo electrostatico E creado por el proton. En elsistema de referencia propio del electron se observa movimiento del proton, lo cual genera (visto en el sistemapropio del electron) un campo magnetico B′ que a primer orden en v/c, esta dado por

B′ = − 1

c2v ×E (23.9)

y dado que el electron posee un momento dipolar magnetico intrınseco MS dado por

MS =q

meS (23.10)

[ver Ec. (15.4), Pag. 389], este interactua con el campo magnetico B′. La energıa de interaccion asociada esta dadapor1

W ′ = −Ms ·B′ (23.11)

de la Ec. (23.9) podemos escribir B′ en la forma

B′ = − 1

c2v ×E =

1

c2v × ∇V (r)

q=

1

meqc2mev× dV (r)

dr

r

r

B′ =1

meqc21

r

dV (r)

drp× r

cuantizando los observables en el campo y teniendo en cuenta que V (r) = −e2/r, la energıa de interaccion queda

W ′ = −Ms ·B′ = −(q

meS

)·[

1

meqc21

R

dV (R)

dRP×R

]=

1

m2ec

2

1

R

dV (R)

dRS · L

W ′ =1

m2ec

2

1

R

dV (R)

dRL · S =

e2

m2ec

2

1

R3L · S

1La energıa potencial asociada a (23.11) es una extrapolacion directa del analogo en electrodinamica clasica, segun el cual la energıade interaccion de un sistema de cargas con momento magnetico “orbital” M = qL/me esta dado por W = −Ms·B

Page 541: Mecanica Cuantica: Notas de Clase

23.1. EL HAMILTONIANO DE ESTRUCTURA FINA 541

vemos sin embargo de la Ec. (23.4), que el termino WSO posee una correccion adicional con un factor de 1/2.Este factor proviene del hecho de que el movimiento del electron alrededor del proton no es rectilıneo2. El espındel electron rota con respecto a un sistema de referencia inercial, generando una precesion de Thomas. Tenemosentonces el termino de interaccion espın-orbita dado por

WSO =1

2m2ec

2

1

R

dV (R)

dRL · S =

e2

2m2ec

2

1

R3L · S (23.12)

para estimar el orden de magnitud de este termino, tenemos en cuenta que L y S son del orden de ~, y que R esdel orden del radio de Bohr a0, de modo que

WSO ≃ e2

2m2ec

2

~2

a30(23.13)

y al compararlo con |H0| de la Ec. (23.7), se obtiene

WSO

H0≃ ~2e2/

(2m2

ec2a30)

e2/a0=

~2

2m2ec

2

1

a20=

~2

2m2ec

2

(mee

2

~2

)2

WSO

H0≃ e4

2~2c2=α2

2≃ 1

2

(1

137

)2

(23.14)

23.1.4. Termino de Darwin

La ecuacion de Dirac es local, puesto que la interaccion entre el electron y el campo de coulomb generado porel nucleo depende de la posicion del electron r. Sin embargo, la aproximacion no relativista en forma de expansionen potencias de v/c, conduce a una ecuacion no-local para el espinor de dos componentes que describe al estadoelectronico i.e. una ecuacion en la cual la interaccion entre el electron y el campo es no-local. En esta ecuacion elelectron es afectado por todos los valores que toma el campo en un cierto dominio centrado en r, y cuyo tamanoes del orden de magnitud

λel ≃λC2π

=~

mec(23.15)

siendo λC la longitud de onda de Compton del electron [ver Ecs. (13.37, 13.38), Pag. 366].Vamos a modelar en forma semi-cuantitativa esta interaccion no-local. Asumamos que la energıa potencial del

electron en lugar de estar dada por V (r), esta descrita por una expresion de la forma

V =

∫d3ρ f (|ρ|) V (r+ ρ) (23.16)

donde f (|ρ|) es una cantidad cuya integral es igual a la unidad, y que solo toma valores significativos dentro deuna esfera de radio λel ≃ ~/mec centrada en ρ = 0. Es decir, si integramos f (|ρ|) dentro de esta esfera el resultadoes casi la unidad3.

Si asumimos que V (r) no posee una variacion sensible en una distancia del orden de λel, podemos reemplazarV (r+ ρ) por V (r) dentro de la esfera en donde f (|ρ|) es significativa. Por tanto, podemos sacar el potencialV (r) de la integral y la integral de f (|ρ|) es practicamente la unidad. En este caso, la expresion (23.16) se reducea V (r).

2La Ec. (23.9) es una transformacion de la relatividad especial, de modo que solo es valida cuando el sistema de referencia S′ semueve con velocidad constante con respecto a S.

3El vector ρ es un vector posicion definido tomando la posicion r del electron como el origen. Puede pensarse que dado el caracterprobabilıstico de la mecanica cuantica, la interaccion del proton no es con un electron puntual sino con una nube electronica centradaen r, y con un radio caracterıstico dentro del cual la probabilidad de encontrar al electron es casi la unidad. En tal caso, es de esperarseque la funcion de peso f (|ρ|) dada en la Ec. (23.16) corresponda a la densidad de probabilidad asociada a cada punto del espacio, yesperamos que el maximo de esta funcion este en ρ = 0.

Page 542: Mecanica Cuantica: Notas de Clase

542 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Sin embargo, podemos obtener mas informacion de (23.16) si expandimos V (r+ ρ) en su serie de Tayloralrededor de ρ = 0.

V (r+ ρ) = V (r) + ρi ∂iV (r) +1

2ρiρj∂i∂jV (r) + . . .

con lo cual la expresion (23.16) queda

V = V (r)

∫d3ρ f (|ρ|) + ∂iV (r)

∫d3ρ ρi f (|ρ|) +

1

2[∂i∂jV (r)]

∫d3ρ ρiρj f (|ρ|) + . . .

V = V (r) +1

2[∂i∂jV (r)]

∫d3ρ ρiρj f (|ρ|) + . . . (23.17)

donde hemos tenido en cuenta que ρi f (|ρ|) es una funcion impar que por tanto se anularıa al integrar sobre unaesfera centrada en ρ = 0. Por tanto, el primer termino no-local en la Ec. (23.17) es proporcional a las segundasderivadas del potencial, y a la integral de f (|ρ|) por funciones cuadraticas en ρ integradas sobre el volumen. Comola integracion se hace desde |ρ| = 0 hasta |ρ| ≃ λel podemos asumir que el valor promedio de |ρ| es del orden deλel/2, de modo que

1

2[∂i∂jV (r)]

∫d3ρ ρiρj f (|ρ|) ≃ 1

2

[∇2V (r)

](λel2

)2 ∫d3ρ f (|ρ|) ≃ 1

8

[∇2V (r)

]λ2el

1

2[∂i∂jV (r)]

∫d3ρ ρiρj f (|ρ|) ≃ ~2

8m2ec

2∇2V (r) (23.18)

donde se ha usado la Ec. (23.15). Hemos llegado a la Ec. (23.18) por argumentos semi-cuantitativos, esta expresioncoincide sin embargo con la Ec. (23.4) que define al termino de DarwinWD. Aplicando este termino a V (r) = −e2/rtenemos que

WD = −e2 ~2

8m2ec

2∇2

(1

R

)= 4πe2

~2

8m2ec

2δ (R)

WD =πe2~2

2m2ec

2δ (R) (23.19)

donde hemos usado (18.50), Pag. 452. Tomando el promedio de este termino en un estado atomico ψ (r) se obtiene

〈WD〉ψ = 〈ψ|WD |ψ〉 = πe2~2

2m2ec

2

∫ψ∗ (r) δ (r) ψ (r) d3r =

πe2~2

2m2ec

2

∫|ψ (r)|2 δ (r) d3r

〈WD〉ψ =πe2~2

2m2ec

2|ψ (0)|2 (23.20)

en consecuencia el termino de Darwin solo afecta a electrones en el estado s (l = 0) que son los unicos para loscuales ψ (0) 6= 0 (ver seccion 13.6.1, Pag. 369). El orden de magnitud de |ψ (0)|2 se obtiene teniendo en cuentaque la integral sobre la esfera de radio a0 centrada en r = 0, de la funcion de onda es aproximadamente la unidad

V|ψ (r)|2 dV ≃ |ψ (0)|2

VdV ∼ |ψ (0)|2 a30 ∼ 1

|ψ (0)|2 ∼ 1

a30(23.21)

sustituyendo (23.21) en (23.20) y usando la Ec. (2.21) Pag. 117 tenemos que

〈WD〉ψ =πe2~2

2m2ec

2|ψ (0)|2 ≃ πe2~2

2m2ec

2

1

a30=πe2~2

2m2ec

2

m3ee

6

~6=π

2mec

2 e8

~4c4

〈WD〉ψ ≃ mec2 e8

~4c4= mec

2α4 (23.22)

Page 543: Mecanica Cuantica: Notas de Clase

23.2. ESTRUCTURA HIPERFINA 543

donde hemos usado (23.2). De la Ec. (23.7) tenemos que H0 ≃ mec2α2 y por tanto

WD

H0≃ α2 =

(1

137

)2

(23.23)

de las Ecs. (23.8, 23.14, 23.23) vemos que todos los terminos de la estructura fina son unas 104 veces menores queel Hamiltoniano no perturbado H0 que se trabajo en el capıtulo 13.

23.2. Estructura hiperfina

Hasta el momento hemos considerado al proton como una partıcula puntual de masa Mp y carga qp = −qe.Sin embargo, el proton al igual que el electron es una partıcula de espın 1/2. Denotaremos como I al observablede espın del proton. Tenemos entonces un momento magnetico de espın del proton MI. No obstante, el factorgiromagnetico es diferente al del electron

MI =gpµn~

I ; µn =qp~

2Mp, gp ≃ 5,585 (23.24)

debido a la presencia de la masa del proton en el denominador de (23.24), el magneton nuclear de Bohr µn esunas 2000 menor que el magneton de Bohr electronico µB . Aunque el momento angular del proton y el electronson iguales, el magnetismo nuclear es mucho menos importante que el electronico debido a la gran diferencia demasa. Por tanto, las interacciones magneticas debidas al espın del proton I, son muy debiles y daran lugar a laestructura hiperfina del atomo de Hidrogeno.

El electron se mueve no solo en el campo electrostatico del proton sino tambien en el campo magneticogenerado por MI. Puesto que la estructura hiperfina es muy pequena, podemos encontrarla usando la ecuacion(no-relativista) de Schrodinger. Cuando se introduce el potencial vectorial asociado al campo magnetico generadopor MI, aparecen un conjunto adicional de terminos dados por???

Whf = −µ04π

q

meR3L ·MI +

1

R3[3 (MS · n) (MI · n)−MS ·MI ] +

3MS ·MI δ (R)

(23.25)

donde MS es el momento magnetico de espın del electron, y n el vector unitario que va desde el proton haciael electron. Veremos que los terminos Whf son mucho menores que los de Wf y de allı el termino de estructurahiperfina.

23.2.1. Interpretacion de los terminos en la estructura hiperfina

El primer termino en (23.25) representa la interaccion entre MI y el campo magnetico

Be =µ0qL

4πmer3

que actua sobre el proton y que tiene como fuente a la carga electronica en rotacion.

El segundo termino en (23.25) es la interaccion dipolo-dipolo entre los momentos magneticos nuclear y electroni-co. Es decir, la interaccion de MS con el campo magnetico generado por MI, o vice versa.

El ultimo termino en (23.25) se conoce como termino de contacto de Fermi, y surge de la singularidaden r = 0 del campo creado por MI. En la realidad, el proton no es puntual y el campo magnetico dentro delproton no tiene la misma forma que el creado por MI (y que entra en la interaccion dipolo-dipolo). El terminode contacto describe la interaccion de MS con el campo magnetico en el interior del proton. La funcion delta deDirac en este termino revela que como su nombre lo indica, el termino de contacto solo existe cuando las funcionesde onda del proton y del electron se traslapan.

Page 544: Mecanica Cuantica: Notas de Clase

544 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Considerando que todos los momentos angulares son del orden de ~, y usando las Ecs. (23.10, 23.24), el ordende magnitud de los dos primeros terminos en (23.25) viene dado por

‖Whf1‖ ≈∥∥∥∥−

µ04π

q

meR3L ·MI

∥∥∥∥ .µ04π

q

mea30

‖L‖ ‖MI‖ =µ0q

4πmea30

~

∥∥∥gpµn~

I∥∥∥

‖Whf1‖ .µ0q

4πmea30gp ‖µn‖ ‖I‖ =

µ0q

4πmea30gp~ ‖µn‖ =

µ0q

4πmea30gp~

q~

2Mp

‖Whf1‖ .gp2

q2~2

meMpa30

µ04π

(23.26)

similarmente

‖Whf2‖ ≈ µ04π

1

a30‖3 (MS · n) (MI · n)−MS ·MI‖

.µ0

4πa303 (‖MS‖ ‖n‖) (‖MI‖ ‖n‖) + ‖MS‖ ‖MI‖

≈ µ04πa30

3 ‖MS‖ ‖MI‖+ ‖MS‖ ‖MI‖ =µ0πa30

‖MS‖ ‖MI‖ =µ0πa30

∥∥∥∥q

meS

∥∥∥∥∥∥∥gpµn

~I∥∥∥

=µ0πa30

q

me~2∥∥∥gpµn

~

∥∥∥ =µ0πa30

q

me~gp ‖µn‖ =

µ0πa30

q

me~gp

q~

2Mp=

q2~2

meMpa30

µ02πgp

‖Whf2‖ . 2gpq2~2

meMpa30

µ04π

(23.27)

de las ecuaciones (23.26, 23.27) tenemos entonces

‖Whf1‖+ ‖Whf2‖ .5

2gp

q2~2

meMpa30

µ04π

y usando las relaciones

µ0 =1

ε0c2; e2 =

q2

4πε0(23.28)

junto con (23.59) obtenemos

‖Whf1‖+ ‖Whf2‖ .5

2gp

~2

meMpa30

q2

4πε0c2=

5

2gp

~2

meMpc2e2

1

a30=

5

2gp

~2

meMpc2α~c

(αmec

~

)3

‖Whf1‖+ ‖Whf2‖ .5

2gpme

Mpmec

2α4

al compararlo con (23.13) vemos que estos terminos son unas 2000 veces mas pequenos que WSO. Similarmente,el termino de contacto de Fermi es unas 2000 veces menor que el termino de Darwin Ec. (23.19) [ambos contienenun factor δ (R)].

23.3. Estructura fina del nivel n = 2

En el capıtulo 13, vimos que los niveles de energıa del atomo de Hidrogeno solo dependen del numero cuantico n,cuando solo se considera la interaccion electrostatica. En particular, los estados 2s (n = 2, l = 0) y 2p (n = 2, l = 1)poseen la misma energıa dada por la Ec. (13.43), Pag. 367 con n = 2

−EI4

= −1

8µc2α2 (23.29)

Page 545: Mecanica Cuantica: Notas de Clase

23.4. REPRESENTACION MATRICIAL DE LA ESTRUCTURA FINA PARA EL NIVEL N = 2 545

cuando se ignora el espın, la subcapa 2s corresponde a un estado singlete (no degenerado), y la subcapa 2pcorresponde a un triplete asociado a los 3 valores propios diferentes de L3, m = 1, 0,−1.

No obstante, la introduccion del espın del electron y del proton incrementa el grado de degeneracion de losniveles de energıa. El nivel de degeneracion de cada subcapa se multiplica por cuatro, puesto que S3 e I3 puedentomar cada uno dos valores diferentes mS = ±1/2, mI = ±1/2. En particular, una base posible para la subcapa2s es ∣∣∣∣n = 2; l = 0;mL = 0;mS = ±1

2;mI = ±1

2

de modo que la subcapa 2s es de dimension cuatro. Para la subcapa 2p, una base posible es

∣∣∣∣n = 2; l = 1;mL = 1, 0,−1;mS = ±1

2;mI = ±1

2

de modo que la subcapa 2p es de dimension doce. En consecuencia la dimension del subespacio generado por n = 2(grado de degeneracion de E2) es 16.

De acuerdo con la discusion dada en la seccion 20.4, debemos diagonalizar la matriz 16× 16 que representa larestriccion de W al subespacio E2, con el fin de calcular el efecto de tal perturbacion. Asumiremos que el atomoesta aislado de modo que no intervienen campos electricos o magneticos externos. En cuyo caso el Hamiltonianocompleto vendra dado por

H = H0 +W = H0 +Wf +Whf

y puesto que Whf es unas 2000 veces menor que Wf , comenzaremos evaluando las correcciones de estructura finaasociadas a Wf . Veremos que Wf remueve parcialmente la degeneracion de grado 16 que posee el nivel n = 2,generando la estructura fina. El Hamiltoniano Whf producira una remocion adicional de la degeneracion queconduce a la estructura hiperfina. En las siguientes secciones realizaremos el calculo de la estructura fina paran = 2 y en la seccion 23.9 se realizara el calculo de la estructura hiperfina para n = 1. El procedimiento paracalcular la estructura fina e hiperfina de otros niveles es analogo.

23.4. Representacion matricial de la estructura fina para el nivel n = 2

Veremos que las propiedades de los elementos matriciales deWf (en la base de autoestados deH0), nos conducea una estructura diagonal por bloques de submatrices mas pequenas. Este hecho simplificara considerablementeel calculo de los valores y vectores propios en el subespacio E2.

Comenzaremos caracterizando una serie de observables que conmutan con el Hamiltoniano Wf . En primerlugar, las Ecs. (23.3, 23.4) muestran que Wf no depende del observable I (espın del proton). En consecuencia, Wf

conmuta con I. Por tanto, el teorema 1.68, Pag. 58, nos indica que los elementos matriciales que conectan a dosestados diferentes de mI son nulos

⟨n; l′;m′

L;m′S ;mI = ±1

2

∣∣∣∣Wf

∣∣∣∣n; l;mL;mS ;mI = ∓1

2

⟩= 0 (23.30)

de hecho, puesto queWf no depende de I, podemos omitir este numero cuantico en todos los calculos que involucrana la estructura fina Wf , multiplicando por 2 todo grado de degeneracion que se obtenga. De esta forma la matriz16× 16 se desacopla en dos matrices 8× 8 en la forma

(Wf )16×16 =

((Wf )8×8 08×8

08×8 (Wf )8×8

)= (Wf )8×8 ⊗ I2×2 (23.31)

donde hemos tenido en cuenta que ademas las submatrices 8× 8 sobre la “diagonal” de (Wf )16×16 son identicas.

Page 546: Mecanica Cuantica: Notas de Clase

546 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Probaremos ahora queWf conmuta con L2. Para verlo, observemos que L2 conmuta con todas las componentesde L, con R = |R| (ya que L2 solo actua sobre variables angulares), con P2 4, y con S (ya que L2 no depende devariables de espın). En consecuencia, las Ecs. (23.3, 23.4) nos muestran que L2 conmuta con Wmv [el cual depende

de(P2)2], con WSO (el cual depende de R, L y S) y con WD (que solo depende de R). De nuevo el teorema 1.68,

nos indica que elementos matriciales que involucran a valores propios diferentes de L2 se anulan5

⟨n; l′;m′

L;m′S ;m

′I

∣∣Wf |n; l;mL;mS ;mI〉 = 0 si l 6= l′ (23.32)

en particular estados asociados a las subcapas 2s y 2p corresponden a valores propios diferentes de L2 (0 y 2~2

respectivamente). Por tanto, los elementos matriciales de Wf que conectan a un estado 2s con un estado 2pse anulan. En consecuencia, la matriz (Wf )8×8 representativa de Wf para el nivel n = 2, se desacopla en unasubmatriz 2× 2 asociada a la subcapa 2s y otra submatriz 6× 6 asociada a la subcapa 2p.

(Wf )8×8 =

(W2s

f

)2×2

02×6

06×2

(W2p

f

)6×6

(23.33)

la matriz se ha diagonalizado en bloques de 2×2 y 6×6. La propiedad anterior tambien se puede ver del hecho dequeWf es de paridad par. Para verlo, notemos que bajo paridad, ocurren los siguientes cambios en los observables

R → −R ; R→ R, P → −P, P2 → P2, L → L, S → S

y aplicando esta operacion en las Ecs. (23.3, 23.4) vemos que Wf permanece invariante bajo paridad. Por tanto,Wf no tiene elementos de matriz que conecten a un estado 2s con un estado 2p, puesto que estos estados tienenparidades opuestas.

23.5. Calculo de los terminos cinetico y de Darwin

Puede verificarse que los terminos Wmv y WD conmutan con las componentes de L. Esto se puede ver teniendoen cuenta que L actua sobre variables angulares y conmuta con R y P2. En consecuencia, los operadores Wmv yWD son operadores escalares con respecto a las variables orbitales. Por tanto, los terminos matriciales asociadosa los operadores Wmv y WD son nulos cuando dichos elementos de matriz estan asociados a dos valores diferentesde mL. Adicionalmente, la Ec. (23.4) muestra que Wmv y WD no dependen de S, por tanto las matrices querepresentan a estos operadores son proporcionales a la identidad. Notese que estas propiedades son validas paravalores arbitrarios de n, l,m.

Por otro lado, puesto que ignoraremos el espın del proton, el subespacio asociado a 2s sera de dimension 2,correspondiente a los valores posiblesms = ±1/2 de S3. Ası mismo el subespacio asociado a 2p sera de dimension 6,correspondiente a los valores posibles ms = ±1/2 de S3, y m = 1, 0,−1 de L3. Esto nos conduce a las submatrices2× 2 y 6× 6 descritas en la Ec. (23.33).

En consecuencia, para las submatrices de dimension 2 × 2 asociadas a los terminos cinetico y de Darwin en(23.33) tenemos que

(W2s

mv

)2×2

= 〈n = 2; l = 0;mL = 0|(− P4

8m3ec

2

)|n = 2; l = 0;mL = 0〉 · I2×2 (23.34)

(W2s

D

)2×2

= 〈n = 2; l = 0;mL = 0|(

~2

8m2ec

2∇2V (R)

)|n = 2; l = 0;mL = 0〉 · I2×2 (23.35)

4De la Ec. (12.29), Pag. 350, podemos ver que en la base |r〉 el operador P2 se escribe en la forma

P2 = − ~2

2µ∇2 = − ~2

(1

r

∂2

∂r2r − L2

~2r2

)

y teniendo en cuenta que L2 solo depende de variables angulares, se sigue que P2 conmuta con L2.5Notese que las Ecs. (23.30, 23.32) son validas para cualquier valor de n y no solo para n = 2. Por tanto, es muy facil extender los

argumentos anteriores para otros valores de n.

Page 547: Mecanica Cuantica: Notas de Clase

23.5. CALCULO DE LOS TERMINOS CINETICO Y DE DARWIN 547

donde la constante de proporcionalidad de la identidad para cada termino esta dada por elementos matricialespuramente orbitales. Para el caso especıfico de V (R) = −e2/R, la Ec. (23.19) nos dice que (23.35) se convierte en

(W2s

D

)2×2

=πe2~2

2m2ec

2〈n = 2; l = 0;mL = 0| δ (R) |n = 2; l = 0;mL = 0〉 · I2×2 (23.36)

Similarmente, las submatrices de dimension 6 × 6 asociadas a los terminos cinetico y de Darwin en (23.33)vienen dadas por

(W2p

mv

)6×6

= 〈n = 2; l = 1;mL|(− P4

8m3ec

2

)|n = 2; l = 1;mL〉 · I6×6 (23.37)

(W2p

D

)6×6

= 〈n = 2; l = 1;mL|(

~2

8m2ec

2∇2V (R)

)|n = 2; l = 1;mL〉 · I6×6

(W2p

D

)6×6

=πe2~2

2m2ec

2〈n = 2; l = 1;mL| δ (R) |n = 2; l = 1;mL〉 · I6×6 (23.38)

donde la identidad 6 × 6 se debe a que no hay acople entre los terminos con mS 6= m′S o con mL 6= m′

L. LasEcs. (23.34, 23.36) ası como las Ecs. (23.37, 23.38) nos indican que para calcular la contribucion de los terminoscinetico y de Darwin con V (R) = −e2/R, bastara con calcular factores complejos de la forma

〈Wmv〉 = − 1

8m3ec

2〈n, l,mL|P4 |n, l,mL〉 (23.39)

〈WD〉 =πe2~2

2m2ec

2〈n, l,mL| δ (R) |n, l,mL〉 (23.40)

para calcular el termino 〈Wmv〉 escribimos

H0 =P2

2me+ V (R) ⇒ P4 = 4m2

e [H0 − V (R)]2 = 4m2e

[H0 +

e2

R

]2

P4 = 4m2e

[H2

0 +H0e2

R+e2

RH0 +

e4

R2

]

tomando el valor medio de P4 en un estado no perturbado |ϕn,l,m〉 del atomo de Hidrogeno se obtiene

⟨P4⟩

= 4m2e 〈ϕn,l,m|

[H2

0 +H0e2

R+e2

RH0 +

e4

R2

]|ϕn,l,m〉

= 4m2e 〈ϕn,l,m|

[E2n + En

e2

R+e2

REn +

e4

R2

]|ϕn,l,m〉

⟨P4⟩

= 4m2e

[E2n + 2Ene

2

⟨1

R

n,l,m

+ e4⟨

1

R2

n,l,m

](23.41)

sustituyendo (23.41) en (23.39) la cantidad 〈Wmv〉 queda

〈Wmv〉n,l,m = − 1

2mec2

[E2n + 2Ene

2

⟨1

R

n,l,m

+ e4⟨

1

R2

n,l,m

](23.42)

esta expresion es valida para todo n, l,m.

Page 548: Mecanica Cuantica: Notas de Clase

548 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

23.5.1. Calculo de 〈1/R〉 , 〈1/R2〉 y 〈1/R3〉De la Ec. (23.42) vemos que debemos calcular las cantidades 〈1/R〉 ,

⟨1/R2

⟩. Para futuros propositos tambien

calcularemos⟨1/R3

⟩[ver Ec. (23.69)]. Para ello debemos tener en cuenta que la funcion de onda del atomo de

Hidrogeno no perturbado, esta dada por las Ecs. (13.41), Pag. 367

ϕn,l,m (r) = Rn,l (r)Ylm (θ, ϕ) (23.43)

las funciones radiales para las subcapas 1s, 2s y 2p estan dadas por las Ecs. (13.48, 13.49), Pag. 367

R1,0 (r) = 2 (a0)−3/2 e−r/a0 ; R2,0 (r) = 2 (2a0)

−3/2

(1− r

2a0

)e−r/2a0 (23.44)

R2,1 (r) = (2a0)−3/2 3−1/2 r

a0e−r/2a0 (23.45)

puesto que los armonicos esfericos estan debidamente normalizados, el valor medio 〈Rq〉 para q entero (positivo onegativo) se puede escribir como

〈Rq〉n,l,m =

∫ϕ∗n,l,m (r) rq ϕn,l,m (r) dV =

∫R∗n,l (r)Y

∗lm (θ, ϕ) rq Rn,l (r)Ylm (θ, ϕ) r2 dr dΩ

=

∫R∗n,l (r) r

q+2 Rn,l (r) dr

∫Y ∗lm (θ, ϕ)Ylm (θ, ϕ) dΩ

quedando finalmente

〈Rq〉n,l,m =

∫ ∞

0rq+2 |Rn,l (r)|2 dr (23.46)

valida para q positivo o negativo, siempre que la integral (23.46) sea convergente. Al sustituir (23.44, 23.45) en(23.46) aparecen integrales de la forma

I (k, p) =

∫ ∞

0rke−pr/a0 dr (23.47)

donde p y k son enteros. Integrando por partes con u = rk y dv = e−pr/a0 dr, la integral (23.47) adquiere la forma

I (k, p) =

[−a0pe−pr/a0rk

]∞

0

+ka0p

∫ ∞

0rk−1e−pr/a0 dr

I (k, p) =ka0pI (k − 1, p) (23.48)

por recurrencia se obtiene

I (k, p) =ka0p

[(k − 1) a0

pI (k − 2, p)

]= k (k − 1)

(a0p

)2 [(k − 2) a0p

I (k − 3, p)

]

I (k, p) = k (k − 1) (k − 2)

(a0p

)3

I (k − 3, p)

que para k entero positivo, claramente nos da

I (k, p) = k!

(a0p

)kI (0, p) (23.49)

a partir de la definicion (23.47), la integral I (0, p) nos da

I (0, p) =

∫ ∞

0e−pr/a0dr =

[−a0pe−pr/a0

]∞

0

I (0, p) =a0p

(23.50)

Page 549: Mecanica Cuantica: Notas de Clase

23.5. CALCULO DE LOS TERMINOS CINETICO Y DE DARWIN 549

y sustituyendo (23.50) en (23.49), la integral I (k, p) queda

I (k, p) = k!

(a0p

)k+1

(23.51)

asignando q = −1 en (23.46), y utilizando (23.44), (23.47) y (23.51), se obtiene⟨1

R

1s

=

∫ ∞

0r |R1,0 (r)|2 dr =

4

a30

∫ ∞

0re−2r/a0dr =

4

a30I (1, 2) =

4

a30

(a02

)2

⟨1

R

1s

=1

a0(23.52)

⟨1

R

2s

=

∫ ∞

0r |R2,0 (r)|2 dr =

4

8a30

∫ ∞

0r

[1− r

2a0

]2e−r/a0 dr

=1

2a30

∫ ∞

0

[re−r/a0 − r2

a0e−r/a0 +

r3

4a20e−r/a0

]dr

=1

2a30

[I (1, 1) − 1

a0I (2, 1) +

1

4a20I (3, 1)

]

=1

2a30

[a20 −

1

a02!a30 +

1

4a203!a40

]

⟨1

R

2s

=1

4a0(23.53)

⟨1

R

2p

=

∫ ∞

0r |R2,1 (r)|2 dr =

1

8a30

1

3

∫ ∞

0r

(r

a0

)2

e−r/a0 dr

=1

24a50

∫ ∞

0r3e−r/a0 dr =

1

24a50I (3, 1) =

1

24a503!a40

⟨1

R

2p

=1

4a0(23.54)

similarmente con q = −2 se obtiene⟨

1

R2

1s

=4

a30I (0, 2) =

2

a20(23.55)

⟨1

R2

2s

=1

2a30

[I (0, 1) − 1

a0I (1, 1) +

1

4a20I (2, 1)

]=

1

4a20(23.56)

⟨1

R2

2p

=1

24a50I (2, 1) =

1

12a20(23.57)

es facil ver que la expresion⟨1/R3

⟩no tiene sentido para las subcapas 1s y 2s, puesto que la integral (23.46) serıa

divergente. Para la subcapa 2p haciendo q = −3 en (23.46) y utilizando (23.45), tenemos⟨

1

R3

2p

=

∫ ∞

0r−1 |R2,1 (r)|2 dr =

∫ ∞

0r−1

∣∣∣∣(2a0)−3/2 3−1/2 r

a0e−r/2a0

∣∣∣∣2

dr

=1

24a50

∫ ∞

0r e−r/a0 dr

de lo cual se obtiene ⟨1

R3

2p

=1

24a50I (1, 1) =

1

24a30(23.58)

Page 550: Mecanica Cuantica: Notas de Clase

550 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

23.5.2. Calculo de 〈Wmv〉Es conveniente escribir las expresiones en terminos de la constante de estructura fina α, usando las siguientes

relaciones

En = −EIn2

= − 1

2n2α2mec

2 ; e2 = α~c ; a0 =~

αmec(23.59)

Reemplazando (23.59) en (23.42) obtenemos

〈Wmv〉 = − 1

2mec2

[1

4n4α4m2

ec4 − 2

(1

2n2α2mec

2

)(α~c)

⟨1

R

n,l,m

+ α2~2c2⟨

1

R2

n,l,m

](23.60)

y usando (23.52, 23.55) en la Ec. (23.60) se obtiene 〈Wmv〉 para la subcapa 1s (la cual requerimos para el calculode estructura fina asociado a n = 1, de la seccion 23.8)

〈Wmv〉1s = − 1

2mec2

[1

4α4m2

ec4 − 2

(1

2α2mec

2

)(α~c)

1

a0+ α2~2c2

2

a20

]

= − 1

2mec2

[1

4α4m2

ec4 − 2

(1

2α2mec

2

)(α~c)

αmec

~+ 2α2~2c2

(αmec

~

)2]

〈Wmv〉1s = −5

8α4mec

2 (23.61)

similarmente, para las subcapas 2s y 2p se obtiene

〈Wmv〉2s = − 13

128α4mec

2 (23.62)

〈Wmv〉2p = − 7

384α4mec

2 (23.63)

23.5.3. El valor medio 〈WD〉De las Ecs. (23.36, 23.38) junto con la Ec. (23.20), este valor medio se puede escribir genericamente en la forma

〈WD〉n,l,m = 〈WD〉ψ =πe2~2

2m2ec

2|ψ (0)|2 = πe2~2

2m2ec

2

∣∣∣ϕn,l,m (r = 0) eiEt/~∣∣∣2

〈WD〉n,l,m =~2

8m2ec

24πe2 |ϕn,l,m (r = 0)|2

y recordando que la funcion de onda solo es no nula en el origen para l = 0 (ver seccion 13.6.1, pag. 369), tenemosque

〈WD〉n,l,m =~2

8m2ec

24πe2 |ϕn,0,0 (r = 0)|2 δl,0 (23.64)

con lo cual

〈WD〉2p = 0 (23.65)

para los niveles 1s y 2s, usando (23.43, 23.44, 23.59) y el hecho de que Y00 = 1/√4π, la Ec. (23.64) nos da

〈WD〉1s =~2

8m2ec

24πe2 |ϕn,0,0 (r = 0)|2 = ~2

8m2ec

24πe2 |R1,0 (0) Y00|2 =

~2

8m2ec

2e2 |R1,0 (0)|2

=~2

8m2ec

2e2

4

a30=

~2

2m2ec

2e2

1

a30=

~2

2m2ec

2α~c

(αmec

~

)3=

1

2α4mec

2

Page 551: Mecanica Cuantica: Notas de Clase

23.6. CALCULO DEL TERMINO DE ESPIN-ORBITA WSO 551

de manera similar se calcula 〈WD〉2s con lo cual obtenemos

〈WD〉1s =~2

8m2ec

2e2 |R1,0 (0)|2 =

1

2α4mec

2 (23.66)

〈WD〉2s =~2

8m2ec

2e2 |R2,0 (0)|2 =

1

16α4mec

2 (23.67)

23.6. Calculo del termino de espın-orbita WSO

El lector puede comprobar facilmente que el termino de espın-orbita (23.12) no conmuta con los operadores L3,S3. Por tanto, los elementos no-diagonales de las submatrices (23.33) son en general no nulos. En otras palabras,el termino espın-orbita puede inducir transiciones entre diferentes valores de los numeros cuanticos mL y mS. Enconsecuencia, para el termino de espın-orbita deben calcularse elementos matriciales de la forma

〈WSO〉 =⟨n, l, s,m′

L,m′S

∣∣ (ξ (R) L · S) |n, l, s,mL,mS〉 (23.68)

ξ (R) ≡ e2

2m2ec

2

1

R3(23.69)

Utilizando la base |r, ε〉 de posicion y espın, podemos separar la parte radial de la parte angular y espinorial.Se obtiene entonces

〈WSO〉 =⟨n, l, s,m′

L,m′S

∣∣ (ξ (R) L · S) |n, l, s,mL,mS〉=

[〈n, l| ⊗

⟨l, s,m′

L,m′S

∣∣] (ξ (R) L · S) [|n, l〉 ⊗ |s,mL,mS〉]= 〈n, l| ξ (R) |n, l〉

⟨l, s,m′

L,m′S

∣∣ ( L · S) |s,mL,mS〉

〈WSO〉 =

[e2

2m2ec

2

∫ ∞

0

1

r3|Rnl (r)|2 r2 dr

] ⟨l, s,m′

L,m′S

∣∣ (L · S) |l, s,mL,mS〉

que se puede escribir en la forma

〈WSO〉 = ξnl⟨l, s,m′

L,m′S

∣∣ (L · S) |l, s,mL,mS〉 (23.70)

ξnl =e2

2m2ec

2

∫ ∞

0

1

r|Rnl (r)|2 dr (23.71)

Vemos entonces que el calculo se separa en un termino espın-angular y un termino radial.

23.6.1. Calculo del termino espın-angular

Calcularemos primero los terminos matriciales del operador L · S en la ecuacion (23.70). La representacionmatricial de este operador puede calcularse en diferentes bases. Una es la base de vectores propios comunes a L2,S2, L3, S3

|l, s,mL,mS〉 (23.72)

o introduciendo el momento angular totalJ = L+ S (23.73)

podemos construir una base de vectores propios comunes a L2, S2, J2 y J3, definida por6

|l, s, J,mJ 〉 (23.74)

Por otro lado, se puede transformar de una base a la otra, utilizando los coeficientes de Clebsch-Gordan discutidosen la seccion 16.8.

6Ambos conjuntos de operadores junto con H , forman un C.S.C.O.

Page 552: Mecanica Cuantica: Notas de Clase

552 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Veremos que la base (23.74) es mas apropiada para este problema debido a que el operador L · S es diagonalen esta base. Por tanto, en lugar de los elementos matriciales (23.70) calcularemos elementos matriciales de laforma

〈WSO〉J = ξnl⟨l, s, J ′,m′

J

∣∣ (L · S) |l, s, J,mJ〉 (23.75)

Para ver que L · S es diagonal en la base (23.74), elevamos al cuadrado la Ec. (23.73) teniendo en cuenta queL y S conmutan

J2 = (L+ S)2 = L2 + 2L · S+ S2 ⇒L · S =

1

2

(J2 − L2 − S2

)(23.76)

combinando (23.76) con el hecho de que los vectores (23.74) son autoestados propios de J2,L2,S2 se tiene que

L · S |l, s, J,mJ〉 =1

2

(J2 − L2 − S2

)|l, s, J,mJ 〉

L · S |l, s, J,mJ〉 =~2

2[J (J + 1)− l (l + 1)− s (s+ 1)] |l, s, J,mJ〉 (23.77)

la ecuacion (23.77) nos muestra que los autovalores de L · S (para l y s fijos) solo dependen de J pero no de mJ .Usando (23.77) vemos que los terminos matriciales en la base ortonormal (23.74) vienen dados por

⟨l, s, J ′,m′

J

∣∣L · S |l, s, J,mJ 〉 =~2

2[J (J + 1)− l (l + 1)− s (s+ 1)]

⟨l, s, J ′,m′

J

∣∣ l, s, J,mJ 〉⟨l, s, J ′,m′

J

∣∣L · S |l, s, J,mJ 〉 =~2

2[J (J + 1)− l (l + 1)− s (s+ 1)] δJJ ′ δmJ ,m′

J(23.78)

de modo que en la base acoplada este operador es diagonal. En el capıtulo 16, seccion 16.5.6, vimos las reglas deadicion del momento angular Ec. (16.56) Pag. 420, segun la cual para dos momentos angulares caracterizados porlos numeros cuanticos l y s, el numero cuantico J toma los posibles valores

J = l + s, l + s− 1, . . . , |l − s|

para l = 0, J solo toma el valor J = s. Por tanto, para l = 0, es claro que el termino matricial (23.78) se anula7.En particular, para la subcapa 2s (en la cual l = 0) no hay contribucion del termino de espın-orbita

〈WSO〉2s = 02×2 (23.79)

en cuanto a la subcapa 2p (con s = 1/2, l = 1), los valores posibles de J son

J =1

2,3

2

y el termino matricial (23.78) nos da

⟨l = 1; s =

1

2;J ′;m′

J

∣∣∣∣L · S∣∣∣∣l = 1, s =

1

2, J,mJ

⟩=

~2

2

[J (J + 1)− 11

4

]δJJ ′ δmJ ,m′

J(23.80)

7Notese que este resultado es valido para cualquier valor de n y s, solo depende de que l = 0.

Page 553: Mecanica Cuantica: Notas de Clase

23.6. CALCULO DEL TERMINO DE ESPIN-ORBITA WSO 553

23.6.2. Calculo del termino radial

Puesto que el cambio de base antes mencionado solo involucra a las variables espın-angulo, es claro que eltermino puramente radial ξ2p no depende de la base usada. Como la contribucion espın-angular se anula para lasubcapa 2s, calcularemos el termino radial (23.71) solo para la subcapa 2p. Usando las expresiones (23.45, 23.47),la ecuacion (23.71) para n = 2, l = 1 queda

ξ2p =e2

2m2ec

2

∫ ∞

0

1

r|R21 (r)|2 dr =

e2

2m2ec

2

∫ ∞

0

1

r

∣∣∣∣(2a0)−3/2 3−1/2 r

a0e−r/2a0

∣∣∣∣2

dr

=e2

2m2ec

2

∫ ∞

0

1

r

1

3 (2a0)3

r2

a20e−r/a0 dr =

e2

48a50m2ec

2

∫ ∞

0re−r/a0 dr

ξ2p =e2

48a50m2ec

2I (1, 1)

usando las relaciones (23.51, 23.59) nos queda

ξ2p =e2

48a50m2ec

2a20 =

e2

48a30m2ec

2=

α~c

48(

~αmec

)3m2ec

2

ξ2p =mec

2α4

48~2(23.81)

con lo cual desaparecen las variables radiales.

23.6.3. Contribucion espın-orbita completa para la subcapa 2p

Sustituyendo (23.80) y (23.81) en (23.70) con l = 1, s = 1/2 (para la subcapa 2p), y para los valores posiblesde J = 1/2, 3/2; las contribuciones no nulas en (23.70), es decir los terminos diagonales vienen dados por

ξ2p

⟨l = 1; s =

1

2;J =

1

2;mJ

∣∣∣∣L · S∣∣∣∣l = 1; s =

1

2;J =

1

2;mJ

⟩= −ξ2p~2 = − 1

48mec

2α4

ξ2p

⟨l = 1; s =

1

2;J =

3

2;mJ

∣∣∣∣L · S∣∣∣∣l = 1; s =

1

2;J =

3

2;mJ

⟩=

1

2ξ2p~

2 =1

96mec

2α4

tenemos entonces que para l = 1, s = 12 se forman dos subespacios de E , asociados a J = 1/2 y a J = 3/2

respectivamente. Estos espacios son de dimension 2J + 1 (numero de valores posibles de mJ) y por tanto son dedimension 2 para J = 1/2 y de dimension 4 para J = 3/2. Denotaremos estos espacios por E (2p, J) con J = 1/2y 3/2. Puesto que el operador L · S es diagonal en la base (23.74) y los elementos matriciales no dependen de mJ ,vemos que dentro de cada subespacio E (2p, J) el operador L · S es proporcional a la identidad. Tenemos entoncesque la degeneracion de orden 6 de la subcapa 2p es parcialmente removida por WSO, quedando una degeneracionde orden cuatro para J = 3/2 y una degeneracion de orden 2 para J = 1/2. La textura matricial en la baseacoplada queda en la forma

(W2p

SO

)J6×6

=

(W2p

SO

)(1/2)2×2

02×4

04×2

(W2p

SO

)(3/2)4×4

=

1

96mec

2α4

(−2I2×2 02×4

04×2 I4×4

)(23.82)

E (2p) = E(2p, J =

1

2

)⊕ E

(2p, J =

3

2

)

la degeneracion 2J+1 asociada a cada estado con J fijo, es una degeneracion esencial relacionada con la invarianzarotacional8 de Wf . Recordemos que para la subcapa 2s, J solo puede tomar el valor J = 1/2, y que no haycontribucion proveniente del termino de espın-orbita.

8Esta invarianza rotacional es en un sentido extendido ya que es con respecto al momento angular total J = L+ S.

Page 554: Mecanica Cuantica: Notas de Clase

554 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Puesto que hemos cambiado de base para calcular los elementos matriciales de la subcapa 2p, a priori parecenecesario cambiar de nuevo a la base (23.72) ya que fue en esta ultima en donde se calcularon los terminos Wmv

y WD. Sin embargo, hemos visto que los operadores Wmv y WD son proporcionales a la identidad dentro delsubespacio E (2p)6×6. La representacion de todo operador proporcional a la identidad es la misma en todas lasbases. Por tanto, resulta mas conveniente cambiar la representacion matricial de WD y Wmv a la base (23.74), yaque los elementos matriciales no cambian en lo absoluto.

23.7. Sıntesis de resultados sobre la estructura fina

Hemos visto que la base acoplada (23.74) es la mas conveniente para describir la representacion matricial deWf . En esta base, los numeros cuanticos de los cuales depende la energıa son (n, l, J), el ultimo numero cuanticolo introduce en el espectro la interaccion espın-orbita. Para el nivel 2s, J = 1/2 en tanto que para 2p tenemos dosvalores J = 1/2, o 3/2. El nivel asociado a un conjunto de valores (n, l, J) se denota agregando el sımbolo J a lanotacion espectroscopica de la subcapa (n, l), en la forma:

nlJ

por ejemplo del nivel n = 2 del atomo de hidrogeno, surgen los siguientes niveles asociados a su estructura fina

2s1/2, 2p1/2, 2p3/2 (23.83)

la idea ahora es calcular las posiciones de los niveles (23.83) con respecto al nivel no perturbado. Puesto que todolo hemos escrito en terminos de la constante de estructura fina α, es conveniente escribir los niveles no perturbadosen terminos de tal parametro, usando la Ec. (23.29)

En=2 ≡ E02 = −1

8µc2α2

Tomando las Ecs. (23.62, 23.67, 23.79) vemos que para la subcapa 2s la contribucion de Wf nos da

〈Wf 〉2s = 〈Wmv〉2s + 〈WD〉2s + 〈WSO〉2s = − 13

128α4mec

2 +1

16α4mec

2 + 0

y tomando las Ecs. (23.63, 23.65, 23.82), la contribucion de Wf a los niveles 2p1/2 y 2p3/2 resultan

〈Wf 〉2p1/2 = 〈Wmv〉2p1/2 + 〈WD〉2p1/2 + 〈WSO〉2p1/2 = − 7

384α4mec

2 + 0− 1

48mec

2α4

〈Wf 〉2p3/2 = 〈Wmv〉2p3/2 + 〈WD〉2p3/2 + 〈WSO〉2p3/2 = − 7

384α4mec

2 + 0 +1

96mec

2α4

notese que solo WSO es responsable de la separacion entre 2p1/2 y 2p3/2, ya que los terminos cinetico Wmv y deDarwin WD no son sensibles al numero cuantico J . Las correcciones de la estructura fina quedan finalmente

〈Wf 〉2s = 〈Wf 〉2p1/2 = − 5

128mec

2α4 ; 〈Wf 〉2p3/2 = − 1

128mec

2α4 (23.84)

las Ecs. (23.84) nos dicen que los niveles 2s1/2, 2p1/2, 2p3/2 se bajan en las cantidades dadas por

E2s1/2 − E02 = − 5

128mec

2α4

E2p1/2 − E02 = − 5

128mec

2α4

E2p3/2 − E02 = − 1

128mec

2α4

Page 555: Mecanica Cuantica: Notas de Clase

23.7. SINTESIS DE RESULTADOS SOBRE LA ESTRUCTURA FINA 555

Figura 23.1: Ilustracion de la modificacion del nivel n = 2 debido a la estructura fina en el atomo de Hidrogeno.Se crean los subniveles 2s1/2, 2p1/2 y 2p3/2. Los dos primeros poseen la misma energıa dentro del presente calculo.Sin embargo, estos dos niveles poseen una ligera diferencia conocida como corrimiento Lamb, cuya explicacionrequiere el empleo de la electrodinamica cuantica.

vemos entonces que todos los niveles se bajan con respecto al nivel n = 2 no perturbado. La brecha entre el nivelno perturbado y el nivel 2p3/2 es 5 veces menor que la brecha asociada a los otros niveles. Notese que los niveles2s1/2 y 2p1/2 poseen la misma energıa. En el marco de la presente teorıa esta es una degeneracion accidental, encontraste con la degeneracion 2J + 1 de cada nivel J , la cual se considera esencial. Esta situacion se describe enla Figura 23.1

Una evidencia experimental interesante de la existencia de la estructura fina es la observacion de que la lıneaespectral α de Lyman que da cuenta de la transicion 2p → 1s, realmente contiene dos lıneas cuya brecha es muysimilar 2p1/2 → 1s1/2 y 2p3/2 → 1s1/2, tales lıneas estan separadas por una brecha de energıa dada por

∆E =(E2p1/2 − E1s1/2

)−(E2p3/2 − E1s1/2

)= E2p1/2 − E2p3/2 =

4

128mec

2α4

∆E =1

32mec

2α4

por tanto se puede observar que se emiten fotones de dos energıas diferentes (aunque muy cercanas) en la serie deLyman. Vale decir que la subcapa 1s solo admite el valor J = 1/2, y por tanto Wf no desdobla este nivel. Cuandola transicion se da entre niveles excitados hay que tener en cuenta el desdoblamiento tanto de la subcapa inicialcomo de la subcapa final.

Ya hemos mencionado que la ecuacion de Dirac para una partıcula bajo potencial Coulombiano puede resolverseen forma exacta. Dicha solucion exacta nos da la energıa de un nivel caracterizado por los numeros cuanticosn, l, s, J , y se obtiene

En,J = mec2

1 + α2

n− J − 1

2+

√(J +

1

2

)2

− α2

−2− 1

2

(23.85)

esto nos muestra que para n dado, dos niveles con el mismo J tienen la misma energıa, como lo vimos con losniveles 2s1/2 y 2p1/2. Vemos por tanto, que este resultado no solo serıa valido a primer orden en Wf sino a todoslos ordenes. Ademas se observa que la energıa depende de n, J pero no de l. Una expansion en potencias de α de

Page 556: Mecanica Cuantica: Notas de Clase

556 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

la expresion exacta (23.85), nos da

En,J = mec2 − 1

2mec

2α2 1

n2− mec

2

2n4

(n

J + 1/2− 3

4

)α4 + . . .

donde el primer termino es la autoenergıa del electron, el segundo termino es el nivel “no perturbado” de unelectron en el atomo de Hidrogeno, y el tercer termino es la contribucion de primer orden en Wf .

Puede demostrarse que incluso en ausencia de un campo externo o de fotones incidentes, debe considerarsela existencia de un campo electromagnetico fluctuante cuyo origen esta en la naturaleza cuantica del campo9. Elacople del atomo con estas fluctuaciones del campo electromagnetico remueve la degeneracion entre los niveles 2s1/2y 2p1/2, elevando ligeramente al primero con respecto al segundo, por una cantidad conocida como corrimientoLamb, que es del orden de 1060MHz. El estudio de este fenomeno permitio el desarrollo de la electrodinamicacuantica.

23.8. La estructura fina para n = 1

Para la subcapa 1s no hay degeneracion orbital ya que l = 0. Puesto que S3 e I3 pueden tomar cada uno losvalores ±1/2, la degeneracion del nivel 1s es de orden 4. Una posible base para esta subcapa esta dada por

∣∣∣∣n = 1; l = 0;mL = 0;mS = ±1

2;mI = ±1

2

veremos que a diferencia de lo que ocurre para el nivel n = 2, el termino Wf no remueve la degeneracion delnivel n = 1, i.e. de la subcapa 1s. Los terminos Wmv y WD no actuan sobre las variables de espın. Por tanto, surepresentacion matricial es proporcional a la identidad 4×4. Por otro lado, aplicando los argumentos de la seccion23.6.1, vemos que la contribucion del termino espın-orbita es cero debido a que l = 0. Puede verificarse que

〈Wmv〉1s = −5

8mec

2α4I4x4 ; 〈WD〉1s =1

2mec

2α4I4x4 ; 〈WSO〉1s = 04×4

en conclusion, la correccion Wf no desdobla al nivel n = 1, solo se corre el nivel como un todo en una cantidaddada por

〈Wf 〉1s = 〈Wmv〉1s + 〈WD〉1s + 〈WSO〉1s = −1

8mec

2α4

esto tambien se puede ver teniendo en cuenta que con n = 1, solo es posible que l = 0 y que J = 1/2. Por tantoWf solo genera un nivel de estructura fina 1s1/2.

23.9. Estructura hiperfina para n = 1

Aunque se puede calcular la estructura hiperfina para n = 2, es mas facil medir experimentalmente la estructurahiperfina para n = 1, debido a que para este nivel no hay desdoblamiento asociado a la estructura fina, sino soloun corrimiento global del nivel. Por tanto, para n = 1 el desdoblamiento del espectro se debe solo a la estructurahiperfina.

Puesto que n, l y mL son fijos en el proceso, una base adecuada sera

|n, l,mL,mS ,mI〉 ; n = 1, l = mL = 0 ; mS = ±1

2, mI = ±1

2

9Nosotros hemos usado una “aproximacion semi-clasica” en la cual las partıculas (electrones) se trabajan como entidades cuanticaspero los campos se tratan como entidades clasicas. En general, tanto las partıculas como los campos son de naturaleza cuantica.

Page 557: Mecanica Cuantica: Notas de Clase

23.9. ESTRUCTURA HIPERFINA PARA N = 1 557

Retomando entonces el Hamiltoniano (23.25) asociado a la estructura hiperfina

Whf = −µ04π

q

meR3L ·MI +

1

R3[3 (MS · n) (MI · n)−MS ·MI ] +

3MS ·MI δ (R)

(23.86)

el primer termino incorpora productos internos de la forma

〈L ·MI〉 =⟨n = 1, l = 0,mL = 0,m′

S ,m′I

∣∣LkM Ik |n = 1, l = 0,mL = 0,mS ,mI〉

= 〈n = 1, l = 0,mL = 0|Lk |n = 1, l = 0,mL = 0〉⟨m′S,m

′I

∣∣M Ik |mS ,mI〉

donde el producto interno orbital esta dado por

〈Lk〉n,l,mL =1

2〈n, l,mL| (L+ ± L−) |n, l,mL〉 = 0 ; k = 1, 2

〈L3〉n,l,mL = mL 〈n, l,mL| n, l,mL〉 = mL = 0

que se anulan en virtud de que l = mL = 0. Puede demostrarse ademas, que los terminos asociados a la interacciondipolo-dipolo son cero en virtud de la simetrıa esferica del estado 1s ???.

Por tanto, la unica contribucion no nula es la debida al termino de contacto. Para dicho termino se debecalcular el elemento matricial

〈Whf 〉1s = −2µ03

⟨n = 1; l = 0;mL = 0;m′

S ;m′I

∣∣MS ·MI δ (R) |n = 1; l = 0;mL = 0;mS ;mI〉 (23.87)

esta base expande un subespacio de 4 dimensiones asociado a la degeneracion del nivel 1s, que denotaremos porE1s, la identidad en dicho subespacio esta dada por

11s =

1/2∑

mS=−1/2

1/2∑

mI=−1/2

|n = 1; l = 0;mL = 0;mS ;mI〉 〈n = 1; l = 0;mL = 0;mS ;mI |

para calcular el elemento matricial (23.87), observamos que MS · MI solo actua sobre los grados de libertad deespın, en tanto que δ (R) solo actua sobre grados de libertad orbitales. Adicionalmente, los kets en (23.87) puedenescribirse como el producto tensorial de un ket orbital y un ket de espın. La Ec. (23.87) queda entonces

〈Whf 〉1s = −2µ03

[〈n = 1; l = 0;mL = 0| ⊗

⟨m′S ;m

′I

∣∣] MS ·MI δ (R) [|n = 1; l = 0;mL = 0〉 ⊗ |mS;mI〉]

〈Whf 〉1s = −2µ03

〈n = 1; l = 0;mL = 0| δ (R) |n = 1; l = 0;mL = 0〉⟨m′S ;m

′I

∣∣ MS ·MI |mS ;mI〉

aplicando (23.10, 23.24) se obtiene

〈Whf〉1s = −2µ03

〈n = 1; l = 0;mL = 0| δ (R) |n = 1; l = 0;mL = 0〉⟨m′S ;m

′I

∣∣(

q

meS

)·(gpqp2Mp

I

)|mS ;mI〉

〈Whf〉1s = −µ0qqpgp3meMp

〈n = 1; l = 0;mL = 0| δ (R) |n = 1; l = 0;mL = 0〉⟨m′S ;m

′I

∣∣ S · I |mS ;mI〉

teniendo en cuenta que µ0 = 1/(ε0c

2), y que qp = −q (el proton tiene la carga opuesta al electron) nos queda

finalmente

〈Whf 〉1s = R⟨m′S;m

′I

∣∣S·I |mS ;mI〉 ; R ≡ q2gp3ε0c2meMp

〈n = 1; l = 0;mL = 0| δ (R) |n = 1; l = 0;mL = 0〉 (23.88)

Page 558: Mecanica Cuantica: Notas de Clase

558 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

23.9.1. Calculo del factor orbital R para Whf

Calculamos primero el factor R definido en (23.88)

R ≡ q2gp3ε0c2meMp

Vϕ∗1,0,0 (r) δ (r) ϕ1,0,0 (r) dV =

q2gp3ε0c2meMp

|ϕ1,0,0 (0)|2 =q2gp

3ε0c2meMp|R1,0 (0)|2 |Y0,0 (0)|2

R =q2gp

3ε0c2meMp

1

4π|R1,0 (0)|2 =

q2gp12πε0c2meMp

∣∣∣(2 (a0)

−3/2 e−r/a0)r=0

∣∣∣2=

q2gp3πε0c2meMpa30

R =q2gp

3πε0c2meMp

(~µcα

)3 =4

3gp

q2

4πε0

me

Mp

cα3

m2e~

3µ3 =

4

3gpe

2me

Mp

cα3

m2e~

3

(1

me+

1

Mp

)−3

R =4

3gp (α~c)

me

Mp

cα3

m2e~

3

[1

me

(1 +

me

Mp

)]−3

R =4

3gpme

Mp

1

~2

[1 +

me

Mp

]−3

mec2α4 (23.89)

donde hemos usado (23.44).

23.9.2. Calculo del factor de espın para Whf

Nos queda entonces calcular el elemento matricial asociado al espın en (23.88)

J ≡⟨m′S;m

′I

∣∣S · I |mS;mI〉

El calculo es muy similar al que se realiza para la correccion espın orbita L · S, ya que tambien se trata delacoplamiento de dos momentos angulares (aunque en este caso, ambos momentos angulares son intrınsecos). Portanto podemos emular el razonamiento hecho en la seccion 23.6. Al igual que en dicha seccion, sera convenientehacer un cambio de base. Los elementos matriciales para el operador S · I los hemos escrito en la base10

∣∣∣∣s =1

2; I =

1

2;mS ;mI

⟩(23.90)

de estados propios comunes a S2, I2,S3, I3. Podemos introducir el momento angular intrınseco total11

F ≡ S+ I (23.91)

para construir la base ∣∣∣∣s =1

2; I =

1

2;F ;mF

⟩≡ |F ;mF 〉 (23.92)

de autoestados comunes a S2, I2,F2 y F3. Hemos abreviado la notacion puesto que s, I no cambian en el proceso.Dado que s = I = 1/2, el espın total F puede tomar dos valores

F = 0, 1

se puede pasar de una base a otra usando los coeficientes de Clebsch-Gordan discutidos en la seccion 16.8. Comoen el caso de la seccion 23.6 para el operador L · S, la base (23.92) es mejor que la base (23.90) para el calculo de

10Cuando consideramos el espın del proton y del electron, el espacio de Hilbert de los estados sera el producto tensorial del espacioorbital Er con los estados espinoriales ES del electron y EI del proton, i.e. E ≡ Er ⊗ ES ⊗ EI. Una base en tal espacio serıa de la forma|r, εS, εI〉. En la Ec. (23.90) ya hemos desacoplado la parte orbital de modo que nos describe una base del espacio espinorial ES ⊗EI.

11El momento angular total es L+ S+ I. Sin embargo, en el estado base tenemos que l = 0 y el momento angular total es S+ I.

Page 559: Mecanica Cuantica: Notas de Clase

23.9. ESTRUCTURA HIPERFINA PARA N = 1 559

los elementos matriciales de S · I, ya que en la base (23.92) la representacion matricial es diagonal. Elevando alcuadrado la expresion (23.91) y despejando S · I se tiene

F2 = S2 + I2 + 2S · IS · I =

1

2

(F2 − S2 − I2

)

al aplicar el operador S · I sobre un estado del tipo (23.92) tenemos

S · I |F ;mF 〉 =1

2

(F2 − S2 − I2

)|F ;mF 〉 =

~2

2

[F (F + 1)− 3

4− 3

4

]|F ;mF 〉

S · I |F ;mF 〉 =~2

2

[F (F + 1)− 3

2

]|F ;mF 〉

por tanto los estados |F ;mF 〉 son vectores propios del operador S · I. Los valores propios de S · I solo dependende F y no de mF y estan dados por

|F = 0;mF 〉 → −3

4~2

|F = 1;mF 〉 → ~2

4

los elementos matriciales son entonces

⟨F ′;m′

F

∣∣S · I |F ;mF 〉 = δF ′,F δm′F ,mF

~2

2

[F (F + 1)− 3

2

]; F = 0, 1 (23.93)

por tanto, Whf remueve parcialmente la degeneracion de orden 4 del estado 1s. Obteniendose un nivel de degene-racion de orden 3 para F = 1 y uno no degenerado para F = 0. La degeneracion remanente de orden 2F + 1, esde caracter esencial y esta relacionada con la invarianza de Whf bajo una rotacion del sistema total.

Ahora bien, el termino R solo dependıa de la parte orbital, de modo que su valor numerico no se altera porel cambio de base (ya que este ultimo solo involucra a la parte espinorial), y dado que las otras contribucioneshiperfinas son nulas, no es necesario regresarnos a la base original.

23.9.3. Espectro hiperfino del nivel 1s

Como vimos en la Sec. 23.8, bajo el efecto del termino Wf la energıa del nivel 1s no se desdobla, pero si sebaja como un todo en una cantidad

Ef1s = E01s −

mec2α4

8si adicionamos el efecto de Whf , encontramos que el nivel 1s1/2 se desdobla en dos niveles hiperfinos. Paracaracterizarlos, sustituımos (23.93) en (23.88) para obtener

〈Whf 〉F=01s = R〈F = 0;mF |S · I |F = 0;mF 〉 = −3

4~2R

〈Whf 〉F=11s = R〈F = 1;mF |S · I |F = 1;mF 〉 =

1

4~2R

por tanto el nivel desdoblado con F = 0 esta por debajo de 1s1/2 en una cantidad (3/4) ~2R. El nivel desdobladocon F = 1 esta por encima de 1s1/2 en una cantidad (1/4) ~2R. La brecha entre los niveles desdoblados de 1s1/2 es~2R. Estas caracterısticas se ilustran en la figura 23.2a.

Un analisis similar se puede realizar para la estructura hiperfina de los niveles 2s1/2, 2p1/2 y 2p3/2. Estos nivelesse desdoblan en niveles hiperfinos correspondientes a todos los valores permitidos de F

F = J + I, J + I − 1, . . . , |J − I|para los niveles 2s1/2 y 2p1/2, se tiene que J = 1/2, de modo que F = 0, 1. Para el nivel 2p3/2 tenemos que J = 3/2y F toma los valores F = 2, 1. La figura 23.2b, muestra la estructura hiperfina asociada a n = 2.

Page 560: Mecanica Cuantica: Notas de Clase

560 CAPITULO 23. ESTRUCTURA FINA E HIPERFINA DEL ATOMO DE HIDROGENO

Figura 23.2: (a) Ilustracion de la modificacion del nivel 1s debido a la estructura fina e hiperfina en el atomo deHidrogeno. La estructura fina solo produce un corrimiento del nivel como un todo en una cantidad −mec

2α4/8.La estructura hiperfina desdobla el nivel corregido por la estructura fina en dos subniveles, por medio del numerocuantico F . (b) Estructura hiperfina asociada a n = 2.

Page 561: Mecanica Cuantica: Notas de Clase

Capıtulo 24

Campos electricos y magneticos externossobre el atomo de Hidrogeno: EfectoZeeman y efecto Stark

En el capıtulo 23, estudiamos las correcciones al espectro del atomo de Hidrogeno debidas a los efectos relativis-tas. Para este estudio el campo electrostatico y los campos magneticos considerados son internos. En este capıtuloestudiaremos el efecto de campos magneticos y electricos externos sobre el espectro del atomo de Hidrogeno. Elefecto de un campo magnetico uniforme externo sobre el espectro atomico se conoce como efecto Zeeman, entanto que el efecto debido a un campo electrico uniforme externo se conoce como efecto Stark.

24.1. Efecto Zeeman de la estructura hiperfina del estado base 1s

Asumiremos que el atomo esta inmerso en un campo magnetico externo estatico y uniforme B0 = B0u3. Estecampo interactua con los momentos magneticos en el atomo debidos a los momentos angulares orbitales y de espın

ML =q

2meL ; MS =

q

meS ; MI = − qgp

2MpI

estas interacciones se incluyen en el Hamiltoniano como la energıa de interaccion entre el atomo y el campo B0

WZ = −B0 · (ML +MS +MI) = −B0u3 ·(

q

2meL+

q

meS− qgp

2MpI

)= −B0

(q

2meL3 +

q

meS3 −

qgp2Mp

I3

)

= − q

2meB0 (L3 + 2S3) +

q

2MpgpB0I3

WZ = ω0 (L3 + 2S3) + ωnI3 ; ω0 ≡ − q

2meB0 , ωn ≡ q

2MpgpB0 (24.1)

donde ω0 es la frecuencia de Larmor en el campo B0. Al Hamiltoniano WZ se le conoce como Hamiltoniano deZeeman. Puesto que Mp ≫ me, se tiene que

|ω0| ≫ |ωn| (24.2)

estrictamente, el Hamiltoniano de Zeeman contiene un termino adicional (termino diamagnetico) cuadratico enB0. Sin embargo, este termino no actua sobre los espines y solamente corre el nivel 1s como un todo (ver seccion14.2.3, Pag. 378). Ademas el termino es mucho menor en valor absoluto que los terminos lineales en el campo.???

Estudiaremos el efecto de WZ sobre el estado base 1s del atomo de hidrogeno. Aun con campos muy intensos,WZ es mucho menor que la distancia entre el nivel 1s y los otros niveles, de modo que su efecto se puede tratarperturbativamente.

561

Page 562: Mecanica Cuantica: Notas de Clase

562 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

El efecto de un campo magnetico externo sobre los niveles de energıa atomicos se conoce como efecto Zeeman.Dependiendo de la intensidad del campo magnetico, el Hamiltoniano WZ puede ser del orden de magnitud de laestructura hiperfina o incluso mayor. En general, WZ puede ser mucho menor, del orden de, o mucho mayor queWhf , con lo cual el Hamiltoniano completo WZ +Whf debe ser diagonalizado dentro del nivel n = 1.

En la seccion 23.9, Ec. (23.88) Pag. 557 vimos que Whf para n = 1 queda en la forma RS · I. Para el terminode Zeeman (24.1) debemos calcular elementos matriciales de la forma

〈WZ〉1s =⟨n = 1; l = 0;mL = 0;m′

S ;m′I

∣∣ [ω0 (L3 + 2S3) + ωnI3] |n = 1; l = 0;mL = 0;mS ;mI〉

dado que l = mL = 0, la contribucion ω0L3 es nula. Adicionalmente, teniendo en cuenta que 2ω0S3 + ωnI3 soloactua sobre variables de espın tenemos que

〈WZ〉1s =〈n = 1; l = 0;mL = 0| ⊗

⟨m′S;m

′I

∣∣ [2ω0S3 + ωnI3] |n = 1; l = 0;mL = 0〉 ⊗ |mS ;mI〉= 〈n = 1; l = 0;mL = 0| n = 1; l = 0;mL = 0〉

⟨m′S;m

′I

∣∣ [2ω0S3 + ωnI3] |mS ;mI〉〈WZ〉1s =

⟨m′S;m

′I

∣∣ [2ω0S3 + ωnI3] |mS;mI〉

en general debemos calcular los elementos matriciales de Whf +WZ

〈RI · S+ 2ω0S3 + ωnI3〉

los cuales solo actuan sobre grados de libertad de espın. Estos elementos matriciales deben calcularse en labase |mS ,mI〉 o en la base |F,mF 〉. Adicionalmente, la Ec. (24.2) nos dice que |ω0| ≫ |ωn| de modo quedespreciaremos el termino ωnI3. En consecuencia, la perturbacion sobre el nivel 1s sera

W1s ≈ RI · S+ 2ω0S3 (24.3)

variando de manera contınua la intensidad del campo, podemos modificar la magnitud del efecto Zeeman. Deacuerdo con la intensidad del campo determinaremos tres casos

1. ~ω0 ≪ R~2: campos debiles

2. ~ω0 ≫ R~2: campos fuertes

3. ~ω0 ≈ R~2: campos intermedios

Veremos que el operador completo se puede diagonalizar en forma exacta. Sin embargo, en los dos primeroscasos utilizaremos teorıa de perturbaciones. En el primer caso, el termino 2ω0S3 se considerara una perturbacioncon respecto a RI · S. En el segundo caso sera al contrario. Ademas de permitirnos practicar la teorıa degeneradade perturbaciones, lo anterior tambien sirve para realizar analisis asintoticos.

24.1.1. Efecto Zeeman de campo debil

En el regimen de campo debil el Hamiltoniano no perturbado H0 es el termino de contacto RI · S, y elHamiltoniano de perturbacion W es el termino 2ω0S3. Ya hemos determinado los autoestados del termino decontacto RI · S, y se obtuvieron dos niveles un triplete (nivel triplemente degenerado con F = 1) y un singlete(nivel no degenerado con F = 0)

|F = 1;mF = −1, 0, 1〉 triplete de energıaR~2

4

|F = 0;mF = 0〉 singlete de energıa − 3R~2

4(24.4)

Page 563: Mecanica Cuantica: Notas de Clase

24.1. EFECTO ZEEMAN DE LA ESTRUCTURA HIPERFINA DEL ESTADO BASE 1S 563

por tanto, debemos utilizar teorıa de perturbaciones para un nivel degenerado. De acuerdo con la formulacion en laseccion 20.4, Pag. 504 [particularmente, en las Ecs. (20.47, 20.48)] al considerar a 2ω0S3 como una perturbacion conrespecto a RI · S, (aproximacion de campo debil) debemos diagonalizar separadamente las dos matrices asociadasa 2ω0S3 en los dos niveles F = 1 y F = 0, i.e. correspondientes a valores propios no perturbados diferentes deRI · S.

De las Ecs. (16.32, 16.33), Pag. 412, obtenemos la accion de S3 sobre los estados |F,mF 〉, en donde dichosestados se ordenaran en la forma1

|F,mF 〉 → |1, 1〉 , |1, 0〉 , |1,−1〉 , |0, 0〉 (24.5)

a fin de obtener la representacion matricial. Aplicando (16.32, 16.33) sobre los estados (24.5) se obtiene

S3 |F = 1;mF = 1〉 = S3 |+,+〉 = ~

2|+,+〉 = ~

2|F = 1;mF = 1〉

S3 |F = 1;mF = 0〉 =S3√2|+,−〉+ |−,+〉 =

1√2

~

2|+,−〉 − ~

2|−,+〉

=

~

2

|+,−〉 − |−,+〉√2

=~

2|F = 0;mF = 0〉

S3 |F = 1;mF = −1〉 = S3 |−,−〉 = −~

2|−,−〉 = −~

2|F = 1;mF = −1〉

S3 |F = 0;mF = 0〉 = S3

|+,−〉 − |−,+〉√2

=

~2 |+,−〉+ ~

2 |−,+〉√2

=

~

2

|+,−〉+ |−,+〉√2

=~

2|F = 1;mF = 0〉

en notacion mas abreviada escribimos

S3 |1, 1〉 =~

2|1, 1〉 , S3 |1, 0〉 =

~

2|0, 0〉 , S3 |1,−1〉 = −~

2|1,−1〉 , S3 |0, 0〉 =

~

2|1, 0〉 (24.6)

la representacion matricial de S3 para la base ordenada (24.5) queda entonces

(S3)F,mF =~

2

1 0 0 00 0 0 10 0 −1 0

0 1 0 0

(24.7)

de acuerdo con la Ec. (20.47) Pag. 504, para realizar el calculo perturbativo siendo 2ω0S3 la perturbacion, loscalculos se realizan dentro de cada uno de los subespacios EF=1 y EF=0 asociados a valores propios no perturbadosdistintos. Por tanto, para el calculo perturbativo solo requerimos las submatrices 3× 3 y 1× 1 que se delinean enla Ec. (24.7). Es decir no se requieren los elementos de matriz que conectan a un estado de F = 1 con un estadode F = 0. Sin embargo, mas adelante cuando diagonalicemos el operador completo (24.3) requeriremos la matrizcompleta (24.7).

Es interesante comparar esta matriz con la matriz asociada a F3 = S3 + I3 en esta misma base. Tal matrizviene dada por

(F3)F,mF = ~

1 0 0 00 0 0 00 0 −1 0

0 0 0 0

(24.8)

1En el capıtulo 16, tenemos que J = J(1) + J(2). Para nuestro contexto J → F, J(1) → S, J(2) → I. Los estados definidos en la Ec.(16.17), Pag. 409, corresponden en este caso a

|±,±〉 =∣∣∣∣mS = ±1

2,mI = ±1

2

⟩; |±,∓〉 =

∣∣∣∣mS = ±1

2, mI = ∓1

2

Page 564: Mecanica Cuantica: Notas de Clase

564 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

vemos que F3 es diagonal en tanto que S3 no lo es. Sin embargo, las submatrices demarcadas en las Ecs. (24.7,24.8) son identicas salvo por un factor multiplicativo constante. Esto implica que para el calculo perturbativo(en el cual trabajamos dentro de cada subespacio EF=1 y EF=0), ambas matrices son proporcionales. En otraspalabras, los operadores S3 y F3 definidos en el subespacio

EF = EF=1 ⊕ EF=0

son totalmente diferentes. Pero la restriccion de S3 a los subespacios EF=1 y EF=0, es proporcional a la restricciondel operador F3 en cada uno de estos subespacios. Recordando la manera en que se define la restriccion de unoperador a un subespacio [seccion 1.33, Ec. (1.129), Pag. 75], y definiendo P1 como el proyector sobre el subespacioEF=1, y a P0 como el proyector sobre EF=0 podemos escribir

PiS3Pi =1

2PiF3Pi ; i = 0, 1 (24.9)

la misma relacion existe por supuesto para las otras componentes Sk y Fk, como es de esperarse en virtud de laisotropıa del espacio.

Volviendo al calculo perturbativo, la matriz que representa a la restriccion del operador 2ω0S3 sobre el subes-pacio EF=1, es la submatriz 3× 3 delineada en (24.7) multiplicada por 2ω0

2ω0 (S3)F=1 =

~ω0 0 00 0 00 0 −~ω0

(24.10)

y en el nivel F = 0 corresponde a la matriz 01×1. Puesto que ambas matrices son diagonales, vemos que losautoestados de campo debil a orden cero en ω0 coinciden con los estados |F,mF 〉. Ademas los autovalores a primerorden en ω0 vienen dados por

|F = 1;mF = 1〉 ↔ R~2

4+ ~ω0

|F = 1;mF = 0〉 ↔ R~2

4+ 0

|F = 1;mF = −1〉 ↔ R~2

4− ~ω0

|F = 0;mF = 0〉 ↔ −3R~2

4+ 0 (24.11)

La Fig. 24.1 muestra un tıpico “diagrama de Zeeman”. Esto es, una grafica de ~ω0 (medida del campo magnetico)en el eje X, y las energıas de los 4 subniveles de Zeeman sobre el eje Y . Para campo cero (ω0 = 0) tenemosdos niveles hiperfinos F = 0 y F = 1. Cuando se activa el campo B0 el subnivel no degenerado |F = 0;mF = 0〉genera una lınea horizontal (no hay cambio en la energıa ni desdoblamiento). Para el nivel F = 1 se remuevecompletamente su triple degeneracion obteniendose tres subniveles equidistantes que varıan linealmente con ~ω0

con pendientes +1, 0 y −1.Puesto que el calculo anterior es perturbativo, su validez depende de que la diferencia entre dos subniveles

adyacentes (dada por ~ω0), sea mucho menor que la diferencia entre los niveles hiperfinos “no perturbados” conF = 1 y F = 0 (asociados a campo magnetico nulo).

Frecuencias de Bohr asociadas a 〈F 〉 y 〈S〉 para efecto Zeeman con campo debil

En la seccion 5.8.3, Pagina 228, vimos que el valor esperado de un observable dado B posee unas frecuenciascaracterısticas de evolucion denominadas frecuencias de Bohr. Para dos estados de energıas Ea y Eb la frecuenciade Bohr asociada esta dada por

νab =Ea − Eb

h

Page 565: Mecanica Cuantica: Notas de Clase

24.1. EFECTO ZEEMAN DE LA ESTRUCTURA HIPERFINA DEL ESTADO BASE 1S 565

Figura 24.1: Diagrama de Zeeman en la aproximacion de campo debil para la estructura hiperfina del nivel 1s delatomo de Hidrogeno.

ademas una frecuencia de Bohr νab contribuye al valor esperado del observable B, solo si el elemento de matrizdel tipo 〈Ea|B |Eb〉 es no nulo. En nuestro contexto, los autoestados del Hamiltoniano de campo debil son estadosdel tipo |F,mF 〉. Las matrices (24.7, 24.8) representan a S3 y F3 en esta base. Puesto que la matriz para F3 esdiagonal, no hay frecuencias de Bohr no nulas asociadas a 〈F3〉 (t). Por tanto 〈F3〉 es estatico. Por otro lado, S3tiene ademas de los elementos diagonales que se asocian a la componente estatica de 〈S3〉, elementos no diagonalesentre los estados |F = 1;mF = 0〉 y |F = 0;mF = 0〉, con diferencia de energıa R~2, como se ve en la figura 24.1y en la Ec. (24.11). Por tanto en adicion a la componente estatica de 〈S3〉 hay una componente modulada a unafrecuencia R~. Un analisis similar se puede hacer para cada componente de S, y el resultado final es una precesionde S alrededor de F como se puede ver en la Fig. 24.2. Adicionalmente, en virtud de la ligadura F = I+ S,tendremos que I tambien precesa con la misma frecuencia como se ilustra en la Fig. 24.2. Puesto que todo esteanalisis es para campo magnetico cero, es claro que F = I + S es constante de movimiento, de modo que paracampo magnetico cero el vector F de la Fig. 24.2 es constante.

Notese que en la Fig. 24.2, F tiene en general componentes en todos los ejes. El plano de la base del conogenerado por S y por I, no es paralelo al plano XY , ya que el promedio de la componente S3 oscila con frecuenciaR~. Como todas las componentes (promedios) de S oscilan con la misma frecuencia, el resultado es un movimientocircular con frecuencia R~.

Al introducir el campo magnetico B0 el efecto es que F deja de ser constante de movimiento y comienza aprecesar alrededor del eje del campo (eje Z), con una frecuencia ω0 (frecuencia de Larmor), mucho menor que lafrecuencia de precesion de S e I (ya que en este regimen de campo debil ~ω0 ≪ R~2).

Debe aclararse sin embargo, que la teorıa de perturbaciones aquı mostrada no predice ninguna de estas pre-cesiones. La razon es que tales precesiones surgen de considerar elementos de matriz entre un estado con F = 1 yotro con F = 0. Pero la teorıa de perturbaciones precisamente se restringe a trabajar dentro de subespacios conF constante. Efectivamente hemos obtenido que a orden cero nuestros autoestados incluso con B0 6= 0, siguensiendo del tipo |F,mF 〉 como se ve en las Ecs. (24.11). Por tanto, a orden cero en teorıa de perturbaciones, Fsigue siendo constante de movimiento incluso con B0 6= 0.

Page 566: Mecanica Cuantica: Notas de Clase

566 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

Figura 24.2: Precesion de S e I alrededor de F y precesion de F alrededor de la direccion del campo magnetico,en el lımite de campo debil.

24.1.2. El efecto Zeeman para campo fuerte

En este caso el termino hiperfino sera la perturbacion y el termino de Zeeman sera el Hamiltoniano no pertur-bado. Por tanto, en este caso tenemos que

H0 = 2ω0S3 ; W = RI · S

Debemos empezar por diagonalizar el termino de Zeeman, para lo cual emplearemos la base desacoplada |mS ,mI〉,ya que estos son autoestados del Hamiltoniano no perturbado (Hamiltoniano de Zeeman)2.

WZ |mS ,mI〉 = 2ω0S3 |mS,mI〉 = 2mS~ω0 |mS ,mI〉

puesto que mS = ±1/2, los valores propios de WZ son ±~ω0. Cada uno de ellos es doblemente degenerado debidoa los dos valores posibles de mI . Utilizaremos la notacion |mS ,mI〉 → |εS , εI〉 con εS = ± y εI = ±. Tenemosentonces que

2ω0S3 |+,±〉 = +~ω0 |+,±〉 ; 2ω0S3 |−,±〉 = −~ω0 |−,±〉 (24.12)

puesto que el Hamiltoniano hiperfinoWhf es ahora la perturbacion, consideraremos correcciones de primer orden enR, diagonalizando la restriccion del operador RI · S a los subespacios bidimensionales EmS=1/2,mI y EmS=−1/2,mI ,asociados a los dos valores propios distintos de 2ω0S3.

Es facil ver que los vectores de la forma |ε1, ε2〉 son tambien vectores propios de F3

F3 |mS ,mI〉 = (S3 + I3) |mS ,mI〉 = ~ (mS +mI) |mS,mI〉2Estrictamente la base desacoplada es solo la parte espinorial de los estados propios del Hamiltoniano de Zeeman. La componente

orbital de estos autoestados es arbitraria.

Page 567: Mecanica Cuantica: Notas de Clase

24.1. EFECTO ZEEMAN DE LA ESTRUCTURA HIPERFINA DEL ESTADO BASE 1S 567

Claramente los unicos vectores propios con el mismo valor propio de F3 son |+,−〉 y |−+〉 que estan en subespaciosdiferentes. Por otro lado, teniendo en cuenta que

RI · S =R2

(F2 − S2 − I2

)

conmuta con F3, el teorema 1.68 Pag. 58, nos dice que no hay elementos matriciales de RI · S entre los estados|+,+〉 , |+,−〉 ni entre los estados |−,+〉 , |−,−〉 ya que corresponden a valores propios diferentes de F3. Enconsecuencia, dentro de cada subespacio bidimensional, el operador RI · S es diagonal.

⟨m′S,m

′I

∣∣RI · S |mS,mI〉 = 〈mS ,mI |RI · S |mS ,mI〉 δmS ,m′SδmI ,m′

I(24.13)

utilizando la Ec. (16.11) Pag. 408, tenemos que

I · S = I3S3 +1

2(I+S− + I−S+) (24.14)

La ecuacion (24.13), nos muestra que solo los elementos diagonales sobreviven para el operador I · S. A conti-nuacion demostraremos que los elementos diagonales del operador I+S−+I−S+ son nulos. Para verlo, examinamosprimero la accion de dicho operador sobre un elemento arbitrario de la base desacoplada

[I+S− + I−S+] |mS,mI〉 = I+√s (s+ 1)−mS (mS − 1) |mS − 1,mI〉

+I−√s (s+ 1)−mS (mS + 1) |mS + 1,mI〉

[I+S− + I−S+] |mS,mI〉 =√I (I + 1)−mI (mI + 1)

√s (s+ 1)−mS (mS − 1) |mS − 1,mI + 1〉

+√I (I + 1)−mI (mI − 1)

√s (s+ 1)−mS (mS + 1) |mS + 1,mI − 1〉

estos valores solo pueden ser no nulos para los kets |mS = +1/2,mI = −1/2〉 y |mS = −1/2,mI = 1/2〉. Puestoque s = I = 1/2, y para estos casos ms = −mI , las contribuciones no nulas son

[I+S− + I−S+] |mS,−mS〉 =√s (s+ 1) +mS (−mS + 1)

√s (s+ 1)−mS (mS − 1) |mS − 1,−mS + 1〉

+√s (s+ 1) +mS (−mS − 1)

√s (s+ 1)−mS (mS + 1) |mS + 1,−mS − 1〉

[I+S− + I−S+] |mS,−mS〉 = [s (s+ 1)−mS (mS − 1)] |mS − 1,−mS + 1〉+ [s (s+ 1)−mS (mS + 1)] |mS + 1,−mS − 1〉

para el caso s = mS = 1/2, la contribucion no nula queda

[I+S− + I−S+] |+,−〉 = [s (s+ 1)−mS (mS − 1)] |−,+〉

de modo que el termino diagonal es claramente nulo

〈+,−| [I+S− + I−S+] |+,−〉 = [s (s+ 1)−mS (mS − 1)] 〈+,− |−,+〉 = 0

similarmente ocurre para el caso s = −mS = 1/2. Por tanto, se tiene que

〈mS ,mI | [I+S− + I−S+] |mS ,mI〉 = 0 (24.15)

combinando las ecuaciones (24.13), (24.14) y (24.15), un elemento de matriz del operador RI · S en la basedesacoplada queda

R⟨m′S ,m

′I

∣∣ I · S |mS ,mI〉 = R〈mS ,mI | I3S3 |mS ,mI〉 δmS ,m′SδmI ,m′

I= R~2mSmI δmS ,m′

SδmI ,m′

I(24.16)

Page 568: Mecanica Cuantica: Notas de Clase

568 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

De otra parte, combinando las Ecs. (24.12, 24.16), obtenemos los autovectores a orden cero en R y los auto-valores a primer orden en R

|+,+〉 ↔ ~ω0 +R~2

4(24.17)

|+,−〉 ↔ ~ω0 −R~2

4(24.18)

|−,+〉 ↔ −~ω0 −R~2

4(24.19)

|−,−〉 ↔ −~ω0 +R~2

4(24.20)

en la Fig. 24.3, las lıneas solidas (para ~ω0 ≫ R~2) representan los niveles para el regimen de campo fuerte. Laslıneas punteadas indican la prolongacion de las lıneas solidas, pero estan en un regimen que no corresponde acampo fuerte. Se obtienen dos lıneas paralelas de pendiente +1 separadas por una energıa R~2/2 y dos lıneasparalelas de pendiente −1 separadas en R~2/2.

Figura 24.3: (a) Diagrama de Zeeman en la aproximacion de campo fuerte, tomando la estructura hiperfina delnivel 1s del atomo de Hidrogeno como perturbacion.

El desdoblamiento de campo fuerte R~2/2 entre los estados |+,+〉 y |+,−〉 o entre los estados |−,+〉 y |−,−〉se puede interpretar de la siguiente manera: Vimos que en la expresion (24.14) solo el termino I3S3 contribuıa enel calculo de los elementos matriciales en la aproximacion de campo fuerte. Por tanto el Hamiltoniano total en

Page 569: Mecanica Cuantica: Notas de Clase

24.1. EFECTO ZEEMAN DE LA ESTRUCTURA HIPERFINA DEL ESTADO BASE 1S 569

aproximacion de campo fuerte se puede escribir de manera efectiva en la forma

2ω0S3 +RI3S3 = 2

(ω0 +

R2I3

)S3 = 2 (ω0 + ωI)S3 ; ωI ≡

R2~mI (24.21)

de modo que el espın electronico se acopla a ω0 (i.e. al campo B0) pero adicionalmente se acopla a un “campoefectivo” parametrizado por ωI que surge del acople hiperfino entre I y S tomando dos valores posibles ya quemI = ±1/2, dependiendo de si el espın del nucleo esta arriba o abajo. Puesto que este “campo interno efectivo”se suma o resta a B0 dependiendo de mI , es este campo efectivo el que genera la brecha entre los estados |+,+〉y |+,−〉 o entre los estados |−,+〉 y |−,−〉.

Las frecuencias de Bohr en la evolucion de 〈S3〉 para campo fuerte

En la aproximacion de campo fuerte, el acople Zeeman de S con B0 es mas importante que el acople hiperfinode S con I. Si despreciamos el acople hiperfino, puede verse que S precesa muy rapidamente (en virtud de que|B0| es grande) alrededor del eje Z. Puesto que ωn es despreciable, se desprecia tambien el efecto Zeeman nuclear(entre B0 e I), bajo estas aproximaciones I permanece estacionario.

De la Ec. (24.14) podemos ver que en el regimen de campo fuerte la rapida precesion de S, genera que losterminos S± oscilen muy rapido y cancelen su efecto en promedio, quedando entonces solo con la contribucionS3I3. Si incorporamos el termino hiperfino, el efecto es adicionar un pequeno “campo efectivo” paralelo a u3 yproporcional a I3 como se ve en la Ec. (24.21). Este campo efectivo acelera o retarda la precesion de S alrededor deZ, dependiendo del signo de I3. En un campo fuerte, los estados de energıa bien definida son de la forma |mS ,mI〉.En esta base, el operador S3 tiene solo elementos diagonales, de manera que no hay frecuencias de Bohr no nulasasociadas a 〈S3〉. En consecuencia, 〈S3〉 sera estatico en la aproximacion de campo fuerte (en contraste con elescenario de campo debil). La Fig. 24.4 muestra la precesion de S y el caracter estatico de I cuando despreciamosel acople hiperfino y el acople Zeeman entre B0 e I.

Para los observables 〈Si〉 con i = 1, 2 encontramos dos frecuencias angulares de Bohr ω0 ±R~/2, que corres-ponden a las dos posibles orientaciones del “campo efectivo interno” producido por I3, que se adiciona al campoexterno B0. La introduccion del termino hiperfino tambien genera la precesion de I alrededor del “campo efectivointerno” generado por S3.

24.1.3. El efecto Zeeman para campo intermedio

Si asumimos que ~ω0 ≈ R~2, no podemos considerar a ninguno de los dos Hamiltonianos Whf o WZ como unaperturbacion. En este caso tenemos que diagonalizar el Hamiltoniano completo. Utilizaremos los estados |F ;mF 〉para encontrar la representacion matricial del Hamiltoniano completo. Puesto que estos son autoestados de Whf ,la matriz asociada a Whf sera diagonal. De acuerdo con las Ecs. (24.4) los elementos diagonales de Whf asociadosa F = 1 tienen el valor R~2/4 y los asociados a F = 0 dan −3R~2/4. Por otra parte, las Ecs. (24.6) nos dan larepresentacion matricial de S3 en la base |F ; ,mF 〉. Por tanto, ordenando los vectores base en la forma3

|1, 1〉 , |1,−1〉 , |1, 0〉 , |0, 0〉 (24.22)

la representacion matricial de Whf +Wz queda

〈Whf +WZ〉F,mF =

R~2

4 + ~ω0 0 0 0

0 R~2

4 − ~ω0 0 0

0 0 R~2

4 ~ω0

0 0 ~ω0 −3R~2

4

(24.23)

3No podemos tomar directamente la representacion matricial (24.7) ya que esta se construyo sobre el ordenamiento (24.5), el cualdifiere del ordenamiento en (24.22).

Page 570: Mecanica Cuantica: Notas de Clase

570 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

Figura 24.4: (a) Precesion de S alrededor de la direccion del campo magnetico en la aproximacion de campo fuerte.En este caso S3 es estatico. Adicionalmente, si despreciamos ωn, el vector I serıa estatico.

Notese que S3 conmuta con F3, de lo cual el termino 2ω0S3 solo tendra elementos matriciales no nulos entre dosestados con el mismo mF , lo cual explica los ceros de la matriz (24.23). Por esta misma razon se ordeno la baseen la forma (24.22) en lugar del orden seguido en la Ec. (24.5).

La matriz (24.23) es diagonal por bloques de modo que se puede escribir como suma directa de dos matrices1× 1 mas una matriz 2× 2.

〈Whf +WZ〉F,mF =

(R~2

4+ ~ω0

)11×1 ⊕

(R~2

4− ~ω0

)11×1 ⊕

(R~2

4 ~ω0

~ω0 −3R~2

4

)(24.24)

Las dos matrices unidimensionales tienen los siguientes valores propios4

E1 =R~2

4+ ~ω0 ↔ |1, 1〉 = |+,+〉 (24.25)

E2 =R~2

4− ~ω0 ↔ |1,−1〉 = |−,−〉 (24.26)

El diagrama de Zeeman correspondiente se muestra en la Fig. 24.5. Los niveles E1 y E2 estan representados porlas dos lıneas rectas contınuas de pendientes ±1, que toman el valor R~2/4 para ω0 = 0 (i.e. para campo externocero). Vemos que estas graficas reproducen el comportamiento para campo debil (ω0 pequeno) y para campofuerte (ω0 grande) al comparar ambos lımites con los obtenidos en las figuras 24.1, 24.3.

4Notese que con la base ordenada segun la ecuacion (24.5), la matriz no tendrıa la textura por bloques descrita en (24.24). Estojustifica el reordenamiento dado en (24.22).

Page 571: Mecanica Cuantica: Notas de Clase

24.1. EFECTO ZEEMAN DE LA ESTRUCTURA HIPERFINA DEL ESTADO BASE 1S 571

Figura 24.5: (a) Diagrama de Zeeman para valores arbitrarios del campo magnetico. Las lıneas punteadas repre-sentan las asıntotas de las hiperbolas.

Los autovalores asociados a la submatriz 2× 2 de la Ec. (24.23) nos dan la ecuacion de valores propios(R~2

4− E

)(−3R~2

4− E

)− ~2ω2

0 = 0

cuyas raıces nos dan los otros niveles de energıa

E3 = −R~2

4+

√(R~2

2

)2

+ ~2ω20 (24.27)

E4 = −R~2

4−√(R~2

2

)2

+ ~2ω20 (24.28)

La Fig. 24.5 muestra que cuando ~ω0 varıa, los niveles E3 y E4 trazan las dos ramas de una hiperbola. Las asıntotasde esta hiperbola son las lıneas rectas definidas por las ecuaciones

E = −R~2

4± ~ω0 (24.29)

que son las lıneas rectas punteadas asociadas a la Fig 24.5 y las ecuaciones (24.18, 24.19) correspondientes a losestados |+,−〉 y |−,+〉. Los dos puntos de retorno de la hiperbola corresponden a ω0 = 0 y energıas −R~2/4 ±R~2/2, es decir estan sobre el eje Y con energıas R~2/4 y −3R~2/4. Las tangentes a ambos puntos de retornoson horizontales en concordancia con lo encontrado en (24.11) para los estados |F = 0, 1;mF = 0〉.

Notese que en un campo debil los estados de energıa bien definida son los estados |F,mF 〉 y en un campofuerte son los estados de la base |mS,mI〉. Para campos intermedios, son los vectores propios asociados a la matriz(24.23)5, que son estados intermedios entre los estados |F,mF 〉 y los estados |mS,mI〉. Esto se puede entender

5Notese que dos de los vectores propios de la matriz (24.23) son los estados

|ψ1〉 = |1, 1〉 = |+,+〉 ; |ψ2〉 = |1,−1〉 = |−,−〉

Page 572: Mecanica Cuantica: Notas de Clase

572 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

como si nos movieramos contınuamente desde un acople fuerte entre I y S (base acoplada) para ω0 pequeno, haciaun desacople total entre I y S (base desacoplada) para ω0 grande.

24.2. Efecto Stark para el atomo de Hidrogeno

Consideremos al atomo de Hidrogeno inmerso en un campo electrico uniforme y estatico ~E = Eu3. La energıade interaccion del campo electrico con el momento dipolar electrico qR del atomo esta descrita por el Hamiltoniano

WS = −q~E·R = −qEX3

aun para los campos mas intensos que se producen en el laboratorio, WS ≪ H0, siendo H0 el Hamiltoniano(13.4) de la Pag. 357, que describe la energıa cinetica mas la energıa potencial interna electrostatica del atomode Hidrogeno. Por tanto, se puede tratar perturbativamente con respecto a H0. Por otro lado, WS puede sermucho menor, del orden de, o mucho mayor que alguno de los Hamiltonianos Wf y Whf . En esta seccion nosrestringiremos a asumir que el campo electrico externo es suficientemente intenso para ser dominante con respectoa Wf y Whf . De hecho en el actual contexto despreciaremos la estructura fina e hiperfina. Puesto que H0 y WS

no dependen de variables de espın, ignoraremos los numeros cuanticos mS y mI , cuyo unico papel sera multiplicarcualquier degeneracion encontrada por cuatro.

24.2.1. El efecto Stark sobre el nivel n = 1

De acuerdo con la teorıa de perturbaciones, el efecto del campo electrico a primer orden sobre el estado1s, depende del elemento matricial

〈n = 1, l = 0,mL = 0|WS |n = 1, l = 0,mL = 0〉 = −qE 〈n = 1, l = 0,mL = 0|X3 |n = 1, l = 0,mL = 0〉

〈WS〉1s = −qE∫dV ϕ∗

1,0,0 (r) x3 ϕ1,0,0 (r)

puesto que x3 es impar y la funcion de onda del estado base es par, el integrando es impar y la integral se anula.En consecuencia, no hay correccion lineal en E. Por tanto, debemos calcular el termino (20.41), Pag. 502, asociadoal segundo orden en teorıa de perturbaciones.

ε2 = q2E2∑

n 6=1

l,m

|〈1, 0, 0|X3 |n, l,m〉|2E1 − En

(24.30)

aquı aparecen integrales no nulas, ya que hay funciones de onda que tienen paridad opuesta a ϕ1,0,0 (r), demanera que el integrando tendrıa paridad par. Recordemos que la paridad de la funcion de onda esta dictaminadapor el armonico esferico asociado cuya paridad es la asociada al numero cuantico l [ver Ec. (11.34) Pag. 332].Adicionalmente, puesto que E1 − En < 0, el estado base se baja.

De acuerdo con la expresion (20.39) Pag. 502, el estado base corregido a primer orden en E, nos da

|ψ0〉 = |1, 0, 0〉 − qE∑

n 6=1

l,m

|n, l,m〉 〈n, l,m|X3 |1, 0, 0〉E1 − En

+ . . . (24.31)

esto nos muestra que a primer orden en E, el valor medio del momento dipolar electrico qR, viene dado por

dado que estos dos estados coinciden en ambas bases. Sin embargo los otros dos vectores propios de la matriz (24.23) son combinacioneslineales de |1, 0〉 y |0, 0〉 o equivalentemente, combinaciones lineales de |+,−〉 y |−,+〉. Tales estados se obtienen diagonalizando lasubmatriz 2× 2 de la matriz (24.23).

Page 573: Mecanica Cuantica: Notas de Clase

24.2. EFECTO STARK PARA EL ATOMO DE HIDROGENO 573

〈ψ0| qR |ψ0〉. Utilizando (24.31) tenemos que

〈ψ0| qR |ψ0〉 = q

〈1, 0, 0| − qE

n′ 6=1

l′,m′

〈1, 0, 0|X3 |n′, l′,m′〉E1 − En′

⟨n′, l′,m′∣∣

×

|1, 0, 0〉 − qE

n 6=1

l,m

|n, l,m〉 〈n, l,m|X3 |1, 0, 0〉E1 − En

〈ψ0| qR |ψ0〉 = q 〈1, 0, 0|R |1, 0, 0〉 − q2E∑

n 6=1

l,m

〈1, 0, 0|R |n, l,m〉 〈n, l,m|X3 |1, 0, 0〉E1 − En

−q2E∑

n′ 6=1

l′,m′

〈1, 0, 0|X3 |n′, l′,m′〉E1 − En′

⟨n′, l′,m′∣∣R |1, 0, 0〉 +O

(E2)

una vez mas el termino 〈1, 0, 0|R |1, 0, 0〉 se anula por argumentos de paridad. El valor esperado del momentodipolar electrico a primer orden en E, vendra dado entonces por

〈ψ0| qR |ψ0〉 = −q2E∑

n 6=1

l,m

〈1, 0, 0|R |n, l,m〉 〈n, l,m|X3 |1, 0, 0〉 + 〈1, 0, 0|X3 |n, l,m〉 〈n, l,m|R |1, 0, 0〉E1 − En

(24.32)

Por tanto, el campo electrico E genera un momento dipolar inducido. Ahora bien, de las identidades

x1 = r sin θ cosϕ = r

√2π

3[Y1,−1 (θ, ϕ)− Y11 (θ, ϕ)]

x2 = r sin θ sinϕ = ir

√2π

3[Y1,−1 (θ, ϕ) + Y11 (θ, ϕ)]

y usando las relaciones de ortogonalidad de los armonicos esfericos puede verse que

〈ψ0|Xk |ψ0〉 = 0 ; k = 1, 2 (24.33)

sustituyendo (24.33) en (24.32), el valor esperado del momento dipolar electrico queda

〈ψ0| qR |ψ0〉 = u3q 〈ψ0|X3 |ψ0〉 = −q2E∑

n 6=1

l,m

2u3 〈1, 0, 0|X3 |n, l,m〉 〈n, l,m|X3 |1, 0, 0〉E1 − En

〈ψ0| qR |ψ0〉 = −2u3q2E∑

n 6=1

l,m

|〈1, 0, 0|X3 |n, l,m〉|2E1 − En

(24.34)

de modo que el momento dipolar inducido es paralelo al campo electrico aplicado ~E = Eu3 (como ocurre tambienen el escenario clasico). Esto se debe a la simetrıa esferica del estado 1s (ya que Y00 no depende de los angulos) y alhecho de que esta simetrıa esferica es rota por el campo electrico y reducida a una simetrıa axial con respecto al ejeX3. El coeficiente de proporcionalidad χ entre el momento dipolar inducido y el campo se denomina susceptibilidadelectrica lineal. De acuerdo con la Ec. (24.34), para el estado 1s esta susceptibilidad electrica viene dada por

χ1s = −2q2∑

n 6=1

l,m

|〈1, 0, 0|X3 |n, l,m〉|2E1 − En

(24.35)

ahora bien, para la componente X3 que sobrevive, tenemos en cuenta que

x3 = r cos θ = r

√4π

3Y1,0 (θ) = r

√4π

3Y ∗1,0 (θ) (24.36)

Page 574: Mecanica Cuantica: Notas de Clase

574 CAPITULO 24. CAMPOS EXTERNOS SOBRE EL ATOMO DE HIDROGENO

y las relaciones de ortonormalidad de los armonicos esfericos nos conducen a

〈1, 0, 0|X3 |n, l,m〉 =

∫R∗

1,0 (r) Y∗00 x3 Rn,l (r) Ylm (θ, ϕ) r2 dr dΩ

=

√4π

3

∫R∗

1,0 (r) Y00 rY∗1,0 (θ) Rn,l (r) Ylm (θ, ϕ) r2 dr dΩ

=

√4π

3Y00

∫R∗

1,0 (r) Rn,l (r) r3 dr

∫Y ∗1,0 (θ) Ylm (θ, ϕ) dΩ

=

√4π

3δl,1δm,0Y00

∫R∗

1,0 (r) Rn,l (r) r3 dr

∫Y ∗1,0 (θ) Y1,0 (θ, ϕ) dΩ

= δl,1δm,0

∫R∗

1,0 (r)Y∗00

[√4π

3rY ∗

1,0 (θ)

]Rn,1 (r) Y1,0 (θ, ϕ) r

2 dr dΩ

〈1, 0, 0|X3 |n, l,m〉 = δl,1δm,0

∫R∗

1,0 (r)Y∗00 x3 Rn,1 (r) Y1,0 (θ, ϕ) dV

quedando finalmente

〈1, 0, 0|X3 |n, l,m〉 = 〈1, 0, 0|X3 |n, 1, 0〉 δl,1δm,0con lo cual las Ecs. (24.30, 24.31 ,24.34, 24.35) quedan en la forma

ε2 = q2E2∞∑

n=2

|〈1, 0, 0|X3 |n, 1, 0〉|2E1 − En

|ψ0〉 = |1, 0, 0〉 − qE∞∑

n=2

|n, 1, 0〉 〈n, 1, 0|X3 |1, 0, 0〉E1 − En

+ . . .

〈ψ0| qR |ψ0〉 = −2u3q2E

∞∑

n=2

|〈1, 0, 0|X3 |n, 1, 0〉|2E1 − En

χ1s = −2q2∞∑

n=2

|〈1, 0, 0|X3 |n, 1, 0〉|2E1 − En

24.2.2. Efecto Stark sobre el nivel n = 2

El efecto deWS sobre el nivel n = 2 se obtiene a primer orden diagonalizando la restriccion deWS al subespacioE2 expandido por los cuatro estados6

|2, 0, 0〉 , |2, 1, 1〉 , |2, 1, 0〉 , |2, 1,−1〉 (24.37)

la funcion de onda ϕ2,0,0 (r) es par, y las funciones de onda ϕ2,1,m (r) son impares. Puesto que WS es impar, seconcluye que se anulan los siguientes 10 elementos matriciales

〈2, 0, 0|WS |2, 0, 0〉 =⟨2, 1,m′∣∣WS |2, 1,m〉 = 0

y dado que los estados |2, 0, 0〉 y |2, 1,m〉 son de paridad opuesta, los elementos matriciales 〈2, 1,m|WS |2, 0, 0〉pueden ser no nulos. De hecho veremos que solo 〈2, 1, 0|WS |2, 0, 0〉 es no nulo. Para verlo utilizamos la Ec. (24.36)

6Estrictamente el espacio de estados es de dimension 16 debido a las variables de espın del electron y el proton. Pero dado que nohay dependencia de las variables de espın, las matrices se podran escribir comoM4×4⊗I4×4, siendoM4×4 una matriz orbital construıdacon la base (24.37). Por supuesto, toda degeneracion obtenida se multiplica por 4.

Page 575: Mecanica Cuantica: Notas de Clase

24.2. EFECTO STARK PARA EL ATOMO DE HIDROGENO 575

con lo cual

〈2, 1,m|WS |2, 0, 0〉 = −qE∫ϕ∗2,1,m (r) x3 ϕ2,0,0 (r) dV

= −√

3qE

∫R2,1 (r) Y

∗1,m (θ, ϕ) rY10 (θ) R2,0 (r)Y0,0 (θ, ϕ) r

2 dr dΩ

= −√

1

√4π

3qE

∫R2,1 (r) R2,0 (r) r

3 dr

∫Y ∗1,m (θ, ϕ) Y10 (θ) dΩ

= − qE√3δm,0

∫ ∞

0R2,1 (r) R2,0 (r) r

3 dr

〈2, 1,m|WS |2, 0, 0〉 = γEδm,0 ; γ ≡ − q√3

∫ ∞

0R2,1 (r) R2,0 (r) r

3 dr

puesto que R2,1 (r) y R2,0 (r) son reales, la cantidad γ es real. Los elementos matriciales deWS en la base ordenada

|2, 1, 1〉 , |2, 1,−1〉 , |2, 1, 0〉 , |2, 0, 0〉

nos dan

〈WS〉 =

0 0 0 00 0 0 00 0 0 γE0 0 γE 0

(24.38)

calculando los vectores y valores propios de la matriz (24.38), obtenemos la correccion a primer orden en E de laenergıa y a orden cero de los autoestados.

|2, 1, 1〉 ↔ ε1 = 0

|2, 1,−1〉 ↔ ε1 = 0

1√2(|2, 1, 0〉 + |2, 0, 0〉) ↔ ε1 = γE

1√2(|2, 1, 0〉 − |2, 0, 0〉) ↔ ε1 = −γE

con lo cual la degeneracion del nivel n = 2 se remueve parcialmente, y los corrimientos en la energıa son linealesy no cuadraticos en E, a diferencia de la correccion (24.30) para el nivel 1s. Este efecto Stark lineal se debe ala existencia de dos niveles de paridad opuesta y con la misma energıa no perturbada, i.e. los niveles 2s y 2p.

Los estados con n = 2 son inestables ya que tienden a caer en el estado base. Sin embargo, el estado 2s tieneuna vida media mucho mayor que el estado 2p. La transicion entre los estados 2p y 1s se realiza por emisionespontanea de un foton de la serie de Lyman α, con una vida media de unos 10−9seg. Por otro lado, la transiciondel estado 2s al 1s se realiza por la emision de dos fotones, con una vida media del orden de un segundo. Por loanterior, se dice que el estado 2p es inestable y el estado 2s se denomina metaestable.

Puesto que el Hamiltoniano de Stark WS tiene elementos de matriz no nulos que conectan al estado 2s conel 2p, cualquier campo electrico externo (estatico u oscilante) mezcla el estado metaestable 2s con el estadoinestable 2p, reduciendo fuertemente la vida media del estado 2s. Este fenomeno se conoce como extincion dela metaestabilidad.

Page 576: Mecanica Cuantica: Notas de Clase

Capıtulo 25

Moleculas diatomicas

Figura 25.1: Perfil tıpico de la energıa potencial de interaccion entre los nucleos de una molecula diatomica comofuncion de la distancia r entre los nucleos. Los primeros estados vibracionales se representan por lıneas horizontalesen el pozo de potencial.

La formacion de una molecula diatomica requiere que la energıa de interaccion V (r) entre los atomos neutrosposea al menos un mınimo local que garantice la estabilidad del sistema, siendo r la distancia entre los atomos.La forma tıpica de este potencial se muestra en la Fig. 25.1. Para r muy grande, los atomos no interactuan, demodo que V (r) debe tomar un valor constante que suele escogerse como el cero de la energıa potencial. A medidaque r decrece V (r) varıa aproximadamente como −1/r6, donde la interaccion atractiva es del tipo de fuerza deVan der Waals1. Cuando r se vuelve suficientemente pequeno como para que las funciones de onda electronicasse traslapen, V (r) decrece aun mas rapido y pasa por un mınimo local r = re, luego de lo cual decrece en valorabsoluto y se anula en algun punto rm. Para r < rm la fuerza se vuelve repulsiva y se incrementa en formaindefinida a medida que decrece r (ya que en este caso domina la interacccion repulsiva entre los nucleos).

En una imagen clasica, r = re serıa un punto de equilibrio estable. El valor V (re) = −V0 nos da la energıa dedisociacion de la molecula. Esto es, V0 es la energıa necesaria para que los dos atomos se separen indefinidamente.A mayor V0 la molecula es mas estable.

La descripcion mecano-cuantica de la molecula es un problema muy complejo, ya que involucra encontrarlos estados estacionarios de un sistema de nucleos y electrones que interactuan todos entre sı. De hecho, no sepuede resolver de manera exacta la ecuacion de Schrodinger asociada. Una importante simplificacion surge del

1Es logico que el potencial efectivo decaiga mucho mas rapido que el potencial de Coulomb, ya que la interaccion efectiva es elresultado del apantallamiento de cargas en una molecula que es neutra.

576

Page 577: Mecanica Cuantica: Notas de Clase

577

hecho de que la masa del electron es mucho menor que la del proton. Esto implica que en primera aproximacion, elmovimiento de ambos se puede estudiar por separado (aproximacion de Born-Oppenheimer). Para ello comenzamosestudiando el movimiento de los electrones para un valor fijo de r entre los dos nucleos. De esta forma se obtieneuna serie de estados estacionarios para el sistema electronico de energıas E1 (r) , E2 (r) etc. Consideramos entoncesel estado base E1 (r) del sistema electronico, cuando r varıa debido al movimiento de los nucleos. Asumimos queel sistema electronico permanece siempre en el estado base para todo r. Esto implica que la funcion de onda delsistema se adapta instantanemente a cualquier cambio en r. Se dice que los electrones (que son muy moviles)siguen “adiabaticamente” el movimiento de los nucleos. En esta aproximacion, la energıa electronica E1 (r) actuacomo una energıa potencial de interaccion entre los dos nucleos. Esta energıa potencial de interaccion dependeentonces de la distancia entre los nucleos r y debe anadirse a la repulsion electrostatica. En consecuencia, bajo laaproximacion de Born-Oppenheimer la energıa potencial de interaccion total V (r) del sistema de los dos nucleosque nos permite determinar su movimiento estara dada por

V (r) = E1 (r) +Z1Z2e

2

r(25.1)

siendo Z1 y Z2 los numeros atomicos de los dos nucleos. La energıa potencial modelada en la Fig. 25.1, es la dadapor la Ec. (25.1).

Al tomar en cuenta todos los grados de libertad del problema apareceran vibraciones de los dos nucleosalrededor de su posicion de equilibrio, y rotacion del sistema con respecto al centro de masa.

Sean m1 y m2 las masas de los dos nucleos, puesto que el potencial V (r) es central, la seccion 12.2 nos muestraque tambien en el escenario cuantico es posible separar el problema en el movimiento del centro de masa (unamasa libre equivalente M = m1 +m2, con el movimiento del centro de masa) y el movimiento de una partıculaequivalente de masa reducida

µ =m1m2

m1 +m2

sometida al potencial V (r) de la Ec. (25.1). El unico movimiento no trivial es el de la masa reducida. A diferenciadel atomo de hidrogeno en el cual la masa reducida es aproximadamente la masa del electron, la masa reducidade un sistema de dos nucleos es en general muy diferente a la masa de cada nucleo, puesto que dichas masassuelen ser del mismo orden de magnitud. En consecuencia, el movimiento real de cada nucleo es muy diferente almovimiento de la partıcula imaginaria con masa µ, las posiciones de los nucleos se obtienen a partir de la posiciondel centro de masa y de la posicion de la partıcula imaginaria µ, usando las Ecs. (12.2) Pag. 344.

Retornando al problema equivalente de la partıcula de masa reducida µ sometida al potencial V (r), los estadosestacionarios asociados vendran dados por las Ecs. (12.33, 12.36) Pag. 351

ϕv,l,m (r, θ, ϕ) =1

ruv,l (r)Yl,m (θ, ϕ) (25.2)

donde los niveles de energıa y la funcion radial estan dadas por la Ec. (12.37), Pag. 352

[− ~2

d2

dr2+ V (r) +

l (l + 1) ~2

2µr2

]uv,l (r) = Ev,luv,l (r) (25.3)

asumiremos de aquı en adelante que la proyeccion del momento angular total orbital de los electrones sobre el ejeinternuclear es nulo, al igual que su espın total. En consecuencia, el momento angular total de la molecula surgesolo de la rotacion de los dos nucleos. Este es el caso en casi todas las moleculas diatomicas en su estado base.En el caso mas general surgen terminos en la energıa nuclear de interaccion que no dependen exclusivamente dela distancia r.

Podemos definir por supuesto un potencial efectivo como la suma del potencial real y el potencial centrıfugoen la forma

Vef (r) = V (r) + Vcent (r) = V (r) +l (l + 1) ~2

2µr2(25.4)

Page 578: Mecanica Cuantica: Notas de Clase

578 CAPITULO 25. MOLECULAS DIATOMICAS

de modo que la ecuacion radial (25.3), tiene la forma de una ecuacion de valores propios para un Hamiltonianounidimensional en el cual la partıcula de masa µ se coloca en el potencial efectivo Vef (r).

Adicionalmente, expandiremos el potencial V (r) en la forma

V (r) = −V0 + f (r − re)2 − g (r − re)

3 + . . . (25.5)

los coeficientes f y g son positivos, puesto que el potencial posee un mınimo local en re, y se incrementa masrapido para r < re que para r > re. Comenzaremos despreciando el termino cubico de tal manera que asumiremospotencial puramente parabolico.

25.1. Estados de momento angular cero (l = 0)

Para l = 0, se anula el potencial centrıfugo en el potencial efectivo (25.4). Por tanto Vef (r) coincide con V (r).En consecuencia, obtenemos los autoestados y autovalores propios del oscilador armonico cuantico unidimensional.La variable unidimensional x del oscilador armonico se convierte en (r − re), que serıa la “elongacion” del oscilador.

Ev,0 = −V0 +(v +

1

2

)~ω ; ω ≡

√2f

µ, v = 0, 1, 2, 3, . . . (25.6)

uv (r) =

(β2

π

)1/41√2vv!

e−β2(r−re)2/2Hv [β (r − re)] ; β ≡

√µω

~(25.7)

siendo Hv un polinomio de Hermite [ver Ecs. (8.50), Pag. 282]. En la Fig. 25.1, Pag. 576, hemos representadolos dos primeros niveles de energıa con lıneas horizontales, donde la longitud de las lıneas nos da una idea de laextension caracterıstica (∆r)v de la funcion de onda asociada a estos estados. De la Ec. (8.64), Pag. 284 tenemosque

(∆r)v ≃√(

v +1

2

)~

µω(25.8)

Para que el calculo anterior sea valido, es necesario que el termino g (r − re)3 sea despreciable con respecto a

f (r − re)2, dentro de una vecindad de ancho ∆r alrededor de r = re, es decir

∣∣∣f (r − re)2∣∣∣≫

∣∣∣g (r − re)3∣∣∣ para |r − re| . (∆r)v (25.9)

combinando (25.8, 25.9) se obtiene

f ≫ g (∆r)v = g√2 (∆r)0

√v +

1

2; (∆r)0 ≡

√~

2µω(25.10)

donde (∆r)0 es el ancho de la funcion de onda en el estado base. Se obtiene en particular

f ≫ g (∆r)0 (25.11)

en la practica la condicion (25.11) se satisface casi siempre. Debemos sin embargo tener en cuenta que los numeroscuanticos v deben ser suficientemente pequenos para que tambien se satisfaga la condicion (25.10).

Notese que la expansion (25.5) no es valida en r = 0 donde V (r) diverge. El argumento anterior asumeimplıcitamente la condicion

(∆r)v ≪ re (25.12)

en cuyo caso las funciones de onda (25.7) son practicamente cero en el origen, y casi identicas a las solucionesexactas de la ecuacion radial (25.3) que rigurosamente se deben anular en el origen [condicion (12.44) pagina 353].

Page 579: Mecanica Cuantica: Notas de Clase

25.2. ESTADOS DE MOMENTO ANGULAR NO NULO (L 6= 0) 579

25.2. Estados de momento angular no nulo (l 6= 0)

Si estamos en un regimen de pequenas oscilaciones (como ocurre en la mayorıa de los casos) entonces ladistancia entre los atomos sera del orden de re. El valor tıpico del potencial centrıfugo sera entonces su valor enr = re

Vcent (re) =l (l + 1) ~2

2µr2e= Bhl (l + 1) ; B ≡ ~

4πµr2e(25.13)

puesto que el momento angular esta relacionado con los modos rotacionales, a la cantidad B la llamamos laconstante rotacional. Notese que si l ∼ 1, el potencial centrıfugo es del orden de 2Bh, lo cual a su vez nos indicarıael orden de magnitud de la energıa rotacional. En general esta energıa rotacional es mucho menor que la energıavibracional asociada a la molecula

2Bh≪ ~ω (25.14)

Por otro lado, si ∆r ≪ re es el ancho de la funcion de onda alrededor de re, tenemos que la variacion del potencialcentrıfugo alrededor de r = re, es del orden de

∣∣∣∣∆Vcent (r)

∆r

∣∣∣∣r=re

≈∣∣∣∣dVcent (r)

dr

∣∣∣∣r=re

=l (l + 1) ~2

µr3e

|∆Vcent (r)|r=re ≈ l (l + 1) ~2

µr3e∆r = 2Bhl (l + 1)

∆r

re(25.15)

en tanto que la variacion del potencial real V (r) es del orden de la “energıa potencial elastica” con “elongacion”∆r y “constante elastica” k ≡ µω2

∆V (r) =1

2µω2 (∆r)2 =

1

4~ω (∆r)2

2µω

~=

1

4~ω

(∆r)2

(∆r)20(25.16)

donde hemos usado (25.10). Y puesto que ∆r ≪ re, utilizando (25.14) en (25.15) y asumiendo valores no muygrandes de l, tenemos que

|∆Vcent (r)| ≃ 2Bhl (l + 1)∆r

re≪ 2Bhl (l + 1) ≃ 2Bh≪ ~ω (25.17)

por otro lado, puesto que ∆r es del orden de (∆r)0, la Ec. (25.16) nos indica que

∆V (r) ≈ ~ω (25.18)

combinando las Ecs. (25.18, 25.17) vemos que en la region del espacio en la cual la funcion de onda tiene amplitudessignificativas (esto es en un ancho ∆r alrededor de re) la variacion (25.15) del potencial centrıfugo es mucho menorque la variacion (25.16) de V (r). Por tal razon, podemos reemplazar en primera aproximacion el valor del potencialcentrıfugo por su valor en r = re, Ec. (25.13). Combinando entonces las Ecs. (25.4, 25.13) el potencial efectivoqueda en la forma

Vef (r) ≃ V (r) +Bhl (l + 1) (25.19)

utilizando (25.19) y la expansion (25.5) hasta segundo orden, la ecuacion radial (25.3) queda en la forma

[− ~2

d2

dr2− V0 + f (r − re)

2 +Bhl (l + 1)

]uv,l (r) = Ev,luv,l (r)

[− ~2

d2

dr2+

1

2µω2 (r − re)

2

]uv,l (r) = [Ev,l + V0 −Bhl (l + 1)] uv,l (r) (25.20)

Page 580: Mecanica Cuantica: Notas de Clase

580 CAPITULO 25. MOLECULAS DIATOMICAS

esta ecuacion es totalmente analoga a la ecuacion de valores propios de un oscilador armonico unidimensional. Portanto el miembro derecho de la Ec. (25.20) que esta en parentesis, debe ser igual a (v + 1/2) ~ω. En consecuencia,el espectro asociado a la Ec. (25.20) esta dado por

Ev,l =

(v +

1

2

)~ω − V0 +Bhl (l + 1) ; v = 0, 1, 2, 3, . . . ; l = 0, 1, 2, 3, . . . (25.21)

notese que el operador diferencial a la izquierda de la Ec. (25.20) no depende de l, ya que toda la dependenciacon este numero cuantico quedo al lado derecho de tal ecuacion y por tanto fue absorbida por el valor propio. Enconsecuencia, la funcion radial que se genera en (25.20) es independiente de l

uv,l (r) = uv (r) (25.22)

Donde la funcion radial estarıa dada por la Ec. (25.7). La expresion (25.2) para la funcion de onda completase puede escribir en esta aproximacion de la forma

ϕv,l,m (r) =1

ruv (r)Ylm (θ, ϕ) (25.23)

Observese que la energıa (25.21) consiste en la contribucion de un modo vibracional de frecuencia ω y unmodo rotacional de momento angular l, el termino constante −V0 puede removerse del espectro si se desea.Adicionalmente, en la funcion de onda los modos vibracionales estan asociados con la dependencia radial y losrotacionales con la dependencia angular. Vemos entonces que la funcion de onda (25.23) es el producto de dosfunciones en donde solo uno de los factores se modifica con las vibraciones y solo uno de ellos se modifica conlas rotaciones. Notese en particular que la independencia de la funcion radial con respecto al numero cuantico lexpresada en la Ec. (25.22), es importante para que la funcion radial no dependa de las rotaciones.

Figura 25.2: Diagrama que ilustra los dos primeros niveles v = 0 y v = 1, con su estructura rotacional debida altermino Bhl (l + 1).

La figura 25.2 muestra los dos primeros modos vibracionales v = 0, 1 con su estructura rotacional debida alfactor Bhl (l + 1). En esta figura se muestra que solo transiciones con ∆l = 1 estan permitidas, lo cual veremos acontinuacion.

Page 581: Mecanica Cuantica: Notas de Clase

25.3. ESPECTRO DE MOLECULAS DIATOMICAS HETEROPOLARES 581

25.3. Espectro de moleculas diatomicas heteropolares

Asumiremos moleculas heteropolares (atomos diferentes), y nos confinaremos a estudiar el espectro de emisiono absorcion infraroja. El momento dipolar electrico D (r) de la molecula esta dirigido a lo largo de la lınea queune los nucleos, y se puede expandir en potencias de r − re

D (r) = d0 + d1 (r − re) + . . . (25.24)

si θ es el angulo entre el eje de la molecula y el vector u3 tendremos que la proyeccion de D (r) a lo largo de u3

sera D (r) cos θ. Puesto que la molecula esta rotando, no es posible para todo tiempo alinear el momento dipolarcon el eje X3.

Pretendemos determinar las frecuencias del espectro de ondas electromagneticas a lo largo de u3 que la moleculapuede absorber o emitir como consecuencia de la variacion de su dipolo electrico. De acuerdo con la discusionde la seccion 5.8.3 Pag. 228, debemos determinar para ello las frecuencias de Bohr que aparecen en la evoluciontemporal del valor esperado de D (r) cos θ. Por lo tanto, precisamos encontrar los valores de v′, l′,m′ y v, l,m paralos cuales los elementos matriciales

⟨v′, l′,m′∣∣D (r) cos θ |v, l,m〉 =

∫r2drdΩ ϕ∗

v′,l′,m′ (r, θ, ϕ) D (r) cos θ ϕv,l,m (r, θ, ϕ)

son no nulos. De la expresion (25.23) esta relacion se puede escribir en la forma

⟨v′, l′,m′∣∣D (r) cos θ |v, l,m〉 =

[∫ ∞

0dr u∗v′ (r) D (r) uv (r)

]×[∫

dΩ Y ∗l′,m′ (θ, ϕ) cos θ Ylm (θ, ϕ)

](25.25)

Para evaluar la integral angular tendremos en cuenta la siguiente identidad de los armonicos esfericos

cos θ Ylm (θ, ϕ) =

√l2 −m2

4l2 − 1Yl−1,m (θ, ϕ) +

√(l + 1)2 −m2

4 (l + 1)2 − 1Yl+1,m (θ, ϕ)

de modo que la integral angular en (25.25) queda

⟨l′,m′∣∣ cos θ |l,m〉 =

∫dΩ Y ∗

l′,m′ (θ, ϕ)

[√l2 −m2

4l2 − 1Yl−1,m (θ, ϕ) +

√(l + 1)2 −m2

4 (l + 1)2 − 1Yl+1,m (θ, ϕ)

]

=

√l2 −m2

4l2 − 1

∫dΩ Y ∗

l′,m′ (θ, ϕ) Yl−1,m (θ, ϕ)

+

√(l + 1)2 −m2

4 (l + 1)2 − 1

∫dΩ Y ∗

l′,m′ (θ, ϕ) Yl+1,m (θ, ϕ)

⟨l′,m′∣∣ cos θ |l,m〉 = δmm′

[δl′,l−1

√l2 −m2

4l2 − 1+ δl′,l+1

√(l + 1)2 −m2

4 (l + 1)2 − 1

](25.26)

en lo que respecta a la integral radial en (25.25), debemos tener en cuenta que la funcion uv (r) es identica a lafuncion de onda del oscilador armonico unidimensional si hacemos x ≡ r − re en la Ec. (25.7). Denotando estasfunciones como |v〉 y utilizando (25.24), la integral radial en (25.25) queda

⟨v′∣∣D (r) |v〉 =

⟨v′∣∣ (d0 + d1X) |v〉 = d0〈v′ |v〉+ d1

⟨v′∣∣X |v〉 = d0 δv′v + d1

√~

2µω

⟨v′∣∣(a† + a

)|v〉

= d0 δv′v + d1

√~

2µω

√v + 1

⟨v′∣∣ v + 1〉+√

v⟨v′∣∣ v − 1〉

⟨v′∣∣D (r) |v〉 = d0 δv′v + d1

√~

2µω

√v + 1 δv′,v+1 +

√v δv′,v−1

(25.27)

Page 582: Mecanica Cuantica: Notas de Clase

582 CAPITULO 25. MOLECULAS DIATOMICAS

donde hemos usado las Ecs. (8.9) Pag. 272 y las Ecs. (8.41) Pag. 280. Sustituyendo (25.26, 25.27) en (25.25)tenemos que

⟨v′, l′,m′∣∣D (r) cos θ |v, l,m〉 =

[d0 δv′v + d1

√~

2µω

√v + 1 δv′,v+1 +

√v δv′,v−1

]

×[δl′,l−1

√l2 −m2

4l2 − 1+ δl′,l+1

√(l + 1)2 −m2

4 (l + 1)2 − 1

]δmm′ (25.28)

de la expresion (25.28) se obtienen reglas de seleccion asociadas al elemento de matriz de la proyeccion delmomento dipolar electrico a lo largo de u3. Tal elemento de matriz es nulo a menos que se cumplan las condiciones

l′ − l = +1,−1 ; m = m′ (25.29)

v′ − v = 0, +1, −1 (25.30)

Notese que la regla de seleccion (25.29) proviene de la dependencia angular (ortonormalidad de los armonicosesfericos) y es por tanto independiente de las aproximaciones realizadas para resolver la ecuacion radial (25.3)2.En contraste, la regla de seleccion (25.30) depende de realizar la aproximacion armonica en la expansion (25.5)del potencial V (r) y de conservar solo hasta el termino lineal en la expansion (25.24) del dipolo D (r).

25.3.1. Espectro puramente rotacional

La Ec. (25.28) nos muestra que para v− v′ = 0, el valor esperado del dipolo no depende de d1, desde el puntode vista de la Ec. (25.24) esto indica que en este caso el valor esperado es independiente de las “elongaciones” o“vibraciones” r − re del dipolo, ası como del valor de los numeros cuanticos v, v′. Es decir el conjunto de lıneasasociadas a v = v′, constituyen el espectro puramente rotacional (solo depende de los numeros cuanticos angularesl,m), cuya intensidad serıa proporcional a d20. Por otro lado, la parte puramente rotacional del espectro (25.21)vendra dada por

Ev,l =

(v +

1

2

)~ω − V0 +Bhl (l + 1) ; v = fijo . . . ; l = 0, 1, 2, 3, . . .

para calcular las transiciones se pueden eliminar los terminos constantes de modo que para el espectro puramenterotacional se tiene

El = Bhl (l + 1) ; l = 0, 1, 2, 3, . . . (25.31)

Los niveles adyacentes nos dan

El − El−1 = Bh [l (l + 1)− l (l − 1)] = 2Bhl

de modo que la separacion entre niveles adyacentes se incrementa linealmente con l, como se indica en la Fig.25.3a. De otra parte, las reglas de seleccion (25.29) nos dicen que ∆l = ±1, de manera que las unicas frecuenciasde Bohr asociadas a la oscilacion dipolar son las asociadas a niveles adyacentes νl,l−1 (usamos la notacion ν paradistinguir estas frecuencias del numero cuantico v)

νl,l−1 =El − El−1

h= 2Bl

formando una serie de frecuencias equidistantes separadas por un intervalo 2B como se muestra en la Fig. 25.3b.La forma de las figuras 25.3 justifica el nombre de “constante rotacional” dado al parametro B.

2Sin embargo, tal regla de seleccion depende del caracter central de la interaccion y por tanto de la validez de la aproximacion deBorn-Oppenheimer.

Page 583: Mecanica Cuantica: Notas de Clase

25.3. ESPECTRO DE MOLECULAS DIATOMICAS HETEROPOLARES 583

Figura 25.3: (a) Primeros niveles puramente rotacionales. La separacion entre niveles adyacentes crece linealmentecon l. (b) Frecuencias de Bohr para el espectro puramente rotacional. Las frecuencias son equidistantes y separadaspor una distancia 2B.

25.3.2. Espectro vibracional-rotacional

Las lıneas asociadas a las transiciones v−v′ = ±1, l′− l = ±1, corresponden al espectro vibracional-rotacional.Aplicando la Ec. (25.21) obtenemos las frecuencias asociadas a este espectro

ωvibrot =Eν′,l′ − Eν,l

h=(v′ − ν

) ~hω +B

[l′(l′ + 1

)− l (l + 1)

]

Sin perdida de generalidad podemos asumir v′ = v + 1, y puesto que l′ = l ± 1 tenemos dos tipos de frecuencias

ω± ≡ ω(l′=l±1)vibrot =

Eν+1,l±1 − Eν,lh

2π+B (l ± 1) [(l ± 1) + 1]− l (l + 1)

ω+vibrot =

ω

2π+B (l + 1) (l + 2)−Bl (l + 1) =

ω

2π+ 2B (l + 1) ; l = 0, 1, 2, 3, . . .

ω−vibrot =

ω

2π+B (l − 1) l −Bl (l + 1) =

ω

2π− 2Bl =

ω

2π− 2B

(l′ + 1

); l′ = 0, 1, 2, 3, . . .

En sıntesis, utilizando la Ec. (25.21), podemos separar las lıneas de este espectro en dos grupos

1. Las lıneas v′ = v + 1, l′ = l + 1 ↔ v, l de frecuencias

ω+vibrot =

ω

2π+B (l + 1) (l + 2)−Bl (l + 1) =

ω

2π+ 2B (l + 1) ; l = 0, 1, 2, 3, . . . (25.32)

2. Las lıneas v′ = v + 1, l′ = l − 1 ↔ v, l de frecuencias

ω−vibrot =

ω

2π+Bl′

(l′ + 1

)−B

(l′ + 1

) (l′ + 2

)=

ω

2π− 2B

(l′ + 1

); l′ = 0, 1, 2, 3, . . . (25.33)

Figura 25.4: Espectro vibracional-rotacional para una molecula heteropolar. Este espectro esta divididos en dosramas: la rama P (izquierda) y la rama R (derecha).

El espectro vibracional-rotacional se ilustra en la figura 25.4, y contiene dos grupos de lıneas equidistantes,simetricas con respecto a la frecuencia vibracional ω/2π. Todas las lıneas juntas constituyen una banda. Las

Page 584: Mecanica Cuantica: Notas de Clase

584 CAPITULO 25. MOLECULAS DIATOMICAS

lıneas constituıdas por las frecuencias (25.32) se denominan la rama R, en tanto que las lıneas asociadas alas frecuencias (25.33) se denominan rama P. En cada rama, la distancia entre dos lıneas adyacentes es 2B.El intervalo central que separa a las dos ramas esta a una distancia 4B, ya que NO hay una lınea asociada ala frecuencia puramente vibracional ω/2π. Por esta razon es frecuente decir que hay una “lınea faltante” en elespectro. Como consecuencia, no hay un espectro puramente vibracional. Sin embargo, puesto que ω/2π ≫ 2B,un espectrometro de baja resolucion podrıa ignorar la estructura rotacional y observar el espectro de la figura25.4, como si hubiera una sola lınea centrada en ω/2π.

La ausencia de un espectro puramente vibracional tambien se puede ver de las reglas de seleccion (25.29,25.30) que nos muestran que las transiciones con ∆l = 0 y ∆v 6= 0 estan prohibidas. En contraste, tales reglasde seleccion muestran que transiciones con ∆l 6= 0 y ∆v = 0 sı estan permitidas, y por tanto hay un espectropuramente rotacional.

25.4. Correcciones a la estructura espectral (opcional)

La estructura espectral de la molecula diatomica se ha calculado basados en la suposicion de que la variacion delpotencial centrıfugo es despreciable. En tal caso se reemplaza la funcion Vcent (r) por su valor en r = re. Esto implicaque en esta aproximacion, el potencial efectivo se obtiene a partir del potencial real mas una traslacion rıgidavertical de este. Estudiaremos a continuacion las correcciones que resultan de calcular las pequenas variaciones deVcent alrededor de re. Para ello, hacemos la expansion del potencial centrıfugo en potencias de r − re

Vcent (r) =l (l + 1) ~2

2µr2=l (l + 1) ~2

2µr2e− l (l + 1) ~2

µr3e(r − re) +

3l (l + 1) ~2

2µr4e(r − re)

2 + . . . (25.34)

De modo que combinamos las expansiones (25.5, 25.34) para formar la expansion del potencial efectivo

Vef (r) = −V0 + f (r − re)2 − g (r − re)

3 + . . .

+l (l + 1) ~2

2µr2e− l (l + 1) ~2

µr3e(r − re) +

3l (l + 1) ~2

2µr4e(r − re)

2 + . . . (25.35)

veremos que la variacion del potencial centrıfugo alrededor de r = re (para l 6= 0) genera los siguientes efectos

1. La posicion re del mınimo de Vef es ligeramente mayor que la posicion re del mınimo del potencial real.

2. El valor de este mınimo Vef (re) es ligeramente distinto de −V0 +Bhl (l + 1).

3. La curvatura de Vef (r) en r = re no esta dada unicamente por el coeficiente f . Notese que esta curvaturaes la que nos determinaba la frecuencia del oscilador armonico equivalente como se aprecia en la Ec. (25.6).

Tomando la expansion (25.35) hasta orden cuadratico en (r − re), el valor del mınimo local evaluado hastaeste orden nos da

dVef (re)

dr= 0 = 2f (re − re)−

l (l + 1) ~2

µr3e+

3l (l + 1) ~2

µr4e(re − re) (25.36)

para valores tıpicos de f y para l ∼ 1, se puede tomar f ≫ l (l + 1) ~2/(µr4e). En cuyo caso la relacion (25.36) se

puede aproximar en la forma

2f (re − re) ≃l (l + 1) ~2

µr3e(25.37)

de esta forma se obtiene

re − re ≃l (l + 1) ~2

2µfr3e=Bhl (l + 1)

fre(25.38)

Page 585: Mecanica Cuantica: Notas de Clase

25.4. CORRECCIONES A LA ESTRUCTURA ESPECTRAL (OPCIONAL) 585

con lo cual re > re como se predijo. Utilizando (25.6) y (25.10) en (25.38) resulta

re − re(∆r)0

≃ Bhl (l + 1)

fre

(∆r)0[(∆r)0]

2 =Bhl (l + 1) (∆r)0

(ω2µ/2) re [~/ (2µω)]=

4Bhl (l + 1)

(∆r)0re

re − re(∆r)0

≃ 2l (l + 1)2Bh

(∆r)0re

≪ 1 (25.39)

donde hemos usado ademas las aproximaciones (25.12, 25.14). Podemos decir que la desviacion de re con respectoa re es “pequena”, ya que es mucho menor que el ancho del paquete en el estado base. Combinando las Ecs. (25.11,25.12) con la condicion (25.39) queda

g (re − re) ≪ g (∆r)0 ≪ f

3

2

(re − re)

re≪ 3

2

(re − re)

(∆r)0≪ 1 ⇒ 3

2

(re − re)

re

(l (l + 1) ~2

µr3e

)≪ l (l + 1) ~2

µr3e

obtenemos entonces las desigualdades

g (re − re) ≪ f ;3l (l + 1) ~2

2µr4e(re − re) ≪

l (l + 1) ~2

µr3e(25.40)

evaluando Vef (r) en el mınimo local re, la expansion (25.35) queda

Vef (re) = −V0 + f (re − re)2 − g (re − re)

3 + . . .

+l (l + 1) ~2

2µr2e− l (l + 1) ~2

µr3e(re − re) +

3l (l + 1) ~2

2µr4e(re − re)

2 + . . .

Vef (re) = −V0 + [f − g (re − re)] (re − re)2 + . . .

+l (l + 1) ~2

2µr2e+

[3l (l + 1) ~2

2µr4e(re − re)−

l (l + 1) ~2

µr3e

](re − re) + . . . (25.41)

sustituyendo las aproximaciones (25.40, 25.37, 25.38) en la expansion (25.41) tenemos que

Vef (re) ≃ −V0 + f (re − re)2 +

l (l + 1) ~2

2µr2e− l (l + 1) ~2

µr3e(re − re)

= −V0 + [f (re − re)] (re − re)−l (l + 1)~2

µr3e(re − re) +

l (l + 1) ~2

2µr2e

≃ −V0 +[l (l + 1) ~2

2µr3e

](re − re)−

l (l + 1) ~2

µr3e(re − re) +

l (l + 1) ~2

2µr2e

= −V0 −l (l + 1) ~2

2µr3e(re − re) +

(~

4πµr2e

)hl (l + 1)

≃ −V0 −l (l + 1) ~2

2µr3e

[Bhl (l + 1)

fre

]+

(~

4πµr2e

)hl (l + 1)

quedando finalmente

Vef (re) ≃ −V0 −B~2

2µfr4eh [l (l + 1)]2 +Bhl (l + 1)

Vef (re) ≃ −V0 +Bhl (l + 1)−Gh [l (l + 1)]2 ; G ≡ B~2

2µfr4e=

~3

8πµ2r6ef(25.42)

por tanto, para un momento angular no nulo la energıa de disociacion |Vef (re)| difiere de la energıa de disociacionV0 para el estado base. Ademas el termino proporcional a G proviene de tener en cuenta la variacion del potencial

Page 586: Mecanica Cuantica: Notas de Clase

586 CAPITULO 25. MOLECULAS DIATOMICAS

centrıfugo como se puede ver al comparar las ecuaciones (25.19, 25.42), donde la variacion del potencial centrıfugose desprecio en (25.19). En la vecindad de r = re, el potencial efectivo se puede escribir en la forma

Vef (r) = Vef (re) + f (r − re)2 − g (r − re)

3 + . . . (25.43)

a partir de la expansion (25.43), es claro que el coeficiente f viene dado por

f =1

2

[d2

dr2Vef (r)

]

r=re

(25.44)

con lo cual dicho coeficiente esta relacionado con la curvatura de Vef (r) en r = re. Para evaluar la diferenciaentre f y f , tendremos en cuenta el termino en (r − re)

3 de V (r) en la expansion (25.35) y consecuentemente, eltermino en (r − re)

2 del potencial centrıfugo

f =1

2

[d2

dr2Vef (r)

]

r=re

≃ 1

2

d2

dr2

[−V0 + f (r − re)

2 − g (r − re)3+

+l (l + 1) ~2

2µr2e− l (l + 1) ~2

µr3e(r − re) +

3l (l + 1) ~2

2µr4e(r − re)

2

]

r=re

=1

2

2f − 6g (re − re) +

3l (l + 1) ~2

µr4e

≃ f − 3g

[l (l + 1) ~2

2µfr3e

]+

3l (l + 1) ~2

2µr4e

donde hemos usado la aproximacion (25.38) en el ultimo paso. Tenemos entonces que

2f ≃ 2f +3l (l + 1) ~2

µr4e− 3gl (l + 1) ~2

µfr3e(25.45)

la frecuencia angular definida en (25.6) debe entonces reemplazarse por

ω =

√2f

µ≃√

2f

µ+

3l (l + 1) ~2

µ2r4e− 3gl (l + 1) ~2

µ2fr3e=

√2f

µ

√1 +

[3l (l + 1) ~2

2fµr4e− 3gl (l + 1) ~2

2f2µr3e

]

≃ ω

[1 +

1

2

(3l (l + 1) ~2

2fµr4e− 3gl (l + 1) ~2

2f2µr3e

)]=

[ω +

3~2ω

4µfr3e

(1

re− g

f

)l (l + 1)

]

ω ≃ ω − 2παel (l + 1) ; αe ≡3~2ω

8πµfr3e

(g

f− 1

re

)(25.46)

estas ecuaciones muestran que la curvatura evaluada en el mınimo del potencial efectivo cambia cuando se considerala variacion del potencial centrıfugo, traduciendose en un cambio en la frecuencia natural de vibracion.

De una forma similar se puede determinar g. A partir de la expansion (25.43) es claro que este termino vienedado por

g = −1

6

[d3

dr3Vef (r)

]

r=re

(25.47)

sin embargo el termino cubico en (25.43) solo agrega una pequena correccion a los resultados que se obtienen conlos dos primeros terminos, por lo cual despreciaremos la variacion de d3Veff/dr

3 cuando vamos desde re hasta re.Tomaremos entonces g ≃ g.

En resumen, una expansion del potencial efectivo alrededor del mınimo corregido queda en la forma

Vef (r) ≃ Vef (re) +1

2µω2 (r − re)

2 − g (r − re)3 (25.48)

re − re ≃ l (l + 1) ~2

2µfr3e=Bhl (l + 1)

fre(25.49)

Vef (re) ≃ −V0 +Bhl (l + 1)−Gh [l (l + 1)]2 ; G ≡ B~2

2µfr4e=

~3

8πµ2r6ef(25.50)

ω ≃ ω − 2παel (l + 1) ; αe ≡3~2ω

8πµfr3e

(g

f− 1

re

)(25.51)

Page 587: Mecanica Cuantica: Notas de Clase

25.4. CORRECCIONES A LA ESTRUCTURA ESPECTRAL (OPCIONAL) 587

donde hemos usado las ecuaciones (25.38, 25.42, 25.46).

25.4.1. Correccion a las funciones de onda y los niveles de energıa

De la expresion (25.48), podemos generar la correspondiente correccion a la ecuacion radial (25.3)

[− ~2

d2

dr2+

1

2µω2 (r − re)

2 − g (r − re)3

]uv,l (r) = [Ev,l − Veff (re)]uv,l (r) (25.52)

si despreciamos el termino proporcional a g, reconocemos de nuevo la ecuacion de valores propios de un osciladorarmonico unidimensional de frecuencia angular ω, cuya posicion de equilibrio es r = re. Tenemos entonces que eltermino entre parentesis cuadrados a la derecha de (25.52) debe ser igual a (v + 1/2) ~ω

E0v,l =

(v +

1

2

)~ω + Veff (re) = −V0 +

(v +

1

2

)~ω +Bhl (l + 1)−Gh [l (l + 1)]2 (25.53)

donde hemos usado (25.50). Las funciones propias asociadas a estados estacionarios poseen la forma (25.2), conla funcion radial uv (r) dada por la solucion armonica (25.7), pero reemplazando β, re por β, re

uv (r) =

(β2

π

)1/41√2vv!

e−β2(r−re)2/2Hv

[β (r − re)

]; β ≡

√µω

~

dado que hemos tenido en cuenta el termino g (r − re)3 para calcular la nueva frecuencia angular ω, la consistencia

del calculo nos exige estimar la correccion de este termino a los autovalores y autovectores de la ecuacion radial(25.52). Esto implica evaluar la primer correccion anarmonica tal como se hizo en la seccion 20.6.4, Pag. 511utilizando teorıa de perturbaciones. Aplicando los resultados de la seccion 20.6.4 ????, los niveles perturbadosvendran dados por

Ev,l = E0v,l + ξ~ω

(v +

1

2

)2

+7

60ξ~ω ; ξ ≡ −15

4

g2~

µ3ω5 (25.54)

puesto que ξ ≪ 1, ω puede reeemplazarse por ω en la correccion perturbativa.

25.4.2. Distorsion centrıfuga de la molecula

La Ec. (25.49) muestra que re > re, y que la distancia entre ambas se incrementa con l. En otras palabras, ladistancia entre los nucleos se incrementa cuando la molecula aumenta su rotacion. En un sentido clasico podemosdecir que “el termino centrıfugo” tiende a separar los nucleos hasta que es balanceado por la fuerza restauradora2f (re − re) debida al potencial V (r).

La molecula no puede entonces considerarse como un “rotador rıgido”. El incremento en la distancia entrenucleos produce a su vez un incremento en el momento de inercia de la molecula, que a su vez genera un decre-mento en la energıa cinetica rotacional (si el momento angular es constante). Este decremento solo se compensaparcialmente con el incremento V (re) − V (re), en la energıa potencial. Este es el origen Fısico de la correccionproporcional a G en el espectro descrito en (25.53). Esta correccion (que es de signo negativo) se incrementa muchomas rapido con l que la energıa rotacional proporcional a B en el espectro (25.53). Experimentalmente, esto setraduce en que las frecuencias de Bohr del espectro puramente rotacional ya no seran estrictamente equidistantes,sino que su separacion disminuye con el incremento de l.

25.4.3. Acople vibracional-rotacional

Si agrupamos los terminos segundo y tercero en (25.53) y reemplazamos ω por su expresion (25.51), se obtiene(v +

1

2

)~ω +Bhl (l + 1) =

(v +

1

2

)~ω +Bhl (l + 1)− αehl (l + 1)

(v +

1

2

)(25.55)

Page 588: Mecanica Cuantica: Notas de Clase

588 CAPITULO 25. MOLECULAS DIATOMICAS

los dos primeros terminos a la derecha de la expresion (25.55) son claramente energıas vibracionales y rotacionalesrespectivamente. El tercer termino depende de los numeros cuanticos v y l, y representa el acople entre los gradosde libertad vibracionales y rotacionales.

La Ec. (25.55) se puede reescribir en la forma(v +

1

2

)~ω +Bhl (l + 1) =

(v +

1

2

)~ω +Bvhl (l + 1) ; Bv ≡ B − αe

(v +

1

2

)(25.56)

es como si cada nivel vibracional tuviera una constante rotacional efectiva Bv que depende del numero cuanticovibracional v.

De nuevo podemos hacer un analogo clasico. La Ec. (25.13) nos dice que B es proporcional a 1/r2. Cuando lamolecula vibra, r varıa y por tanto tambien B. Puesto que las frecuencias vibracionales son mucho mayores quelas rotacionales, podemos definir una constante efectiva rotacional de la molecula en un estado vibracional dado:para ello podemos usar el promedio de B sobre un intervalo de tiempo mucho mayor a un periodo vibracional(y mucho menor que un periodo rotacional para que B pueda considerarse constante en el proceso de rotacion).Debemos tomar entonces el promedio temporal de 1/r2 en el estado vibracional bajo consideracion.

Ahora bien, los dos terminos de signos opuestos en la expresion (25.51) para αe pueden interpretarse dela siguiente forma. El termino proporcional a g obviamente surge del termino anarmonico de V (r), el cual seincrementa con la amplitud de las oscilaciones puesto que nos alejamos del regimen de pequenas oscilaciones (portanto se incrementa con v). El termino cubico (primer termino anarmonico), introduce una asimetrıa en la formade V (r) de manera que la molecula “pasa mas tiempo” en la region r > re que en la region r < re. De aquı sesigue que el valor promedio de 1/r2 es menor que 1/r2e , de modo que la anarmonicidad disminuye la constanteefectiva rotacional Bv. Esto se puede ver al combinar las Ecs. (25.56, 25.51). Por otro lado, incluso si el movimientovibracional es simetrico con respecto a re (es decir si g = 0) el valor promedio de 1/r2 no es igual a 1/r2e puestoque ⟨

1

r2

⟩6= 1

〈r〉2=

1

r2e

y este es el origen del segundo termino en αe de la Ec. (25.51). Cuando se toma el promedio de 1/r2, se favorecenlos valores pequenos de r de modo que ⟨

1

r2

⟩>

1

〈r〉2=

1

r2e

lo cual explica el signo del segundo termino en αe de la Ec. (25.51). El signo de αe depende por supuesto de lacompetencia entre estos dos efectos opuestos en signo. En general, el termino anarmonico es el que domina demodo que αe es positivo y Bv < B.

Notese que el acople vibracional-rotacional existe incluso cuando v = 0, en este caso

B0 = B − 1

2αe

lo cual constituye otra manifestacion de la extension de la funcion de onda (∆r)0 asociada al estado v = 0.Si αe es positivo, la estructura rotacional es ligeramente mas compacta en el estado vibracional mas alto v′ que

en el estado vibracional v = v′ − 1. Puede verse que las ramas R y P ilustradas en la Figura 25.4, se afectan demodo diferente. Las lıneas adyacentes ya no seran equidistantes y en promedio estaran mas cercanas en la ramaR que en la rama P .

Reuniendo las ecuaciones (25.53, 25.54, 25.55) podemos escribir el espectro completo vibracional-rotacionalrotulado con los numeros cuanticos v, l

Ev,l = −V0 +(v +

1

2

)~ω +

[B − αe

(v +

1

2

)]hl (l + 1)−Ghl2 (l + 1)2 + ξ

(v +

1

2

)2

~ω +7

60ξ~ω (25.57)

recordemos que V0 es la energıa de disociacion de la molecula (para momento angular nulo), ω/2π es la frecuenciavibracional, B la constante rotacional [Ec. (25.13)], y las cantidades G,αe, ξ son constantes adimensionales dadaspor las ecuaciones (25.50, 25.51, 25.54).

Page 589: Mecanica Cuantica: Notas de Clase

25.5. ESPECTRO DE MOLECULAS DIATOMICAS HOMOPOLARES: EFECTO RAMAN 589

25.5. Espectro de moleculas diatomicas homopolares: efecto Raman

Cuando las moleculas son homopolares (atomos identicos), la simetrıa que emerge hace que el momento dipolarelectrico permanente se anule, volviendo a la molecula inactiva en el infrarojo. En tal caso, cuando una onda optica(en el rango del visible) golpea la molecula, ????

Page 590: Mecanica Cuantica: Notas de Clase

Capıtulo 26

Sistemas cuanticos de partıculas identicas

Veremos que bajo los postulados de la mecanica cuantica que ya hemos establecido, se presentan ambiguedadescuando tratamos sistemas de partıculas identicas, razon por la cual debemos introducir un nuevo postulado quepermita una descripcion adecuada de un conjunto de partıculas identicas.

Diremos que dos partıculas son identicas si poseen las mismas propiedades intrınsecas tales como masa enreposo, espın, carga etc. Es decir, tales propiedades intrınsecas no se pueden distinguir en un experimento1. Porejemplo, todos los electrones en el universo son identicos, todos los protones en el universo son identicos, ası comotodos los atomos de hidrogeno (protios). Por otra parte el electron y el positron (su antipartıcula) no son identicosya que aunque tienen la misma masa y espın, difieren en el signo de su carga electrica.

Es claro que tanto en un contexto clasico como cuantico, un sistema fısico que contiene dos partıculas identicasno cambia sus propiedades de evolucion cuando se intercambian los roles de las dos partıculas.

Es importante notar que la definicion de partıculas identicas y todas las simetrıas a las que conlleva sonindependientes de las condiciones experimentales. A manera de ejemplo, incluso si no se miden las cargas en unexperimento dado, un electron y un positron no se pueden tratar como partıculas identicas.

26.1. Partıculas identicas en mecanica clasica

Dado que las partıculas clasicas poseen trayectorias bien definidas, un sistema de partıculas identicas se puedetratar practicamente igual que un sistema general de partıculas. Podemos distinguir cada partıcula una vez quedeterminamos su posicion y velocidad iniciales, rastreando la curva que describe.

Por simplicidad estudiaremos un sistema de dos partıculas identicas y veremos que incluso en mecanica clasicaaparecen algunas simetrıas asociadas al caracter identico de las partıculas. En el tiempo inicial t0, el estado delsistema se especifica con los valores iniciales de posicion y velocidad de cada partıcula. Denotaremos estos datosiniciales en la forma r0,v0 y r′0,v′

0. Para describir la evolucion del estado del sistema rotulamos las dospartıculas: para la partıcula (1) tendremos una posicion r1 (t) y una velocidad v1 (t), y los valores asociados a lapartıcula (2) seran r2 (t) , v2 (t). Esta numeracion es arbitraria, a diferencia de lo que ocurrirıa si las partıculasfueran no identicas. El estado fısico inicial puede en teorıa ser descrito por dos “estados matematicos” diferentespuesto que cualquiera de estas dos asignaciones es totalmente equivalente

r1 (t0) = r0 , v1 (t0) = v0 ; r2 (t0) = r′0 , v2 (t0) = v′0 (26.1)

o

r1 (t0) = r′0 , v1 (t0) = v′0 ; r2 (t0) = r0 , v2 (t0) = v0 (26.2)

1Propiedades como posicion, momento, velocidad etc, son propiedades cinematicas y dinamicas y no son intrınsecas, ya que dependende las condiciones iniciales.

590

Page 591: Mecanica Cuantica: Notas de Clase

26.2. PARTICULAS IDENTICAS EN MECANICA CUANTICA 591

ahora, si solucionamos la evolucion del sistema usando las condiciones iniciales (26.1), tales soluciones tendran laforma

r1 (t) = r (t) , r2 (t) = r′ (t)

donde r (t) y r′ (t) son dos funciones vectoriales del tiempo. El hecho de que las partıculas sean identicas implicaque el sistema no cambia si intercambiamos los roles de las partıculas. Por tanto, el Lagrangiano o Hamiltonianoclasicos

L (r1,v1; r2,v2) ; H (r1,v1; r2,v2)

son invariantes bajo el intercambio de ındices 1 ↔ 2. De esto se sigue que la solucion para la evolucion del sistemapartiendo de las condiciones iniciales (26.2) estara dada por

r1 (t) = r′ (t) , r2 (t) = r (t)

las dos descripciones matematicas del estado fısico bajo estudio son totalmente equivalentes ya que conducen a lasmismas predicciones fısicas. Lo intrınseco o esencial en esta descripcion es: la partıcula con posicion y velocidadr0,v0 en t0, evolucionara de acuerdo con la funcion vectorial r (t) y la partıcula con posicion y velocidad r′0,v′

0en t0, evolucionara de acuerdo con la funcion vectorial r′ (t). Lo unico que tenemos que hacer es escoger en eltiempo inicial uno de los “estados matematicos” e ignorar la existencia del otro. En tal sentido tratamos a laspartıculas como si fueran de diferente naturaleza. Una vez hecha una escogencia, los rotulos (1) y (2) con losque “marcamos” cada partıcula en t0, actuan como propiedades intrınsecas para distinguir a las dos partıculas.Puesto que podemos rastrear la trayectoria de cada partıcula, podemos determinar las posiciones y velocidades dela partıcula rotulada como (1) en cualquier tiempo. Por supuesto lo mismo vale para la partıcula con rotulo (2).

26.2. Partıculas identicas en mecanica cuantica

En mecanica cuantica la situacion es totalmente distinta. Incluso si en t0 los paquetes de onda asociados ados partıculas identicas no se traslapan (estan separados espacialmente) la evolucion temporal puede mezclarlos.En tal sentido, cuanticamente se “pierde el rastro” de las partıculas. Cuando una partıcula es detectada en unaregion del espacio, no hay manera de saber si la partıcula detectada es la que originalmente se rotulo (1) o la queoriginalmente se rotulo (2). La razon es que ambas partıculas tienen en general una probabilidad diferente de cerode ser detectadas en tal region del espacio. La numeracion asignada en el tiempo inicial sera entonces ambiguacuando se mide su posicion, ya que como veremos a continuacion, existen varios “caminos” que el sistema puedeseguir desde su estado inicial hasta el estado que se encuentra en la medida2.

Tomemos como ejemplo la colision de dos partıculas identicas en su sistema de referencia centro de masa.Asumamos que en t0 sus paquetes estan separados para facilitar la rotulacion (ver Fig. 26.1a). Denotaremos por(1) la partıcula de la izquierda y por (2) la de la derecha. Los dos paquetes de onda se dirigen el uno al otroy al aproximarse, comienzan a traslaparse las funciones de onda (Fig 26.1b). Despues de la colision, la regiondel espacio en la cual la densidad de probabilidad de las dos partıculas es significativa, tiene la forma de unacapa esferica cuyo radio se incrementa con el tiempo (Fig. 26.1c). Supongamos ahora que ubicamos un detectorD en la direccion que hace un angulo θ con la velocidad inicial del paquete de onda (1). Si este detector detectauna partıcula, es claro que la otra partıcula debe moverse en direccion opuesta por conservacion del momento.Sin embargo, no es posible determinar si la partıcula detectada en D, es la inicialmente rotulada como (1) o lainicialmente rotulada como (2). Para verlo, observamos que hay dos “caminos” diferentes que el sistema pudohaber seguido desde la condicion inicial establecida en la Fig. 26.1a, para llegar al estado final que se encuentra enla medida. Estos dos caminos se presentan esquematicamente en la Fig. 26.2. No podemos determinar cual caminosiguio el sistema.

2La ambiguedad se puede remover solo si los paquetes de onda no se traslapan para ningun tiempo. En este caso las probabilidadesserıan excluyentes. Sin embargo, esta situacion nunca es exacta, y en pocos casos se puede despreciar el traslapamiento de las funcionesde onda para todo tiempo.

Page 592: Mecanica Cuantica: Notas de Clase

592 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

Figura 26.1: Colision de dos partıculas identicas en su sistema de referencia del centro de masa. (a) En t0 lospaquetes de onda esta bien separados. (b) A medida que se aproximan las dos partıculas, sus paquetes de ondacomienzan a traslaparse. (c) Despues de la colision, la region de alta probabilidad de deteccion tiene la forma deuna capa esferica que se expande con el tiempo.

Figura 26.2: Representacion de los dos “caminos” que un sistema de dos partıculas identicas puede seguir desde elestado inicial hasta la medida (en el sistema de referencia del centro de masa). La indistinguibilidad no permitedeterminar cual de los dos caminos tomaron las partıculas.

Se presenta entonces una dificultad fundamental para usar los postulados de la mecanica cuantica, ya que paracalcular una probabilidad asociada a alguna medida es necesario conocer perfectamente el estado final asociado adicha medicion. En este caso hay dos estados diferentes (de hecho ortogonales) asociados a las figuras 26.2. Sinembargo, ambos estados estan asociados a un solo estado fısico ya que no podemos distinguir entre ellos a travesde alguna medida experimental. La pregunta natural es: bajo estas condiciones ¿el calculo de probabilidad debeemplear el camino de la Fig. 26.2a, el camino de la Fig. 26.2b, o los dos?. Si se deben tomar los dos, ¿debemossumar las probabilidades asociadas con cada camino, o debemos sumar sus amplitudes de probabilidad? (en elultimo caso, ¿que signo debemos usar?). Cada una de estas alternativas nos llevara a diferentes predicciones. Antesde responder a estas preguntas tomaremos otro ejemplo que nos ilustra el problema de la indistinguibilidad encuantica.

26.3. Degeneracion de intercambio

En el anterior ejemplo, consideramos dos paquetes de onda que inicialmente no se traslapan, lo cual nospermite rotular cada paquete sin ambiguedad al menos en t = t0. Las ambiguedades aparecen cuando tratamos dedeterminar el ket o estado matematico asociado con un resultado dado de una medida de posicion. En esta seccionveremos que en ciertas circunstancias, surge la misma dificultad en la escogencia del ket matematico usado para

Page 593: Mecanica Cuantica: Notas de Clase

26.3. DEGENERACION DE INTERCAMBIO 593

describir el estado fısico inicial. Esta dificultad asociada al estado inicial involucrara al concepto de degeneracionde intercambio.

26.3.1. Degeneracion de intercambio para un sistema de dos partıculas de espın 1/2

Como primer paso consideremos un sistema de dos partıculas identicas de espın 1/2, en el cual nos limitaremosa mediciones de grados de libertad de espın. Al igual que en las secciones precedentes, distinguiremos entre elestado fısico del sistema y su descripcion matematica (un ket del espacio de estados).

Parece natural que si hacemos un conjunto completo de medidas de cada espın, conoceremos el estado fısicocompleto de manera perfecta. Asumiremos que la tercera componente de espın de una de las partıculas es +~/2y la de la otra es −~/2. Esto es equivalente a la especificacion de r0,v0 y de r′0,v′

0 en el sistema clasico.Para describir el sistema matematicamente numeramos las partıculas: S1 y S2 denota a los dos observables de

espın, y |ε1, ε2〉 es la base ortonormal del espacio de estados formado por vectores propios comunes a S(1)3 (valor

propio ε1~/2) y S(2)3 (valor propio ε2~/2).

Al igual que en el ejemplo clasico, hay dos “estados matematicos” diferentes que se pueden asociar con elmismo sistema fısico. En este caso uno de los estados definidos por

|ε1 = +, ε2 = −〉 (26.3)

|ε1 = −, ε2 = +〉 (26.4)

cualquiera de estos dos estados ortogonales puede en principio describir el estado fısico del sistema. Ahora bien,estos dos kets expanden un subespacio bidimensional de vectores normalizados de la forma

|χ〉 ≡ α |+ , −〉+ β |− , +〉 ; |α|2 + |β|2 = 1 (26.5)

en virtud del principio de superposicion, todos los kets matematicos (26.5) pueden representar al estado fısicoasociado a (26.3) o a (26.4). En otras palabras, una superposicion de la forma (26.5) representa un estado fısicocon una partıcula con espın arriba y otra con espın abajo. Lo intrınseco es tener una partıcula con espın arriba yotra con espın abajo. Esto se denomina degeneracion de intercambio.

La degeneracion de intercambio crea dificultades fundamentales, puesto que la aplicacion de los postulados alos kets del tipo (26.5) pueden conducir a predicciones diferentes de acuerdo con el ket escogido. Determinemospor ejemplo, la probabilidad de encontrar las primeras componentes de los dos espines iguales a +~/2. Con estamedida, el resultado esta asociado a un solo ket del espacio de estados (ya que el intercambio me deja el ketintacto). Recordemos que los autoestados de S1 con respecto a los autoestados de S3 se escriben en la forma

|±〉1 =1√2[|+〉 ± |−〉] (26.6)

el estado (unico) que describe a dos partıculas con primera componente de espın arriba, se construye como elproducto tensorial de dos estados del tipo |+〉1

|+,+〉1 =∣∣∣(+)(1)

⟩1⊗∣∣∣(+)(2)

⟩1=

1√2[|ε1 = +〉+ |ε1 = −〉]⊗ 1√

2[|ε2 = +〉+ |ε2 = −〉]

|+,+〉1 =1

2[|+,+〉+ |−,+〉+ |+,−〉+ |−,−〉]

de modo que la probabilidad que queremos calcular para el vector (26.5) esta dada por

P = |〈χ |+,+〉1|2 =∣∣∣∣α∗ 〈+ , −|+ β∗ 〈− , +|

1

2[|+,+〉+ |−,+〉+ |+,−〉+ |−,−〉]

∣∣∣∣2

P =

∣∣∣∣1

2(α+ β)

∣∣∣∣2

Page 594: Mecanica Cuantica: Notas de Clase

594 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

a manera de ejemplo, utilizando (α, β) = (1, 0) se obtiene P = 1/4, y usando α = β = 1/√2 se obtiene P = 1/2.

Es claro entonces que esta probabilidad depende de los coeficientes α y β. Por tanto, no es consistente describirel estado fısico bajo estudio por el conjunto de kets (26.5) o por alguno de ellos escogido en forma arbitraria. Ladegeneracion de intercambio debe removerse, y determinar cual ket del tipo (26.5) debe emplearse en el calculo.

En este ejemplo aparece degeneracion de intercambio solo en el estado inicial, debido a que hemos escogidoel mismo valor para las componentes de los dos espines en el estado final. En el caso general puede aparecerdegeneracion de intercambio tanto en el estado inicial como en el final. Esto ocurre por ejemplo, si el resultado dela medida corresponde a dos diferentes autovalores de S1.

26.3.2. Degeneracion de intercambio para un sistema arbitrario

Las dificultades inherentes a la degeneracion de intercambio aparecen en cualquier sistema cuantico de Npartıculas identicas. Tomaremos por ejemplo, un sistema de tres partıculas identicas. Cada una de las tres partıcu-las tiene asociado un espacio de estados y observables que actuan en cada uno de estos espacios. Por ejemplo,la partıcula que rotulamos como (1) tiene asociado un espacio de estados E (1) y un observable que actua en talespacio lo denotaremos por B (1). El espacio de estados correspondiente al sistema de tres partıculas es el productotensorial de los estados de cada una

E = E (1)⊗ E (2)⊗ E (3)

vamos a asumir que el observable B (1) que actua sobre E (1) constituye un C.S.C.O. en E (1), o que B (1) simbolizavarios observables que constituyen un C.S.C.O. El hecho de que las tres partıculas sean identicas implica que existenlos observables B (2), B (3) y que constituyen un C.S.C.O. en E (2) y E (3) respectivamente. Naturalmente, lostres B (p) poseen el mismo espectro bk. Vamos a “distinguir” el espectro de cada B (p) utilizando el rotulo dela partıcula asociada

B (p) →b(p)1 , b

(p)2 , b

(p)3 , b

(p)4 , . . .

; p = 1, 2, 3

de modo que sus vectores propios asociados∣∣∣b(p)k

⟩son una base para E (p) (por simplicidad asumiremos que no

hay degeneracion). Por tanto, el producto tensorial de estas bases es una base para el espacio de estados E delsistema completo ∣∣∣b(1)i , b

(2)j , b

(3)k

los cuales son vectores propios comunes de las extensiones de B (1), B (2) y B (3) en E , con autovalores bi, bj , bkrespectivamente.

Ahora bien, puesto que las tres partıculas son identicas, no podemos medir B (1) , B (2) , B (3) puesto que lanumeracion no tiene significado fısico. Lo que sı se puede, es medir el observable B para cada una de las trespartıculas. Supongamos que esta medida nos arrojo tres diferentes autovalores bn, bp, bq. En este caso aparecedegeneracion de intercambio, ya que el estado del sistema despues de esta medida puede apriori representarse porcualquiera de los kets del subespacio de E expandido por los seis vectores base dados por

∣∣∣b(1)n , b(2)p , b(3)q

⟩,∣∣∣b(1)n , b(2)q , b(3)p

⟩,∣∣∣b(1)p , b(2)n , b(3)q

⟩,∣∣∣b(1)q , b(2)n , b(3)p

⟩,∣∣∣b(1)p , b(2)q , b(3)n

⟩,∣∣∣b(1)q , b(2)p , b(3)n

es decir, por todas las permutaciones de los rotulos n, p, q. Por tanto, una medida completa sobre cada partıculano permite determinar un unico ket del espacio de estados del sistema. En nuestro caso vemos que si obtenemostres medidas diferentes, tendremos tantos estados linealmente independientes asociados con esta medida comopermutaciones de las tres diferentes medidas es decir 3! = 6.

Si algunas de las medidas de autovalores coinciden, disminuye la degeneracion por intercambio. Por ejemplo,la indeterminacion debida a la degeneracion de intercambio es menor si dos de los tres autovalores medidos en elejemplo anterior son iguales, en tal caso tenemos los siguientes kets asociados

∣∣∣b(1)n , b(2)n , b(3)q

⟩,∣∣∣b(1)n , b(2)q , b(3)n

⟩,∣∣∣b(1)q , b(2)n , b(3)n

Page 595: Mecanica Cuantica: Notas de Clase

26.4. OPERADORES DE PERMUTACION 595

y la indeterminacion desaparece por completo si los tres autovalores medidos tienen el mismo valor. En tal caso

solo tendremos asociado un ket de la forma∣∣∣b(1)n , b

(2)n , b

(3)n

⟩.

26.4. Operadores de permutacion

Para establecer adecuadamente el postulado adicional que se necesita para remover la degeneracion de inter-cambio, sera necesario emplear operadores que permiten la permutacion de las partıculas identicas involucradasen un problema. Comenzaremos por simplicidad, con sistemas de dos partıculas

26.4.1. Permutaciones en sistemas de dos partıculas

Consideraremos un sistema compuesto por dos partıculas del mismo espın s. En el presente tratamiento nosera necesario que las partıculas sean identicas. Solo pediremos que los espacios de estados asociados a cadapartıcula sean isomorfos. De hecho, por el momento asumiremos que las partıculas son no-identicas de maneraque la numeracion (1) y (2) indica su naturaleza. Por ejemplo, (1) puede denotar un proton y (2) puede denotarun electron.

Escogeremos una base |ui〉 para el espacio de estados E (1) de la partıcula (1). Puesto que ambas partıculastienen el mismo espın, E (2) es isomorfo con E (1), y se puede expandir con la misma base3. Podemos construiruna base para el espacio total E = E1 ⊗ E2 utilizando el producto tensorial de dos bases identicas

E = E1 ⊗ E2 →∣∣∣u(1)i , u

(2)j

⟩(26.7)

y dado que el orden de los vectores es irrelevante en el producto tensorial, tenemos que∣∣∣u(2)j , u

(1)i

⟩=∣∣∣u(1)i , u

(2)j

sin embargo, se tiene que ∣∣∣u(1)j , u(2)i

⟩6=∣∣∣u(1)i , u

(2)j

⟩si i 6= j

definimos el operador permutacion P21 como el operador lineal cuya accion sobre los vectores base esta dada por

P21

∣∣∣u(1)i , u(2)j

⟩=∣∣∣u(2)i , u

(1)j

⟩=∣∣∣u(1)j , u

(2)i

la accion de este operador sobre un ket arbitrario de E , se obtiene expandiendo este ket en la base (26.7). Puedeverse que el operador P21 ası definido no depende de la base |ui〉 escogida. Pero sı es muy importante que labase de E se construya con el producto tensorial entre dos bases identicas.

Vamos a escoger en particular, la base |r, ε〉, de vectores de posicion y de espın. Una base para el espaciocompleto es ∣∣∣r(1), ε(1); r′(2), ε′(2)

⟩(26.8)

la accion del operador de permutacion sera

P21

∣∣∣r(1), ε(1); r′(2), ε′(2)⟩=∣∣∣r(2), ε(2); r′(1), ε′(1)

⟩=∣∣∣r′(1), ε′(1); r(2), ε(2)

⟩(26.9)

cualquier ket |ψ〉 ∈ E , es una combinacion lineal de la base contınua (26.8) y se puede representar con un conjuntode (2s+ 1)2 funciones de seis variables

|ψ〉 =∑

ε,ε′

∫d3r d3r′ ψε,ε′

(r, r′

) ∣∣∣r(1), ε(1); r′(2), ε′(2)⟩

; ψε,ε′(r, r′

)= 〈r(1), ε(1); r′(2), ε′(2) |ψ〉 (26.10)

3El espacio orbital de estados de cualquier partıcula elemental es simplemente el espacio L2 de las funciones cuadraticamenteintegrables. Por tanto, la unica diferencia puede provenir del espacio espinorial, que solo es diferente si las dos partıculas poseendiferente espın.

Page 596: Mecanica Cuantica: Notas de Clase

596 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

la accion del operador permutacion P21 sobre |ψ〉 se obtiene combinando las ecuaciones (26.9, 26.10)

∣∣ψ′⟩ = P21 |ψ〉 =∑

ε,ε′

∫d3r d3r′ ψε,ε′

(r, r′

) ∣∣∣r′(1), ε′(1); r(2), ε(2)⟩

(26.11)

intercambiando los nombres de las variables mudas ε↔ ε′, r ↔ r′, la Ec. (26.11) queda en la forma

∣∣ψ′⟩ = P21 |ψ〉 =∑

ε,ε′

∫d3r d3r′ ψε′,ε

(r′, r

) ∣∣∣r(1), ε(1); r′(2), ε′(2)⟩

(26.12)

comparando (26.10) con (26.12) vemos que las funciones o coeficientes

ψ′ε,ε′(r, r′

)=⟨r(1), ε(1); r′(2), ε′(2)

∣∣∣ ψ′⟩ =⟨r(1), ε(1); r′(2), ε′(2)

∣∣∣P21 |ψ〉 (26.13)

que representan a |ψ′〉 = P21 |ψ〉 se pueden obtener a partir de los coeficientes en (26.10) que representan al ket|ψ〉, invirtiendo (r, ε) y (r′, ε′)

ψ′ε,ε′(r, r′

)= ψε′,ε

(r′, r

)(26.14)

A partir de la definicion es facil ver que

(P21)2 = 1 (26.15)

de modo que P21 es su propia inversa. Los elementos matriciales de P21 en la base∣∣∣u(1)i , u

(2)j

⟩estan dados por

⟨u(1)k , u(2)m

∣∣∣P21

∣∣∣u(1)i , u(2)j

⟩=⟨u(1)k , u(2)m

∣∣∣ u(2)i , u(1)j

⟩=⟨u(1)k , u(2)m

∣∣∣ u(1)j , u(2)i

⟩= δkjδmi (26.16)

y los elementos matriciales de P †21 son por definicion

⟨u(1)k , u(2)m

∣∣∣P †21

∣∣∣u(1)i , u(2)j

⟩=(⟨u(1)i , u

(2)j

∣∣∣P21

∣∣∣u(1)k , u(2)m

⟩)∗=(⟨u(1)i , u

(2)j

∣∣∣ u(1)m , u(2)k

⟩)∗= δimδjk (26.17)

comparando las Ecs. (26.16, 26.17) resulta

P †21 = P21 (26.18)

es decir P21 es hermıtico. Combinando las Ecs. (26.15, 26.18) se obtiene

P †21P21 = P21P

†21 = 1 (26.19)

de modo que el operador P21 es unitario.

26.4.2. Simetrizadores y antisimetrizadores

Puesto que P21 es hermıtico sus valores propios son reales, y puesto que (P21)2 = 1, sus autovalores son ±1.

Podemos verlo tambien diciendo que P21 es unitario y por tanto sus valores propios yacen en el cırculo complejounitario, pero como tambien es hermıtico los valores propios son reales de modo que solo pueden ser ±1. Losautovectores |ψS〉 de P21 con valor propio +1, se denominan simetricos, y los autovectores |ψA〉 asociados al valorpropio −1 se denominan antisimetricos.

P21 |ψS〉 = |ψS〉 ; P21 |ψA〉 = − |ψA〉definimos ahora los operadores

S =1

2(1 + P21) ; A =

1

2(1− P21)

Page 597: Mecanica Cuantica: Notas de Clase

26.4. OPERADORES DE PERMUTACION 597

a partir de las Ecs. (26.15, 26.18, 26.19) es facil ver las siguientes propiedades

S† = S ; A† = A ; S2 = S ; A2 = A (26.20)

SP21 = P21S = S ; AP21 = P21A = −A (26.21)

S +A = 1 ; AS = SA = 0 (26.22)

de tal manera que S y A son proyectores hermıticos. Las Ecs. (26.22) nos dicen ademas que estos proyectores sonsuplementarios y ortogonales. Veamos algunas de estas propiedades por ejemplo

A† =1

2(1− P21)

† =1

2

(1− P †

21

)=

1

2(1− P21) = A

S2 =1

4(1 + P21)

2 =1

4

(1 + 2P21 + P 2

21

)=

1

4(2 + 2P21) =

1

2(1 + P21) = S

AP21 =1

2(1− P21)P21 =

1

2

(P21 − P 2

21

)=

1

2(P21 − 1) = −A

Por otro lado, de las Ecs. (26.21) podemos ver que dado un ket arbitrario |ψ〉 tenemos que

P21S |ψ〉 = S |ψ〉 ; P21A |ψ〉 = −A |ψ〉 (26.23)

es decir que dado un ket arbitrario no nulo |ψ〉 , tenemos que S |ψ〉 es vector propio de P21 con valor propio +1, entanto que A |ψ〉 es vector propio de P21 con valor propio −1. Por esta razon S y A se conocen como simetrizadory antisimetrizador, puesto que mapean a un vector arbitrario no nulo en su componente simetrica y antisimetricarespectivamente.

26.4.3. Transformacion de los observables por medio de las permutaciones

Consideremos un observable B (1) que actua sobre el subespacio E (1) y cuya extension se define sobre E .Podemos construir una base de E (1) con los vectores propios |ui〉 de B (1), denotaremos los valores propios

correspondientes por bi. Calcularemos la accion del operador P21B (1)P †21 sobre un elemento arbitrario de la base

de E , construıda con el producto tensorial de los |ui〉

P21B (1)P †21

∣∣∣u(1)i , u(2)j

⟩= P21B (1)

∣∣∣u(1)j , u(2)i

⟩= bjP21

∣∣∣u(1)j , u(2)i

= bj

∣∣∣u(1)i , u(2)j

⟩= B (2)

∣∣∣u(1)i , u(2)j

como esto es valido para todos los elementos de la base, lo sera para cualquier combinacion lineal de esta, y portanto para un ket arbitrario de E

P21B (1)P †21 = B (2)

con un argumento similar podemos ver que

P21B (2)P †21 = B (1)

por supuesto,B (1) y B (2) se refiere realmente a sus extensiones sobre E . Hay otros operadores extendidos definidosen E tales como B (1) + C (2) o B (1)C (2). Es facil ver la accion de la transformacion de similaridad hecha conP21 sobre estos operadores

P21 [B (1) +C (2)]P †21 = B (2) +C (1)

P21B (1)C (2)P †21 = P21B (1)P †

21P21C (2)P †21 = B (2)C (1)

podemos generalizar las anteriores expresiones para observables en E que se puedan escribir en terminos deobservables del tipo B (1) y C (2), que denotaremos genericamente por O (1, 2)

P21 [O (1, 2)]P †21 = O (2, 1) (26.24)

Page 598: Mecanica Cuantica: Notas de Clase

598 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

dondeO (2, 1) se obtiene del observableO (1, 2) intercambiando los ındices 1 y 2 en toda la expresion del observable.Decimos que un observable OS (1, 2) es simetrico si se cumple

OS (1, 2) = OS (2, 1) (26.25)

al aplicar (26.25) y la condicion de unitariedad de P21 Ec. (26.19), vemos que para un observable simetrico secumple

P21 [OS (1, 2)]P†21 = OS (1, 2) ⇒ P21 [OS (1, 2)] = OS (1, 2) P21

[OS (1, 2) , P21] = 0

por tanto los observables simetricos conmutan con el operador permutacion P21.

26.4.4. Permutacion de un conjunto arbitrario de partıculas

Asumiremos un sistema de partıculas del mismo espın, pero no necesariamente identicas. Por simplicidadilustraremos la mayor parte de las propiedades con el caso N = 3, veremos que algunas propiedades de laspermutaciones generales difieren de las presentadas para el caso N = 2.

Una base para el espacio de estados de tres partıculas con el mismo espın se puede escribir en la forma∣∣∣u(1)i , u

(2)j , u

(3)k

⟩(26.26)

en este caso existen 6 permutaciones (N ! en el caso general), que denotaremos en la forma

P123, P312, P231, P132, P213, P321 (26.27)

donde por definicion el operador Pnpq (siendo npq una permutacion de los numeros 1,2,3) es un operador linealcuya accion sobre los vectores bases esta dada por

Pnpq

∣∣∣u(1)i , u(2)j , u

(3)k

⟩=∣∣∣u(n)i , u

(p)j , u

(q)k

por ejemplo

P231

∣∣∣u(1)i , u(2)j , u

(3)k

⟩=∣∣∣u(2)i , u

(3)j , u

(1)k

⟩=∣∣∣u(1)k , u

(2)i , u

(3)j

P123 es claramente el operador identidad. La accion de Pnpq sobre un ket arbitrario se puede obtener expandiendodicho ket en la base (26.26).

Es facil ver que el conjunto de todas las N ! permutaciones asociadas a N elementos constituyen un grupo. Esdecir, cumplen con los siguientes axiomas

1. P123 es el operador identidad.

2. El producto de dos operadores de permutacion es otro operador de permutacion. Por ejemplo, tomemos laaccion de las siguientes permutaciones

P321

∣∣∣u(1)i , u(2)j , u

(3)k

⟩=∣∣∣u(3)i , u

(2)j , u

(1)k

⟩=∣∣∣u(1)k , u

(2)j , u

(3)i

⟩(26.28)

P312P132

∣∣∣u(1)i , u(2)j , u

(3)k

⟩= P312

∣∣∣u(1)i , u(3)j , u

(2)k

⟩= P312

∣∣∣u(1)i , u(2)k , u

(3)j

⟩=∣∣∣u(3)i , u

(1)k , u

(2)j

P312P132

∣∣∣u(1)i , u(2)j , u

(3)k

⟩=

∣∣∣u(1)k , u(2)j , u

(3)i

⟩(26.29)

comparando (26.28) con (26.29) podemos ver que

P312P132 = P321

Page 599: Mecanica Cuantica: Notas de Clase

26.4. OPERADORES DE PERMUTACION 599

3. Los operadores permutacion son asociativos. Por ejemplo, el lector puede verificar que

(P312P132)P231 = P312 (P132P231)

4. Cada operador permutacion posee un operador inverso que tambien es de permutacion. Con razonamientossimilares al anterior se puede probar que

P−1123 = P123 ; P−1

312 = P231 ; P−1231 = P312

P−1132 = P132 ; P−1

213 = P213 ; P−1321 = P321 (26.30)

En general los operadores permutacion no conmutan. Por ejemplo

P312P132 = P321 ; P132P312 = P213 6= P321

Paridad de una permutacion

Una transposicion es una permutacion que intercambia dos ındices dejando los demas intactos. Los tres ultimosoperadores en (26.27) son transposiciones4. Como las transposiciones son permutaciones que solo involucran a doselementos, poseen las mismas propiedades que las permutaciones P21 que estudiamos en la seccion 26.4.1. Enconsecuencia, las transposiciones son hermıticas, unitarias y coinciden con su inverso.

Un operador permutacion se puede escribir como el producto de transposiciones. Por ejemplo, es posibleverificar que

P312 = P132P213 = P321P132 = P213P321 = P132P213 (P132)2 = . . . (26.31)

esta descomposicion NO es unica. Sin embargo, para una permutacion dada, la paridad del numero de transposi-ciones es siempre la misma. Una permutacion par (impar) es una permutacion que se escribe como un numero par(impar) de transposiciones. Las tres primeras permutaciones en (26.27) son pares y las tres ultimas son impares.Para N ≥ 2, siempre hay N !/2 de permutaciones pares y N !/2 de permutaciones impares.

Puesto que las permutaciones son productos de operadores unitarios (transposiciones) entonces son unitarias.Sin embargo, las permutaciones no son necesariamente hermıticas ya que el producto de operadores hermıticosno-conmutantes, no es hermıtico [ver teorema 1.34 Pag. 34].

No obstante, puede demostrarse que el inverso (i.e. el hermıtico) de una permutacion Pnpq tiene la mismaparidad que la permutacion original. Esto se puede ver teniendo en cuenta que P−1

npq se construye con las mismastransposiciones pero tomadas en orden inverso. A manera de ejemplo, tenemos que

P312 = P132P213 ⇒ P−1312 = (P132P213)

−1 = P−1213P

−1132 ⇒

P−1312 = P213P132

Kets completamente simetricos y antisimetricos

Puesto que los operadores de permutacion no conmutan para N > 2, no es posible construir una base deautovectores comunes a estos operadores. Sin embargo, veremos que existen algunos kets que son simultaneamenteautovectores de todos los operadores permutacion. Denotaremos por Pα un operador de permutacion arbitrariode los primeros N enteros. Un ket |ψS〉 tal que

Pα |ψS〉 = |ψS〉para toda permutacion Pα se dice que es un ket completamente simetrico. Similarmente un ket se denominacompletamente antisimetrico si se cumple la condicion

Pα |ψA〉 = εα |ψA〉 ; εα =

+1 si Pα es una permutacion par−1 si Pα es una permutacion impar

4Es obvio que una transposicion aplicada dos veces es la identidad. Por tanto, una transposicion es su propio inverso. Por estarazon, las tres ultimas permutaciones en (26.27) coinciden con su propia inversa como se puede ver en las Ecs. (26.30).

Page 600: Mecanica Cuantica: Notas de Clase

600 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

alternativamente, puesto que Pα se compone de un producto de transposiciones, se puede definir un ket totalmentesimetrico como aquel que queda invariante bajo cualquier transposicion, y un ket es completamente antisimetricosi invierte su signo bajo cualquier transposicion. El conjunto de los kets completamente simetricos constituye unsubespacio vectorial ES ⊂ E , y el de los kets completamente antisimetricos un subespacio EA ⊂ E . Consideremoslos operadores

S =1

N !

N !∑

α=1

Pα ; A =1

N !

N !∑

α=1

εαPα (26.32)

Veremos que S y A son los proyectores sobre los espacios ES y EA respectivamente. Por esta razon se denominanel simetrizador y el antisimetrizador. Tomando el adjunto a ambos lados de (26.32) obtenemos

S† =1

N !

N !∑

α=1

P †α =

1

N !

N !∑

α=1

P−1α =

1

N !

N !∑

β=1

Pβ = S

A† =1

N !

N !∑

α=1

εαP†α =

1

N !

N !∑

α=1

εαP−1α =

1

N !

N !∑

β=1

εβPβ = A

donde hemos usado el hecho de que al recorrer todos los inversos se recorren todos los operadores aunque en unorden diferente. Ademas, el inverso tiene la misma paridad que la permutacion directa.

Supongamos ahora que Pα0 es una permutacion arbitraria, calcularemos Pα0S y Pα0A

Pα0S =1

N !

N !∑

α=1

Pα0Pα =1

N !

N !∑

β=1

Pβ = S

Pα0A =1

N !

N !∑

α=1

εαPα0Pα =1

N !εα0

N !∑

β=1

εβPβ = εα0A

donde hemos tenido en cuenta que al multiplicar la suma de todas las permutaciones por una permutacion fija,se vuelven a obtener todas las permutaciones aunque en un orden diferente. Ademas si Pα0 es par (impar) laparidad de cada producto Pα0Pα queda intacta (se invierte de signo). Para los productos SPα0 y APα0 se realizaun procedimiento analogo y se obtiene

Pα0S = SPα0 = S ; Pα0A = APα0 = ε0A (26.33)

aplicando las Ecs. (26.33) tambien se obtiene

S2 =

(1

N !

N !∑

α=1

)S =

1

N !

N !∑

α=1

PαS =1

N !

N !∑

α=1

S =1

N !N !S = S

A2 =1

N !

N !∑

α=1

εαPαA =1

N !

N !∑

α=1

ε2αA =1

N !

N !∑

α=1

A = A

AS =1

N !

N !∑

α=1

εαPαS =1

N !

N !∑

α=1

εαS =S

N !

N !∑

α=1

εα = 0

en la ultima ecuacion se tuvo en cuenta que para N ≥ 2, la mitad de las permutaciones es par y la otra mitad esimpar. Tenemos entonces que

S2 = S ; A2 = A ; SA = AS = 0 (26.34)

Page 601: Mecanica Cuantica: Notas de Clase

26.5. POSTULADO DE SIMETRIZACION 601

S y A son entonces proyectores sobre los subespacios ES y EA respectivamente. La Ec. (26.33) nos dice que laaccion de estos operadores sobre un ket arbitrario |ψ〉 nos da un ket completamente simetrico y completamenteantisimetrico respectivamente

Pα0S |ψ〉 = S |ψ〉 ⇒ Pα0 |ψS〉 = |ψS〉 ; |ψS〉 ≡ S |ψ〉Pα0A |ψ〉 = εα0A |ψ〉 ⇒ Pα0 |ψA〉 = εα0 |ψA〉 ; |ψA〉 ≡ A |ψ〉

para N ≥ 3, los subespacios ES y EA no son suplementarios (su suma directa no es E). Por ejemplo, para N = 3tenemos

S +A =1

3(P123 + P231 + P312) 6= 1

es decir, la union de todos los kets completamente simetricos con todos los completamente antisimetricos, no formanuna base. Hay kets “mixtos” que no tienen ninguna de las dos simetrıas y que son linealmente independientes delos anteriores. Esto es consistente con el hecho de que para N > 2, los autoestados comunes a todos los operadorespermutacion no pueden formar una base, ya que tales operadores no conmutan entre sı.

Para encontrar la transformacion de los observables por medio de una permutacion arbitraria, podemos escribirla permutacion como producto de transposiciones ya que estas poseen las mismas propiedades que la permutacionP21 que se estudio en la seccion 26.4.1. Con los argumentos de la seccion 26.4.1 se puede encontrar la forma enque una permutacion arbitraria transforma a un observable. A manera de ejemplo, tomemos la permutacion P312

y la escribimos en terminos de transposiciones como en la Ec. (26.31)

P312 = P132P213

la transformacion de un observable O (1, 2, 3) a traves de P312 se puede escribir como

P312O (1, 2, 3) P †312 = [P132P213]O (1, 2, 3) [P132P213]

† = [P132P213]O (1, 2, 3) P †213P

†132

= P132

[P213O (1, 2, 3) P †

213

]P †132 = P132 [O (2, 1, 3)]P †

132

P312O (1, 2, 3) P †312 = O (3, 1, 2) (26.35)

donde hemos usado la Ec. (26.24), teniendo en cuenta que P132 y P213 son transposiciones de los ındices 2, 3 y 1, 2respectivamente. En particular, si un observable OS (1, 2, . . . , N) es completamente simetrico bajo el intercambiode los ındices 1, 2, . . . , N , conmutara con todas las transposiciones, y puesto que una permutacion arbitraria es unproducto de transposiciones, se concluye que el observable OS (1, 2, . . . , N) conmutara con cualquier permutacionPα de los N ındices anteriores

[OS (1, 2, . . . , N) , Pα] = 0 si OS (1, 2, . . . , N) es completamente simetrico (26.36)

26.5. Postulado de simetrizacion

El postulado de simetrizacion nace como una necesidad de describir sistemas de partıculas identicas y removerla degeneracion de intercambio, junto con las dificultades que esta conlleva. Cuando se discutio la degeneracion deintercambio, se observo que esta desaparecıa cuando el ket era completamente simetrico bajo el intercambio de losrotulos de partıcula. Similarmente, es facil demostrar que tal degeneracion tambien desaparece cuando el ket escompletamente antisimetrico bajo dicho intercambio. Estos razonamientos junto con la experiencia fenomenologica,condujeron al llamado postulado de simetrizacion, que se puede enunciar en la siguiente forma:

Cuando un sistema incluye varias partıculas identicas, solo ciertos kets del espacio de estados pueden describira los estados fısicos. Los estados fısicos son o bien totalmente simetricos o totalmente antisimetricos con respectoa la permutacion de estas partıculas. La naturaleza simetrica o antisimetrica de los kets asociados con el estadofısico, depende de la naturaleza de las partıculas identicas en cuestion. Aquellas partıculas cuyos estados asociados

Page 602: Mecanica Cuantica: Notas de Clase

602 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

son simetricos se denominan Bosones, en tanto que aquellas asociadas a estados antisimetricos se denominanFermiones.

El postulado de simetrizacion limita entonces el espacio de estados para un sistema de partıculas identicas.Para partıculas de diferente naturaleza, el espacio de estados E , es el producto tensorial de los estados de cadapartıcula del sistema. Cuando las partıculas son identicas, el espacio de estados es solo un subespacio de E , queserıa ES si las partıculas son bosones o EA si las partıculas identicas son fermiones.

De acuerdo con este postulado, las partıculas que existen en la naturaleza se dividen en dos categorıas. Todaslas partıculas que conocemos hasta ahora obedecen a la siguiente regla empırica: Las partıculas de espın semi-entero (electrones, positrones, protones, neutrones, muones, tauones, etc.) son fermiones, y las partıculas de espınentero (fotones, mesones, bosones vectoriales, etc.), son bosones.

26.5.1. Aplicacion del postulado a partıculas compuestas

Una vez que la regla empırica antes mencionada se ha verificado para las partıculas “elementales”, se verificarapara otras partıculas tambien, ya que estas estan compuestas por partıculas elementales. Consideremos un sistemade partıculas identicas compuestas. Permutar dos de estas partıculas compuestas es equivalente a permutar todaslas partıculas que componen a la primera con todas las partıculas que componen a la segunda (las cuales sonidenticas a las de la primera partıcula, ya que las partıculas compuestas son identicas)5 .

Ahora bien, el ket que describe al sistema debe permanecer inalterado bajo la permutacion de dos partıculascompuestas identicas, si las partıculas compuestas estan formadas solo por bosones elementales (ya que todatransposicion de bosones deja el signo inalterado), o si cada una de ellas esta compuesta por un numero par defermiones (ya que cada transposicion de fermiones cambia el signo, y habrıa un numero par de cambios de signo).Esto indica que las partıculas compuestas son bosones, lo cual es consistente con las reglas de adicion del momentoangular (si asumimos que la regla empırica es valida), ya que la suma de un numero par de espines semi-enteroses entera, y la suma de cualquier numero de espines enteros es entera.

Por otro lado, si cada partıcula compuesta contiene un numero impar de fermiones, el estado debe cambiar designo bajo la permutacion de dos partıculas compuestas, ya que esto implica un numero impar de transposicionesde las partıculas elementales. Si asumimos la regla empırica como valida, esto es de nuevo consistente con las reglasde adicion del momento angular, ya que la suma de un numero impar de espines semi-enteros es semi-entera, demodo que cada partıcula compuesta serıa un fermion.

Por ejemplo, los nucleos atomicos estan compuestos por protones y neutrones, y ambos tipos de partıculas sonfermiones de espın 1/2. En consecuencia, nucleos con masa atomica par (numero total de nucleones) son bosones,y nucleos con masa atomica impar son fermiones. Por ejemplo, el isotopo 3He del helio es un fermion, en tantoque el isotopo del helio 4He es un boson.

26.5.2. Solucion de la degeneracion de intercambio

Sea |u〉 un ket que describe matematicamente un estado fısico bien definido de N partıculas identicas. Paracualquier operador permutacion Pα, el ket matematico Pα |u〉 describe el mismo estado fısico que |u〉. Lo mismoocurre con cualquier ket del subespacio Eu expandido por Pα |u〉, donde Pα recorre todas las permutaciones(incluyendo la identidad). Dependiendo del ket |u〉 escogido, este subespacio puede tener dimension 1 o dimensionN ! o una dimension intermedia. Por ejemplo, para dos partıculas identicas de espın 1/2, el estado |++〉 generaun solo ket linealmente independiente al barrer las permutaciones I, P21. En tanto que el ket |+−〉 genera doskets linealmente independientes con las mismas permutaciones. Si la dimension es mayor que uno, hay varios ketsmatematicos linealmente independientes que corresponden al mismo estado fısico, generando la degeneracion deintercambio.

5No es necesario que las partıculas elementales que componen a la partıcula compuesta sean todas identicas. Por ejemplo, dosprotones son partıculas compuestas identicas. Sin embargo, cada proton (en una vision simplificada) consiste de dos quarks tipo “up”y un quark tipo “down”.

Page 603: Mecanica Cuantica: Notas de Clase

26.6. APLICACION DEL POSTULADO DE SIMETRIZACION PARA N = 2 603

El nuevo postulado de simetrizacion restringe al conjunto de estados matematicos que pueden describir unestado fısico de partıculas identicas, ya que estos kets deben pertenecer al subespacio ES para bosones y EApara fermiones. Para encontrar los estados matematicos adecuados debemos entonces proyectar los estados delsubespacio Eu sobre los subespacios ES para bosones y EA para fermiones, para lo cual debemos usar los proyectoresS y A respectivamente, sobre los estados Pα |u〉, con lo cual obtenemos

SPα |u〉 = S |u〉 (26.37)

APα |u〉 = εαA |u〉 (26.38)

donde hemos usado la Ec. (26.33) Pag. 26.33. Estas ecuaciones nos muestran que todas las proyecciones de ketsde Eu sobre los subespacios ES para bosones y EA para fermiones, son colineales. Por tanto el postulado desimetrizacion asigna un solo ket linealmente independiente de Eu, al estado fısico antes descrito. En consecuencia,dicho postulado remueve la degeneracion de intercambio, asignando el estado (unico dentro de un factor constante)S |u〉 a los bosones y el estado A |u〉 para los fermiones. De aquı en adelante estos se denominaran los kets fısicos.

En particular, es posible que todos los kets de Eu tengan proyeccion cero sobre ES o sobre EA, en cuyo casoel postulado de simetrizacion esta excluyendo al correspondiente estado fısico. Veremos un ejemplo en la seccion26.6.

Es claro ahora el algoritmo de construccion del unico ket fısico asociado a un estado fısico dado de un sistemade N partıculas identicas.

1. Comenzamos por numerar las partıculas arbitrariamente, construyendo el ket |u〉, que resulta de la nume-racion particular elegida.

2. Se aplica el proyector S o el proyector A sobre |u〉, dependiendo de si las partıculas identicas son bosones ofermiones.

3. Se normaliza el ket obtenido.

26.6. Aplicacion del postulado de simetrizacion para N = 2

Consideremos un sistema de dos partıculas identicas. Supongamos que sabemos que una de ellas esta en elestado individual caracterizado por el ket normalizado |ϕ〉, y la otra partıcula esta en el estado normalizadodescrito por |χ〉.

Primero estudiaremos el caso en el cual los dos estados son diferentes. En tal caso, el ket fısico asociado alsistema de dos partıculas se construye con la prescripcion ya descrita

1. Numeremos con el (1) a la partıcula asociada al estado |ϕ〉 y con el numero (2) a la partıcula asociada alestado |χ〉, el estado |u〉 queda en la forma

|u〉 =∣∣∣ϕ(1), χ(2)

2. Si las partıculas son bosones (fermiones) simetrizamos (antisimetrizamos) al estado |u〉

|bosones〉 = S |u〉 = 1

2

[∣∣∣ϕ(1), χ(2)⟩+∣∣∣ϕ(2), χ(1)

⟩]=

1

2

[∣∣∣ϕ(1), χ(2)⟩+∣∣∣χ(1), ϕ(2)

⟩](26.39)

|fermiones〉 = A |u〉 = 1

2

[∣∣∣ϕ(1), χ(2)⟩−∣∣∣ϕ(2), χ(1)

⟩]=

1

2

[∣∣∣ϕ(1), χ(2)⟩−∣∣∣χ(1), ϕ(2)

⟩](26.40)

Page 604: Mecanica Cuantica: Notas de Clase

604 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

3. Los kets (26.39, 26.40) no estan en general normalizados. Si asumimos que los estados |ϕ〉 y |χ〉 son ortogonalesy estan normalizados, los estados fısicos normalizados seran

|bosones〉 =1√2

[∣∣∣ϕ(1), χ(2)⟩+∣∣∣ϕ(2), χ(1)

⟩]=

1√2

[∣∣∣ϕ(1), χ(2)⟩+∣∣∣χ(1), ϕ(2)

⟩]

|fermiones〉 =1√2

[∣∣∣ϕ(1), χ(2)⟩−∣∣∣ϕ(2), χ(1)

⟩]=

1√2

[∣∣∣ϕ(1), χ(2)⟩−∣∣∣χ(1), ϕ(2)

⟩]

Asumamos ahora que los estados individuales son identicos, el estado |u〉 sera

|u〉 =∣∣∣ϕ(1), ϕ(2)

⟩(26.41)

este estado ya es totalmente simetrico. Por tanto, si las dos partıculas son bosones, el estado (26.41) es el ket fısicoasociado a un estado en el cual los dos bosones estan en el mismo estado individual |ϕ〉. De hecho, el simetrizadorS deja intacto a este estado. Por otro lado, si las partıculas son fermiones tenemos que

A |u〉 = 1

2

[∣∣∣ϕ(1), ϕ(2)⟩−∣∣∣ϕ(2), ϕ(1)

⟩]= 0

de modo que no existe un ket no-nulo en EA que pueda describir el estado fısico en el cual dos fermiones estanen el mismo estado individual |ϕ〉. El postulado de simetrizacion excluye este tipo de estados fısicos. Hemosestablecido para un caso particular el denominado “principio de exclusion de Pauli” que nos dice que dosfermiones identicos no pueden estar en el mismo estado individual. Este principio establece una gran diferenciaen el comportamiento estadıstico de un sistema de fermiones identicos con respecto al de un sistema de bosonesidenticos.

26.7. Postulado de simetrizacion para N arbitrario

Ilustraremos el caso general para el escenario con N = 3. Consideremos el estado fısico que se define especifi-cando los estados individuales normalizados |ϕ〉 , |χ〉 , |ω〉. Escogeremos el estado |u〉 con la siguiente asignacionnumerica

|u〉 =∣∣∣ϕ(1), χ(2), ω(3)

estudiaremos a los bosones y fermiones por aparte

26.7.1. Postulado de simetrizacion para bosones

Al aplicar el simetrizador asociado a tres bosones identicos tenemos

S |u〉 =1

3!

3!∑

α=1

∣∣∣ϕ(1), χ(2), ω(3)⟩=

1

6

[∣∣∣ϕ(1), χ(2), ω(3)⟩+∣∣∣ϕ(1), χ(3), ω(2)

⟩+∣∣∣ϕ(2), χ(1), ω(3)

+∣∣∣ϕ(3), χ(1), ω(2)

⟩+∣∣∣ϕ(2), χ(3), ω(1)

⟩+∣∣∣ϕ(3), χ(2), ω(1)

⟩]

S |u〉 =1

6

[∣∣∣ϕ(1), χ(2), ω(3)⟩+∣∣∣ϕ(1), ω(2), χ(3)

⟩+∣∣∣χ(1), ϕ(2), ω(3)

+∣∣∣χ(1), ω(2), ϕ(3)

⟩+∣∣∣ω(1), ϕ(2), χ(3)

⟩+∣∣∣ω(1), χ(2), ϕ(3)

⟩](26.42)

solo resta normalizar el vector (26.42). La constante de normalizacion depende de cuantos de estos estados sondistintos. Si todos los tres estados individuales son diferentes y ortogonales entre sı, los seis kets que aparecenen (26.42) tambien son ortogonales, y para normalizar el estado completo, basta reemplazar el factor 1/6 por el

Page 605: Mecanica Cuantica: Notas de Clase

26.7. POSTULADO DE SIMETRIZACION PARA N ARBITRARIO 605

factor 1/√6. Si en cambio, tenemos dos estados identicos y uno diferente (ortogonal a los estados identicos), al

aplicar el simetrizador solo quedan tres kets diferentes y el factor normalizador serıa 1/√3

|ϕ;ϕ;ω〉 = 1√3

[∣∣∣ϕ(1), ϕ(2), ω(3)⟩+∣∣∣ϕ(1), ω(2), ϕ(3)

⟩+∣∣∣ω(1), ϕ(2), ϕ(3)

⟩]

finalmente si los tres estados son identicos, el estado |u〉 ya esta automaticamente simetrizado y normalizado.

|u〉 =∣∣∣ϕ(1), ϕ(2), ϕ(3)

la aplicacion del simetrizador dejarıa intacto al ket.

26.7.2. Postulado de simetrizacion para fermiones

—————————————-——————————————La aplicacion del antisimetrizador al estado |u〉 de tres fermiones identicos nos da

A |u〉 = 1

3!

3!∑

α=1

εαPα

∣∣∣ϕ(1), χ(2), ω(3)⟩

El antisimetrizador se escribe explıcitamente como

A =1

3!P123 + P231 + P312 − P213 − P321 − P132

donde P123 es la identidad. Aplicando el antisimetrizador sobre el ket |u〉 y ajustando una constante de normali-zacion, el ket fısico posee la forma

|ϕ;χ;ω〉 ≡√3!A |u〉 =

√3!

3!P123 + P231 + P312 − P213 − P321 − P132

∣∣∣ϕ(1), χ(2), ω(3)⟩

=1√3!

∣∣∣ϕ(1), χ(2), ω(3)⟩+∣∣∣ϕ(2), χ(3), ω(1)

⟩+∣∣∣ϕ(3), χ(1), ω(2)

⟩−∣∣∣ϕ(2), χ(1), ω(3)

⟩−∣∣∣ϕ(3), χ(2), ω(1)

⟩−∣∣∣ϕ(1), χ(3)

=1√3!

∣∣∣ϕ(1), χ(2), ω(3)⟩−∣∣∣ϕ(1), χ(3), ω(2)

⟩+∣∣∣ϕ(2), χ(3), ω(1)

⟩−∣∣∣ϕ(2), χ(1), ω(3)

⟩+∣∣∣ϕ(3), χ(1), ω(2)

⟩−∣∣∣ϕ(3), χ(2)

=1√3!

∣∣∣ϕ(1)⟩⊗[∣∣∣χ(2), ω(3)

⟩−∣∣∣χ(3), ω(2)

⟩]+∣∣∣ϕ(2)

⟩⊗[∣∣∣χ(3), ω(1)

⟩−∣∣∣χ(1), ω(3)

⟩]

+∣∣∣ϕ(3)

⟩⊗[∣∣∣χ(1), ω(2)

⟩−∣∣∣χ(2), ω(1)

⟩]

de lo cual se obtiene el determinante 3× 3 dado por

|ϕ;χ;ω〉 ≡√3!A |u〉 = 1√

3!

∣∣∣∣∣∣

∣∣ϕ(1)⟩ ∣∣χ(1)

⟩ ∣∣ω(1)⟩

∣∣ϕ(2)⟩ ∣∣χ(2)

⟩ ∣∣ω(2)⟩

∣∣ϕ(3)⟩ ∣∣χ(3)

⟩ ∣∣ω(3)⟩

∣∣∣∣∣∣(26.43)

conocido como determinante de Slater. El estado√3!A |u〉 es cero si dos (o tres) estados individuales coinciden,

ya que el determinante tendrıa dos (o tres) columnas identicas. Este hecho nos lleva al principio de exclusionde Pauli, ya mencionado anteriormente. El mismo estado cuantico no puede ser ocupado simultaneamente porvarios fermiones identicos. Si los tres estados son ortogonales los seis kets asociados al determinante (26.43) sonortogonales. Por tanto, para normalizarlos basta reemplazar el factor 1/3! por el factor 1/

√3!, lo cual se logra

multiplicando el estado A |u〉 por el factor√3! como ya se menciono.

Page 606: Mecanica Cuantica: Notas de Clase

606 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

Para N arbitrario, se pueden generalizar facilmente los resultados anteriores. Para N bosones identicos, siem-pre se puede construir el estado totalmente simetrico S |u〉 a partir de los N estados de partıcula individual|ϕ1〉 , . . . , |ϕN 〉. En el caso de N fermiones identicos, el estado fısico A |u〉 se puede escribir en la forma de un de-terminante de Slater N×N , este determinante excluye el caso en el cual dos o mas estados individuales coinciden,ya que el estado antisimetrizado se anula. El hecho de que los bosones no sigan este “principio de exclusion” entanto que los fermiones sı, marca una gran diferencia entre el comportamiento de estos dos tipos de partıculas.

Notese finalmente que es el principio de exclusion de Pauli (previamente establecido fenomenologicamente) elque obliga a incluır kets completamente antisimetricos en el postulado de simetrizacion.

26.8. Construccion de una base de estados fısicos de partıculas identicas

Consideremos un sistema de N partıculas identicas. Comenzando por la base |ui〉 de partıcula individual,construımos en primer lugar la base en el producto tensorial E de los espacios de una partıcula, asignando unacierta numeracion de partıcula. ∣∣∣u(1)i1 , u

(2)i2, . . . , u

(N)iN

⟩(26.44)

donde el subındice rotula estados y el supraındice rotula partıculas. La idea es determinar una base de los subes-pacios ES o EA es decir una base para los kets fısicos. Aplicando los proyectores S o A a los kets (26.44), obtenemosun conjunto de kets que expanden ES o EA. Veamos el caso de ES ya que el caso de EA es analogo. Sea |ϕ〉 ∈ ES ,tal estado se puede expandir en la base (26.44) de E

|ϕ〉 =n∑

i1=1

n∑

i2=1

· · ·n∑

iN=1

ai1,i2,...,iN

∣∣∣u(1)i1 , u(2)i2, . . . , u

(N)iN

⟩(26.45)

donde n es la dimension de cada subespacio de partıcula individual (dimension infinita numerable en el caso delespacio de Hilbert L2). Es claro que S |ϕ〉 = |ϕ〉 ya que |ϕ〉 ∈ ES. Si aplicamos S a ambos lados de (26.45), nosqueda

|ϕ〉 =∑

i1,i2,...,iN

ai1,i2,...,iN

[S∣∣∣u(1)i1 , u

(2)i2, . . . , u

(N)iN

⟩]

de modo que el estado arbitrario |ϕ〉 ∈ ES , queda escrito en terminos de kets de la forma

S∣∣∣u(1)i1 , u

(2)i2, . . . , u

(N)iN

⟩∈ ES (26.46)

Sin embargo, en general no todos los kets de la forma (26.46) son linealmente independientes. Por ejemplo, podemos

permutar los roles de las varias partıculas en uno de los kets del tipo∣∣∣u(1)i1 , u

(2)i2, . . . , u

(N)iN

⟩de la base inicial (antes

de la simetrizacion). Sobre este nuevo ket, la aplicacion de S o A conduce al mismo ket |ϕ〉 (tal vez con signocambiado en el caso de A), de acuerdo con las Ecs. (26.37, 26.38).

La discusion anterior nos conduce a introducir el concepto de numero de ocupacion. En general no todoslos estados |ui1〉 , |ui2〉 , . . . , |uiN 〉 son diferentes. Es conveniente reordenar los estados diferentes con un nuevoındice. Si tenemos p estados diferentes de partıcula individual, entonces escribimos

|uk〉 =|uk1〉 , |uk2〉 , . . . ,

∣∣ukp⟩

; donde |ukm〉 6= |ukn〉 si m 6= n

El estado inicial lo reorganizamos en la forma∣∣∣u(1)k1 , u

(2)k1, . . . , u

(n1)k1

;u(n1+1)k2

, u(n1+2)k2

, . . . , u(n1+n2)k2

; . . . ;u(N−np+1)kp

, u(N−np+2)kp

, . . . , u(N)kp

donde ni es el numero de partıculas en el estado |uki〉 con i = 1, 2, . . . , p. Es claro que se tiene que cumplir lacondicion

p∑

i=1

ni = N (26.47)

Page 607: Mecanica Cuantica: Notas de Clase

26.8. CONSTRUCCION DE UNA BASE DE ESTADOS FISICOS DE PARTICULAS IDENTICAS 607

a los ni se les denomina numero de ocupacion, que es el numero de partıculas en el estado |uki〉. Dos ketsdiferentes del tipo (26.44) cuyos numeros de ocupacion coincidan, se pueden obtener el uno a partir del otro conuna permutacion. Por tanto, despues de la aplicacion del simetrizador o el antisimetrizador, se obtiene el mismoket fısico a partir de ambos kets de acuerdo con la Ec. (26.37, 26.38) (a lo mas con un signo de diferencia).Denotaremos a este unico estado fısico simetrizado (o antisimetrizado) asociado a una configuracion dada deocupacion en la forma

|n1, n2, . . . , np〉para bosones, estos estados se obtienen de

|n1, n2, . . . , np〉 = cSS∣∣∣u(1)1 , u

(2)1 , . . . , u

(n1)1 ;u

(n1+1)2 , u

(n1+2)2 , . . . , u

(n1+n2)2 ; . . . ;u

(N−np+1)p , u

(N−np+2)p , . . . , u(N)

p

(26.48)y para fermiones de

|n1, n2, . . . , np〉 = cAA∣∣∣u(1)1 , u

(2)1 , . . . , u

(n1)1 ;u

(n1+1)2 , u

(n1+2)2 , . . . , u

(n1+n2)2 ; . . . ;u

(N−np+1)p , u

(N−np+2)p , . . . , u(N)

p

(26.49)donde los coeficientes de normalizacion cS y cA vienen dados por

cS =

√N !

n1!n2! . . . np!; cA =

√N !

ahora bien, puesto que el numero de estados accesibles diferentes puede ser infinito, escribiremos un estado deocupacion de aquı en adelante en la forma

|n1, n2, . . . , nk, . . .〉

Example 26.1 Tomemos los siguientes kets asociados a cinco partıculas identicas∣∣∣u(1)1 , u

(2)5 , u

(3)1 , u

(4)7 , u

(5)5

⟩;∣∣∣u(1)7 , u

(2)1 , u

(3)5 , u

(4)5 , u

(5)1

⟩(26.50)

donde u(i)ki

indica que la i−esima partıcula esta en el estado excitado ki del oscilador armonico unidimensional.Ambos estados en (26.50) describen a dos partıculas en el estado base u1, dos partıculas en el quinto estadoexcitado y una partıcula en el septimo estado excitado. Podemos ver claramente que ambos kets estan conectadospor medio de una permutacion de los rotulos de partıculas

∣∣∣u(1)1 , u(2)5 , u

(3)1 , u

(4)7 , u

(5)5

⟩=∣∣∣u(4)7 , u

(1)1 , u

(5)5 , u

(2)5 , u

(3)1

⟩= P41523

∣∣∣u(1)7 , u(2)1 , u

(3)5 , u

(4)5 , u

(5)1

notese que la permutacion que conecta a ambos estados no es unica. Por ejemplo tambien se puede escribir∣∣∣u(1)1 , u

(2)5 , u

(3)1 , u

(4)7 , u

(5)5

⟩=∣∣∣u(4)7 , u

(1)1 , u

(2)5 , u

(5)5 , u

(3)1

⟩= P41253

∣∣∣u(1)7 , u(2)1 , u

(3)5 , u

(4)5 , u

(5)1

ahora bien, el orden mas natural para este estado fısico es colocar los estados en orden ascendente de energıa, ental caso serıa el ket ∣∣∣u(1)1 , u

(3)1 , u

(2)5 , u

(5)5 , u

(4)7

como ya se menciono, al simetrizar o antisimetrizar cualquiera de estos kets se obtiene un unico ket fısico (a lomas se obtiene un signo de diferencia cuando se antisimetriza, dependiendo del ket elegido). Notese que tambien sepodrıan intercambiar los estados en lugar de las partıculas. Sin embargo se debe tener presente que los subındicesen los kets (26.50) indican la excitacion del estado individual y no son los rotulos de los estados. Por ejemplo sielegimos el primer ket en (26.50) podemos escribir

∣∣∣u(1)1 , u(2)5 , u

(3)1 , u

(4)7 , u

(5)5

⟩≡∣∣∣u(1)k1 , u

(2)k2, u

(3)k3, u

(4)k4, u

(5)k5

Page 608: Mecanica Cuantica: Notas de Clase

608 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

de modo quek1 = 1, k2 = 5, k3 = 1, k4 = 7, k5 = 5

y podemos aplicar el permutador sobre los ındices de estados

P41253

∣∣∣u(1)1 , u(2)5 , u

(3)1 , u

(4)7 , u

(5)5

⟩≡ P41253

∣∣∣u(1)k1 , u(2)k2, u

(3)k3, u

(4)k4, u

(5)k5

=∣∣∣u(1)k4 , u

(2)k1, u

(3)k2, u

(4)k5, u

(5)k3

⟩=∣∣∣u(1)7 , u

(2)1 , u

(3)5 , u

(4)5 , u

(5)1

mostrando una vez mas que ambos estados en (26.50) estan conectados por una permutacion. Cuando cualquierade estos estados se simetriza (o antisimetriza) lo que se obtiene es un ket fısico con la informacion de que dospartıculas estan en el estado base u1, dos en el quinto estado excitado, y una en el septimo estado excitado. Enla notacion de numero de ocupacion cada casilla del ket denota un estado individual y en ella se coloca el numerode partıculas que hay en cada estado. En este caso el ket fısico |ψ〉 se escribe en la forma

|ψ〉 = |2, 0, 0, 0, 2, 0, 1, 0, 0, 0, . . .〉

donde solo hay numeros distintos de cero en la primera, quinta, y septima casillas, ya que en los otros estadosno hay ninguna partıcula. Los estados accesibles son infinitos ya que no hay cota para los estados excitados deloscilador armonico, por eso se colocan puntos suspensivos indicando infinitas casillas. Por supuesto, ya no hayrotulos de partıculas en virtud de la indistinguibilidad. En ocasiones, es util sintetizar la notacion escribiendo sololos numeros de los estados que estan ocupados, escribiendo el estado como subındice. Esto con el fin de evitar laescritura de tantos ceros. Por ejemplo en nuestro caso se puede escribir

|ψ〉 =∣∣2(1), 2(5), 1(7)

26.8.1. Propiedades de los kets de ocupacion

Las propiedades mas sobresalientes de estos kets de ocupacion son las siguientes

El producto interno entre dos estados de ocupacion |n1, n2, . . . , nk, . . .〉 y |n′1, n′2, . . . , n′k, . . .〉 esta dado por

⟨n′1, n

′2, . . . , n

′k, . . . |n1, n2, . . . , nk, . . .〉 = δn1,n′

1δn2,n′

2. . . δnk,n′

k. . .

de manera que solo es diferente de cero si los numeros de ocupacion son los mismos para todo k. Para verlo,podemos usar (26.48) o (26.49) y las definiciones (26.32) de S y A, para obtener la expansion de los dos

kets bajo consideracion en la base ortonormal∣∣∣u(1)1 , u

(2)2 , . . . , u

(N)N

⟩. Al hacer el producto interno entre

los kets resultantes se puede ver que si los numeros de ocupacion no son iguales, estos dos kets no puedentener componentes no-nulas simultaneas sobre el mismo vector base. La normalizacion esta garantizada porla introduccion de las constantes de normalizacion cS y cA.

Si las partıculas bajo estudio son bosones, los kets de ocupacion |n1, n2, . . . , nk, . . .〉 son arbitrarios, y portanto, una base ortogonal la constituye un conjunto que barre todas las configuraciones de ocupacion posibles,sometida a la ligadura (26.47). Observemos que si reemplazamos S por su definicion (26.32), en la Ec. (26.48),

aparece al lado derecho de esta ecuacion, una superposicion de estados ortogonales∣∣∣u(1)1 , . . . , u

(N)N

⟩con

coeficientes positivos, ya que no hay cambio de signo bajo intercambios y cS se definio como positivo. Estoindica que los kets |n1, n2, . . . , nk, . . .〉 definidos en (26.48) son no-nulos. Los kets |n1, n2, . . . , nk, . . .〉 expandena ES , y por tanto forman una base de este subespacio puesto que son no-nulos.

Si las partıculas bajo estudio son fermiones, una base del espacio EA de estados fısicos se obtiene escogiendoel conjunto de kets

|n1, n2, . . . , nk, . . .〉 ; ni = 0, 1 (26.51)

Page 609: Mecanica Cuantica: Notas de Clase

26.9. CONSISTENCIA DEL POSTULADO DE SIMETRIZACION CON LOS OTROS POSTULADOS 609

en el cual cada numero de ocupacion es cero o uno. Una vez mas sujeto a la ligadura (26.47). A diferenciadel simetrizador, el antisimetrizador introduce signos positivos para permutaciones pares y negativos parapermutaciones impares. Como vimos en la seccion 26.7.2, dos fermiones identicos no pueden ocupar el mismoestado individual simultaneamente. Esto implica que numeros de ocupacion con ni > 1, anulan el ket (26.49)corrrespondiente. Ahora bien, cuando todos los numeros de ocupacion son cero o uno, el ket (26.51) es no

nulo ya que en tal caso, los kets Pα

∣∣∣u(1)1 , . . . , u(N)N

⟩y Pβ

∣∣∣u(1)1 , . . . , u(N)N

⟩con Pα 6= Pβ son diferentes y

ortogonales. La relacion (26.49) nos da entonces vectores no nulos cuando tomamos kets del tipo (26.51).Estos expanden a EA y puesto que son no-nulos, constituyen una base para EA.

26.9. Consistencia del postulado de simetrizacion con los otros postulados

Debemos verificar que el postulado de simetrizacion no entra en contradiccion con los otros postulados. De-mostraremos que (a) el proceso de medida se puede describir con kets que pertenecen unicamente al subespacioES o EA. (b) Si el estado pertenece inicialmente a uno de los subespacios ES o EA, su evolucion temporal es tal quecontinuara dentro de este subespacio para todo tiempo. En general podremos usar los postulados de la mecanicacuantica totalmente dentro de uno de estos subespacios.

26.9.1. Postulado de simetrizacion y el proceso de medida

El ket |ψ (t)〉 que describe a un estado fısico de N partıculas identicas en el tiempo t, pertenece al subespacioES (EA) si las partıculas son bosones (fermiones). Cuando se mide un observable G, el sistema (de partıculasidenticas) queda preparado en un ket propio |ϕ〉 del observable. Por otro lado, el postulado de simetrizacion medice que el estado |ϕ〉 debe tambien pertenecer al subespacio ES (EA) para el sistema de bosones (fermiones). Portanto, debemos asegurarnos que el proceso de medida no me deja al sistema preparado en un estado fuera de ESo EA.

De momento asumamos que |ϕ〉 pertenece a ES o EA, la amplitud de probabilidad 〈ϕ| ψ (t)〉 involucra a doskets que pertenecen a ES o EA, es decir ambos son estados totalmente simetricos o antisimetricos.

Si el conjunto de medidas es completo (por ejemplo, la medida de cada posicion ri y de las componentes S(i)3

de espın para todas las partıculas), el estado fısico |ϕ〉 es unico dentro de factores constantes. Si el conjunto demedidas es incompleto (por ejemplo, medir solo el espın de las partıculas, o medir solo sobre un subconjunto departıculas), se obtendran varios kets ortogonales fısicos, y las probabilidades asociadas deben sumarse.

En algunos casos es posible especificar el conjunto de medidas sobre el sistema de partıculas identicas, escribien-do el observable en terminos de los observables basicos Ri,Pi,Si. Tomemos un ejemplo concreto. Los siguientesobservables se pueden medir en un sistema de tres partıculas identicas: La posicion del centro de masa RG, elmomento total P, el momento angular total L, el espın total S y la energıa electrostatica de repulsion W

RG =1

3(R1 +R2 +R3) ; P = P1 +P2 +P3 (26.52)

L = L1 + L2 + L3 ; S = S1 + S2 + S3 (26.53)

W =q2

4πε0

[1

|R1 −R2|+

1

|R2 −R3|+

1

|R1 −R3|

](26.54)

de estas expresiones, es claro que los observables asociados a cantidades fısicas que se miden sobre un sistema departıculas identicas, introducen los observables de partıcula individual en forma simetrica. Este hecho provienedirectamente del caracter identico de las partıculas. Por ejemplo, los coeficientes en la superposicion (26.52)asociada a RG son todos iguales, debido a que todas las partıculas tienen la misma masa. Los coeficientes en lasuperposicion (26.54) son todos iguales debido a que todas las partıculas poseen la misma carga. Vemos entoncesque ninguna propiedad fısica se modifica al permutar las N partıculas. En consecuencia, para cualquier observablefısico asociado a un sistema de partıculas identicas, las N partıculas juegan un rol simetrico. Los anteriores

Page 610: Mecanica Cuantica: Notas de Clase

610 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

argumentos son validos tanto para bosones como para fermiones. Matematicamente, un observable fısicoG asociadoaN partıculas identicas debe ser entonces invariante bajo cualquier permutacion Pα de lasN partıculas. De acuerdocon la discusion en la seccion 26.4.4 [ver Ec. (26.36)], esto es equivalente a la condicion de que G debe conmutarcon todas las permutaciones

[G,Pα] = 0 para todo Pα (26.55)

Esto implica que algunos observables para un sistema de partıculas distinguibles, no seran observables paraun sistema de partıculas identicas. Por ejemplo, si tenemos un sistema de dos partıculas identicas, el operadorR1 −R2 no sera un observable, ya que no es invariante ante la permutacion P21 puesto que cambia de signo bajoesta operacion, en realidad una medida de R1 −R2 asume que la partıcula (1) se puede distinguir de la (2). Sinembargo, este mismo operador sı serıa un observable para un sistema de dos partıculas no identicas. Por otraparte, la distancia entre las partıculas |R1 −R2| es claramente un observable valido para dos partıculas identicas(la distancia es invariante ante un intercambio de las partıculas).

La ecuacion (26.55) implica que los subespacios ES y EA son ambos invariantes bajo la accion de un observablefısico G de las partıculas identicas. Si |ψ〉 ∈ EA tenemos que

Pα |ψ〉 = εα |ψ〉

y teniendo en cuenta (26.55) resultaPαG |ψ〉 = GPα |ψ〉 = εαG |ψ〉

por tanto G |ψ〉 tambien pertenece a EA, i.e. G |ψ〉 tambien es completamente antisimetrico. Un argumento similarse sigue si |ψ〉 ∈ ES .

Todas las operaciones que se realizan sobre un observable fısico, tales como la determinacion de sus valoresy vectores propios se pueden aplicar a G enteramente dentro del subespacio ES o EA. Solo se conservan losautovectores de G que pertenecen al subespacio fısico y sus correspondientes valores propios. Vale enfatizar, queesta consistencia esta relacionada con el hecho de que los observables fısicos asociados a partıculas identicas debenser totalmente simetricos (para bosones o fermiones) con respecto a la permutacion de las partıculas.

En general no encontraremos todos los autovalores de G asociados al espacio completo E , cuando nos restrin-gimos al subespacio ES o EA. El postulado de simetrizacion puede entonces excluır algunos valores propios de G,del espectro fısico. Por otro lado, puesto que ES o EA son invariantes bajo la accion de G, todo autovector de Gen ES o EA, es tambien autovector de G en E con el mismo autovalor.

La restriccion de que los observables deben ser simetricos puede llevarnos a la necesidad de reestructurara los observables asociados a ciertas mediciones. Por ejemplo, trataremos de escribir observables asociados a lamedicion simultanea de la posicion de tres partıculas identicas. Los observables usuales R1, R2 y R3 no seranobservables fısicos en este caso, ya que cada uno de ellos no es simetrico bajo permutaciones de las partıculas.Podemos entonces tratar de escribir tres observables totalmente simetricos con base en los cuales se pueda estimarlas posiciones de las tres partıculas. Por ejemplo, se pueden usar los observables

R1 +R2 +R3 ; R1R2 +R2R3 +R3R1 ; R1R2R3

sin embargo, este metodo es mas bien formal, ya que no es viable medir estos observables directamente en unexperimento. Es mas sencillo restringirnos a usar los autoestados fısicos asociados a la medida como se describioen esta seccion.

26.9.2. Postulado de simetrizacion y evolucion temporal

El Hamiltoniano de un sistema de partıculas identicas debe ser un observable fısico y por tanto debe sertotalmente simetrico. Tomemos como ejemplo, el Hamiltoniano del atomo de Helio en donde por simplicidad, solotendremos en cuenta las interacciones electrostaticas

H (1, 2) =P2

1

2me+

P22

2me− 2e2

R1− 2e2

R2+

e2

|R1 −R2|

Page 611: Mecanica Cuantica: Notas de Clase

26.10. CONSECUENCIAS FENOMENOLOGICAS DEL POSTULADO DE SIMETRIZACION 611

los dos terminos cineticos son simetricos debido a que las masas son iguales. Los dos terminos asociados a laatraccion del nucleo son iguales debido a que los dos electrones tienen cargas iguales. Es obvio que cada electrones afectado de la misma manera por tal atraccion. Finalmente, el termino de repulsion entre los dos electrones essimetrico porque ninguno de los dos electrones esta en una posicion privilegiada.

Para un sistema de N partıculas identicas, el Hamiltoniano al igual que cualquier observable fısico asociado apartıculas identicas, debe conmutar con todas las permutaciones de las N partıculas

[H,Pα] = 0 (26.56)

ahora bien, el ket inicial |ψ (t0)〉 debe ser un ket fısico y por tanto debe pertenecer a ES o EA. Es necesario que laevolucion temporal sea tal que |ψ (t)〉 sea un ket fısico para todo tiempo. Es decir, |ψ (t)〉 debe pertenecer a ES oEA para todo tiempo. Escribiremos la ecuacion de Schrodinger en la forma

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 ⇒ |ψ (t+ dt)〉 − |ψ (t)〉

dt=

1

i~H (t) |ψ (t)〉 ⇒

|ψ (t+ dt)〉 =

[1 +

dt

i~H (t)

]|ψ (t)〉

Aplicando Pα a ambos lados y usando (26.56) resulta

Pα |ψ (t+ dt)〉 =[1 +

dt

i~H (t)

]Pα |ψ (t)〉 (26.57)

Si |ψ (t)〉 ∈ EA entonces Pα |ψ (t)〉 = εα |ψ (t)〉, esto junto con la ecuacion (26.57) nos muestran que Pα |ψ (t+ dt)〉 =εα |ψ (t+ dt)〉. Por tanto, si |ψ (t)〉 ∈ EA (i.e. es completamente antisimetrico), entonces |ψ (t+ dt)〉 ∈ EA. Simi-larmente se puede demostrar que la evolucion temporal conserva la simetrıa total. Por tanto, si el ket inicial escompletamente simetrico (antisimetrico) la evolucion temporal via ecuacion de Schrodinger hace que el estado seacompletamente simetrico (antisimetrico) para todo tiempo. La ecuacion de Schrodinger es entonces consistentecon el postulado de simetrizacion.

26.10. Consecuencias fenomenologicas del postulado de simetrizacion

26.10.1. Diferencias entre fermiones y bosones

Hemos visto que el postulado de simetrizacion no restringe la distribucion de los bosones entre los diversosestados cuanticos. En contraste, para los fermiones este postulado prohibe que dos fermiones identicos ocupen elmismo estado cuantico. Este hecho se conoce como principio de exclusion de Pauli, y fue establecido para explicarlas propiedades de los atomos de varios electrones. Sin embargo, en el presente contexto no es estrictamente unprincipio sino una consecuencia del postulado de simetrizacion, y es valido para cualquier sistema de fermionesidenticos, no solo los electrones. Este principio de exclusion (o su ausencia para los bosones) tiene prediccionesespectaculares que han sido confirmadas experimentalmente. Veremos algunos ejemplos mas adelante.

26.10.2. Estado base de un sistema de partıculas identicas independientes

Ya hemos visto que el Hamiltoniano asociado a partıculas identicas (bosones o fermiones) debe ser simetricocon respecto a la permutacion de las partıculas. Asumiremos un sistema no interactuante de partıculas identicas.En tal caso el Hamiltoniano total se escribira como una suma de operadores de una partıcula en la forma

H (1, 2, . . . , N) = h (1) + h (2) + . . .+ h (N)

h (i) es funcion solo de los observables asociados a la partıcula rotulada como (i). La simetrıa total del Hamiltonianorequiere que cada funcion h (i) sea la misma para los N terminos. Para calcular los autovalores y los autovectores

Page 612: Mecanica Cuantica: Notas de Clase

612 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

del Hamiltoniano total, basta con calcular los vectores y valores propios de los operadores individuales h (j) enel espacio E (j) asociado a una partıcula. Por simplicidad asumiremos que el espectro de h (j) es discreto y nodegenerado

h (j)∣∣∣ϕ(j)n

⟩= e(j)n

∣∣∣ϕ(j)n

⟩;∣∣∣ϕ(j)n

⟩∈ E (j)

notese que el ındice (j) es de partıcula y no de degeneracion. Los vectores propios construıdos a priori sonlos productos tensoriales de los vectores de cada partıcula, y el valor propio es la suma de los valores propiosindividuales asociados ∣∣∣ϕ(1)

n1, ϕ(2)

n2. . . , ϕ(N)

nN

⟩=

∣∣∣ϕ(1)n1

⟩⊗∣∣∣ϕ(2)n2

⟩⊗ . . .⊗

∣∣∣ϕ(N)nN

⟩(26.58)

En1,n2,...,nN = e(1)n1+ e(2)n2

+ . . .+ e(N)nN (26.59)

si consideramos un sistema de bosones identicos, los kets anteriores deben ser simetrizados

∣∣ΦSn1,n2,...,nN

⟩= c

N !∑

α=1

∣∣∣ϕ(1)n1, ϕ(2)

n2. . . , ϕ(N)

nN

⟩(26.60)

puede verificarse que el ket descrito por (26.60) es ket propio de H con el mismo valor propio (26.59) del ket sinsimetrizar (26.58). En consecuencia, las energıas (26.59) corresponden a valores reales de la energıa del sistema.En particular si e1 es el valor propio mas pequeno de h (j) (obviamente igual para cada partıcula y por tanto,independiente de j) y si |ϕ1〉 es su vector propio asociado, el estado base del sistema se obtendra cuando los Nbosones identicos esten todos en el estado |ϕ1〉. La energıa y el vector en el estado base seran

E1,1,...,1 = Ne1 ;∣∣∣ϕ(1)

1 , ϕ(2)1 . . . , ϕ

(N)1

Sin embargo, si el sistema de N partıculas identicas es de fermiones, no es posible que las N partıculas estentodas en el mismo estado base |ϕ1〉. Para obtener el estado base del sistema, debe tenerse en cuenta el principiode exclusion de Pauli. Si las energıas se ordenan en forma ascendente

e1 < e2 < . . . < eN

la energıa del estado base de un sistema de N fermiones identicos sera

E1,2,...,N = e1 + e2 + . . .+ eN

y estara descrito por el ket normalizado dado por

∣∣ΦAn1,n2,...,nN

⟩=

1√N !

∣∣∣∣∣∣∣∣∣∣∣∣

∣∣∣ϕ(1)1

⟩ ∣∣∣ϕ(1)2

⟩· · ·

∣∣∣ϕ(1)N

⟩∣∣∣ϕ(2)

1

⟩ ∣∣∣ϕ(2)2

⟩· · ·

∣∣∣ϕ(2)N

......

...∣∣∣ϕ(N)1

⟩ ∣∣∣ϕ(N)2

⟩· · ·

∣∣∣ϕ(N)N

∣∣∣∣∣∣∣∣∣∣∣∣la energıa individual mas alta eN que se encuentra en el estado base se denomina la energıa de fermi del sistema.

Si existe degeneracion gk en los niveles de energıa individuales ek, hay gk estados ortogonales asociados a cadavalor propio. Por tanto, pueden haber hasta gk fermiones identicos con energıa ek (ya que cada uno estarıa en unestado diferente). En tal caso, la energıa de fermi ep es en general menor que eN , y la energıa del sistema en elestado base sera

E1,2,...,p = g1e1 + g2e2 + . . .+ gp−1ep−1 + kpep

sujeto a la ligadura

kp +

p−1∑

i=1

gi = N ; kp ≤ gp

notese que el nivel de fermi podrıa no estar “lleno”: si con kp partıculas (con kp < gp), ya hemos completado lasN partıculas, no todos los estados asociados a ep estaran ocupados por un fermion.

Page 613: Mecanica Cuantica: Notas de Clase

26.11. PREDICCIONES FISICAS DEL POSTULADO DE SIMETRIZACION 613

26.11. Predicciones fısicas del postulado de simetrizacion

En mecanica cuantica, las predicciones fısicas estan relacionadas con probabilidades que se calculan con pro-ductos internos. Veremos que la simetrizacion y antisimetrizacion causa efectos de interferencia cuando tenemospartıculas identicas. No obstante, tambien veremos que en ciertas situaciones, se puede ignorar el postulado desimetrizacion, de modo que las predicciones hechas asumiendo las partıculas como distinguibles no seran muydiferentes de las que se obtienen cuando se tratan como identicas.

Por simplicidad, trabajaremos un sistema de dos partıculas identicas. Asumamos que una de ellas esta en elestado |ϕ1〉 y la otra en el estado |ϕ2〉 ortogonal al anterior, de modo que el estado fısico, viene dado por el ketnormalizado

|ϕ1;ϕ2〉 ≡ 1√2[1 + εP21]

∣∣∣ϕ(1)1 , ϕ

(2)2

ε = +1 (para bosones), ε = −1 (para fermiones)

ahora queremos medir sobre cada partıcula el mismo observable B, que los asociaremos a los observables B (1) yB (2). Pensemos que el espectro de B es discreto y no degenerado

B |ui〉 = bi |ui〉

queremos calcular la probabilidad de encontrar en el proceso de medida el valor bn para una de las partıculas ybm para la otra. Asumiremos primero que bn 6= bm, de manera que los estados propios asociados son ortogonalesentre sı. Bajo estas condiciones, despues de la medicion de los observables, el sistema quedara preparado en elestado fısico normalizado definido por

|un;um〉 ≡1√2[1 + εP21]

∣∣∣u(1)n , u(2)m

la amplitud de probabilidad para obtener las medidas bn y bm estan dadas por

〈un;um |ϕ1;ϕ2〉 =1

2

⟨u(1)n , u(2)m

∣∣∣(1 + εP †

21

)(1 + εP21)

∣∣∣ϕ(1)1 , ϕ

(2)2

⟩(26.61)

usando la hermiticidad y nilpotencia de P21 tenemos que(1 + εP †

21

)(1 + εP21) = (1 + εP21)

2 = 1 + 2εP21 + ε2P 221

(1 + εP †

21

)(1 + εP21) = 2 + 2εP21 (26.62)

sustituyendo (26.62) en (26.61) y poniendo a P21 a actuar sobre el bra, resulta

〈un;um |ϕ1;ϕ2〉 =⟨u(1)n , u(2)m

∣∣∣ (1 + εP21)∣∣∣ϕ(1)

1 , ϕ(2)2

⟩=⟨u(1)n , u(2)m

∣∣∣ ϕ(1)1 , ϕ

(2)2

⟩+ ε

⟨u(1)n , u(2)m

∣∣∣P21

∣∣∣ϕ(1)1 , ϕ

(2)2

〈un;um |ϕ1;ϕ2〉 =⟨u(1)n , u(2)m

∣∣∣ ϕ(1)1 , ϕ

(2)2

⟩+ ε

⟨u(1)m , u(2)n

∣∣∣ ϕ(1)1 , ϕ

(2)2

=⟨u(1)n

∣∣∣ ϕ(1)1

⟩⟨u(2)m

∣∣∣ ϕ(2)2

⟩+ ε

⟨u(1)m

∣∣∣ ϕ(1)1

⟩⟨u(2)n

∣∣∣ ϕ(2)2

〈un;um |ϕ1;ϕ2〉 = 〈un| ϕ1〉 〈um| ϕ2〉+ ε 〈um| ϕ1〉 〈un| ϕ2〉 (26.63)

en el ultimo paso se ha suprimido la numeracion, ya que los espacios son isomorfos de modo que el valor delnumero complejo que se obtiene no depende de la numeracion. La amplitud de probabilidad es entonces una suma(resta) para el caso de dos bosones (fermiones) identicos. Los dos terminos a la derecha de (26.63) pueden serasociados a los diagramas 26.3a y 26.3b.

El resultado (26.63) se puede interpretar en la siguiente forma: Los kets |ϕ1〉 y |ϕ2〉 asociados al estado inicialse pueden conectar a los bras 〈un| y 〈um| asociados al estado final por dos “caminos” diferentes representados

Page 614: Mecanica Cuantica: Notas de Clase

614 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

Figura 26.3: Ilustracion del termino directo y el termino de intercambio asociado a una medida sobre un sistemade dos partıculas identicas.

esquematicamente en las figuras 26.3a y 26.3b. A cada uno de estos “caminos” le podemos asociar una amplitudde probabilidad 〈un| ϕ1〉 〈um| ϕ2〉 y 〈um| ϕ1〉 〈un| ϕ2〉. Estas dos amplitudes interfieren con un signo positivo(negativo) para bosones (fermiones). La probabilidad de encontrar el par de medidas bn y bm es el modulo alcuadrado de esta amplitud

P (bn; bm) = |〈un| ϕ1〉 〈um| ϕ2〉+ ε 〈um| ϕ1〉 〈un| ϕ2〉|2

P (bn; bm) = |〈un| ϕ1〉 〈um| ϕ2〉|2 + |〈um| ϕ1〉 〈un| ϕ2〉|2

+2εRe 〈un| ϕ1〉 〈um| ϕ2〉 〈ϕ1| um〉 〈ϕ2| un〉 (26.64)

es usual llamar a uno de los terminos de la derecha en la Ec. (26.63) [por ejemplo el termino asociado a la figura26.3a], el termino directo, y al otro se le denomina termino de intercambio. Es en realidad una cuestion deconvencion a cual llamamos termino directo y a cual termino de intercambio.

Vamos a considerar ahora el caso en el cual queremos examinar la probabilidad de que se obtenga el mismovalor propio bn, para ambas partıculas. Como no hay degeneracion, los dos estados finales seran identicos. En elcaso de fermiones la probabilidad es cero puesto que estos procesos estarıan prohibidos por el principio de exclusionde Pauli. Para el caso de bosones, el estado simetrizado y normalizado sera

|un;un〉 =∣∣∣u(1)n , u(2)n

la amplitud tendra entonces la forma

〈un;un |ϕ1;ϕ2〉 =1√2

⟨u(1)n , u(2)n

∣∣∣ (1 + P21)∣∣∣ϕ(1)

1 , ϕ(2)2

⟩=

1√2

⟨u(1)n , u(2)n

∣∣∣ ϕ(1)1 , ϕ

(2)2

⟩+⟨u(1)n , u(2)n

∣∣∣P21

∣∣∣ϕ(1)1 , ϕ

(2)2

〈un;un |ϕ1;ϕ2〉 =1√2

⟨u(1)n , u(2)n

∣∣∣ ϕ(1)1 , ϕ

(2)2

⟩+⟨u(1)n , u(2)n

∣∣∣ ϕ(1)1 , ϕ

(2)2

⟩=

√2⟨u(1)n , u(2)n

∣∣∣ ϕ(1)1 , ϕ

(2)2

〈un;un |ϕ1;ϕ2〉 =√2 〈un| ϕ1〉 〈un| ϕ2〉

de modo que la probabilidad esta dada por

P (bn, bn) = 2 |〈un| ϕ1〉|2 |〈un| ϕ2〉|2 (26.65)

notese que no hay termino de interferencia en contraste con la ecuacion (26.64). El factor de dos que aparece en(26.65) esta relacionado con el hecho de que el termino directo coincide con el de intercambio en este caso.

Generalizando, para un sistema de N partıculas, hay en general N !, terminos de intercambio que se adicionano sustraen en la amplitud de probabilidad. En el caso de bosones, el numero de intercambios es menor cuandoalgunas partıculas estan en el mismo estado.

La figura 26.4, ilustra los terminos de intercambio para tres partıculas identicas que estan caracterizadas porlos estados individuales iniciales |ϕ1〉 , |ϕ2〉 , |ϕ3〉, y para las cuales asumimos que los valores propios individualesbn1 , bn2 , bn3 que se obtienen en el proceso de medida son todos diferentes. Estos seis terminos (N ! = 3!) ilustranlos posibles “caminos”, algunos de los cuales contribuyen con signo positivo (caminos que se obtienen a partir del

Page 615: Mecanica Cuantica: Notas de Clase

26.11. PREDICCIONES FISICAS DEL POSTULADO DE SIMETRIZACION 615

Figura 26.4: Ilustracion del termino directo y los terminos de intercambio asociados a una medida sobre un sistemade tres partıculas identicas.

termino directo con un numero par de transposiciones de los estados iniciales o finales) otros contribuyen con signoε dependiendo de si son bosones o fermiones (cuando el numero de transposiciones para obtener el intercambioes impar). Si algunos de los estados finales coinciden, habra algunos terminos de intercambio iguales y tendremosmenos sumandos en la amplitud de probabilidad.

26.11.1. Predicciones sobre partıculas aparentemente identicas

Una manera de examinar que tan intrınseco es el postulado de simetrizacion, es realizando un experimento delsiguiente tipo: Supongamos que tenemos dos partıculas de diferente naturaleza. Escogeremos un estado inicial delsistema en el producto tensorial (el cual se supone que describe a un sistema fısico en este caso)

|ψ〉 =∣∣∣ϕ(1), χ(2)

consideremos un instrumento de medida que no puede distinguir a las dos partıculas. Por ejemplo, podrıamostener un instrumento que solo mide carga electrica y el sistema consiste en un electron y un muon (que poseen lamisma carga). Otro ejemplo, serıa un instrumento que solo mide masa y el sistema fısico consiste de un electrony un positron (que tiene la misma masa pero carga opuesta al electron).

Al obtener los resultados bn y bm no sabemos si bn esta asociado a la partıcula (1) o a la partıcula (2). Los

dos estados∣∣∣u(1)n , u

(2)m

⟩y∣∣∣u(1)m , u

(2)n

⟩representan en este caso a diferentes estados fısicos, pero corresponden a los

mismos resultados de la medida antes descrita. Puesto que son ortogonales, debemos adicionar las probabilidadesasociadas, las cuales dan

P ′ (bn; bm) =∣∣∣⟨u(1)n , u(2)m

∣∣∣ϕ(1), χ(2)⟩∣∣∣

2+∣∣∣⟨u(1)m , u(2)n

∣∣∣ϕ(1), χ(2)⟩∣∣∣

2

P ′ (bn; bm) = |〈un |ϕ〉|2 |〈um |χ〉|2 + |〈um |ϕ〉|2 |〈un |χ〉|2 (26.66)

comparando las probabilidades (26.66) y (26.64) podemos ver que hay una diferencia significativa en las predic-ciones fısicas sobre partıculas que son “identicas para nuestro experimento” pero que no son “intrınsecamenteidenticas”, con respecto al caso de partıculas que sı son intrınsecamente identicas. Notese que esto tiene que ver

con el hecho de que para partıculas distinguibles los kets∣∣∣u(1)n , u

(2)m

⟩y∣∣∣u(1)m , u

(2)n

⟩representan diferentes estados

fısicos, en tanto que para partıculas identicas representan el mismo estado fısico. Por esta razon, las probabilidadesse suman en el caso de partıculas distinguibles, en tanto que para partıculas indistinguibles lo que se suman sonlas amplitudes (razon por la cual surgen interferencias en el ultimo caso). Ver discusion en la seccion 5.11, pag.240.

Page 616: Mecanica Cuantica: Notas de Clase

616 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

Veamos ahora el caso en el cual las dos partıculas diferentes arrojan el mismo resultado de la medida bn, encuyo caso la amplitud de probabilidad y la probabilidad nos dan

A′ (bn; bn) =⟨u(1)n , u(2)n

∣∣∣ϕ(1), χ(2)⟩= 〈un |ϕ〉 〈un |χ〉

P ′ (bn; bn) = |〈un |ϕ〉|2 |〈un |χ〉|2 (26.67)

Comparando con la Ec. (26.65) asociada a partıculas intrınsecamente identicas, podemos notar la diferencia conrespecto a las predicciones para partıculas aparentemente identicas.

26.11.2. Colision elastica de dos partıculas identicas

Examinaremos el problema de la colision elastica de dos partıculas identicas en el sistema de referencia centrode masa. Por simplicidad ignoraremos el efecto del espın. Sin embargo, el calculo sera valido siempre que lainteraccion no dependa del espın, y si las dos partıculas estan inicialmente en el mismo estado de espın.

En este caso debemos tomar en cuenta la evolucion temporal, pero veremos que el termino de intercambioentra de una manera muy similar al caso de medidas que no involucran evolucion temporal.

Figura 26.5: Colision elastica entre dos partıculas identicas vista desde el sistema de referencia del centro de masa.(a) Momentos de las dos partıculas en el estado inicial. (b) Momentos de las dos partıculas en el estado final (justodespues de la medicion).

La Fig. 26.5a, muestra el estado inicial en el cual las dos partıculas se acercan la una a la otra con momentosopuestos ±pu3, donde hemos definido la direccion X3 a lo largo de los momentos. El ket fısico inicial |ψi〉 estaradescrito entonces por la expresion

|ψi〉 =1√2(1 + εP21)

∣∣∣pu(1)3 ,−pu(2)

3

⟩(26.68)

|ψi〉 es el estado del sistema en el tiempo inicial t0 antes de la colision. Describiremos la evolucion temporal a travesdel operador lineal U (t, t′) conocido como operador evolucion temporal (ver seccion 7.1, Pagina 260). Si definimost1 como el tiempo en el cual se ejecutara la medida, tendremos que para este tiempo el estado del sistema justoantes de la medida sera

|ψ (t1)〉 = U (t1, t0) |ψi〉 (26.69)

puesto que el Hamiltoniano conmuta con P21 y el operador U (t, t′) solo depende del Hamiltoniano y del tiempo,se tiene que este operador tambien conmuta con P21

[U(t, t′), P21

]= 0 (26.70)

este fenomeno ya fue descrito en la seccion 26.2, Pag. 591. Calcularemos la amplitud de probabilidad de detectaruna partıcula en la direccion n (recordemos que por conservacion de momento, la otra irıa en direccion −n).Puesto que la colision es elastica, los modulos de los momentos no cambian y las partıculas en el estado cuya

Page 617: Mecanica Cuantica: Notas de Clase

26.12. SITUACIONES EN LAS CUALES SE PUEDE IGNORAR EL POSTULADO DE SIMETRIZACION617

probabilidad queremos evaluar tendran momentos ±pn. El ket final fısico |ψf 〉 (justo despues de la medida) estaraentonces dado por

|ψf 〉 =1√2(1 + εP21)

∣∣∣pn(1),−pn(2)⟩

(26.71)

la amplitud de probabilidad deseada se obtiene aplicando las Ecs. (26.68, 26.69, 26.71)

〈ψf |ψ (t1)〉 = 〈ψf |U (t1, t0) |ψi〉 =1√2〈ψf |U (t1, t0) (1 + εP21)

∣∣∣pu(1)3 ,−pu(2)

3

〈ψf |ψ (t1)〉 =1

2

⟨pn(1),−pn(2)

∣∣∣(1 + εP †

21

)U (t1, t0) (1 + εP21)

∣∣∣pu(1)3 ,−pu(2)

3

⟩(26.72)

utilizando las propiedades de P21 y la Ec. (26.70) resulta

(1 + εP †

21

)U (t1, t0) (1 + εP21) = (1 + εP21) (1 + εP21)U (t1, t0)

=(1 + 2εP21 + P 2

21

)U (t1, t0) = (1 + 2εP21 + 1)U (t1, t0)(

1 + εP †21

)U (t1, t0) (1 + εP21) = 2 (1 + εP21)U (t1, t0) = 2

(1 + εP †

21

)U (t1, t0) (26.73)

sustituyendo (26.73) en (26.72) tenemos

〈ψf |ψ (t1)〉 =⟨pn(1),−pn(2)

∣∣∣(1 + εP †

21

)U (t1, t0)

∣∣∣pu(1)3 ,−pu(2)

3

〈ψf |ψ (t1)〉 =⟨pn(1),−pn(2)

∣∣∣U (t1, t0)∣∣∣pu(1)

3 ,−pu(2)3

+ε⟨−pn(1), pn(2)

∣∣∣U (t1, t0)∣∣∣pu(1)

3 ,−pu(2)3

⟩(26.74)

En la Ec. (26.74) vemos de nuevo que hay un termino directo y uno de intercambio en la amplitud. Diagramati-camente, estos corresponden a los procesos que se ilustraron en las figuras 26.2a y 26.2b, de la Pagina 592. Denuevo, las amplitudes de probabilidad asociadas a estos dos terminos se suman o restan dependiendo de si laspartıculas son fermines o bosones. La presencia de los dos terminos genera un termino de interferencia cuandorealizamos el modulo al cuadrado de la expresion (26.74). Se puede notar que si cambiamos n por −n, la expresion(26.74) se multiplica por ε, de modo que la probabilidad permanece invariante. Esto es de esperarse ya que la Fig.26.5b nos muestra claramente que el cambio n → −n, serıa indistinguible en el proceso.

26.12. Situaciones en las cuales se puede ignorar el postulado de simetriza-

cion

Si el postulado de simetrizacion fuera siempre esencial, serıa imposible describir a un sistema de partıculasidenticas con un numero restringido de partıculas, ya que habrıa que incluır todas las partıculas identicas a ellasen el universo para simetrizar el sistema. Veremos que hay situaciones en las cuales el postulado de simetrizacionse puede ignorar, considerando a las partıculas como si fueran de distinta naturaleza, y obtener las mismaspredicciones. La discusion de la seccion 26.11, nos muestra que esto ocurre cuando los terminos de intercambiointroducidos por el postulado de simetrizacion son nulos o despreciables. Veremos algunos ejemplos

26.12.1. Partıculas identicas ubicadas en regiones espaciales distintas

Es comun que las funciones de onda de dos o mas partıculas no se traslapen significativamente. Por ejemplo silas funciones de onda de dos partıculas (en una dimension por simplicidad) son simetricas y tienen anchos ∆x1 y∆x2, tales funciones no se traslapan de manera significativa si los centros de las funciones estan separados por unadistancia mucho mayor que ∆x1 + ∆x2. En la practica hay por supuesto un traslapamiento no nulo a todas las

Page 618: Mecanica Cuantica: Notas de Clase

618 CAPITULO 26. SISTEMAS CUANTICOS DE PARTICULAS IDENTICAS

distancias, ya que las funciones de onda usualmente no se anulan exactamente en ninguna region del espacio. Sinembargo, cuando se cumple la condicion antes mencionada se pueden trazar dos (o mas) regiones disyuntas en lascuales esta casi toda la probabilidad de ubicar a cada partıcula. En tal caso las partıculas se pueden asumir comolocalizadas6 en cada region ∆1 y ∆2. Por simplicidad ignoraremos los efectos de espın. Consideremos entoncesdos partıculas identicas una de ellas en el estado individual |ϕ1〉 y la otra en el estado individual |ϕ2〉. Vamos asuponer el caso ideal en el cual la funcion de onda ϕ1 (r) es exactamente nula por fuera de la region ∆1 y la funcionde onda ϕ2 (r) es exactamente nula por fuera de ∆2. En tal sentido podemos “rastrear” a las partıculas y decircategoricamente que la partıcula rotulada como (1) (por convencion) esta dentro de la region ∆1, y la rotuladacomo (2) esta dentro de la region ∆2. La ausencia de traslapamiento de las funciones de onda nos lleva a unasituacion similar a la de la mecanica clasica y es de esperarse que el postulado de simetrizacion sea innecesario enestas circunstancias.

Pensemos ahora en medir un observable relacionado con una de las partıculas. Debemos colocar el aparatode medida de manera que no pueda registrar lo que ocurre digamos en el dominio ∆2. La medida solo estararelacionada entonces con la partıcula dentro de la region ∆1 [rotulada como (1) por convencion].

Ahora imaginemos una medida asociada a las dos partıculas simultaneamente, pero realizadas por dos instru-mentos de medida diferentes, uno que no es sensible a los fenomenos que ocurren dentro de ∆1 y otro que no essensible a lo que ocurre dentro de ∆2. Por simplicidad asumamos que los autoestados asociados a la medida sondiscretos y no-degenerados. Sean b1 y b2 las cantidades fısicas que se obtienen para cada partıcula, y sean |u1〉 y|u2〉 los estados individuales (vectores propios asociados a b1 y b2) en que queda preparada cada partıcula luegode las medidas dentro de ∆1 y ∆2 respectivamente. Ahora bien, la disposicion espacial de los instrumentos demedida implica que

ui (r) = 〈r |ui〉 = 0 si r ∈ ∆j ; i, j = 1, 2 , i 6= j

de modo que las funciones justo despues de la medida estan localizadas en los mismos dominios ∆1 y ∆2 que lasfunciones justo antes de la medida. Esto implica que las funciones de onda u1 y ϕ2 no se traslapan, lo mismoocurre con las funciones u2 y ϕ1. En consecuencia

〈u1 |ϕ2〉 =∫u∗1 (r) ϕ2 (r) dV =

∆1

u∗1 (r) ϕ2 (r) dV +

∆2

u∗1 (r) ϕ2 (r) dV +

∆u∗1 (r) ϕ2 (r) dV

donde ∆ es la region complementaria entre ∆1 y ∆2. En la region ∆ ambas funciones de onda se anulan, en ∆1

se anula ϕ2 (r) y en ∆2 se anula u1 (r), de manera que cada integral es nula. De una forma similar podemos verque 〈u2 |ϕ1〉 se anula. Tenemos entonces

〈u1 |ϕ2〉 = 〈u2 |ϕ1〉 = 0 (26.75)

ahora bien, empleando el postulado de simetrizacion la amplitud de probabilidad de obtener los resultados b1 yb2 viene dada por la Ec. (26.63)

A (b1; b2) = 〈u1;u2 |ϕ1;ϕ2〉 = 〈u1| ϕ1〉 〈u2| ϕ2〉+ ε 〈u2| ϕ1〉 〈u1| ϕ2〉

pero de acuerdo con (26.75) el termino de intercambio es nulo de modo que

A (b1; b2) = 〈u1| ϕ1〉 〈u2| ϕ2〉

y recordando que el termino de intercambio es el termino que agrega el postulado de simetrizacion, vemos queel resultado es el mismo que si hubieramos ignorado dicho postulado. Por tanto, bajo ciertas circunstancias esposible estudiar las partıculas como si fuesen de diferente naturaleza. En particular, si tenemos un conjunto deN partıculas identicas suficientemente alejadas de cualquier otra partıcula identica adicional, podemos aplicar elpostulado de simetrizacion a este sistema restringido de N partıculas identicas, obteniendo resultados correctos.

6Estamos asumiendo las partıculas como localizadas en dos o mas regiones disyuntas. Esto no implica que cada partıcula este enun autoestado de posicion |ri〉 (ni siquiera aproximadamente), ya que la localizacion es en regiones finitas (y no en puntos), cuya unicacondicion es que sean disyuntas.

Page 619: Mecanica Cuantica: Notas de Clase

26.12. SITUACIONES EN LAS CUALES SE PUEDE IGNORAR EL POSTULADO DE SIMETRIZACION619

En el estado inicial hemos supuesto funciones de onda que no se traslapan, ademas hemos definido el estadodel sistema especificando dos estados de partıcula individual. Podemos preguntarnos si despues de que el sistemaevoluciona temporalmente aun es posible estudiar a una de las partıculas e ignorar la otra. Para ello no soloes necesario que las dos partıculas permanezcan en regiones distintas del espacio, tambien se requiere que nointeractuen. Incluso para partıculas de diferente naturaleza, la interaccion introduce correlaciones y el vector deestado del sistema completo ya no se puede escribir como el producto tensorial de dos estados asociados a cadapartıcula individual (ver seccion 6.1, Pag. 244).

Vale enfatizar que el hecho de que podamos ignorar el postulado de simetrizacion cuando apartamos suficien-temente las partıculas, es una condicion esencial para poder definir un sistema aislado de partıculas identicas enmecanica cuantica.

26.12.2. Identificacion de partıculas por su direccion de espın

Consideremos una colision elastica de dos partıculas con espın 1/2 (por ejemplo dos electrones), y asumamosque la interaccion no depende del espın, de modo que los estados de espın de las dos partıculas se conservan en elproceso. Si los estados de espın de las dos partıculas son ortogonales entre sı, tales estados serviran para distinguirentre las dos partıculas para todo tiempo, como si las partıculas fueran de distinta naturaleza.

Para verlo, usaremos el calculo realizado en la seccion 26.11.2, agregando apropiadamente los estados de espın.El ket fısico inicial (26.68) junto con las variables de espın se escribira por ejemplo en la forma

|ψi〉 =1√2(1− P21)

∣∣∣pu(1)3 , (+)(1) ;−pu(2)

3 , (−)(2)⟩

(26.76)

donde los sımbolos + y − indican espın arriba y abajo respectivamente. El estado final (26.71) con las variablesde espın se escribira como

|ψf 〉 =1√2(1− P21)

∣∣∣pn(1), (+)(1) ;−pn(2), (−)(2)⟩

(26.77)

ahora bien, si la interaccion es independiente del espın, entonces el Hamiltoniano H y por tanto el operadorevolucion temporal seran independientes de las variables de espın. En consecuencia el operador U (t1, t0) no puedecambiar las variables de espın de un ket o un bra. Esto implica que

⟨−pn(1), (−)(1) ; pn(2), (+)(2)

∣∣∣U (t1, t0)∣∣∣pu(1)

3 , (+)(1) ;−pu(2)3 , (−)(2)

⟩= 0 (26.78)

ya que U (t1, t0) no cambia los estados de espın de modo que estos continuan siendo ortogonales. La Ec. (26.78)implica que el termino de intercambio en la Ec. (26.74) se anula, quedando

〈ψf |ψ (t1)〉 =⟨pn(1), (+)(1) ;−pn(2), (−)(2)

∣∣∣U (t1, t0)∣∣∣pu(1)

3 , (+)(1) ;−pu(2)3 , (−)(2)

⟩(26.79)

Se obtiene entonces el mismo resultado si tratamos a las dos partıculas como diferentes, es decir si no antisimetri-zamos los kets inicial y final, y si asociamos el ındice (1) con el estado de espın |+〉 y el ındice (2) con el estadode espın |−〉. Esta argumentacion deja de ser valida si U (t1, t0) [o equivalentemente el Hamiltoniano], dependende variables de espın.

Page 620: Mecanica Cuantica: Notas de Clase

Capıtulo 27

Atomos de muchos electrones yaproximacion de campo central

El estudio del atomo de hidrogeno es relativamente simple debido a que es un atomo con un solo electron. Porun lado, esto permite reducir el problema a un problema de dos cuerpos desacoplados en donde solo la dinamica deun cuerpo es no-trivial y este ultimo esta sometido a una fuerza central. Adicionalmente, el principio de exclusionde Pauli no es relevante. En este capıtulo se estudiaran atomos de muchos electrones para los cuales el problemaes mucho mas complejo debido a que incluso en el sistema de referencia del centro de masa, el problema continuasiendo acoplado (no se puede reducir al problema de varias partıculas imaginarias desacopladas), y el principio deexclusion de Pauli juega un papel esencial ya que tenemos Z fermiones identicos (electrones).

Consideremos un atomo de Z electrones. Puesto que el nucleo es mucho mas masivo que los electrones, vamosa despreciar la dinamica de los nucleos y asumiremos que la posicion de este coincide con la posicion del centrode masa del sistema. En lo que sigue no consideraremos los efectos relativistas y en particular no incluiremos losterminos de espın. El Hamiltoniano que describe el movimiento de los Z electrones vendra dado por

H =Z∑

i=1

P2i

2me−

Z∑

i=1

Ze2

Ri+Z−1∑

i=1

Z∑

j=i+1

e2

|Ri −Rj |; e2 ≡ q2

4πε0(27.1)

los electrones se han numerado arbitrariamente de 1 a Z. El primer termino en el Hamiltoniano es la energıacinetica total del sistema de Z electrones, el segundo describe la atraccion que el nucleo ejerce sobre cada electrondel sistema. Finalmente, el tercer termino se refiere a la repulsion de los electrones entre sı. Notese que la suma enel tercer termino contiene Z (Z − 1) /2 sumandos que corresponden a todos los pares posibles de electrones. EsteHamiltoniano es simetrico bajo el intercambio i↔ j como lo requiere el postulado de simetrizacion.

Notese que en ausencia del tercer termino en (27.1), el Hamiltoniano queda

Ha =

Z∑

i=1

P2i

2me−

Z∑

i=1

Ze2

Ri

para este Hamiltoniano de partıculas no interactuantes, pueden determinarse con facilidad sus kets y valorespropios. Como se discutio en el ejemplo 6.1, Pag. 246, en este caso el problema se desacopla. Calculando los

valores propios E(i)ni y kets propios

∣∣∣ψ(i)ni

⟩para el operador Hi asociado a cada valor de i

Hi =P2i

2me− Ze2

Ri

se puede construir un conjunto de kets y valores propios de H0 en la forma

En =Z∑

i=1

E(i)ni ; |ψn〉 =

∣∣∣ψ(1)n1

⟩⊗∣∣∣ψ(2)n2

⟩⊗∣∣∣ψ(Z)nZ

620

Page 621: Mecanica Cuantica: Notas de Clase

27.1. APROXIMACION DE CAMPO CENTRAL 621

y solo resta antisimetrizar el producto tensorial para cumplir con el postulado de simetrizacion. Sin embargo,la introduccion de la interaccion hace que este desacople ya no sea posible. A priori podrıa pensarse en trataral termino de interaccion como una perturbacion. No obstante, es de esperarse que la distancia relativa entreelectrones este en promedio en el mismo orden de magnitud que la distancia promedio entre cada electron y elnucleo. El cociente entre el termino de interaccion repulsiva y el de atraccion hacia el nucleo tendra el siguienteorden de magnitud

‖Hnuc‖ =

Z∑

i=1

Ze2

Ri≈ 1

〈R〉Z∑

i=1

Ze2 ≈ Z2e2

〈R〉

‖Hint‖ =Z−1∑

i=1

Z∑

j=i+1

e2

|Ri −Rj |≈ 1

〈|Ri −Rj |〉Z−1∑

i=1

Z∑

j=i+1

e2 ≈ 1

〈R〉Z (Z − 1) e2

2∥∥∥∥Hint

Hnuc

∥∥∥∥ ≈ (Z − 1)

2Z

este cociente varıa entre 1/4 para Z = 2, y 1/2 para Z ≫ 1. Por tanto, ambos Hamiltonianos son del mismo ordende magnitud, de modo que una tratamiento perturbativo escasamente funciona en forma muy aproximada (y pococonfiable) para el atomo de Helio con Z = 2. Para atomos de muchos electrones la aproximacion perturbativaserıa aun peor. Por esta razon debemos recurrir a metodos alternativos. Uno de los mas utilizados es la llamadaaproximacion de campo central, que describiremos a continuacion.

27.1. Aproximacion de campo central

Para desarrollar el metodo recurriremos a una imagen semi-clasica. Un electron dado (i), se mueve bajo lainfluencia repulsiva de los otros Z − 1 electrones que compensan parcialmente la interaccion atractiva del nucleo.En esta aproximacion, se considera que el electron (i) se mueve bajo la influencia de un potencial que solodepende de su posicion ri que tiene en cuenta a la fuerza atractiva nuclear y al efecto promedio de los electronesrestantes. Podemos adicionalmente hacer la suposicion de que dicho potencial solo depende de la magnitud deri. Denotando este potencial como Vc (ri), esta suposicion adicional implica que la fuerza resultante es central, almenos en promedio. Por esta razon hablamos de una aproximacion de campo central. Esta aproximacion estaignorando efectos tales como el hecho de que el movimiento del electron (i) influye sobre la distribucion electronicarestante, cambiando a su vez al potencial en el cual esta inmerso el electron (i), es decir hay una correlacion entreel electron en cuestion y los electrones restantes. Por otro lado, la interaccion no es exactamente central. Porejemplo, un electron muy cercano tendra una interaccion dominante con respecto a los otros, y la repulsion noes en general colineal con la fuerza de atraccion del nucleo, en cuyo caso la suma vectorial no corresponde a unafuerza central. Sin embargo, en esta imagen clasica (ya que implıcitamente hemos supuesto los electrones comolocalizados), es razonable una aproximacion de campo central si tomamos un promedio sobre un tiempo muchomayor al periodo de revolucion de los electrones.

En un escenario cuantico, los electrones ya no estan localizados y la imagen de una nube electronica distribuıdapor todo el espacio hace que la aproximacion de campo central funcione mejor que en el escenario clasico. Ya noes necesario tomar un promedio en el tiempo para que la aproximacion central sea razonable. El promedio sobrela distribucion espacial puede dar cuenta de esta aproximacion.

Page 622: Mecanica Cuantica: Notas de Clase

622 CAPITULO 27. ATOMOS DE MUCHOS ELECTRONES Y APROXIMACION DE CAMPO CENTRAL

Para tener en cuenta la anterior discusion escribiremos el Hamiltoniano (27.1) en la forma

H =

Z∑

i=1

P2i

2me+

Z∑

i=1

Vc (Ri)−Z∑

i=1

Vc (Ri)−Z∑

i=1

Ze2

Ri+

Z−1∑

i=1

Z∑

j=i+1

e2

|Ri −Rj |H = H0 +W (27.2)

H0 ≡Z∑

i=1

P2i

2me+

Z∑

i=1

Vc (Ri) , W ≡ −Z∑

i=1

Vc (Ri)−Z∑

i=1

Ze2

Ri+

Z−1∑

i=1

Z∑

j=i+1

e2

|Ri −Rj |(27.3)

las Ecs. (27.2, 27.3) son validas para cualquier valor de Vc (Ri), de modo que no determinan a dicho potencial.Sin embargo, una escogencia adecuada de Vc (Ri), sera una en la cual |W | ≪ |H0|, de manera que W se puedatratar como una perturbacion. H0 serıa el Hamiltoniano no perturbado, que se resuelve con facilidad dado quees un Hamiltoniano de partıculas independientes. Bastara con resolver el problema de valores propios de unHamiltoniano de un electron

Hb ≡P2

2me+ Vc (R) (27.4)

La determinacion de un potencial Vc (Ri) optimo es un problema muy complejo, debido a la correlacion entreel electron para el cual se evalua el potencial y la nube electronica restante. La idea es llegar a una solucionautoconsistente, es decir que las funciones de onda que se determinan con Vc (Ri) deben predecir una distribucionde carga que reconstituya al mismo potencial (al menos aproximadamente).

Si bien la determinacion del potencial Vc (r) es muy compleja, un analisis cualitativo nos muestra como debeser el comportamiento asintotico de Vc (r). Para valores muy pequenos de r, el electron (i) esta dentro de la nubeelectronica creada por los otros electrones de modo que solo “siente” el potencial atractivo debido al nucleo1. Porotro lado para r muy grande, el electron (i) esta esencialmente por fuera de la nube electronica formada por lacontribucion de los Z− 1 electrones restantes. En este caso el electron “siente” el equivalente a una carga puntualsituada en el origen igual a la suma algebraica de la carga del nucleo mas la de la nube de (Z − 1) electrones.Podemos entonces resumir el comportamiento asintotico de la siguiente manera

Vc (r) ≃ −e2

rpara r grande (27.5)

Vc (r) ≃ −Ze2

rpara r pequeno (27.6)

Para valores intermedios de r se requiere la determinacion completa del potencial. La Fig. 27.1, muestra unpotencial tıpico de Vc (r) descrito por la lınea contınua junto con las lıneas asintoticas (lıneas punteadas) definidaspor las Ecs. (27.5, 27.6). Esta figura muestra efectivamente que el potencial tiende a la funcion (27.5) para rgrande y a la funcion (27.6) para r pequeno.

Ası mismo podemos extraer informacion cualitativa del espectro. Puesto que Vc (r) es central, es valida toda ladiscusion realizada en el capıtulo 12. En particular, este problema posee las degeneraciones esenciales propias de lanaturaleza central de la interaccion [ver seccion 12.6.1, Pag. 354], de manera que los autovalores del Hamiltoniano(27.4) dependen de los numeros cuanticos n y l, pero no del numero cuantico m. Puesto que Vc (r) no es en generalcoulombiano, no estaran presentes las degeneraciones accidentales propias de este potencial [ver seccion 13.6, Pag.368]. l caracteriza al valor propio de L2 y n es la suma del numero cuantico l mas el numero cuantico radial k quese introdujo al resolver la ecuacion radial para un l dado [ver Ecs. (12.37), Pag. 352]. Los numeros cuanticos n yl son enteros (recordemos que no hemos introducido el espın), y satisfacen la condicion

0 ≤ l ≤ n− 1 (27.7)

1En una imagen semi-clasica, si pensamos que el electron (i) (asumido como puntual) esta inmerso en una nube electronica esferi-camente simetrica, los “cascarones externos” al electron (i) no contribuyen al campo. Solo contribuye la “carga neta” de la nubeelectronica interna, es decir la nube localizada entre 0 ≤ r < ri, siendo ri la posicion del electron en cuestion. Si ri es mucho menorque el radio de Bohr, podemos despreciar la fraccion de carga electronica que esta en tal intervalo radial, comparada con la carga delnucleo.

Page 623: Mecanica Cuantica: Notas de Clase

27.1. APROXIMACION DE CAMPO CENTRAL 623

Figura 27.1: Perfil tıpico del potencial Vc (r) como funcion de r. La lınea contınua representa el perfil comple-to de este potencial, y las lıneas punteadas son las funciones definidas en las Ecs. (27.5, 27.6) que definen elcomportamiento asintotico de dicho potencial.

Para un valor dado de l, las energıas se incrementan con n

En,l > En′,l si n > n′ (27.8)

Por otro lado, para un valor fijo de n, la energıa es mas baja cuando el autoestado esta asociado a una capa masprofunda. Es decir, cuando la densidad de probabilidad del electron en la vecindad del nucleo es mayor, en estecaso el efecto de apantallamiento debido a la nube electronica es muy pequeno como ya se discutio. Las energıasEn,l asociadas con el mismo valor de n se pueden ordenar en el orden en el cual se aumenta el momento angular

En,0 < En,1 < En,2 < . . . < En,n−1 (27.9)

Podemos entender la jerarquıa (27.9) teniendo en cuenta que en un analogo clasico un valor menor de l (parael mismo n) significa menor parametro de impacto, de modo que el electron estarıa en una capa mas profunda.Ocurre que en general la jerarquıa de los estados es aproximadamente la misma para todos los atomos. Si bienlos valores especıficos de las energıas dependen de Z. La Fig. 27.2 muestra esta jerarquıa e ilustra la degeneracionesencial de orden 2 (2l + 1), donde el factor de 2 se debe al espın. Los estados dentro del mismo corchete esta muycercanos el uno al otro y de hecho para algunos atomos practicamente coinciden, dentro de estos estados muycercanos las posiciones relativas pueden variar de un atomo a otro. Es importante mencionar que esta figura solomuestra posiciones relativas de los estados pero no brinda ninguna informacion sobre los valores especıficos de lasenergıas.

Hay diferencias notables con respecto al espectro del atomo de Hidrogeno. Esto se deriva del hecho de que enel presente contexto la energıa depende de los numeros cuanticos n y l. Esto hace que el orden de los estados seadiferente. Por ejemplo, la Fig. 27.2 muestra que la capa 4s tiene una energıa ligeramente menor que la de la capa3d (en el atomo de Hidrogeno es al contrario puesto que la energıa solo depende de n), esto tiene que ver con quela funcion de onda 4s es “mas penetrante” (i.e. pertenece a una capa mas profunda) debido a que pertenece aun menor momento angular. Inversiones similares se ven entre otras capas. Esto nos muestra la importancia delefecto repulsivo entre los electrones.

Page 624: Mecanica Cuantica: Notas de Clase

624 CAPITULO 27. ATOMOS DE MUCHOS ELECTRONES Y APROXIMACION DE CAMPO CENTRAL

Figura 27.2: Representacion de la posicion relativa de los niveles de energıa electronicos en un potencial centraldel tipo Vc (r). La degeneracion de cada nivel se indica en parentesis. Los niveles dentro de un corchete estan muycercanos entre sı. Al lado derecho se escriben los sımbolos de los atomos para los cuales la capa electronica queaparece en la misma lınea corresponde a la capa mas externa ocupada en el estado base.

27.2. Configuraciones electronicas de los atomos

En la aproximacion de campo central, despreciamos la contribucion de la perturbacion W en las Ecs. (27.2,27.3) y calculamos los autoestados del Hamiltoniano H0 descrito por dichas ecuaciones. Puesto que los autoestadossurgen de la antisimetrizacion del producto tensorial de las soluciones de partıcula individual, tales autoestadosestan descritos por un determinante de Slater. El estado base del atomo se obtiene cuando los Z electronesocupan los estados de energıa mas bajos compatibles con el principio de exclusion de Pauli. El maximo numero deelectrones que puede tener un nivel de energıa dado En,l es la degeneracion 2 (2l + 1) de dicho nivel. El conjuntode estados individuales asociados a una energıa dada En,l se denomina una capa. La configuracion electronicadescribe cuales capas estan ocupadas y cuantos electrones posee cada capa. La caracterizacion de las funciones deonda y los niveles de energıa asociados, permiten conocer el numero de enlaces formados por los atomos, ası comosu geometrıa y estabilidad.

Para determinar la configuracion electronica del estado base, se “llenan” las capas sucesivas desde el nivel 1sen forma sucesiva en el orden indicado en la Fig. 27.2, hasta que se agoten los Z electrones.

Por ejemplo, en el estado base del atomo de Hidrogeno, el unico electron del atomo ocupa el nivel 1s. En elatomo de Helio con Z = 2, la configuracion electronica consiste en los dos atomos ocupando el mismo nivel 1s,uno con espın arriba y el otro con espın abajo para ser compatible con el principio de exclusion

He : 1s2

la notacion espectroscopica indica entonces que los dos electrones ocupan estados ortogonales de la capa 1s, conla misma funcion espacial pero espinores ortogonales. Para el Litio con Z = 3, la configuracion electronica viene

Page 625: Mecanica Cuantica: Notas de Clase

27.2. CONFIGURACIONES ELECTRONICAS DE LOS ATOMOS 625

dada porLi : 1s2, 2s

ya que la capa 1s solo puede aceptar dos electrones y el tercer electron debe ir al nivel inmediatamente superior,que de acuerdo con la Fig. 27.2 es el nivel 2s. Para el caso del Berilio (Z = 4), la configuracion electronica es

Be : 1s2, 2s2

ya que la capa 2s puede aceptar otro electron. Para Z > 4, se procede al llenado de las capas superiores hastaagotar los Z electrones, llenando las capas 2p, 3s, 3p etc. En la figura 27.2, se muestra en el lado derecho lossımbolos de los elementos para los cuales la capa en cuestion es la mas externa, cuando los atomos estan en elestado base. Esta es la clasificacion de la tabla periodica de Mendeleev. Debe tenerse en cuenta sin embargo, quelos niveles que aparecen dentro de los corchetes en la Fig. 27.2 estan muy cercanos entre sı, y su llenado puedeocurrir en forma irregular. Por ejemplo, aunque en la figura 27.2 el nivel 4s aparece debajo del nivel 3d, para elcromo (Z = 24) hay 5 electrones en la capa 3d a pesar de que la capa 4s esta incompleta

Cr : 1s2, 2s2, 2p6, 3s2, 3p6, 4s1, 3d5

irregularidades similares ocurren para el cobre (Z = 29), Niobio (Z = 41), etc.Cuando todas las capas estan llenas, hay tantos estados individuales ortogonales como electrones. En otras

palabras, hay solo un determinante de Slater no-nulo asociado a configuraciones con todas las capas llenas (ocapas cerradas). En consecuencia, el estado base de los gases nobles (ns2, np6 . . .) es no-degenerado al igual queel de las tierras alcalinas (. . . , ns2).

Por otro lado, si el numero de electrones externos es menor que el grado de degeneracion de la capa masexterna, el estado base del atomo es degenerado. Para los alcalinos (. . . , ns), hay una degeneracion de 2, para elcarbono (1s2, 2s2, 2p2) la degeneracion es C2

6 = 15, puesto que los estados individuales se pueden escoger de losseis estados ortogonales que constituyen la capa 2p.

Adicionalmente, puede demostrarse que para una capa completa todos los momentos angulares electronicosnetos (orbital, de espın y total) son cero2. Por tanto el momento angular electronico de un atomo3, es debido soloa los electrones externos. Tal momento angular es entonces nulo para los gases nobles y las tierras alcalinas, entanto que para metales alcalinos el momento angular total electronico sera 1/2, puesto que poseen un solo electronexterno, cuyo momento angular orbital es cero y cuyo espın es 1/2.

Ahora bien, los estados excitados de mas baja energıa del Hamiltoniano H0 en la aproximacion de campocentral, se obtienen cuando se mueve uno de los electrones a una estado individual de energıa mas alto que laultima capa ocupada en el estado base. Hemos dicho los estados excitados de mas baja energıa, puesto que elelectron que se mueve y los otros electrones de la capa mas externa del estado base, no estan en general llenandocapas, y por tanto hay varios estados ortogonales asociados a la energıa del primer estado excitado. Por ejemplo,el primer estado excitado del atomo de Helio posee la configuracion electronica

He∗ : 1s, 2s

2Veremos esta caracterıstica para el atomo de Helio en el estado base [ver Ec. (28.9) Pag. 628 y discusion posterior].3El momento angular del atomo debe adicionar al momento angular de la nube electronica, el momento angular del nucleo.

Page 626: Mecanica Cuantica: Notas de Clase

Capıtulo 28

El atomo de Helio

Estudiaremos el atomo de Helio en el marco de la aproximacion de campo central. Teniendo en cuenta solo lainteraccion electrostatica, el Hamiltoniano del atomo de Helio se escribe como

H =P2

1

2me+

P22

2me− 2e2

R1− 2e2

R2+

e2

|R1 −R2|(28.1)

De acuerdo con la estrategia desarrollada en el capıtulo 27, escribiremos el Hamiltoniano del atomo de Helio enla forma

H = H0 +W (28.2)

H0 ≡ P21

2me+

P22

2me+ Vc (R1) + Vc (R2) (28.3)

W = −2e2

R1− 2e2

R2+

e2

|R1 −R2|− Vc (R1)− Vc (R2) (28.4)

donde el potencial central Vc (Ri) se elige adecuadamente para queW se pueda considerar una pequena correccion(perturbacion)1 con respecto a H0. Como primer paso, se desprecia la contribucion de W (aproximacion decampo central) lo cual nos lleva a estudiar las configuraciones electronicas del atomo bajo esta aproximacion.Posteriormente, se estudia la correccion de W via teorıa estacionaria de perturbaciones.

28.1. Configuraciones del atomo de Helio

Cuando se desprecia W , los electrones se pueden considerar independientes. Sin embargo, parte de la contri-bucion de la repulsion estatica promedio esta implıcitamente incluıda en el potencial central Vc.

De acuerdo con la discusion de la seccion 27.1, las configuraciones del atomo de Helio en la aproximacion decampo central (en la cual los electrones estan embebidos en un campo central Vc ), se especifican a traves de losnumeros cuanticos n, l y n′, l′ de los dos electrones. La energıa electronica total es entonces

Ec = En,l + En′,l′ (28.5)

De acuerdo con la Fig. 27.2, la configuracion del estado base consiste en los dos electrones en la capa 1s, denotandoseentonces como la configuracion 1s2. El primer estado excitado se obtiene cuando uno de los electrones esta enla capa 1s y el otro en la capa 2s, la configuracion electronica es entonces 1s, 2s. El segundo estado excitadocorresponde a la configuracion 1s, 2p.

Las configuraciones excitadas del atomo de Helio tienen la forma 1s, n′l′. Sin embargo, tambien existenconfiguraciones nl, n′l′ “doblemente excitadas” en las cuales ambos electrones estan en estados excitados. No

1Por supuesto, la simetrıa nos indica que Vc (R1) y Vc (R2) deben tener la misma forma funcional.

626

Page 627: Mecanica Cuantica: Notas de Clase

28.1. CONFIGURACIONES DEL ATOMO DE HELIO 627

obstante, en el caso del Helio la energıa total de estas configuraciones es mayor que la energıa de ionizacion delatomo, es decir la energıa necesaria para pasar del estado 1s2 al estado 1s, n′l′ con n′ → ∞. En consecuencia, losestados doblemente excitados son muy inestables, ya que tienden a disociarse rapidamente en un electron y un ion,razon por la cual suelen denominarse “estados de autoionizacion”. Sin embargo, existen configuraciones doblementeexcitadas que no son autoionizantes, pero que decaen emitiendo fotones. Algunas de las correspondientes lıneasespectrales han sido observadas experimentalmente.

28.1.1. Degeneracion de las configuraciones

Puesto que Vc es central, la energıa de las configuraciones no depende de los numeros cuanticos m y m′ donde

−l ≤ m ≤ l ; −l′ ≤ m′ ≤ l′

adicionalmente, puesto que Vc no depende del espın, la energıa tampoco depende de los numeros cuanticos ε y ε′

con ε = ±1/2 y ε′ = ±1/2. Por esta razon, la mayor parte de las configuraciones son degeneradas.Para calcular la degeneracion, tendremos en cuenta que un estado perteneciente a una configuracion esta

definida por 8 numeros cuanticos (cuatro para cada electron) dados por (n, l,m, ε) y (n′, l′,m′, ε′). Puesto que loselectrones son fermiones identicos, debe tenerse en cuenta el postulado de simetrizacion y el consecuente principiode exclusion de Pauli. El estado fısico (antisimetrizado) estarıa dado por

∣∣n, l,m, ε;n′, l′,m′, ε′⟩=

1√2(1− P21)

∣∣∣n(1), l(1),m(1), ε(1);n′(2), l′(2),m′(2), ε′(2)⟩

(28.6)

el principio de exclusion de Pauli prohibe los estados con identicos numeros cuanticos n = n′, l = l′,m = m′

y ε = ε′. El conjunto de kets fısicos para n, l;n′l′ fijos forma un subespacio E (n, l;n′, l′) del espacio EA, dondedicho subespacio esta asociado con la configuracion n, l;n′l′. Una base ortonormal del subespacio E (n, l;n′, l′) nosdara el grado de degeneracion del correspondiente nivel de energıa. Para evaluar el grado de degeneracion de unaconfiguracion nl;n′l′ dada, debemos distinguir dos casos:

Electrones en diferentes capas

Cuando los dos electrones no estan en la misma capa. Es decir no se cumple la condicion n = n′ y l = l′. En talcaso, ya que al menos uno de los numeros cuanticos n, l de los dos electrones es diferente, los estados individualesnunca coinciden y por tanto m,m′ y ε, ε′ pueden tomar de forma independiente cualquier valor. Por tanto, ladegeneracion esta dada por

gnl,n′l′ = [2 (2l + 1)]×[2(2l′ + 1

)]= 4 (2l + 1)

(2l′ + 1

); si n 6= n′ o l 6= l′ (28.7)

por ejemplo, la degeneracion de la configuracion 1s, 2s (primer estado excitado) es 4, y la degeneracion de laconfiguracion 1s, 2p (segundo estado excitado) es 12.

Electrones en la misma capa

Cuando los dos electrones estan en la misma capa se tiene que n = n′ y l = l′. En tal caso deben excluirse losestados con m = m′ y ε = ε′. El numero total de estados individuales es 2 (2l + 1). Para calcular el numero total deestados compatibles con el principio de exclusion de Pauli podemos proceder de la siguiente forma: consideremosun estado de dos partıculas de la forma

(n, l,m, ε)(n, l,m′, ε′

)

podemos proceder a recorrer independientemente a los pares (m, ε) y (m′, ε′) lo cual nos da un total de [2 (2l + 1)]×[2 (2l + 1)] estados. Ahora contamos los estados que no son compatibles con el principio de exclusion, es decir talque m = m′ y ε = ε′, para dichos estados el espın solo toma dos valores y la tercera componente de momento

Page 628: Mecanica Cuantica: Notas de Clase

628 CAPITULO 28. EL ATOMO DE HELIO

angular toma 2l+1 valores, para un total de 2 (2l + 1) estados. Sustrayendo los estados que violan el principio deexclusion de los anteriores tenemos

[2 (2l + 1)]× [2 (2l + 1)]− 2 (2l + 1) = 2 (2l + 1) (4l + 1)

sin embargo, al recorrer los numeros cuanticos de manera independiente hacemos un doble conteo de cada estado,ya que el estado de dos partıculas (n, l,m, ε) (n, l,m′, ε′) es igual al estado (n, l,m′, ε′) (n, l,m, ε). El presenteconteo esta tomando los dos en cuenta como si fueran diferentes, por tanto debemos dividir el anterior resultadopor dos2, con lo cual obtenemos

gnl2 = (2l + 1) (4l + 1) (28.8)

Otra forma de verlo es la siguiente: dado el conjunto fijo de numeros cuanticos (n, l,m, ε), hay [2 (2l + 1)− 1]estados del tipo (n, l,m′, ε′) compatibles con el principio de exclusion, ya que el numero de estados de la forma(n, l,m′, ε′) es 2 (2l + 1) pero uno de ellos (cuando m = m′ y ε = ε′) viola dicho principio. Por otro lado, hay2 (2l + 1) estados del tipo (n, l,m, ε), con lo cual el numero de estados en el conteo sera

[2 (2l + 1)]× [2 (2l + 1)− 1] = 2 (2l + 1) (4l + 1)

una vez mas este conteo toma en cuenta dos veces al mismo estado y el resultado debe dividirse por dos, con locual se reproduce de nuevo la Ec. (28.8).

Example 28.1 La configuracion 1s2 (estado base) no es degenerada. En tal caso es util realizar la expansion deldeterminante de Slater correspondiente a la configuracion. Si en la Ec. (28.6) hacemos

n = n′ = 1, l = l′ = m = m′ = 0, ε = (+) , ε′ = (−)

podemos escribir

∣∣1, 0, 0, ε; 1, 0, 0, ε′⟩

=1√2(1− P21)

∣∣∣1(1), 0(1), 0(1), (+)(1) ; 1(2), 0(2), 0(2), (−)(2)⟩

=1√2

[∣∣∣1(1), 0(1), 0(1), (+)(1) ; 1(2), 0(2), 0(2), (−)(2)⟩

−∣∣∣1(2), 0(2), 0(2), (+)(2) ; 1(1), 0(1), 0(1), (−)(1)

⟩]

=1√2

[∣∣∣1(1), 0(1), 0(1), (+)(1) ; 1(2), 0(2), 0(2), (−)(2)⟩

−∣∣∣1(1), 0(1), 0(1), (−)(1) ; 1(2), 0(2), 0(2), (+)(2)

⟩]

podemos factorizar la parte espacial y escribir

∣∣1, 0, 0, ε; 1, 0, 0, ε′⟩=∣∣∣1(1), 0(1), 0(1); 1(2), 0(2), 0(2)

⟩⊗

[∣∣∣(+)(1) ; (−)(2)⟩−∣∣∣(−)(1) ; (+)(2)

⟩]

√2

(28.9)

en la componente espinorial de la Ec. (28.9) reconocemos el estado singlete |S = 0,MS = 0〉 que surge de las reglasde adicion para S = S(1) + S(2), cuando s(1) = s(2) = 1/2 [ver Ec. (16.32) Pag. 412]. Concluımos que aunque elHamiltoniano H0 no depende de variables de espın, las ligaduras introducidas por el postulado de simetrizacionrequieren que el espın total del estado base sea S = 0. Notese que de acuerdo con (28.8) ninguna configuracioncon l = 0, sera degenerada independientemente del valor de n.

2Notese que este problema de doble conteo no aparece cuando los dos electrones son de capas diferentes. Esto se debe a que en elconteo, el intercambio es solo de los numeros cuanticos (m, ε) ↔ (m′, ε′). Por tanto, los estados (n, l,m, ε) (n′, l′,m′, ε′) son diferentesa los estados (n, l,m′, ε′) (n′, l′,m, ε) cuando (n, l) es diferente de (n′, l′).

Page 629: Mecanica Cuantica: Notas de Clase

28.2. EFECTO DE LA REPULSION ELECTROSTATICA 629

(2, 1, 1,+) (2, 1, 1,−)(2, 1, 1,+) (2, 1, 0,+)(2, 1, 1,+) (2, 1, 0,−)(2, 1, 1,+) (2, 1,−1,+)(2, 1, 1,+) (2, 1,−1,−)

(2, 1, 1,−) (2, 1, 1,+)(2, 1, 1,−) (2, 1, 0,+)(2, 1, 1,−) (2, 1, 0,−)(2, 1, 1,−) (2, 1,−1,+)(2, 1, 1,−) (2, 1,−1,−)

(2, 1, 0,+) (2, 1, 1,+)(2, 1, 0,+) (2, 1, 1,−)(2, 1, 0,+) (2, 1, 0,−)(2, 1, 0,+) (2, 1,−1,+)(2, 1, 0,+) (2, 1,−1,−)

(2, 1, 0,−) (2, 1, 1,+)(2, 1, 0,−) (2, 1, 1,−)(2, 1, 0,−) (2, 1, 0,+)(2, 1, 0,−) (2, 1,−1,+)(2, 1, 0,−) (2, 1,−1,−)

(2, 1,−1,+) (2, 1, 1,+)(2, 1,−1,+) (2, 1, 1,−)(2, 1,−1,+) (2, 1, 0,+)(2, 1,−1,+) (2, 1, 0,−)(2, 1,−1,+) (2, 1,−1,−)

(2, 1,−1,−) (2, 1, 1,+)(2, 1,−1,−) (2, 1, 1,−)(2, 1,−1,−) (2, 1, 0,+)(2, 1,−1,−) (2, 1, 0,−)(2, 1,−1,−) (2, 1,−1,+)

Cuadro 28.1: Conteo de la degeneracion asociada a dos electrones en el atomo de Helio que estan en la mismacapa con n = n′ = 2 y l = l′ = 1. En este conteo aparecen 30 estados pero en virtud de la duplicacion, solo 15 deellos son estados fıscamente diferentes.

Example 28.2 Veamos el caso de dos electrones en la misma capa con n = n′ = 2 y l = l′ = 1. Para cada estadocon (2, 1,m, ε) fijo, hay 5 estados del tipo (2, 1,m′, ε′) compatibles con el principio de exclusion de Pauli, ademashay 6 estados de la forma (2, 1,m, ε), con lo cual el conteo nos arroja 30 estados. El lector puede sin embargoapreciar que cada estado aparece dos veces. Por ejemplo aparecen (2, 1, 1,+) (2, 1, 1,−) y (2, 1, 1,−) (2, 1, 1,+). Hayentonces en total 15 estados fısicamente diferentes con la misma energıa. El procedimiento de conteo se apreciaen la tabla 28.1

28.2. Efecto de la repulsion electrostatica

El siguiente paso es estudiar el efecto de W usando teorıa estacionaria de perturbaciones. Para ello, debemosdiagonalizar la restriccion de W dentro del subespacio E (n, l;n′l′). Los autovalores de la correspondiente matriznos daran la correccion a primer orden en W de la energıa Ec. Los autoestados asociados son de orden cero enW . Veremos que para calcular la matriz representativa de la restriccion de W , podemos escoger una base en lacual dicha matriz ya es diagonal.

28.2.1. Base de E (n, l;n′, l′) adaptada a las simetrıas de W

Nuestro Hamiltoniano tiene la forma del Hamiltoniano (16.5) Pag. 405

H = H1 (P1,R1) +H2 (P2,R2) +W (|R2 −R1|) (28.10)

En la seccion 16.2.1, Pag. 404 vimos que un Hamiltoniano de la forma (28.10) no conmuta con L(1) ni con L(2)

pero sı conmuta con L(1) + L(2). Las Ecs. (16.3, 16.8) nos dicen que para un Hamiltoniano de la forma (28.10)tenemos que [

Hi, L(k)]= [H,L] = [W (|R2 −R1|) ,L] = 0 ; L ≡ L(1) + L(2) ; i, k = 1, 2 (28.11)

en particular

[W,L] =

[e2

R12,L

]= 0 (28.12)

Page 630: Mecanica Cuantica: Notas de Clase

630 CAPITULO 28. EL ATOMO DE HELIO

de modo que el momento angular total es una constante de movimiento, en tanto que el momento angular de cadaelectron no lo es. Esto esta asociado al hecho de que una rotacion que involucre a los dos electrones no cambia ladistancia relativa R12 entre ellos. En contraste, una rotacion que involucre a un solo electron cambiara en generala la cantidad R12.

Adicionalmente, puesto que ni H ni W dependen de variables de espın, conmutaran con cualquier operadorde espın. En particular, tenemos que

[W,S] = 0 ; S ≡ S(1) + S(2) (28.13)

Por tanto, los operadoresL2,S2, L3, S3,W

forman un conjunto de observables conmutantes. Mostraremos que de hecho L2,S2, L3, S3 forman un C.S.C.O.en el subespacio E (n, l;n′, l′) de EA. La tarea sera entonces encontrar una base comun de vectores propios de losobservables L2,S2, L3, S3 y construır con ellos la representacion matricial de la restriccion de W al subespacioE (n, l;n′, l′) de EA.

Para ello recordamos que el espacio de Hilbert total E es el producto tensorial E (1) ⊗ E (2) relativo a unanumeracion arbitraria de los electrones. El subespacio E (n, l;n′, l′) de EA se puede obtener antisimetrizando loskets del subespacio En,l (1) ⊗ En′,l′ (2) de E . Por tanto elegimos una base del subespacio En,l (1) ⊗ En′,l′ (2) en laforma ∣∣∣n(1), l(1),m(1), ε(1)

⟩⊗∣∣∣n′(2), l′(2),m′(2), ε′(2)

⟩; con (n, l) ,

(n′, l′

)fijos

(28.14)

con los cuales obtenemos los kets fısicos (28.6) antisimetrizando. Notese que en terminos de momento angularorbital y de espın, los vectores (28.14) forman una base desacoplada, en la cual los numeros cuanticos que estanbien definidos son momentos angulares parciales tanto en el sentido orbital y de espın, como en el sentido de queestan asociados a cada partıcula.

Sin embargo, las reglas de adicion del momento angular permiten definir otra base para el subespacio En,l (1)⊗En′,l′ (2) compuesta por vectores propios comunes a L2,S2, L3, S3 definida completamente por la especificacion delos correspondientes valores propios3. Esta base la denotaremos en la forma

∣∣∣n(1), l(1), n′(2), l′(2);L,ML

⟩⊗ |S,MS〉

(28.15)

donde las reglas de adicion de momentos angulares nos dicen que

L = l + l′, l + l′ − 1, . . . ,∣∣l − l′

∣∣ ; S = 1, 0 (28.16)

Ahora bien, de las expresiones

L2 =[L(1) + L(2)

]2, S2 =

[S(1) + S(2)

]2

L3 = L(1)3 + L

(2)3 , S3 = S

(1)3 + S

(2)3

se observa que L2,S2, L3, S3 son operadores simetricos ya que todos ellos son invariantes bajo la permutacion P21

de las dos partıculas4. Por tanto, tales operadores conmutan con P21. Esto a su vez implica que L2,S2, L3, S3conmutan con el operador antisimetrizador total. Por tanto, los vectores que resultan de la antisimetrizacion de(28.15) continuan siendo autovectores de L2,S2, L3, S3 con los mismos valores propios, aunque algunos de ellospodrıan aniquilarse al ser proyectados sobre EA, en cuyo caso el estado fısico queda descartado por el principiode exclusion de Pauli, y no formarıa parte de la base del subespacio E (n, l;n′, l′) que estamos construyendo. Losvectores no nulos que se obtienen al antisimetrizar a los vectores (28.15) son ortogonales puesto que corresponden

3Esta es una base acoplada en el sentido de las partıculas. Pero en la que permanecen desacoplados los momentos angulares orbitaly de espın.

4Recordemos que esta condicion garantiza que estos operadores son observables adecuados para partıculas identicas. Ver seccion26.9.1, Pag. 609.

Page 631: Mecanica Cuantica: Notas de Clase

28.2. EFECTO DE LA REPULSION ELECTROSTATICA 631

a autovalores diferentes de al menos uno de los cuatro observables involucrados. Puesto que tales vectores anti-simetricos expanden a E (n, l;n′, l′), ellos constituyen una base ortonormal de dicho subespacio, que denotamos enla forma ∣∣∣n, l, n′, l′ ;L,ML;S,MS

⟩; con (n, l) ,

(n′, l′

)fijos

(28.17)

con ∣∣∣n, l, n′, l′ ;L,ML;S,MS

⟩= c (1− P21)

∣∣∣n(1), l(1), n′(2), l′(2);L,ML

⟩⊗ |S,MS〉

(28.18)

siendo c una constante de normalizacion. Por tanto, L2,S2, L3, S3 forman un C.S.C.O. en el subespacio E (n, l;n′, l′)de EA.

Introduciremos ahora el operador permutacion P(S)21 que actua solo sobre el espacio de espın

P(S)21

∣∣∣ε(1); ε′(2)⟩≡∣∣∣ε′(1); ε(2)

⟩(28.19)

Ahora bien, en la seccion 16.4.3 vimos que la base acoplada de espın |S,MS〉 para s1 = s2 = 1/2 consta de unsinglete con S =M = 0

|0, 0〉 = 1√2[|+,−〉 − |−,+〉] (28.20)

y un triplete con S = 1 y tres valores distintos de MS

|1, 1〉 = |+,+〉 ; |1, 0〉 = 1√2[|+,−〉+ |−,+〉] ; |1,−1〉 = |−−〉 (28.21)

ademas en dicha seccion vimos que el estado singlete es antisimetrico bajo el intercambio de ε y ε′ en tanto que losestados del triplete son simetricos bajo tal intercambio, como se ve claramente de las Ecs. (28.20, 28.21). Podemossintetizar estos resultados con la ecuacion

P(S)21 |S,MS〉 = (−1)S+1 |S,MS〉 (28.22)

si ahora definimos la permutacion P(0)21 como el operador permutacion en el espacio de estados de las variables

orbitales, tenemos que

P21 = P(0)21 ⊗ P

(S)21 (28.23)

y aplicando las Ecs. (28.22, 28.23), la ecuacion (28.18) queda en la forma

∣∣∣n, l, n′, l′ ;L,ML;S,MS

⟩=c[1− (−1)S+1 P

(0)21

] ∣∣∣n(1), l(1), n′(2), l′(2);L,ML

⟩⊗ |S,MS〉 (28.24)

28.2.2. Restricciones impuestas por el postulado de simetrizacion

La dimension del espacio En,l (1) ⊗ En′,l′ (2) es obviamente 4 (2l + 1) (2l′ + 1). Sin embargo, esa no es necesa-riamente la dimension del espacio E (n, l;n′, l′) ya que algunos kets de la base de En,l (1) ⊗ En′,l′ (2) pueden tenerproyeccion nula sobre E (n, l;n′, l′). Veremos en que casos aparecen algunas proyecciones nulas.

Estudiaremos primero el caso en el cual los dos electrones no ocupan la misma capa de modo que n 6= n′ y/ol 6= l′. En este caso, la parte orbital de (28.24) es una suma o diferencia entre dos kets ortogonales y por tantonunca es cero. Lo mismo ocurre para la parte espinorial |S,MS〉, de modo que todos los valores posibles de L yS dados por la Ec. (28.16) generan vectores no nulos. En este caso la constante de normalizacion c en (28.24) es1/√2.

Por ejemplo, para la configuracion 1s, 2s; tenemos que n 6= n′ y que l = l′ = 0. En este caso podemos tenerS = 0, L = 0 y S = 1, L = 0. Para la configuracion 1s, 2p podemos tener S = 0, L = 1, y S = 1, L = 1.

Page 632: Mecanica Cuantica: Notas de Clase

632 CAPITULO 28. EL ATOMO DE HELIO

A continuacion escribiremos el vector puramente orbital∣∣n(1), l(1);n′(2), l′(2);L,ML

⟩[donde (n, l) y (n′, l′) son

fijos], utilizando la completez dentro del espacio En,l ⊗ En′,l′ en la forma

∣∣∣n(1), l(1);n′(2), l′(2);L,ML

⟩=

[∑

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩⟨

n(1), l(1),m(1);n′(2), l′(2),m′(2)∣∣∣]×

∣∣∣n(1), l(1);n′(2), l′(2);L,ML

=∑

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩

⟨n(1), l(1),m(1);n′(2), l′(2),m′(2)

∣∣∣ n(1), l(1);n′(2), l′(2);L,ML

=∑

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩

×⟨l(1),m(1); l′(2),m′(2)

∣∣∣ l(1); l′(2);L,ML

∣∣∣n(1), l(1);n′(2), l′(2);L,ML

⟩=

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩ ⟨l, l′;m,m′∣∣ l, l′;L,ML

En notacion de coeficientes de Clebsch-Gordan escribimos∣∣∣n(1), l(1);n′(2), l′(2);L,ML

⟩=∑

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩ ⟨m,m′ (l, l′

)L,ML

⟩(28.25)

donde 〈m,m′ (l, l′) L,ML〉 es el coeficiente de Clebsch-Gordan que genera el cambio de base.

Ahora supondremos que n = n′ y l = l′ de modo que ambos electrones ocupan la misma capa. En tal casoalgunos de los kets en (28.24) pueden ser nulos. Haciendo n = n′ y l = l′ esta expresion se reduce a

∣∣∣n(1), l(1);n(2), l(2);L,ML

⟩=∑

m

m′

∣∣∣n(1), l(1),m(1);n(2), l(2),m′(2)⟩⟨m,m′ (l, l) L,ML

⟩(28.26)

El coeficiente de Clebsch-Gordan asociado posee la siguiente propiedad

⟨m,m′ (l, l) L,ML

⟩= (−1)L

⟨m′,m (l, l) L,ML

⟩(28.27)

Combinando las Ecs. (28.26) y (28.27), se obtiene

P(0)21

∣∣∣n(1), l(1);n(2), l(2);L,ML

⟩=

m

m′

⟨m,m′ (l, l) L,ML

⟩P

(0)21

∣∣∣n(1), l(1),m(1);n(2), l(2),m′(2)⟩

=∑

m

m′

⟨m,m′ (l, l) L,ML

⟩ ∣∣∣n(1), l(1),m′(1);n(2), l(2),m(2)⟩

=∑

m

m′(−1)L

⟨m′,m (l, l) L,ML

⟩ ∣∣∣n(1), l(1),m′(1);n(2), l(2),m(2)⟩

intercambiando las variables mudas m y m′, tenemos que

P(0)21

∣∣∣n(1), l(1);n(2), l(2);L,ML

⟩= (−1)L

m

m′

⟨m,m′ (l, l) L,ML

⟩ ∣∣∣n(1), l(1),m(1);n(2), l(2),m′(2)⟩

y utilizando nuevamente las ecuaciones (28.26) se obtiene finalmente

P(0)21

∣∣∣n(1), l(1);n(2), l(2);L,ML

⟩= (−1)L

∣∣∣n(1), l(1);n(2), l(2);L,ML

⟩(28.28)

Page 633: Mecanica Cuantica: Notas de Clase

28.2. EFECTO DE LA REPULSION ELECTROSTATICA 633

sustituyendo (28.28) en (28.24) para n = n′ y l = l′, resulta

|n, l, n, l;L,ML;S,MS〉 =c[1− (−1)S+1 P

(0)21

] ∣∣∣n(1), l(1), n(2), l(2);L,ML

⟩⊗ |S,MS〉

=c[1− (−1)L+S+1

] ∣∣∣n(1), l(1), n(2), l(2);L,ML

⟩⊗ |S,MS〉

de lo cual se obtiene (tomando la constante de normalizacion como c = 1/2)

|n, l, n, l;L,ML;S,MS〉 =

0 si L+ S es impar∣∣n(1), l(1), n(2), l(2);L,ML

⟩⊗ |S,MS〉 si L+ S es par

(28.29)

En consecuencia, cuando los dos electrones estan en la misma capa, L y S no pueden ser arbitrarios, ya que L+Sdebe ser par. En particular, para la configuracion 1s2, tenemos que L = 0, por tanto es necesario que S = 0, yel valor S = 1 esta excluıdo, en concordancia con lo encontrado en la seccion 28.1.1 [ver Ec. (28.9) Pag. 628 ydiscusion posterior].

Adicionalmente, se observa que el postulado de simetrizacion introduce una correlacion entre la simetrıa de laparte orbital y la simetrıa de la parte espinorial del ket fısico (28.24). Dado que el ket total debe ser antisimetrico,se tiene que la parte orbital asociada a S = 0 (singlete espinorial antisimetrico) debe corresponder a un ket orbitalsimetrico, en tanto que S = 1 (triplete espinorial simetrico) debe corresponder a un ket orbital antisimetrico.Veremos que esto tiene consecuencias fenomenologicas importantes.

28.2.3. Terminos espectrales generados por la repulsion electrostatica

El termino W conmuta con los cuatro observables L2, L3, S2, S3, los cuales forman un C.S.C.O. dentro deE (n, l;n′, l′). Se sigue entonces que la restriccion de W dentro de dicho subespacio es diagonal en la base

∣∣n, l;n′, l′;L,ML;S,MS

y sus autovalores vienen dados por

δ (L,S) =⟨n, l;n′, l′;L,ML;S,MS

∣∣W∣∣n, l;n′, l′;L,ML;S,MS

⟩(28.30)

Esta energıa no depende de ML ni de MS ya que las ecuaciones (28.11, 28.13) nos dicen que W conmuta con Ly S, o equivalentemente con L3, L± y con S3, S±. Por tanto W es un operador escalar tanto en el espacio deestados orbitales como en el espacio de estados espinoriales.

Dentro de cada configuracion nl, n′l′ obtenemos niveles de energıa del tipo

Ec(n, l;n′, l′

)+ δ (L,S) (28.31)

que denotamos por sus valores de L y S, siendo Ec (n, l;n′, l′) los niveles obtenidos con la aproximacion de campo

central. Cada nivel tiene una degeneracion de orden (2L+ 1) (2S + 1). Estos niveles se denominan terminosespectrales, y se denotan de la siguiente forma: Para cada valor de L asociamos en notacion espectroscopica unaletra del alfabeto, escribimos la correspondiente letra en mayuscula y le anadimos en la parte superior izquierdaun numero igual a 2S + 1. Veamos los siguientes ejemplos

La configuracion 1s2 conduce a un solo termino espectral que escribimos en la forma 1S, ya que como hemosvisto el termino 3S (asociado a espın uno) esta prohibido por el principio de exclusion de Pauli.

La configuracion 1s, 2s genera dos terminos 1S (no degenerado) y 3S (triplemente degenerado).

La configuracion 1s, 2p genera dos terminos 1P (degeneracion 3) y 3P (degeneracion 9).

Para la configuracion mas compleja 2p2 obtenemos los terminos espectrales 1S, 1D y 3P (recordemos queL+ S tiene que ser par, ya que los dos electrones estan en la misma capa).

En conclusion, bajo el efecto de la repulsion electrostatica, la degeneracion de cada configuracion se remueveparcialmente. La configuracion 1s2 que no es degenerada simplemente sufre un corrimiento.

Page 634: Mecanica Cuantica: Notas de Clase

634 CAPITULO 28. EL ATOMO DE HELIO

28.3. Terminos espectrales que surgen de la configuracion 1s, 2s

Veremos que los dos terminos 1S y 3S que surgen de la configuracion 1s, 2s y cuyos valores de espın total sondiferentes, tienen energıas diferentes a pesar de que el Hamiltoniano original es puramente electrostatico. Vamosa discutir el origen de dicha diferencia.

En la configuracion 1s, 2s tenemos que n = 1, n′ = 2 y l = l′ = L = 0. Aplicando esto en la Ec. (28.25) seobtiene

∣∣∣n(1), l(1);n′(2), l′(2);L,ML

⟩=∑

m

m′

∣∣∣n(1), l(1),m(1);n′(2), l′(2),m′(2)⟩⟨m,m′ (l, l′

)L,ML

⟩⇒

∣∣∣n(1) = 1, l(1) = 0; n′(2) = 2, l′(2) = 0; L = 0,ML = 0⟩

=∣∣∣n(1) = 1, l(1) = 0,m(1) = 0; n′(2) = 2, l′(2) = 0,m′(2) = 0

⟩〈0, 0 (0, 0) 0, 0〉

donde hemos tenido en cuenta que para l = l′ = 0, solo es posible que m = m′ = 0. El coeficiente de ClebschGordan es la unidad en este caso. Obtenemos entonces∣∣∣n(1) = 1, l(1) = 0;n′(2) = 2, l′(2) = 0;L =ML = 0

⟩=∣∣∣n(1) = 1, l(1) = m(1) = 0; n′(2) = 2, l′(2) = m′(2) = 0

(28.32)este vector lo podemos escribir en notacion simplificada como

∣∣1s(1); 2s(2)⟩. Ya vimos que la configuracion 1s, 2s

produce dos terminos espectrales 1S (no degenerado) y 3S (triplemente degenerado). Los estados asociados a losdos terminos espectrales los denotaremos por

∣∣1S, 0⟩,∣∣3S,MS

⟩; MS = 1, 0,−1 (28.33)

debe tenerse cuidado de no confundir la letra S cuando denota espın total, i.e. el valor propio asociado al operador

S2 ≡[S(1)

]2+[S(2)

]2, o cuando denota que el momento angular orbital total es cero. En notacion espectroscopica

el estado 3S se refiere a que el espın total es S = 1 (2S +1 = 3), y el momento angular es L = 0 (que en notacionespectroscopica es la letra S).

Por ahora estos vectores tienen una asignacion especıfica a una partıcula de modo que deben ser antisimetri-zados. Para ello se utiliza la Ec. (28.24)

∣∣∣n, l, n′, l′ ;L,ML;S,MS

⟩=c[1− (−1)S+1 P

(0)21

] ∣∣∣n(1), l(1), n′(2), l′(2);L,ML

⟩⊗ |S,MS〉 (28.34)

con n = 1, n′ = 2 y l = l′ = 0, el estado singlete en (28.33) con S = MS = 0 (termino espectral 1S), viene dadopor

∣∣1S, 0⟩

≡∣∣∣n = 1, l = 0, n′ = 2, l

′= 0;L =ML = 0;S =MS = 0

∣∣1S, 0⟩

=c[1− (−1)1 P

(0)21

] ∣∣∣n(1) = 1, l(1) = 0, n′(2) = 2, l′(2) = 0;L =ML = 0

⟩⊗ |S = 0,MS = 0〉

Y utilizando el vector (28.32) en notacion simplificada como∣∣1s(1); 2s(2)

⟩, esta ecuacion se puede reescribir como

∣∣1S, 0⟩=

1√2

[1 + P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

⊗ |S = 0,MS = 0〉

donde hemos usado c = 1/(2√2). Para el triplete en (28.33) con S = 1 y MS = 1, 0,−1, la Ec. (28.34) nos da

∣∣3S,MS

⟩≡

∣∣∣n = 1, l = 0, n′ = 2, l′= 0;L =ML = 0;S = 1,MS

∣∣3S,MS

⟩=

c[1− (−1)2 P

(0)21

] ∣∣∣n(1) = 1, l(1) = 0, n′(2) = 2, l′(2) = 0;L =ML = 0

⟩⊗ |S = 1,MS〉

Page 635: Mecanica Cuantica: Notas de Clase

28.3. TERMINOS ESPECTRALES QUE SURGEN DE LA CONFIGURACION 1S, 2S 635

una vez mas en notacion simplificada

∣∣3S,MS

⟩=

1√2

[1− P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

⊗ |S = 1,MS〉 ; MS = 1, 0,−1

en sıntesis, los estados fısicos (antisimetrizados) en notacion espectroscopica estan dados por

∣∣3S,MS

⟩=

1√2

[1− P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

⊗ |S = 1,MS〉 ; MS = 1, 0,−1 (28.35)

∣∣1S, 0⟩

=1√2

[1 + P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

⊗ |S = 0,MS = 0〉 (28.36)

los autovalores de W de la Ec. (28.30) quedan

δ(3S)

=⟨3S,MS

∣∣W∣∣3S,MS

δ(3S)

=1

2

[⟨1s(1); 2s(2)

∣∣∣[1− P

(0)†21

]⊗ 〈S = 1,MS |

]W[[

1− P(0)21

] ∣∣∣1s(1); 2s(2)⟩

⊗ |S = 1,MS〉]

teniendo en cuenta que W no actua sobre variables de espın y que P(0)21 es hermıtico, resulta

δ(3S)=⟨3S,MS

∣∣W∣∣3S,MS

⟩=

1

2

⟨1s(1); 2s(2)

∣∣∣[1− P

(0)21

]W[1− P

(0)21

] ∣∣∣1s(1); 2s(2)⟩〈S = 1,MS |S = 1,MS〉

similarmente se calcula δ(1S). Obtenemos entonces

δ(3S)

=1

2

⟨1s(1); 2s(2)

∣∣∣[1− P

(0)21

]W[1− P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

(28.37)

δ(1S)

=1

2

⟨1s(1); 2s(2)

∣∣∣[1 + P

(0)21

]W[1 + P

(0)21

] ∣∣∣1s(1); 2s(2)⟩

(28.38)

Y teniendo en cuenta que P(0)21 es nilpotente y conmuta con W , tenemos

(1± P

(0)21

)W(1± P

(0)21

)=

(1± P

(0)21

)(1± P

(0)21

)W =

[1 +

(P

(0)21

)2± 2P

(0)21

]W =

[2± 2P

(0)21

]W

(1± P

(0)21

)W(1± P

(0)21

)= 2

(1± P

(0)21

)W (28.39)

aplicando (28.39) en las Ecs. (28.37, 28.38) obtenemos

δ(3S)

=⟨1s(1); 2s(2)

∣∣∣(1− P

(0)21

)W∣∣∣1s(1); 2s(2)

=⟨1s(1); 2s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

⟩−⟨2s(1); 1s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

δ(1S)

=⟨1s(1); 2s(2)

∣∣∣(1 + P

(0)21

)W∣∣∣1s(1); 2s(2)

=⟨1s(1); 2s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

⟩+⟨2s(1); 1s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

que se puede escribir en la forma

δ(3S)

= K − J ; δ(1S)= K + J (28.40)

K ≡⟨1s(1); 2s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

⟩; J ≡

⟨2s(1); 1s(2)

∣∣∣W∣∣∣1s(1); 2s(2)

⟩(28.41)

al sustituir (28.40) en (28.31), se observa que K representa un corrimiento de la energıa como un todo, y nogenera un desdoblamiento. En contraste, se observa que el termino J sı introduce una diferencia de energıa entrelos terminos 1S y 3S. Notese que con respecto a K, el termino J es un termino de intercambio. El calculo numericomuestra que K − J es positivo de modo que el nivel 3S (perturbado) esta por encima del nivel (no perturbado)1s, 2s. Ası mismo J es positivo de modo que el nivel 1S esta por encima del nivel 3S y el desdoblamiento estadado por 2J ≈ 0,8eV. Estos hechos se ilustran en la Fig. 28.1

Page 636: Mecanica Cuantica: Notas de Clase

636 CAPITULO 28. EL ATOMO DE HELIO

Figura 28.1: Ilustracion de la posicion relativa de los terminos espectrales que surgen de la configuracion 1s, 2s delatomo de helio. El termino directo Krepresenta un corrimiento del nivel como un todo, en tanto que J genera undesdoblamiento, y por tanto una remocion parcial de la degeneracion.

28.3.1. La integral de intercambio

Puesto que el termino J (conocido como integral de intercambio) es el que genera el desdoblamiento, y portanto la remocion parcial de la degeneracion, vamos a estudiarlo en mayor detalle. Recordando la forma de laperturbacion para la aproximacion de campo central Ec. (28.4)

W = F (R1) + F (R2) +e2

|R1 −R2|(28.42)

F (R) ≡ −2e2

R− Vc (R) (28.43)

la integral de intercambio J de la Ec. (28.41) queda

J ≡⟨2s(1); 1s(2)

∣∣∣[F (R1) + F (R2) +

e2

|R1 −R2|

] ∣∣∣1s(1); 2s(2)⟩

J =⟨2s(1); 1s(2)

∣∣∣F (R1)∣∣∣1s(1); 2s(2)

⟩+⟨2s(1); 1s(2)

∣∣∣F (R2)∣∣∣1s(1); 2s(2)

+⟨2s(1); 1s(2)

∣∣∣ e2

|R1 −R2|∣∣∣1s(1); 2s(2)

J =⟨2s(1)

∣∣∣F (R1)∣∣∣1s(1)

⟩⟨1s(2)

∣∣∣ 2s(2)⟩+⟨1s(2)

∣∣∣F (R2)∣∣∣2s(2)

⟩⟨2s(1)

∣∣∣ 1s(1)⟩

+⟨2s(1); 1s(2)

∣∣∣ e2

|R1 −R2|∣∣∣1s(1); 2s(2)

pero es claro que⟨1s(2)

∣∣ 2s(2)⟩=⟨2s(1)

∣∣ 1s(1)⟩= 0, ya que son productos internos de estados ortogonales (estados

con diferente valor de n). Por tanto, solo el termino repulsivo contribuye a la integral de intercambio5

J =⟨2s(1); 1s(2)

∣∣∣ e2

|R1 −R2|∣∣∣1s(1); 2s(2)

⟩(28.44)

Denotaremos por ϕn,l,m (r) a las funciones de onda asociadas al estado estacionario |n, l,m〉 de un electron enel potencial Vc [

P 2

2m+ Vc (R)

]|n, l,m〉 = En,l |n, l,m〉 ; ϕn,l,m (r) ≡ 〈r |n, l,m〉 (28.45)

5Notese que para la integral K contribuyen en general todos los terminos, esto permite entender al menos cualitativamente porqueK es mayor que J .

Page 637: Mecanica Cuantica: Notas de Clase

28.3. TERMINOS ESPECTRALES QUE SURGEN DE LA CONFIGURACION 1S, 2S 637

en la base |r〉 el calculo de J de la Ec. (28.44) involucra a la integral

J =

∫d3r1

∫d3r2 ϕ

∗2,0,0 (r1) ϕ

∗1,0,0 (r2)

e2

|r1 − r2|ϕ1,0,0 (r1) ϕ2,0,0 (r2) (28.46)

no realizaremos el calculo explıcito de esta integral6. Sin embargo, es importante observar que el valor numericode esta integracion es positivo y J ≈ 0,4 eV.

Las ecuaciones (28.35, 28.36) junto con las expresiones (28.37, 28.38) nos muestran el origen de la separacionde los niveles de energıa entre los terminos 3S y 1S. El origen de este desdoblamiento yace en las diferenciasentre las propiedades de simetrıa de las partes orbitales de dichos terminos. Puesto que el triplete espinorial (S =1, MS = 1, 0,−1) es simetrico, el postulado de simetrizacion exige que la parte orbital asociada sea antisimetrica,

originando el signo (−) para P(0)21 en las Ecs. (28.35, 28.37). Analogamente, el singlete espinorial (S = 0, MS = 0)

es antisimetrico y por tanto la parte orbital debe ser simetrica, originando el signo (+) para P(0)21 en las Ecs. (28.36,

28.38).

Lo anterior permite explicar porque la energıa del termino 1S es mayor que la del termino 3S. Para el terminosinglete, la funcion de onda orbital es simetrica con respecto al intercambio de los dos electrones, lo cual implicauna probabilidad diferente de cero de que ambos electrones esten en el mismo punto del espacio. Por esta razon,la energıa electrostatica repulsiva e2/ |r1 − r2| , que es grande para valores pequenos de la distancia relativa entrelos electrones, se ve significativamente incrementada para el estado singlete. De otra parte, para el estado triplete,la funcion de onda orbital es antisimetrica con respecto al intercambio de los dos electrones, implicando unaprobabilidad nula de que los electrones esten en el mismo punto del espacio. Por tanto, el valor medio de ladistancia relativa entre los electrones es mayor, y por tanto es menor el valor medio de la repulsion electrostatica.

Es interesante observar de la anterior discusion que a pesar de que W no depende del espın, el desdoblamientoque este operador produce tiene su origen en el valor total del espın, ya que dependiendo de dicho valor tendremosuna simetrıa diferente para el termino orbital, en virtud del postulado de simetrizacion.

28.3.2. Analisis del papel del postulado de simetrizacion

A priori, podrıa pensarse que el postulado de simetrizacion es el responsable del desdoblamiento entre losniveles 1S y 3S. Veremos sin embargo que no es ası. Encontraremos que este postulado simplemente fija el valordel espın total de los terminos que surgen de una configuracion dada en virtud de la repulsion electrostatica entrelos electrones.

Para verlo, supongamos que uno de los electrones es reemplazado por una partıcula (imaginaria hasta dondesabemos) que tenga la misma carga, masa y espın del electron, pero que posea algun numero cuantico intrınsecoadicional que lo diferencie de los electrones. Notese que el Hamiltoniano (28.2) tendra exactamente la mismaforma7. Por otro lado, puesto que H no depende del espın, podemos ignorar el espın en los calculos y simplementemultiplicar por 4 las degeneraciones asociadas. El nivel de energıa asociado a H0 en (28.3) correspondiente ala configuracion 1s, 2s es doblemente degenerado desde el punto de vista orbital, debido a que los dos estadosortogonales

∣∣1s(1), 2s(2)⟩y∣∣2s(1), 1s(2)

⟩son dos estados fısicamente diferentes (cuando las partıculas eran

identicas se consideraban iguales) asociados a dicha configuracion. Para estudiar el efecto deW perturbativamente,diagonalizamos la restriccion deW en el espacio dos dimensional expandido por estos dos kets. La matriz asociada

6Es importante observar que aunque la integral de intercambio no depende explıcitamente de Vc (R), sı depende implıcitamente dedicho potencial. Para verlo, basta con observar que las funciones de onda que aparecen en (28.46) son soluciones de la ecuacion (28.45)que depende de Vc (R).

7Por supuesto que si una partıcula ası existiera, tendrıa que existir alguna contribucion en el Hamiltoniano debida a la propiedadintrınseca adicional, que estarıamos despreciando.

Page 638: Mecanica Cuantica: Notas de Clase

638 CAPITULO 28. EL ATOMO DE HELIO

es entonces

W1s,2s =

( ⟨1s(1); 2s(2)

∣∣W∣∣1s(1); 2s(2)

⟩ ⟨1s(1); 2s(2)

∣∣W∣∣2s(1); 1s(2)

⟩⟨2s(1); 1s(2)

∣∣W∣∣1s(1); 2s(2)

⟩ ⟨2s(1); 1s(2)

∣∣W∣∣2s(1); 1s(2)

⟩)

W1s,2s =

( ⟨1s(1); 2s(2)

∣∣W∣∣1s(1); 2s(2)

⟩ ⟨2s(1); 1s(2)

∣∣W∣∣1s(1); 2s(2)

⟩⟨2s(1); 1s(2)

∣∣W∣∣1s(1); 2s(2)

⟩ ⟨1s(1); 2s(2)

∣∣W∣∣1s(1); 2s(2)

⟩)

donde la ultima igualdad es debida a que W es invariante bajo el intercambio de las dos partıculas (inclusocuando son distinguibles), de modo que las integrales J y K tambien son invariantes bajo dicho intercambio [verpor ejemplo la Ec. (28.46)]. Por tanto, esta matriz se puede escribir exclusivamente en terminos de J y K

W1s,2s =

(K JJ K

)

esta matriz se diagonaliza de inmediato y se obtienen los valores propios K+J y K−J , asociados respectivamentecon la combinacion lineal simetrica y antisimetrica de los dos kets

∣∣1s(1), 2s(2)⟩y∣∣2s(1), 1s(2)

⟩. Notese sin embargo

que no hemos antisimetrizado y de hecho hemos tratado a los dos kets anteriores como fısicamente distintos. Portanto, el hecho de que estos autoestados orbitales tengan una simetrıa bien definida relativa al intercambio delas partıculas, no tiene nada que ver con el postulado de simetrizacion ni con el principio de exclusion de Pauli.

Este hecho solo surge de que W conmuta con P(0)21 de modo que podemos encontrar autoestados comunes a W y

P(0)21 .

Notese en consecuencia que al ignorar el postulado de simetrizacion, es posible acoplar el estado orbitalsimetrico con el estado espinorial simetrico (triplete), ası como acoplar el estado orbital antisimetrico con elestado espinorial antisimetrico (singlete). En sıntesis, cuando las dos partıculas no son identicas obtenemos elmismo arreglo de niveles y la misma simetrıa orbital anterior. Sin embargo, la degeneracion de los niveles esdiferente ya que no hay estados linealmente independientes que sean aniquilados por el antisimetrizador. En elcaso distinguible, el nivel mas bajo puede tener espın total S = 0 o S = 1, lo mismo ocurre con el nivel mas altoK + J .

Volviendo de nuevo al atomo de Helio real vemos que el principio de exclusion de Pauli no es el responsabledel desdoblamiento del nivel 1s, 2s en dos niveles K ± J , pues hemos visto que este desdoblamiento tambienaparece cuando se consideran distinguibles las partıculas en cuestion. Esto se debe a que el caracter simetrico oantisimetrico de la parte orbital de la funcion de onda, se relaciona con la invarianza de la interaccion electrostaticabajo la permutacion de dos electrones. Lo que hace el principio de exclusion de Pauli es prohibir que el estado masbajo tenga espın total S = 0, y que el nivel mas alto tenga espın S = 1, dado que en estos dos casos el estado serıaglobalmente simetrico lo cual esta prohibido para fermiones por el postulado de simetrizacion, y por tanto por elprincipio de exclusion de Pauli. En otras palabras, con o sin distinguibilidad obtenemos funciones de onda consimetrıa de permutacion global bien definida, y al aplicar el antisimetrizador se anulan los estados globalmentesimetricos, dejando intactos los estados globalmente antisimetricos.

28.3.3. Hamiltoniano efectivo dependiente del espın

Si reemplazamos a W por el operador

W = α+ βS(1) · S(2) (28.47)

donde S(1) y S(2) denotan el espın de cada electron, tenemos que

S2 =[S(1) + S(2)

]2=(S(1)

)2+(S(2)

)2+ 2S(1) · S(2) ⇒ (28.48)

S(1) · S(2) =S2 −

(S(1)

)2 −(S(2)

)2

2(28.49)

Page 639: Mecanica Cuantica: Notas de Clase

28.3. TERMINOS ESPECTRALES QUE SURGEN DE LA CONFIGURACION 1S, 2S 639

sin embargo debemos tener en cuenta que el espın de los electrones es intrınseco, de modo que para todo ket deestado que describa a este sistema de dos electrones y que incluya a los espinores, se tiene que s(1) = s(2) ≡ s = 1/2.Por tanto

[(S(1)

)2+(S(2)

)2]|. . .〉 = ~2

[s(1)

(s(1) + 1

)+ s(2)

(s(2) + 1

)]|. . .〉 = 2~2 [s (s+ 1)] |. . .〉 = 3

2~2 |. . .〉

como esto es valido para todos los kets que describen nuestro sistema, tenemos que para nuestros propositos sepuede escribir8 (

S(1))2

+(S(2)

)2≡ 3

2~21 (28.50)

sustituyendo (28.50) en (28.49) se tiene que

S(1) · S(2) =S2

2− 3

4~2

por tanto el operador W definido por (28.47) queda

W =

(α− 3β~2

4

)+β

2S2 ≡ κ+

β

2S2 ; κ ≡ α− 3β~2

4

este operador claramente actua de manera no trivial solo sobre los espinores. Puesto que (β/2)S2 es proporcionala S2, posee los mismos vectores propios |S,MS〉 de S2 con valores propios dados por (β/2) ~2S (S + 1)

S2 |S,MS〉 = ~2S (S + 1) |S,MS〉 ⇔(β

2S2

)|S,MS〉 =

2~2S (S + 1)

)|S,MS〉

Adicionalmente, puesto que W solo difiere de (β/2)S2 por un operador proporcional a la identidad κ1, se tieneque posee los mismos vectores propios con valores propios dados por

2S2

)|S,MS〉 =

2~2S (S + 1)

)|S,MS〉 ⇔

(κ+

β

2S2

)|S,MS〉 =

(κ+

β

2~2S (S + 1)

)|S,MS〉

y teniendo en cuenta la definicion de κ(α− 3β~2

4+β

2S2

)|S,MS〉 =

[α− 3β~2

4+β

2~2S (S + 1)

]|S,MS〉

de manera que los vectores propios son el triplete |S = 1,MS〉 y el singlete |S = 1,MS = 0〉 con valores propios

|S = 1,MS = 1, 0,−1〉 → α− 3β~2

4+ β~2 = α+

β~2

4(28.51)

|S = 0,MS = 0〉 → α− 3β~2

4(28.52)

finalmente si redefinimos

α ≡ K − J

2; β ≡ −2J

~2(28.53)

los valores propios asociados al triplete y singlete quedan

|1,MS〉 → K − J

2− 2J

~2~2

4= K − J

|0, 0〉 → K − J

2+

2J

~23~2

4= K + J

8Para una discusion similar asociada al espın de una sola partıcula, ver Eq. (15.9), Pag. 391, y la discusion alrededor.

Page 640: Mecanica Cuantica: Notas de Clase

640 CAPITULO 28. EL ATOMO DE HELIO

por tanto, al diagonalizar W obtenemos los mismos autoestados y autovalores que encontramos con el operadorW definido en (28.4), como se puede ver de la Ec. (28.40). En un sentido efectivo, el potencial W (Hamiltonianoefectivo) actua de manera analoga al potencial realW . Ahora bien, el Hamiltoniano efectivo (28.47) tiene la formade la interaccion magnetica entre dos espines. Sin embargo, no es correcto decir que la energıa de acople entre loselectrones que son responsables de la aparicion de los dos terminos K±J , sea de origen magnetico. Un analisis deordenes de magnitud muestra que dos momentos magneticos iguales a los del electron y colocados a una distanciadel orden de 1 Armstrong entre ellos, tendrıan una energıa de interaccion mucho menor que J .

A pesar de lo anterior, la simplicidad de la estructura de W , hace que este Hamiltoniano efectivo se utilicecon frecuencia en lugar de W . Debe tenerse presente sin embargo, que es un termino efectivo que no nos describea priori el verdadero origen de la interaccion. Por ejemplo, una construccion similar se hace para la descripcionde materiales ferromagneticos, en los cuales los espines tienen la tendencia a alinearse paralelamente entre ellos.Puesto que el estado de espın serıa completamente simetrico (espines todos arriba o abajo), el principio de exclusionde Pauli requiere que el estado orbital sea completamente antisimetrico. Por las mismas razones que en el atomode Helio, la energıa de repulsion electronica es entonces mınima. Para estudiar este fenomeno se suele utilizarHamiltonianos efectivos de la forma (28.47). Sin embargo, una vez mas debe notarse que el origen de la interacciones tambien electrostatico y no magnetico.

28.4. Terminos espectrales que surgen de otras configuraciones excitadas

El segundo nivel excitado corresponde a la configuracion 1s, 2p. Para esta configuracion podemos hacer untratamiento analogo. En este caso tenemos L = 1 de modo que ML = 1, 0, o −1. Ahora bien, puesto que para laconfiguracion 1s, 2p las capas ocupadas por los dos electrones son diferentes (n 6= n′ y l 6= l′), los dos terminos 3Py 1P existen simultaneamente, donde 3P es nueve veces degenerado y 1P tiene degeneracion triple.

Un analisis similar al realizado para la configuracion 1s, 2s muestra que para la configuracion 1s, 2p el termino3P posee una energıa mas baja que la del termino 1P , y que la diferencia de energıas es proporcional a la integral deintercambio analoga a la obtenida en (28.46). Un estudio similar se puede realizar para las demas configuracionesdel tipo 1s, n′l′.

28.5. Validez del tratamiento perturbativo

A priori, para queW pueda tratarse coherentemente en forma perturbativa con respecto a H0, es necesario quelos corrimientos de energıa asociados con W [por ejemplo la integral de intercambio (28.46)] sean mucho menoresque las diferencias de energıa entre configuraciones (no perturbadas). Sin embargo, este no es el caso. Por ejemplo,para la configuracion 1s, 2s, los terminos (perturbados) 1S y 3S tienen una diferencia de energıa dada por

∣∣E[(1s, 2s)

(1S)]

− E[(1s, 2s)

(3S)]∣∣ ≃ 0,8eV

en tanto que la mınima distancia entre los niveles (no perturbados) 1s, 2s y 1s, 2p, esta dada por

∣∣E[(1s, 2p)

(3P)]

− E[(1s, 2s)

(1S)]∣∣ ≃ 0,35eV

Es notable que a pesar de lo anterior, el tratamiento hecho anteriormente es adecuado. Esto se debe a que paraconfiguraciones del tipo 1s, n′l′ tenemos que L = l′ (puesto que l = 0). En consecuencia, dado queW conmuta conL, posee elementos matriciales nulos entre estados con diferentes valores de L. En particular, W tiene elementosmatriciales nulos entre estados de la configuracion 1s, 2s y 1s, 2p.

Vemos por tanto que W acopla una configuracion 1s, n′l′ solo a una configuracion del tipo 1s, n′′l′ (dos capasdistintas que solo difieren en el valor de n), o del tipo nl, n′′l′′ con n y n′′ diferentes de uno. Este ultimo caso soloocurre cuando l y l′′ se adicionan para dar l′, y corresponderıa a estados doblemente excitados.

Page 641: Mecanica Cuantica: Notas de Clase

28.6. ESTRUCTURA FINA DEL ATOMO DE HELIO Y MULTIPLETES 641

28.6. Estructura fina del atomo de helio y multipletes

En el atomo de helio hemos tenido en cuenta hasta ahora solo interacciones de naturaleza electrostatica. Sinembargo, tambien existen las interacciones de ındole relativista como las estudiadas para el atomo de hidrogeno,esto es correcciones a la energıa cinetica, acoplamiento espın-orbita, y termino de Darwin. No obstante, en elcaso del atomo de helio la presencia simultanea de dos electrones da origen por ejemplo a un termino de acoplemagnetico espın-espın y orbita-orbita en el Hamiltoniano, que actua tanto en el espacio espinorial como en elorbital de estados de los dos electrones. Por fortuna, las diferencias de energıa que surgen de estos acoples deorigen relativista y magnetico son mucho menores que las existentes entre dos terminos espectrales diferentes. Portanto, el correspondiente Hamiltoniano de estructura fina se puede tratar perturbativamente.

En la presente seccion no pretendemos realizar un estudio detallado de la estructura fina asociada al atomo deHelio. Solo discutiremos las simetrıas del problema, y la notacion espectroscopica que surge para distinguir entrelos diferentes niveles de energıa.

Si despreciamos la contribucion espın-espın y orbita-orbita, la forma generica del Hamiltoniano de estructurafina tanto para el atomo de helio como para atomos de muchos electrones es de la forma

HSF ≃N∑

i=1

ξ (Ri) Li · Si (28.54)

donde Ri, Li y Si son los observables de posicion, momento angular y de espın asociados a cada electron. Sicalculamos el conmutador de este Hamiltoniano con los momentos angulares orbital y de espın tenemos

[HSF ,Lk] =

[HSF ,

N∑

m=1

L(m)k

]=

N∑

m=1

N∑

n=1

ξ (Rn)[L(n)p S(n)

p , L(m)k

]

[HSF ,Sk] =

N∑

m=1

N∑

n=1

ξ (Rn)[L(n)p S(n)

p , S(m)k

]

donde el superındice denota partıculas y el subındice denota componentes. Estos conmutadores quedan entoncesen la forma

[HSF ,Lk] =

N∑

m=1

N∑

n=1

ξ (Rn)L(n)p

[S(n)p , L

(m)k

]+[L(n)p , L

(m)k

]S(n)p

=

N∑

m=1

N∑

n=1

ξ (Rn)[L(n)p , L

(m)k

]S(n)p

=N∑

m=1

N∑

n=1

ξ (Rn) δnmi~εpkrL(n)r S(n)

p = i~N∑

n=1

ξ (Rn) εrpkL(n)r S(n)

p

[HSF ,Lk] = i~

N∑

n=1

ξ (Rn)[L(n) × S(n)

]k

[HSF ,Sk] =

N∑

m=1

N∑

n=1

ξ (Rn)[L(n)p S(n)

p , S(m)k

]=

N∑

m=1

N∑

n=1

ξ (Rn) L(n)p

[S(n)p , S

(m)k

]

= i~

N∑

m=1

N∑

n=1

ξ (Rn) L(n)p δnmεpkrS

(n)r = −i~

N∑

n=1

ξ (Rn) εprkL(n)p S(n)

r

[HSF ,Sk] = −i~N∑

n=1

ξ (Rn)[L(n) × S(n)

]k

tenemos entonces que[HSF ,L] = − [HSF ,S] 6= 0 ⇒ [HSF ,J] = 0 , J ≡ L+ S (28.55)

Page 642: Mecanica Cuantica: Notas de Clase

642 CAPITULO 28. EL ATOMO DE HELIO

la Ec. (28.55) implica que el Hamiltoniano de estructura fina no es invariante si rotamos solo las variables orbitaleso solo las variables de espın, pero sı es invariante bajo la rotacion simultanea de todas las variables orbitales y deespın. Por tanto, el momento angular total de los electrones es una constante de movimiento.

El espacio de estados asociado con un termino es expandido por los estados del tipo |n, l;n′, l′;L,ML;S,MS〉escritos en la Ec. (28.24), donde L y S son fijos, y tal que

−L ≤ML ≤ L ; −S ≤MS ≤ S

se puede demostrar que en este espacio los observables J2 y J3 forman un C.S.C.O. que de acuerdo con la Ec. (28.55)conmuta con HSF . En consecuencia los vectores propios |J,MJ 〉 comunes a J2 [con valores propios J (J + 1) ~2] ya J3 [con valor propio MJ~] son necesariamente autovectores de HSF con autovalor que depende de J pero no deMJ , debido a que HSF conmuta con J+ y J−. Las reglas de adicion del momento angular nos dicen que

J = L+ S, L+ S − 1, L+ S − 2, . . . , |L− S| (28.56)

De modo queHSF remueve parcialmente la degeneracion. Para cada “termino” aparecen tantos niveles distintoscomo valores de J , de acuerdo con la Ec. (28.56). Cada uno de estos niveles tiene una degeneracion 2J + 1 envirtud de su independencia conMJ y se denomina un “multiplete”. Estos multipletes poseen tambien una notacionespectroscopica: es la notacion espectroscopica del termino, a la que le anadimos un subındice a la derecha igualal valor de J . Veamos algunos ejemplos:

El estado base del atomo de helio nos da un solo multiplete 1S0.

Para la configuracion 1s, 2s, cada uno de los dos terminos 1S y 3S nos llevan a un solo multiplete: 1S0 y 3S1respectivamente.

Para la configuracion 1s, 2p, el termino 1P conduce a un solo multiplete 1P1, en tanto que el termino 3Pposee tres multipletes, 3P2,

3 P1 y 3P0. La posicion relativa de estos multipletes se ilustra en la Fig. 28.2.

La medida experimental y el calculo teorico de los multipletes que surgen de la configuracion 1s, 2p son degran importancia, debido a que conducen a un conocimiento bastante preciso de la constante de estructura finaα = e2/~c.

A partir de la estructura (28.54) del Hamiltoniano de estructura fina y utilizando el teorema de Wigner-Eckartse puede demostrar que la energıa del multiplete J es proporcional a J (J + 1) − L (L+ 1) − S (S + 1). Esto esvalido no solo para el atomo de helio sino para atomos de muchos electrones y se conoce como la “regla del intervalode Lande”. Para el helio los niveles 3P1 y 3P2 que surgen de la configuracion 1s, 2p son mucho mas cercanos delo que predice esta regla, debido a la importancia del acople magnetico dipolo-dipolo de los espines de los doselectrones, efecto que ha sido ignorado en el Hamiltoniano (28.54).

Por supuesto tambien surgen efectos debidos a la existencia del espın del nucleo. Sin embargo la estructurahiperfina que emerge existe solo para el isotopo 3He cuyo nucleo posee espın I = 1/2. El isotopo 4He tiene espınnuclear cero y por tanto no hay efectos hiperfinos.

Para el 3He cada multiplete de momento angular total electronico J se desdobla en dos niveles hiperfinos demomento angular total F = J±1/2, que serıa (2F + 1) veces degenerado, a menos que J = 0, en cuyo caso F solopuede tomar el valor 1/2.

Page 643: Mecanica Cuantica: Notas de Clase

28.6. ESTRUCTURA FINA DEL ATOMO DE HELIO Y MULTIPLETES 643

Figura 28.2: Ilustracion de la posicion relativa de los terminos espectrales y multipletes que surgen de la configura-cion 1s, 2p del atomo de helio. La distancia entre los tres multipletes 3P0,

3P1 y 3P2 se ha reescalado con respectoa la distancia entre los termino 1P y 3P , para que se pueda apreciar el desdoblamiento del termino 3P .

Page 644: Mecanica Cuantica: Notas de Clase

Capıtulo 29

Metodo de Hartree-Fock

La idea es estudiar la estructura electronica para atomos de N electrones (de hecho, el metodo es facilmenteextendible para el estudio de sistemas fısicos de N fermiones identicos). Como ya se ha discutido, una posibilidades dividir el Hamiltoniano total (27.1)1

H =N∑

i=1

[P2i

2me− Ze2

Ri

]+

N∑

i=1

N∑

j>i

e2

|Ri −Rj |; e2 ≡ q2

4πε0(29.1)

en un Hamiltoniano desacoplado H0 y un Hamiltoniano acoplado W en la forma

H = H0 +W (29.2)

H0 ≡N∑

i=1

[P2i

2me+ Vc (Ri)

], W ≡ −

N∑

i=1

[Vc (Ri) +

Ze2

Ri

]+

N∑

i=1

N∑

j>i

e2

|Ri −Rj |(29.3)

donde el potencial efectivo Vc (Ri) se introduce con el fin de que W se pueda considerar una perturbacion conrespecto a H0. Podemos definir tambien

Vc (Ri) ≡ −Ze2

Ri+ U (Ri) (29.4)

donde U (Ri) contendrıa la informacion del potencial efectivo promedio debida unicamente a los otros electrones.La idea es encontrar una solucion aproximada al problema de valores propios

Hψ (T) = Eψ (T) (29.5)

combinando un modelo de partıcula independiente (descrito por el Hamiltoniano H0) con el metodo variacional.Donde

T ≡ (T1, T2, . . . , TN ) ; Tk ≡ (rk, εk) (29.6)

es una abreviacion de las variables de posicion rk y de espın εk de cada partıcula. El metodo de Hartree-Fockbusca determinar la funcion ψHF (T) que nos proporcione la mejor aproximacion variacional a la solucion delproblema de valores propios (29.5) utilizando el modelo de partıcula independiente.

El punto de partida sera entonces una funcion de onda Φ (T) basada en un modelo de partıcula independientepara N electrones. Por tanto la funcion de prueba debe ser una combinacion lineal de uno o mas determinantes

1Hay una ligera diferencia entre el Hamiltoniano (27.1) y el Hamiltoniano (29.1), ya que para el primero asumimos que el numerode electrones es Z (atomo neutro), en tanto que en el segundo asumimos un numeros N de electrones que puede ser distinto de Z.

644

Page 645: Mecanica Cuantica: Notas de Clase

645

de Slater

D (T1, . . . ,TN ) =1√N !

∣∣∣∣∣∣∣∣∣

ψa1 (T1) ψa1 (T2) · · · ψa1 (TN )ψa2 (T1) ψa2 (T2) · · · ψa2 (TN )

......

. . ....

ψaN (T1) ψaN (T2) · · · ψaN (TN )

∣∣∣∣∣∣∣∣∣

D (T1, . . . ,TN ) =√N ! AΦH (T1, . . . ,TN )

ΦH (T1, . . . ,TN ) = ψa1 (T1) ψa2 (T2) . . . ψaN (TN )

donde A es el antisimetrizador definido en (26.32) Pag. 600 y ΦH es un producto de orbitales que denominamosfuncion de Hartree. ak representa los cuatro numeros cuanticos que identifican completamente cada orbital.La funcion de Hartree representa un sistema de N electrones independientes pero distinguibles. Ya sabemos quela antisimetrizacion hace que se introduzcan correlaciones entre espines y que surja el principio de exclusion dePauli, haciendo que los electrones no sean del todo independientes. Los orbitales pueden escribirse a su vez comoel producto de un orbital espacial y uno espinorial

ψak (Tk) = ϕak (rk)χ (εk) (29.7)

los espinores que describen un electron con espın arriba y abajo los denotaremos como α y β respectivamente

χ

(+1

2

)≡ α ; χ

(−1

2

)≡ β (29.8)

la notacion α (k) implica que el k−esimo electron tiene espın arriba. Puesto que nuestro Hamiltoniano no contienecorrecciones de espın, la ecuacion de valores propios (29.5) se convierte en una ecuacion puramente orbital

[− ~2

2m∇2k −

Ze2

rk+ U (rk)

]ϕak (rk) = εakϕak (rk) (29.9)

Vc (rk) = −Ze2

rk+ U (rk) (29.10)

por el momento los orbitales ψak (Tk) son desconocidos. Sin embargo, podemos suponer su existencia para escribirla energıa de interaccion efectiva U (rk) que experimenta el k−esimo electron debido a los otros electrones. Puestoque |ϕak (rk)|2 d3rk es la probabilidad de encontrar el k−esimo electron dentro del elemento de volumen d3rkcentrado en rk, se tiene entonces que la carga efectiva dQ dentro de dicho volumen viene dada por

dQ = −e |ϕak (rk)|2 d3rk

y la energıa de interaccion entre las cargas dQ y −e ubicadas en las posiciones rk y rj viene dada por

dU (|rk − rj |) = − e dQ

|rk − rj |=

e2

|rk − rj ||ϕak (rk)|2 d3rk

de modo que la energıa potencial U (rk) se obtiene integrando sobre todo el volumen (para incluır toda la cargaefectiva Q) y sumando sobre todos los demas electrones (j 6= k)

U (rk) = e2∑

j 6=k

∫ |ϕak (rk)|2|rk − rj|

d3rk (29.11)

Si conocieramos los N orbitales ϕak (rk) del problema de N electrones, podemos conocer el potencial efectivocompleto que experimenta cada uno de los electrones usando (29.11) junto con (29.10). Recıprocamente, si cono-cieramos el potencial efectivo Vc (rk) podrıamos determinar los orbitales usando las ecuaciones (29.9, 29.10) de

Page 646: Mecanica Cuantica: Notas de Clase

646 CAPITULO 29. METODO DE HARTREE-FOCK

valores propios. Sin embargo, en la practica no conocemos ni los orbitales ni los potenciales efectivos. El objetivodel metodo de Hartree-Fock es encontrar ambas cantidades de tal manera que resulten autoconsistentes. Es decir,que dadas las soluciones de los orbitales podamos determinar los potenciales efectivos por medio de (29.11) y queuna vez determinados dichos potenciales podamos insertarlos en las Ecs. (29.9) de manera que las soluciones de(29.9) reproduzcan los mismos orbitales, al menos en forma aproximada.

Estrictamente hablando, el metodo descrito hasta aquı no requiere asumir que el potencial efectivo Vc (rk)sea central. Cuando asumimos que dicho potencial es de caracter central hablamos del metodo restringidode Hartree-Fock. La aproximacion de campo central es particularmente acertada en el caso de capas cerradas,debido a que todos los momentos angulares son cero y esto le da simetrıa esferica al problema. En el caso de capasabiertas la aproximacion de campo central es menos acertada pero suele producir aun muy buenos resultados alconsiderar la aproximacion de llenado que consiste en promediar V (rk) [que no se considera central] sobre todoslos angulos en la forma

Vc (rk) ≡1

∫V (rk) dΩ

cuando se considera que Vc (rk) es central, exigimos que ψΓ (T) sea funcion propia de los operadoresH,L2, L3,S2, S3,

ya que todos ellos conmutan entre sı. Tenemos entonces que

HψΓ (T) = EΓψΓ (T) ; L2ψΓ (T) = l (l + 1) ~2ψΓ (T) ; L3ψΓ (T) = m~ψΓ (T)

S2ψΓ (T) = s (s+ 1) ~2ψΓ (T) ; S3ψΓ (T) = ε~ψΓ (T) (29.12)

Sin embargo, es posible que estos operadores no formen un C.S.C.O por lo cual el conjunto de todos los numeroscuanticos Γ podrıa contener numeros cuanticos adicionales a los de estos operadores

Γ ≡ (γ, l,m, s, ε) (29.13)

donde γ se refiere a los numeros cuanticos necesarios para definir la energıa, y tal vez otros numeros cuanticosadicionales requeridos para determinar al estado ψΓ.

Cada determinante de Slater es funcion propia de L3 y de S3. En consecuencia, las funciones ψΓ que satisfacenlas ecuaciones de valores propios (29.12) deben ser combinaciones lineales de determinantes de Slater asociados auna misma configuracion electronica y con los mismos valores de m y ε

ψγLS (T) =∑

λ

CλDγ(λ)LS (T) (29.14)

Donde los coeficientes Cλ son parametros variacionales que se escogen de manera que la funcion de onda (29.14)sea tambien funcion propia de L2 y S2. Si la capa es abierta tendremos en general varios coeficientes Cλ. Encontraste, si la capa es cerrada solo se requiere un determinante de Slater para describir la estructura electronicaya que en este caso L = S = J = 0.

29.1. Producto interno entre determinantes de Slater y un operador simetri-

co

Denotamos el determinante de Slater en la forma

D (a |T) ≡√N !A ψa (T) =

1√N !

N !∑

k=1

εkPk

N∏

i=1

ψai (Ti) (29.15)

D (a |T) =1√N !

∣∣∣∣∣∣∣∣∣

ψa1 (T1) ψa1 (T2) · · · ψa1 (TN )ψa2 (T1) ψa2 (T2) · · · ψa2 (TN )

......

. . ....

ψaN (T1) ψaN (T2) · · · ψaN (TN )

∣∣∣∣∣∣∣∣∣(29.16)

Page 647: Mecanica Cuantica: Notas de Clase

29.1. PRODUCTO INTERNO ENTRE DETERMINANTES DE SLATER Y UN OPERADOR SIMETRICO647

en algunas ocasiones se describe el determinante de Slater escribiendo solo la diagonal principal entre barras ocorchetes

D (a |T) ≡ 1√N !

|ψa1 (T1) ψa2 (T2) · · ·ψaN (TN )|

=1√N !

|ψ (a1 |1) ψ (a2 |2) · · ·ψ (aN |N )| (29.17)

sea O un observable simetrico de manera que conmuta con todas las N ! permutaciones

[Pk,O] = 0 ; k = 1, 2, . . . , N !

para propositos futuros, expresaremos los elementos matriciales del operador simetrico O en la base de un conjuntode determinantes de Slater (normalizados a uno)

〈D (b)| O |D (a)〉 ≡∫D∗ (b |T) O D (a |T) dT (29.18)

para calcular este elemento matricial, sustituımos (29.15) en (29.18)

〈D (b)| O |D (a)〉 ≡∫D∗ (b |T) O D (a |T) dT =

1√N !

N !∑

k=1

εk

∫D∗ (b |T) O Pk

N∏

i=1

ψai (Ti) dT

por construccion cada determinante de Slater es antisimetrico con respecto al grupo de permutaciones de las Npartıculas. Por tanto

PkD∗ (b |T) = εkD

∗ (b |T) (29.19)

siendo εk la paridad de la permutacion Pk. Teniendo en cuenta (29.19) y el hecho de que Pk conmuta con O setiene

〈D (b)| O |D (a)〉 = 1√N !

N !∑

k=1

∫[PkD

∗ (b |T)]

[Pk O

N∏

i=1

ψai (Ti)

]dT

ahora bien, es claro que la aplicacion del operador permutacion sobre un producto de funciones ψA y ψB esequivalente al producto de la aplicacion del permutador sobre cada funcion2

Pk [ψAψB ] = [PkψA] [PkψB ] (29.20)

con lo cual tenemos

〈D (b)| O |D (a)〉 = 1√N !

N !∑

k=1

∫Pk

[D∗ (b |T) O

N∏

i=1

ψai (Ti)

]dT

finalmente, el permutador solo cambia los rotulos de los argumentos de las funciones. Puesto que las variables deintegracion son mudas, el resultado no depende del rotulo asignado a cada variable. Por tanto, cada una de lasN ! permutaciones contribuye con el mismo valor al integrar. Con lo cual se obtiene finalmente

〈D (b)| O |D (a)〉 =√N !

∫D∗ (b |T) O

[N∏

i=1

ψai (Ti)

]dT

2La identidad (29.20) esta relacionada con el hecho de que la permutacion intercambia los ındices Ti en la funcion ψA (T1, . . . ,TN )ası como en la funcion ψB (T1, . . . ,TN), pero no intercambia un argumento de ψA con un argumento de ψB.

Page 648: Mecanica Cuantica: Notas de Clase

648 CAPITULO 29. METODO DE HARTREE-FOCK

sustituyendo la Ec. (29.15) en esta expresion tenemos que el elemento matricial se puede escribir alternativamenteen la forma

〈D (b)| O |D (a)〉 =N !∑

k=1

εk

∫dT

Pk

N∏

j=1

ψ∗bj (Tj)

[O

N∏

i=1

ψai (Ti)

]

en sıntesis, la representacion matricial de un operador simetrico O en la base de los determinantes de Slater D (a)viene dada por

〈D (b)| O |D (a)〉 ≡∫D∗ (b |T) O D (a |T) dT (29.21)

=√N !

∫D∗ (b |T) O [ψa1 (T1) ψa2 (T2) · · ·ψaN (TN )] dT (29.22)

=

N !∑

k=1

εk

∫dT

Pk[ψ∗b1 (T1) · · ·ψ∗

bN(TN )

]O [ψa1 (T1) · · ·ψaN (TN )] (29.23)

recordemos que el signo de integracion significa integracion sobre las variables espaciales de todos los electrones ysuma sobre las variables de espın, y que a ≡ a1, . . . , aN es una abreviacion que denota el conjunto de numeroscuanticos que definen a losN orbitales con los cuales se construye el determinante de Slater. En particular, tomandoO = 1, se puede verificar la ortonormalidad de los determinantes de Slater con base en la ortonormalidad de losorbitales.

Podemos escribir estos elementos matriciales de una forma mas condensada definiendo la funcion de Hartree

ΦH (T) ≡ ψa1 (T1) ψa2 (T2) · · ·ψaN (TN ) (29.24)

y la funcion auxiliar3

φk (T) ≡ Pk [ψa1 (T1) ψa2 (T2) · · ·ψaN (TN )] = PkΦH (T) (29.25)

de modo que la Ec. (29.23) se puede reeescribir como

〈D (b)| O |D (a)〉 =N !∑

k=1

εk

∫dT φ∗k (T) OΦH

〈D (b)| O |D (a)〉 =

N !∑

k=1

εk 〈φk (T)| O |ΦH (T)〉 (29.26)

29.1.1. Ejemplo de aplicacion para N = 3

Vamos a calcular explıcitamente el determinante de Slater para N = 3 i.e. un sistema de tres electrones. Elantisimetrizador se escribira como

A =1

3!P123 + P231 + P312 − P213 − P321 − P132

donde P123 es la identidad. Una funcion de Hartree tiene la forma

ΦH (T1,T2,T3) = ψa1 (T1)ψa2 (T2)ψa3 (T3)

3Recordemos que el permutador puede actuar sobre el conjunto T1, . . . ,TN, o sobre el conjunto a1, . . . , aN, pero no sobre losdos al tiempo, ya que en este ultimo caso el producto quedarıa invariante, pues solo se reordenarıan los orbitales en el producto.

Page 649: Mecanica Cuantica: Notas de Clase

29.2. VALOR ESPERADO DE LA ENERGIA 649

un determinante de Slater se escribe en la forma

D (T1,T2,T3) =√3!AΦH (T1,T2,T3)

=

√3!

3!P123 + P231 + P312 − P213 − P321 − P132 [ψa1 (T1)ψa2 (T2)ψa3 (T3)]

=1√3!

ψa1 (T1)ψa2 (T2)ψa3 (T3) + ψa1 (T2)ψa2 (T3)ψa3 (T1) + ψa1 (T3)ψa2 (T1)ψa3 (T2)

−ψa1 (T2)ψa2 (T1)ψa3 (T3)− ψa1 (T3)ψa2 (T2)ψa3 (T1)− ψa1 (T1)ψa2 (T3)ψa3 (T2)

D (T1,T2,T3) =1√3!

ψa1 (T1) [ψa2 (T2)ψa3 (T3)− ψa2 (T3)ψa3 (T2)]

+ψa1 (T2) [ψa2 (T3)ψa3 (T1)− ψa2 (T1)ψa3 (T3)]

+ψa1 (T3) [ψa2 (T1)ψa3 (T2)− ψa2 (T2)ψa3 (T1)]

D (T1,T2,T3) =1√3!

∣∣∣∣∣∣

ψa1 (T1) ψa1 (T2) ψa1 (T3)ψa2 (T1) ψa2 (T2) ψa2 (T3)ψa3 (T1) ψa3 (T2) ψa3 (T3)

∣∣∣∣∣∣

si rotulamos las permutaciones en la forma

P1 ≡ P123 ; P2 ≡ P231 ; P3 ≡ P312

P4 ≡ P213 ; P5 ≡ P321 ; P6 ≡ P132 (29.27)

el determinante de Slater tambien se puede escribir como

D (T1,T2,T3) =1√3!

P1 + P2 + P3 − P4 − P5 − P6ΦH (T)

=1√3!

φ1 (T) + φ2 (T) + φ3 (T)− φ4 (T)− φ5 (T)− φ6 (T)

29.2. Valor esperado de la energıa

Dado que la funcion de onda que describe al sistema deN electrones es una combinacion lineal de determinantesde Slater, es de gran utilidad calcular el valor esperado de la energıa con base en un determinante de Slater. Enparticular, cuando una capa es cerrada, la funcion de onda fısica estara dada por un solo determinante de Slaterde tal manera que este valor esperado de la energıa coincide con el valor promedio fısico de esta cantidad. En loque sigue a continuacion, nos limitaremos a calculos sobre capas cerradas.

Supongamos que tenemos una funcion de prueba Φ (T1, . . . ,TN ) que por simplicidad asumiremos normalizada.El teorema 21.1 Pag. 515 nos dice que la energıa del estado base E0 cumple con la desigualdad

E0 ≤ 〈Φ|H |Φ〉

Puesto que la capa es cerrada, suponemos que la funcion de prueba es un determinante de Slater

Φ = D (T1,T2, . . . ,TN )

Descompondremos el Hamiltoniano H de la Ec. (29.1) en la forma

H = H(0) +H(1) ; H(0) ≡N∑

i=1

[P2i

2me− Ze2

Ri

]; H(1) ≡

N−1∑

i=1

N∑

j=i+1

e2

|Ri −Rj |(29.28)

Page 650: Mecanica Cuantica: Notas de Clase
Page 651: Mecanica Cuantica: Notas de Clase
Page 652: Mecanica Cuantica: Notas de Clase
Page 653: Mecanica Cuantica: Notas de Clase
Page 654: Mecanica Cuantica: Notas de Clase
Page 655: Mecanica Cuantica: Notas de Clase
Page 656: Mecanica Cuantica: Notas de Clase
Page 657: Mecanica Cuantica: Notas de Clase
Page 658: Mecanica Cuantica: Notas de Clase
Page 659: Mecanica Cuantica: Notas de Clase
Page 660: Mecanica Cuantica: Notas de Clase
Page 661: Mecanica Cuantica: Notas de Clase
Page 662: Mecanica Cuantica: Notas de Clase
Page 663: Mecanica Cuantica: Notas de Clase