Les aberrations optiques

Je présente ici une façon simple de retrouver la forme analytique des aberrations optiques d'ordre trois (aberrations de sphéricité, coma, astigmatisme, courbure de champ et distorsion) à partir d'un simple développement limité de la trajectoire d'un rayon lumineux. Ce traitement, utilisant les nombres complexes, est quelque peu différent du traitement original de Seidel. Par rapport à ce dernier, il présente l'avantage de sa simplicité. L'inconvénient est qu'il décrit la coma par deux coefficients indépendants, alors que le traitement de Seidel montre que ces coefficients sont liés. Je ne parle pas ici de l'aberration chromatique qui a une origine différente et qui apparaît à l'ordre un dans les paramètres de ce développement.

Attention : n'ayant pas eu beaucoup de retours sur la première version de ce document, je ne me suis pas senti motivé pour le faire très complet. Au niveau de la description qualitative des aberrations, je montre la méthode pour l'aberration de sphéricité et la coma. Pour les trois autres aberrations je donne seulement les étapes à suivre en laissant les détails comme exercice pour le lecteur.

Plan


En deux dimensions

Très souvent, quand on étudie l'optique de Gauss, on fait des constructions géométriques en deux dimensions et on en déduit les caractéristiques du système optique qu'on étudie. Or, si on considère un rayon quelconque qui entre dans le système optique, il n'y a aucune raison pour que ce rayon et l'axe optique se trouvent dans un même plan. Il y a donc quelque chose de fondamentalement incorrect à traiter un système optique réel comme s'il n'avait que deux dimensions. Pourtant, le traitement en deux dimensions présente quand même deux intérêts :

  1. dans la pratique, et curieusement, il marche plutôt bien ;
  2. il est beaucoup plus simple.

Je vais donc commencer, moi aussi, par traiter le problème en deux dimensions avant de généraliser en trois dimensions.

Formalisme

[Définition des notations]

La figure ci-dessus définit nos notations. On considère un système optique centré quelconque. Par « centré » on entend qu'il possède un axe de symétrie qu'on appelle « axe optique ». Ce système est représenté dans la figure ci-dessus par un gros point d'interrogation. On considère un rayon (en rouge) qui entre dans le système par la gauche et ressort par la droite. On choisit deux plans de référence P1 et P2 qui permettent de repérer respectivement les rayons incident (d'entrée) et émergent (de sortie).

Le rayon incident est repéré par les coordonnées h et t. h est la hauteur au dessus de l'axe optique du point où le rayon croise P1. t est la tangente de l'angle que fait ce rayon avec l'axe optique. De la même manière, le rayon émergent est repéré par les coordonnées h' et t' par rapport au plan P2. Toutes ces grandeurs sont algébriques, positives si elles sont « vers le haut  ».

Pour décrire complètement le système optique, il faut qu'on donne les coordonnées du rayon émergent qui correspond à chaque rayon incident. Autrement dit, il faut qu'on détermine les fonctions h'(h, t) et t'(h, t).

Exemples

Deux exemples simples aideront à comprendre ce formalisme : le système « vide » et la lentille mince.

Translation

C'est le système optique le plus simple : simplement un espace vide entre les plan P1 et P2. On peut le considérer comme une simple translation du plan de référence.

[Schéma d'une translation]

Si l est la distance qui sépare les deux plans, les équations qui décrivent la translation sont simplement

h' = h + tl
t' = t

Lentille mince

Supposons que nous utilisons une lentille mince de focale f pour obtenir l'image d'un objet qui est à l'infini (paysage, objet astronomique...). L'image se trouvant alors dans le plan focal image, c'est à cet endroit qu'on va mettre l'écran, le film photographique ou le capteur CCD. Il est donc commode de choisir ce plan pour le plan P2 servant à repérer le rayon émergent. Quand au rayon incident, on va le repérer par le point où il frappe la lentille. P1 est donc le plan de la lentille.

[Schéma d'une lentille]

Nous nous plaçons pour le moment dans le cadre de l'optique de Gauss. Pour construire le rayon émergent correspondant au rayon incident dessiné en rouge, on va considérer un rayon supplémentaire (pointillés rouges) qui est parallèle au rayon qui nous intéresse (même valeur de t) et qui passe par le centre de la lentille. Les règles de l'optique de Gauss nous disent que ce rayon n'est pas dévié par la lentille et que les deux rayons se croisent au plan focal P2. Comme ce rayon supplémentaire n'est pas dévié, il va croiser le plan P2 en h' = ft. Comme les deux rayons se croisent en P2, ils auront la même valeur de h'. La valeur de t' s'en déduit facilement en remarquant sur la figure que t' = (h' - h) / f. Pour la lentille mince ainsi étudiée, on a alors

h' = ft
t' = -h/f + t

Développement limité

Revenons maintenant au cas général. Nous avons un système optique centré et nous voulons déterminer h' et t' en fonction de h et de t. Nous allons considérer h et t comme des petits paramètres et nous allons développer h' et t' en puissances de ces petits paramètres. On peut donc écrire

h' = h'0 + h'1(h, t) + h'2(h, t) + ...
t' = t'0 + t'1(h, t) + t'2(h, t) + ...

h'j et t'j sont des polynômes de degré j. Mais puisque le système est symétrique par rapport à l'axe optique, on sait que si on on fait la substitution

h -> -h
t -> -t,

alors on aura

h' -> -h'
t' -> -t',

ce qui veut dire que tous les termes de degré pair du développement sont nuls. Le développement s'écrit donc

h' = h'1(h, t) + h'3(h, t) + h'5(h, t) + ...
t' = t'1(h, t) + t'3(h, t) + t'5(h, t) + ...

Aberrations

Pour décrire les aberrations, on va revenir au cas de la lentille mince étudié précédemment. On peut remarquer que les équations qu'on avait trouvées pour h' et t' sont linéaires en h et t. Ceci n'est pas une particularité de la lentille mince, c'est dû simplement au fait que les formules et les règles de construction de l'optique de Gauss constituent en fait la théorie à l'ordre 1 des systèmes optiques centrés. Dans une vraie lentille, les termes d'ordre 3 et plus sont aussi présents. On les appelle collectivement aberrations. Les aberrations les plus connues et étudiées sont celles correspondant aux termes d'ordre 3. On les appelle aberrations de Seidel, du nom du mathématicien allemand qui les a étudiées au 19e siècle. Ce sont ces aberrations qui nous intéressent ici.

Comme ce qui nous intéresse est l'image produite par la lentille, on veut seulement connaître la position où le rayon émergent frappe l'écran, le film ou le CCD. On s'intéresse donc uniquement à h' et pas du tout à t'. Comme l'objet est à l'infini, on repère les points de l'objet par leur position angulaire, c'est à dire par la direction t dans laquelle arrivent les rayons lumineux issus de ce point. L'ensemble des rayons issus d'un point objet qui frappent la lentille constitue un cylindre de direction t s'appuyant sur le bord du diaphragme d'entrée. C'est donc un ensemble de rayons ayant tous une même valeur de t et toutes les valeurs possibles de h telles que |h| < R, R étant le rayon du diaphragme.

En absence d'aberrations, on aurait h' = ft, ce qui traduit simplement la proportionnalité entre la position angulaire t du point objet et la position h' du point image. En tenant compte des aberration de Seidel, on a

h' = ft + h'3(h, t)

où le premier terme représente la position idéale d'arrivée du rayon et le deuxième terme est une petite perturbation qui dégrade l'image. Si on explicite cette perturbation, on a

h'3(h, t) = a30h3 + a21h2t + a12ht2 + a03t3

où les différents termes portent les noms suivants :

On peut remarquer que plus on ouvre le diaphragme (plus on accepte des grandes valeurs de |h|), plus les aberrations seront importantes. Elles deviennent aussi d'autant plus importantes qu'on regarde vers les bords du champ (valeurs de t élevées). Cependant, chaque aberration a sa façon spécifique de dépendre de chacun de ces deux paramètres que sont l'ouverture du diaphragme et la position dans le champ.

Mais pour décrire plus précisément les aberrations, et en particulier pour distinguer l'astigmatisme de la courbure de champ, on ne peut pas continuer à travailler en deux dimensions.

En trois dimensions

En trois dimensions il faut quatre coordonnées pour repérer un rayon : deux pour la position où il frappe un plan de référence et deux pour son orientation. Une façon simple de généraliser l'étude précédente consiste à considérer que les coordonnées h et t qui repèrent les rayons sont des nombres complexes. Ainsi, comme le montre la figure ci-dessous, la position où un rayon frappe un plan de référence est repérée par les coordonnées cartésiennes Re(h) et Im(h).

[Définition des notations en trois dimensions]

Pour repérer l'orientation du rayon, on appelle Re(t) et Im(t) les coordonnées de la projection sur le plan de référence du vecteur unitaire porté par le rayon. Dit d'une autre façon, on définit t de façon à ce que la translation du plan de référence corresponde toujours à la transformation

h' = h + tl
t' = t.

Pour un système quelconque, on peut donc développer h' et t' en puissances de Re(h), Im(h), Re(t) et Im(t). De façon équivalente (et plus commode ici), on peut développer en puissances de h, h*, t et t*, l'étoile représentant la conjugaison complexe. Ça fait beaucoup de paramètres, donc beaucoup de termes dans le développement. Il faut utiliser les symétries pour en éliminer.

Symétries

L'argument sur la symétrie par rapport à l'axe optique est toujours valable. On peut donc éliminer tous les termes de degré pair. Mais nous avons aussi une nouvelle symétrie : l'invariance du système par une rotation d'un angle a quelconque autour de l'axe optique. Si on fait donc la transformation

h -> eiah
t -> eiat

alors on doit avoir

h' -> eiah'
t' -> eiat'.

Si on applique cette transformation à un terme de la forme ajklmhjh*ktlt*m, il est transformé en ei(j+l-k-m)aajklmhjh*ktlt*m. On en déduit que seuls sont non nuls les coefficients ajklm tels que j+l-k-m = 1.

Nous avons aussi la symétrie par rapport au plan horizontal, c'est à dire par rapport au plan où h et t sont réels. Si on fait la transformation

h -> h*
t -> t*

alors on doit avoir

h' -> h'*
t' -> t'*.

La transformation ci-dessus transforme ajklmhjh*ktlt*m en ajklmh*jhkt*ltm. On en déduit que ajklm = a*jklm. Autrement dit, tous les coefficients ajklm sont réels.

Développement

On peut reprendre maintenant notre développement en série. On a à nouveau, pour un système quelconque,

h' = h'1(h, t) + h'3(h, t) + h'5(h, t) + ...
t' = t'1(h, t) + t'3(h, t) + t'5(h, t) + ...

Si on ne s'intéresse qu'à h' (c'est analogue pour t'), on a pour l'ordre 1

h'1(h, t) = a1000h + a0010t

et pour l'ordre 3

h'3(h, t) = a2100h2h* + a2001h2t* + a1110hh*t + a0120h*t2 + a1011htt* + a0021t2t*

À l'ordre 1 on peut remarquer quelque chose de très intéressant : il n'y a pas de terme en h* ou t*. Autrement dit, tout se passe comme quand on était à deux dimensions. C'est la raison pour laquelle l'optique de Gauss, décrite bien souvent en deux dimensions, semble « marcher comme par magie » en trois dimensions.

Description des aberrations

Si on revient au cas de la lentille qui nous intéresse, on a à nouveau

h' = ft + h'3(h, t)

ft est la position idéale et h'3(h, t) est la perturbation. On peut faire l'identification suivante :

Pour comprendre qualitativement l'effet de chacune de ces aberrations, il faut prendre ces termes un par un et imaginer que c'est la seule aberration présente dans le système. On écrit donc

h' = ft + ajklmhjh*ktlt*m

ajklmhjh*ktlt*m est le terme qui nous intéresse. On considère ensuite un point de l'objet (c'est à dire une valeur donnée de t) et on regarde l'effet de l'aberration sur son image. Cette image est formée par tous les rayons incidents ayant cette valeur particulière de t et toutes les valeurs possibles de h telles que |h| < R, R étant le rayon du diaphragme.

En toute logique, il faudrait maintenant que je fasse des dessins pour expliquer une par une ces aberrations. Si je ne le fais pas c'est essentiellement parce que c'est au dessus de mes forces. Par ailleurs, il est très facile de trouver des livres ou des sites web où ces schémas sont très bien faits. Ce qui est beaucoup plus difficile à trouver, c'est une explication qui montre la relation logique qu'il y a entre ce qu'on voit dans ces schémas et les termes du développement limité. Je vais donc essayer de montrer cette relation logique ci-dessus. Pour lire ce qui suit, il serait bon que vous ayez les schémas dans la tête ou devant vous. Vous pouvez par exemple consulter les références à la fin de ce document.

Aberration de sphéricité

C'est le terme a2100h2h*. Comme c'est le seul à être non nul pour t = 0, c'est la seule aberration présente au centre du champ. Une lentille présentant uniquement cette aberration a pour équations

h' = ft + a2100h|h|2
t' = -h/f + t.

Il est intéressant ici de défocaliser l'image en appliquant une translation de distance l en aval de cette lentille. L'effet de la translation est donné par :

h'' = h' + t'l

(t'' ne nous intéresse pas), ce qui combiné à la lentille donne :

h'' = (f + l)t + (a2100|h|2 - l/f)h.

Supposons maintenant qu'on met devant la lentille une sorte de diaphragme en forme de mince couronne qui ne laisse passer que les rayons qui frappent ce diaphragme à une distance donnée du centre. Les rayons ainsi acceptés vont tous avoir une même valeur de |h|. Dans ces circonstances, on peut retrouver une image nette juste en défocalisant convenablement la lentille. En effet, si on défocalise d'une distance

l = fa2100|h|2,

alors on aura

h'' = (f + l)t,

ce qui est l'équation d'une lentille sans aberrations de distance focale (f + l). Dans les lentilles minces sphériques, a2100 est toujours négatif. La défocalisation l doit donc aussi être négative (on doit rapprocher l'écran de la lentille) et d'autant plus grande que |h| est grand (le rayon passe près du bord). C'est pour ça que cette aberration est décrite de façon qualitative en disant que les rayons passant près du bord de la lentille convergent plus près de celle-ci que les rayons passant près du centre.

Coma isotrope

Je ne sais pas comment appeler ce terme là : a2001h2t*, alors appelons-le coma isotrope. Pour le décrire, remettons devant notre lentille le diaphragme couronne utilisé précédemment. On peut alors écrire

h = |h|eia

|h| est fixé par notre diaphragme et a est variable. Dans ce cas, pour un point donné de l'objet (t fixe), la position de l'image est donnée par

h' = ft + a2001|h|2t*e2ia

où seul a est variable. Ceci est l'équation d'un cercle de centre ft (position idéale de l'image) et de rayon |h|2|a2001t|. Si on retire notre diaphragme couronne, on va accepter tous les rayons incidents dont |h| est inférieur au rayon R de la lentille. On obtient donc un disque de centre ft et de rayon |a2001R2t|.

Coma sagittale

C'est le terme a1110hh*t. En reprenant notre diaphragme couronne bien aimé (|h| fixé), on voit que chaque point de l'objet (t fixé) donne une image en

h' = (f + a1110|h|2)t.

Tout est fixé ici. L'image d'un point est un point. En supposant que a1110 est positif, on remarque seulement que les rayons convergent un peu trop loin du centre de l'image, et ce d'autant plus qu'ils passent près du bord de la lentille. Quand on retire le diaphragme, |h| peut varier entre 0 et R. L'image d'un point est donc un segment de droite orienté dans la direction du centre du champ.

Coma

En fait les deux termes de coma ne sont pas indépendants. Ceci n'est pas apparent dans le développement limité, mais un traitement plus détaillé du problème montre qu'on a toujours deux fois plus de coma sagittale que de coma isotrope (|a1110| = 2|a2001|). Le traitement de Seidel montre ceci implicitement puisqu'il décrit les aberrations par seulement cinq coefficients indépendants. Mais ceci au prix d'une plus grande complexité.

Si on reprenait notre diaphragme couronne, on verrait qu'avec ce diaphragme l'image d'un point est un cercle dont le centre est décalé par rapport à la position idéale de l'image. Le décalage est le double du rayon du cercle. Quand on retire le diaphragme, on a la superposition d'une multitude de cercles avec des rayons et des décalages différents. Ceci produit l'image en cornet de glace qui est souvent associée à cette aberration.

Astigmatisme

Je vous avais prévenus des exercices pour la fin ;-). Il reste trois aberrations à décrire. Je mets ci-dessous les idées à développer. Si vous trouvez ça frustrant ça veut dire que vous êtes au moins arrivés jusqu'ici. Dans ce cas dites-le moi, ça m'encouragera à continuer !

L'astigmatisme c'est a0120h*t2. Plus compliqué que les autres. Prendre un diaphragme en forme de fente fixant l'argument de h. Mettre la fente dans le plan d'incidence. Montrer qu'on retrouve une image ponctuelle par défocalisation. Tourner la fente de 90°. Montrer qu'on retrouve une image ponctuelle par défocalisation dans l'autre sens. Ça aide de prendre t réel, ce qu'on peut faire sans perte de généralité.

Courbure de champ

a1011htt*. Pas de diaphragme nécessaire, il suffit de défocaliser. Défocalisation en |t|2. Trouver l'équation du « plan » de netteté qui est en fait courbe. D'où le nom de l'aberration.

Distorsion

a0021t2t*. Rien à faire. Toute l'image est nette dans un même plan. Grossissement non linéaire. L'image d'une droite ne passant pas par le centre est courbe.

Références


Edgar Bonet <webmaster@edg...>.
[pour une Europe sans brevets logiciels] [HTML by Vim] [HTML 4.01 valide !]