La convexité d'une fonction de 2 variables

Étude de convexité de fonctions de 2 variables

L’étude d’une dérivée seconde permet de déterminer sur quels intervalles une fonction d’une variable est convexe ou concave et donc, entre autres applications, de savoir si un phénomène modélisable par une fonction est en train de ralentir ou de s’accélérer.

 

Le principe

Cependant, une fonction d’une seule variable ne peut modéliser que des phénomènes simples. Et il ne vous a pas échappé que nous vivons dans un monde complexe. En économie, par exemple, il est fréquent de recourir à des fonctions de deux variables. Graphiquement, la convexité d’une fonction s’apprécie par la forme que dessine une surface courbe. Les définitions de la convexité et de la concavité sont alors celles utilisées en topologie.

convexité

Fort logiquement, l’étude de la convexité ne repose plus sur une dérivée seconde mais sur une matrice hessienne, du moins si la fonction est deux fois dérivable. Rappel :

\[H = \left( {\begin{array}{*{20}{c}} {\frac{{{\partial ^2}f}}{{\partial {x^2}}}}&{\frac{{{\partial ^2}f}}{{\partial x\partial y}}}\\ {\frac{{{\partial ^2}f}}{{\partial y\partial x}}}&{\frac{{{\partial ^2}f}}{{\partial {y^2}}}} \end{array}} \right)\]

Pour simplifier les écritures, la notation de Monge est salvatrice : \(H = \left( {\begin{array}{*{20}{c}} r&s\\ s&t \end{array}} \right)\)

Retenons deux points quelconques de coordonnées \((x\,;y)\) et \((x'\,;y')\) situés sur la surface représentative de la fonction \(f\) et soit \(\lambda\) un nombre compris entre 0 et 1, la fonction est convexe si \(f[\lambda x + (1 - \lambda)x', \lambda y + (1 - \lambda)y']\) \(\leqslant\) \(\lambda f(x,y) + (1 - \lambda)f(x',y')\)

Elle est concave si le sens de l’inégalité change et strictement convexe (ou concave) si l’inégalité est stricte.

L’inégalité ci-dessus signifie que si la fonction est convexe et que, graphiquement, on relie deux de ses points en suivant la courbure de la surface représentative de \(f,\) alors cette liaison se trouve en-dessous d’un segment de droite qui relie ces deux points. Dit plus simplement, un bol posé à l’endroit est modélisable par une fonction convexe tandis que posé à l’envers, il représente une surface concave.

Du coup, des plans tangents situés SOUS une surface trahissent une convexité. Inversement, s’ils se situent au-dessus, la fonction étudiée est concave.

La formule ci-dessus n’est toutefois guère opérationnelle. Pour un calcul manuel, on préfère employer le déterminant de la matrice hessienne : \(D = rt - s^2.\)

Si \(D < 0,\) on ne peut pas conclure. Si \(D > 0,\) \(f\) est soit convexe soit concave. Il faut alors s’intéresser à \(r.\) S’il est positif, \(f\) est convexe. S’il est négatif, \(f\) est concave. Il s’agit de conditions suffisantes mais non nécessaires puisque tout peut arriver si le déterminant est négatif...

Lorsque \(f\) est convexe, elle admet un minimum global et lorsqu’elle est concave, elle admet un maximum global. Si la convexité ou la concavité n’est observée que localement, l’extremum est bien entendu local.

L’étude de la convexité permet donc de connaître la nature d’un extremum. De nombreux problèmes d’optimisation consistent à rechercher ces points. La procédure consiste à d’abord déterminer un ou des points candidats par annulation des dérivées partielles premières puis à en connaître la nature grâce à la matrice hessienne (maximum, minimum ou point selle).

Une combinaison linéaire de fonctions convexes dont tous les coefficients sont positifs se traduit par une fonction convexe (idem pour la concavité).

Astuce : si l’on cherche à connaître la convexité de \(f(x\,;y) = g(x) + h(y),\) on vérifie la convexité de \(g\) et de \(h.\) Si les deux sont convexes (ou concaves), on détermine tout de suite la convexité de \(f\) sans passer par la hessienne puisque c’est une simple étude de deux fonctions d’une variable. Par exemple, \(f(x\,;y) = \ln x - e^y\) est une fonction concave puisque \(\ln x\) et \(-e^y\) sont deux fonctions concaves.

 

Exercice

N'allons pas chercher l’originalité. Soit la fonction \(f(x , y) = x^2 + y^2,\) définie sur \(\mathbb{R}^2.\) Comme vous connaissez certainement la parabole représentative de la fonction carré, vous vous doutez certainement que \(f\) est convexe. Vérifions-le.

D’abord les dérivées premières…

\(\frac{\partial f}{\partial x} = 2x\) et \(\frac{\partial f}{\partial y} = 2y\)

Puis les dérivées secondes…

\(\frac{\partial ^2 f}{\partial x^2} = 2,\) \(\frac{\partial ^2 f}{\partial y^2} = 2\) et \(\frac{\partial ^2 f}{\partial xy} = \frac{\partial ^2 f}{\partial yx} = 0\)

La matrice hessienne apparaît dans toute sa splendeur…

\(H = \left( {\begin{array}{*{20}{c}} 2&0\\ 0&2 \end{array}} \right)\)

Son déterminant est égal à 4, donc \(D > 0\) quels que soient \(x\) et \(y.\) On remarque aussi que \(r = 2\) donc \(> 0.\) Bingo ! \(f\) est convexe partout.

Illustration (avec Excel) :

x² + y²

 

concavité