En los problemas de optimización, el método de los multiplicadores de Lagrange, llamados así en honor a Joseph Louis Lagrange, es un procedimiento para encontrar los máximos y mínimos relativos (o locales) de funciones de múltiples variables sujetas a restricciones.[1] Este método reduce el problema restringido con n variables a uno sin restricciones de n + k variables, donde k es igual al número de restricciones, y cuyas ecuaciones pueden ser resueltas más fácilmente. Estas nuevas variables escalares desconocidas, una para cada restricción, son llamadas multiplicadores de Lagrange. El método dice que los puntos donde la función tiene un extremo condicionado con k restricciones, están entre los puntos estacionarios de una nueva función sin restricciones construida como una combinación lineal de la función y las funciones implicadas en las restricciones, cuyos coeficientes son los multiplicadores.
La demostración usa derivadas parciales y la regla de la cadena para funciones de varias variables. Se trata de extraer una función implícita de las restricciones, y encontrar las condiciones para que las derivadas parciales con respecto a las variables independientes de la función sean iguales a cero.
Consideremos un caso tridimensional. Supongamos que tenemos la función, f (x, y), y queremos maximizarla, estando sujeta a la condición:
donde c es una constante. Podemos visualizar las curvas de nivel de f dadas por
para varios valores de dn, y el contorno de g dado por g(x, y) = c. Supongamos que hablamos de la curva de nivel donde g = c. Entonces, en general, las curvas de nivel de f y g serán distintas, y la curva g = c por lo general intersectará y cruzará muchos contornos de f. En general, moviéndose a través de la línea g=c podemos incrementar o disminuir el valor de f. Sólo cuando g=c (el contorno que estamos siguiendo) toca tangencialmente (no corta) una curva de nivel de f, no se incrementa o disminuye el valor de f. Esto ocurre en el extremo local restringido y en los puntos de inflexión restringidos de f.
Un ejemplo familiar puede ser obtenido de los mapas climatológicos, con sus curvas de nivel de presión y temperatura (isóbaras e isotermas respectivamente): el extremo restringido ocurrirá donde los mapas superpuestos muestren curvas que se tocan.
Geométricamente traducimos la condición de tangencia diciendo que los gradientes de f y g son vectores paralelos en el máximo. Introduciendo un nuevo escalar, λ, resolvemos
para λ ≠ 0.
Una vez determinados los valores de λ, volvemos al número original de variables y así continuamos encontrando el extremo de la nueva ecuación no restringida.
de forma tradicional. Eso es, para todo (x, y) satisfaciendo la condición porque es igual a cero en la restricción, pero los ceros de F(x, y) están todos en .
Sea f (x) una función definida en un conjunto abierto n-dimensional {x ∈ Rn}. Se definen s restricciones gk (x) = 0, k=1,..., s, y se observa (si las restricciones son satisfechas) que:
Se procede a buscar un extremo para h
lo que es equivalente a
Demostración |
Comencemos con el caso de una restricción.
Sea una superficie M contenida en Rn definida por g(x)=0 y sea f(x) la función a obtener su punto crítico. Si p M un punto crítico entonces se ha de cumplir: para todo v vector tangente a M en p (es decir, sea cual sea la dirección en la que nos desplacemos en M, el incremento de f a primer orden es nulo) La anterior condición significa que es perpendicular al tangente a M en p y dado que dim M=n-1 existe un único vector perpendicular linealmente independiente que viene dado por , de modo que se tiene: para algún número En el caso de que M esté definida por varias restricciones el conjunto de vectores perpendiculares al tangente a M en p viene generado por de modo que al ser perpendicular al vector tangente a M en p este ha de ser de la forma: para unos ciertos números |
Los multiplicadores desconocidos λk se determinan a partir de las ecuaciones con las restricciones y conjuntamente se obtiene un extremo para h que al mismo tiempo satisface las restricciones (i.e. gk=0), lo que implica que f ha sido optimizada
El método de multiplicadores de Lagrange es generalizado por las condiciones de Karush-Kuhn-Tucker.
Supongamos que queremos encontrar la distribución probabilística discreta con máxima entropía. Entonces
Podemos usar los multiplicadores de Lagrange para encontrar el punto de máxima entropía (dependiendo de las probabilidades). Para todo k desde 1 hasta n, necesitamos
lo que nos da
Derivando estas n ecuaciones, obtenemos
Esto muestra que todo pi es igual (debido a que depende solamente de λ). Usando la restricción ∑k pk = 1, encontramos
Esta (la distribución uniforme discreta) es la distribución con la mayor entropía.
Determinar los puntos en la esfera que están más cercanos al punto
la distancia al punto :
para hacer más sencilla la operación se maximiza o minimiza el cuadrado de la distancia:
la restricción:
De acuerdo con el método de los multiplicadores de Lagrange, se resuelven las ecuaciones " " y " " y el resultado es:
(1) (2) (3) (4)
la manera más sencilla de resolver estas ecuaciones es dejar x, y, z en función de y luego sustituimos en la ecuación (4).
En primer lugar se observa que ≠ 1 porque si obtenemos un resultado absurdo en la ecuación (1). Ahora, de la ecuación (1) obtenemos
y lo mismo sucede con las ecuaciones (2) y (3):
.
Sustituyendo en la ecuación (4)
se obtiene que
y entonces los puntos (x, y, z) son :
y
Uno de ellos es el más lejano (máximo de la función), y se puede observar que el punto más cercano es
Restricciones:
Aplicar el método:
Entonces:
Por lo tanto, los puntos críticos son:
Bastará entonces evaluar la función en esos puntos para determinar que:
por lo que en ambos puntos tiene un máximo en y un mínimo en si está restringida de esta manera.
Como en el caso no restringido en el que usamos la matriz Hessiana y el criterio de Sylvester para determinar la naturaleza de los puntos críticos, en presencia de multiplicadores de Lagrange existe un método análogo para descubrir si un punto crítico v0 es máximo, mínimo, o punto silla.
Sean f:U⊂ℝ2→ℝ y g:U⊂ℝ2→ℝ dos curvas suaves de clase C2. Sea v0∈U tal que g(v0)= c y sea S el conjunto de nivel de g con valor c. Asumimos que g(v0)≠0 y existe un número real tal que f(v0) = g(v0). Para la función auxiliar h = f - g tenemos la matriz hessiana limitada:
Análogamente al caso bidimensional, consideramos el caso n-dimensional, Sea f:U⊂ℝn→ℝ y g:U⊂ℝn→ℝ dos curvas suaves de clase C2. Sea v0∈U tal que g(v0)= c y sea S elconjunto de nivel de g con valor c. Asumimos que g(v0)≠0 y existe un número real tal que f(v0) = g(v0). Para la función auxiliar h = f - g construimos la matriz hessiana limitada:
Examinamos los determinantes de las submatrices en la diagonal de orden mayor o igual a 3: