14. Выпуклые функции

Определение. Пусть X – промежуток, f: X\to\mathbb{R}. Функция f называется выпуклой, если всякий отрезок, соединяющий две произвольные точки графика функции f, лежит не ниже дуги графика функции f, соединяющей эти точки.

Пусть x_1,x_2\in X,x\in(x_1,x_2). Найдем ординату точки C. Из подобия треугольников ABD и ACE имеем

\displaystyle y=f(x_1)+{x-x_1\over x_2-x_1}(f(x_2)-f(x_1)).

Условие выпулости функции f запишется следующим образом:

\begin{array}{l}<br />
\forall x_1,x_2\in X\ x_1<x_2\ \forall x\in[x_1,x_2]\\[4mm]<br />
\displaystyle<br />
f(x)\le f(x_1)+{x-x_1\over x_2-x_1}(f(x_2)-f(x_1)).\hskip6.7cm (1)<br />
\end{array}

\displaystyle f(x)\le{x_2-x\over x_2-x_1}f(x_1)+{x-x_1\over x_2-x_1}f(x_2).<br />

Перепишем это условие в несколько ином виде.
\begin{array}{l}<br />
(x_2-x_1)f(x)\le(x_2-x)f(x_1)+(x-x_1)f(x_2),\\[2mm]<br />
((x_2-x)+(x-x_1))f(x)\le(x_2-x)f(x_1)+(x-x_1)f(x_2),\\[2mm]<br />
(x_2-x)f(x)+(x-x_1)f(x)\le(x_2-x)f(x_1)+(x-x_1)f(x_2),\\[2mm]<br />
(x_2-x)(f(x)-f(x_1)\le(x-x_1)(f(x_2)-f(x)).<br />
\end{array}

\displaystyle {f(x)-f(x_1)\over x-x_1}\le{f(x_2)-f(x)\over x_2-x}.\hskip8.3cm (2)

Очевидно, что (1)\Leftrightarrow(2).

Функция выпукла в том и только в том случае, если \forall x_1,x_2,x:\ x_1<x<x_2 выполняется условие (2).

Теорема (критерий выпуклости для дифференцируемых функций). Пусть f:X\to\mathbb{R}, X – промежуток, функция f дифференцируема. Функция f является выпуклой тогда и только тогда, когда функция f^{\prime} возрастает.

Доказательство. \Rightarrow

Так как f выпукла, то выполняется неравенство (2). Перейдем к пределу в этом неравенстве сначала при x\to x_1, а затем при x\to x_2. По теореме о предельном переходе в неравенствах имеем

\begin{array}{l}<br />
\displaystyle<br />
\lim_{x\to x_1}{f(x)-f(x_1)\over x-x_1}\le\lim_{x\to x_1}{f(x_2)-f(x)\over x_2-x},\\[4mm]<br />
\displaystyle<br />
f^{\prime}(x_1)\le{f(x_2)-f(x_1)\over x_2-x_1},\\[4mm]<br />
\displaystyle<br />
\lim_{x\to x_2}{f(x)-f(x_1)\over x-x_1}\le\lim_{x\to x_2}{f(x_2)-f(x)\over x_2-x},\\[4mm]<br />
\displaystyle<br />
{f(x_2)-f(x_1)\over x_2-x_1}\le f^{\prime}(x_2).<br />
\end{array}
\forall x_1,x_2,x_1<x_2 f^{\prime}(x_1)\le f^{\prime}(x_2), значит, f^{\prime} возрастает.

\Leftarrow

Возьмем любые x_1,x_2,x\in X,\ x_1<x<x_2. Применим теорему Лагранжа к функции f на промежутке [x_1,x], а затем на [x,x_2]:

\begin{array}{l}<br />
\displaystyle<br />
\exists c_1\in (x_1,x):\ {f(x)-f(x_1)\over x-x_1}=f^{\prime}(c_1),\\[4mm]<br />
\displaystyle<br />
\exists c_2\in (x,x_2):\ {f(x_2)-f(x)\over x_2-x}=f^{\prime}(c_2),\\[4mm]<br />
c_1<c_2.<br />
\end{array}
Так как f^{\prime} возрастает, то f^{\prime}(c_1)\le f^{\prime}(c_2) \Rightarrow

\displaystyle {f(x)-f(x_1)\over x-x_1}\le {f(x_2)-f(x)\over x_2-x}.

Отсюда следует, что f выпукла.

Теорема. Пусть f:X\to\mathbb{R}, X – промежуток, f дифференцируема. Тогда функция f выпукла тогда и только тогда, когда график функции f лежит выше всякой касательной к графику.

Доказательство. Уравнение касательной к графику функции f в точке с абсциссой a имеет вид

y=l(x),\ l(x)=f(a)+f^{\prime} (a)(x-a).

\Rightarrow

Рассмотрим разность

f(x)-l(x)=f(x)-f(a)-f^{\prime}(a)(x-a).

По теореме Лагранжа, примененной к промежутку с концами a,x

\exists c\in(a,x):\ f(x)-f(a)=f^{\prime}(c)(x-a).

Так как f выпукла, то f^{\prime} возрастает.

1)
\begin{array}{l}<br />
a<x\Rightarrow c>a\Rightarrow f^{\prime}(a)\le f^{\prime}(c)\\[2mm]<br />
\left.\begin{array}{l}<br />
f^{\prime}(c)-f^{\prime}(a)\ge0,\\<br />
x-a>0,<br />
\end{array}\right|\Rightarrow f(x)-l(x)\ge0,\\<br />
f(x)\ge l(x).<br />
\end{array}

2)
\begin{array}{l}<br />
x<a\Rightarrow c<a\Rightarrow f^{\prime}(c)\le f^{\prime}(a)\\[2mm]<br />
\left.\begin{array}{l}<br />
f^{\prime}(c)-f^{\prime}(a)\le0,\\<br />
x-a<0,<br />
\end{array}\right|\Longrightarrow f(x)-l(x)\ge0,\\<br />
f(x)\ge l(x).<br />
\end{array}

3)
x=a\ f(x)=l(x).

Значит, \forall x\ f(x)\ge l(x).

\Rightarrow

\begin{array}{ll}<br />
\forall x,a\in X&f(x)-f(a)-f^{\prime}(a)(x-a)\ge0,\\<br />
&f(x)-f(a)\ge f^{\prime}(a)(x-a),\\<br />
a<x&\displaystyle {f(x)-f(a)\over x-a}\ge f^{\prime}(a),\\[4mm]<br />
a>x&\displaystyle {f(x)-f(a)\over x-a}\le f^{\prime}(a).<br />
\end{array}
Вместо a берем x, вместо xx_1:

\displaystyle {f(x_1)-f(x)\over x_1-x}\le f^{\prime}(x).

Вместо a берем x, вместо xx_2:

\displaystyle {f(x_2)-f(x)\over x_2-x}\ge f^{\prime}(x).

Отсюда

\displaystyle {f(x_2)-f(x)\over x_2-x}\ge {f(x_1)-f(x)\over x_1-x}.

Замечание. Рассмотренные нами выпуклые функции иногда называют выпуклыми вниз функциями. Аналогично определяются выпуклые вверх (вогнутые) функции, для которых справедливы аналогичные теоремы.

Определение. Если в окрестности точки a точки графика функции f лежат как выше, так и ниже касательной, то точка a называется точкой перегиба.

Определение выпуклости равносильно следующему

Утверждение. Функция f выпукла тогда и только тогда, когда \forall x_1,x_2\in X \forall\alpha_1,\alpha_2\in\mathbb{R}, \alpha_1,\alpha_2\ge0, \alpha_1+\alpha_2=1

f(\alpha_1x_1+\alpha_2x_2)\le\alpha_1f(x_1)+\alpha_2f(x_2).

Это утверждение следует из следующего утверждения:

x\in[x_1,x_2]\Leftrightarrow\exists \alpha_1,\alpha_2\ge0,\<br />
\alpha_1+\alpha_2=1:\ x=\alpha_1x_1+\alpha_2x_2.

Доказательство. Необходимость. Пусть x\in[x_1,x_2]. Положим \alpha_2=1-\alpha_1. Тогда

\begin{array}{l}<br />
x=\alpha_1x_1+(1-\alpha_1)x_2,\\[2mm]<br />
\displaystyle<br />
\alpha_1={x_2-x\over x_2-x_1},\ \alpha_2={x-x_1\over x_2-x_1}.<br />
\end{array}

Очевидно, что все условия на \alpha_1,\alpha_2 выполнены.

Достаточность. Пусть x=\alpha_1x_1+\alpha_2x_2, \alpha_1,\alpha_2\ge0, \alpha_1+\alpha_2=1. Нужно доказать, что \alpha_1x_1+\alpha_2x_2\in[x_1,x_2]. Докажем, что x_1\le\alpha_1x_1+\alpha_2x_2.

\begin{array}{l}<br />
(\alpha_1-1)x_1+\alpha_2x_2\ge0,\\<br />
-\alpha_2x_1+\alpha_2x_2\ge0,\\<br />
\alpha_2(x_2-x_1)\ge0<br />
\end{array}

- а это очевидно.

Замечание. Доказано больше: \forall x\in[x_1,x_2] найдется единственная пара чисел \alpha_1,\alpha_2\ge0, \alpha_1+\alpha_2=1, такая, что \alpha_1x_1+\alpha_2x_2=x, кроме того, получены формулы для \alpha_1 и \alpha_2.

Определение. Пара чисел \alpha_1,\alpha_2 называется барицентрическими координатами точки x.

Один комментарий

  1. 1 Дмитрий:

    Статья отличная, спасибо. Для первого знакомства даже хорошо, что определение геометрическое, а основное определение дается как критерий. Теоремы очень помогли в курсовой

    [Ответить]

Оставьте свой отзыв

Добавить изображение