Нерівність середнього арифметичного та геометричного

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

У математиці, нерівність середнього арифметичного та геометричного або коротше нерівність СА–СГ стверджує, що середнє арифметичне набору невід'ємних дійсних чисел більше ніж або дорівнює середньому геометричному цих же чисел; і далі, що ці середні дорівнюють одне одному тоді і лише тоді, коли усі числа в наборі однакові.

Найпростіший нетривіальний випадок — тобто, з більш ніж з однією змінною — для двох невід'ємних чисел Шаблон:Mvar і Шаблон:Mvar, це таке твердження

x+y2xy

зі знаком рівності тоді і лише тоді, коли Шаблон:Math. Цей випадок можна зрозуміти завдяки тому факту, що квадрат дійсного числа завжди невід'ємний і з елементарного випадку біноміальної формули Шаблон:Math:

0(xy)2=x22xy+y2=x2+2xy+y24xy=(x+y)24xy.

Інакше кажучи, Шаблон:Math, де рівність досягається саме тоді, коли Шаблон:Math, тобто Шаблон:Math.

Для геометричного тлумачення, розглянемо прямокутник зі сторонами довжин Шаблон:Mvar і Шаблон:Mvar, звідси його периметр Шаблон:Math і площа Шаблон:Mvar. Подібно, квадрат з усіма сторонами довжини Шаблон:Math має периметр Шаблон:Math і ту ж саму площу, що і прямокутник. Найпростіший нетривіальний випадок нерівності СА-СГ для периметра дає Шаблон:Math і, що лише квадрат має найменший периметр серед усіх прямокутників рівної площі.

Загальна нерівність СА-СГ відповідає тому факту, що натуральний логарифм, який переводить множення у додавання, є строго увігнутою функцією; використовуючи нерівність Єнсена отримуємо загальне доведення нерівності.

lnx+lny2ln(x+y2)

Розширення нерівності СА-СГ можуть включати ваги або середні степеневі.

Підґрунтя

Середнє арифметичне набору з Шаблон:Mvar чисел Шаблон:Math — це сума чисел поділена на Шаблон:Mvar:

x1+x2++xnn.


Подібно середнє геометричне, окрім того, що воно визначене лише для набору невід'ємних дійсних чисел і використовує множення і корінь замість додавання і ділення:

x1x2xnn.

Якщо Шаблон:Math, тоді це дорівнює показниковій функції середнього арифметичного натуральних логарифмів цих чисел:

exp(lnx1+lnx2++lnxnn).

Нерівність

Перефразовуючи нерівність використовуючи математичний запис, ми маємо, що для будь-якого набору з Шаблон:Mvar невід'ємних дійсних чисел Шаблон:Math,

x1+x2++xnnx1x2xnn,

і, що рівність досягається тоді і лише тоді, коли Шаблон:Math.

Геометричне тлумачення

У двох вимірах, Шаблон:Math це периметр прямокутника з довжинами сторін Шаблон:Math і Шаблон:Math. Аналогічно, Шаблон:Math це периметр квадрата з тією самою площею як попередньо згаданий прямокутник. Отже, для Шаблон:Math нерівність СА-ГА твердить, що лише квадрат має найменший периметр посеред усіх прямокутників рівної площі.

Повна нерівність це розширення цієї ідеї на Шаблон:Mvar вимірів. Кожна вершина Шаблон:Mvar-вимірного паралелепіпеда має Шаблон:Mvar інцидентних ребер. Якщо довжини цих ребер Шаблон:Math, тоді Шаблон:Math це загальна довжина ребер інцидентних цій вершині. Всього маємо Шаблон:Math вершин, тому множимо це на Шаблон:Math; однак, оскільки кожне ребро інцидентне двом вершинам, кожне ребро пораховане двічі. Через це ми ділимо на Шаблон:Math і приходимо до висновку, що ребер всього Шаблон:Math. Ребер кожної довжини однакова кількість і всього Шаблон:Mvar довжин; з цього випливає, що ми маємо Шаблон:Math ребер кожної довжини і загальна довжина всіх ребер становить Шаблон:Math. З іншого боку,

2n1nx1x2xnn

є загальною довжиною ребер інцидентних до певної вершини на Шаблон:Mvar-вимірному кубі рівного об'єму. Оскільки наша нерівність стверджує, що

x1+x2++xnnx1x2xnn,

ми маємо

2n1(x1+x2++xn)2n1nx1x2xnn

зі знаком рівності тоді і лише тоді, коли Шаблон:Math.

Отже, нерівність СА-ГА стверджує, що лише гіперкуб має найменшу суму довжин ребер інцидентних кожній вершині посеред усіх Шаблон:Mvar-вимірних паралелограмів того самого об'єму.[1]

Приклад застосування

Розглянемо функцію

f(x,y,z)=xy+yz+zx3

для всіх додатних дійсних чисел Шаблон:Mvar, Шаблон:Mvar і Шаблон:Mvar. Припустимо ми бажаємо знайти мінімальне значення цієї функції. Спершу ми перепишемо її трошки:

f(x,y,z)=6xy+12yz+12yz+13zx3+13zx3+13zx36=6x1+x2+x3+x4+x5+x66

з

x1=xy,x2=x3=12yz,x4=x5=x6=13zx3.

Застосовуючи нерівність СА-СГ для Шаблон:Math, маємо

f(x,y,z)6xy12yz12yz13zx313zx313zx36=6122333xyyzzx6=22/331/2.

Далі, ми знаємо, що два боки нерівності дорівнюють один одному тоді коли всі доданки середнього рівні між собою:

f(x,y,z)=22/331/2 коли xy=12yz=13zx3.

Усі точки Шаблон:Math, що задовольняють цим умовам лежать на промені, що починається в початку координат і задається так

(x,y,z)=(t,233t,332t),t>0.

Доведення нерівності СА-СГ

Існує декілька шляхів доведення нерівності СА-ГА; наприклад, його можна вивести із нерівності Єнсена, використовуючи угнуту функцію ln(Шаблон:Mvar). Також можна довести використовуючи нерівність перестановок. Зважаючи на довжину та необхідні попередні знання, просте доведення по індукції наведене нижче, мабуть, найкраща рекомендація для першого читання.

Ідея перших двох доведень

Нам потрібно показати, що

x1+x2++xnnx1x2xnn

зі знаком рівності лише коли всі числа однакові. Якщо Шаблон:Math, тоді заміна обох Шаблон:Mvar і Шаблон:Mvar на Шаблон:Math залишить середнє арифметичне ліворуч незміненим, але збільшить середнє геометричне праворуч оскільки

(xi+xj2)2xixj=(xixj2)2>0.

Отже, правий бік буде найбільшим коли Шаблон:Mvar-ті дорівнюють середньому арифметичному

α=x1+x2++xnn,

отже, оскільки тоді це найбільше значення правого боку виразу, ми маємо

x1+x2++xnn=α=αααnx1x2xnn.

Це правильне доведення для випадку Шаблон:Math, але процедура отримання ітеративного попарного середнього може зазнати невдачі у створенні Шаблон:Mvar рівних чисел у випадку коли Шаблон:Math. Як приклад можна навести випадок коли Шаблон:Math: Усереднювання двох відмінних чисел продукує два рівних числа, але третє все ще залишатиметься відмінним. Тому, ми ніколи не отримаємо нерівність із середнім геометричним, яке включає три однакових числа.

З цього видно, що для перетворення цієї ідею у дійсне доведення для випадку Шаблон:Math необхідний додатковий трюк або зміна аргументу.

Доведення за допомогою індукції

Із середнім арифметичним

α= x1++xnn

невід'ємних дійсних чисел Шаблон:Math, твердження СА-СГ тотожне до

αnx1x2xn

зі знаком рівності тоді і лише тоді, коли Шаблон:Math для всіх Шаблон:Math}.

Для наступного доведення ми застосуємо математичну індукцію і лише добре відому арифметику.

База: Для Шаблон:Math твердження дійсне із знаком рівності.

Гіпотеза: Припустимо, що нерівність СА-ГА має місце для всіх можливих комбінацій з Шаблон:Mvar невід'ємних дійсних чисел.

Крок: Розглянемо Шаблон:Math невід'ємних дійсних числа Шаблон:Math. Їх середнє арифметичне Шаблон:Mvar задовольняє

(n+1)α= x1++xn+xn+1.

Якщо всі числа дорівнюють Шаблон:Mvar, тоді ми маємо рівність у твердження СА_СГ і ми зупиняємось. Інакше ми можемо знайти одне число, яке буде більшим і одне число яке буде меншим ніж Шаблон:Mvar, нехай Шаблон:Math і Шаблон:Math. Тоді

(xnα)(αxn+1)>0.(*)

Тепер розглянемо Шаблон:Mvar чисел Шаблон:Math з

y:=xn+xn+1αxnα>0,

яке теж невід'ємне. З того, що

nα=x1++xn1+xn+xn+1α=y,

маємо, що Шаблон:Mvar також є середнім арифметичним Шаблон:Mvar чисел Шаблон:Math і індукційна гіпотеза дає нам

αn+1=αnαx1x2xn1yα.(**)

Завдяки (*) ми знаємо, що

(xn+xn+1α=y)αxnxn+1=(xnα)(αxn+1)>0,

звідси

yα>xnxn+1,(***)

оскільки Шаблон:Math. З цього випливає, що якщо хоча б одне число Шаблон:Math є нулем, тоді ми одразу маємо строгу нерівність у (**). Інакше, права сторона у (**) є додатною і строга нерівність досягається, використовуючи оцінку (***), щоб отримати нижню границю для правої сторони (**). Отже, в обох випадках ми маємо

αn+1>x1x2xn1xnxn+1,

що завершує доведення.

Доведення Коші прямо-зворотною індукцією

Наступне доведення прямо покладається на добре відомі правила арифметики, але використовує рідко вживану техніку прямо-зворотної індукції. По суті автором є Оґюстен-Луї Коші.[2]

Випадок коли всі числа однакові

Якщо всі числа однакові:

x1=x2==xn,

тоді їх сума є Шаблон:Math, отже середнє арифметичне дорівнює Шаблон:Math; і їх добуток становить Шаблон:Math, отже їх середнє геометричне дорівнює Шаблон:Math; з цього, середнє арифметичне і середнє геометричне однакові, як і вимагалось.

Випадок коли не всі числа однакові

Залишилось показати, що якщо не всі числа однакові, тоді арифметичне середнє більше ніж геометричне середнє. Очевидно, це можливо лише коли Шаблон:Math.

Цей випадок значно складніший, і ми розділимо його на підвипадки.

Випадок коли n = 2

Якщо Шаблон:Math, тоді ми маємо два числа, Шаблон:Math і Шаблон:Math, і оскільки (за припущенням) не всі числа однакові, маємо:

(x1+x22)2x1x2=14(x12+2x1x2+x22)x1x2=14(x122x1x2+x22)=(x1x22)2>0,

звідси

x1+x22>x1x2

як вимагалось.

Підвипадок коли n = 2k

Розглянемо випадок коли Шаблон:Math, де Шаблон:Mvar це додатне число. Ми продовжуємо, використовуючи математичну індукцію.

У базовому випадку, Шаблон:Math, тому Шаблон:Math. Ми вже показали, що нерівність має місце коли Шаблон:Math, отже, тут все готово.

Тепер, припустимо, що для певного Шаблон:Math, ми вже показали, що нерівність дотримується для Шаблон:Math, і ми хочемо показати, що нерівність має місце і для Шаблон:Math. Щоб це зробити, ми двічі застосуємо нерівність для Шаблон:Math чисел і один раз для Шаблон:Math чисел, щоб отримати:

x1+x2++x2k2k=x1+x2++x2k12k1+x2k1+1+x2k1+2++x2k2k12x1x2x2k12k1+x2k1+1x2k1+2x2k2k12x1x2x2k12k1x2k1+1x2k1+2x2k2k1=x1x2x2k2k

де у першій нерівності рівність досягається лише тоді, коли

x1=x2==x2k1

і

x2k1+1=x2k1+2==x2k

(у цьому випадку перше середнє арифметичне і перше середнє геометричне обидва дорівнюють Шаблон:Math, і аналогічно із другим середнім арифметичним і другим середнім геометричним); і у другій нерівності рівність досягається лише тоді, коли два середніх геометричних рівні між собою. Оскільки не всі Шаблон:Math чисел однакові, неможливо, щоб обидві нерівності стали рівностями, тому ми знаємо, що:

x1+x2++x2k2k>x1x2x2k2k

як вимагалось.

Підвипадок коли n < 2k

Якщо Шаблон:Mvar не є натуральним степенем  Шаблон:Math, тоді це однозначно менше ніж деякий натуральний степінь 2, оскільки послідовність Шаблон:Math є необмеженою згори. Отже, без втрати загальності, нехай Шаблон:Mvar буде деяким натуральним степенем Шаблон:Math, який більше ніж Шаблон:Mvar.

З цього, якщо ми маємо Шаблон:Mvar чисел, тоді позначимо їх середнє арифметичне як Шаблон:Mvar, і розширимо список чисел так:

xn+1=xn+2==xm=α.

Тоді ми маємо:

α=x1+x2++xnn=mn(x1+x2++xn)m=x1+x2++xn+mnn(x1+x2++xn)m=x1+x2++xn+(mn)αm=x1+x2++xn+xn+1++xmm>x1x2xnxn+1xmm=x1x2xnαmnm,

тому

αm>x1x2xnαmn

і

α>x1x2xnn

як вимагалось.

Доведення по індукції із використанням базових знань з обчислення

Наступне доведення використовує математичну індукцію і диференціальне числення.

База: Для Шаблон:Math твердження виконується із знаком рівності.

Гіпотеза: Припустимо, що СА-СГ виконується для всіх можливих Шаблон:Mvar невід'ємних дійсних чисел.

Крок: Для того, щоб довести твердження для Шаблон:Math невід'ємних дійсних чисел Шаблон:Math, нам потрібно довести, що

x1++xn+xn+1n+1(x1xnxn+1)1n+10

з рівністю лише тоді, коли всі Шаблон:Math чисел однакові.

Якщо всі числа дорівнюють нулю, нерівність виконується із знаком рівності. Якщо деякі, але не всі числа є нулями, то ми маємо строгу нерівність. Отже, ми можемо припустити, що всі Шаблон:Math чисел є додатними.

Ми розглядатимемо останнє число Шаблон:Math як змінну і визначимо функцію

f(t)=x1++xn+tn+1(x1xnt)1n+1,t>0.

Доведення кроку індукції тотожне доведенню того, що Шаблон:Math для всіх Шаблон:Math, із Шаблон:Math тільки якщо Шаблон:Math і Шаблон:Mvar всі рівні. Це можна зробити проаналізувавши критичні точки Шаблон:Mvar.

Перша похідна Шаблон:Mvar така

f(t)=1n+11n+1(x1xn)1n+1tnn+1,t>0.

Критична точка Шаблон:Math має задовольняти Шаблон:Math, що значить

(x1xn)1n+1t0nn+1=1.

Після невеличкої перестановки отримуємо

t0nn+1=(x1xn)1n+1,

і зрештою

t0=(x1xn)1n,

що є середнім геометричним Шаблон:Math. Це єдина критична точка Шаблон:Mvar. Оскільки Шаблон:Math для всіх Шаблон:Math, функція Шаблон:Mvar є строго опуклою і має строгий глобальний мінімум у Шаблон:Math. Тепер обчислимо значення функції у цьому глобальному мінімумі:

f(t0)=x1++xn+(x1xn)1/nn+1(x1xn)1n+1(x1xn)1n(n+1)=x1++xnn+1+1n+1(x1xn)1n(x1xn)1n=x1++xnn+1nn+1(x1xn)1n=nn+1(x1++xnn(x1xn)1n)0,.

де остання нерівність виконується через індукційну гіпотезу. Гіпотеза також каже, що ми можемо мати рівність лише коли Шаблон:Math усі однакові. У цьому випадку, їхнє середнє геометричне і Шаблон:Math мають однакове значення. З цього, якщо Шаблон:Math не всі рівні, ми маємо Шаблон:Math. Це завершує доведення.

Цю техніку можна використати для доведення узагальненої нерівності СА-СГ і Нерівності Коші — Буняковського в Евклідовому просторі Шаблон:Math.

Доведення Пойа із використанням експоненційної функції

Пойа Дьордь навів доведення подібне до наступного. Нехай Шаблон:Math для всіх дійсних Шаблон:Mvar, із першою похідною Шаблон:Math і другою похідною Шаблон:Math. Звернемо увагу, що Шаблон:Math, Шаблон:Math і Шаблон:Math для дійсних Шаблон:Mvar, звідси Шаблон:Mvar є строго опуклою з абсолютним мінімумом у Шаблон:Math. Звідси Шаблон:Math для всіх дійсних Шаблон:Mvar зі знаком рівності лише для Шаблон:Math.

Розглянемо список невід'ємних дійсних чисел Шаблон:Math. Якщо вони всі нулі, тоді нерівність СА-СГ виконується зі знаком рівності. Отже, ми можемо припустити, що середнє арифметичне Шаблон:Math. Застосовуючи попередню нерівність ми отримуємо, що

x1αx2αxnαex1α1ex2α1exnα1=exp(x1α1+x2α1++xnα1),(*)

із рівністю, лише якщо Шаблон:Math для кожного Шаблон:Math. Аргумент експоненційної функції можна спростити:

x1α1+x2α1++xnα1=x1+x2++xnαn=nn=0.

Повертаючись до Шаблон:Math,

x1x2xnαne0=1,

що дає Шаблон:Math, отже, в результаті[3]

x1x2xnnα.

Узагальнення

Нерівність СА-СГ зважена

Існує подібна нерівність для середнього зваженого і середнього геометричного зваженого. А саме, нехай дані невід'ємні числа Шаблон:Math і невід'ємні ваги Шаблон:Math. Встановимо Шаблон:Math. Якщо Шаблон:Math, тоді нерівність

w1x1+w2x2++wnxnwx1w1x2w2xnwnw

виконується з рівністю тоді і тільки тоді, коли всі Шаблон:Mvar і Шаблон:Math однакові. Тут використовується домовленість, що Шаблон:Math.

Якщо всі Шаблон:Math, то ми маємо звичайну нерівність СА-СГ.

Доведення із використанням нерівності Єнсена

Використовуючи скінченну форму нерівності Єнсена для натурального логарифма, ми можемо довести нерівність між середнім арифметичним зваженим і середнім геометричним зваженим.

Оскільки Шаблон:Mvar з вагою Шаблон:Math не впливає на нерівність, ми можемо надалі припустити, що всі ваги додатні. Якщо всі Шаблон:Mvar однакові, тоді має місце рівність. Отже, залишилось довести строгу нерівність, якщо вони не однакові, ми це також припускатимемо далі. Якщо хоч один Шаблон:Mvar нульовий (але не всі), тоді середнє геометричне зважене нульове, тоді як середнє арифметичне зважене ненульове, тому має місце строга нерівність. Через це ми припускатимемо, що всі Шаблон:Mvar — додатні.

Оскільки натуральний логарифм є строго угнутим, скінченна форма нерівності Єнсена і функціональні рівняння натурального логарифма кажуть, що

ln(w1x1++wnxnw)>w1wlnx1++wnwlnxn=lnx1w1x2w2xnwnw.

Оскільки натуральний логарифм є строго висхідною функцією, то

w1x1++wnxnw>x1w1x2w2xnwnw.

Інші узагальнення

Див. також

Примітки

Шаблон:Reflist

Шаблон:Середні значення

  1. Шаблон:Cite book
  2. Cauchy, Augustin-Louis (1821). Cours d'analyse de l'École Royale Polytechnique, première partie, Analyse algébrique, Paris. The proof of the inequality of arithmetic and geometric means can be found on pages 457ff.
  3. Шаблон:Cite book