Főmenü megnyitása

A Jensen-egyenlőtlenség elegáns közös kiterjesztését adja számos matematikai egyenlőtlenségnek.

Ha egy (véges vagy végtelen) I intervallumon az f függvény konvex, , nem negatív számok, amikre teljesül , akkor

Ha f szigorúan konvex, akkor egyenlőség csak az esetben teljesül.

Ha f konkáv, akkor az állítás fordított irányú egyenlőtlenséggel teljesül.

Például az függvény szigorúan konvex a valós számok halmazán, így ha tetszőleges, akkor

ami a számtani és négyzetes közép közötti egyenlőtlenség. Egyenlőség akkor és csak akkor áll fenn, ha

Hasonlóképpen a konkáv x log x függvényt használva azt kapjuk, hogy pozitív számokra

Mivel a jobb oldal logaritmusa, a számtani és mértani közép közötti egyenlőtlenséget kapjuk.

Jensen egyenlőtlenségeSzerkesztés

A matematikában Jensen egyenlőtlensége, amit a dán matematikusról, Johan Jensenről, neveztek el, összefüggésbe hozza egy integrál egy konvex függvény értékét a konvex függvény integráljával. Azt 1906-ban bizonyította Jensen. Az általánosságára tekintettel az egyenlőtlenség megjelenik sok alakban, ami a kontextustól függ, és aminek egy része az alábbiakban kerül bemutatásra.

Az egyenlet véges képlete volt a logója a Matematikai Tudományok Intézetének a Koppenhágai Egyetemen 2006-ig.

ÁllításokSzerkesztés

Jensen egyenlőtlenségének a klasszikus képlete magába foglal különféle számokat és súlyokat. Az egyenlőtlenséget ki lehet fejezni eléggé általánosságban használva a mértékelméletet vagy egyenértékű valószínűségszerű jelölést. Ebben a valószínűség szerinti felállításban az egyenlőtlenséget tovább lehet általánosítani a teljes érvényességéig.

A véges képletSzerkesztés

Ha egy konvex φ függvény egy I=R valós intervallumon, ahol x_i–k az intervallum elemei és a_i-k a súlyok, Jensen egyenlőtlenségét ki lehet fejezni:

 

és az egyenlőtlenség nyilvánvalóan megfordított, ha φ konkáv.

Konkrét eset, ha az ai súlyok mind egyenlőek az eggyel, akkor:

 

Konkáv log(x) függvény (megjegyzés: használhatjuk Jensen egyenlőtlenséget a függvény konvexitásának vagy konkávitásának bizonyítására, valós intervallumon.) Behelyettesítve  -et az előző képletbe a számtani és mértani közép közötti egyenlőtlenséget kapjuk:

 

Ha a változó x egy másik t változó függvénye xi = g(ti). Általánosan a következőt kapjuk: ai–ket felváltja egy nem negatív integrálható f(x)függvény, mint például egy valószínűségi eloszlás, a szummákat pedig integrálok.

Az elméleti mértéktér és a valószínűség szerinti képletSzerkesztés

Legyen (Ω,A,μ) egy mértéktér μ(Ω) = 1. Ha g egy valós értékű függvény, ami μ szerint integrált φ pedig egy mérhető konvex függvény, akkor:

 

Valószínűségelméletben legyen   egy valószínűségtér , X egy integrált valós értékű változó és φ egy mérhető konvex függvény. Akkor:

 

Ekkor a valószínűségelméletben, a mértéknek (μ) megfeleltethető egy valószínűség   , μ-nek egy várható érték   , és g a függvénynek egy véletlen változó X.

Általánosan az egyenlőtlenség egy valószínűség szerintSzerkesztés

Általánosan legyen T egy valós vektortér, X egy T értékű integrálható véletlen változó. Az integrálhatóság azt jelenti, hogy bármely T elem számára T:   , z eleme T létezik egy   T elem, úgy hogy   . Ekkor minden mérhető konvex φ függvényre és minden σ-algebra-rára   :

 

Ez a kijelentés általánosítja az előzőt, amikor a T vektortér a tengely és   a triviális σ-algebra  .

BizonyításokSzerkesztés

 

A Jensen egyenlőtlenség grafikus bizonyítása egy lehetséges esetben. A szaggatott görbe az X tengely mentén X feltételezett eloszlása, míg a szaggatott görbe az Y tengely mentén a megfelelő eloszlású Y értékek. Vegyük észre, hogy X egyre növekedő értékei mellett Y(X) egyre jobban növeli az eloszlást.

Jensen egyenlőtlenségének bizonyítása különféle módon történhet, és három különböző fent említett, különböző állításoknak megfelelő bizonyítás ajánlott. Ám mielőtt megkezdenénk ezeket a matematikai bizonyításokat, érdemes elemezni a grafikus bizonyítást a valószínűség szerinti eset alapján, ahol X egy valós szám, (lásd az ábrát). Elfogadva az X értékeknek egy feltételezett eloszlását, azonnal azonosíthatjuk az   és a képe   értéket a grafikonon. Észrevehetjük   a megfelelő értékek eloszlása egyre inkább nő az X növekedő értékeik mellett, és az Y eloszlása szélesebb, az X > X0 intervallumban, és keskenyebb X <X0 intervallumban bármilyen X0 számára; különösen igaz ez   esetére. Következésképpen beláttuk, hogy Y mindig el fog mozdulni felfelé, tekintettel   pozíciójára. Ezzel bebizonyítottuk az egyenlőtlenséget, azaz:

 

Egyenlőség akkor áll fenn, amikor   nem szigorúan konvex, például amikor ez egy egyenes. A bizonyításokat ez az intuitív elképzelés a következőkben fogalmazza meg:

Bizonyítás 1 (véges képlet)Szerkesztés

Ha λ1 és λ2 két tetszőleges pozitív valós számok, melyekre λ1 + λ2 = 1, akkor   konvexitása miatt:

  -re.

Általánosan: ha λ1 , λ2 , …, λn pozitív valós számok, melyekre λ1 + … + λn = 1, akkor

 

bármennyi x1 , …, xn számára. A Jensen egyenlőtlenségének ezt a véges képletét teljes indukcióval bizonyíthatjuk be. Ha n = 2 az állítás igaz. Tegyük fel, hogy n-re igaz az állítás, és bizonyítsuk n + 1-re. Ha legalább egy λi λ>0 például λ> 1 ; akkor konvexitás miatt:

 

Mivel   , felhasználva feltevésünket a képlet utolsó kifejezésében megkapjuk az eredményt, név szerint a Jensen-féle véges képletű egyenlőtlenséget.

Azért, hogy megkapjuk az általános egyenlőtlenséget ebből a véges képletből, használjunk egy sűrűségérvet. A véges képletet újra fel lehet írni úgy, mint:

 

ahol μn egy mérték, amit a Dirac delták egy tetszőleges kombinációja ad:

 

Mivel a konvex függvények folytonosak, és mivel a Dirac delták kombinációi gyengén sűrűek az általános állítást egyszerűen megkapjuk.

Bizonyítás 2 (elméleti-határ képlet)Szerkesztés

Legyen g egy valós értékű μ-integrálható függvény egy Ω mértéktérben, és legyen φ, egy konvex függvény a valós számok halmazán. Határozzuk meg φ jobb oldali deriváltját:

 

Mivel φ konvex, a jobb oldali hányados ahogy a t közelíti a 0-t jobbról, egyre csökken és alulról korlátos.

 

Ha t < 0, a határértéke mindig létezik.

Legyen:

 
 
 

Akkor minden x -re ax + b ≤ φ(x). Ha x > x0 , és t = x − x0 > 0. Akkor,

 

Tehát,

 

ahogyan azt bizonyítani akartuk. x < x0 esetében hasonlóan bizonyíthatjuk. Ha ax + b = φ(x0).

φ(x 0 ) akkor átírhatjuk a képletet

  - alakúra.

De mivel μ(Ω) = 1, tehát minden valós k számra

 

Így:

 

Bizonyítás 3 (általános egyenlőtlenség egy valószínűség szerint)Szerkesztés

Legyen X egy integrálható valószínűségi változó, az értéket egy valós T vektortérből veszi. Mivel   konvex, minden  -re

 

ahogy θ megközelíti a 0+ -t, ez az érték csökken. φ deriváltja X szerint az Y irányába:

 

Látható, a differenciál lineáris y-ban van és mivel korábban beláttuk, hogy a jobb oldal infimuma kisebb mint az értéke a θ = 1 –nél.

 

Egy tetszőleges sub-σ-algebrára   az utolsó egyenlőtlenség szerint, ha   fennáll, akkor

 

Ebből következve megkapjuk az eredményt, mivel:

 

Alkalmazások és speciális esetekSzerkesztés

Képlet, amely magában foglal egy valószínűség szerinti sűrűség függvénytSzerkesztés

Tételezzük fel, hogy Ω egy valós sorozat mérhető alhalmaza és f(x) egy nem negatív függvény, melyre:

 

Probabilisztikus nyelvben, f egy valószínűségi sűrűség-függvény.

Jensen egyenlőtlensége a következő állítássá válik:

Bármilyen g valós értékű függvény és φ konvex a g tartománya fölött, akkor

 

Ha g(x) = x, akkor az egyenlőtlenségnek ez a formája redukálódik egy általában használt speciális esetre:

 

Alternatív véges képletSzerkesztés

Ha Ω véges halmaz   , és ha μ egy megszámlálható mérték az Ω-án, akkor az általános alak redukálódik egy összegekről szóló állításra:

 

feltéve ha  

Van egy képlet Ω –re is.

Statisztikus fizikaSzerkesztés

Jensen egyenlőtlensége a statisztikai fizikában különös fontosságú akkor, amikor a konvex függvény exponenciális. Adva van:

 

ahol a zárójel a várható értékekre utal tekintettel néhány valószínűségi eloszlásra a véletlenszerű X változóban.

A bizonyítás ebben az esetben nagyon egyszerű (cf. Chandler, Sec. 5.5). A következő egyenlőtlenséget alkalmazva:

 

Kapjuk a végső exponenciális egyenlőtlenséget:

 

InformációelméletSzerkesztés

Ha p(x) x valószínűségi változó valódi eloszlás, és q(x) másik eloszlás, akkor Jensen egyenlőtlenségét alkalmazva Y(x) = q(x)/p(x)-re a véletlen változóra, a függvény legyen φ(y) = −log(y) így a Gibbs egyenlőtlenséget kapjuk.

 
 
 
 

Ez megmutatja, hogy az átlagos üzenethossz minimalizált, amikor kódokat jelölnek ki valódi valószínűségek alapján. Az a nemnegatív mennyiség, (q-nak távolsága p-től) a Kullback-Leibler távolság.

Rao-Blackwell tételSzerkesztés

Ha L egy konvex függvény, akkor Jensen egyenlőtlenségéből, megkapjuk, hogy:

 

Tehát ha δ(X) torzítatlan becslés θ paraméterre T(X) egy elégséges statisztika θ-ra, egy kisebb várt veszteség birtokában L, számolás útján elérhető. Megadható olyan L becslés, mely hatásosabb mint δ(X).

 

torzítatlan θ-ra, és X függvénye.

Ezt az eredményt a Rao-Blackwell tételként ismerik.

Lásd mégSzerkesztés

ForrásokSzerkesztés

  • Walter Rudin (1987): Valós és komplext elemzés. McGraw-Hill. ISBN 0-07-054234-1
  • David Chandler (1987): Bevezetés a modern statisztikus mechanikába. Oxford. ISBN 0-19-504277-8
  • Jensen, Johan Ludwig William Valdemar (1906): "Sur les fonctions* convexes* et les inégalités* entre* les valeurs* moyennes*". Acta Mathematica 30: 175-193

További információkSzerkesztés

  • Eric W Weisstein: Jensen egyenlőtlenség - A matematika világa
  • Jensen egyenlőtlensége logóként szolgált a Koppenhágai Egyetem Matematikai Szakosztálya számára.