A valószínűségszámításban az X valószínűségi változó sűrűségfüggvénye f pontosan akkor, ha az X-nek az F-fel jelölt eloszlásfüggvénye előállítható a következő alakban:

Annak a valószínűsége, hogy egy valószínűségi változó értéke és közé esik, megfelel a valószínűségi sűrűségfüggvény és közötti szakaszának görbe alatti területének

Szemben a valószínűségekkel, a sűrűségfüggvények felvehetnek 1-nél nagyobb értéket is. A valószínűségi eloszlások sűrűségfüggvényeken alapuló konstrukciója szempontjából nem a sűrűségfüggvény által felvett érték a fontos, hanem az integrál.

A sűrűségfüggvény általánosítása az általánosított sűrűségfüggvény, ahol is a Lebesgue-mértékre vonatkozó sűrűségfüggvények a valószínűségi sűrűségfüggvények. A továbbiakban sűrűségfüggvényen valószínűségi sűrűségfüggvényt értünk, kivéve ha azt máshogy jelezzük.

Diszkrét esetben az események valószínűsége megkapható a tartalmazott elemi események valószínűségeinek összegzésével. Folytonos esetben azonban ez nem tehető meg, mivel a nullaszor végtelen értéke bármi lehet. Például két ember csak ritkán pont egyforma magas, eltér egymástól egy hajszállal vagy csak néhány atomnyival. A sűrűségfüggvénnyel tetszőleges intervallum valószínűsége meghatározható, így a nullaszor végtelen probléma megkerülhető.

Definíció szerkesztés

A sűrűségfüggvény definiálható valószínűségeloszlás alapján, vagy pedig a valószínűségeloszlást lehet levezetni a sűrűségfüggvényből.

Az önálló definícióban szerepel az   tulajdonság, a nemnegativitás, az integrálhatóság és a normáltság, azaz a teljes  -en vett integrál egy. Ekkor definiálható hozzá

  valószínűségeloszlás.

Megfordítva, levezethető valószínűségi mértékből. Ekkor, ha az   függvényre minden   esetén

 

illetve

 

akkor   sűrűségfüggvény.

Tulajdonságai szerkesztés

Létezés szerkesztés

 
Különböző lognormális eloszlások sűrűségfüggvényei, ahol  
 
Különböző lognormális eloszlások eloszlásfüggvényei, ahol  

Általános tulajdonságok szerkesztés

  • A definícióból nyilvánvalóan látszik, hogy
 
bármely sűrűségfüggvény esetén. Ám az is megmutatható, hogy egy tetszőleges f mérhető függvény pontosan akkor sűrűségfüggvény (vagyis pontosan akkor található hozzá olyan valószínűségi változó, melynek sűrűségfüggvénye) ha f(x) ≥ 0 majdnem mindenütt és a fenti tulajdonság teljesül rá.
 
  • Speciálisan
 

a két definíció egyenértékű.

Kapcsolat az eloszlásfüggvénnyel szerkesztés

Ha az   eloszlásfüggvény folytonos, és legfeljebb megszámlálható végtelen pontban nem differenciálható, akkor van sűrűségfüggvénye, és:

 

Más jelöléssel, F '(x)=f(x), vagyis az eloszlásfüggvényből egyszerű deriválással kapjuk a sűrűségfüggvényt.

Vannak olyan eloszlások, mint a Cantor-eloszlás, amelyek eloszlásfüggvénye folytonos, és majdnem mindenütt differenciálható, de nincs sűrűségfüggvényük. A folytonos eloszlások eloszlásfüggvénye majdnem mindenütt differenciálható, de a derivált csak az abszolút folytonos részt foglalja magába.

Megfordítva, a sűrűségfüggvényből is kiszámítható az eloszlásfüggvény (abszolút folytonos) része:

 
 

ami azonnal következik a definícióból.

Sűrűségfüggvény részintervallumon szerkesztés

Ha egy   valószínűségi változó csak egy   részintervallumból vesz fel elemeket, akkor a sűrűségfüggvény választható úgy, hogy az   intervallumon kívül a 0 értéket veszi fel. Erre példa az exponenciális eloszlás, ahol  . Egy alternatív lehetőség az értelmezési tartomány leszűkítése, azaz   definiálása. Ekkor az eloszlás sűrűségét az   intervallumon adja meg a Lebesgue-mérték szerint.

Nemlineáris transzformáció szerkesztés

A nemlineáris   transzformáció esetén

 .

Konvolúció szerkesztés

Abszolút folytonos eloszlás esetén a valószínűségeloszlások konvolúciója visszavezethető a sűrűségfüggvények konvolúciójára. Ha   abszolút folytonos eloszlások az   és   eloszlásfüggvényekkel, akkor : .

Itt   a   és   konvolúciója, és   az   és   konvolúciója. Tehát a konvolúció és a sűrűségfüggvény képzése felcserélhető.

Ez a tulajdonság közvetlenül átvihető független valószínűségi változók összegére. Legyenek   valószínűségi változók az   és   sűrűségfüggvényekkel, ekkor

 .

Tehát az összeg sűrűségfüggvénye megegyezik a tagok sűrűségfüggvényeinek konvolúciójával.

Példák szerkesztés

 
Az exponenciális eloszlás sűrűségfüggvénye különböző paraméterekkel

Az exponenciális eloszlás abszolút folytonos eloszlás, sűrűségfüggvénye

 

ahol   valós paraméter. Ha  , akkor az   helyen 1-nél nagyobb értéket vesz fel. Az, hogy   sűrűségfüggvény, adódik az exponenciális függvény elemi integrációs szabályából, a nemnegativitás közvetlenül következik a hatványozás szabályaiból, és az integrálhatóság is bizonyítható.

A véges intervallumon egyenletes eloszlásnak is van sűrűségfüggvénye, például a   intervallumon. Az általa megadott valószínűség

 , ha   és  

Az intervallumon kívüli események valószínűsége nulla. Az   sűrűségfüggvény megfelel az

 

feltételeknek. Az   alkalmas függvény, amit a   intervallumon kívül nulla folytat az integrálhatóság kedvéért. Ezzel a folytonos egyenletes eloszlás sűrűségfüggvénye:

 

Egy másik megfelelő függvény:

 

A két függvény egy Lebesgue-nullmértékű halmazon különbözik csak, és mindkettő megfelel a követelményeknek. Mivel egy tetszőleges pontban meg lehet változtatni az értéket, azért egy valószínűségeloszlásnak legalább kontinuum sok sűrűségfüggvénye van. Az integrálok értéke nem változik, tehát a módosított sűrűségfüggvény is sűrűségfüggvény marad.

Megjegyzések a definícióhoz szerkesztés

Szigorúan véve a definícióban egy   Lebesgue-mérték szerinti integrál szerepel, amit úgy kellene jelölni, hogy  . Többnyire azonban a Riemann-integrál is megfelel, emiatt szoktak a definícióban   integrált írni. A különbséget az jelenti, hogy a Riemann-integrálnak nincs mértékelméleti háttere, míg a Lebesgue-integrálnak van.

A német szakirodalom meg is különbözteti a két eljárást. Amiből a valószínűségeloszlást származtatják, az a Wahrscheinlichkeitsdichte, a másik a Verteilungsdichte.[1]

Létezés és egyértelműség szerkesztés

Valószínűségeloszlásból származtatva szerkesztés

A valószínűségeloszlással definiált esetben a   valószínűségi mértékből származik a valószínűségeloszlás. A normáltságból következik  . Mivel a valószínűségek nem lehetnek negatívak, a függvény sehol se negatív. a σ-additív tulajdonság következik a majorált konvergencia tételéből, a sűrűségfüggvénnyel mint majoránssal és az

 

függvénysorozattal, ahol az   halmazok páronként diszjunktak, és   az   halmaz karakterisztikus függvénye.

Az egyértelműség következik a mérték egyértelműségének tételéből, és a Borel-σ-algebra generátorainak metszetstabil tulajdonságából, ami itt a zárt intervallumok.

A másik definíció alapján szerkesztés

A Radon-Nikodým-tétellel belátható, hogy adott valószínűségeloszláshoz létezik sűrűségfüggvény:

Ha   valószínűségeloszlás, akkor akkor és csak akkor van sűrűségfüggvénye, ha abszolút folytonos a   Lebesgue-mértékre. Ez azt jelenti, hogy ha  , akkor  .

Ez nem zárja ki, hogy több sűrűségfüggvény létezik, de mindegyik csak Lebesgue-nullmértékű halmazon különbözik a többitől, azaz majdnem mindenütt egyenlőek.

Emiatt a diszkrét valószínűségeloszlásoknak nincs sűrűségfüggvénye, mivel egy alkalmas   elemre mindig teljesül, hogy  . Ezeknek a ponthalmazoknak azonban a Lebesgue-mértéke nulla, vagyis a diszkrét valószínűségeloszlások nem abszolút folytonosak.

A valószínűségek számítása szerkesztés

Alapok szerkesztés

Adva legyen az   sűrűségfüggvény, ekkor az   intervallum valószínűsége

 .

Itt mindegy, hogy az intervallum zárt-e, vagy nyílt, félig nyílt, mivel a folytonos valószínűségi változók esetén egy pont valószínűsége nulla. Formálisan,

 
 

Bonyolultabb halmazok esetén az egyes intervallumokon vett integrálokat kell összeadni. Ekkor a képlet

 .

Alkalmazható a σ-additivitás is, ami azt jelenti, hogy a   páronként diszjunkt intervallumok, és

 

az összes egyesítése, akkor

 .

ahol  . Ez érvényes véges sok és végtelen számú intervallumra. Diszjunkt intervallumok valószínűsége összeadódik.

Példa szerkesztés

Egy callcenterben két hívás között eltelt idő megközelítően exponenciális eloszlású. Legyen ennek paramétere  ! Ekkor a sűrűségfüggvény

 .

Az x tengely beosztását a   paraméter határozza meg úgy, hogy   idő alatt várható értékben egy hívás fut be. Annak a valószínűsége, hogy a következő hívás egy és két időegység után következik be:

 .

Tegyük fel, hogy egy munkatárs öt időegység hosszú szünetet tart! Annak a valószínűsége, hogy közben nem érkezik hívás, egyenlő azzal a valószínűséggel, hogy a következő hívásig öt vagy több időegység telik el. Ennek valószínűsége

 

Jellemző számadatok meghatározása szerkesztés

Egy valószínűségi változó jellemző számadatai közül több is megadható a valószínűségi változó sűrűségfüggvényének segítségével.

Módusz szerkesztés

Egy valószínűségeloszlás illetve valószínűségi változó módusza definiálható a sűrűségfüggvénnyel: Ahol a sűrűségfüggvénynek maximuma van, ott van a módusz. Formálisan,   akkor módusza az   sűrűségfüggvényű valószínűségi változónak, ha az   hely lokális maximumhely.[2] ez azt jelenti, hogy

van  , hogy   minden   helyen.

Egy sűrűségfüggvénynek több lokális maximumhelye is lehet, ekkor az eloszlás bimodális vagy multimodális. Az egyenletes eloszlás esetén minden hely módusz.

Medián szerkesztés

A mediánt rendszerint az eloszlásfüggvénnyel és kvantilisekkel definiálják. Abszolút folytonos eloszlás mediánja számítható sűrűségfüggvénnyel:   az eloszlás vagy a valószínűségi változó mediánja, ha:

 

és

 

Folytonosság miatt   mindig létezik, de az egyértelműség nem garantált, például csak két diszjunkt intervallum unióján nullától különböző értékeket felvevő szimmetrikus sűrűségfüggvény esetén.

Várható érték szerkesztés

Ha az   valószínűségi változó sűrűségfüggvénye  , akkor   várható értéke:

 ,

ha az integrál konvergens. Ha nem konvergens, akkor a valószínűségi változónak nincs várható értéke.

Szórásnégyzet és szórás szerkesztés

Ha az   valószínűségi változó sűrűségfüggvénye  , és várható értéke  , akkor   szórásnégyzete

 .

Vagy az eltolási tétellel:

 .

Ezek a képletek csak akkor használhatók, ha az integrálok konvergensek. A szórás a szórásnégyzetből számítható gyökvonással, de sokszor elég a szórásnégyzetet használni.

Magasabb momentumok, ferdeség és lapultság szerkesztés

A fent leírt nemlineáris transzformáció felhasználásával közvetlenül kiszámíthatók a további momentumok. Így ha az   valószínűségi változó sűrűségfüggvénye  , akkor:

 

és a k-adik abszolút momentum

 .

Ha   várható értéke  , akkor a centrális momentumok:

 

és az abszolút centrális momentumok:

 .

Példa szerkesztés

Példaként tekintsük az exponenciális eloszlást:

 

ahol   paraméter!

Az exponenciális eloszlásnak mindig módusza a nulla. A   intervallumon a sűrűségfüggvény konstans nulla, és az   intervallumon szigorúan monoton csökken, így a 0 helyen lokális maximum van. A monotóniából következik, hogy nincs több lokális maximum, a módusz egyértelmű.

A centrális momentumokból meghatározható a ferdeség és a lapultság.

A medián meghatározásához elég a   félegyenesen integrálni, mivel a negatív számokon a függvény értéke konstans nulla:

 .

Rövid számolással

 .

Ez teljesíti a mediánra vonatkozó második egyenlőséget is, tehát valóban medián.

A várható érték meghatározható parciális integrállal:

 .

A parciális integrál kétszeri alkalmazásával számítható a szórásnégyzet is.

További példák szerkesztés

Legyen most az   sűrűségfüggvény  , ha  ;   ha  ; és   ha  ! Ekkor   valóban sűrűségfüggvény, mivel nemnegatív teljes  -en, továbbá

 .

Minden   esetén:

 

Az eloszlásfüggvény

 

Ha   valószínűségi változó, aminek sűrűségfüggvénye  , akkor például

 .

Az   változó várható értéke

 .

Többdimenziós sűrűségfüggvény szerkesztés

Többdimenziós valószínűségi változókra is definiálható sűrűségfüggvény, ha eloszlásuk abszolút folytonos. Legyen az   valószínűségi vektorváltozó   értékű; ekkor   az   (Lebesgue-mérték szerinti) sűrűségfüggvénye, ha

 

minden   Borel-halmazra.

Speciálisan, az   dimenziós   intervallumokra, ahol   valós számok:

 .

Valószínűségi vektorváltozóknak is definiálható eloszlásfüggvény. Itt  , ahol az egyenlőtlenség komponensenként értendő. Ekkor   az   teret a [0,1] intervallumra képezi úgy, hogy

 .

Ha   n-szer folytonosan differenciálható, akkor a sűrűségfüggvény parciális differenciálással megkapható:

 

Az   komponensek   sűrűségfüggvényei a peremeloszlások többi komponens szerinti integrálásával kaphatók.

Továbbá: Ha     értékű sűrűségfüggvényes valószínűségi vektorváltozó, akkor a következők ekvivalensek:

  • Az   sűrűségfüggvényének alakja  , ahol   az   sűrűsége.
  • Az   valószínűségi változók függetlenek.

Becslés diszkrét adatok alapján szerkesztés

 
Gyakorisági sűrűség (hisztogram)

Folytonosnak tekintett eloszlásból származó, de diszkréten mért adatok, például testmagasság centiméterben mérve reprezentálhatók gyakorisági sűrűségfüggvényként. Magsűrűségbecslőkkel a sűrűségfüggvény folytonos függvénnyel becsülhető. Az ehhez használt magnak a mérési hibához kell alkalmazkodnia.

Legyen   approximáló véletlen változó, az   jellemző mennyiségekkel és   valószínűségekkel. Az   diszkrét approximáló valószínűségi változó határátmenete az   folytonos valószínűségi változóba valószínűségi hisztogrammal modellezhető. Ehhez   lehetséges értékeit a   szakaszokra osztujk fel. Ezek a   hosszú intervallumok és a hozzájuk tartozó   osztályközepek a sűrűségfüggvény approximációját szolgálják, szemléletesen a valószínűségi hisztogrammal, ami az osztályközepekre emelt   téglalapokból áll. Kis   esetén   felfogható a folytonos   valószínűségi változó approximációjaként. Minél rövidebbek a   szakaszok, annál jobban közelíti   a folytonos   valószínűségi változót. Az   határátmenet minden intervallumra a következőhöz vezet:[3]

a szórásnégyzet esetén
 
a várható érték esetén
 .

A sűrűségfüggvény általánosítása szerkesztés

Létezik a matematikai statisztikában a sűrűségfüggvénynek egy általánosítása, az általánosított sűrűségfüggvény, mely a valószínűségi mező egy általánosításán, a statisztikai mezőn értelmezett, s definíciójában olyan mély mértékelméleti eszközöket használ, mint a Radon–Nikodym-derivált. Általánosított sűrűségfüggvénye minden valószínűségi változónak van, s abszolút folytonos esetben a sűrűségfüggvénnyel, míg diszkrét esetben a P függvénnyel azonos.

Jegyzetek szerkesztés

  1. Georgii: Stochastik. 2009, S. 19, 24.
  2. A.V. Prokhorov: Mode
  3. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 262 ff.

Források szerkesztés

Fordítás szerkesztés

Ez a szócikk részben vagy egészben a Wahrscheinlichkeitsdichtefunktion című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.