Harmonický průměr - Harmonic mean

V matematice je harmonický průměr jedním z několika druhů průměrů , a zejména jedním z Pythagorových prostředků . Někdy je to vhodné pro situace, kdy je požadována průměrná sazba .

Harmonický průměr lze vyjádřit jako převrácenou hodnotu aritmetického průměru vzájemných hodnot daného souboru pozorování. Jako jednoduchý příklad je harmonický průměr 1, 4 a 4

Definice

Harmonický průměr H kladných reálných čísel je definován jako

Třetí vzorec ve výše uvedené rovnici vyjadřuje harmonický průměr jako převrácenou hodnotu aritmetického průměru vzájemných hodnot.

Z následujícího vzorce:

je více zřejmé, že harmonický průměr souvisí s aritmetickými a geometrickými prostředky . Jedná se o reciproční dual z aritmetického průměru pozitivních vstupů:

Harmonický průměr je Schur-konkávní funkce a dominuje minimem jeho argumentů v tom smyslu, že pro jakýkoli pozitivní soubor argumentů . Harmonický průměr tedy nelze libovolně zvětšit změnou některých hodnot na větší (přičemž alespoň jedna hodnota zůstane nezměněna).

Harmonický průměr je také konkávní , což je ještě silnější vlastnost než Schurova konkávnost. Člověk se musí postarat o to, aby používal pouze kladná čísla, protože průměr není konkávní, pokud jsou použity záporné hodnoty.

Vztah s jinými prostředky

Geometrický důkaz beze slov , že max  ( , b ) > střední kvadratická ( RMS ) nebo kvadratický průměr ( QM ) > aritmetický průměr ( AM ) > geometrický průměr ( GM ) > Harmonická střední ( HM ) > min  ( , b ) z dvě kladná čísla a a b

Harmonický průměr je jedním ze tří Pythagorových prostředků . U všech kladných datových souborů obsahujících alespoň jeden pár nestejných hodnot je harmonický průměr vždy nejmenší ze tří průměrů, zatímco aritmetický průměr je vždy největší ze tří a geometrický průměr je vždy mezi nimi. (Pokud jsou všechny hodnoty v neprázdné datové sadě stejné, jsou tyto tři prostředky vždy stejné; např. Harmonické, geometrické a aritmetické průměry {2, 2, 2} jsou všechny 2.)

Jedná se o zvláštní případ M -1 o výkonu průměr :

Protože harmonický průměr seznamu čísel silně směřuje k nejmenším prvkům seznamu, má tendenci (ve srovnání s aritmetickým průměrem) zmírňovat dopad velkých odlehlých hodnot a zhoršovat dopad malých.

Aritmetický průměr je často mylně používán v místech, která vyžadují harmonický průměr. V níže uvedeném příkladu rychlosti je aritmetický průměr 40 nesprávný a příliš velký.

Harmonický průměr se vztahuje k ostatním pythagorejským prostředkům, jak je vidět na níže uvedené rovnici. To lze vidět na interpretaci jmenovatele jako aritmetického průměru součinu čísel nkrát, ale pokaždé s vynecháním j -tého členu. To znamená, že pro první člen vynásobíme všechna n čísla kromě prvního; za druhé vynásobíme všechna n čísla kromě druhého; a tak dále. Čitatel, kromě n , který jde s aritmetickým průměrem, je geometrický průměr mocniny  n . Proto je n -tý harmonický průměr je spojena s N -tý geometrických a aritmetických průměrů. Obecný vzorec je

Pokud je množina neidentických čísel podrobena šíření zachovávajícímu průměr- tj. Dva nebo více prvků množiny jsou od sebe „rozprostřeny“, přičemž aritmetický průměr zůstává beze změny-, pak harmonický průměr vždy klesá.

Harmonický průměr dvou nebo tří čísel

Dvě čísla

Geometrická konstrukce tří pythagorejských průměrů dvou čísel a a b . Harmonický průměr je označen H fialově. Q označuje čtvrtý průměr, kvadratický průměr . Vzhledem k tomu, přepona je vždy delší než nohu pravoúhlého trojúhelníku , diagram ukazuje, že Q > > G > H .

Pro speciální případ pouze dvou čísel a lze napsat harmonický průměr

nebo

V tomto zvláštním případě harmonický průměr souvisí s aritmetickým průměrem a geometrickým průměrem podle

Protože podle nerovnosti aritmetických a geometrických průměrů to pro případ n = 2 ukazuje, že HG (vlastnost, která ve skutečnosti platí pro všechna n ). Z toho také vyplývá, že geometrický průměr těchto dvou čísel se rovná geometrickému průměru jejich aritmetických a harmonických průměrů.

Tři čísla

Pro zvláštní případ tří čísel , a je harmonický průměr může být psán

Tři kladná čísla H , G a A jsou harmonické, geometrické a aritmetické průměry tří kladných čísel právě tehdy, platí -li následující nerovnost

Vážený harmonický průměr

Je-li sada závaží , ..., je spojena s datové sady , ..., je vážený harmonický průměr je definován

Nevážený harmonický průměr lze považovat za speciální případ, kdy jsou všechny váhy stejné.

Příklady

Ve fyzice

Průměrná rychlost

V mnoha situacích zahrnujících sazby a poměry poskytuje harmonický průměr správný průměr . Pokud například vozidlo urazí určitou vzdálenost d odchozí rychlostí x (např. 60 km/h) a vrátí stejnou vzdálenost rychlostí y (např. 20 km/h), pak je jeho průměrná rychlost harmonickým průměrem x a y (30 km/h) - ne aritmetický průměr (40 km/h). Celková doba jízdy je stejná, jako kdyby urazila celou vzdálenost průměrnou rychlostí. To lze dokázat následovně:

Průměrná rychlost za celou cestu = Celková ujetá vzdálenost/Součet času pro každý segment = 2 d/d/X + d/y = 2/1/X+1/y

Nicméně, v případě, že vozidlo jede po určitou dobu při rychlosti x a potom stejnou dobu při rychlosti y , pak je jeho průměrná rychlost je aritmetický průměr z x a y , které se ve výše uvedeném příkladu je 40 km / h. Stejný princip platí pro více než dva segmenty: je-li dána řada dílčích vypnutí při různých rychlostech, pokud každá dílčí cesta pokrývá stejnou vzdálenost , pak průměrná rychlost je harmonickým průměrem všech rychlostí dílčích vypnutí; a pokud každý dílčí výlet trvá stejně dlouho , pak průměrná rychlost je aritmetickým průměrem všech rychlostí dílčích vypnutí. (Pokud tomu tak není, pak je zapotřebí vážený harmonický průměr nebo vážený aritmetický průměr . Pro aritmetický průměr je rychlost každé části cesty vážena dobou trvání této části, zatímco pro harmonický průměr je odpovídající hmotnost je vzdálenost. V obou případech se výsledný vzorec sníží na dělení celkové vzdálenosti celkovým časem.)

Je však možné se vyhnout použití harmonického průměru pro případ „vážení na vzdálenost“. Problém představte jako nalezení „pomalosti“ cesty, kde „pomalost“ (v hodinách na kilometr) je inverzní k rychlosti. Když je zjištěna pomalost cesty, převraťte ji, abyste našli „skutečnou“ průměrnou rychlost jízdy. Pro každý vypínací segment i je pomalost s i = 1/rychlost i . Poté vezměte vážený aritmetický průměr s i vážený jejich příslušnými vzdálenostmi (volitelně s normalizovanými váhami, které se sčítají na 1 dělením délkou cesty). To dává skutečnou průměrnou pomalost (v čase na kilometr). Ukazuje se, že tento postup, který lze provést bez znalosti harmonického průměru, představuje stejné matematické operace, jaké by člověk použil při řešení tohoto problému pomocí harmonického průměru. Tak to ukazuje, proč harmonický průměr v tomto případě funguje.

Hustota

Podobně, pokud si někdo přeje odhadnout hustotu slitiny s ohledem na hustoty jejích prvků a jejich hmotnostní zlomky (nebo ekvivalentně hmotnostní procenta), pak předpokládaná hustota slitiny (bez typicky malých změn objemu v důsledku atomu balení efekty) je vážený harmonický průměr jednotlivých hustot, vážený hmotností, spíše než vážený aritmetický průměr, jak by se na první pohled dalo očekávat. Chcete -li použít vážený aritmetický průměr, hustoty by musely být váženy podle objemu. Použití dimenzionální analýzy na problém při označování hmotnostních jednotek podle prvku a zajištění toho, aby se zrušily pouze podobné hmotnosti prvků, to objasňuje.

Elektřina

Pokud jeden zapojí dva elektrické odpory paralelně, jeden s odporem x (např. 60 Ω ) a jeden s odporem y (např. 40 Ω), pak je účinek stejný, jako kdyby jeden použil dva odpory se stejným odporem, oba rovná harmonická střední hodnota x a y (48 W): ekvivalentní odpor, v každém případě, je 24 Ω (jedna polovina z harmonický průměr). Stejný princip platí pro kondenzátory v sérii nebo pro induktory paralelně.

Nicméně, jestliže jeden spojuje rezistory v sérii, pak průměrný odpor je aritmetický průměr x a y (s celkovým odporem, který se rovná součtu x a y). Tato zásada platí pro kondenzátory paralelně nebo pro induktory v sérii.

Stejně jako v předchozím příkladu platí stejný princip, když jsou připojeny více než dva odpory, kondenzátory nebo induktory za předpokladu, že jsou všechny paralelně nebo všechny v sérii.

"Efektivní hmotnost vodivosti" polovodiče je také definována jako harmonický průměr účinných hmot ve třech krystalografických směrech.

Optika

Pokud jde o jiné optické rovnice , rovnice tenkých čoček 1/F = 1/u + 1/protilze přepsat tak, že ohnisková vzdálenost f je polovinou harmonického průměru vzdáleností subjektu u a objektu v od objektivu.

Ve financích

Vážený harmonický průměr je upřednostňovanou metodou pro zprůměrování násobků, jako je poměr ceny a zisku (P/E). Pokud jsou tyto poměry zprůměrovány pomocí váženého aritmetického průměru, mají vysoké datové body větší váhu než nízké datové body. Vážený průměr harmonických naopak váží každý datový bod správně. Jednoduchý vážený aritmetický průměr, když je aplikován na necenové normalizované poměry, jako je P/E, je zkreslený směrem nahoru a nelze jej numericky odůvodnit, protože je založen na vyrovnaných výdělcích; stejně jako rychlosti vozidel nelze zprůměrovat pro zpáteční cestu (viz výše).

Zvažte například dvě firmy, jednu s tržní kapitalizací 150 miliard USD a ziskem 5 miliard USD (P/E 30) a druhou s tržní kapitalizací 1 miliarda USD a ziskem 1 milion USD (P/E 1000). Zvažte index vytvořený ze dvou akcií, přičemž 30% bylo investováno do prvního a 70% investováno do druhého. Chceme vypočítat poměr P/E tohoto indexu.

Použití váženého aritmetického průměru (nesprávné):

Použití váženého harmonického průměru (správný):

Správný P/E 93,46 tohoto indexu lze tedy nalézt pouze pomocí váženého harmonického průměru, zatímco vážený aritmetický průměr jej výrazně nadhodnotí.

V geometrii

V každém trojúhelníku je poloměr incircle jedna třetina harmonického průměru výšek .

Pro každý bod P na menší oblouku BC na circumcircle z o rovnostranného trojúhelníka ABC, se vzdáleností q a t z B a C v tomto pořadí, a s průsečíkem PA a BC je ve vzdálenosti y od bodu P, máme, že y je polovina harmonického průměru q a t .

V pravoúhlém trojúhelníku s nohama a a b a nadmořskou výškou h od přepony do pravého úhlu je h ² poloviční harmonický průměr a ² a b ² .

Nechť t a s ( t > s ) jsou strany dvou vepsaných čtverců v pravoúhlém trojúhelníku s přeponou c . Pak s ² se rovná polovině harmonického průměru c ² a t ² .

Nechejte lichoběžník mít za sebou vrcholy A, B, C a D a mít rovnoběžné strany AB a CD. Nechť E je průsečík úhlopříček a nechť F je na straně DA a G je na straně BC tak, aby FEG bylo rovnoběžné s AB a CD. Pak FG je harmonický průměr AB a DC. (To lze prokázat použitím podobných trojúhelníků.)

Překřížené žebříky. h je polovina harmonického průměru A a B

Jedna aplikace tohoto lichoběžníkového výsledku je v problému se zkříženými žebříky , kde dva žebříky leží opačně přes uličku, každý s chodidly na základně jedné boční stěny, přičemž jeden se opírá o zeď ve výšce A a druhý se opírá o opačnou zeď v výška B , jak je znázorněno. Žebříky se kříží ve výšce h nad podlahou uličky. Pak h je polovina harmonický průměr A a B . Tento výsledek stále platí, pokud jsou stěny šikmé, ale stále rovnoběžné a „výšky“ A , B a h jsou měřeny jako vzdálenosti od podlahy podél linií rovnoběžných se stěnami. To lze snadno dokázat pomocí vzorce plochy lichoběžníku a vzorce přidání plochy.

V elipse je semi-latus konečník (vzdálenost od ohniska k elipse podél čáry rovnoběžné s vedlejší osou) harmonickým průměrem maximální a minimální vzdálenosti elipsy od ohniska.

V jiných vědách

V informatice , konkrétně získávání informací a strojovém učení , se harmonický průměr přesnosti (skutečná pozitiva na předpokládaný pozitivní) a odvolání (skutečná pozitiva na skutečný pozitivní) často používá jako agregované skóre výkonu pro hodnocení algoritmů a systémů: F-skóre (nebo F-měření). To se používá při získávání informací, protože relevantní je pouze pozitivní třída , zatímco počet negativ je obecně velký a neznámý. Jedná se tedy o kompromis, zda by správné kladné předpovědi měly být měřeny ve vztahu k počtu predikovaných pozitivních hodnot nebo počtu skutečných pozitivních, takže se měří versus předpokládaný počet pozitivních, což je aritmetický průměr těchto dvou možné jmenovatele.

Důsledek vyplývá ze základní algebry v problémech, kde lidé nebo systémy spolupracují. Pokud například čerpadlo poháněné plynem dokáže vypustit bazén za 4 hodiny a čerpadlo napájené z baterie může vypustit stejný bazén za 6 hodin, bude to trvat obě čerpadla6 · 4/6 + 4, což se rovná 2,4 hodinám, k vypuštění bazénu dohromady. To je polovina harmonického průměru 6 a 4:2 · 6 · 4/6 + 4= 4,8 . To znamená, že vhodný průměr pro dva typy čerpadel je harmonický průměr a u jednoho páru čerpadel (dvě čerpadla) to trvá polovinu tohoto harmonického průměrného času, zatímco u dvou párů čerpadel (čtyři čerpadla) by to trvalo čtvrtina této harmonické střední doby.

V hydrologii se harmonický průměr podobně používá k průměrným hodnotám hydraulické vodivosti pro tok, který je kolmý na vrstvy (např. Geologické nebo půdní) - tok rovnoběžný s vrstvami používá aritmetický průměr. Tento zjevný rozdíl v průměrování je vysvětlen skutečností, že hydrologie používá vodivost, která je inverzní k odporu.

V sabermetrii je číslo rychlosti hráče harmonickým průměrem jejich součtu domácích běhů a odcizení .

V populační genetice se harmonický průměr používá při výpočtu účinků fluktuací ve velikosti sčítání populace na efektivní velikost populace. Harmonický průměr bere v úvahu skutečnost, že události, jako je zúžení populace, zvyšují rychlost genetického driftu a snižují množství genetických variací v populaci. Je to důsledek skutečnosti, že po zúžení velmi málo jedinců přispívá ke genofondu omezujícímu genetické variace přítomné v populaci pro mnoho příštích generací.

Při zvažování úspory paliva v automobilech se běžně používají dvě opatření - míle na galon (mpg) a litry na 100 km. Protože rozměry těchto veličin jsou navzájem inverzní (jedna je vzdálenost na objem, druhá objem na vzdálenost), vezme -li se průměrná hodnota spotřeby paliva řady automobilů, vytvoří jedno opatření harmonický průměr druhého - tj. převedením střední hodnoty spotřeby paliva vyjádřené v litrech na 100 km na míle na galon vznikne harmonický průměr spotřeby paliva vyjádřený v mílích na galon. Pro výpočet průměrné spotřeby paliva vozového parku z jednotlivých spotřeby paliva by měl být použit harmonický průměr, pokud vozový park používá míle na galon, zatímco aritmetický průměr by měl být použit, pokud vozový park používá litry na 100 km. V USA používají standardy CAFE (federální standardy spotřeby pohonných hmot) harmonický průměr.

V chemii a jaderné fyzice je průměrná hmotnost na částici směsi sestávající z různých druhů (např. Molekul nebo izotopů) dána harmonickým průměrem hmotností jednotlivých druhů vážených jejich příslušným hmotnostním zlomkem.

Distribuce beta

Harmonický průměr pro distribuci beta pro 0 <α <5 a 0 <β <5
(Mean - HarmonicMean) pro distribuci beta versus alfa a beta od 0 do 2
Harmonické prostředky pro rozdělení beta Purpurová = H (X), Žlutá = H (1-X), menší hodnoty alfa a beta vpředu
Harmonické prostředky pro rozdělení beta Purple = H (X), Yellow = H (1-X), větší hodnoty alfa a beta vpředu

Harmonický průměr rozdělení beta s parametry tvaru α a β je:

Harmonický průměr s α <1 není definován, protože jeho definující výraz není ohraničen v [0, 1].

Nechat α = β

ukazuje, že pro α = β se harmonický průměr pohybuje od 0 pro α = β = 1, do 1/2 pro α = β → ∞.

Následují limity s jedním parametrem konečným (nenulový) a druhým parametrem blížícím se těmto limitům:

S geometrickým průměrem může být harmonický průměr užitečný při odhadu maximální pravděpodobnosti v případě čtyř parametrů.

Pro toto rozdělení existuje také druhý harmonický průměr ( H 1 - X )

Tento harmonický průměr s β <1 není definován, protože jeho definující výraz není ohraničen v [0, 1].

Nechání α = β ve výše uvedeném výrazu

ukazuje, že pro α = β se harmonický průměr pohybuje od 0, pro α = β = 1, do 1/2, pro α = β → ∞.

Níže jsou uvedeny limity s jedním parametrem konečným (nenulový) a druhým blížícím se těmto limitům:

Ačkoli oba harmonické prostředky jsou asymetrické, když α = β jsou tyto dva prostředky stejné.

Lognormální distribuce

Harmonický průměr ( H ) lognormálního rozdělení je

kde μ je aritmetický průměr a σ 2 je rozptyl rozdělení.

Harmonické a aritmetické prostředky spolu souvisejí

kde C v je variační koeficient .

Geometrické ( G ), aritmetické a harmonické prostředky spolu souvisejí

Paretova distribuce

Harmonický průměr Paretovy distribuce typu 1 je

kde k je parametr měřítka a α je parametr tvaru.

Statistika

Pro náhodný vzorek se harmonický průměr vypočítá výše. Jak střední a rozptyl může být nekonečný (v případě, že obsahuje alespoň jednu funkční formy 1/0).

Ukázkové distribuce průměru a rozptylu

Průměr vzorku m je asymptoticky rozložen normálně s rozptylem s 2 .

Rozptyl samotného průměru je

kde m je aritmetický průměr převrácených hodnot, x jsou varianty, n je velikost populace a E je operátor očekávání.

Delta metoda

Za předpokladu, že rozptyl není nekonečný a že centrální limitní věta platí pro vzorek, pak pomocí metody delta , rozptyl je

kde H je průměr harmonických, m je aritmetický průměr vzájemných hodnot

s 2 je rozptyl vzájemných údajů

a n je počet datových bodů ve vzorku.

Jackknife metoda

Kudla způsob odhadu rozptylu je možné v případě, že průměrná je známa. Tato metoda je obvyklou verzí 'delete 1' spíše než 'delete m'.

Tato metoda nejprve vyžaduje výpočet průměru vzorku ( m )

kde x jsou ukázkové hodnoty.

Poté se vypočítá řada hodnot w i kde

Potom se vezme průměr ( h ) z w i :

Rozptyl průměru je

Testování významnosti a intervaly spolehlivosti pro průměr pak lze odhadnout pomocí t testu .

Vzorkování zkreslené podle velikosti

Předpokládejme, že náhodný rozdíl má rozdělení f ( x ). Předpokládejme také, že pravděpodobnost výběru variátu je úměrná jeho hodnotě. Toto je známé jako vzorkování na základě délky nebo na základě velikosti.

Nechť μ je průměr populace. Pak je funkce hustoty pravděpodobnosti f *( x ) populace s předpojatou velikostí

Očekávání této délky zkreslené distribuce E * ( x ) je

kde σ 2 je rozptyl.

Očekávání harmonického průměru je stejné jako předepnutá verze E ( x ) bez délky

Problém délkově předpjatého vzorkování vzniká v řadě oblastí, včetně analýzy původu rodokmenu a analýzy přežití

Akman a kol. vyvinuli test pro detekci zkreslení založeného na délce ve vzorcích.

Posunuté proměnné

Pokud X je kladná náhodná proměnná a q > 0, pak pro všechna ε > 0

Okamžiky

Za předpokladu, že X a E ( X ) jsou> 0, pak

Vyplývá to z Jensenovy nerovnosti .

Gurland ukázal, že pro distribuci, která má pouze kladné hodnoty, pro jakékoli n > 0

Za určitých podmínek

kde ~ znamená přibližně.

Vlastnosti vzorkování

Za předpokladu, že varianty ( x ) jsou čerpány z lognormálního rozdělení, existuje několik možných odhadů pro H :

kde

Z těchto H 3 je pravděpodobně nejlepší odhad pro vzorky 25 a více.

Odchylky a odchylky

Aproximace prvního řádu na zkreslení a rozptyl H 1 jsou

kde C v je variační koeficient.

Podobně prvního řádu přiblížení k vychýlení a odchylkou H 3 jsou

V numerických experimentech H 3 je obecně lepší než odhad z harmonický průměr než H 1 . H 2 vytváří odhady, které jsou do značné míry podobné H 1 .

Poznámky

Environmental Protection Agency doporučuje použití harmonický průměr při stanovení maximální hladiny toxinů ve vodě.

V inženýrských studiích geofyzikálních nádrží je široce používán harmonický průměr.

Viz také

Reference

externí odkazy