Sabermetrics - Sabermetrics

Sabermetrics nebo SABRmetrics je empirická analýza baseballu , zejména baseballová statistika, která měří aktivitu ve hře.

Sabermetrikové shromažďují a shrnují relevantní data z této herní aktivity, aby odpověděli na konkrétní otázky. Termín je odvozen od zkratky SABR, což je zkratka pro Society for American Baseball Research , založenou v roce 1971. Pojem „sabermetrics“ vytvořil Bill James , který je jedním z jeho průkopníků a je často považován za jeho nejvýznamnějšího obhájce a veřejnost. tvář.

Raná historie

Henry Chadwick , sportovní spisovatel v New Yorku, vytvořil boxové skóre v roce 1858. To byl první způsob, jakým mohli statistici popsat baseballový sport numerickým sledováním různých aspektů hraní her. Vytvoření skóre boxu poskytlo statistikům baseballu souhrn individuálních a týmových výkonů pro danou hru.

Sabermetrics výzkum začal v polovině 20. století se spisy Earnshaw Cook , jeden z prvních sabermetricians. Cookova kniha z roku 1964 Procentní baseball byla jednou z prvních svého druhu. Většina organizovaných baseballových týmů a profesionálů zpočátku považovala Cookovu práci za nesmyslnou. Myšlenka vědy o baseballové statistice začala dosahovat legitimity v roce 1977, kdy Bill James začal vydávat Baseball Abstracts , své roční kompendium baseballových dat. Jamesovy myšlenky se však pomalu začaly těšit širokému přijetí.

Bill James věřil, že došlo k rozšířenému nedorozumění ohledně toho, jak se hraje baseball, a tvrdil, že sport nebyl definován jeho pravidly, ale ve skutečnosti, jak shrnul profesor inženýrství Richard J. Puerzer, „definován podmínkami, za kterých se hra hraje -konkrétně míčové hry, ale také hráči, etika, strategie, vybavení a očekávání veřejnosti. “ Sabermetrikové, někdy považovaní za statistiky baseballu, se začali snažit nahradit dlouholetou oblíbenou statistiku známou jako průměr pálkování. Bylo prohlašováno, že průměr týmového odpalování poskytuje relativně špatnou kondici pro zaznamenané týmové běhy. Sabermetrické úvahy by říkaly, že běhy vyhrávají míčové hry a že dobrým měřítkem hodnoty hráče je jeho schopnost pomoci svému týmu nastřílet více běhů než tým soupeře.

Než Bill James propagoval sabermetrii, Davey Johnson použil systém IBM System/360 v pivovaru majitele týmu Jerolda Hoffbergera, aby na začátku 70. let napsal simulaci baseballového počítače FORTRAN při hraní za Baltimore Orioles . Své výsledky použil při neúspěšném pokusu prosadit u svého manažera Earla Weavera myšlenku, že by měl v sestavě pálkovat jako druhý. Napsal programy IBM BASIC, které mu měly pomoci spravovat Tidewater Tides , a poté, co se v roce 1984 stal manažerem New York Mets , zařídil, aby týmový zaměstnanec napsal aplikaci dBASE II ke kompilaci a ukládání pokročilých metrik do týmové statistiky. Craig R. Wright byl dalším zaměstnancem Major League Baseball, který na začátku osmdesátých let pracoval s Texas Rangers . Během svého působení u Strážců se stal známým jako první zaměstnanec front office v historii MLB, který pracoval pod názvem Sabermetrician.

David Smith založil Retrosheet v roce 1989 s cílem elektronizovat skóre boxu v každé hlavní ligové baseballové hře, která kdy byla hrána, za účelem přesnějšího shromažďování a porovnávání statistik hry.

The Oakland Athletics začal používat více kvantitativní přístup k baseballu se zaměřením na sabermetrické principy v 90. letech minulého století. Zpočátku to začalo tím, že Sandy Alderson jako generální manažer týmu použil zásady k získávání relativně podhodnocených hráčů. Jeho myšlenky pokračovaly, když Billy Beane převzal funkci generálního ředitele v roce 1997, práci, kterou zastával až do roku 2015, a najal svého asistenta Paula DePodestu . Díky statistické analýze, kterou provedli Beane a DePodesta v sezóně 2002, vyhráli Oakland A 20 zápasů v řadě. Pro franšízu to byl historický okamžik, ve kterém se 20. hra hrála v Alameda County Coliseum. Jeho přístupy k baseballu brzy získaly národní uznání, když Michael Lewis v roce 2003 publikoval Moneyball: The Art of Winning an Unfair Game, kde podrobně popsal Beaneovo používání Sabermetrics. V roce 2011 byl vydán film podle Lewisovy knihy - také nazývané Moneyball -, který se podrobně seznámil s technikami používanými v přední kanceláři Oakland Athletics.

Tradiční měření

Sabermetrics byl vytvořen ve snaze, aby se fanoušci baseballu dozvěděli o sportu prostřednictvím objektivních důkazů. To se provádí hodnocením hráčů v každém aspektu hry, konkrétně v odpalování, nadhazování a v poli. Tato hodnotící opatření jsou obvykle formulována z hlediska běhů nebo vítězství týmu, protože starší statistiky byly považovány za neúčinné.

Měření odpalování

Za tradiční měřítko odpalovacího výkonu se považují zásahy dělené celkovým počtem pálkařů. Bill James, spolu s dalšími otci sabermetrie, shledal toto opatření chybným, protože ignoruje jakýkoli jiný způsob, jak se těsto může dostat na základnu kromě zásahu. To vedlo k vytvoření procenta On-base , které bere v úvahu procházky a trefování po hřištích. Pro výpočet procenta On-Base se celkový počet zásahů + základen na míčích + zásahů podle hřiště dělí číslem u netopýrů + základen na míčích + zásahem hřiště + obětováním much.

Dalším problémem tradiční míry průměrování odpalování je, že nerozlišuje mezi zásahy (tj. Dvouhra, čtyřhra, trojka a oběh) a každému zásahu dává stejnou hodnotu. Bylo tedy vytvořeno měřítko, které rozlišuje mezi těmito čtyřmi výsledky hitů, tlouci procento . Pro výpočet procenta tlouknutí se celkový počet bází všech zásahů vydělí celkovým počtem opakování u netopýra. Stephen Jay Gould navrhl, že zmizení průměru odpalování 0,400 je ve skutečnosti známkou obecného zlepšení odpalování. Důvodem je, že v moderní době se hráči začínají více soustředit na dosahování sil než na průměr. Proto se stalo cennějším porovnávat hráče pomocí procenta tlouknutí a procenta na základně nad průměrem pálkování.

Tato dvě vylepšená sabermetrická opatření jsou důležitými dovednostmi pro měření v těstíčku a byla zkombinována za účelem vytvoření moderní statistiky OPS. On-base plus slugging je součet procenta na základně a procenta tlouknutí. Tato moderní statistika se stala užitečnou při porovnávání hráčů a je účinnou metodou predikce běhů zaznamenaných od určitého hráče.

Některé z dalších statistik, které sabermetricians používají k vyhodnocení výkonu odpalování, jsou váženy na základě průměrného průměru , sekundárního průměru , vytvořených běhů a ekvivalentního průměru .

Měření rozteče

Tradiční mírou výkonu nadhazování je získaný průměr běhu. Vypočítává se jako povolené běhy povolené na 9 směn. Earned run average neodděluje schopnost nadhazovače od schopností hráčů v poli, se kterými hraje. Dalším klasickým měřítkem nadhazování je procento vítěze nadhazovače . Výherní procento se vypočítá vydělením výher počtem rozhodnutí (vítězství a prohry). Vítězné procento je také silně závislé na týmu nadhazovače, zejména na počtu běhů, které skóruje.

Sabermetrikové se pokusili najít různé míry výkonu nadhazování, které vylučují výkony zúčastněných hráčů v poli. Jednou z prvních vyvinutých a jednou z nejpopulárnějších v používání jsou procházky plus zásahy na jednu směnu (WHIP), které, i když nejsou zcela nezávislé na obraně, mají tendenci ukazovat, kolikrát nadhazovač pravděpodobně postaví hráče na základnu (buď základna-na-míče, hit-by-pitch, nebo base hit) a tedy jak efektivní jsou odpalovači proti konkrétnímu nadhazovači při dosahování základny. Novějším vývojem je vytvoření systému DIPS ( Defense independent pitching statistics ). Voros McCracken byl připočítán s rozvojem tohoto systému v roce 1999. Prostřednictvím svého výzkumu McCracken dokázal, že mezi nadhazovači je malý až žádný rozdíl v počtu odpalovaných úderů na míče vložené do hry, bez ohledu na úroveň jejich dovedností. . Některé příklady těchto statistik jsou ERA nezávislá na obraně, nezávislé hřiště na poli a komponenta ERA nezávislá na obraně . Další sabermetrikové pokračovali v práci v DIPS, například Tom Tango, který provozuje web sabermetrie Tango na baseballu .

Baseball Prospectus vytvořil další statistiku zvanou periferní ERA . Tato míra výkonu nadhazovače bere hity, procházky, povolený běh domů a strikeouty, přičemž se přizpůsobuje faktorům hřiště. Každý hřiště má jiné rozměry, pokud jde o vnější zeď, takže džbán by neměl být měřen stejně pro každý z těchto parků.

Průměr pálkování na míčích ve hře (BABIP) je dalším užitečným měřením pro určení výkonu nadhazovače. Když má džbán vysoký BABIP, často se v následující sezóně projeví vylepšení, zatímco džbán s nízkým BABIP často v následující sezóně vykazuje pokles. To je založeno na statistickém konceptu regrese k průměru . Jiní vytvořili různé způsoby, jak se pokusit kvantifikovat jednotlivá hřiště na základě charakteristik hřiště, na rozdíl od běhů získaných nebo zasažených míčů.

Algebra pro pokročilé

Hodnota nad náhradním hráčem (VORP) je považována za populární sabermetrickou statistiku. Tato statistika ukazuje, jak moc hráč přispívá svému týmu ve srovnání s hypotetickým hráčem, který hraje na minimální úrovni potřebné k udržení pozice na soupisce v prvoligovém týmu. Toto měření vynalezl Keith Woolner, bývalý spisovatel sabermetrické skupiny/webových stránek Baseball Prospectus .

Vítězství nad výměnou (VÁLKA) je další populární sabermetrická statistika pro hodnocení příspěvků hráče do jeho týmu. Podobně jako VORP, WAR porovnává daného hráče s hráčem na náhradní úrovni, aby určil počet dalších výher, které hráč poskytl svému týmu. Hodnoty VÁLKY se liší podle pozice zasažení a jsou do značné míry dány úspěšným výkonem hráče a délkou hracího času.

Kvantitativní analýza v baseballu

Mnoho tradičních a moderních statistik, jako jsou ERA a Wins Shared, neposkytuje úplné porozumění tomu, co se na hřišti odehrává. Jednoduché poměry nestačí k pochopení statistických údajů o baseballu. Strukturovaná kvantitativní analýza je schopna vysvětlit mnoho aspektů hry, například zjistit, jak často by se tým měl pokoušet krást .

Aplikace

Sabermetrics lze použít k více účelům, ale nejběžnější je hodnocení výkonu v minulosti a předpovídání výkonu budoucího, aby se určil přínos hráče do jeho týmu. Ty mohou být užitečné při určování, kdo by měl vyhrát ocenění na konci sezóny, jako je MVP, a při určování hodnoty určitého obchodu.

Většina hráčů baseballu má tendenci hrát několik let v menších ligách, než jsou povoláni do hlavní ligy. Konkurenční rozdíly spojené s efekty ballpark dělají problém přesného srovnání statistik hráče. Sabermetričané dokázali tento problém vyřešit úpravou hráčovy statistiky menší ligy, známé také jako ekvivalence menší ligy. Prostřednictvím těchto úprav mohou týmy sledovat výkon hráče v AA i AAA, aby zjistili, zda je způsobilý být povolán do velkých společností.

Aplikované statistiky

Sabermetrics metody se obecně používají pro tři účely:

  1. Porovnat klíčové výkony mezi určitými konkrétními hráči za realistických datových podmínek. Hodnocení minulých výkonů hráče umožňuje analytický přehled. Porovnání těchto dat mezi hráči může pomoci porozumět klíčovým bodům, jako jsou jejich tržní hodnoty. Tímto způsobem lze definovat roli a plat, který by měl být danému hráči přidělen.
  2. Poskytnout předpověď budoucí výkonnosti daného hráče nebo týmu. Pokud jsou k dispozici minulé údaje o výkonu týmu nebo konkrétního hráče, lze Sabermetrics použít k předpovědi průměrných budoucích výkonů pro příští sezónu. Lze tedy s jistou pravděpodobností předpovědět počet výher a ztrát.
  3. Poskytnout užitečnou funkci příspěvků hráče svému týmu. Při analýze dat je člověk schopen porozumět příspěvkům hráče k úspěchu/neúspěchu svého týmu. Vzhledem k této korelaci lze objektivně podepsat nebo uvolnit hráče s určitými vlastnostmi.

Strojové učení pro předpovídání výsledku hry

Model strojového učení lze vytvořit pomocí datových sad dostupných u zdrojů, jako je například baseball-reference. Tento model poskytne odhady pravděpodobnosti výsledku konkrétních her nebo výkonu konkrétních hráčů. Tyto odhady jsou stále přesnější, pokud jsou aplikovány na velký počet událostí v dlouhodobém horizontu. Výsledek hry (výhra/prohra) je považován za binomickou distribuci.

Předpovědi lze provádět pomocí logistického regresního modelu s vysvětlujícími proměnnými, mezi něž patří: skórované běhy soupeřů, skórované běhy, shutouts čas na pálce, míra výher a nadhazovač.

Nedávné pokroky

Mnoho sabermetricianů stále tvrdě pracuje na tom, aby přispěli do oblasti vytvářením nových opatření a kladením nových otázek. Dvě pětiletí historických abeced Billa Jamese a kniha Win Shares pokračovaly v rozvoji sabermetrie, 25 let poté, co pomohl toto hnutí rozjet. Jeho bývalý asistent Rob Neyer , který je nyní vedoucím spisovatelem na ESPN.com a národním baseballovým redaktorem SBNation, také pracoval na popularizaci sabermetrie od poloviny 80. let.

Nate Silver , bývalý spisovatel a vedoucí partner Baseball Prospectus , vynalezl PECOTA . Tato zkratka znamená Algoritmus testů empirického srovnání a optimalizace hráčů a je sabermetrickým systémem pro předpovídání výkonu hráče Major League Baseball. Jednoduše řečeno, předpokládá, že kariéra podobných hráčů půjde po podobné trajektorii. Tento systém vlastní Baseball Prospectus od roku 2003 a pomáhá autorům webových stránek vymyslet nebo vylepšit široce spoléhající sabermetrická opatření a techniky.

Počínaje baseballovou sezónou 2007 se MLB začalo zabývat technologií, která by zaznamenávala podrobné informace o každém hřišti, které se ve hře hodí. To se stalo známým jako systém PITCHf/x , který je schopen zaznamenávat rychlost hřiště v místě jeho uvolnění a při překročení desky, stejně jako umístění a úhel přerušení určitých hřišť prostřednictvím videokamer. FanGraphs je webová stránka, která upřednostňuje tento systém a také analýzu dat play-by-play. Web se také specializuje na publikování pokročilých baseballových statistik a grafiky, která vyhodnocuje a sleduje výkon hráčů a týmů.

V populární kultuře

Viz také

Reference

Poznámky

externí odkazy