Přesnost a preciznost - Accuracy and precision

V sadě měření je přesnost blízkost měření ke konkrétní hodnotě, zatímco přesnost je vzájemná blízkost měření.

Přesnost má dvě definice:

  1. Běžněji je to popis systematických chyb , míra statistických předpojatostí ; nízká přesnost způsobuje rozdíl mezi výsledkem a „skutečnou“ hodnotou. ISO tomu říká pravdivost .
  2. Alternativně ISO definuje přesnost jako popis kombinace obou typů výše uvedených pozorovacích chyb (náhodných a systematických), takže vysoká přesnost vyžaduje vysokou přesnost i vysokou pravdivost.

Přesnost je popis náhodných chyb , měřítko statistické variability .

Jednodušeji řečeno, vzhledem k souboru datových bodů z opakovaných měření stejné veličiny lze o této sadě říci, že je přesná, pokud se jejich průměr blíží skutečné hodnotě měřené veličiny, zatímco o sadě lze říci, že je přesná. pokud jsou hodnoty blízko sebe. V první, běžnější definici „přesnosti“ výše, jsou tyto dva pojmy na sobě nezávislé, takže o konkrétním souboru dat lze říci, že je buď přesný, nebo přesný, nebo obojí, nebo žádný.

Společná technická definice

Přesnost je blízkost výsledků měření ke skutečné hodnotě; přesnost je míra, do které opakovaná (nebo reprodukovatelná ) měření za nezměněných podmínek ukazují stejné výsledky.

V oblasti vědy a techniky je přesnost měřicího systému mírou blízkosti měření veličiny ke skutečné hodnotě této veličiny . Přesnost měřicího systému, vztahující se k reprodukovatelnosti a opakovatelnosti , je mírou, do které opakovaná měření za nezměněných podmínek ukazují stejné výsledky . Ačkoli tato dvě slova přesnost a přesnost mohou být v hovorovém používání synonymem, v kontextu vědecké metody jsou záměrně kontrastována .

Oblast statistiky , kde hraje ústřední roli interpretace měření, upřednostňuje místo přesnosti a přesnosti používat pojmy zkreslení a variabilita : zkreslení je míra nepřesnosti a variabilita míra nepřesnosti.

Systém měření může být přesný, ale ne přesný, přesný, ale ani přesný, ani jeden, ani oba. Pokud například experiment obsahuje systematickou chybu , zvětšení velikosti vzorku obecně zvyšuje přesnost, ale nezlepšuje přesnost. Výsledkem by byl konzistentní, ale nepřesný řetězec výsledků chybného experimentu. Odstranění systematické chyby zvyšuje přesnost, ale nemění přesnost.

Měřicí systém je považován za platný, pokud je přesný a přesný . Související pojmy zahrnují zkreslení ( náhodné nebo řízené efekty způsobené faktorem nebo faktory nesouvisejícími s nezávislou proměnnou ) a chyby (náhodná variabilita).

Terminologie je také aplikována na nepřímá měření - tj. Hodnoty získané výpočetním postupem z pozorovaných dat.

Kromě přesnosti a přesnosti mohou mít měření také rozlišení měření , což je nejmenší změna základní fyzikální veličiny, která vytváří odezvu při měření.

V numerické analýze je přesnost také blízkost výpočtu ke skutečné hodnotě; zatímco přesnost je rozlišení reprezentace, obvykle definované počtem desítkových nebo binárních číslic.

Z vojenského hlediska se přesnost vztahuje především na přesnost palby ( justesse de tir ), přesnost palby vyjádřenou blízkostí seskupení střel ve středu cíle a kolem něj.

Kvantifikace

V průmyslové instrumentaci je přesnost tolerancí měření nebo přenosem přístroje a definuje meze chyb vzniklých při používání přístroje v normálních provozních podmínkách.

V ideálním případě je měřicí zařízení přesné a přesné, přičemž všechna měření jsou blízko a těsně seskupena kolem skutečné hodnoty. Přesnost a přesnost procesu měření je obvykle stanovena opakovaným měřením nějakého sledovatelného referenčního standardu . Tyto standardy jsou definovány v Mezinárodním systému jednotek (zkráceně SI z francouzštiny: Système international d'unités ) a jsou udržovány národními normalizačními organizacemi , jako je National Institute of Standards and Technology ve Spojených státech.

To platí také v případě, že se měření opakují a zprůměrují. V takovém případě je správně použit termín standardní chyba : přesnost průměru se rovná známé standardní odchylce procesu děleno druhou odmocninou z počtu průměrovaných měření. Dále, centrální limitní věta ukazuje, že rozdělení pravděpodobnosti z průměrných měření budou blíže k normálnímu rozdělení, než je jednotlivých měření.

Pokud jde o přesnost, můžeme rozlišit:

  • rozdíl mezi průměrem měření a referenční hodnotou, zkreslení . Pro kalibraci je nutné stanovit a opravit předpětí .
  • kombinovaný účinek a přesnost.

Běžnou praxí ve vědě a technice je vyjadřovat přesnost a/nebo přesnost implicitně pomocí významných čísel . Není-li to výslovně uvedeno, rozumí se mezí chyby poloviční hodnota posledního významného místa. Například záznam 843,6 m nebo 843,0 m nebo 800,0 m by znamenal rozpětí 0,05 m (poslední významné místo je desáté místo), zatímco záznam 843 m by znamenal rozpětí chyby 0,5 m ( poslední významné číslice jsou jednotky).

Odečet 8 000 m s nulami na konci a bez desetinné čárky je nejednoznačný; koncové nuly mohou, ale nemusí být považovány za významné číslice. Aby se předešlo této nejednoznačnosti, by mohl být počet zastoupeny ve vědecké notaci: 8,0 x 10 3  znakem M označuje, že první nula je významný (tedy rozpětí 50 m) při 8,000 x 10 3  znakem M označuje, že všechny tři nuly jsou významné, za získání rozpětí 0,5 m. Stejně tak je možné použít násobek základní jednotkou měření: 8,0 km se rovná 8,0 x 10 3  m. Udává rozpětí 0,05 km (50 m). Spoléhání se na tuto konvenci však může vést k chybám falešné přesnosti při přijímání dat ze zdrojů, které ji nedodržují. Například zdroj vykazující číslo jako 153 753 s přesností +/- 5 000 vypadá, že má přesnost +/- 0,5. Podle úmluvy by to bylo zaokrouhleno na 154 000.

Alternativně, pokud je ve vědeckém kontextu požadováno uvést přesnost chyby s větší přesností, lze použít zápis, jako je 7,54398 (23) × 10 −10 m, což znamená rozsah mezi 7,54375 a 7,54421 × 10 −10 m.

Přesnost zahrnuje:

  • opakovatelnost - variace vznikající při veškerém úsilí o udržení konstantních podmínek pomocí stejného nástroje a operátora a opakování během krátkého časového období; a
  • reprodukovatelnost - variace vznikající při použití stejného postupu měření mezi různými přístroji a operátory a v delších časových obdobích.

Ve strojírenství se přesnost často bere jako trojnásobek standardní odchylky provedených měření, což představuje rozsah, ve kterém se může vyskytnout 99,73% měření. Ergonom, který měří lidské tělo, si například může být jistý, že 99,73% jeho extrahovaných měření spadá do rozmezí ± 0,7 cm - při použití systému zpracování GRYPHON - nebo ± 13 cm - při použití nezpracovaných dat.

Definice ISO (ISO 5725)

Podle ISO 5725-1 se přesnost skládá z pravdivosti (blízkost výsledků měření ke skutečné hodnotě) a přesnosti (opakovatelnost nebo reprodukovatelnost měření)

Posun ve smyslu těchto pojmů nastal s vydáním řady norem ISO 5725 v roce 1994, což se odráží i v čísle „BIPM International Vocabulary of Metrology“ (VIM) z roku 2008, body 2.13 a 2.14.

Podle ISO 5725-1 je obecný termín „přesnost“ používán k popisu blízkosti měření ke skutečné hodnotě. Když je termín aplikován na sady měření stejné měřené veličiny , zahrnuje složku náhodné chyby a složku systematických chyb. V tomto případě je pravdivost blízkost průměru sady výsledků měření ke skutečné (skutečné) hodnotě a přesnost je shoda shody mezi sadou výsledků.

ISO 5725-1 a VIM se také vyhýbají používání pojmu „ předpojatost “, dříve specifikovaného v BS 5497-1, protože má různé konotace mimo oblasti vědy a techniky, jako v medicíně a právu.

V binární klasifikaci

Přesnost se také používá jako statistické měřítko toho, jak dobře test binární klasifikace správně identifikuje nebo vylučuje podmínku. To znamená, že přesnost je podíl správných předpovědí ( skutečných pozitivních i skutečných negativních ) mezi celkovým počtem zkoumaných případů. Porovnává tak odhady pravděpodobnosti před a po testu . Aby byl kontext sémantikou jasný, je často označován jako „přesnost Rand“ nebo „ Randův index “. Je to parametr testu. Vzorec pro kvantifikaci binární přesnosti je:

kde TP = skutečně pozitivní ; FP = falešně pozitivní ; TN = skutečně negativní ; FN = falešně negativní

Všimněte si, že v této souvislosti nejsou použitelné koncepce pravdivosti a přesnosti definované v ISO 5725-1. Jedním z důvodů je, že pro každý případ neexistuje jediná „skutečná hodnota“ veličiny, ale spíše dvě možné skutečné hodnoty, zatímco přesnost je ve všech případech průměrem, a proto zohledňuje obě hodnoty. Termín přesnost se však v tomto kontextu používá k označení jiné metriky pocházející z oblasti získávání informací ( viz níže ).

V psychometrii a psychofyzice

V psychometrii a psychofyzice je termín přesnost zaměnitelně používán s validitou a konstantní chybou . Precision je synonymem pro spolehlivost a variabilní chyby . Platnost měřicího nástroje nebo psychologického testu se stanoví experimentem nebo korelací s chováním. Spolehlivost je stanovena řadou statistických technik, klasicky prostřednictvím interního testu konzistence, jako je Cronbachova alfa, aby se zajistilo, že sady souvisejících otázek mají související odpovědi, a poté srovnání těchto souvisejících otázek mezi referenční a cílovou populací.

V logické simulaci

V logické simulaci , Častou chybou při hodnocení přesných modelů je srovnávat modelu logika simulace na tranzistorové simulačního modelu obvodu . Toto je srovnání rozdílů v přesnosti, ne přesnosti. Přesnost se měří s ohledem na detail a přesnost se měří s ohledem na realitu.

V informačních systémech

Systémy získávání informací, jako jsou databáze a webové vyhledávače , jsou hodnoceny mnoha různými metrikami , z nichž některé jsou odvozeny z matice zmatků , která rozděluje výsledky na skutečná pozitiva (správně načtené dokumenty), pravdivé negativy (správně načtené dokumenty), falešně pozitivní (nesprávně načtené dokumenty) a falešně negativní (nesprávně načtené dokumenty). Mezi běžně používané metriky patří představy o přesnosti a odvolání . V tomto kontextu je přesnost definována jako zlomek načtených dokumentů, které jsou relevantní pro dotaz (skutečná pozitiva dělena skutečností+falešná pozitiva), pomocí sady výsledků relevantních pro základní pravdu vybraných lidmi. Vyvolání je definováno jako zlomek relevantních načtených dokumentů ve srovnání s celkovým počtem příslušných dokumentů (skutečná pozitiva dělená skutečnými pozitivy+falešná negativa). Méně často se používá metrika přesnosti, která je definována jako celkový počet správných klasifikací (skutečná pozitiva plus pravdivá negativa) děleno celkovým počtem dokumentů.

Žádná z těchto metrik nebere v úvahu pořadí výsledků. Hodnocení je pro webové vyhledávače velmi důležité, protože čtenáři jen zřídka projdou první stránku s výsledky a na webu je příliš mnoho dokumentů na to, aby je bylo možné všechny ručně zařadit, zda mají být zahrnuty nebo vyloučeny z daného vyhledávání. Přidání mezní hodnoty pro určitý počet výsledků do určité míry zohledňuje hodnocení. Přesnost měření na k je například mírou přesnosti, která se dívá pouze na výsledky vyhledávání v první desítce (k = 10). Sofistikovanější metriky, jako například zlevněný kumulativní zisk , berou v úvahu každé jednotlivé hodnocení a běžně se používají tam, kde je to důležité.

Viz také

Reference

externí odkazy