Automatické strojové učení - Automated machine learning
Část série na |
Strojové učení a dolování dat |
---|
Automatizované strojové učení ( AutoML ) je proces automatizace úkolů aplikace strojového učení na problémy reálného světa. AutoML pokrývá celý kanál od nezpracované datové sady po model nasaditelného strojového učení. AutoML bylo navrženo jako řešení založené na umělé inteligenci pro stále rostoucí výzvu aplikace strojového učení. Vysoký stupeň automatizace v AutoML umožňuje neodborníkům využívat modely a techniky strojového učení, aniž by museli být odborníky na strojové učení. Automatizace procesu aplikace strojového učení end-to-end navíc nabízí výhody výroby jednodušších řešení, rychlejší vytváření těchto řešení a modelů, které často překonávají ručně navržené modely. Ke srovnání relativní důležitosti každého faktoru v predikčním modelu bylo použito AutoML.
Srovnání se standardním přístupem
V typické aplikaci strojového učení mají praktici sadu vstupních datových bodů, které mají být použity pro školení. Nezpracovaná data nemusí mít formu, na kterou lze použít všechny algoritmy. Aby byly údaje přístupné pro strojové učení, odborník bude muset požádat příslušný datový předzpracování , funkce inženýrství , extrakce příznaků a výběr funkce metody. Po těchto krocích musí praktici provést výběr algoritmu a optimalizaci hyperparametru, aby maximalizovali prediktivní výkon svého modelu. Každý z těchto kroků může být náročný, což má za následek značné překážky používání strojového učení.
AutoML dramaticky zjednodušuje tyto kroky pro neodborníky.
Cíle automatizace
Automatizované strojové učení může cílit na různé fáze procesu strojového učení. Kroky k automatizaci jsou:
-
Příprava a příjem dat (z nezpracovaných dat a různých formátů)
- Detekce typu sloupce ; např. logická, diskrétní, spojitá nebo textová
- Detekce záměru sloupce; např. cíl/štítek, stratifikační pole, numerický znak, znak kategorického textu nebo funkce volného textu
- Detekce úkolů; např. binární klasifikace , regrese , shlukování nebo hodnocení
-
Funkce inženýrství
- Výběr funkcí
- Extrakce funkcí
- Meta učení a přenosové učení
- Detekce a zpracování zkosených dat a/nebo chybějících hodnot
- Výběr modelu
- Optimalizace hyperparametru učecího algoritmu a featurizace
- Výběr potrubí za omezení času, paměti a složitosti
- Výběr metrik hodnocení a postupů validace
- Kontrola problému
- Detekce úniku
- Detekce chybné konfigurace
- Analýza získaných výsledků
- Vytváření uživatelských rozhraní a vizualizací
Viz také
Reference
Další čtení
- „Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn a NNI“ . Bizety . 16. června 2020.