DeepSpeed ​​- DeepSpeed

DeepSpeed
Původní autoři Microsoft Research
Vývojáři Microsoft
První vydání 18. května 2020 ; Před 13 měsíci ( 2020-05-18 )
Stabilní uvolnění
v0.3.16 / 30. dubna 2021 ; před 2 měsíci ( 2021-04-30 )
Úložiště github .com / microsoft / DeepSpeed
Napsáno Python , CUDA , C ++
Typ Softwarová knihovna
Licence Licence MIT
webová stránka deepspeed .ai

DeepSpeed je open source knihovna pro hluboké učení optimalizace pro PyTorch . Knihovna je navržena tak, aby snížila výpočetní výkon a využití paměti a vycvičila velké distribuované modely s lepším paralelismem na stávajícím počítačovém hardwaru . DeepSpeed ​​je optimalizován pro trénink s nízkou latencí a vysokou propustností. Zahrnuje Zero Redundancy Optimizer (ZeRO) pro tréninkové modely se 100 miliardami a více parametry. Mezi funkce patří trénink smíšené přesnosti, trénink s jedním GPU, trénink s více GPU a s více uzly, stejně jako paralelismus vlastních modelů. Zdrojový kód DeepSpeed ​​je licencován pod licencí MIT a je k dispozici na GitHubu .

Tým tvrdil, že dosáhl až 6,2násobného zlepšení propustnosti, 2,8x rychlejší konvergence a 4,6x méně komunikace.

Viz také

Reference

Další čtení

externí odkazy