Shogun (sada nástrojů) - Shogun (toolbox)

Sada nástrojů pro strojové učení Shogun
Původní autoři Gunnar Rätsch
Soeren Sonnenburg
Vývojáři Soeren Sonnenburg
Sergey
Lisitsyn Heiko Strathmann
Fernando Iglesias
Viktor Gal
Stabilní uvolnění
6.0.0 / 25. dubna 2017 ( 2017-04-25 )
Úložiště github .com / shogun-toolbox / shogun
Napsáno C ++
Operační systém Cross-platform
Typ Softwarová knihovna
Licence BSD3 s volitelným GNU GPLv3
webová stránka www .shogun .ml

Shogun je zdarma , open-source strojové učení software knihovna napsaná v C ++ . Nabízí řadu algoritmů a datových struktur pro problémy se strojovým učením . Nabízí rozhraní pro Octave , Python , R , Java , Lua , Ruby a C # pomocí SWIG .

Je licencován podle podmínek GNU General Public License verze 3 nebo novější.

Popis

Shogun se zaměřuje na jádrové stroje, jako jsou podpůrné vektorové stroje pro regresní a klasifikační problémy. Shogun také nabízí plnou implementaci modelů Hidden Markov . Jádro Shogun je napsáno v C ++ a nabízí rozhraní pro MATLAB , Octave , Python , R , Java , Lua , Ruby a C # . Shogun je v aktivním vývoji od roku 1999. Dnes existuje na celém světě živá komunita uživatelů, která používá Shogun jako základnu pro výzkum a vzdělávání a přispívá k základnímu balíčku.

Snímek obrazovky pořízený v systému Mac OS X

Podporované algoritmy

V současné době Shogun podporuje následující algoritmy:

  • Podporujte vektorové stroje
  • Algoritmy redukce rozměrů, jako PCA, jádro PCA, lokálně lineární vkládání, hesenské lokálně lineární vkládání, zarovnání místního tečného prostoru, zarovnání lineárního místního tečného prostoru, zarovnávání jádra lokálně lineární, zarovnání lokálního tangenciálního prostoru jádra, vícerozměrné škálování, izomapa, mapy difúze, Laplaciánské vlastní mapy
  • Online výukové algoritmy jako SGD-QN, Vowpal Wabbit
  • Algoritmy shlukování: k-means a GMM
  • Kernel Ridge Regression, Support Vector Regression
  • Skryté Markovovy modely
  • K-nejbližší sousedé
  • Lineární diskriminační analýza
  • Perceptrony jádra.

Je implementováno mnoho různých jader, od jader pro numerická data (jako jsou gaussianská nebo lineární jádra) až po jádra se speciálními daty (například řetězce přes určité abecedy). Aktuálně implementovaná jádra pro numerická data zahrnují:

  • lineární
  • gaussian
  • polynomiální
  • sigmoidní jádra

Mezi podporovaná jádra pro speciální data patří:

  • Spektrum
  • Vážený stupeň
  • Vážený stupeň se směnami

Druhá skupina jader umožňuje zpracování libovolných sekvencí přes pevné abecedy, jako jsou sekvence DNA , i celé texty e-mailů.

Speciální funkce

Protože byl Shogun vyvinut s ohledem na aplikace bioinformatiky , je schopen zpracovávat obrovské datové sady skládající se až z 10 milionů vzorků. Shogun podporuje použití předem vypočítaných jader. Je také možné použít kombinované jádro, tj. Jádro skládající se z lineární kombinace libovolných jader v různých doménách. Lze se naučit také koeficienty nebo váhy lineární kombinace. Za tímto účelem nabízí Shogun více funkcí učení jádra .

Reference

  • S. Sonnenburg, G. Rätsch, S. Henschel, C. Widmer, J. Behr, A. Zien, F. De Bona, A. Binder, C. Gehl a V. Franc: The SHOGUN Machine Learning Toolbox , Journal of Machine Learning Research , 11: 1799-1802, 11. června 2010.
  • M. Gashler. Vafle: Sada nástrojů pro strojové učení. Journal of Machine Learning Research, 12 (July): 2383–2387, 2011.
  • P. Vincent, Y. Bengio, N. Chapados a O. Delalleau. Naučte se vysoce výkonnou knihovnu strojového učení. URL http://plearn.berlios.de/ .

externí odkazy

  • Domovská stránka sady nástrojů Shogun
  • shogun na GitHubu
  • „SHOGUN“ . Volný kód .