Spleeter è una libreria di separazione delle fonti di Deezer con modelli preaddestrati scritti in Python che utilizza Tensorflow. Rende facile l'addestramento del modello di separazione delle fonti (supponendo che si abbia un set di dati di fonti isolate), e fornisce un modello già addestrato allo stato dell'arte per eseguire vari tipi di separazione:
Voci (voce cantante) / separazione dell'accompagnamento (2 stems)
Separazione voce / batteria / basso / altro (4 stems)
Voci / batteria / basso / pianoforte / altre separazioni (5 stems)
I modelli 2 stems e 4 stems hanno prestazioni elevate sul dataset musdb. Spleeter è anche molto veloce in quanto può eseguire la separazione di file audio a 4 stems 100 volte più velocemente del tempo reale quando viene eseguito su una GPU.
Spleeter è stato progettato in modo che si possa usare direttamente dalla linea di comando o nella propria pipeline di sviluppo come una libreria Python. Può essere installato con pip o utilizzato con Docker.
Add new comment