Flowtron Text to Speech

categorie

Flowtron


Flowtron è una tecnologia di nVidia che deriva da questo studio: "Flowtron: an Autoregressive Flow-based Generative Network for Text-to-Speech Synthesis".

Di cosa si tratta ?. Flowtron è una rete neurale generativa autoregressiva basata sul flusso per la sintesi vocale con il controllo della variazione del parlato e del trasferimento di tono e timbro. Flowtron prende in prestito intuizioni da IAF e rivisita Tacotron per fornire una sintesi MEL-spettrografica di alta qualità ed espressività. E' ottimizzato massimizzando la probabilità dei dati di addestramento, il che rende l'addestramento semplice e stabile. Flowtron apprende una mappatura invertibile dei dati in uno spazio latente che può essere manipolato per controllare molti aspetti della sintesi vocale (altezza, tono, velocità del discorso, cadenza, accento). I risultati sono sorprendenti, e benchè le voci abbiamo qualche distorsione di sintesi qua e là la presenza del tono e del timbro e della cadenza le fa sembrare assolutamente reali, e i difetti sembra siano dei disturbi di trasmissione del segnale, invece che imperfezioni.

Google Colab

SpeechBrain: A general-purpose PyTorch speech processing toolkit

Customize variations and style transfer
style transfer examples

github repo
reddit speechtech


Digital Garden - Self Wiki

Digital Garden - Self Wiki
Come faccio a ricordare tutto quello che imparo ?

La risposta a questa domanda, apparentemente impossibile, trova una soluzione piuttosto efficace: creare un wiki della propria conoscenza, divisa per argomenti. Questo processo viene chiamato da alcuni, creare il proprio giardino digitale, il proprio digital garden.

Lo hanno già fatto in molti, e questi sono i loro wiki, a disposizione dichiunque per poterne prendere spunto e addirittura prendere nota delle cose imparate !

Il punto di partenza è stata questa discussione.

Il digital garden di RIchard Litt

Learn Anything
meta-knowledge
Awesome Lists

image credit: Camila Cerda

Learning how to learn | Barbara Oakley | TEDxOaklandUniversity

Deep Face Drawing

categorie

Deep Face Drawing


Deep Face Drawing si può usare direttamente online, gratuitamente, e permette di fare uno schizzo con il mouse o caricarne uno (rigorosamente in bianco e nero e senza sfondo) e ritrovarsi una foto calcolata dalla AI abbastanza somigliante, soprattutto se si rimane nei canoni del dataset che è stato usato per il training del modello.

Il Paper


DeepFaceDrawing: Deep Generation of Face Images from Sketches

Quattro Stadi di Competenza di una Abilità

categorie

four stages of competence

Secondo un modello psicologico descritto nel 1969 da Martin Broadwall nel suo "four levels of teaching" si possono definire generalmente quattro stadi di competenza relativamente ad una qualsiasi abilità (skill).

Si va dalla "non conoscenza", nella quale l'unica cosa che si può usare è l'intuito, ma sbagliando perchè non si è approfondita ancora la materia.
Poi si passa alla "incompetenza conscia" nella quale si conosce quello che non si sa della materia e quindi si possono azzardare delle analisi citandone gli aspetti principali, ma molto probabilmente sbagliando.
Poi si arriva alla "competenza conscia" che permette di fare delle analisi corrette.
Ed infine si arriva alla "competenza inconscia", Nella quale si padroneggia abbastanza da poter mettere in campo anche l'intuito.

Nelle organizzazioni il trasferimento di queste competenze avviene secondo altri 4 livelli: SECI model of knowledge dimensions

What Goes Beyond This Dichotomisation Between Information and Knowledge?


Daniel Goleman sulla concentrazione e il segreto della completezza



Daniel Goleman (wikipedia) è un autore e giornalista scientifico. Per 12 anni ha scritto sul New York Times sul cervello e le scienze comportamentali. Nel 1995 il suo libro: "L'intelligenza Emotiva" è diventato un best selle tradotto in 40 paesi. Si è occupato inoltre di: autoinganno, creatività, trasparenza, meditazione, apprendimento sociale ed emotivo e la crisi ecologica.

In questo imperdibile video, Goleman spiega come funziona l'intelligenza cognitiva, come allenare la capacità di attenzione, le capacità cognitive e l'impatto che hanno sulla vita quotidiana e molto molto altro, arricchito da interessanti esempi di storie per avvalorarne il significato.

twitter

Intelligence squared youtube
sito ufficiale
twitter
facebook
podcast


Scrivere un libro con Markdown e Versioning - mdBook

categorie

mdbook
Scrivere un libro con Markdown significa usare il proprio editor preferito, non dover imparare interfacce assurde e avere il versioning. Tutte caratteristiche di cui si era già parlato qui, in questo articolo. Ma avere una alternativa è sempre positivo.

mdBook è scritto in Rust e si compila localmente direttamente dal repository oppure è possibile scaricare una release già compilata per windows, mac e linux.

GitHub Flavored Markdown Spec
The Tools I Use To Write Books

Automate your Documentation with Gitlab and Mkdocs

[via]

Xiran Jay Zhao ci spiega la Cultura Cinese

categorie



Xiran Jay Zhao , autrice sci-fi e fantasy, cosplayer, bookstagrammer e Cattiva Disney mancata, ci spiega qualche millennio di storia, architettura, arte, antropologia e sociologia cinese commentando le due pellicole di Mulan, il classico animato e il famigerato remake live action.

Non ne lascia passare una, come dovrebbe essere. L'intento non è demolire i film (beh, nel secondo caso anche si, e fa bene), ma facendo così riesce a citare tonnellate di osservazioni e aneddoti che rivelano la densità e vastità di cose che in occidente sono completamente ignorate su oltre 5000 anni ricchissimi di storia della Cina. Il tutto con il suo tono sarcastico.

Sito ufficiale
twitter
instagram


8-bit Music Theory e Austin Wintory

8-bit Music Theory (twitter, patreon) ci rivela come Austin Wintory, autore di alcune delle migliori colonne sonore (per videogame) mai composte, compone un tema.

Il processo creativo attraversa le scelte dell'orchestrazione relative agli strumenti che eseguiranno il tema principale, la melodia, la chiave scelta e il ritmo che si accompagna al tutto, in armonia.

Music Theory for Musicians and Normal People

How I wrote 2 minutes of Aliens Fireteam Elite music




How to Write One Minute of Music - THE PATHLESS