Un bambino di 3 anni, guardando una fotografia, è in grado di identificare gli oggetti che vi compaiono. Fino a poco tempo fa questa "semplice" abilità era molto al di là delle capacità di qualsiasi computer.
La professoressa Fei Fei Li, che dirige il dipartimento di computer vision dell'università di Stanford, ha contribuito in modo significativo all'avanzamento in questo campo dell'intelligenza artificiale, usando un approccio originale.
Ha stimato un bambino di quell'età è stato esposto a centinaia di milioni di immagini e che quindi la sua "rete neurale convoluzionale" (un modello incredibilmente semplificato del suo cervello) ha avuto un lungo training per riuscire nel riconoscimento. Allo scopo di simulare questo tipo di apprendimento è stato creato Image net: un archivio semantico di 15 milioni di immagini basato su wordnet (sito ufficiale).
Ora i computer sono in grado di riconoscere diversi oggetti in una scena e metterli in relazione fra loro descrivendo le immagini con una semplice frase. Ovviamente ancora non senza commettere buffi errori. La professoressa, nel suo TED talk, accenna anche ai possibili impieghi di questa tecnologia, una delle più affascinanti e fantascientifiche al momento in sviluppo.
deep image sent
Convolutional Neural Networks for Visual Recognition
If We Want Humane AI, It Has to Understand All Humans
Add new comment