Vector Embeddings sono una forma di ingegneria automatica delle caratteristiche di dati non strutturati. Invece di scegliere manualmente le caratteristiche necessarie dai dati, si usa un modello di apprendimento automatico pre-addestrato che produrrà una rappresentazione dei dati più compatta, preservando al contempo le loro caratteristiche significative. Si costruisce quindi un Vector Database con opportuni indici in modo da cercare ed usare questa conoscenza in modo molto rapido, fare analogie tra oggetti simili eccetera.
Questa nuova tecnologia permette di staticizzare dati raccolti dai modelli linguistici, ottimizzare le risorse impiegate, e pescare a strascico facendo scraping dalla rete, e riuscire comunque a trovare analogie, che poi possono venire usate in modi malevoli. La tecnologia è neutrale ma l'uso che se ne fa, no.
Add new comment