AI LLM

Cosa sono i Vector Database

categorie



Vector Embeddings sono una forma di ingegneria automatica delle caratteristiche di dati non strutturati. Invece di scegliere manualmente le caratteristiche necessarie dai dati, si usa un modello di apprendimento automatico pre-addestrato che produrrà una rappresentazione dei dati più compatta, preservando al contempo le loro caratteristiche significative. Si costruisce quindi un Vector Database con opportuni indici in modo da cercare ed usare questa conoscenza in modo molto rapido, fare analogie tra oggetti simili eccetera.

Questa nuova tecnologia permette di staticizzare dati raccolti dai modelli linguistici, ottimizzare le risorse impiegate, e pescare a strascico facendo scraping dalla rete, e riuscire comunque a trovare analogie, che poi possono venire usate in modi malevoli. La tecnologia è neutrale ma l'uso che se ne fa, no.

Vector Databases Explained


GAN Human Generator

human generator
Human Generator è un nuovo strumento, al momento gratuito e senza limitazioni, che consente di creare e scaricare foto di persone che non esistono, essendo frutto dei calcoli svolti dal modelli GAN sul cloud. Sono prodotte sulla base di milioni di immagini di provenienza legale che il modello generativo ha acquisito in precedenza.

Essendo gratuito e girando su hardware molto potente, si possono fare molte prove e arrivare a cogliere la potenza e i risvolti di questa tecnologia. Caricando una foto si può generare l'immagine di una persona esistente, anche una star, e vestirla con qualsiasi tipo di abito o costume di scena, perfino armature ed esoscheletri. Ingegnandosi con il breve prompt di personalizzazione "Add something up" (molto più potente di quanto si possa pensare) e mischiando le sorgenti, il software improvvisa dei design anche particolarmente affascinanti che non sfigurerebbero come character o fashion design.

[via]

Lara Croft Bot gioca a Tomb Raider

categorie



Creating a Self-Aware Lara Croft that Plays Tomb Raider riassume il processo di creazione di un bot ML che gioca al classico di Core Design "come farebbe la protagonista".

Non è un risultato dal vivo, il gioco viene messo in pausa ogni volta che viene generato un commento. Si assiste quindi ad un montaggio di tutte le parti insieme, e ce ne sono molte. Ciò significa che non è possibile avere una normale conversazione con Lara Croft perché ogni commento richiede molti minuti per essere generato.

Lara è ancora un modello ML che simula una certa consapevolezza, prendendo in considerazione la personalità dell'avventurosa ereditiera definita attingendo alle varie opere pubblicate (film, fumetti e videogame). Il video mostra cosa succede quando si utilizzano più modelli gratuiti per creare qualcosa, è un esempio per far capire il potenziale di queste tecnologie combinate, che piano piano arriverà sull'hardware di chiunque, probabilmente entro un massimo di 10 anni.


Come Aggiornarsi sui Large Language Model

categorie

Large Language Models
Catching up on the weird world of LLMs è un articolo di Simon Willison che spiega i seguenti punti sui LLM.

Simon ha co-creato il framework web Django e ha sviluppato Datassette, uno strumento per l'esplorazione e la pubblicazione di dati che aiuta le persone a prendere dati di qualsiasi forma, ad analizzarli ed esplorarli e a pubblicarli come sito web interattivo compreso di API. Ha chiamato il progetto come il lettore di cassette del Commodore 64.

Nell'articolo spiega: cosa sono i LLM, come funzionano, fa una breve cronologia, elenca quali sono quelli veramente validi e dà alcuni suggerimenti per il loro utilizzo.
Esplora come usarli per il codice e cosa possiamo costruire con loro, come si fanno interagire con altri strumenti, l'embedding e la ricerca vettoriale, i plugin ChatGPT, un interprete con ChatGPT, come si addestrano, il training set LLaMA, l'apprendimento per rinforzo dal feedback umano, i modelli con licenza aperta ed altro.


Ai: Come Beccare chi Copia

categorie

ai anti copy tools bbc


How to spot an AI cheater è un articolo della BBC che spiega come usare la AI per individuare chi ha copiato il suo testo da uno strumento online.

Esistono vari tool come: copyleaks, sapling, winston, turnitin e gptzero. Ed altri ne arriveranno, ma come funzionano ? Come può l'IA individuare un'altra IA?

La risposta breve è il riconoscimento dei modelli. La risposta più lunga è che i verificatori utilizzano identificatori unici che differenziano la scrittura umana dal testo generato dal computer. La "Perplessità" e la "Burstiness" sono forse le due metriche chiave per l'individuazione dei testi dell'IA.

La "perplessità" misura la capacità di un modello linguistico di scrivere frasi possibili, grammaticalmente corrette, in breve la capacità di prevedere la parola successiva. Gli esseri umani tendono a scrivere con una "perplessità" diversa da quella delle IA, con frasi più imprevedibili e diverse.

La "Burstiness" si riferisce alla varianza delle frasi. Nel testo scritto, l'intelligenza artificiale tende a essere più uniforme: la struttura e la lunghezza delle frasi sono generalmente regolari e meno creative nella scelta delle parole e nell'uso delle frasi. La frequenza e la combinazione di termini, frasi ripetute e strutture di frasi creano cluster che mancano della variazione di un vocabolario esteso e di uno stile fiorente che un testo scritto da un essere umano normalmente mostrerebbe.


Dall'Immagine al 3D

categorie

image to 3D
3d.csm.ai permette di esplorare una vasta gamma di oggetti 3D di media qualità generati automaticamente dai modelli LLM partendo da immagini bidimensionali: grafica, render o fotografie.

E' possibile scaricare i modelli 3D o crearne anche di propri.

Cedro 3D ha presentato tra le altre cose anche uno spazio di huggingspace che fa più o meno la stessa cosa ma si concentra su modelli esclusivamente umani per ricostruire sia il modello che la postura.


Fritz Lang Blade Runner 1929

categorie

Come ipotizzato tempo fa cominciano ad arrivare i primi barlumi di pellicole immaginarie create con la AI. E' il caso di "Blade Runner 1929" by Fritz Lang. Si tratta per ora di una sequenza di screenshot che raccontano una storia che mescola insieme in modo particolarmente riuscito elementi di Blade Runner (1982) e di Metropolis (1927), due capolavori sorprendentemente sovrapponibili.

L'impiego di LLM è a dir poco controverso e giustamente molto malvisto dalla community di artisti. Però a volte qualche scintilla ci sorprende. Oltre a vedere pellicole reinterpretate con stili molto riconoscibili (vedi vari titoli alla maniera di Wes Anderson, oramai parodia di sé stesso) emerge anche questo trend di fare la fusione di due film. Se si scelgono due capolavori il risultato potrebbe non essere del tutto da buttare. Certo per ora c'è sempre la mano di qualcuno che guida completamente il processo, perchè questi modelli non hanno coscienza, emozioni, intenzione, nulla. E quindi è solo uno stimolante esercizio di stile.

[via]

Universal Paperclips

Universal Paperclips
Universal Paperclips è un gioco incrementale free online del 2017 creato da Frank Lantz della New York University. L'utente veste i panni di un'intelligenza artificiale programmata per produrre graffette. Inizialmente l'utente clicca su un pulsante per creare una singola graffetta alla volta; man mano che si aprono altre opzioni, l'utente può vendere le graffette per creare denaro per finanziare macchine che costruiscono graffette automaticamente. A vari livelli, la crescita esponenziale raggiunge un livello minimo, richiedendo all'utente di investire risorse come denaro, materie prime o cicli di computer nell'invenzione di un'altra innovazione per passare alla fase successiva di crescita. Il gioco termina se l'IA riesce a convertire tutta la materia dell'universo in graffette.

Sia il titolo del gioco che il suo concetto generale si ispirano all'esperimento mentale del "massimizzatore di graffette" descritto per la prima volta dal filosofo svedese Nick Bostrom nel 2003, un concetto successivamente discusso da numerosi commentatori.

wikipedia