Dall-e

Hola,

Fa uns sis mesos ja us vaig portar aquí un altre vídeo de DotCSV . En aquest parlava de l'últim avanç en Intel·ligència Artificial (IA) realitzat per la gent de OpenAI . Fa sis mesos s'havia aconseguit a partir d'un petit text que la IA generés tot una pàgina, una redacció i amb sentit. També era capaç de seguir una conversa per escrit (xat). Així que amb tota aquesta potència van pensar, què passa si en lloc de text li diem que generi una imatge?
Així ha nascut Dall-e, nom que sorgeix d'unir Dalí i Wall-e, el qual encara segueix en fase d'entrenament. A aquest model li proporciones un text - "una taula de tres potes" - i crea una imatge de una taula de tres potes. Els punts importants i que la fan tan diferent i potent que fa a la resta d'aplicacions d'IA que hem vist fins ara són d'una banda que sigui capaç d'entendre el que li hem escrit i segon el generar una imatge sense tenir referències. La primera part la hereta del model de fa sis mesos capaç d'interpretar i seguir un text. L'altra part encara no han explicat el com però si que és el que no fa. Tot el que se'ns havia mostrat fins ara és capaç de generar imatges que no existeixen però a partir d'imatges existents. Aquell famós exemple de dotar la IA de tots els quadres de Van Gogh, després donar-li una imatge qualsevol i la IA transformar-la perquè sembli un quadre de Van Gogh. Però aquí partim d'uns quadres que ja coneix i una imatge que li proporcionem. Dall-e no té imatges de referència i el que li introduïm és un text. Així que ha de saber que és una taula, per exemple, com és i generar una del no res i amb les característiques que nosaltres li escrivim, ja que si en lloc de tres potes posem que ha de ser de cinc i circular, ho entendrà i la regenerarà.
Estem a un pas que els nens per als treballs de la seva escola no buscaran a Google fotos de Roma, sinó que escriuran vull una foto de César en un cavall a la batalla de les Galias, i chas la IA li proporcionarà la imatge perfecta per al seu treball. O amb una IA veure com quedaria en el nostre menjador, una butaca o un treset o un sofà llit tan sols escrivint en una caixa de text, i aquesta ens donaria una foto del saló amb aquests objectes.


¿Es esta IA el FIN de los DISEÑADORES GRÁFICOS? ¿Puede la IA ser CREATIVA? - (DALL-E)

Comentaris

Entrades populars