Kunst af kunstig intelligens

OpenAI lancerede tidligere i år DALL·E, en proprietær computermodel, der kan skabe kunst ud fra prompts. Og selvom DALL·E (endnu) ikke er tilgængelig for alle, er mange blevet inspirerede til at skabe efterligninger af konceptet. Kunsten er p.t. af svingende kvalitet, men hvem ved, måske kommer kunstig intelligens til at stå for fremtidens kunst?
Tidligere i år lancerede OpenAI en computermodel døbt efter Salvador Dali og WALL·E, der kan forvandle ord til kunst. Programmet er ikke tilgængeligt for alle, men flere er nu blevet inspireret til at lave deres egne kopier. Foto: OpenAI
Tidligere i år lancerede OpenAI en computermodel døbt efter Salvador Dali og WALL·E, der kan forvandle ord til kunst. Programmet er ikke tilgængeligt for alle, men flere er nu blevet inspireret til at lave deres egne kopier. Foto: OpenAI
5. januar 2021 lancerede AI-firmaet OpenAI en computermodel ved navn DALL·E, hvis navn er en kombination af (Salvador) Dali og Disneys robot WALL·E. For det er nemlig lige præcis det, DALL·E kan – den kan lave kunst uden pensel. I præsentationen var der særligt ét billede, der vakte opmærksomhed – en avokadostol.
 

Eksempler på avokadostole genereret af DALL·E. Foto: OpenAI
 
Hvis en AI kan tænke sig frem til et kreativt, plausibelt design til en stol, der slet ikke findes i virkeligheden, hvad kan den så ikke også finde på?
 
Det fandt vi aldrig ud af, for OpenAI er, på trods af navnet, ikke så åbne endda. DALL·E-modellen er proprietær software, men måske er der håb forude. Selvsamme firmas tekstgenerator, GPT-3, blev gjort offentligt tilgængelig i november sidste år. GPT-3-modellen er fra juni 2020 – med andre ord blev den tilgængeliggjort med halvandet års forsinkelse. Hvis samme tidsramme holder for DALL·E, skal vi vente nogle måneder endnu.
 
Der er dog også dem, der slet ikke kan vente. Nysgerrige programmører har søsat et hav af replikationsprojekter siden januar 2021, med ét mål: at skabe en replika af DALL·E – og helst én, der kan skabe en avokadostol af lignende kvalitet.
 
I modsætning til den proprietære DALL·E, så er replikaerne frit tilgængelige og kan bruges af alle interesserede, herunder visuelle kommunikatører. Outputtene fra modellerne er – med meget få undtagelser – ejet af dig selv. Men kvaliteten svinger.
 

Hvad kan DALL·E?

En af de frit tilgængelige replikaer hedder ru-DALL·E (”ru”, fordi den er finansieret af den store russiske bank Sberbank). Måske afholder Kforum robot-uge om al den indflydelse, computere og kunstig intelligens har på kommunikationsbranchen, og de beslutter sig for at skabe et nyt midlertidigt logo for Kforum. De beder ru-DALL·E om hjælp og fodrer modellen med Kforums allerede eksisterende logo og prompten ”en robot gemmer sig inde i bogstavet K.” Resultater er følgende nye logo:
 
 
Nyt Kforum logo? Foto: ru-DALL·E
 
Det ligner mere en kvinde, end en robot – måske en robotkvinde? – men måske har ru-DALL·E givet inspiration til, hvordan det nye midlertidige logo kan udformes.
 
Alle ru-DALL·Es kreationer skabes på samme måde. Du giver den en prompt, og den giver dig et billede. Og måske giver du den et startbillede at eksperimentere ud fra, ligesom i ovenstående eksempel.
 
Næste uge har du til opgave at lave en kampagne for rygestop. Igen kan du henvende dig til din sparringspartner i ru-DALL·E. Prompten ”en kampagne for rygestop, tegnet af Claude Monet” resulterer for eksempel i følgende billede:
 
 
https://img.rudalle.ru/images/90/40/eb/9040eb4e9ea547d5b571690be9b68f54_00000.jpgEr det en vandpiberyger, ru-DALL·E forsøger at portrættere? Foto: ru-DALL·E
 
 
Resultaterne for den samme prompt er altid forskellige og varierer meget i kvalitet. Det er både en ulempe og en fordel. Hvis du vil skabe en avokadostol i Photoshop, skal du selv opfinde designet og implementere det. DALL·E designer og tegner selv avokadostolen, men der er færre knapper at skrue på i forhold til det endelige resultat. Det er med andre ord svært at kontrollere, hvad DALL·E skaber, men selvsamme kvalitet er dens styrke. Nedenstående billede er et godt eksempel på DALL·Es evne til at overraske på godt og ondt, genereret af prompten ”iskapperne smelter, klimakrisen raser”:
 
 

Hvad søren skal de orange prikker forestille? Foto: ru-DALL·E
 
 
I billedet er det ikke blot iskapperne, men hele jordkloden, der smelter. En lignende prompt resulterer i følgende billede:
 
 
Er det pingviner fanget på et stykke løsrevet is, DALL·E forsøger at portrættere?
 
 
DALL·E er langt hen ad vejen autonom og selvkørende, men tilfældigheden kan lempes ved at generere mange billeder samtidigt, hvoraf du vælger det, du bedst synes om, og tager det en tur i Photoshop. De 25 billeder nedenfor er alle skabt af prompten ”Et smukt landskab.” Det kræver meget computerhukommelse at skabe mange billeder samtidigt, men nedenstående collage er genereret på en normal Macbook Pro.
 
Collage af smukke landskaber. Hvilket et synes du bedst om?
 
DALL·Es muligheder er mange. For eksempel kan du bede DALL·E redigere og tegne i allerede eksisterende billeder – måske billeder, DALL·E selv har skabt. Det bedste, du kan gøre for at vurdere, om DALL·E er en hjælp i dit arbejde, er at lege med modellen.
 

Hvordan kommer jeg i gang med at bruge DALL·E?

Et godt sted at starte er at afprøve den demo, som skaberne af ru-DALL·E har lagt ud. Når du er fortrolig med den basale prompt-struktur, er det oplagt at lege med de såkaldte ”notesbøger”, som du finder i Google Colab eller ”co-laboratory”. De er fyldt med DALL·E-computerkode, men inde i notesbøgerne er oftest inkluderet en brugervejledning, så alle let kan være med. Det eneste felt, du generelt skal koncentrere dig om, er ”text prompt.” Alt andet tager de kære programmører sig af. I bunden af denne artikel finder du en række links, så du hurtigt kan komme i gang.
 
Måske kan du ikke lige nu se, hvordan du skal kunne bruge modellen i dit arbejde. Du arbejder måske i et firma, som har en bestemt visuel profil. Og hvis DALL·E er selvkørende, hvordan får jeg den så til at skabe billeder af den type, jeg gerne vil se? Hvorfor ikke bare bruge Photoshop?
 
Det er her, finjustering af DALL·E kommer ind i billedet. Ved at træne den basale DALL·E-model på eksempelvis et korpus af et firmas visuelle materiale, kan DALL·E lære at skabe billeder af den type. Hagen er, at finjustering er en delikat proces, som kræver mange billeder – helst flere tusinde – før resultaterne bliver brugbare.
 
En hurtig finjustering af ru-DALL·E på syv grafiske billeder på Kforum demonstrerer, at der skal langt mere til, før den finjusterede model er anvendelig.
 
Syv grafiske billeder fra Kforum
 
 
Prompten ”en megafon” resulterer i billeder, der ikke ligefrem ligner en megafon.
 
DALL·Es replikationer kan inspirere og overraske, men endnu er kvaliteten for svingende og mængden af knapper, man kan skrue på, for smal til, at modellerne vil blive bredt brugt i kommunikationsbranchen. Lige nu er det et legetøj, som hele tiden udvikler sig. Hvad den officielle DALL·E har at byde på, må vi givetvis vente et stykke tid med at få at se. 
 

Nyttige links til at komme i gang

DALL·E er langt fra det perfekte værktøj, men mulighederne er mange. Nedenfor er en række nyttige links til DALL·E-modeller og SoMe-profiler til inspiration. Du er også velkommen til at kontakte undertegnede, hvis du oplever problemer undervejs.
 
DALL·E-replikaer
 
 
 
 
Nyttige SoMe-profiler
 
 
 

Del artikel

Tilmeld dig vores nyhedsbrev

Vær på forkant med udviklingen. Få den nyeste viden fra branchen med vores nyhedsbrev.

Forsiden lige nu

Læs også