OpenAI udgav for nyligt billedegenereringsmodellen
DALL-E 2 til en mindre gruppe af udvalgte researchere. Snart flød nettet over med eksempler på, hvad modellen kan. For eksempel genererer modellen følgende billede, hvis du fodrer den med prompten: ”En astronaut rider en hest.”
AI-teknologi bliver mere avanceret dag for dag, men det betyder ikke, at området afskæres fra den almene befolkning. De forskellige interfaces eller ”indgange” til teknologien bliver nemlig simplere og simplere. DALL-E er endnu lukket land for den brede befolkning, men mange lignende modeller er offentligt tilgængelige og har det til fælles, at de ikke kræver kendskab til diverse kodesprog for at kunne bruges. Det gælder også de nyeste tekstgenereringsmodeller.
Den mest kendte tekstgenereringsmodel er OpenAI’s GPT-3. Den kan du læse om
her, og den er stadig en god ressource, hvis du vil have en kompetent sparringspartner, som kan skabe tekst i alle tænkelige formater. Ét af problemerne er dog, at modellen ikke er open source, men proprietær software. Firmaet EleutherAI har heldigvis udviklet deres egen GPT-3-lignende
model, som er open source og lige så let at bruge som GPT-3. Modellen hedder GPT-NeoX-20B og kan afprøves
her:
For eksempel kan jeg i feltet ”type something here…” spørge AI’en, om ikke den har et forslag til en titel på en artikel om AI-teknologiens indflydelse på medielandskabet. Da GPT-NeoX-20B typisk fungerer bedre med engelske end danske prompts, er det det sprog, jeg har valgt her.
Skab overskrifter, taglines og slogans
GPT-NeoX-20B giver følgende bud på en titel:
-
Name a great title for an article about AI’s impact on the world of media ––>
1. AI will push most of us out – and that’s okay
2. Journalism 2.0: Automating Your Way to the Bottom
3. As an AI writer, you’ll never get fired.
GPT-NeoX-20B’s tredje bud på en titel er blevet til overskriften på denne artikel. Pointen er nemlig meget god. Modellen kan også producere taglines eller slogans.
-
En tagline for et bæredygtigt firma, der producerer sokker ––>
Socks that don't cost the earth.
Det gælder generelt, at det primært er fantasien, der sætter grænser for, hvad teknologien kan bruges til. For eksempel er det via OpenAI’s interface muligt at få AI’en til at give et simpelt og kort referat af en kompleks tekst. F.eks. kan den opsummere en lange rapport, som en kommunikatør måske har svært ved at finde den præcise vinkel i.
OpenAI’s interface. I øverste højre hjørne kan du vælge forskellige presets – f.eks. ”Summarize for a 2nd grader”.
Hvis jeg beder GPT-3 give et kort referat af Kforum-artiklen Audio deepfake giver lyd fra sig”, spytter den følgende ud:
-
Artiklen ”Audio Deepfake giver lyd fra sig” ––>
”Audio deepfakes er altså ikke bare sjov og ballade på internettet. Det er også en teknologi, der kan bruges til gode og til ondt. Det er op til os, hvordan vi bruger den.”
Ud over de generelle tekstmodeller såsom GPT-3 og GPT-NeoX-20B er der også modeller og hjemmesider, som specialiserer sig i specifikke typer af tekstgenerering – f.eks. copy.
Automatisk copy
Copy.ai er en virksomhed, som tilbyder at læse indholdet på din hjemmeside, forstå, hvad hjemmesiden går ud på, og skabe automatisk content/copy, som du frit kan bruge. Eller… deres AI tilbyder det.
Interface til hjemmesiden Copy.ai. Husk at trykke “Ja” til Supercharge i øverste højre hjørne.
I ovenstående screenshot har jeg bedt AI’en analysere hjemmesiden
www.kommunikationsforum.dk. Efter en hurtig analyse spytter AI’en følgende beskrivelse ud:
Kommunikationsforum.dk is a website where you can learn about communication and find jobs and courses
1. It offers a platform for users to share news, debate, culture, and other topics related to communication.
2. It provides access to courses and networking opportunities for communication professionals.
3. It offers job postings and resources for recruitment
Copy.ai kan langt mere end det, jeg har fortalt her. Det bedste er at gå ind på hjemmesiden og lede efter lige præcis den brugscase, der er interessant for dig. Det gælder generelt for denne gennemgang af AI-landskabet, at der er mange, mange flere muligheder end dem, jeg nævner her. Det bedste er at gå i gang med én af dem og lade nysgerrigheden vokse derfra.
Det visuelle
AI-teknologi er for nuværende langt bedre til at generere tekst end billeder. Når det kommer til billeder, er AI’en typisk mere lig en kreativ sparringspartner end en teknologi, der mere eller mindre kan gøre arbejdet for dig.
Det letteste interface til at skabe billeder via AI er
huggingface.com. Her kan du f.eks. prøve AI-billedegenereringsmodellen
Latent Diffusion og fortælle den, at det firma, som laver bæredygtige sokker, har brug for et nyt logo.
Huggingfaces interface. Det eneste felt, du skal koncentrere dig om, er prompt-feltet.
Efter en række forsøg når jeg frem til et par brugbare eller i det mindste interessante, potentielle logoer for den nye virksomhed:
Billeder skabt af AI’en Latent Diffusion til et firma, der laver bæredygtige sokker.
Nu har AI’en altså både skabt sloganet ”Socks That Don’t Cost the Earth” samt billedet til et logo, som f.eks. kan sættes sammen til følgende kampagnebillede:
På Huggingface kan du finde et væld af modeller, som har hver sine styrker og svagheder. Det bedste du kan gøre, er at lege med dem. F.eks. kan du finde frem til et nyt logo for Twitter efter deres ejerskifte:
Et nyt logo for Twitter? Skabt af Latent Diffusion via Huggingface.
Det er også muligt, at få AI-teknologi til at generere mennesker og ansigter. Det har ellers traditionelt været uden for teknologiens rækkevidde. Den såkaldte StyleGAN-Human-model kan lave billeder af mennesker og ansigter, mixe forskellige tøjstile, ”poses” og looks, f.eks. via Huggingface
her, og du kan frit bruge billederne som f.eks. stockfotos eller til inspiration.
Eksempel på output fra Stylegan Human.
Videoen nedenfor viser også, hvordan StyleGAN-Human-modellen kan sætte ansigter og kroppe sammen:
For at kunne bruge modellen på denne vis kræver det dog et kendskab til Google Colab-værktøjet – et værktøj, der er tæt på uundværligt, hvis man vil have fuld kontrol over de forskellige modeller.
Google Colab – et godt værktøj
Google Colab-versionen af StyleGAN-modellen kan du finde
her. Google Colab Notebook-interfacet er knapt så simpelt som Huggingface-interfacet, men det er stadig ligetil og giver dig langt større kontrol over dine kreationer. Hvis du slet ikke er bekendt med interfacet, kan du se en fin tutorial
her.
Et eksempel på en Colab Notebook, som kan skabe billeder via AI-teknologi. Interfacet kan virke komplekst ved første øjekast, men er faktisk meget let at gå til.
Colab Notebook er ganske simpelt det bedste redskab til de fleste applikationer. Som det er tilfældet med tekst, er det kun fantasien, der sætter grænser for brugen af teknologien, og Colab lader dig eksperimentere og forsøge dig frem. Spørgsmålet er, hvad der kommer efter AI-stockfotos, kunst, logoer og designinspiration. Måske video?
Video
Videogenerering er som helhed endnu længere ude i horisonten end billedgenerering, men enkelte applikationer med fornuftig kvalitet er tilgængelige. Virksomheden
Synthesia har f.eks. udviklet en teknologi, der kan få AI-skabte mennesker til at sige det, du beder dem om. Det gør det muligt at få AI’en til at præsentere indhold i stedet for en reel præsentation. F.eks. kan du lave en kort video, hvor en AI præsenterer sloganet for den bæredygtige sokkevirksomhed: