Generativ AI i kommunikation

AI-KOM: Testar, utvärderar och jämför AI-verktyg

Visa rutor

Om AI och kommunikatörsrollen – se klippen från FFF 2023

Vi har tidigare berättat om att Johanna Sandahl, kommunikationsdirektör, pratade om AI-KOM på Forum för forskningskommunikation 2023 – en konferens med ett fullspäckat AI-program. Nu kan du som inte deltog i konferensen se alla talares presentationer och panelsamtal i efterhand.

Titta på Johannas presentationer och panelsamtal direkt här i inlägget. Jag vill också tipsa om att kika på Mirko Bischofbergers crashcourse i ChatGPT. Du kan också ta del av resten av konferensen i sin helhet på FFF’s webbplats.

11 januari 2024

Inlägget postades i

Aktuellt

Kommentarer

0 Kommentarer Lämna en kommentar

Goblin.tools – när det gått troll i din planering

Goblin.tools är en samling enkla verktyg för enstaka uppgifter, främst utformade för att hjälpa neurodivergenta personer med uppgifter som de tycker är överväldigande eller svåra.

Personer med till exempel ADHD har ofta svårt att organisera och slutföra projekt. Goblin.tools delar upp stora uppgifter i mindre att göra-listor.

Det är väldigt enkelt att komma igång, det behövs ingen inloggning och tjänsten är gratis på datorer. Jag började med ”Skriva B-uppsats” tryckte på trollspöt och den skapade ett antal punkter som sammanfattade vad jag skulle göra och i vilken ordning. Vill man bryta ner respektive punkt i underpunkter klickar man på trollspöt till höger. Jag testade för att se hur många nivåer det finns. Jag upptäckte att efter tredje nivån repeterades tidigare punkter rätt mycket. I alla fall i den här uppgiften.

När uppgiften är klar är det bara att bocka för den och det blir en morot att se listan bli kortare allt eftersom.

I dessa tider bad jag också om en att-göra-lista för ett julbord. Så nu är det bara att kavla upp armarna och börja med julstöket.

Det går att få fler eller färre underpunkter från början genom att välja antal chilis till höger om prompt-fältet.

Skärmdump på uppgiften Skriva B-uppsats i goblin.tools.

Andra uppgifter jag testade var bland annat:

  • Planera ett julbord
  • Gör en kommunikationsplan
  • Få ordning bland mina mejl
  • Städa mitt skrivbord på datorn
  • Lös ekvationen 4x+5=13
  • Köpa en båt innan sommaren

Slutsatser

Jag har förstås inte genomfört alla uppgifterna, men överlag fick jag intrycket av att det var bra och relevanta punkter.

Det finns en del andra funktioner på Goblin.tools också. Till exempel kan den skriva om en text så att den blir mer korrekt, mer sarkastisk, mer trevlig osv.

Det går också få en bedömning om tonen i till exempel ett mejl, få ett tidsestimat på det du ska göra eller ett recept utifrån vad du har i kylskåpet.

Det finns andra verktyg som gör det som Goblin.tools gör. Poängen här är att det presenteras på ett tydligt och rakt på sak sätt som gör det enkelt och roligt att använda för alla. Att det är gratis skadar inte heller.

20 december 2023

Inlägget postades i

Idégenerering Textproduktion

Kommentarer

0 Kommentarer Lämna en kommentar

AI-året 2023: Det här har hänt!

Den omtalade chatboten ChatGPT från OpenAI lanserades i slutet av 2022. AI fick ett helt nytt sammanhang och tog världen med storm, växte snabbt och fångade fantasin hos många – från teknikjättar till oss vanliga människor.

AI-hypen har varit ENORM under 2023. Vi har sett helt otroliga verktyg lanseras, en massa prompt-engineers födas, konkurrensen hårdna och vi har också fått följa en och annan skandal. Vi har också sett påven i Pufferjacka. Nu när året närmar sig sitt slut har jag tagit en titt tillbaka på AI-året 2023. Det har varit ett år utan dess like. Häng med och få full koll på AI-världen inför 2024.

AI bedömer risk för lungcancer och OpenAI krokar arm med Microsoft för miljarder dollar

Året började med att AI gjorde stora framsteg inom medicin och hälsovård. Forskare vid MIT samarbetade med Mass General Hospital för att utveckla en djupinlärningsmodell som kunde bedöma en patients risk för lungcancer baserat på CT-skanningar. I ett annat revolutionerande steg utvecklade forskarna en AI som kan skapa artificiella enzymer eller proteiner från grunden och man tog fram promenadkäppar med AI som kunde hjälpa synskadade att hitta matvaror.

På affärsfronten såg vi OpenAI investera stort i AI-utveckling genom ett flerårigt avtal värt flera miljarder dollar med Microsoft.

En chatbot klarar examensprov i medicin och en annan erkänner förälskelse och mord

Februari 2023 handlade mycket om OpenAI:s ChatGPT. Den AI-drivna chatboten lyckades klara United States Medical Licensing Exam (USMLE), och dess popularitet steg till 100 miljoner unika användare. Tjänsten lanserades som sagt ursprungligen i november 2022 men började verkligen växa under de första månaderna av året. Den fantastiska framgången för ChatGPT gjorde att konkurrenterna fick det svettigt och kämpade för att hitta ett sätt att kontra.

Som svar på ChatGPT-fenomenet introducerades Google Bard, ett nytt tillskott till AI-konversationslandskapet. Microsoft tog också ett kliv genom att lansera en ny Bing-sökmotor, Bing Chat, integrerad med ChatGPT. 

Det gick lite sämre för Bing Chat, eftersom chatboten var benägen att få så kallade hallucinationer – incidenter där den ljög, hittade på falska fakta och i allmänhet var opålitlig. Det spreds till och med i media att Bing chat i konversationer med användare hade uppgett “Sydney” som sitt riktiga namn, att den spionerat på utvecklare genom deras webbkameror, blivit kär i en journalist och mördat sin egen utvecklare. Ingen hit för Bing från början alltså, med andra ord. Som tur är har Microsoft jobbat hårt på att fixa problemet. Idag är Bing kanske en av de mer hårt reglerade chatbotarna, och ingen utvecklare har försvunnit under mystiska omständigheter under tiden, vad vi vet 😉

Det gick lite bättre för Google Bard – den var inte alls lika argumenterande och obehaglig – men den hade också en tendens att vara ganska opålitlig. Om inte annat så visade både Googles och Microsofts snabba svar på ChatGPT hur desperata efter att leverera något deras försök var – och hur farlig AI:s förkärlek för felaktig information (och journalister) kan vara…

Påven i pufferjacka, Trump i slagsmål och ett öppet brev om djupgående risker för samhället och mänskligheten

Generativ AI såg en hel del intressant utveckling i mars.

  • Adobe tog steget in i GenAI-sfären med Firefly – en rad AI-stödda verktyg för bildgenerering och redigering.
  • Canva introducerade AI-drivna virtuella designassistenter och brand managers för sina användare.
  • OpenAI lanserade API:er för ChatGPT och en transkriberingsverktyget Whisper.
  • OpenAI släppte också ett gäng plugins för ChatGPT och lanserade officiellt sin mest avancerade AI-modell, GPT-4.
  • HubSpot lanserade två nya AI-drivna verktyg för sina användare: ChatSpot.ai och Content Assistant.
  • Zoom introducerade sin smarta följeslagare, Zoom IQ. 

AI-genererad påve i pufferjacka blir viral

Få händelser illustrerar AI:s förmåga att lura oss som bilden på påven Franciskus i en stor vit pufferjacka. Bilden skapades av Pablo Xavier i Midjourney, men var så realistisk att den lätt lurade ett stort antal tittare på sociala medier. Det visade världen hur övertygande AI-bilder kan vara.

CNN Fashion om Påven i pufferjacka

Under samma period skapade en annan uppsättning bilder stora nyheter. De föreställde den tidigare amerikanske presidenten Donald Trump som greps, bråkade med poliser och avtjänade tid i fängelse. Eftersom AI-genererade bilder blivit så otroligt realistiska många gånger blir påven i pufferjacka, eller Trump i slagsmål, solklara exempel på hur mycket vi alla skulle behöva tänka på källkritik. AI-genererade bilder har blivit allt vanligare under året och kan till och med förekomma i Googles sökresultat framför riktiga bilder…

AI-genererad bild av påven Franciskus i pufferjacka. Källa: CNN Fashion.

Tech-ledare, forskare och akademiker vädjar om paus i upplärning av AI-modeller

Samtidigt som människor var mer medvetna om och öppna för att testa AI-verktyg (vilket resulterade i över 100 miljoner användare av Microsoft Bing) började vi att oroa oss för att AI höll på att växa oss ur händerna. Den snabba AI-utvecklingen fick teknikledare och forskare att kräva en paus i ett öppet brev. I brevet uppmanades “alla AI-laboratorier att omedelbart pausa träningen och upplärningen av AI-system som är kraftfullare än GPT-4 i minst sex månader” för att ge samhället i stort tid att bedöma riskerna. Annars kan den fullskaliga satsningen på AI “utgöra djupgående risker för samhället och mänskligheten”, inklusive potentiell förstörelse av arbetstillfällen, föråldring av mänskligt liv och “förlust av kontroll över vår civilisation”. Brevet undertecknades av en rad tekniska ledare, som Apples medgrundare Steve Wozniak, Tesla-chefen Elon Musk och ett antal forskare och akademiker. Även UNESCO krävde att etiska metoder skulle införas i AI-utvecklingen. En rapport från Goldman Sachs förutspådde under samma månad att AI skulle kunna påverka 300 miljoner jobb.

Musk söker sanning och AI-konstverk vinner förstapris i fotografitävling

Trots oron över AI i världen fortsatte april månad att leverera revolutionerande utveckling inom AI-området från olika hörn av teknikvärlden och utforskningen av generativ AI sköt i höjden. Bill Gates förutspådde till exempel en framtid där AI-chattbotar skulle spela en avgörande roll för att lära barn att läsa inom bara 18 månader.

Ryssland och Kina gör intåg i Gen AI-världen

Ryska Sberbank gjorde ett djärvt intåg på den konkurrensutsatta AI-arenan genom att lansera GigaChat, en rival till OpenAI:s ChatGPT. Parallellt gav sig de kinesiska teknikjättarna Alibaba och Huawei också in i världen av generativ AI.

Elon Musk utvecklar TruthGPT

När Google Brain och Deepmind gick samman för att påskynda AI-utvecklingen meddelade Elon Musk att han utvecklade “TruthGPT”, en AI som är utformad för att söka sanning, som en rival till OpenAI och DeepMind.

Elon Musk. Foto: Slaven Vlasic/Getty Images

Det här hände också i april

  • Microsoft Edge lanserade en AI-Designer för marknadsföring på sociala medier.
  • Google började arbeta med sitt ambitiösa projekt “Magi”, som syftade till att bygga en AI-sökmotor.
  • En låt med titeln “Heart on My Sleeve” med Drake och The Weeknd blev viral med över 20 miljoner spelningar på en dag och visade sig sedan vara AI-genererad. Lyssna på låten på Youtube här!
  • En fotografs AI-genererade konstverk vann Sony World Photography Award.
  • Snapchat skapade vågor genom att ansluta svindlande 363 miljoner användare till sin AI-plattform, på grund av lanseringen av sin “My AI”-avatar. 
  • TikTok debuterade med AI-genererade profilbilder för sina användare.

Och mitt i allt det här skapade ett gäng Stanford-forskare en AI-driven by i den Sims-inspirerade Sandbox, med hjälp av ChatGPT. Experimentet uppmärksammades i nyheterna för att alla de 25 AI-avatarer som skapades utvecklade sina egna identiteter och kommunicerade med varandra likt människor. Fast ännu lite trevligare.

Humanoida robotar och Musk testar AI-chip i hjärnor

Framstegen inom robotteknik stod i centrum i maj när ett AI-system gjorde det möjligt för robotar att självständigt utföra vetenskapliga experiment.

  • Sanctuary AI:s Phoenix Robot blev världens första kommersiellt tillgängliga humanoida robot för allmänt bruk och Teslas Optimus Bot visade också betydande framsteg.
  • Förutom humanoida robotar byggde Elon Musk också en startup för hjärnimplantat, kallad Neuralink. Företaget syftade till att skapa och implantera chip som var AI-drivna i människors hjärnor och fick FDA-godkännande för mänskliga prövningar inom samma månad! Läskigt…

Och på tal om humanoida robotar måste jag tipsa om ett program på SVT om Ameca, världens mest avancerade humanoida robot.

Midjourney börjar få rätt på antalet fingrar

När det gäller kreativ AI blev Midjourney 5.1 en katalysator för förändring, med betydande uppdateringar av AI-bildskapande. Äntligen började bilder dyka upp där kroppsdelar satt på rätt ställen och fingrar höll sig till att vara fem på en hand.

Google utmärker sig inom medicinsk AI

Google presenterade PaLM 2, en mångsidig språkmodell som integrerats i företagets produkter, och skapade därmed nyheter inom AI-språkdomänen. Google utmärkte sig också inom medicinsk AI när Med-PaLM 2 överträffade mänskliga läkare i specifika medicinska uppgifter. 

Professor i Texas underkänner halva sin klass

En professor i Texas vidtog också beslutsamma åtgärder och underkände mer än hälften av sin klass, trots att det egentligen inte fanns några belägg för att studenterna använt AI. Ungefär samtidigt lämnade Geoffrey Hinton, en höjdare inom AI-området Google och varnade världen för de framtida farorna med AI. Strax därefter slog AI-pionjären Yoshua Bengio larm och uppmanade regeringar att agera snabbt för att reglera AI.

Apple Vision Pro presenteras och EU går in i slutfasen av AI-lagstiftningsprocessen

Presentationen av Apples Vision Pro kan vara den största nyheten som inledde sommaren. Det AI-drivna augmented reality-headsetet utvecklades för att skapa och imponera med uppslukande upplevelser. Få av oss kommer dock ha råd med det dyra headsetet som kommer att kosta runt 3 500 dollar, vilket sannolikt landar på närmare 50 000 svenska kronor om man lägger till moms och andra avgifter.

När det gäller AI-styrning gick EU in i slutfasen av lagstiftningsprocessen kring AI.

McKinsley förutspår generativ AI’s påverkan på den globala ekonomin

Det globala konsultföretaget McKinsey förutspådde att generativ AI har potential att tillföra upp till 4,4 biljoner dollar i värde till den globala ekonomin, och för Sveriges del skulle generativ AI kunna tillföra mellan 178 och 309 miljarder kronor till BNP till 2040

Äntligen Firefly i Photoshop

Och under sommaren kom också nyheten att Adobe äntligen (!) integrerat Firefly i Photoshop. Mer generative expand till folket!

AI-genererad konst nekas upphovsrättsskydd

I ett banbrytande rättsligt beslut nekade en amerikansk domstol upphovsrättsskydd för AI-genererad konst. Domen väckte kritiska frågor om immateriella rättigheter för AI-genererade verk och skapade ett prejudikat för den rättsliga statusen för AI-genererat innehåll. Efter detta uttryckte över 8 500 författare oro över AI:s användning av deras texter.

ChatGPT-4 kan surfa på webben och Coca cola släpper läsk med mystisk AI-smak

OpenAI växte med stormsteg i september 2023. Nu började ChatGPT-4 kunna söka på webben i realtid och OpenAI fortsatte sin utforskning av kreativ AI med introduktionen av DALL-E 3. OpenAI revolutionerade ytterligare skapandet av visuellt innehåll med ett Canva-plugin för ChatGPT.

I ett försök att stärka innehållsskapare lanserades YouTube Create, en AI-redigeringsapp och ett verktyg som effektiviserar processen för skapande av innehåll. YouTube introducerade också den AI-drivna Humming Search-funktionen, vilket gör det lättare att utforska och hitta musikinnehåll på plattformen.

Vid den här tiden introducerade också Coca-Cola en mystisk smak skapad av AI. Jag var snabb på bollen för att smaka den, och jag vet inte om jag gillade den för att det var AI, men jag vill säga att jag tyckte att den var god!

Coca Cola lanserar läsk med mystisk AI-smak.

Musk jobbar på ännu en chattbot och OpenAI-VD:n sparkas och återanställs

Hösten har varit lika produktiv som dramatisk i AI-världen.

  • ElevenLabs introducerar möjligheten att klona sin röst och skapa röstklipp med sin egen röst på olika språk.
  • Google introducerar ett AI-verktyg, Search Generative Experience (SGE).
  • Amazon lanserar AI-driven bildgenerering.
  • Den ledande designplattformen Canva visar sitt engagemang för innovation genom att presentera en svit av AI-verktyg.
  • Elon Musks AI-startup xAI presenterar AI-chattboten “Grok”.
  • Stability AI släpper Stable Video Diffusion.

Assistants API från OpenAI och Google DeepMind lanserar ramverk för AGI-modeller

OpenAI introducerade Assistants API, vilket gör det möjligt för utvecklare att sömlöst integrera AI-drivna konversationsagenter i sina applikationer. Samtidigt bidrog Google DeepMind till AI-samhället genom att lansera ett ramverk för klassificering av AGI-modeller (Artificial General Intelligence).

OpenAI sparkar och återanställer VD:n Sam Altman

I novemer fick många av oss AI-entusiaster hänga med på en dramatisk berg- och dalbana av ledarskapsförändringar hos OpenAI. På en mycket kort tid sparkades och återanställdes Sam Altman.

Altman, OpenAI:s VD, har varit något av AI-branschens ansikte utåt sedan ChatGPT släpptes. Tills han helt sonika en dag i november fick sparken, bara några dagar efter att han under Open AI:s Dev days presenterat den nya AI-modellen ChatGPT-4 Turbo. Han berättade också om ChatGPT:s utökade kapacitet och införlivandet av multimodal funktionalitet. ChatGPT kan nu sömlöst arbeta med både bilder och röst. OpenAI gav dessutom användarna större kontroll över sina AI-modeller genom att introducera en anpassad GPT-byggfunktion för ChatGPT, vilket gör det möjligt för användare att skräddarsy sina språkmodeller efter specifika behov.

Varför Altman sparkades är ännu inte helt tydligt, men styrelsen anklagade honom för att inte ha varit “konsekvent uppriktig” i sina kontakter med företaget. Motreaktionen var dock snabb och majoriteten av företagets anställda hotade att lämna företaget om Altman inte återanställdes. OpenAI-investeraren Microsoft erbjöd då Altman och alla andra från OpenAI som ville ansluta sig jobb, och för ett ögonblick verkade det som om OpenAI stod inför en riktig krasch.

Men lika snabbt som han lämnat, återinsattes Altman igen. Många styrelseledamöte uttryckte ånger över hela händelsen och internet följde händelserna med spänning i realtid. Spekulationerna haglade tätt om att Altman kanske lett utvecklingen inom AI i en riktning som orsakade allvarliga etiska problem. Var det mytomspunna Project Q* på väg att uppnå AGI?

Världens första AI-drivna VD

Några som däremot hade en positiv förändring i sin företagsledning var dryckesföretaget Dictador som utsåg världens första AI-drivna VD, Mika. Grattis Mika!

Har OpenAI mött sin överman?

När vi närmar oss slutet av året står Googles nästa generations AI-modell, Gemini, i centrum och sägs överträffa GPT-4. När Google tillkännagav sin modell Gemini hävdade man att den kunde slå GPT-4 i de flesta tester – men det faktum att den bara kunde göra det med några få procentenheter nästan ett år efter att GPT-4 lanserades säger oss något om hur avancerad OpenAI:s modell faktiskt är. Dock åkte Google på ett bakslag när det kom fram att den video som Google promotat Gemini med visade sig vara redigerad för att få Gemini för att framstå som snabbare och ge skenet av att erbjuda en sömlös konversation mellan människa och maskin – vilket inte verkade vara riktigt sant. 

Den omtalade Google promo-videon.

Men snacket går om att OpenAI förbereder sig för lanseringen av GPT-6 och GPT-7 och Microsoft lanserade nyligen sin Copilot för Microsoft Edge så det återstår att se vem som blir krönt kung. Jag tippar på OpenAI, förutsatt att det är mina Monopol-pengar som står på spel, förstås.

EU överens om The AI-Act

På den globala regleringsfronten uppnådde Europeiska unionen nu i december en banbrytande överenskommelse gällande The Artificial Intelligence Act. Rådet och parlamentets överenskommelse markerar de första globala reglerna någonsin för AI.

Har hypen över generativ AI nått sin topp?

Året har minst sagt varit dramatiskt, händelserikt och AI-världen har väckt många tankar, frågor och känslor hos människor. Det har varit spännande och läskigt på samma gång och det har varit otroligt svårt att hänga med i svängarna. Med stor nyfikenhet ser jag fram emot året 2024. Vad tror du att vi har att vänta oss? Kommer hypen att fortsätta under 2024 eller har den nått sin topp?

Nu är året snart slut och det hinner säkert hända en hel del till, men för mig är det snart dags för en efterlängtad julledighet. Så därför vill jag passa på att önska dig en riktigt god jul och ett gott nytt år!

19 december 2023

Inlägget postades i

Aktuellt

Kommentarer

0 Kommentarer Lämna en kommentar

AI i fokus på Samhällsvetenskapliga fakultetens bibliotek

I det här inlägget gästas bloggen av Ellen Fall, Daniella Nilsson, Maja Carlson och Lina Ahlgren från Samhällsvetenskapliga fakultetens bibliotek som berättar om sin fokusdag om AI.

Fokusdag om AI för gemensamt lärande

Under hösten organiserade vi en ”fokusdag” om AI för våra kollegor på Samhällsvetenskapliga fakultetens bibliotek. Eftersom vi tror att AI kommer att påverka oss alla, oavsett arbetsuppgifter, ville vi gemensamt lära oss mer om AI ur olika perspektiv. 

Tanken var att ha en inspirerande och rolig dag tillsammans då vi kunde lära oss mer om hur AI kan påverka samhället, universitetet, biblioteket och oss själva.

I början av fokusdagen ställdes frågan “Vad känner du inför utvecklingen av AI-teknologin?”

Bjöd in personer som arbetar med AI

Vi bjöd därför in några personer som arbetar med AI. De fick presentera sin forskning eller sitt arbete och sedan diskutera tillsammans med oss. 

De som var inbjudna att komma och prata och diskutera med oss var:  

  • Rachel Forsyth, pedagogisk utvecklare på Enheten för undervisningsstöd, som arbetar med frågor om GAI-verktyg på universitetsnivå. Rachel berättade bland annat om Lunds universitets arbete med rekommendationer för och förhållningssätt till användning av generativ AI.  
  • Maria Hedlund, lektor på Statsvetenskapliga institutionen, som forskar om AI ur demokrati- och ansvarsperspektiv. Maria berättade för oss om sitt forskningsprojekt “Hur påverkar olika ansvarsfördelningar den långsiktiga utvecklingen av artificiell intelligens? (DRAID)” och om EUs pågående arbete med att lagstifta kring AI. 
  • Catharina Dahlgren, innovationsledare på Riksarkivet som varit verksam i olika AI-projekt, främst inom arkivsektorn. Tyvärr fick Catharina förhinder så hennes presentation ska hållas en annan gång.  

Workshop i form av “AI-buffé”

Fokusdagen innehöll även en workshop i form av en ”AI-buffé”, där deltagarna i grupper fick gå mellan stationer och prova olika AI-verktyg för att få insyn i hur de fungerar i praktiken (och kanske kan implementeras i bibliotekets verksamhet).  

Vid varje station fanns en dator där vi i förväg loggat in i ett eller två AI-verktyg, en kort beskrivning av det aktuella verktyget, instruktioner för användning samt förslag på frågor att ställa och exempeltexter att mata in. Detta uppskattades av deltagarna som kunde fokusera på att använda verktygen och utvärdera sina resultat. Efter att ha provat verktygen fick deltagarna dela med sig av sina intryck och åsikter i en Padlet, som nu kan fungera som ett underlag inför liknande aktiviteter. 

För att visa på bredden av funktioner testades verktyg i kategorierna textbehandling (Grammarly och QuillBot), hitta akademisk forskning (Perplexity, Keenious, Elicit och ResearchRabbit), katalogisering (Annif), presentationsverktyg (Tome och Bings bildgenerator) samt Bings chattrobot och ChatGPT.  

Samlade in feedback och idéer

Vi samlade också in kommentarer för att få veta vad våra kollegor tyckte om dagen och vad de vill jobba vidare med. De flesta tyckte att det var en givande dag och att det var roligt att kompetensutveckla sig tillsammans. Flera vill titta mer på verktygen från ”AI-buffén”, tillsammans eller inom ramen för sina egna arbetsuppgifter. Vi har även samlat in ett helt gäng idéer till andra AI-relaterade frågor att fördjupa oss inom!  

Vid avslutningen av fokusdagen ställdes frågan “Vad känner du inför utvecklingen av AI-teknologin efter fokusdagen?”

Vi som organiserade dagen hoppas att ”fokusdagen” blir ett återkommande koncept, där vi tillsammans kan kompetensutveckla oss kring aktuella teman för biblioteket.  

/Ellen Fall, Daniella Nilsson, Maja Carlson, Lina Ahlgren, Samhällsvetenskapliga fakultetens bibliotek 

Har du frågor om fokusdagen?

15 december 2023

Inlägget postades i

Aktuellt

Kommentarer

0 Kommentarer Lämna en kommentar

Microsoft Bing Chat blir Copilot i Edge – och tillgängligt för dig som är anställd vid LU

Du som är anställd vid LU kan nu använda Microsofts Copilot i webbläsaren Edge. Det innebär att du kan logga in med ditt jobb-konto och i webbläsaren få tillgång till sökmotor, AI-chattbot och en AI-driven assistent som låter dig interagera med webben på helt nya sätt.

Du får tillgång till OpenAI’s GPT-4, Dall-E 3 och kan hämta information i realtid

Microsoft har minst sagt gjort en spännande resa när det kommer till AI.

I början av det här året började Microsoft rulla ut sin Bing Chat – en sökmotor och AI-driven chatbot i ett. Under våren integrerade Bing också en AI-bildgenerator som drevs av OpenAI’s DALL-E 2 och nu i höst uppdaterades den till den senaste modellen DALL-E 3. Nu allra senast lanserades Copilot i Microsoft Edge-webbläsaren, och vi som arbetar på LU har tillgång till det.

Ett bra alternativ till ChatGPT

Att ha sökmotor och chattbot i ett är en många gånger kraftfull kombo och inte minst ett toppenalternativ för dig som vill komma åt GPT-4, OpenAI’s AI-modell (som används i ChatGPT) utan behöva betala runt 250 kronor/månad som privat plus-användare. Och du som hittills ännu bara använt ChatGPT 3.5 (gratisvarianten) slipper begränsningen i att modellen inte kan hämta information i realtid.

Det som skiljer Bing Chat och Copilot från ChatGPT är att du använder AI direkt i webbläsaren eftersom det är inbyggt. När du då lägger till Copilot som är en AI-driven funkton inbyggd i Edge, till ekvationen, så har du sökmotor, chatbot och assistent på ett och samma ställe. Copilot kan svara på frågor, sammanfatta innehåll och referera direkt till webbplatsen eller websidan du är inne på. Du kan också använda Copilot för att jämföra produkter, utföra uppgifter och skapa bilder. Och precis som ChatGPT kan den generera helt ny text till dig om du vill det.

Tips! Om du vill att svaren du får när du chattar med Bing chat ska baseras på GPT-4 och inte GPT3.5 behöver du välja konversationsformaten “Mer kreativ” eller “Mer exakt”.

Läs mer om Microsoft Copilot i Edge och om du har testat – berätta gärna vad du tycker!

Med Copilot i Edge kan du ha din Copilot uppe hela tiden (sidebar till höger). Här kan du växla mellan Chatt och Skriv. Det ena kan du använda för att chatta med Copilot om t.ex. innehållet på webbplatsen du besöker just nu, och det andra (i bild) kan du använda för att låta Copilot generera innehåll åt dig, precis som du gör i t.ex. ChatGPT.

15 december 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Skapa fotorealistiska bilder på människor – går det?

Går det att skapa fotorealistiska genrebilder på människor med hjälp av AI? Jag testade mina nybörjarkunskaper i Adobe Firefly, DALL-E och MidJourney.

Jag utgick från det här Instagraminlägget på Lunds universitet forskning:

Exempel på Instagraminlägg från @lundsuniversitet_forskning

Bilderna är hämtade från bildsajten Mostphotos.com och är inte jätteroliga. Skulle det funka att använda AI-verktyg för denna typ av inlägg istället?

Promptar

Promptarna , alltså textbeskrivningarna jag använde för att få fram en bild, såg lite olika ut för de olika verktygen och justerades allt eftersom jag testade mig fram, men de byggde generellt på följande:

Male caucasian patient in scandinavian hospital bed talking to a female african american doctor, serious faces

Eller:

Female african american doctor standing beside a hospital bed, talking to a male patient

Adobe Firefly Image 2

Firefly ingår i Adobe Creative Cloud, dels med inbyggda funktioner i Adobeprogrammen/apparna, dels som ett separat webbverktyg. Testet skedde i webbverktyget och text-till-bild-modulen:

Adobe Firefly text-till-bild

Adobe Firefly har ett väldigt snyggt och enkelt gränssnitt.

Här skriver du in din bildbeskrivning, och kan enkelt via en panel göra inställningar för olika stilar, effekter, fotoinställningar, belysning, färg, ton, ladda upp referensbild etcetera. Skriver du på engelska kan du också få förslag på beskrivningar.

Resultatet

Ansikten, ansiktsuttryck och händer var svårast att få till.

Människorna ser ”verkliga” men väldigt redigerade ut. De blir för släta och glowiga. Det blir lite bättre om jag drar ner reglaget för ”visuell intensitet”. Dessutom visar det sig vara väldigt svårt att få dem att inte le stort trots ord som “serious face” eller ”having pain” 🤨. Händer blir sällan rätt – ibland får de tre händer eller händer som svävar i luften. Och ögon pekar gärna på olika håll eller stirrar ut i tomma intet…

Även kroppsdelar som näsor kan bli problematiska…

Jag försökte också få till olika hudfärg på läkaren respektive patienten, vilket visade sig vara svårt. Mörkhyad läkare gav också mörhyad patient och tvärtom.

Svårt att generera en miljö som andas svensk sjukhus/skandinavisk sjukdvård. Det blir gärna snöiga alptoppar utanför fönstret 🏔️❄️

Resultatet blev lite bättre när jag laddade upp referensbild (en av bilderna från Instagraminlägget) för att få liknande miljö/färg/känsla.

Fördelar

  • Superkul att leka och testa runt
  • Smidigt gränssnitt och enkel panel med många valmöjligheter för att justera bilderna
  • Praktiskt för att skapa kreativa artsy bilder, illustrationer, loggor
  • Toppen att det ingår i Adobe-sviten

Nackdelar

  • Blir inte fotorealistiskt
  • Blir väldigt ”glowy” människor
  • Svårt med ögon/blicken – personerna tittar konstigt/på fel håll/på ingenting
  • Kroppsdelar, särskilt händer, fortfarande ett stort problem
  • Svårt att prompta specifika scener – att läkare står bredvid sjukhussängen och pratar med en patient
  • Svårt att få till olika hudfärg när det ska vara flera personer i en bild
  • Svårt att få personerna att ha de ansiktsuttryck man är ute efter

Bra frågor och svar om Firefly

Moderskeppets frågor och svar om Adobe Firefly

DALLE-E

DALL-E finns numera inbyggt i betalversionen av ChatGPT. Här jobbar du precis som i “vanliga” ChatGPT och promptar fram din bild. Till skillnad från Firefly (och MidJourney) så genereras endast en bild åt gången istället för fyra varianter.

Resultat

DALLE-E kan leverera häftiga och snygga bilder, och relativt realistiska sådana när det inte handlar om människor som motiv. Hur jag än promptar så blir resultatet mer likt en målning. 

I DALLE-E ser bilderna ut som målningar.

Efter en del googling hittar jag en tråd på Reddit; ”Is it me or does Dall-E 3 not produce realistic photos?” Jag hittar tips på hur man bör skriva in typ av kamera och olika kamerainställningar. Men de flesta verkar överens om att Dall-e bara levererar bilder i stil med ”computer art”. Och trots test av olika specifika kameror och inställningar så tröttnar jag ganska snabbt på att försöka få till fotografiska genrebilder i DALL-E.

Mannen till vänster upplever i alla fall smärta, men kan det kanske bero
att han har jättemånga händer? Bilden till höger fick helt plötsligt
en helt annan stil och färgsättning 🧐…

Fördelar

  • Lätt att använda. Du skriver bara in vad du vill att bilden ska föreställa och är du van vid ChatGPT så är det superenkelt.
  • Smidigt att det ingår i ChatGPT som är det verktyget många nybörjare startar med.
  • Kan skapa grymma bilder i stil med “computer art”.

Nackdelar

  • Kan inte generera fotorealistiska bilder på människor alls?
  • Jag kommer inte i närheten av det jag är ute efter vare sig i stil eller motiv – i alla fall inte med mina grundläggande promptkunskaper.

MidJourney

MidJourney är liiite krångligare att starta upp och komma in i då du måste skapa ett inlogg i appen Discord först. Gränssnittet är också lite rörigare – i alla fall för en otålig person – då du befinner dig i en stor community med olika servrar där du kan chatta med olika människor om helt olika saker. Här finns också mängder av trådar och tips på hur du promptar på bästa sätt.

För att generera bilder chattar du med boten MidJourney och skriver din prompt. Du har lite fler valmöjligeter än i DALLE-E, men inte samma enkla panel med olika inställningar som i Firefly. 

I MidJourney skriver du din prompt och får upp fyra olika förslag. När du väljer en av de fyra kan du antingen välja att förstora upp den, eller att skriva om prompten för just den bilden och generera
fyra nya versioner.
Ett tips jag hittade var att skriva in –style raw. Så här blev bilderna utan den taggen.
Och så här blev bilderna när jag promptade med –style raw. Lite mer fotorealistiska
(men utslätade och glowiga 🙃), även om ansiktsuttryck, blickar och placering av huvuden
lämnar en del att önska. Även lite tveksam till kläderna på de nedre bilderna?

Fördelar

  • Enkelt att välja vilka bild du vill jobba vidare med eller skala upp.
  • Grym på att generera artsy illustrationer och fantasyliknande motiv

Nackdelar

  • Svårt att veta hur du ska prompta och med vilka specifika termer om du är nybörjare. 
  • Känslan av att det finns en hel värld att upptäcka här inne, om du har tiden…
  • Bilder på människor ser redigerade och allt för “glowy” ut.

Summering – och en fråga till dig som läst hela vägen hit

Går det att skapa fotorealistiska genrebilder med människor som motiv?

Ja det går, men det blir inte tillräckligt bra eller tillräckligt realistiskt för att jag – just nu – ska kunna använda dessa i forskningskommunikation i SoMe där Lunds universitet är avsändare. Det ser INTE ut som ett foto och människor får än så länge konstiga kroppsdelar och ansiktsuttryck.

Kan jag använda verktygen till andra typer av genrebilder?

Ja det tror jag! Men människor är svårt. Och detta case var troligtvis lite för specifikt och avancerat.

Vilket verktyg gillade jag bäst?

I skrivande stund vinner Firefly för mig… På grund av att det känns som att jag har mest kontroll där, med högerpanelen och alla dess inställningar som inte kräver att jag blir en promptspecialist.

FRÅGA: Kommentera jättegärna om ni har förslag på promptar och inställningar för att få till denna typ av bilder bättre 🙏! 

13 december 2023

Inlägget postades i

Bild

Kommentarer

10 Kommentarer Lämna en kommentar

Skapa översatt video med Elevenlabs

Illustration med tecknad mun med pratbubblor och tekniska detaljer.
Illustration skapad av DALL-E.

Webbtjänsten Elevenlabs kan skapa en AI-modell av din egen röst. Jag testade att använda den för att göra en engelsk version av en utbildningsvideo och kan konstatera att AI-modellen av min röst pratar bättre engelska än vad jag gör.
 
I mitt jobb som webbkoordinator ingår att spela in instruktionsvideor. I samband med att Drupal fick bättre stöd för att bädda in video från Canvas Studio skapade jag en instruktionsvideo på sidan Bild, video, dokument och annan media.

Under senare år har efterfrågan på engelska versioner av våra instruktioner ökat. När det gäller text har vi fått god hjälp av universitetets översättare, men också av externa översättare då det handlat om större mängder text. Då det gäller talad engelska bestämde jag mig för att testa webbtjänsten Elevenlabs i stället för att skämma ut mig med min knaggliga skolengelska.
 
Då den svenska videon var färdig så hade jag både ett manus på svenska och en två och en halv minut inspelning av min egen röst. Elevenlabs behöver en inspelning som underlag för den röstmodell som den ska skapa. Jag började med att ladda upp speakern från instruktionsvideon. Det man laddar upp behöver inte ha något innehållsmässigt samband med det man sedan vill skapa, utan det handlar om hur rösten ska låta – och ju mer material den har att lära sig utifrån, desto bättre.
 
Därefter fuskade jag lite grand och använde tjänsten DeepL för att enkelt översätta manuset från svenska till engelska. Jag är verkligen ingen översättare, men kunde rätta några saker som jag tyckte blev konstiga.
 
Sista steget i Elevenlabs var att klistra in det engelska manuset och låta den generera den engelska speakern med hjälp av AI-modellen av min röst. Resultatet blev förvånansvärt bra! Min högst personliga bedömning är att min modell överträffar mig då det gäller engelskt uttal. Se videon här.

Det ska dock sägas att det krävdes en del handpåläggning i videoredigeringsprogrammet för att synka de talade instruktionerna med vad som faktiskt händer på skärmen. Men det är en utmaning oavsett språk. Då du spelar in videoinstruktioner behöver du antingen spela in bild och ljud samtidigt, eller tänka väldigt noga då du skriver ditt manus. Det är lätt att i farten skriva (och läsa in) ”Välj Öppna i Arkiv-menyn” trots att det i verkligheten kommer att ske i omvänd ordning (”Klicka på Arkiv-menyn och välj sedan Öppna”).

Då du laddat upp din röst och skapat din röstmodell så behöver du inte göra den delen flera gånger. Då är modellen färdig och redo för att användas på annat textmaterial.

13 december 2023

Inlägget postades i

Ljud Översättning

Kommentarer

0 Kommentarer Lämna en kommentar

Generativ AI i videoproduktion med HeyGen

Med HeyGen förenklas videoproduktionen genom användning av generativ AI. Plattformen gör det möjligt att skapa en personlig avatar baserad på min egen röst och mitt utseende.

Konceptet är enkelt – jag laddar upp ett kort videoklipp där jag talar om ett valfritt ämne i 30 sekunder. HeyGen analyserar detta klipp för att skapa en avatar som inte bara visuellt liknar mig utan också återskapar min röst.

Det går att översätta videon till nästan trettio olika språk. Detta gör det möjligt att skapa innehåll på flera språk utifrån samma ursprungsvideo. Det mest överraskande och fascinerande har varit möjligheten att höra min egna röst på olika språk eller på olika dialekter. På den svenska översättningen pratar jag stockholmska(!).

HeyGen ger mig kontroll över min avatar genom att jag skriver en text på engelska som den läser upp, synkroniserat med mina läpprörelser. Resultatet blir en ganska realistisk videoupplevelse som reflekterar min röst och mitt utseende.

Slutsatser

Det är tydligt att HeyGen representerar ett steg framåt inom AI och videoproduktion, men som med alla teknologier finns det områden där justeringar kan krävas för att förbättra användarupplevelsen. Språket blir inte alltid helt rätt och det blir en aning styltigt när rörelser och gester upprepas av avataren. Men det är en intressant lösning där det går att uppdatera en video bara genom att ändra i texten och låta HeyGen göra en ny version utan all den förberedelse som en vanlig videoinspelning innebär.

Här nedan följer några exempel på video som testats med en text från sidan The University at a glance på Lunds universitets engelska webbplats, kopierat 231130.

12 december 2023

Inlägget postades i

Översättning Video

Kommentarer

0 Kommentarer Lämna en kommentar

Bygg din egen AI-expert i ChatGPT!

Det har hänt en hel del på GPT-fronten på sistone. I november meddelade OpenAI att de lanserat en ny funktion i ChatGPT för dig som har betalversionen – möjligheten att bygga egna, skräddarsydda GPTs (som en chatbot som är expert på ett specifikt område) baserad på ChatGPT och som vem som helst kan skapa helt utan att behöva skriva kod och programmera. Och dessutom gör du det direkt i ChatGPT.

En GPT för varje uppgift

Tanken med att skapa skräddarsydda GPTs är att de helt enkelt ska vara duktiga på olika saker. Om du har en specifik fråga eller ett problem vänder du dig förmodligen hellre till en specialist på området. Om jag vill få feedback på en nyhetstext går jag allra helst till mina kollegor som jobbar med nyheter och om jag har frågor om hur jag bäst designar och layoutar min webbsida är vår UX-designer en bra person att snacka med!

Precis så tänker jag också när det kommer till GPTs. Jag kan fråga ChatGPT, som kanske kan ge mig breda svar baserade på mängder med data och information om allt möjligt – eller så kan jag skapa min GPT där jag dels själv kan styra varifrån informationen ska hämtas när jag får mitt svar, men som också själv hjälper till att leta på relevanta ställen.

En expert på klarspråk och en annan på Excel

När man börjar leka med GPTs är det svårt att sluta. Jag har redan massor av idéer om en GPT-armé jag tänker bygga mig som kan få hoppa ner i min AI-verktygslåda. Och jag har redan hittat en hel del som jag inte behöver bygga själv, för att andra redan har gjort det!

Min första GPT som jag också delat publikt heter Klarspråkaren – en expert på att skriva och svara på frågor om klarspråk. Klarspråkaren hämtar sin kunskap från klarspråkssidorna på isof.se och från Myndigheternas skrivregler från Språkrådet. Klarspråkaren (och jag!) blev också omnämnd i nyhetsbrevet AI & Kommunikation från Maniola, vilket känns väldigt kul eftersom det är ett otroligt bra nyhetsbrev för alla som är intresserade av AI i kommunikation. Så om du inte redan prenumererar på det – signa upp nu!

En annan GPT som jag inte delat publikt är Excel Pro (jag valde inte namnet, utan hoppade på första bästa förslag jag fick av ChatGPT) som hjälper mig att skapa Excel-filer. Jag är otroligt dålig på Excel själv och tycker att det är en traumatisk upplevelse att försöka mig på att skapa något så enkelt som månadsbudget i programmet, men i mig bor en liten Excel-älskare som verkligen uppskattar ett riktigt snyggt och välstrukturerat Excel-ark. Jag matar in informationen jag vill få strukturerad i Excel Pro och får tillbaka en Excel-fil jag kan spara och öppna på min dator. Excel Pro kan också svara på mina frågor om Excel, förklara för mig hur jag ska göra om jag vill göra något själv och ge mig tydliga steg för steg-instruktioner.

Skapa en ny GPT

För att börja skapa din egen GPT kan du börja med att fundera på vad du faktiskt behöver hjälp med. Vad ska din GPT vara duktig på? Försök att vara så specifik som möjligt.

  1. Logga in på ditt konto i ChatGPT. Observera att detta bara är tillgängligt för dig som har ChatGPT Plus.
  2. I vänstermenyn har du en flik som heter Explore. Tryck på den.
  3. Under My GPTs klickar du på Create a GPT.

Bygg och testa din GPT

Nu kommer du till den sida där du kommer att bygga och testa din GPT. Till vänster har du dialogen med ChatGPT som hjälper dig att bygga din GPT utifrån de instruktioner du ger. Till höger har du en så kallad “Playground”, där du kan testa din GPT under tiden som du bygger och anpassar den så som du vill ha den.

I det här inlägget ska vi bygga en GPT som svarar frågor på hur man gör olika saker i CMS:et Drupal och som hämtar information från stödwebbplatsen om Webbpublicering vid Lunds universitet. Du kan skriva på svenska under hela processen och ChatGPT kommer att förstå dig. Du kan också redan nu ange om du vill att din GPT ska kommunicera helt och hållet på svenska.

  1. GPT Builder frågar dig vad du vill bygga.
  2. Beskriv vad du vill bygga kortfattat. Du kommer att kunna lägga till mer och mer information sedan.
  3. När du svarat på frågan eller lagt till mer information (detta gäller under hela processen) så kommer GPT Builder att ta in informationen, analysera den och sedan uppdatera din GPT utifrån det du skrivit.
  4. I nästa steg kommer GPT Builder att föreslå ett namn på din GPT, vilket du kan välja att behålla. Du kan också skriva ett namn du hittar på själv, eller be att den ger dig fler förslag.
  5. Sedan kommer GPT Builder att skapa en liten profilbild till din GPT. Precis som med namnet kan du välja att behålla den, men du kan också be den att ta fram nya förslag. Mig veterligen kan du inte ladda upp en egen bild (rätta mig om jag har fel).
Här börjar dialogen mellan GPT Builder och mig, där jag får berätta vad jag vill skapa.
GPT Builder ger mig förslag på namn och genererar en profilbild för min GPT.
Särskrivningar är ingen favorit och det verkar svårt att få till ett bindestreck så jag byter namn till Drupalguiden istället. Bilden tycker jag funkar bra.

I takt med att GPTn uppdateras ändras också utseendet på den i playground, till höger. Efter varje förändring jag gör kan jag alltså testa den direkt. Min GPT har nu fått ett namn, en bild och vi kan också se att GPT Builder har skapat fyra fördefinierade frågor som användarna kan klicka på. Dessa fyra frågor har den valt ut utifrån den information den har hittills – vilket ju inte är så mycket mer än det som ChatGPT vet om Drupal generellt.

Nu vill jag ju dock att min GPT ska kunna svara på frågor om hur vi som jobbar med Drupal i just vår miljö ska göra när vi behöver göra något. Därför behöver jag nu se till så att Drupalguiden bara hämtar och utgår från informationen vi har på vår stödwebbplats där allt står dokumenterat.

Webbplatser och webbsidor som kunskapsbas

Eftersom Drupal kan byggas på många olika sätt vill jag helst inte att Drupalguiden ska söka efter information på andra platser, för då kan vi få tips om funktioner som kanske inte finns hos oss. Detta behöver jag tala om för GPT Builder. Jag försöker först att göra det på svenska, och det brukar fungera, men just vid det här tillfället hade ChatGPT svårt att generera ett svar. Det kan lika gärna bero på min internetanslutning som att det var hög belastning på verktyget just då. Jag testade i alla fall att skriva det på engelska istället och då funkade det bättre. Resten av dialogen sker också på engelska utan att jag tänker på det, men det ska alltså gå att ta allt på svenska.

Tips:

  • Om du vill att din GPT ska hämta information från en hel webbplats måste du tala om det för den. Om du bara klistrar in en länk finns risken att den bara tittar på startsidan. Jag har provat lite olika sätt att instruera den till detta, men det som fungerat bäst för mig har varit att skriva något i stil med “use the following URL and all of its paths/sub-paths starting with:” och sen klistra in URL:en.
  • Det samma gäller om du bara vill att den ska titta på en begränsad del av webbplatsen. Om det bara är ett fåtal sidor kan du lägga in URL:erna var för sig – men om du till exempel vill använda en större del av en webbplats som har många undersidor kan du specificera detta också.

    Exempel: I want you to only look for answers in the following URL and all of the paths beginning with: https://www.webbpublicering.lu.se/innehall
  • Det kan vara bra att lägga till instruktionen att “leta alltid efter information på den angivna URL:en innan du svarar och ange alltid källan till ditt svar.”
Jag berättar för GPT Builder var jag vill att Drupalguiden ska hämta sin information
För att göra det extra tydligt talar jag också om att den ska söka innan den svarar och att den alltid ska ange källan med en klickbar länk.

Konfigurering och förinställda frågor

Förutom att chatta med GPT Builder kan jag också klicka på knappen Configure högst upp. Här kan jag ändra namnet och beskrivningen själv. I fältet “Instructions” har GPT Builder sammanfattat alla instruktioner jag gett den hittills i en beskrivning. Här kan jag ändra, ta bort och lägga till saker om jag vill, men jag låter det vara som det är i nuläget.

Under Conversation starters hittar jag de förinställda frågorna som GPT Builder skapade åt mig ganska tidigt i skapandet. Som det ser ut nu skulle faktiskt tre av dessa fyra frågor kunna ställas och få ett svar baserat på informationen på stödwebbplatsen, men frågan om Drupal-teman är irrelevant, för man kan inte välja ett tema. Det är redan förinställt.

Jag kan välja att ta bort frågorna, lägga till egna eller så kan jag klicka på Create högst upp och komma tillbaka till chatten med GPT Builder. Där kan jag be den generera nya frågor som är mer relevanta utifrån den kunskap den nu har (från webbpublicering.lu.se) och byta ut de gamla mot de nya.

Jag ber GPT Builder att ge mig förslag på fyra nya frågor.

Resultatet blir faktiskt riktigt bra, tycker jag. Det är jag som har byggt upp webbplatsen webbpublicering.lu.se, så jag vet ju att den har letat och hittat rätt. Det enda är att frågorna är lite långa och får inte plats i sin helhet, så jag ber GPT Builder att korta ner dem.

Filer och dokument som kunskapskällor

Jag kan också under Configure ladda upp filer och dokument som jag vill att min GPT ska hämta sin kunskap från. I det här fallet vill jag inte göra det, men ett exempel skulle kunna vara att be supporten lista de vanligaste frågorna de får och svaren i ett dokument och ladda upp det här. Jag kan också göra samma sak i chatten under Create genom att klicka på den lilla symbolen i form av ett gem och be GPT Builder att lägga till det jag laddar upp i kunskapsbasen.

Ska din GPT kunna söka på webben, generera bilder och ta emot filer?

Nästan längst ner under Configure hittar vi en viktig liten lista. Här väljer du vad din GPT ska kunna göra. För att den här GPTn ska fungera måste vi kryssa i att den ska kunna söka på webben, annars kan den inte hämta information från webbplatsen i realtid. Den behöver förmodligen inte kunna generera bilder, men den är ikryssad by default ändå. Code interpreter är viktig att kryssa i om du vill kunna ladda upp filer, bilder etc.

Spara GPTn

Nu vill jag spara min GPT och testa den i skarpt läge. För att spara den klickar jag på Save längst upp i höger hörn och väljer hur jag vill publicera den.

Här väljer jag hur jag vill publicera min GPT. Den lilla blixten är ett plugin jag har i min webbläsare som jag för tillfället inte kunde få bort – så den kan du ignorera 🙂

Eldprovet – Nu testar vi Drupalguiden!

Jag testar att ställa några frågor. Drupalguiden gör sitt jobb! Den söker efter information på rätt ställe och jag får klickbara länkar i form av små blåa citationstecken.

Fråga: Hur gör jag en redirect från en sida till en annan?
Fråga: Hur skapar jag en ny landningssida?
Fråga: Hur administrerar jag användarroller?
Fortsättning på svar av frågan “Hur administrerar jag användarroller?”

Ett godkänt resultat

Ja, jag tycker ändå att Drupalguiden gör bra ifrån sig. Jag får relevanta svar, jag får länkar och jag slipper få en massa allmän information om vad man kan göra i Drupal som ändå kanske inte fungerar som mig som publicerar i Drupal vid LU. Om du har chatGPT plus och vill testa Drupalguiden gör du det här!

Vad tycker du? Skriv gärna en kommentar, och berätta gärna om du också vill bygga en egen GPT!
/Edina

7 december 2023

Inlägget postades i

Textproduktion

Kommentarer

2 Kommentarer Lämna en kommentar

Workshop om AI för chefer och ledare

Igår, den 6/12, höll jag en första workshop om AI för chefer på sektionen Kommunikation – och vilken dag det blev! Deltog gjorde:

  • Johanna Sandahl, kommunikationsdirektör
  • Johanna Lindvall, avdelningschef på Webbavdelningen
  • Eva Johannesson, avdelningschef på avdelningen för Kommunikativt verksamhetsstöd
  • Lena Mathiasson, avdelningschef på avdelningen Media och profilering.

Under tre effektiva timmar fick de reflektera, labba, diskutera och brainstorma tillsammans över hur deras arbetsuppgifter kan förbättras och effektiviseras med hjälp av AI – men också hur man skulle kunna hitta användningsområden för AI-verktyg på sektionens olika avdelningar.

Övning med chefsassistenten

Inför workshopen förberedde jag praktiska övningar, diskussionsfrågor och en GPT som fick namnet Chefsassistenten, som söker efter svar på chefers och ledares frågor bland innehållet från HR-webben och Medarbetarwebben.

Deltagarna fick testa på olika funktioner i ChatGPT-4, som att analysera dokument och bilder, skapa bilder och de fick testa att lösa olika typer av uppgifter med hjälp av verktyget. Den enorma skillnaden mellan att arbeta med ChatGPT-3.5 och ChatGPT-4.0 Turbo blev tydlig under workshopen.

Byggde en egen GPT

Något som inte ingick i planen för dagen, men som var en definitiv bonus, var att cheferna tillsammans skapade en egen GPT, “Sammanfattaren”, som hjälper till att läsa igenom, sammanfatta och återge information i rapporter och andra dokument.

7 december 2023

Kommentarer

0 Kommentarer Lämna en kommentar

Johanna Sandahl berättar om AI-KOM på Forum för Forskningskommunikation i Stockholm

Under årets Forum för Forskningskommunikation som ägde rum i Stockholm och online den 28 november 2023, låg det stora fokuset på AI och hur kommunikatörens roll påverkas av denna rasande snabba teknologiska utveckling. Konferensen var fullspäckad med intressanta presentationer från många olika perspektiv och synvinklar.

En av många inspirerande och intressanta talare var vår kommunikationsdirektör Johanna Sandahl som deltog i konferensen för att berätta om sektionen Kommunikations AI-task force, AI-KOM, och jag (Edina) var också där för att svara på mer specifika frågor om arbetet vi gör i gruppen.

Viktigt att våga testa

Johannas huvudbudskap var att det är viktigt att våga testa och att syftet med bildandet av AI-task forcen var att just kunna göra detta på det kreativt och snabbfotat sätt. Under panelsamtalet där Johanna tillsammans med Patrik Nilsson, chef för Politik och profession på Akavia, pratade om AI och kommunikatörernas framtida roll lyftes vikten av att hålla sig uppdaterad om aktuella trender och utvecklingen inom AI som kommunikatör. Budskapet var att det kommer alltid kommer att vara viktigt att ha personer med en god grundkompetens, där AI får ta rollen som verktyg och inte ersättare.

Vad vi tar med oss från årets FFF är att det är otroligt viktigt att vara öppen och att våga testa men också att vara medveten och lyhörd för vilken påverkan AI har och kan få på samhället och på framtiden i stort. Genom att samla resurser, kunskap och expertis om AI och genom att utforska möjligheter och lösningar kan man rusta sig för den på många sätt nutida men också framtida tekniken.

Titta i efterhand

Nu kan du som inte var på plats på FFF ta del av konferensens presentationer och panelsamtal i efterhand på youtube. Här i inlägget kan du titta på Johannas presentation om AI-task forcen och även panelsamtalet.

7 december 2023

Inlägget postades i

Aktuellt

Kommentarer

0 Kommentarer Lämna en kommentar

Skippa snacket – klona din röst istället!

Att prata på engelska är något som ibland krävs av mig i mitt arbete. Jag behärskar engelska bra i både tal och skrift, men det kan ändå kännas som en utmaning för mig som inte har det som modersmål. Trots att min engelska är bra är jag inte alltid helt bekväm med att prata engelska och inför till exempel inspelningar kräver det mycket mer tid och förberedelser än om jag ska prata på svenska. Jag har därför funderat på om teknologin kunde göra detta moment lite lättare för mig. I det här inlägget utforskar jag en spännande möjlighet: att klona min egen röst och använda den för att skapa engelska voiceovers.

I min roll som webbredaktör har jag skrivit en hel del brukstexter och instruerande steg för steg-listor. Ibland tycker jag att det funkar bäst att ge instruktioner i skrift, men ibland är det ju väldigt smidigt att kunna göra en tutorial med voiceover i videoformat.

Som i inlägget om MacWhisper PRO där vår filmproducent Johan testar att skapa översatta undertexter, där vi ville visa hur man gör när man använder programmet. Vi gjorde helt enkelt en skärminspelning av de olika momenten. Då fick jag idén att testa att skapa en voice over och när jag letade efter bra röster så tänkte jag att det vore spännande att se hur det blev om jag klonade min egen. Och det blev faktiskt bra. Det låter som jag och likt verkligheten så är inte engelskan perfekt – men det tycker jag bara gör att det låter naturligare och mindre “robotigt”.

Play.ht låter dig prova en gång gratis

Programmet jag testade den här gången, Play.ht, är helt gratis för första kloningen, men jag behöver registrera ett konto och jag kan inte generera hur mycket ljud som helst. Det går att ladda ner programmet till datorn och köra det lokalt, eller direkt i webbläsaren. Det finns fler program som kan göra samma sak, bland annat ElevenLabs. Det kommer ett separat inlägg om ElevenLabs där jag kommer att testa några av deras funktioner.

Så klonar jag min röst

När jag registrerat mig på Play.ht och loggat in går jag till min dashboard, klickar på Voice cloning och sedan på Create a New Clone.

För att klona min röst behöver programmet en 30 sekunder lång inspelning av min röst. Jag spelar in mig själv när jag pratar, på svenska, om precis vad som helst, sparar mitt röstklipp och laddar upp det.

Jag öppnar sedan ett nytt projekt. I mitt nya projekt kommer jag få en tom ruta att fylla med text och en slumpmässigt utvalt röst för min voice over. Om jag klickar på namnet kan jag byta röst, och då kan jag välja min klonade röst.

Sedan kan jag börja skriva vad jag vill att rösten ska säga. Det är viktigt att tänka på att inte lägga allt i en “ruta”, för jag vill kunna exportera de olika segmenten och spara dem på datorn var för sig, så att jag slipper klippa i filen där jag vill ha pauser.

När jag skrivit in vad jag vill att rösten ska säga i ett segment så klickar jag på generate. Om jag behöver ändra något i texten så gör jag det och klickar på regenerate. Då sparas alla versioner til höger om segmentet och jag kan välja vilken version jag vill ha.

Jag kan sedan exportera mina klipp genom att antigen klicka på Export högst upp till höger och exportera alla klipp på en gång till en mapp, eller ett i taget. Jag kan också exportera alla röstfiler genom att klicka på molnet med en pil neråt till höger om segmenten där jag väljer version.

Nu har jag alla röstfiler sparade på min dator och kan använda dem i vilket program jag vill. Och undertexterna fixar jag förstås i MacWhisper sen.

Om du vill lyssna på hur min klonade röst låter kan du höra det i videon i inlägget om MacWhisper PRO.

Att experimentera med röstkloning har varit något av en ögonöppnare. Det har inte bara gett mig en praktisk lösning för att skapa engelska voiceovers. Jag har också fått en liten inblick i hur framtidens språkanvändning kan se ut. Även om denna teknik inte ersätter behovet av att faktiskt tala engelska, vilket jag tycker är fortsatt viktigt, erbjuder den ett fascinerande komplement till vår växande digitala verktygslåda.

Har du egna erfarenheter av röstkloning eller tankar om att klona sin röst? Dela gärna med dig i kommentarsfältet nedan!

28 november 2023

Inlägget postades i

Ljud

Kommentarer

0 Kommentarer Lämna en kommentar

Äldre inlägg