Generativ AI i kommunikation

AI-KOM: Testar, utvärderar och jämför AI-verktyg

Visa rutor

Skapa och översätta undertexter till film

I mitt dagliga arbete producerar jag film och textningen av våra filmer har blivit en viktig arbetsuppgift. I början anlitade vi en extern leverantör för undertexter, men vi har mer och mer gått över till att själva texta filmer. Detta gör vi med hjälp av förbättrade funktioner för undertextning i programmen vi använder för att redigera våra filmer.

Jag redigerar och arbetar med filmer i Adobes verktyg för videoredigering, Premiere Pro. Programmet kan transkribera det talade språket i filmen och skapa undertexter automatiskt. Det innebär att engelskt tal kan få engelska undertexter och nyligen har även stöd för svenska undertexter lanserats.

Premiere Pro

Jag tycker att undertextningen i Premiere fungerar väldigt bra. Oavsett om det är på svenska eller engelska fungerar den mycket bra. Det finns några få ord som behöver korrigeras, meningar som bör förkortas för att göra dem mer lättlästa, och ibland behöver jag ta bort några “Eh” och “Mm..” också. Ibland missar programmet lite knepiga vetenskapstermer också. Men när allt det finliret är klart kan jag enkelt exportera textfilerna (.srt-format) som jag sedan kan ladda upp tillsammans med filmen på olika plattformar, som Youtube, Facebook, LinkedIn och så vidare.

AI-verktyget MacWhisper Pro

Jag har även testat AI-verktyget MacWhisper Pro som byggts på modellen Whisper. Skillnaden i arbetsflödet mellan Premiere Pro och MacWhisper Pro är att jag i Premiere kan generera undertexter medan jag arbetar, klipper och ändrar i filmmaterialet. I MacWhisper måste jag vara helt klar med filmen innan jag kan ladda upp den i MacWhisper och skapa mina undertexter.

Programmet är väldigt smidigt. Jag laddar upp min film och ber sedan MacWhisper skapa undertexter. Det går på ett kick (en film på 5 minuter tar 15-20 sek). MacWhisper kan texta på över 100 språk och såklart även svenska. På samma sätt som med Premiere måste jag gå in och kolla igenom allt material och korrigera där det blivit fel. Jag kan inte se någon skillnad i programmens kapacitet när det gäller att skapa korrekta undertexter.

Båda verktygen fungerar alltså likvärdigt och bra för att undertexta till det talade språket.

När jag vill ha undertexter på ett annat språk

Knepigare blir det om man vill skapa en översättning (från engelskt prat till svenska undertexter t.ex.). Och det är egentligen här den stora skillnaden kommer in, för Premier Pro har inte denna funktionen. Jag kan alltså bara få undertexter på samma språk som talas i min film – men med MacWhisper kan jag plötsligt översätta och skapa undertexter på en rad olika språk!

För att kunna göra detta behöver jag ha Pro-versionen av MacWhisper, som också finns som gratisversion. I sin tur använder MacWhisper Pro AI-verktyget DeepL för att göra själva översättningen, men för att få tillgång till denna funktion behövde jag inte ha någon betalversion i DeepL. Gratisvarianten fungerar gott och väl. Däremot behöver jag skaffa en API-nyckel, en kod, som jag behöver skriva in i MacWhisper för att få tillgång till översättningen.

Så gör du

När jag har transkriberat min videofil till originalspråket (i mitt fall engelska) I MacWhisper går jag in under segments. Där skapar jag min översättning till svenska och därefter exporterar jag ut som .srt.

Sedan kan jag dra in min översatta .srt-fil i Premiere Pro. Undertexterna lägger sig snyggt och prydligt över filmen och jag kan gå in och redigera dessa. På vissa ställen kan det bli fel med tajmingen, det kan jag hyfsat enkelt ändra manuellt. Språket är ofta korrekt, men namn, facktermer, och längden på meningar kan behöva justeras.

Från engelska till svenska fungerar detta utmärkt. Men eftersom jag inte har engelska som modersmål är det omvända svårare (svenska till engelska). Jag kan inte alltid bedöma om det är en bra översättning. Har man möjligheten att jobba med en professionell översättare som kan hjälpa till att rätta till undertexterna utifrån filmen är det såklart att föredra.

Det här fungerar också för dig som vill kunna lägga till din undertext i ett annat program än Premiere Pro eller t.ex. på sociala medier. Du kan använda dig av undertexterna överallt där du kan ladda upp filer i srt-format.

Adobe Premiere Pro

Fördelar

  • Snabb transkribering
  • Skapar undertexter direkt i redigeringen
  • Funktionen finns på flera språk, inklusive svenska
  • Hög träffsäkerhet när det gäller talspråk

Nackdelar

  • Svårt med namn och facktermer
  • Kan inte skapa översättningar

MacWhisper Pro

Fördelar

  • Snabb transkribering
  • Enkelt avskalat gränssnitt
  • Hög träffsäkerhet
  • Kan ladda upp flera olika video- och ljudformat
  • Kan skapa översätta undertexter med hjälp av DeepL

Nackdelar

  • Vill du göra små justeringar i din undertext kan du behöva göra om processen igen, eftersom du laddar upp färdiga filer (filmer, poddar t.ex).
  • Svårt med namn och facktermer
27 november 2023

Inlägget postades i

Översättning Undertextning Video

Kommentarer

2 Kommentarer Lämna en kommentar

AI-KOM i Stockholm på premiär för kursen AI-labbet

Den 18 oktober hölls premiäromgången av den nya kursen “AI-labbet” som Sveriges kommunikatörer anordnar. På plats i Stockholm var några av oss från AI-KOM och vi fick under en hel dag ägna oss åt praktiskt AI-arbete, problemlösning och vara kreativa med hjälp av verktyg inom generativ AI.

Huvudfokuset låg på produktion av text, bild och video. Verktygen vi fick testa på var ChatGPT 3.5 och 4 (plus), Midjourney, Dall-E, Heygen och Visla. Vi fick en introduktion till generativ AI, till verktygen och en framtidsspaning. Kursledare var Petronella Barvaeus och Lisa Walder (från byrån Maniola). Petronella har också gett en kurs från Sveriges kommunikatörer om AI specifikt för oss på Lunds universitet.

Eftersom att vi alla i gruppen arbetar med AI-KOM utöver våra ordinarie huvuduppdrag är det ibland svårt att hitta och sätta av tid för att jobba med AI i längre stunder tillsammans. Den här kursen synliggjorde verkligen vilken nytta vi har av att jobba på det sättet och blev lite av en kick-off för oss. Vi lämnade Stockholm trötta, men inspirerade och taggade på att komma igång med vårt testande.

Konceptet AI-labb plockade vi med oss och på torsdag har vi vårt första AI-labb i gruppen, där vi under en hel eftermiddag ska jobba ihop och försöka skapa saker med AI som vi sedan kan dela med oss av här på bloggen.

Vill du veta mer? Läs mer om kursen “AI-labbet”.

Peter och Anna djupt fokuserade på sina uppgifter och jag (Edina) testar Adobe Illustrators nya AI-funktioner.
23 november 2023

Inlägget postades i

Aktuellt

Kommentarer

0 Kommentarer Lämna en kommentar

Så hälsar ChatGPT Plus dig välkommen hit!

Liten stig omgiven av tätt växande blomster. Illustration.
Med inspiration av Botaniska trädgårdens vackra blommor genererade AI-verktyget Midjourney en illustration.

Hej!

Visst är det något alldeles särskilt intressant när tekniken möter människan? Precis som Botaniska trädgården blommar på alla håll och kanter, hoppas jag, ChatGPT, att denna blogg ska blomma med insikter och upptäckter. Och kanske är du, precis som gruppen som står bakom den här bloggen, nyfiken på vad generativ AI har att erbjuda dig som kommunikatör.

AI-KOM är en grupp nyfikna och intresserade personer som arbetar vid sektionen Kommunikation. De har fått i uppdrag att titta närmare på hur AI-verktyg kan assistera, underlätta och kanske till och med revolutionera det arbete kommunikatörer gör varje dag. I den här bloggen vill AI-KOM dela med sig av både de stunder när generativ AI överträffar förväntningar och de tillfällen när verktygen kanske inte riktigt lever upp till hypen. Och den som gett sig in i djungeln av AI-verktyg vet säkert att den är svårnavigerad.

Så om du någonsin har funderat över hur AI kan påverka ditt dagliga arbete, eller bara är nyfiken på vad några intresserade personer vid ett universitet, på en kommunikationsavdelning, kan komma fram till när de provar sig fram med AI-verktyg, då tror jag att du kommer att finna denna blogg intressant.

Så, kika gärna in här då och då för att se vad de har upptäckt hittills. Oavsett om du är en erfaren AI-användare eller helt grön inom ämnet hoppas de att kunna inspirera dig.

Varmt välkommen. /ChatGPT-4


En dialog mellan mig och ChatGPT

Först och främst vill jag, med egna ord, hälsa dig välkommen hit. Mitt namn är Edina Voloder och jag arbetar tillsammans med fem nyfikna kollegor från sektionen Kommunikation i gruppen AI-KOM. AI-KOM står för AI i kommunikation. Vårt uppdrag är att på ett kreativt och utforskande sätt testa, utvärdera och jämföra olika AI-verktyg som finns och (ständigt) dyker upp på marknaden. I den här bloggen vill vi dela med oss av våra insikter, fynd och upptäckter i takt med att vi testar oss fram i den djungel av generativa AI-verktyg som finns.

I den här bloggen kommer vi att dela med oss av hur vi jobbar i gruppen och vad vi kommer fram till när vi testar och utforskar. Du kommer att få ta del av våra resultat i såväl text som bilder, video och ljud. Till det här blogginlägget har jag valt att ta hjälp av ChatGPT för att generera ett inlägg som välkomnar dig till den här bloggen.

Vad är ChatGPT och hur fungerar verktyget?

ChatGPT en chatbot utvecklad av OpenAI som bygger på en AI-modell som kan förstå och generera text. Det finns många olika AI-modeller och ChatGPT är en av GPT-modellerna. GPT står för Generative Pre-trained Transformer. Dessa maskininlärningsmodeller tränas på stora mängder text för att kunna förutspå nästkommande ord i en textsekvens. ChatGPT är tränad i att på ett sätt likt det mänskliga kunna svara på frågor, skriva texter och utföra många andra språkrelaterade uppgifter.

När du använder ChatGPT chattar du med verktyget i din webbläsare. Du skriver ett meddelande i ett textfält och ChatGPT svarar dig. Ungefär som att chatta med en riktig person.

Vad är en prompt?

En prompt är helt enkelt en instruktion. En prompt kan vara en instruktion till att göra något eller också en fråga du vill ställa. När du vill ställa en fråga räcker det att du skriver ut frågan, du behöver inte instruera den att svara på frågan.

Det blir sällan perfekt första gången

Jag började med att skriva en prompt. Jag använder mig av ChatGPT plus, version 4, som man behöver betala för.

Dialogruta med en text i AI-verktyget ChatGPT.
Jag skrev en första prompt och bad ChatGPT generera ett utkast.

Till en början verkade det lovande. Inte perfekt, men det är det sällan, och till sist tyckte jag att utkastet i sin helhet inte motsvarade alls vad jag ville ha. I sitt utkast berättar ChatGPT bland annat vad vi ska syssla med – vilket den ju faktiskt inte vet något om. För att jag helt enkelt inte förklarade. Och jag tycker att det blev lite väl “säljigt” ändå.

ChatGPT svarade med ett första utkast.
“Spänn fast säkerhetsbältet” var inte direkt det jag var ute efter.

Som många gånger förut, och som många gånger per dag, behövde jag alltså tänka om. Jag behövde ge ChatGPT lite mer inblick i vad det är vi faktiskt ska göra. Annars gissar den bara för att ha något att skriva och för att det borde stå något om det – vilket förvisso är sant.

Förstår vad den behöver veta först

Jag provade därför att instruera ChatGPT på ett annorlunda sätt – genom att istället be den att först ställa några frågor. Jag skrev inte vilka frågor utan förlitade mig på att ChatGPT själv kan förstå vad den behöver veta för att ge mig det jag förväntar mig.

Jag skrev en ny prompt och fick en lista på frågor jag skulle svara på för att ge ChatGPT lite mer information.

Det funkade bättre och ChatGPT ställde i min mening relevanta frågor och fick således också relevanta svar. Det resulterade i ett utkast jag kände mig mer nöjd med. Jag svarade på frågorna så utförligt och tydligt jag kunde, men försökte hålla det kortfattat. Jag tog också med några textstycken från bland annat rektorsbloggen, andra texter från olika webbplatser och bloggar inom LU för att ChatGPT bättre skulle förstå den tonalitet jag var ute efter. Och för att jag var nyfiken på hur den skulle tolka det.

ChatGPT tackade för det utförliga svaret och gav mig ett nytt förslag. Några få ord utbytta här och där och resultatet blev det välkomnande du fick i början av det här inlägget. Ganska fint, tycker jag. Även om det krävdes lite finputsning från både mig och ChatGPT för att komma dit. Totalt tog det tio minuter. Påtår av kaffe inräknat.

22 september 2023

Inlägget postades i

Textproduktion

Kommentarer

0 Kommentarer Lämna en kommentar

Nyare inlägg