Oei, was dat echt onze minister-president Rutte??
Was dat echt onze minister-president Rutte in die video waarin hij zei dat hij de waarheid sprak? Nee dus! Maar het leek wel echt en het leidde ook tot een rel op Twitter. Het was een realistische deepfake video die vervolgens razendsnel van het internet werd afgehaald.
Kunstmatige intelligentie gaat een steeds grotere rol spelen onze dagelijkse communicatie. Meestal hebben we het over AI en dat staat voor artificial intelligence. Onze communicatie wordt meer en meer beheerst door AI. De mogelijkheden lijken eindeloos en niet meer te stoppen. Daarover gaat dit artikel.
Het lijkt allemaal zo makkelijk, maar eigenlijk is AI heel bijzonder. Een computerprogramma levert via deep learning processen ongekende prestaties. Deze programma’s zijn niet alleen nuttig of leuk, maar er zitten ook misbruikrisico’s aan vast. En er komen snel nieuwe programma’s bij.
Wat merken we daar nu eigenlijk van? Een snelle top 5-4-3-2-1 van de actuele mogelijkheden op communicatiegebied. En deze top 5 is zeker niet volledig.
Spraakherkenningsprogramma’s
Niet het meest spannende, maar wel heel erg nuttig voor je productiviteit. Automatic speech recognition (ASR) begon met kleine stapjes. Ingesproken woorden werden in een traag tempo omgezet naar digitale tekst. Al snel volgden hele zinnen. Inmiddels kunnen we met transcriptiesoftware hele verhalen dicteren en onze computer maakt er in een mum van tijd een vrijwel kant-en-klaar document van. Met een accuratesse van boven de 90%, meertalige mogelijkheden en snelheid levert dit een enorme boost aan je productiviteit op.
Spraakopdrachten
Tegenwoordig maken we dagelijks gebruik van spraakopdrachten: zo bedienen we het navigatiesysteem in onze auto en zetten we Google of Siri aan het werk met onze gesproken zoekopdrachten.
Kun jij Chinees spreken?
Ook op het gebied van automatisch vertalen zijn er dankzij AI grote stappen gezet: een gesproken woord in de ene taal kan door een combinatie van digitale spraak en vertaalmachine worden omgezet naar een gesproken woord in een andere taal. Voorlopig is dit nog in een beperkt aantal talen beschikbaar.
Via end-to-end (E2E) learning leert dit complexe vertaalprogramma nog sneller dan via de klassieke deep learning. E2E combineert namelijk onderliggende deep learning processen tot één deep learning proces.
Met Google Duplex naar de kapper
Google een afspraak bij de kapper laten maken? Het kan met Google Duplex! Met realistische expressies van emoties, zoals ‘uhm’ en ‘mmm’, herken je niet dat dit een sprekend computerprogramma is.
Kun je de link niet openen? Klik dan hier.
Deep learning spraakgebied
Draadje los? Het is gelukt om signalen rechtstreeks uit het spraakgebied in de hersenen om te zetten naar spraak. Een deep learning programma leert uit welk hersengebied voorgelezen zinnen afkomstig zijn. De computer slaagde erin om verstaanbare zinnen te produceren. Het zou prachtig zijn als mensen die fysiek niet meer kunnen spreken dat alsnog via een spraakcomputer kunnen. Hoe snel dit realiteit wordt, is natuurlijk de grote vraag, maar de huidige resultaten bieden perspectief.
Wifi in je hoofd?
De bekende Amerikaanse ondernemer Elon Musk ontwikkelt via zijn bedrijf Neuralink producten om het menselijk brein direct met een computer te verbinden. Deze techniek zou op termijn voor iedereen toegankelijk en betaalbaar moeten zijn. Het is de bedoeling dat gebruikers via een elektrodenimplantaat een computer kunnen bedienen met hun gedachten, de zogenoemde brainmachine interfaces (BMIs).
“Ik ben even offline!”
Fotoherkenning
Computervision is een wetenschapsgebied dat zich bezighoudt met hoe computers op hoog niveau inzicht kunnen krijgen in digitale afbeeldingen of video’s. Met grote hoeveelheden ingevoerde data kan een krachtig computersysteem zelfstandig foto’s analyseren en de afgebeelde onderwerpen benoemen. Door deep learning gaat dit steeds beter en uitgebreider. De computer kijkt pixel voor pixel, waar weer eentjes en nullen achter schuilgaan.
Big data en data mining
Ook gezichtsuitdrukkingen en andere fotodetails kunnen digitaal geïdentificeerd worden. Ze zijn daardoor “verzamelbaar”. En dan kom je gelijk bij big data. Big business, want verzamelde data kan verkocht worden. Niet alleen voor commerciële of wetenschappelijke doeleinden, maar ook voor politieke of criminele doeleinden.
Afbeeldingen kun je dan natuurlijk ook gaan selecteren op andere criteria, zoals politieke of religieuze uitingen of op uiterlijk. Een vlag, een kruisje, keppeltje of hoofddoek, een korte broek, een minirok, een bikini, kaplaarzen, kleur haar enzovoort. Het filteren van afbeeldingen zal steeds verfijnder worden. En daarmee ook het gebruik ervan.
Denk aan datamining waarbij ingewikkelde statistische verbanden tussen verschillende gegevensverzamelingen worden gevonden. Wie kan er bij deze data en wat wordt ermee gedaan?
Lachende Mona Lisa
Dit is leuk! Oude foto’s of portretten op schilderijen komen tot leven. Een deep learning algoritme brengt gezichten op een stilstaande afbeelding tot leven. Ogen bewegen en er ontstaat een videobeeld van de persoon. Je overgrootouders stonden bloedserieus op de foto, maar nu verschijnt er opeens emotie op hun gezicht! De app Deep Nostalgia is niet voor niets in korte tijd enorm populair geworden.
Leuke voorbeelden vind je in dit artikel van de NOS over bewegende animaties van mensen op oude foto’s of schilderijen die gemaakt zijn met de tool Deep Nostalgia van de app MyHeritage. De app is een grote hit op dit moment. Wil je Mona Lisa zien lachen?
“Simpele” deepfake video’s: duidelijk nep
Kunstmatige intelligentie beperkt zich niet tot stilstaande beelden. Met AI kun je een deepfake video maken. Deepfake is een samentrekking van deep learning en fake. De betekenis ervan is inmiddels duidelijk: bij een deepfake video lijkt het alsof de gebruikte persoon zelf iets zegt of doet, maar de beelden zijn kunstmatig geproduceerd. Een ander lichaam onder iemands hoofd, het bewerken van iemands gezichtsuitdrukking en hem andere woorden laten zeggen. Meestal zie je nog wel dat het om een nepvideo gaat, omdat de gesproken tekst grappig is of duidelijk niet past bij het personage.
Oorspronkelijk zag je deze techniek vooral in de geavanceerde filmindustrie. Inmiddels is het maken van deepfake video’s ook toegankelijk voor het gewone publiek. Met Wombo.ai kun je hele grappige bewegende beelden effecten creëren. Kies een foto en laat de geportretteerde een liedje zingen.
Royal fake 👑
Hier zie je Queen Elisabeth in een deepfake video, wat leidde tot grote discussies in Groot-Brittannië.
Niet van echt te onderscheiden deepfakes
Maar het maken van deepfake video’s kan nóg geavanceerder. En daarom staat de serious deepfake video hier op nummer 1! Deze video’s zijn superrealistisch. De gezichtsuitdrukkingen, de bewegingen en de gesproken teksten lijken te kloppen. En ook iemands stem kan exact nagebootst worden. De recente video van Mark Rutte kwam daarmee aardig in de buurt.
En wie over de techniek beschikt, kan nog een stapje verder gaan: je kunt een fakepersonage in een video gelijktijdig precies hetzelfde laten zeggen of dezelfde bewegingen laten maken als de bronpersoon! De bronpersoon bestuurt de fakepersonage alsof het een marionet is. Een nieuwe ontwikkeling is dat zulke geavanceerde deepfake video’s zelfs live gemaakt kunnen worden.
Enkele Tweede Kamerleden werden onlangs in verwarring gebracht door een deepfake video. Ze waren ervan overtuigd dat ze met een vertegenwoordiger van de Russische oppositie hadden gesproken. Maar dit bleek bedrog. Het is gissen wie er achter deze video zit en de politieke gevolgen van misleiding kunnen echt gevaarlijk worden.
Het is niet toegestaan om zonder toestemming andermans identiteit te gebruiken. Maar dat sluit misbruik niet uit. Met een realistische deepfake video kunnen mensen beschadigd worden. En er kan ook fake nieuws mee worden gemaakt: ‘deepfake nieuws’. Kijkers weten niet meer wat echt is en worden daardoor in verwarring gebracht.
Nederlandse wetenschappers hebben een techniek ontwikkeld om deepfakevideo’s van echte video’s te onderscheiden. Dit kan een uitkomst bieden in vervelende situaties. Hoe het werkt, wordt begrijpelijkerwijs strikt geheim gehouden!
Goed of slecht?
De meeste van de genoemde communicatiemiddelen hebben zeker een toegevoegde waarde. Met spraakcommando’s vind je snel de weg of je bestuurt er je domotica mee. Handig als je dankzij een vertaalprogramma opeens Chinees kunt spreken! En het is best grappig om je vriend online het smurfenlied te laten zingen. Computerimplantaten kunnen medische oplossingen aanreiken. Of het fijn is om met een “printplaatje” in je hoofd te lopen, daar komen we nog wel achter.
Maar wie wil zichzelf op internet tegenkomen in een discutabele nepvideo? Wat voor impact zou dat hebben op jou en op je omgeving? Het gebeurt helaas al wel en de gevolgen voor de slachtoffers kunnen ernstig zijn. Geavanceerde deepfake video’s kunnen een flinke impact hebben op personen en zelfs op onze maatschappij. Het wordt steeds lastiger om echt van namaak te onderscheiden en om jezelf te beschermen tegen misbruik van deze technieken. We zullen hier ongetwijfeld nog meer mee te maken krijgen. Dus… let op “jezelf”!
© Cintaxis.nl
Dit artikel bevat de mening van de auteur. Aan deze tekst kunnen geen verdere rechten worden ontleend. Niets uit deze tekst mag worden gekopieerd of gepubliceerd, tenzij met toestemming van de auteur.
Jouw verhaal op papier zetten? Neem contact op met Cintaxis Communicatie!