Artwork

Innhold levert av Universitetet i Agder. Alt podcastinnhold, inkludert episoder, grafikk og podcastbeskrivelser, lastes opp og leveres direkte av Universitetet i Agder eller deres podcastplattformpartner. Hvis du tror at noen bruker det opphavsrettsbeskyttede verket ditt uten din tillatelse, kan du følge prosessen skissert her https://no.player.fm/legal.
Player FM - Podcast-app
Gå frakoblet med Player FM -appen!

Julespesial 4: Lyd, bilde og tekst i en algoritme

9:16
 
Del
 

Manage episode 316034425 series 2497947
Innhold levert av Universitetet i Agder. Alt podcastinnhold, inkludert episoder, grafikk og podcastbeskrivelser, lastes opp og leveres direkte av Universitetet i Agder eller deres podcastplattformpartner. Hvis du tror at noen bruker det opphavsrettsbeskyttede verket ditt uten din tillatelse, kan du følge prosessen skissert her https://no.player.fm/legal.

Vi mennesker tar inn mye informasjon samtidig. Når vi for eksempel ser på en film, titter vi på bildene, hører på lyden og kanskje leser teksten, og sammen får vi et mer helhetlig bilde enn hvis vi bare hadde hørt lyden. Kunstig intelligens trenes derimot somoftest opp med bare en type data. I denne episoden tar vi for oss en algoritme som, mot normalt, kombinerer lyd, bilde, og tekst for anda bedre resultater.

Podcasten er en del av en serie hvor vi tar for oss artikler fra konferansen NeurIPS 2021, og denne episoden handler om «VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text» av Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, og Boqing Gong.

  continue reading

143 episoder

Artwork
iconDel
 
Manage episode 316034425 series 2497947
Innhold levert av Universitetet i Agder. Alt podcastinnhold, inkludert episoder, grafikk og podcastbeskrivelser, lastes opp og leveres direkte av Universitetet i Agder eller deres podcastplattformpartner. Hvis du tror at noen bruker det opphavsrettsbeskyttede verket ditt uten din tillatelse, kan du følge prosessen skissert her https://no.player.fm/legal.

Vi mennesker tar inn mye informasjon samtidig. Når vi for eksempel ser på en film, titter vi på bildene, hører på lyden og kanskje leser teksten, og sammen får vi et mer helhetlig bilde enn hvis vi bare hadde hørt lyden. Kunstig intelligens trenes derimot somoftest opp med bare en type data. I denne episoden tar vi for oss en algoritme som, mot normalt, kombinerer lyd, bilde, og tekst for anda bedre resultater.

Podcasten er en del av en serie hvor vi tar for oss artikler fra konferansen NeurIPS 2021, og denne episoden handler om «VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text» av Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, og Boqing Gong.

  continue reading

143 episoder

Alle episoder

×
 
Loading …

Velkommen til Player FM!

Player FM scanner netter for høykvalitets podcaster som du kan nyte nå. Det er den beste podcastappen og fungerer på Android, iPhone og internett. Registrer deg for å synkronisere abonnement på flere enheter.

 

Hurtigreferanseguide

Copyright 2024 | Sitemap | Personvern | Vilkår for bruk | | opphavsrett