Naujienų portalas lrytas.lt kartu su inovacijų ir technologijų paroda-konkursu „Technorama 2023“ kviečia balsuoti ir išrinkti inovatyviausią jauno kūrėjo idėją! Daugiausia simpatijų surinkusios idėjos autoriai bus paskelbti ir apdovanoti organizatorių įsteigtais prizais gegužės 25 d. vykstančiame renginyje.
Projekte pagrindinis dėmesys skiriamas dirbtiniu intelektu (DI) grįstos platformos kūrimui, kad vaizdai būtų paverčiami įtraukiančiais aplinkos garsais. Peržiūrėjus esamus sprendimus, metodikas ir duomenų rinkinius, buvo nustatytas tokio įrankio trūkumas rinkoje. Naudojant dirbtinio intelekto technologiją, būtent YOLOv8 modelį, parengtą naudojant OpenImagesV7 duomenų rinkinį, ir sukuriant garso generavimo algoritmą, pagrįstą ESC-50 duomenų rinkiniu, kuris buvo išplėstas rankiniu būdu ištraukiant ir pažymint daugiau klasių, tikslai buvo sėkmingai pasiekti. Sukurta sistema leidžia vartotojams įkelti vaizdus, pritaikyti garso elementus ir išsaugoti sukurtus įrašus, kartu įtraukiant grįžtamojo ryšio mechanizmą, leidžiantį rinkti vartotojų įvertinimus tolesniam sistemos tobulinimui. Apskritai projektas įgyvendina visapusišką sprendimą, kuris sujungia pažangiausias technologijas su į vartotoją orientuotu dizainu, kad būtų galima išgauti garsus iš vaizdų.
26
DALINTIS
Visos teisės saugomos. © 2023 UAB „Lrytas“.