Viskas apie naująjį Sora neuroninį tinklą iš OpenAI

Viskas apie naująjį Sora neuroninį tinklą iš OpenAI

Neuroniniai tinklai tapo mūsų gyvenimo ir darbo dalimi. Jie naudojami įvairiose pramonės šakose: nuo medicinos iki pramogų pramonės, padeda analizuoti duomenis, numatyti tendencijas, kurti unikalų turinį, kurti prezentacijas ir net diagnozuoti ligas.. 

Technologijų plėtra nesustoja ir vasario 15 dieną OpenAI paskelbė apie savo naują produktą – Sora neuroninį modelį. Šiame straipsnyje mes jums papasakosime daugiau apie „Sora“, kaip ir kam ji gali būti naudinga, kokių privalumų ir trūkumų ji turi.. 

Kas yra Sora

„Sora“ yra sklaidos modelis, generuojantis vaizdo įrašus pagal vartotojo teksto užklausą. Po teksto užklausos pasirodo vaizdo įrašas, panašus į statinį triukšmą, ir palaipsniui jis virsta aiškesniu vaizdu. 

Žemiau pateiktas vaizdo įrašo, kuris buvo paremtas prašymu, pavyzdys: „Filmo apie 30 metų astronauto nuotykius su raudonu vilnos megztu motociklininko šalmu, mėlyną dangų, druskos dykumą, kino stilių, anonsas, nufilmuotas 35 m. mm plėvelė, ryškios spalvos».  

YouTube video


Modelis gali sukurti visą vaizdo įrašą vienu metu, o ne kadrą po kadro, arba padidinti jau baigto vaizdo įrašo trukmę.

„Sora“ gali sukurti sudėtingas scenas su keliais personažais, specifiniais judesių tipais ir tikslia objekto bei fono detale. Modelis supranta ne tik tai, ką vartotojas rašo šablone, bet ir kaip šie dalykai egzistuoja fiziniame pasaulyje.

YouTube video

Kaip veikia Sora

„Sora“ remiasi ankstesniais DALL-E ir GPT modelių tyrimais. Jis naudoja pakartotinio fiksavimo techniką iš DALL-E 3, kad sukurtų aprašomuosius antraštes vaizdiniams duomenims mokyti. Dėl to modelis gali tiksliau sekti vartotojo tekstines instrukcijas sukurtame vaizdo įraše..

Be galimybės kurti vaizdo įrašus tik remiantis tekstu, modelis gali nufotografuoti esamą vaizdą ir sukurti vaizdo įrašą iš nejudančio vaizdo nepraleisdamas smulkių detalių. Sora taip pat gali nufotografuoti esamą vaizdo įrašą ir jį išplėsti arba užpildyti trūkstamus kadrus.

Norėdami sužinoti, kaip optimizuoti sudėtingas ir įprastas užduotis, užsiregistruokite į kursus «Neuroniniai tinklai visiems» internetinėje mokykloje Netology. Per 1,5 mėnesio gausite naujausią informaciją apie neuroninius tinklus ir jų pritaikymą jūsų darbe. 

Kadras su dviem mamutais, sukurtas Sora neuroninio tinklo

Kur naudoti Sora

„Sora AI“ gali būti naudojamas įvairiose srityse. Pavyzdžiui, kino pramonėje sukurti specialiuosius efektus. Neuroninis tinklas gali sukurti sceną, kurioje herojus skrenda ore arba kovoja su monstru, o tai būtų labai sunku padaryti be dirbtinio intelekto.. 

Reklamos srityje AI Sora gali kurti animuotus vaizdo įrašus, žaidimų srityje – tikroviškas scenas ir personažus. Taip pat Sora neuroninis tinklas gali būti naudojamas kuriant mokomąją medžiagą ir pristatymus.

Naujojo neuroninio tinklo galimybės ir apribojimai 

Modelis turi gilų kalbos supratimą, o tai leidžia tiksliai interpretuoti komandas ir generuoti vaizdo įrašus apie žmones, kurie atrodo labai tikroviškai ir išreiškia skirtingas emocijas. „Sora“ taip pat gali sukurti kelis kadrus viename vaizdo įraše, tiksliai išsaugančius vaizdo personažus ir stilių.

„OpenAI“ taip pat pažymėjo, kad dabartinis „Sora“ modelis vis dar turi trūkumų. Šiuo metu ji kovoja su kai kuriais priežasties ir pasekmės atvejais ir kartais nesugeba modeliuoti sudėtingos scenos fizinio tikslumo. Pavyzdžiui, žmogus gali įkąsti sausainį, bet po to ant jo gali nelikti įkandimo žymės..

Ekrano kopija iš Soros sukurto vaizdo įrašo su mergina, einančia gatve

„Sora“ naudojimo saugumas

Šiuo metu modelis nėra prieinamas plačiam vartotojų ratui, su juo dirba „raudonosios komandos“ specialistai, kurie įvertina gaminį žalos ar rizikos požiūriu. Beta versiją gali pasiekti kai kurie kūrybingi profesionalai – skaitmeniniai menininkai, dizaineriai ir kino profesionalai. Jie pateiks atsiliepimus apie tai, kaip tobulinti modelį, kad kūrybingiems profesionalams būtų kuo daugiau naudos.

YouTube video

Rezultatai

„Sora“ yra naujas žingsnis plėtojant dirbtinį intelektą, nes jis leidžia kurti itin detalius ir tikroviškus vaizdo įrašus. Tai atveria naujas galimybes kurti vaizdo įrašus įvairiose srityse, tokiose kaip kinas, vaizdo žaidimai ir virtuali realybė..

YouTube video

Įvertinkite straipsnį

0 / 12

Your page rank:

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *