– Prieš pusmetį „Meta“ buvo tarp dviejų lyderiaujančių įmonių. Šiuo metu – septintuke ar aštuntuke. Per pastaruosius metus įvyko daug reikšmingų pokyčių: kovo mėnesį „xAI“ pristatė savo „Grok“ modelį, o kiek vėliau „OpenAI“ paskelbė apie naująją „ChatGPT 4.1“ versiją. Tuo tarpu „Meta“ visai neseniai vėl bandė įšokti į lenktynes – gana konservatyviai investuodama apie 100 mln. dolerių į naujausios „LLaMA 4“ modelių šeimos kūrimą. Jie visai neseniai buvo pristatyti, tačiau paaiškėjo, kad jų veikimas neatitiko lūkesčių. Tai buvo skaudus smūgis įmonei, kuri tikėjosi grįžti į pirmąjį trejetuką ar net lyderio poziciją. Kai nepriklausomi ekspertai testavo šiuos modelius standartinėse situacijose, paaiškėjo, kad jie net nepralenkia ankstesnės, trečiosios „LLaMA“ kartos.
– Taigi, „Meta“ šiuo metu susiduria su problemomis šiose DI lenktynėse. Jie patys pripažino, kad pradžioje kilo įvairių sunkumų, bet žada toliau tobulinti savo modelius. Mokymui jie ketina naudoti viešai prieinamus duomenis iš „Facebook“, „Instagram“, netgi „WhatsApp“ ir „Messenger“ – programėlių, kurios yra itin populiarios ir Lietuvoje. Ką galima iš tų duomenų išmokt?
– Esmė – prieiga prie specifinių, autentiškų duomenų, kurie nėra enciklopedinio pobūdžio, kaip „Wikipedia“ straipsniai ar kiti viešai prieinami šaltiniai. Tai yra didžiulis turtas. „Meta“ turi prieigą prie tokių duomenų. Tai reiškia, kad kiekvienas mūsų susirašinėjimas gali būti panaudotas tam, kad bet kokios rekomendacijos taptų itin suasmenintos – juk „Meta“ turi prieigą prie mūsų susirašinėjimų, įvairių socialinės medijos pranešimų. Tokie duomenys leistų kurti labai personalizuotus modelius, kurie galėtų būti gerokai pažangesni.
– Ar tokie modeliai geriau mokėtų kalbas, pavyzdžiui, lietuvių?
– Žinoma. Jei mūsų kalba labai nutolusi nuo normų – pilna anglicizmų, žargonų, įvairių netaisyklingų formų – visi šie blogi įpročiai taip pat pakliūtų į modelių mokymą. Iš dalies tai gali būti naudinga, tačiau kyla ir nemažai kitų problemų.
Visas LNK reportažas – vaizdo įraše:
– Kokios yra tos problemos?
– Privatumo ir etikos problemos. Jei pažvelgtume į Europos Bendrąjį duomenų apsaugos reglamentą, jis aiškiai nurodo, kad asmeniniai duomenys turi būti prieinami pačiam vartotojui, o vartotojas turi turėti teisę būti pamirštas – jo duomenys turi būti ištrinami. Jeigu plačiau pažvelgtume į tokių duomenų naudojimą, gali būti, kad net ir vos kelioms dienoms po produkto paleidimo Europoje grėstų milijardinės baudos dėl privatumo pažeidimų. Be to, verta paminėti, kad nuo vasario 2 d. įsigaliojo Europos dirbtinio intelekto aktas, kuriame apibrėžtos ir draudžiamos veiklos. Tarp jų – biometrinių duomenų bazių rinkimas. Pavyzdžiui, jei turime žmogaus nuotrauką kartu su jo vardu ir pavarde, tai jau gali būti laikoma biometrinių duomenų rinkiniu. Tokių duomenų naudojimas, ypač apmokant dirbtinio intelekto modelius, būtų grubus pažeidimas. Pažeidimas, už kurį gali grėsti net 7 proc. metinės apyvartos bauda.
– Tai iš tiesų labai rimta. Dar man užkliuvo tai, kad bus naudojamas ir „WhatsApp“, ir „Messenger“, kurie abu, bent jau oficialiai, yra pristatomi kaip visiškai šifruotos programėlės. Tai reiškia, kad jei aš jums parašau žinutę per „WhatsApp“, niekas kitas neturėtų žinoti jos turinio – tik jūs ir aš. Duomenys, kurie keliauja tarp mūsų, turėtų būti šifruoti. Tad kyla klausimas – kaip tada dirbtinio intelekto modeliai gali „nuskenuoti“ tokią informaciją?
– Geras klausimas. Detalių nežinome. Viena iš galimų versijų – stebimi mūsų susirašinėjimo įpročiai. Kitaip tariant, naudojami ne konkretūs žinučių tekstai, o vadinamieji metaduomenys. Pavyzdžiui, ar esame linkę trumpai atsakyti ir daugiau nereaguoti, ar mėgstame susirašinėti ilgai. Taip galima gauti ne žinučių turinį, bet informaciją apie vartotojo elgseną – kaip dažnai jis bendrauja, kokiu paros metu tai daro ir panašiai. O tokie duomenys gali būti naudojami personalizuojant įvairius sprendimus.
– „Meta“ teigia, kad vartotojai galės pasirinkti – sutikti arba nesutikti, kad jų duomenys būtų naudojami modelių mokymui. Ką būtų protinga pasirinkti?
– Aš manau, kad tikrai verta nesutikti. Pirmiausia todėl, kad modeliai ir taip bus tobulinami, net jei nesutiksite. Tačiau sutikus, atiduodame labai daug privačios informacijos – net jei, atrodytų, nieko slapto neparašome. Vien jau tas faktas, kad nebeturime jokios autorinės teisės į savo susirašinėjimus, yra labai skaudus.
Naujausi komentarai