M. Katkus:
https://www.facebook.com/mykolas.kat...4NkZ1XjgKrnb6l
Garsiausių pasaulio kompanijų akcijos dramatiškai krenta (NVIDIA prarado 600 milijardų kompanijos vertės), geopolitikos analitikai krapšto galvas, konkurentai panikuoja, Kinijos ir Rusijos propagandistai džiūgauja – kas čia nutiko su dirbtiniu intelektu?
Nutiko „DeepSeek" – iš Kinijos kvantinės prekybos akcijomis apribotos rizikos fondo išsiskleidęs DI modelis, pristatytas dar gruodį. Po testų paaiškėjo, kad „DeepSeek" nenusileidžia arba lenkia beveik visus galingiausius DI modelius ir nusileidžia tik pačiam galingiausiam – naujam „OpenAI" modeliui o1. Tačiau skirtingai nuo jo, „DeepSeek" yra visiškai atviras, savo sistemas vystančios kompanijos jį gali atsisiųsti ir susikonfigūruoti taip, kaip jiems reikia.
Nemokamų, įvairių verslų programuotojams skirtų modelių rinkoje iki tol pirmavo galybę pinigų suinvestavusi „Facebook" savininkė „Meta". Silicio slėnio metraštininkai „The Information" vakar pranešė, kad „Meta" veikia panikos režimu – kompanijos tyrėjai mėgina suprasti, kaip juos ir kitus JAV galiūnus sugebėjo aplenkti niekam nežinoma Kinijos bendrovė. Svarbiausia – ne šiaip sau aplenkti, bet padaryti tai su nepalyginti mažesnėmis sąnaudomis. Paskutinis „Meta" išleistas LLAMA DI modelis buvo treniruojamas 16 000 sujungtų mikroprocesorių. Juos aplenkusiems kinams užteko vos 2000 žemesnės galios procesorių.
Dar prieš mėnesį buvo visuotinai manoma, kad JAV turi didžiulį pranašumą DI srityje prieš kinus (ir, žinoma, europiečius, kurių DI kūrėjai arba persikvalifikuoja, arba maitinasi valstybinėmis lėšomis). Dar pirmoje Trumpo kadencijoje prasidėjęs Kinijos technologijų kompanijų dusinimas Bideno laikais įgavo pagreitį – JAV uždraudė kompanijoms pristatinėti kiniečiams naujausius mikročipus. Dirbtinis intelektas potencialiai yra toks pat pavojingas kaip atominis ginklas – tokia metafora besivadovaujantys amerikiečiai iš esmės atribojo kiniečius nuo moderniausių NVIDIA čipų – kompanija net pagamino specialiai sankcionuotoms šalims skirtas žemesnės kokybės produktus.
Čipų paranoja neseniai pasiekė net ir mus – gal girdėjote, kad Lietuva nebuvo įtraukta į šalių, kurios turi teisę gauti naujausias skaičiavimo sistemas, sąrašą (ne tai, kad čia pas mus kažkas labai daug ką treniruotų). Logika paprasta – DI reikalauja daug galios (ir energetikos išteklių). Išlaikydama geriausius savo rankose, JAV užsitikrina ilgalaikį dominavimą ne tik savo verslui, bet ir karybos pramonei. Čipai po truputį tapo naująja nafta – strateginiu ištekliumi, skiriančiu JAV sąjungininkus nuo likusio pasaulio. Antrą Trumpo inauguracijos dieną jis pompastiškai pristatė „Stargate" – „OpenAI", „SoftBank" ir „Oracle" iniciatyvą investuoti 500 milijardų dolerių į DI treniravimą.
Pasirodo, treniruoti galima ir daug pigiau, ir paprasčiau. Kaip tai pavyko kinams (prastesnius, tačiau visai neblogus rezultatus rodo ir kitos Kinijos technologijų kompanijos – „Alibaba" sukurtas pokalbių dirbtinis intelektas) – kol kas nėra aišku. „OpenAI" vadovas Sam Altman savo įrašuose užsimena apie kopijavimą – yra mažai abejotina, kad savo modelio tikslumą „DeepSeek" stipriai pagerino naudodamas konkurentų produkciją. Panagrinėję jų modelį, duomenų mokslininkai rado ir kelias inovacijas, kurios leido jiems 20 kartų sumažinti brangių procesorių poreikį ir greičiau atrasti teisingus atsakymus. Ne tik „Meta", bet ir „OpenAI", „Anthropic", „Google" ir Elono Musko „Grok" dabar mėgina šias inovacijas panaudoti ir savo modelių treniravimui.
Tai turi labai daug įvairių pasekmių. Pirma, verslas – stipriai kris DI modelių kainos, vadinasi, juos pritaikyti bus galima greičiau ir paprasčiau. Iki šiol buvo manyta, kad DI bus kaip „Google" paieška – natūrali monopolija (ar bent oligopolija), kurią įveikti beveik neįmanoma, nes modelių treniravimas kainuos per daug ir pasivyti lyderius – tarkim, „OpenAI" – neapsimokės net labai turtingoms kompanijoms. „DeepSeek" parodė, kad DI pažanga dar nėra baigta ir su daug mažiau pinigų galima treniruoti – ar nukopijuoti – net ir pačius galingiausius modelius. Tai geros naujienos visiems dabar spurtuojantiems taikomojo DI kūrėjams (mūsų „Repsense" naudojasi keliais modeliais, kurių kainos turėtų kristi; čia gera naujiena ir neseniai pristatytam Lietuvos startuoliui „Nexus").
Antra, rinkos ir investavimas. DI bumas iškėlė daugelio DI vystymą pradėjusių technologijų bendrovių akcijų kainas. Dabar ateitis nebeatrodo tokia aiški. Ypač tai paveiks gamintojų vertės grandinę – NVIDIA, TSMC, ASML, Siemens – atrodė, kad jų čipų paklausa beveik neribota, dabar tuo jau niekas nebėra tikras. Jei čipų reikia mažiau – reikės mažiau ir energijos. Net ir trumpalaikis stabtelėjimas nutrauks didįjį technologijų akcijų kilimą, ambicingiems projektams (tokiems kaip „Stargate") gali būti sunkiau pritraukti didžiules investuotojų lėšas.
Trečia, geopolitika. JAV susiruošė būti didžiausia DI supervalstybe, tačiau dabar realu, kad Kinija turi kuo atsakyti. „The Economist" apžvelgia, kad pastaruoju metu atotrūkis tarp Kinijos ir JAV technologijų srityje sumažėjo ir JAV reikės daug atsargiau elgtis su pažanga suinteresuotomis trečiosiomis šalimis – tarkim, Indija – nes jos turės ne tokių jau blogų alternatyvų. Akivaizdu, kad eksporto ribojimai tęsis toliau (sakoma, kad „DeepSeek" taip sėkmingai ištreniravo savo modelį tik todėl, kad jos akcininkas dar iki sankcijų sukaupė naujausių NVIDIA čipų sandėlį), tačiau realu, kad naujausių modelių kopijavimo (arba DI kontekste „distiliavimo") tai gali ir nesustabdyti.
JAV DI pažanga nuo to sustoti neturėtų – jei kinai išties distiliavo naujausią „OpenAI" modelį, ši kompanija neturi jokio pagrindo keisti savo strategijos. Tačiau tai stipriai paveiks pasaulį. Reaguos ir politika.
Nutiko „DeepSeek" – iš Kinijos kvantinės prekybos akcijomis apribotos rizikos fondo išsiskleidęs DI modelis, pristatytas dar gruodį. Po testų paaiškėjo, kad „DeepSeek" nenusileidžia arba lenkia beveik visus galingiausius DI modelius ir nusileidžia tik pačiam galingiausiam – naujam „OpenAI" modeliui o1. Tačiau skirtingai nuo jo, „DeepSeek" yra visiškai atviras, savo sistemas vystančios kompanijos jį gali atsisiųsti ir susikonfigūruoti taip, kaip jiems reikia.
Nemokamų, įvairių verslų programuotojams skirtų modelių rinkoje iki tol pirmavo galybę pinigų suinvestavusi „Facebook" savininkė „Meta". Silicio slėnio metraštininkai „The Information" vakar pranešė, kad „Meta" veikia panikos režimu – kompanijos tyrėjai mėgina suprasti, kaip juos ir kitus JAV galiūnus sugebėjo aplenkti niekam nežinoma Kinijos bendrovė. Svarbiausia – ne šiaip sau aplenkti, bet padaryti tai su nepalyginti mažesnėmis sąnaudomis. Paskutinis „Meta" išleistas LLAMA DI modelis buvo treniruojamas 16 000 sujungtų mikroprocesorių. Juos aplenkusiems kinams užteko vos 2000 žemesnės galios procesorių.
Dar prieš mėnesį buvo visuotinai manoma, kad JAV turi didžiulį pranašumą DI srityje prieš kinus (ir, žinoma, europiečius, kurių DI kūrėjai arba persikvalifikuoja, arba maitinasi valstybinėmis lėšomis). Dar pirmoje Trumpo kadencijoje prasidėjęs Kinijos technologijų kompanijų dusinimas Bideno laikais įgavo pagreitį – JAV uždraudė kompanijoms pristatinėti kiniečiams naujausius mikročipus. Dirbtinis intelektas potencialiai yra toks pat pavojingas kaip atominis ginklas – tokia metafora besivadovaujantys amerikiečiai iš esmės atribojo kiniečius nuo moderniausių NVIDIA čipų – kompanija net pagamino specialiai sankcionuotoms šalims skirtas žemesnės kokybės produktus.
Čipų paranoja neseniai pasiekė net ir mus – gal girdėjote, kad Lietuva nebuvo įtraukta į šalių, kurios turi teisę gauti naujausias skaičiavimo sistemas, sąrašą (ne tai, kad čia pas mus kažkas labai daug ką treniruotų). Logika paprasta – DI reikalauja daug galios (ir energetikos išteklių). Išlaikydama geriausius savo rankose, JAV užsitikrina ilgalaikį dominavimą ne tik savo verslui, bet ir karybos pramonei. Čipai po truputį tapo naująja nafta – strateginiu ištekliumi, skiriančiu JAV sąjungininkus nuo likusio pasaulio. Antrą Trumpo inauguracijos dieną jis pompastiškai pristatė „Stargate" – „OpenAI", „SoftBank" ir „Oracle" iniciatyvą investuoti 500 milijardų dolerių į DI treniravimą.
Pasirodo, treniruoti galima ir daug pigiau, ir paprasčiau. Kaip tai pavyko kinams (prastesnius, tačiau visai neblogus rezultatus rodo ir kitos Kinijos technologijų kompanijos – „Alibaba" sukurtas pokalbių dirbtinis intelektas) – kol kas nėra aišku. „OpenAI" vadovas Sam Altman savo įrašuose užsimena apie kopijavimą – yra mažai abejotina, kad savo modelio tikslumą „DeepSeek" stipriai pagerino naudodamas konkurentų produkciją. Panagrinėję jų modelį, duomenų mokslininkai rado ir kelias inovacijas, kurios leido jiems 20 kartų sumažinti brangių procesorių poreikį ir greičiau atrasti teisingus atsakymus. Ne tik „Meta", bet ir „OpenAI", „Anthropic", „Google" ir Elono Musko „Grok" dabar mėgina šias inovacijas panaudoti ir savo modelių treniravimui.
Tai turi labai daug įvairių pasekmių. Pirma, verslas – stipriai kris DI modelių kainos, vadinasi, juos pritaikyti bus galima greičiau ir paprasčiau. Iki šiol buvo manyta, kad DI bus kaip „Google" paieška – natūrali monopolija (ar bent oligopolija), kurią įveikti beveik neįmanoma, nes modelių treniravimas kainuos per daug ir pasivyti lyderius – tarkim, „OpenAI" – neapsimokės net labai turtingoms kompanijoms. „DeepSeek" parodė, kad DI pažanga dar nėra baigta ir su daug mažiau pinigų galima treniruoti – ar nukopijuoti – net ir pačius galingiausius modelius. Tai geros naujienos visiems dabar spurtuojantiems taikomojo DI kūrėjams (mūsų „Repsense" naudojasi keliais modeliais, kurių kainos turėtų kristi; čia gera naujiena ir neseniai pristatytam Lietuvos startuoliui „Nexus").
Antra, rinkos ir investavimas. DI bumas iškėlė daugelio DI vystymą pradėjusių technologijų bendrovių akcijų kainas. Dabar ateitis nebeatrodo tokia aiški. Ypač tai paveiks gamintojų vertės grandinę – NVIDIA, TSMC, ASML, Siemens – atrodė, kad jų čipų paklausa beveik neribota, dabar tuo jau niekas nebėra tikras. Jei čipų reikia mažiau – reikės mažiau ir energijos. Net ir trumpalaikis stabtelėjimas nutrauks didįjį technologijų akcijų kilimą, ambicingiems projektams (tokiems kaip „Stargate") gali būti sunkiau pritraukti didžiules investuotojų lėšas.
Trečia, geopolitika. JAV susiruošė būti didžiausia DI supervalstybe, tačiau dabar realu, kad Kinija turi kuo atsakyti. „The Economist" apžvelgia, kad pastaruoju metu atotrūkis tarp Kinijos ir JAV technologijų srityje sumažėjo ir JAV reikės daug atsargiau elgtis su pažanga suinteresuotomis trečiosiomis šalimis – tarkim, Indija – nes jos turės ne tokių jau blogų alternatyvų. Akivaizdu, kad eksporto ribojimai tęsis toliau (sakoma, kad „DeepSeek" taip sėkmingai ištreniravo savo modelį tik todėl, kad jos akcininkas dar iki sankcijų sukaupė naujausių NVIDIA čipų sandėlį), tačiau realu, kad naujausių modelių kopijavimo (arba DI kontekste „distiliavimo") tai gali ir nesustabdyti.
JAV DI pažanga nuo to sustoti neturėtų – jei kinai išties distiliavo naujausią „OpenAI" modelį, ši kompanija neturi jokio pagrindo keisti savo strategijos. Tačiau tai stipriai paveiks pasaulį. Reaguos ir politika.
Comment