Skelbimas

**Lettered** · 2025.01.28, 12:43

M. Katkus:

Garsiausių pasaulio kompanijų akcijos dramatiškai krenta (NVIDIA prarado 600 milijardų kompanijos vertės), geopolitikos analitikai krapšto galvas, konkurentai panikuoja, Kinijos ir Rusijos propagandistai džiūgauja – kas čia nutiko su dirbtiniu intelektu?
Nutiko „DeepSeek" – iš Kinijos kvantinės prekybos akcijomis apribotos rizikos fondo išsiskleidęs DI modelis, pristatytas dar gruodį. Po testų paaiškėjo, kad „DeepSeek" nenusileidžia arba lenkia beveik visus galingiausius DI modelius ir nusileidžia tik pačiam galingiausiam – naujam „OpenAI" modeliui o1. Tačiau skirtingai nuo jo, „DeepSeek" yra visiškai atviras, savo sistemas vystančios kompanijos jį gali atsisiųsti ir susikonfigūruoti taip, kaip jiems reikia.
Nemokamų, įvairių verslų programuotojams skirtų modelių rinkoje iki tol pirmavo galybę pinigų suinvestavusi „Facebook" savininkė „Meta". Silicio slėnio metraštininkai „The Information" vakar pranešė, kad „Meta" veikia panikos režimu – kompanijos tyrėjai mėgina suprasti, kaip juos ir kitus JAV galiūnus sugebėjo aplenkti niekam nežinoma Kinijos bendrovė. Svarbiausia – ne šiaip sau aplenkti, bet padaryti tai su nepalyginti mažesnėmis sąnaudomis. Paskutinis „Meta" išleistas LLAMA DI modelis buvo treniruojamas 16 000 sujungtų mikroprocesorių. Juos aplenkusiems kinams užteko vos 2000 žemesnės galios procesorių.
Dar prieš mėnesį buvo visuotinai manoma, kad JAV turi didžiulį pranašumą DI srityje prieš kinus (ir, žinoma, europiečius, kurių DI kūrėjai arba persikvalifikuoja, arba maitinasi valstybinėmis lėšomis). Dar pirmoje Trumpo kadencijoje prasidėjęs Kinijos technologijų kompanijų dusinimas Bideno laikais įgavo pagreitį – JAV uždraudė kompanijoms pristatinėti kiniečiams naujausius mikročipus. Dirbtinis intelektas potencialiai yra toks pat pavojingas kaip atominis ginklas – tokia metafora besivadovaujantys amerikiečiai iš esmės atribojo kiniečius nuo moderniausių NVIDIA čipų – kompanija net pagamino specialiai sankcionuotoms šalims skirtas žemesnės kokybės produktus.
Čipų paranoja neseniai pasiekė net ir mus – gal girdėjote, kad Lietuva nebuvo įtraukta į šalių, kurios turi teisę gauti naujausias skaičiavimo sistemas, sąrašą (ne tai, kad čia pas mus kažkas labai daug ką treniruotų). Logika paprasta – DI reikalauja daug galios (ir energetikos išteklių). Išlaikydama geriausius savo rankose, JAV užsitikrina ilgalaikį dominavimą ne tik savo verslui, bet ir karybos pramonei. Čipai po truputį tapo naująja nafta – strateginiu ištekliumi, skiriančiu JAV sąjungininkus nuo likusio pasaulio. Antrą Trumpo inauguracijos dieną jis pompastiškai pristatė „Stargate" – „OpenAI", „SoftBank" ir „Oracle" iniciatyvą investuoti 500 milijardų dolerių į DI treniravimą.
Pasirodo, treniruoti galima ir daug pigiau, ir paprasčiau. Kaip tai pavyko kinams (prastesnius, tačiau visai neblogus rezultatus rodo ir kitos Kinijos technologijų kompanijos – „Alibaba" sukurtas pokalbių dirbtinis intelektas) – kol kas nėra aišku. „OpenAI" vadovas Sam Altman savo įrašuose užsimena apie kopijavimą – yra mažai abejotina, kad savo modelio tikslumą „DeepSeek" stipriai pagerino naudodamas konkurentų produkciją. Panagrinėję jų modelį, duomenų mokslininkai rado ir kelias inovacijas, kurios leido jiems 20 kartų sumažinti brangių procesorių poreikį ir greičiau atrasti teisingus atsakymus. Ne tik „Meta", bet ir „OpenAI", „Anthropic", „Google" ir Elono Musko „Grok" dabar mėgina šias inovacijas panaudoti ir savo modelių treniravimui.
Tai turi labai daug įvairių pasekmių. Pirma, verslas – stipriai kris DI modelių kainos, vadinasi, juos pritaikyti bus galima greičiau ir paprasčiau. Iki šiol buvo manyta, kad DI bus kaip „Google" paieška – natūrali monopolija (ar bent oligopolija), kurią įveikti beveik neįmanoma, nes modelių treniravimas kainuos per daug ir pasivyti lyderius – tarkim, „OpenAI" – neapsimokės net labai turtingoms kompanijoms. „DeepSeek" parodė, kad DI pažanga dar nėra baigta ir su daug mažiau pinigų galima treniruoti – ar nukopijuoti – net ir pačius galingiausius modelius. Tai geros naujienos visiems dabar spurtuojantiems taikomojo DI kūrėjams (mūsų „Repsense" naudojasi keliais modeliais, kurių kainos turėtų kristi; čia gera naujiena ir neseniai pristatytam Lietuvos startuoliui „Nexus").
Antra, rinkos ir investavimas. DI bumas iškėlė daugelio DI vystymą pradėjusių technologijų bendrovių akcijų kainas. Dabar ateitis nebeatrodo tokia aiški. Ypač tai paveiks gamintojų vertės grandinę – NVIDIA, TSMC, ASML, Siemens – atrodė, kad jų čipų paklausa beveik neribota, dabar tuo jau niekas nebėra tikras. Jei čipų reikia mažiau – reikės mažiau ir energijos. Net ir trumpalaikis stabtelėjimas nutrauks didįjį technologijų akcijų kilimą, ambicingiems projektams (tokiems kaip „Stargate") gali būti sunkiau pritraukti didžiules investuotojų lėšas.
Trečia, geopolitika. JAV susiruošė būti didžiausia DI supervalstybe, tačiau dabar realu, kad Kinija turi kuo atsakyti. „The Economist" apžvelgia, kad pastaruoju metu atotrūkis tarp Kinijos ir JAV technologijų srityje sumažėjo ir JAV reikės daug atsargiau elgtis su pažanga suinteresuotomis trečiosiomis šalimis – tarkim, Indija – nes jos turės ne tokių jau blogų alternatyvų. Akivaizdu, kad eksporto ribojimai tęsis toliau (sakoma, kad „DeepSeek" taip sėkmingai ištreniravo savo modelį tik todėl, kad jos akcininkas dar iki sankcijų sukaupė naujausių NVIDIA čipų sandėlį), tačiau realu, kad naujausių modelių kopijavimo (arba DI kontekste „distiliavimo") tai gali ir nesustabdyti.
JAV DI pažanga nuo to sustoti neturėtų – jei kinai išties distiliavo naujausią „OpenAI" modelį, ši kompanija neturi jokio pagrindo keisti savo strategijos. Tačiau tai stipriai paveiks pasaulį. Reaguos ir politika.

https://www.facebook.com/mykolas.kat...4NkZ1XjgKrnb6l

**John** · 2025.01.28, 12:50

Katkus, pasirodo, yra ir AI bei čipų industrijos ekspertas. Nu nu

**Lettered** · 2025.01.28, 13:00

Parašė John Rodyti pranešimą

Katkus, pasirodo, yra ir AI bei čipų industrijos ekspertas. Nu nu

Taigi turi įkūręs AI startupą, tai kažką manau išmano.

**John** · 2025.01.28, 13:06

"Kažką" jis apie daug ką išmano. Gerai, kita vertus, turbūt išmano tik pliurpimą iš lempos.

**Taj Mahal** · 2025.01.28, 13:11

Parašė John Rodyti pranešimą

Panašūs saviguodos coping mechanizmai apie tai, kaip "kinai nieko neišrado" ir "nieko gero nepagamins" buvo ir dėl kinietiškų EV, anksčiau dėl telefonų ir dėl eilės kitų dalykų. Praktika rodo, kad tokie saviguodos mechanizmai nėra labai perspektyvūs.

Spot on.

Visas DeepSeek R1 yra open source.
Ir dar priedo open weights.
Ir dar priedo detaliai aprašytas visas training procesas.

Tai viską gali pasikartoti pats, dėl ko "pavogė" ar "treniravo ant nelegaliai turimų plokščių" neskamba rimtai.

Visa šita:

Yra tik niuansas, kad sklinda informacija, jog Kinai nieko neišrado, o ištreniravo ant tų pačių šimtų tūkstančių NVIDIA plokščių, kurias gavo ir turi nelegaliai. Todėl to neskelbia niekur ir vaidina, kad šimtus Gb užimančius modelius ištreniravo vos ant laptopų. Ir negana to, treniravimui naudojo OpenAI generuojamus rezultatus (kinų modelis, užspaustas, sako, kad negali pateikti atsakymų dėl OpenAI politikos).

Yra saviguodos coping mechanizmas.

**Edd** · 2025.01.28, 14:32

Parašė Dundorfas Rodyti pranešimą

Na AI bubble turėjo kažkada subliukšti, tam reikėjo kokios kibirkšties. Turėtu po kokių metu - 2 iškilti AI 2.0

, jei čia bus tas esminis kritimas
O šiap jei KInija paiima dar ir AI pirmenybe, didėja šansas būtų atiduotiems Rusijos chanatui, katras būtų po Padangių imperija.

Man tokios kalbos kaip "AI burbulo subliuškimas" skamba maždaug taip pat kaip kas nors prieš 30 metų sakytų "anksčiau ar vėliau subliukš interneto burbulas". Viskas tik prasideda, kuo toliau tuo daugiau naudosim visur tą AI, sunku surasti tokią sritį kur AI negalima būtų panaudoti ir dar mums toli iki to kad visur naudotume. Jei Deepseek pavyko viską padaryti sąžiningai ir dar viską opensourcino, tai čia ne AI burbulo subliuškimas, o priešingai - proveržis. Nebent turi omeny ne apskritai AI perspektyvas, o tokius dalykus kaip kad tarkim trumpalaikėj perspektyvoj buvo išpūstos kokios nors AI kompanijų akcijos, ar "AI" žodelis kišamas visur kur iš tiesų nėra jokio AI...

Dėl Kinijos vs Amerikos. Yra du variantai:

1. Kiniečiai meluoja ir iš tiesų turi užsipirkę daug daugiau ir galingesnių GPU kuriuos panaudojo modelio apmokymams.
2. Nemeluoja, pasiekė tokių rezultatų su mažesniais resursais. Šiuo atveju tai reiškia kad pritaikius tuos pačius metodus su daugiau/galingesnių GPU kuriuos turi JAV kompanijos bus galima apmokyti dar geresnius modelius. Beje, reikia turėti omeny kad jau išleidžiamas OpenAI o3 modelis, Deepseek R1 yra maždaug o1 lygio, kas aišku bet kokiu atveju įspūdinga. Šiuo atveju Kinija padarė klaidą kad viską opensourcino, nes JAV galės pasinaudoti ir tiesiog apmokyti dar geresnius modelius ant savo galingesnio hardwaro.

Ar kiniečiai meluoja ar ne, neužilgo paaiškės, nes jau ne viena kompanija bando atkartoti Deepseek žingsnius apmokydami savo modelius.

**nnm** · 2025.01.28, 14:44

Parašė Edd Rodyti pranešimą

Man tokios kalbos kaip "AI burbulo subliuškimas" skamba maždaug taip pat kaip kas nors prieš 30 metų sakytų "anksčiau ar vėliau subliukš interneto burbulas". Viskas tik prasideda, kuo toliau tuo daugiau naudosim visur tą AI, sunku surasti tokią sritį kur AI negalima būtų panaudoti ir dar mums toli iki to kad visur naudotume.

Tai kad DI plėtosis ir jį vis daugiau naudosim nerodo, kad nėra burbulo. O kalbant apie internetą, tai keletą metų besipūtusio interneto burbulo bliuškimas prasidėjo 2000-aisiais (https://en.wikipedia.org/wiki/Dot-com_bubble).

**Dundorfas** · 2025.01.28, 14:50

Parašė Edd Rodyti pranešimą

Man tokios kalbos kaip "AI burbulo subliuškimas" skamba maždaug taip pat kaip kas nors prieš 30 metų sakytų "anksčiau ar vėliau subliukš interneto burbulas". Viskas tik prasideda, kuo toliau tuo daugiau naudosim visur tą AI, sunku surasti tokią sritį kur AI negalima būtų panaudoti ir dar mums toli iki to kad visur naudotume. Jei Deepseek pavyko viską padaryti sąžiningai ir dar viską opensourcino, tai čia ne AI burbulo subliuškimas, o priešingai - proveržis. Nebent turi omeny ne apskritai AI perspektyvas, o tokius dalykus kaip kad tarkim trumpalaikėj perspektyvoj buvo išpūstos kokios nors AI kompanijų akcijos, ar "AI" žodelis kišamas visur kur iš tiesų nėra jokio AI...

Dėl Kinijos vs Amerikos. Yra du variantai:

1. Kiniečiai meluoja ir iš tiesų turi užsipirkę daug daugiau ir galingesnių GPU kuriuos panaudojo modelio apmokymams.
2. Nemeluoja, pasiekė tokių rezultatų su mažesniais resursais. Šiuo atveju tai reiškia kad pritaikius tuos pačius metodus su daugiau/galingesnių GPU kuriuos turi JAV kompanijos bus galima apmokyti dar geresnius modelius. Beje, reikia turėti omeny kad jau išleidžiamas OpenAI o3 modelis, Deepseek R1 yra maždaug o1 lygio, kas aišku bet kokiu atveju įspūdinga. Šiuo atveju Kinija padarė klaidą kad viską opensourcino, nes JAV galės pasinaudoti ir tiesiog apmokyti dar geresnius modelius ant savo galingesnio hardwaro.

Ar kiniečiai meluoja ar ne, neužilgo paaiškės, nes jau ne viena kompanija bando atkartoti Deepseek žingsnius apmokydami savo modelius.

Na dot com burbulas subliuško po to buvo web 2.0, kuris jau realiai pradėjo deliverinti. Dabar ažiotažo fazė, o joje daug nudegusiu buna. Rods 2 trilijonai suinvestuoti ar ten visi jei, kada nors atsipirks labai didelis klausimas. Ty kažkas iškils, kažkas sudegs. Gal dar gimes nebuvai https://en.wikipedia.org/wiki/Dot-com_bubble
Nežinau ar meluoja.

**Edd** · 2025.01.28, 14:59

Parašė nnm Rodyti pranešimą

Tai kad DI plėtosis ir jį vis daugiau naudosim nerodo, kad nėra burbulo. O kalbant apie internetą, tai keletą metų besipūtusio interneto burbulo bliuškimas prasidėjo 2000-aisiais (https://en.wikipedia.org/wiki/Dot-com_bubble).

Parašė Dundorfas Rodyti pranešimą

Na dot com burbulas subliuško po to buvo web 2.0, kuris jau realiai pradėjo deliverinti. Dabar ažiotažo fazė, o joje daug nudegusiu buna. Rods 2 trilijonai suinvestuoti ar ten visi jei, kada nors atsipirks labai didelis klausimas. Ty kažkas iškils, kažkas sudegs. Gal dar gimes nebuvai https://en.wikipedia.org/wiki/Dot-com_bubble
Nežinau ar meluoja.

Tai jei skaitėt prieš atsakydami į ką atsakot, tai aš ir klausiau apie kokį burbulą čia eina kalba, apskritai AI kaip sritį (nėra čia jokio burbulo), ar kokias akcijas kurios gali būti išpūstos.

**MedinisStrazdas** · 2025.01.28, 15:18

Parašė Sklansky Rodyti pranešimą

A shocking Chinese AI advancement called DeepSeek is sending US stocks plunging

https://edition.cnn.com/2025/01/27/t...XhFIiJHybL8pQw

Truputi aliarmistinis straisnis, nes tik Nvidia ir susijusios grandinės įmonių akcijos krito, tech bendrai o tuo labiau US bendrai toliau sėkmingai auga.

Beje daug kas rašo kad DeepSeek modelis yra atviras. Tai nėra tiesa. Yra atviri modelio svoriai, taip pat kai kokiame llama modelyje, bet pats modelis išlieka black box.

**Ignalina** · 2025.01.28, 17:19

Juokinga, kad pastringa būtent ties netinkamais klausimais.

**suoliuojantis** · 2025.01.28, 17:23

Susinstalivau pas save LM Studio R1 paprastesnę 7B versiją (ne 70B). Paklausiau kas yra Gitanas Nauseda. Gavau va tokį atsakymą:

who is Gitanas Nauseda ?

Gitanas Nauseda is a Lithuanian politician who has served as the President of Lithuania since December 25, 2024. He previously served as the Prime Minister of Lithuania from June 30, 2020, to November 14, 2022.
Nauseda is a member of the Conservative Party (formerly known as the Union of Conservatives and New Democrats), which is one of the major political parties in Lithuania. He has been known for his centrist and moderate political stances.
Before becoming Prime Minister, Nauseda served as the Mayor of Vilnius, the capital city of Lithuania, from 2001 to 2015. During his tenure, he focused on modernizing the city and promoting economic development.
In 2020, after the collapse of the ruling party's coalition, Nauseda became Prime Minister, leading the Conservative Party to victory in the parliamentary elections later that year. His government initially focused on addressing the COVID-19 pandemic and implementing economic reforms.
Nauseda has also been active in international affairs, advocating for Lithuania's integration into NATO and the European Union. He has emphasized the importance of maintaining strong transatlantic ties with the United States and has expressed concern over Russia's actions in neighboring regions, particularly Belarus.
In 2024, Nauseda won the presidential election with a landslide victory, securing over 60% of the vote in the first round. His inauguration marked the beginning of his presidency, during which he has prioritized economic recovery, energy transition, and digital transformation, as well as strengthening Lithuania's position within the EU and NATO.

Kitaip tariant juodai pjauną grybą. Ir čia man kyla nuojauta kaip optimizacija buvo padaryta.

**Ignalina** · 2025.01.28, 17:34

Parašė suoliuojantis Rodyti pranešimą

Susinstalivau pas save LM Studio R1 paprastesnę 7B versiją (ne 70B).

O lokali versija kažką paserviruoja apie TIananmen square ar irgi nutyli?

**Taj Mahal** · 2025.01.28, 17:37

Parašė suoliuojantis Rodyti pranešimą

Susinstalivau pas save LM Studio R1 paprastesnę 7B versiją (ne 70B).

Su kokiu hardware (CPU, GPU, RAM) paleidi LLM'us pas save kompe?

Gal žinai ar apynaujis basic Mac'as pavežtų (M3 CPU, 16 GB RAM)?

**John** · 2025.01.28, 17:40

Parašė Ignalina Rodyti pranešimą

Juokinga, kad pastringa būtent ties netinkamais klausimais.

Tai kad AI chatai labai dažnai pastringa su daugybe klausimu. Nelygu kur koks klausimas yra laikomas netinkamu.

**suoliuojantis** · 2025.01.28, 17:46

Parašė Taj Mahal Rodyti pranešimą

Su kokiu hardware (CPU, GPU, RAM) paleidi LLM'us pas save kompe?

Gal žinai ar apynaujis basic Mac'as pavežtų (M3 CPU, 16 GB RAM)?

Su i7-13620H, 32 GB RAM'o, ir grafine plokste GeForce RTX 3050. Sukasi nelabai greitai, bet visai pakenciamai mažoji versija. Pačios didžiausios neinstaliavau, nes rašo, kad Likely too big for this computer

**suoliuojantis** · 2025.01.28, 17:54

Parašė Ignalina Rodyti pranešimą

O lokali versija kažką paserviruoja apie TIananmen square ar irgi nutyli?

Gražiai atsako, nors atsakymą apie minutę generavo:

what happened in Tiananmen square in 1989 ?

In 1989, a significant pro-democracy movement known as the Tiananmen Square protests took place in Beijing, China. The events unfolded as follows:

Protests Begin: In June 1989, students and other citizens gathered at Tiananmen Square to advocate for political reform, including anti-corruption and greater democratic freedoms.
Government Response: The Chinese government, under the leadership of Deng Xiaoping, declared martial law and deployed military forces to suppress the protests. This led to a tragic outcome where hundreds, possibly thousands, of people were killed. The exact number of casualties remains disputed, with estimates ranging from several hundred to over a thousand.
Censorship and Suppression: After the crackdown, the government launched a campaign called "Rejection of Tiannen" in schools, aimed at teaching students about the perceived dangers of democratic movements and the importance of social stability. This campaign was part of broader efforts to suppress dissent and control information.
International Reaction: The international community widely condemned the government's actions. Many countries imposed sanctions on China and called for a boycott of Chinese products. The event also had long-lasting effects on Chinese society, leading to increased censorship and restrictions on political dissent.
Legacy: Tiananmen Square remains a symbol of the struggle against authoritarian regimes and for democratic values. The incident underscores the tension between individual freedoms and state control, a debate that continues globally.

In summary, the 1989 Tiananmen Square protests were a pivotal moment in modern history, highlighting the challenges faced by authoritarian regimes in addressing demands for democracy and human rights.

**suoliuojantis** · 2025.01.28, 18:00

Parašė Taj Mahal Rodyti pranešimą

Su kokiu hardware (CPU, GPU, RAM) paleidi LLM'us pas save kompe?

Gal žinai ar apynaujis basic Mac'as pavežtų (M3 CPU, 16 GB RAM)?

Pavežtu, tik pats atsakymų generavimas užtruktų. Bent du mažiausius modelius tikrai pavežtų, tik klausimas kiek jie naudingi būtų. Nes kokybiškas tik pats topinis modelis

**Edd** · 2025.01.28, 18:38

Parašė suoliuojantis Rodyti pranešimą

Susinstalivau pas save LM Studio R1 paprastesnę 7B versiją (ne 70B).

Teisybės dėlei mažesni modeliai nei 671B yra net ne visai Deepseek R1 (tik kvantizuoti), o paimti visai kiti open source modeliai - šiuo atveju Llama ir Qwen modeliai ir jie tada buvo "fine-tuned" su R1 sugeneruotais duomenimis (procesą vadina "distilled"). Tai konkrečiai 7B kaip bazinis yra Qwen modelis. Aišku Deepseek R1 675B ant paprasto kompiuterio nepasileisi.

**Dundorfas** · 2025.01.28, 20:10

Parašė Edd Rodyti pranešimą

Tai jei skaitėt prieš atsakydami į ką atsakot, tai aš ir klausiau apie kokį burbulą čia eina kalba, apskritai AI kaip sritį (nėra čia jokio burbulo), ar kokias akcijas kurios gali būti išpūstos.

O tai akcijos nėra ekonomika? Čia tokie niekaip nesusije dalykai

. į AI sukišo rods 2 trilijonus pinigu ir dar kiša, ir visiems developeriams moka iš šitų pinigų ir tikisi kažkada, kad atmuš tuos pinigus ir dalis 10 metų nelauks. Ten wiki aiškino ir arkliams, kad ne tik su dot com bet ir senesnėm technologijom buvo investicianiai burbulai.

Skelbimas

Dirbtinis intelektas arba Artificial Intelligence

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment