Kitajski odgovor na ChatGPT, Gemini in ClaudeAI

V mestu Hangzhou, znanem po inovacijah in tehnološkem razvoju, se je rodil projekt umetne inteligence, poimenovan DeepSeek (kitajsko: 深度求索; pinyin: Shēndù Qiúsuǒ). Deepseek je kitajski laboratorij za umetno inteligenco, ki razvija odprtokodne modele velikega jezika. Čeprav je projekt še mlad, je v letu 2024 postal pomemben igralec v kitajski “AI cenovni vojni”.

Projekt DeepSeek

Projekt DeepSeek sta podprla sklad High-Flyer in njegov ustanovitelj Liang Wenfeng, ki je tako hedge sklad kot laboratorij osnoval na podlagi svojega navdušenja nad umetno inteligenco. High-Flyer, ustanovljen leta 2016, je začel kot sklad za algoritemsko trgovanje. Že leta 2021 je popolnoma prešel na uporabo umetne inteligence pri trgovanju. Aprila 2023 so v sklopu podjetja začeli raziskovalni laboratorij za umetno splošno inteligenco, ki pa se je hitro osamosvojil.

Ko je maja 2024 DeepSeek predstavil svoj model V2, so ga zaradi nizke cene poimenovali “Pinduoduo umetne inteligence” – po kitajskem podjetju, ki je revolucioniralo spletno prodajo. Model je bil kljub nizkim stroškom donosnejši od konkurentov, kot so Tencent, Baidu in Alibaba.

Osredotočeni na raziskave in odprtokodnost

Od začetka je bil DeepSeek usmerjen v raziskave. Njegovi prvi modeli, kot je DeepSeek Coder, so bili brezplačno dostopni raziskovalcem in podjetjem, koda pa odprtokodna pod MIT licenco. Leta 2023 je podjetje predstavilo še zmogljivejši model DeepSeek LLM s 67 milijardami parametrov, ki je konkuriral GPT-4, a je imel težave s skalabilnostjo.

DeepSeek pri zaposlovanju stavi na tehnično znanje namesto na izkušnje, kar privablja predvsem mlade in ambiciozne razvijalce. To jim omogoča, da hitro vpeljujejo sveže ideje in preizkušajo nove pristope.

DeepSeek V3 in izziv ameriških sankcij

Decembra 2024 je podjetje lansiralo model V3 z 671 milijardami parametrov. Model, ki je bil treniran na 14,8 bilijona podatkovnih točk, je stroške usposabljanja optimiziral na 5,58 milijona dolarjev. Z manj viri je dosegel zmogljivosti modelov, kot sta GPT-4 in Claude 3.5, kar je pokazalo omejen vpliv ameriških sankcij na razvoj umetne inteligence na Kitajskem.

V začetku leta 2025 sta bila predstavljena še modela R1 in R1-Zero. Model R1-Zero je pri treningu uporabljal izključno metodo krepitvenega učenja, brez nadzornega prilagajanja, in s tem postavil nove standarde na področju logičnega sklepanja in reševanja matematičnih problemov.

Globalna tekma za umetno inteligenco

DeepSeek je postal simbol tehnološkega preboja na Kitajskem, pri čemer je svojo moč dokazal z optimizacijo stroškov in konkurenčnostjo. Medtem ko podjetje ostaja osredotočeno na raziskave, pa njegov razvoj odpira pomembna vprašanja o prihodnosti umetne inteligence v svetu, kjer sta inovacija in geopolitika vse bolj prepleteni.

Vse več analitikov opozarja, da je prihod novega modela, podobno kot nekdanji ameriški preboji v tehnologiji, znak, da se svetovna ravnovesja hitro spreminjajo. Ali bo DeepSeek vodil naslednjo veliko revolucijo na področju umetne inteligence, bo pokazal čas, a za zdaj je jasno, da Kitajska ni le sledilka, temveč vse bolj vodilna sila v tej industriji.

Deepseek – kitajski odgovor na ChatGPT, ClaudeAI in Gemini

Projekt DeepSeek

Osredotočeni na raziskave in odprtokodnost

DeepSeek V3 in izziv ameriških sankcij

Globalna tekma za umetno inteligenco

Morda bi vas zanimalo tudi