Eqazet.online xəbər verir ki, DeepSeek, bu həftə Apple App Store (və həmçinin Google Play) sıralarında birinci yerə yüksələn çatbot tətbiqi ilə əsas diqqət mərkəzinə çevrildi. DeepSeek-in süni intellekt modelləri, hesablama-effektiv üsullarla təlim edilərək, Wall Street analitiklərini və texnoloqlarını ABŞ-ın süni intellekt yarışında liderliyini saxlayıb-saxlamayacağını və süni intellekt çiplərinə tələbin davam edib-etməyəcəyini sual altında qoymağa vadar etdi.
DeepSeek hardan gəldi və necə bu qədər sürətlə beynəlxalq məşhurluğa çatdı?
DeepSeek-in ticarət mənşəyi
DeepSeek, Çindəki kvant hesablama fondunun, süni intellektə əsaslanaraq ticarət qərarlarını vermək üçün istifadə etdiyi High-Flyer Capital Management tərəfindən maliyyələşdirilir.
Süni intellekt həvəskarı Liang Wenfeng, 2015-ci ildə High-Flyer-i təsis edib. Wenfeng, Zhejiang Universitetində tələbə olarkən ticarətə maraq göstərməyə başlayıb və 2019-cu ildə High-Flyer Capital Management-ı süni intellekt alqoritmləri inkişaf etdirmək və tətbiq etmək məqsədilə maliyyə fondu olaraq işə salıb.
2023-cü ildə High-Flyer, süni intellekt alətləri üzərində tədqiqat aparmaq üçün DeepSeek adlı bir laboratoriya açdı. High-Flyer-in investorlarından biri olduğu üçün bu laboratoriya özünü DeepSeek adlandıran müstəqil bir şirkətə çevrildi.
DeepSeek, ilk gündən özünün məlumat mərkəzi klasterlərini model təlimi üçün qurdu. Lakin, digər Çinə əsaslanan süni intellekt şirkətləri kimi, DeepSeek də ABŞ-ın ixrac qadağalarından təsirləndi. Şirkət, son dövr modellərindən birini təlim etmək üçün Nvidia H800 çipini istifadə etməyə məcbur oldu. Bu, ABŞ şirkətlərinin istifadə etdiyi H100 çipinin daha zəif versiyasıdır.
DeepSeek-in texniki komandası gənc yaşda formalaşmışdır. Şirkət, Çin universitetlərindən doktorantura dərəcəsi olan süni intellekt tədqiqatçılarını cəlb etməkdə aqressiv yanaşır. DeepSeek həm də kompüter elmləri üzrə təhsili olmayan şəxsləri işə götürür ki, texnologiyaları daha geniş mövzularda daha yaxşı anlaya bilsin.
DeepSeek-in güclü modelləri
DeepSeek, 2023-cü ilin noyabr ayında ilk modellərini — DeepSeek Coder, DeepSeek LLM və DeepSeek Chat — təqdim etdi. Lakin, süni intellekt sənayesi ilk dəfə DeepSeek V2-nin təqdimatından sonra diqqətini ona yönəltdi.
DeepSeek V2, ümumi məqsədli mətn və şəkil təhlil edən bir sistem idi və mövcud benchmark testlərində yaxşı nəticələr verdi — və həmin dövrün digər modelləri ilə müqayisədə daha ucuz işləyirdi. Bu, DeepSeek-in daxili rəqiblərini, o cümlədən ByteDance və Alibaba-nı modellərinin istifadə qiymətlərini endirməyə məcbur etdi və bəzilərini tamamilə pulsuz etdi.
DeepSeek V3, 2024-cü ilin dekabr ayında təqdim edildikdən sonra şirkətin məşhurluğunu daha da artırdı.
DeepSeek-in daxili testlərinə görə, DeepSeek V3, həm Meta-nın Llama modelini, həm də OpenAI-nin GPT-4o kimi “bağlı” modelləri aşır.
Eyni zamanda, DeepSeek-in R1 “mülahizə” modeli, yanvar ayında təqdim edildi və DeepSeek, R1-in əsas benchmarklarda OpenAI-nin o1 modeli ilə eyni nəticələri verdiyini iddia edir.
Mülahizə modelləri, özlərini yoxlama qabiliyyətinə malikdir, bu da onlara fizika, elm və riyaziyyat kimi sahələrdə daha etibarlı nəticələr əldə etməyə kömək edir. Lakin, bu modellər digər modellərə nisbətən daha uzun vaxtda nəticələr verə bilər.
DeepSeek V3 və digər modellərinin bir mənfi cəhəti var. Çində inkişaf edən süni intellektlər, Çinin internet tənzimləyiciləri tərəfindən qiymətləndirilir ki, onların cavabları “əsas sosialist dəyərləri” əks etdirsin. Məsələn, DeepSeek-in çatbot tətbiqində, R1 Tiananmen Meydanı və Tayvanın müstəqilliyi ilə bağlı suallara cavab vermir.
Pozucu yanaşma
Əgər DeepSeek-in biznes modeli varsa, bu, tam olaraq nə olduğunu anlamaq çətindir. Şirkət məhsul və xidmətlərini bazar dəyərindən xeyli aşağı qiymətləndirir və bəzilərini tamamilə pulsuz təqdim edir. Bununla yanaşı, investor pulu almır, baxmayaraq ki, VC (risk kapitalı) marağını çəkir.
DeepSeek-in dediyinə görə, səmərəlilik sahəsindəki irəliləyişlər şirkətin qiymət üstünlüyünü qorumağa imkan verir. Bəzi ekspertlər isə şirkətin təqdim etdiyi rəqəmləri şübhə ilə qarşılayır.
Bununla belə, DeepSeek-in modelləri çox sayda inkişaf etdirici tərəfindən sevilir. Modellər açıq mənbə kimi təqdim olunmur, amma kommersiya məqsədləri üçün istifadə edilə bilən sərbəst lisenziyalarla mövcuddur. Hugging Face-in CEO-su Clem Delangue-a görə, Hugging Face platformasında DeepSeek modellərinin 500-dən çox törəmə modeli yaradılıb və ümumilikdə 2,5 milyon yükləmə alıb.
DeepSeek-in daha böyük və daha köklü rəqibləri üzərindəki uğuru, “süni intellekti sarsıdan” və “yüksək həddə təriflənmiş” kimi təsvir edilib. Şirkətin uğuru, ən azından, Nvidia-nın səhmlərinin yanvar ayında 18% düşməsinə səbəb olub və OpenAI CEO-su Sam Altman-dan ictimai reaksiyaya səbəb olub.
Microsoft, DeepSeek-in Azure AI Foundry xidmətində mövcud olduğunu elan edib. Meta-nın CEO-su Mark Zuckerberg, birinci rübdəki gəlir zəngində Meta-nın süni intellekt infrastrukturuna xərcləyəcəyi məbləğin “strateji üstünlük” olacağını bildirib.
2025-ci ilin mart ayında, OpenAI, DeepSeek-in “dövlət tərəfindən subsidiyalaşdırılmış” və “dövlət tərəfindən idarə olunan” olduğunu açıqlayıb və ABŞ hökumətinə DeepSeek modellərinin qadağan olunmasını təklif edib.
Nvidia-nın dördüncü rüb gəlir zəngində CEO Jensen Huang, DeepSeek-in “əla innovasiya” olduğunu vurğulayıb, çünki bu modellər daha çox hesablama resurslarına ehtiyac duyur.
Eyni zamanda, bəzi şirkətlər DeepSeek-i qadağan edir, eləcə də bəzi ölkələr və hökumətlər, o cümlədən Cənubi Koreya. Nyu York ştatı da DeepSeek-in dövlət cihazlarında istifadəsini qadağan edib.
DeepSeek-in gələcəyi barədə nə olacağı isə dəqiq məlum deyil. Təkmilləşdirilmiş modellər mütləqdir. Lakin, ABŞ hökumətinin onu zərərli xarici təsir olaraq qəbul etməsi ehtimalı artır. 2025-ci ilin mart ayında Wall Street Journal, ABŞ-ın DeepSeek-i hökumət cihazlarında istifadəyə qadağa qoyacağını bildirib.