DeepSeek፡ AI Landscapeን የሚቀይር ረብሻ

AIPU WATON ቡድን

መግቢያ

ከተወዳዳሪ ትላልቅ ሞዴሎች መካከል ቀጣይነት ያለው ጭንቀት፣ ለገበያ መጋራት የሚፎካከሩ የክላውድ አቅራቢዎች፣ እና ታታሪ ቺፕ አምራቾች—የዲፕ ፈላጊው ውጤት ጸንቷል።

የስፕሪንግ ፌስቲቫል ሊጠናቀቅ በመጣ ቁጥር በ DeepSeek ዙሪያ ያለው ደስታ ጠንካራ ሆኖ ይቆያል። በቅርቡ የተከበረው በዓል በቴክ ኢንደስትሪው ውስጥ ከፍተኛ የውድድር ስሜት አጉልቶ አሳይቷል፣ ብዙዎች በዚህ “ካትፊሽ” ላይ ሲወያዩ እና ሲተነትኑ ነበር። ሲሊኮን ቫሊ ከዚህ በፊት ታይቶ የማይታወቅ የችግር ስሜት እያጋጠመው ነው፡ የክፍት ምንጭ ጠበቆች ሀሳባቸውን በድጋሚ እየገለፁ ነው፣ እና OpenAI እንኳን የተዘጋ ምንጭ ስትራቴጂው ምርጡ ምርጫ መሆኑን እየገመገመ ነው። ዝቅተኛ የስሌት ወጪዎች አዲሱ ምሳሌ እንደ ኒቪዲ ባሉ ቺፕ ግዙፍ ኩባንያዎች መካከል የሰንሰለት ምላሽ እንዲፈጠር ምክንያት ሆኗል፣ ይህም በአሜሪካ የስቶክ ገበያ ታሪክ የአንድ ቀን የገበያ ዋጋ ኪሳራ አስመዝግቧል፣ የመንግስት ኤጀንሲዎች ደግሞ DeepSeek የሚጠቀሟቸውን ቺፖችን ማክበር እየመረመሩ ነው። በውጭ አገር DeepSeek በተደባለቀ ግምገማዎች መካከል፣ በአገር ውስጥ፣ ያልተለመደ እድገት እያሳየ ነው። የR1 ሞዴል ከተጀመረ በኋላ፣ ተጓዳኝ መተግበሪያ የትራፊክ መጨናነቅ ታይቷል፣ ይህም የመተግበሪያ ዘርፎች እድገት አጠቃላይ የ AI ምህዳርን ወደፊት እንደሚያራምድ ያሳያል። አወንታዊው ገጽታ DeepSeek የመተግበሪያ እድሎችን ያሰፋል፣ ይህም በ ChatGPT ላይ መታመን ለወደፊቱ ውድ እንዳልሆነ ይጠቁማል። ይህ ፈረቃ በO3-mini የተሰኘ የማመዛዘን ሞዴል ለ DeepSeek R1 ምላሽ ለተጠቃሚዎች መስጠቱን እና በቀጣይም የ o3-ሚኒ የአስተሳሰብ ሰንሰለትን ለህዝብ ያደረጉ ማሻሻያዎችን ጨምሮ በOpenAI የቅርብ ጊዜ እንቅስቃሴዎች ላይ ተንጸባርቋል። ምንም እንኳን ይህ የአስተሳሰብ ሰንሰለት እንደ ማጠቃለያ ሆኖ የሚያገለግል ቢሆንም ብዙ የባህር ማዶ ተጠቃሚዎች ለ DeepSeek ምስጋናቸውን ገልጸዋል ።

በብሩህ እይታ፣ DeepSeek የሀገር ውስጥ ተጫዋቾችን አንድ እያደረገ መሆኑ ግልፅ ነው። የሥልጠና ወጪዎችን በመቀነስ ላይ ባተኮረ መልኩ የተለያዩ የላይ ቺፕ አምራቾች፣ መካከለኛ ደመና አቅራቢዎች እና በርካታ ጅምሮች ስነ-ምህዳሩን በንቃት በመቀላቀል የ DeepSeek ሞዴልን ለመጠቀም ወጪ ቆጣቢነትን እያሳደጉ ነው። እንደ DeepSeek ወረቀቶች የ V3 ሞዴል ሙሉ ስልጠና 2.788 ሚሊዮን H800 ጂፒዩ ሰአታት ብቻ የሚፈልግ ሲሆን የስልጠናው ሂደት በጣም የተረጋጋ ነው። የMoE (የባለሙያዎች ድብልቅ) አርክቴክቸር የቅድመ-ሥልጠና ወጪዎችን በአሥር እጥፍ ለመቀነስ ከላማ 3 ጋር ሲነፃፀር በ405 ቢሊዮን መለኪያዎች ወሳኝ ነው። በአሁኑ ጊዜ፣ V3 በMoE ውስጥ ይህን የመሰለ ከፍተኛ ቆጣቢነት የሚያሳይ የመጀመሪያው በይፋ የታወቀ ሞዴል ነው። በተጨማሪም፣ MLA (ባለብዙ ንብርብር ትኩረት) በተቀናጀ መልኩ ይሰራል፣በተለይም በምክንያታዊ ገጽታዎች። የቹዋንጂንግ ቴክኖሎጂ ተመራማሪ ለ AI ቴክኖሎጂ ክለሳ በሰጡት ትንታኔ "MoE በተቀነሰ መጠን የሒሳብ ኃይልን ሙሉ በሙሉ ለመጠቀም በምክንያት ወቅት የሚያስፈልገው የባች መጠን ይበልጣል፣የ KVCache መጠን ቁልፍ መገደብ ነው፣ኤምኤልኤ የKVCache መጠንን በእጅጉ ይቀንሳል።" በአጠቃላይ፣ የ DeepSeek ስኬት የሚገኘው አንድን ብቻ ​​ሳይሆን የተለያዩ ቴክኖሎጂዎችን በማጣመር ነው። የኢንደስትሪ የውስጥ ባለሙያዎች የ DeepSeek ቡድኑን የምህንድስና ችሎታዎች ያወድሳሉ፣ ​​በትይዩ ስልጠና እና ኦፕሬተር ማመቻቸት ያላቸውን ጥሩነት በመጥቀስ እያንዳንዱን ዝርዝር ሁኔታ በማጣራት ትልቅ ውጤት አስመዝግቧል። የዲፕሴክ ክፍት ምንጭ አቀራረብ የትላልቅ ሞዴሎችን አጠቃላይ እድገት የበለጠ ያቀጣጥራል ፣ እና ተመሳሳይ ሞዴሎች ወደ ምስሎች ፣ ቪዲዮዎች እና ሌሎችም ቢሰፋ ይህ በኢንዱስትሪው ውስጥ ያለውን ፍላጎት በከፍተኛ ሁኔታ ያነቃቃል ተብሎ ይጠበቃል።

ለሶስተኛ ወገን የማመዛዘን አገልግሎቶች እድሎች

መረጃው እንደሚያመለክተው DeepSeek ከተለቀቀበት ጊዜ ጀምሮ በ21 ቀናት ውስጥ 22.15 ሚሊዮን የቀን ገቢር ተጠቃሚዎችን (DAU) በማጠራቀም የቻትጂፒቲ ተጠቃሚ መሰረት 41.6% በማሳካት እና በቀን ከ16.95 ሚሊዮን የዱባኦ ተጠቃሚ ተጠቃሚዎች በልጦ በአፕል አፕ ስቶርን በ15.7 ሀገራት ቀዳሚ ሆነ። ነገር ግን ተጠቃሚዎች በገፍ እየጎረፉ ባለበት ወቅት የሳይበር ሰርጎ ገቦች የ DeepSeek መተግበሪያን ያለ እረፍት በማጥቃት በአገልጋዮቹ ላይ ከፍተኛ ጫና በመፍጠር ላይ ናቸው። የኢንደስትሪ ተንታኞች ይህ በከፊል ዲፕሴክ ካርዶችን ለስልጠና በማሰማራት በቂ የማስላት አቅም ባለመኖሩ ምክንያት እንደሆነ ያምናሉ። አንድ የኢንደስትሪ አዋቂ ለአይ ቴክኖሎጂ ሪቪው እንዳስታወቀው "በተደጋጋሚ የሚነሱ የአገልጋይ ችግሮች በቀላሉ ሊፈቱ የሚችሉት ክፍያ በመጠየቅ ወይም ተጨማሪ ማሽኖችን በመግዛት በገንዘብ በመደገፍ ነው፤ በመጨረሻም በ DeepSeek ውሳኔዎች ላይ የተመሰረተ ነው።" ይህ በቴክኖሎጂ እና በምርታማነት ላይ በማተኮር የንግድ ልውውጥን ያሳያል። DeepSeek በአብዛኛው የተመካው በ quantum quantization ለራስ መተዳደሪያ ነው፣ ትንሽ የውጭ የገንዘብ ድጋፍ በማግኘቱ፣ በአንፃራዊነት ዝቅተኛ የገንዘብ ፍሰት ግፊት እና የጠራ የቴክኖሎጂ አካባቢ። በአሁኑ ጊዜ፣ ከተጠቀሱት ችግሮች አንጻር፣ አንዳንድ ተጠቃሚዎች የተጠቃሚን ምቾት ለማሻሻል የአጠቃቀም ገደቦችን ከፍ እንዲያደርግ ወይም የሚከፈልባቸው ባህሪያትን እንዲያስተዋውቅ DeepSeek በማህበራዊ ሚዲያ ላይ ያሳስባሉ። በተጨማሪም፣ ገንቢዎች ለማመቻቸት ኦፊሴላዊውን ኤፒአይ ወይም የሶስተኛ ወገን ኤፒአይዎችን መጠቀም ጀምረዋል። ነገር ግን፣ የ DeepSeek ክፍት መድረክ በቅርቡ አስታውቋል፣ “የአሁኑ የአገልጋይ ሃብቶች እምብዛም አይደሉም፣ እና የኤፒአይ አገልግሎት መሙላት ታግዷል።

 

ይህ ያለምንም ጥርጥር በ AI መሠረተ ልማት ዘርፍ ለሶስተኛ ወገን አቅራቢዎች ተጨማሪ እድሎችን ይከፍታል። በቅርቡ፣ በርካታ የሀገር ውስጥ እና አለምአቀፍ የደመና ግዙፍ ኩባንያዎች የ DeepSeek's ሞዴል ኤፒአይዎችን ጀምረዋል—የባህር ማዶ ግዙፎቹ ማይክሮሶፍት እና አማዞን በጥር መጨረሻ ከተቀላቀሉት የመጀመሪያዎቹ ናቸው። የሃገር ውስጥ መሪው ሁዋዌ ክላውድ የመጀመሪያውን እንቅስቃሴ በማድረግ DeepSeek R1 እና V3 የማመዛዘን አገልግሎቶችን ከሲሊኮን-ተኮር ፍሰት ጋር በመተባበር የካቲት 1 ቀን 2010 ዓ.ም. ከ AI ቴክኖሎጂ ክለሳ የወጡ ዘገባዎች እንደሚያመለክቱት በሲሊኮን ላይ የተመሰረተ የፍሎው አገልግሎት የተጠቃሚዎችን ፍሰት በማሳየቱ መድረኩን ውጤታማ በሆነ መንገድ "ይበላሻል"። ትላልቆቹ ሶስት የቴክኖሎጂ ኩባንያዎች- BAT (ባይዱ፣ አሊባባ፣ ቴንሰንት) እና ባይትዳንስ ከየካቲት 3 ጀምሮ ዝቅተኛ ወጭ እና ውሱን ጊዜ ቅናሾችን አቅርበዋል፣ ይህም ባለፈው አመት በ DeepSeek's V2 ሞዴል ማስጀመሪያ የተቀሰቀሰውን የደመና አቅራቢ ዋጋ ጦርነቶችን ያስታውሳል። የደመና አቅራቢዎች እልህ አስጨራሽ እርምጃዎች በማይክሮሶፍት አዙሬ እና በOpenAI መካከል የነበረውን ጠንካራ ግንኙነት በ2019 ማይክሮሶፍት በOpenAI ላይ ከፍተኛ የሆነ 1 ቢሊዮን ዶላር ኢንቨስትመንት አድርጓል እና በ2023 ChatGPT ከጀመረ በኋላ ጥቅማጥቅሞችን አግኝቷል። ሆኖም ግን ይህ የቅርብ ግንኙነት ከሜታ ክፍት ምንጭ ላማ ጋር በመገናኘት ከማይክሮሶፍት ውጭ ያሉ ሌሎች አቅራቢዎችን ከስርዓተ-ምህዳር ጋር እንዲወዳደሩ አስችሏል። በዚህ ምሳሌ፣ DeepSeek በምርት ሙቀት ከቻትጂፒቲን በልጦ ብቻ ሳይሆን የ o1 መለቀቅን ተከትሎ ክፍት ምንጭ ሞዴሎችንም አስተዋውቋል፣ ይህም የላማ የ GPT-3 መነቃቃት ጋር ተመሳሳይ ነው።

 

እንደ እውነቱ ከሆነ፣ የደመና አቅራቢዎችም ራሳቸውን ለኤአይአይ አፕሊኬሽኖች ትራፊክ መግቢያ አድርገው እያስቀመጡ ነው፣ ይህ ማለት ከገንቢዎች ጋር ያለው ግንኙነት ጥልቅ ወደ ቅድመ ጥቅም ይተረጎማል። ሪፖርቶች እንደሚያመለክቱት ባይዱ ስማርት ክላውድ በአምሳያው በተጀመረበት ቀን DeepSeek ሞዴልን በ Qianfan የመሳሪያ ስርዓት የሚጠቀሙ ከ15,000 በላይ ደንበኞች እንደነበሩት ነው። በተጨማሪም፣ በርካታ ትናንሽ ኩባንያዎች በሲሊኮን ላይ የተመሰረተ ፍሰት፣ ሉቸን ቴክኖሎጂ፣ ቹዋንጂንግ ቴክኖሎጂ እና የተለያዩ የ AI Infra አቅራቢዎችን ጨምሮ ለ DeepSeek ሞዴሎች ድጋፍ እየሰጡ ነው። AI ቴክኖሎጂ ሪቪው እንደተገነዘበው በአሁኑ ወቅት የዲፕሴክን አካባቢያዊ ለማሰማራት የማመቻቸት እድሎች በዋነኛነት በሁለት መስኮች እንዳሉ ተረድቷል፡ አንደኛው የMoE ሞዴሉን ብልሹ ባህሪያት ማመቻቸት ላይ የተደባለቀ የማመዛዘን ዘዴን በመጠቀም የ671 ቢሊየን ፓራሜትር የሞኢ ሞዴልን በሃገር ውስጥ በማሰማራት ድቅል ጂፒዩ/ሲፒዩ/ሲፒዩ ኢንፈረንስ እየተጠቀሙ ነው። በተጨማሪም፣ MLA ን ማመቻቸት አስፈላጊ ነው። ሆኖም፣ የ DeepSeek ሁለቱ ሞዴሎች አሁንም በማሰማራት ማመቻቸት ላይ አንዳንድ ፈተናዎች ያጋጥሟቸዋል። የቹዋንጂንግ ቴክኖሎጂ ተመራማሪ “በአምሳያው መጠን እና በብዙ መለኪያዎች ምክንያት ማመቻቸት በእርግጥ ውስብስብ ነው ፣በተለይ ለአካባቢው ማሰማራቶች በአፈፃፀም እና በዋጋ መካከል ጥሩ ሚዛን ማግኘት ፈታኝ ይሆናል” ብለዋል ። በጣም አስፈላጊው መሰናክል የማስታወስ ችሎታ ገደቦችን በማሸነፍ ላይ ነው። "ሲፒዩዎችን እና ሌሎች የስሌት ሃብቶችን ሙሉ በሙሉ ለመጠቀም የተለያዩ የትብብር አቀራረብን እንከተላለን፣ ያልተጋሩትን የሞኢ ማትሪክስ ክፍሎችን ብቻ በሲፒዩ/ድራም ላይ ከፍተኛ አፈፃፀም ያላቸውን ሲፒዩ ኦፕሬተሮችን በመጠቀም ለማስኬድ እናስቀምጣለን፣ ጥቅጥቅ ያሉ ክፍሎቹ በጂፒዩ ላይ ይቆያሉ" ሲል ገልጿል። ሪፖርቶች እንደሚያመለክቱት የቹዋንጂንግ የክፍት ምንጭ ማዕቀፍ KTransformers በዋነኛነት የተለያዩ ስልቶችን እና ኦፕሬተሮችን በአብነት ወደ ኦሪጅናል ትራንስፎርመሮች ያስገባ ሲሆን ይህም እንደ CUDAGraph ያሉ ዘዴዎችን በመጠቀም የማመዛዘን ፍጥነትን በእጅጉ ያሳድጋል። DeepSeek የእድገት ጥቅማጥቅሞች እየታዩ በመሆናቸው ለእነዚህ ጅማሪዎች እድሎችን ፈጥሯል። ብዙ ኩባንያዎች DeepSeek API ን ከጀመሩ በኋላ የደንበኞችን እድገት አሳይተዋል ፣ ከቀደምት ደንበኞች ማሻሻያዎችን ሲቀበሉ። የኢንደስትሪ ውስጠ አዋቂዎች እንዳስታወቁት፣ "ከዚህ ቀደም በተወሰነ ደረጃ የተመሰረቱ የደንበኛ ቡድኖች በትላልቅ ኩባንያዎች ደረጃቸውን የጠበቁ አገልግሎቶች በመጠን መጠናቸው በጠበቀ መልኩ በዋጋ ተያይዘው ይገኙ ነበር። ሆኖም ከስፕሪንግ ፌስቲቫል በፊት DeepSeek-R1/V3 ማሰማራቱን ከጨረስን በኋላ በድንገት ከብዙ ታዋቂ ደንበኞቻችን የትብብር ጥያቄዎችን አግኝተናል፣ እና ከዚህ ቀደም ተኝተው የነበሩ ደንበኞቻችን እንኳን አገልግሎታቸውን ለማስተዋወቅ ጀመሩ።" በአሁኑ ጊዜ DeepSeek የሞዴል ኢንቬንሽን አፈጻጸምን አሳሳቢ ደረጃ ላይ እየጣለ ያለ ይመስላል፣ እና ሰፊ ሞዴሎችን ከተቀበለ ይህ በ AI Infra ኢንዱስትሪ ውስጥ እድገት ላይ ከፍተኛ ተጽዕኖ ማሳደሩን ይቀጥላል። DeepSeek-ደረጃ ሞዴል በአገር ውስጥ በዝቅተኛ ወጭ ሊሰማራ ከቻለ፣ የመንግስት እና የድርጅት ዲጂታል ትራንስፎርሜሽን ጥረቶችን በእጅጉ ይረዳል። ነገር ግን፣ አንዳንድ ደንበኞች ከትልቅ የሞዴል ችሎታዎች ጋር በተያያዘ ከፍተኛ ተስፋ ሊጠብቁ ስለሚችሉ፣ አፈጻጸምን እና ወጪን ማመጣጠን በተግባራዊ ማሰማራቱ ውስጥ ወሳኝ እንደሚሆን ስለሚያሳይ ተግዳሮቶች ቀጥለዋል። 

DeepSeek ከ ChatGPT የተሻለ መሆኑን ለመገምገም ቁልፍ ልዩነታቸውን፣ ጥንካሬዎቻቸውን እና የአጠቃቀም ጉዳዮችን መረዳት በጣም አስፈላጊ ነው። አጠቃላይ ንጽጽር እነሆ፡-

ባህሪ / ገጽታ DeepSeek ውይይት ጂፒቲ
ባለቤትነት በቻይና ኩባንያ የተሰራ በOpenAI የተሰራ
ምንጭ ሞዴል ክፍት ምንጭ በባለቤትነት የተያዘ
ወጪ ለመጠቀም ነፃ; ርካሽ የኤፒአይ መዳረሻ አማራጮች የደንበኝነት ምዝገባ ወይም በጥቅም ላይ የሚከፈል ዋጋ
ማበጀት በከፍተኛ ሁኔታ ሊበጅ የሚችል፣ ተጠቃሚዎች እንዲስተካከሉበት እና እንዲገነቡበት ያስችላል የተወሰነ ማበጀት ይገኛል።
በተወሰኑ ተግባራት ውስጥ አፈጻጸም ኤክሴል በተወሰኑ አካባቢዎች እንደ የውሂብ ትንታኔ እና መረጃ ሰርስሮ ማውጣት በፈጠራ ጽሑፍ እና በንግግር ተግባራት ውስጥ ከጠንካራ አፈፃፀም ጋር ሁለገብ
የቋንቋ ድጋፍ በቻይንኛ ቋንቋ እና ባህል ላይ ጠንካራ ትኩረት ሰፊ የቋንቋ ድጋፍ ግን አሜሪካን ያማከለ
የስልጠና ወጪ ዝቅተኛ የሥልጠና ወጪዎች ፣ ለቅልጥፍና የተመቻቸ ከፍተኛ የሥልጠና ወጪዎች ፣ ከፍተኛ የስሌት ሀብቶችን ይፈልጋሉ
የምላሽ ልዩነት የተለያዩ ምላሾችን ሊሰጥ ይችላል፣ ምናልባትም በጂኦፖለቲካዊ አውድ ተጽዕኖ ሊሆን ይችላል። በስልጠና መረጃ ላይ ተመስርተው ወጥ የሆኑ መልሶች
የዒላማ ታዳሚዎች ተለዋዋጭነትን ለሚፈልጉ ገንቢዎች እና ተመራማሪዎች ያለመ የንግግር ችሎታዎችን ለሚፈልጉ አጠቃላይ ተጠቃሚዎች ያለመ
ጉዳዮችን ተጠቀም ለኮድ ማመንጨት እና ፈጣን ተግባራት የበለጠ ቀልጣፋ ጽሑፍ ለማመንጨት፣ ጥያቄዎችን ለመመለስ እና በውይይት ለመሳተፍ ተስማሚ

በ "Nvidiya ረብሻ" ላይ ወሳኝ አመለካከት

በአሁኑ ጊዜ ከHuawei በተጨማሪ እንደ ሙር ክሩድስ፣ ሙክሲ፣ ቢራን ቴክኖሎጂ እና ቲያንሱ ዚክሲን ያሉ በርካታ የሀገር ውስጥ ቺፕ አምራቾች ከ DeepSeek ሁለት ሞዴሎች ጋር መላመድ ላይ ናቸው። አንድ ቺፕ አምራች ለ AI ቴክኖሎጂ ሪቪው እንደተናገረው "DeepSeek's መዋቅር ፈጠራን ያሳያል, ነገር ግን LLM ሆኖ ይቆያል. ከ DeepSeek ጋር መላመድ በዋነኛነት አፕሊኬሽኖችን በማመዛዘን ላይ ያተኮረ ነው, ይህም ቴክኒካዊ አተገባበርን ትክክለኛ እና ፈጣን ያደርገዋል." ሆኖም የMoE አካሄድ በማከማቻ እና በማከፋፈል ረገድ ከፍተኛ ፍላጎቶችን ይጠይቃል፣ከሀገር ውስጥ ቺፕስ ጋር ሲሰራ ተኳሃኝነትን ከማረጋገጥ ጋር በማጣጣም ጊዜ መፍትሄ የሚያስፈልጋቸው በርካታ የምህንድስና ፈተናዎችን ያቀርባል። "በአሁኑ ጊዜ የቤት ውስጥ ማስላት ሃይል ከ Nvidia በአጠቃቀም እና በተረጋጋ ሁኔታ አይዛመድም, ለሶፍትዌር አካባቢ ማዋቀር, መላ መፈለግ እና የመሠረት አፈጻጸም ማመቻቸት ኦሪጅናል የፋብሪካ ተሳትፎ ያስፈልገዋል" ብለዋል የኢንዱስትሪ ባለሙያ በተግባራዊ ልምድ ላይ. በተመሳሳይ፣ "በ DeepSeek R1 ትልቅ መለኪያ ምክንያት፣ የቤት ውስጥ ማስላት ሃይል ለትይዩነት ተጨማሪ አንጓዎችን ይፈልጋል። በተጨማሪም፣ የሀገር ውስጥ ሃርድዌር ዝርዝር መግለጫዎች አሁንም በመጠኑ ኋላ ቀር ናቸው፣ ለምሳሌ፣ Huawei 910B በአሁኑ ጊዜ DeepSeek የፈጠረውን የFP8 ሀሳብ መደገፍ አይችልም።" የ DeepSeek V3 ሞዴል ዋና ዋና ነገሮች አንዱ የ FP8 ድብልቅ ትክክለኛነት ስልጠና ማዕቀፍ ማስተዋወቅ ሲሆን ይህም እጅግ በጣም ትልቅ በሆነ ሞዴል ላይ ውጤታማ በሆነ መንገድ የተረጋገጠ ሲሆን ይህም ትልቅ ስኬትን ያሳያል። ከዚህ ቀደም እንደ ማይክሮሶፍት እና ናቪዲ ያሉ ዋና ዋና ተጫዋቾች ተዛማጅ ስራዎችን ጠቁመዋል፣ነገር ግን አዋጭነትን በተመለከተ ጥርጣሬዎች በኢንዱስትሪው ውስጥ ቀርተዋል። ከ INT8 ጋር ሲነጻጸር የFP8 ቀዳሚ ጥቅሙ ከስልጠና በኋላ የመጠን መለኪያ ፍጥነትን በከፍተኛ ደረጃ በማሳደጉ ወደ ኪሳራ ሊደርስ መቻሉ ነው። ከ FP16 ጋር ሲወዳደር፣ FP8 በNvidi's H20 ላይ እስከ ሁለት ጊዜ የሚደርስ ፍጥነት እና በH100 ላይ ከ1.5 ጊዜ በላይ ማጣደፍ ይችላል። በተለይም፣ በአገር ውስጥ ስሌት ኃይል እና በአገር ውስጥ ሞዴሎች ዙሪያ የሚደረጉ ውይይቶች እየበረታ ሲሄዱ፣ ኔቪዲ ሊስተጓጎል ይችል እንደሆነ፣ እና የCUDA ሞተሩ ሊታለፍ ይችላል የሚለው ግምት ከጊዜ ወደ ጊዜ እየተስፋፋ መጥቷል። አንድ የማይካድ ሀቅ DeepSeek በNvidi's market value ላይ ከፍተኛ ውድቀት አስከትሏል፣ነገር ግን ይህ ለውጥ የNvidi's high-end computational power integrity በተመለከተ ጥያቄዎችን ያስነሳል። ቀደም ሲል በካፒታል የሚመራ የስሌት ክምችትን በተመለከተ ተቀባይነት ያላቸው ትረካዎች እየተጋፈጡ ነው፣ ነገር ግን ኔቪዲያ በስልጠና ሁኔታዎች ውስጥ ሙሉ በሙሉ መተካት ከባድ ነው። የ DeepSeek ጥልቅ የCUDA አጠቃቀም ትንተና እንደሚያሳየው ተለዋዋጭነት - ለምሳሌ SM ለግንኙነት መጠቀም ወይም የኔትወርክ ካርዶችን በቀጥታ መጠቀም—ለመደበኛ ጂፒዩዎች ማስተናገድ የማይቻል ነው። የኢንዱስትሪ አመለካከቶች አፅንዖት የሰጡት የNvidi moat እራሱን CUDA ብቻ ሳይሆን መላውን CUDA ስነ-ምህዳር እንደሚያጠቃልል እና DeepSeek የሚቀጥራቸው የPTX (Parallel Thread Execution) መመሪያዎች አሁንም የCUDA ምህዳር አካል ናቸው። "በአጭር ጊዜ ውስጥ የኒቪዲ የስሌት ሃይል ሊታለፍ አይችልም - ይህ በተለይ በስልጠና ላይ ግልጽ ነው; ነገር ግን የቤት ውስጥ ካርዶችን በምክንያታዊነት ማሰማራት በአንፃራዊነት ቀላል ይሆናል, ስለዚህ እድገቱ ፈጣን ይሆናል. የቤት ውስጥ ካርዶችን ማስተካከል በዋነኝነት የሚያተኩረው በፍላጎት ላይ ነው. ማንም እስካሁን ድረስ በሀገር ውስጥ ካርዶች ላይ የ DeepSeek አፈፃፀምን ሞዴል በመለኪያ ማሰልጠን የቻለ የለም "በማለት የኢንዱስትሪ ተንታኝ ለ AI ቴክኖሎጂ አስተያየቱን ሰጥቷል. በአጠቃላይ, ከግንዛቤ አንጻር ሲታይ, ሁኔታዎች ለአገር ውስጥ ትልቅ ሞዴል ቺፕስ አበረታች ናቸው. ለሀገር ውስጥ ቺፕ አምራቾች በፍላጎት መስክ ውስጥ ያሉት እድሎች በስልጠናው ከመጠን በላይ ከፍተኛ መስፈርቶች በመኖራቸው ምክንያት የበለጠ ግልፅ ናቸው ፣ ይህም ወደ ውስጥ ለመግባት እንቅፋት ነው። ተንታኞች የአገር ውስጥ የመግቢያ ካርዶችን መጠቀም ብቻ በቂ እንደሆነ ይከራከራሉ። አስፈላጊ ከሆነ ተጨማሪ ማሽን ማግኘት የሚቻል ሲሆን የሥልጠና ሞዴሎች ግን ልዩ ተግዳሮቶችን ያስከትላሉ - የተጨመሩ ማሽኖችን ማስተዳደር ከባድ ሊሆን ይችላል ፣ እና ከፍተኛ የስህተት መጠኖች የስልጠና ውጤቶችን ላይ አሉታዊ ተጽዕኖ ያሳድራሉ። ስልጠናው ልዩ የክላስተር ሚዛን መስፈርቶች አሉት፣ የፍላጎት ስብስቦች ፍላጎት ግን ያን ያህል ጥብቅ አይደሉም፣ በዚህም የጂፒዩ መስፈርቶችን ያቃልላል። በአሁኑ ጊዜ የ Nvidia ነጠላ H20 ካርድ አፈጻጸም ከ Huawei ወይም Cambrian አይበልጥም; ጥንካሬው በመሰብሰብ ላይ ነው. የሉቸን ቴክኖሎጂ መስራች ዩ ያንግ በኮምፒውቲሽናል ሃይል ገበያ ላይ ያለውን አጠቃላይ ተፅእኖ መሰረት በማድረግ ከ AI ቴክኖሎጂ ሪቪው ጋር ባደረጉት ቃለ ምልልስ "DeepSeek እጅግ በጣም ግዙፍ የስልጠና ስብስቦችን መመስረት እና ኪራይን ለጊዜው ሊያዳክም ይችላል ። በረጅም ጊዜ ውስጥ ከትልቅ ሞዴል ስልጠና ፣ አመክንዮ እና አፕሊኬሽኖች ጋር የተያያዙ ወጪዎችን በከፍተኛ ሁኔታ በመቀነስ የገቢያ ፍላጎት በዚህ ቀጣይነት ላይ የተመሠረተ ነው ። በስሌት ኃይል ገበያ ውስጥ ፍላጎት." በተጨማሪም "የዲፕሴክ ከፍተኛ የማመዛዘን እና የማስተካከል አገልግሎት ፍላጎት ከሀገር ውስጥ የስሌት ገጽታ ጋር ይበልጥ የሚጣጣም ነው፣ የአካባቢ አቅሞች በአንጻራዊ ሁኔታ ደካማ ሲሆኑ ከክላስተር ምስረታ በኋላ የስራ ፈት ሀብቶችን ብክነትን ለመቀነስ ይረዳል። ይህ በተለያዩ የሃገር ውስጥ ስሌት ስነ-ምህዳር ደረጃዎች ላሉት አምራቾች አዋጭ ዕድሎችን ይፈጥራል።" ሉቸን ቴክኖሎጂ ከHuawei Cloud ጋር በመተባበር DeepSeek R1 ተከታታይ የማመዛዘን ኤፒአይዎችን እና የደመና ምስል አገልግሎቶችን በሃገር ውስጥ የማስላት ሃይል ላይ ተመስርቷል። ዩ ያንግ ስለወደፊቱ ያለውን ተስፋ ገልጿል፡- "DeepSeek በአገር ውስጥ በተመረቱ መፍትሄዎች ላይ እምነትን ያሳድጋል፣ ይህም የላቀ ጉጉት እና የሀገር ውስጥ የማስላት አቅም ላይ መዋዕለ ንዋይ ማፍሰስን ያበረታታል።

微信图片_20240614024031.jpg1

መደምደሚያ

DeepSeek ከ ChatGPT "የተሻለ" ይሁን አይሁን በተጠቃሚው ልዩ ፍላጎቶች እና አላማዎች ላይ የተመሰረተ ነው። ተለዋዋጭነት፣ ዝቅተኛ ወጪ እና ማበጀት ለሚፈልጉ ተግባራት DeepSeek የላቀ ሊሆን ይችላል። ለፈጠራ ፅሁፍ፣ ለአጠቃላይ ጥያቄ እና ለተጠቃሚ ምቹ የውይይት በይነገጾች፣ ChatGPT ግንባር ቀደም ሊሆን ይችላል። እያንዳንዱ መሳሪያ ለተለያዩ ዓላማዎች ያገለግላል, ስለዚህ ምርጫው በሚጠቀሙበት ሁኔታ ላይ በእጅጉ ይወሰናል.

የኤልቪ ኬብል መፍትሄን ያግኙ

የመቆጣጠሪያ ገመዶች

ለቢኤምኤስ፣ ለባስ፣ ለኢንዱስትሪ፣ ለመሳሪያ ገመድ።

የተዋቀረ የኬብል ስርዓት

አውታረ መረብ እና ውሂብ፣ የፋይበር ኦፕቲክ ኬብል፣ ጠጋኝ ኮርድ፣ ሞጁሎች፣ የፊት ሰሌዳ

2024 ኤግዚቢሽኖች እና ክስተቶች ግምገማ

ኤፕሪል 16-18፣ 2024 መካከለኛ-ምስራቅ-ኢነርጂ በዱባይ

ኤፕሪል 16-18, 2024 ሴኩሪካ በሞስኮ

ግንቦት 9፣ 2024 አዲስ ምርቶች እና ቴክኖሎጂዎች በሻንጋይ የጀመሩት ክስተት

ኦክቶበር 22-25፣ 2024 ሴኩሪቲ ቻይና በቤጂንግ

ህዳር 19-20፣ 2024 የተገናኘው ዓለም ኬኤስኤ


የልጥፍ ሰዓት፡- ፌብሩዋሪ-10-2025