بي ايم ايس، بس، صنعتي، اوزارن جي ڪيبل لاءِ.

جيئن ته بهار جو ميلو ويجهو اچي رهيو آهي، ڊيپ سيڪ جي چوڌاري جوش مضبوط رهي ٿو. تازي موڪلن ٽيڪ انڊسٽري اندر مقابلي جي هڪ اهم احساس کي اجاگر ڪيو، ڪيترن ئي هن "ڪيٽ فش" تي بحث ۽ تجزيو ڪيو. سلڪون وادي بحران جي هڪ بي مثال احساس جو تجربو ڪري رهي آهي: اوپن سورس جا حامي ٻيهر پنهنجي راءِ جو اظهار ڪري رهيا آهن، ۽ اوپن اي آءِ به ٻيهر جائزو وٺي رهيو آهي ته ڇا ان جي بند سورس حڪمت عملي بهترين انتخاب هئي. گهٽ ڪمپيوٽيشنل خرچن جي نئين پيراڊائم Nvidia جهڙن چپ جائنٽس ۾ هڪ زنجير رد عمل کي جنم ڏنو آهي، جنهن جي نتيجي ۾ آمريڪي اسٽاڪ مارڪيٽ جي تاريخ ۾ هڪ ڏينهن جي مارڪيٽ ويليو نقصان رڪارڊ ڪيو ويو آهي، جڏهن ته سرڪاري ادارا ڊيپ سيڪ پاران استعمال ٿيندڙ چپس جي تعميل جي جاچ ڪري رهيا آهن. ٻاهرين ملڪن ۾ ڊيپ سيڪ جي مخلوط جائزي جي وچ ۾، ملڪي طور تي، اهو غير معمولي واڌ جو تجربو ڪري رهيو آهي. R1 ماڊل جي لانچ کان پوءِ، لاڳاپيل ايپ ٽرئفڪ ۾ اضافو ڏٺو آهي، جيڪو ظاهر ڪري ٿو ته ايپليڪيشن شعبن ۾ واڌ مجموعي AI ايڪو سسٽم کي اڳتي وڌائيندي. مثبت پهلو اهو آهي ته ڊيپ سيڪ ايپليڪيشن جي امڪانن کي وسيع ڪندو، اهو مشورو ڏئي ٿو ته چيٽ جي پي ٽي تي ڀروسو ڪرڻ مستقبل ۾ مهانگو نه هوندو. هي تبديلي اوپن اي آءِ جي تازين سرگرمين ۾ ظاهر ٿي آهي، جنهن ۾ ڊيپ سيڪ آر 1 جي جواب ۾ مفت استعمال ڪندڙن کي o3-ميني نالي هڪ دليل ماڊل جي فراهمي شامل آهي، انهي سان گڏ بعد ۾ اپ گريڊ جيڪي o3-ميني جي سوچ جي زنجير کي عوامي بڻائين ٿا. ڪيترن ئي پرڏيهي استعمال ڪندڙن انهن ترقيات لاءِ ڊيپ سيڪ جو شڪريو ادا ڪيو، جيتوڻيڪ هي سوچ جي زنجير هڪ خلاصو طور ڪم ڪري ٿي.
اميد جي طور تي، اهو واضح آهي ته ڊيپ سيڪ گهريلو رانديگرن کي متحد ڪري رهيو آهي. تربيت جي خرچن کي گهٽائڻ تي ڌيان ڏيڻ سان، مختلف اپ اسٽريم چپ ٺاهيندڙ، انٽرميڊيٽ ڪلائوڊ فراهم ڪندڙ، ۽ ڪيترائي اسٽارٽ اپ ايڪو سسٽم ۾ فعال طور تي شامل ٿي رهيا آهن، ڊيپ سيڪ ماڊل استعمال ڪرڻ لاءِ قيمت جي ڪارڪردگي کي وڌائي رهيا آهن. ڊيپ سيڪ جي پيپرز موجب، V3 ماڊل جي مڪمل تربيت لاءِ صرف 2.788 ملين H800 GPU ڪلاڪن جي ضرورت آهي، ۽ تربيت جو عمل انتهائي مستحڪم آهي. MoE (ماهرن جو ميلاپ) آرڪيٽيڪچر 405 بلين پيرا ميٽرز سان لاما 3 جي مقابلي ۾ ڏهه جي عنصر کان اڳ تربيت جي خرچن کي گهٽائڻ لاءِ اهم آهي. في الحال، V3 پهريون عوامي طور تي تسليم ٿيل ماڊل آهي جيڪو MoE ۾ اهڙي اعليٰ اسپيرسٽي جو مظاهرو ڪري ٿو. اضافي طور تي، MLA (ملٽي ليئر اٽينشن) هم آهنگي سان ڪم ڪري ٿو، خاص طور تي استدلال جي پهلوئن ۾. "MoE جيترو اسپيسر هوندو، اوترو ئي وڏو بيچ سائيز هوندو جيڪو حسابي طاقت کي مڪمل طور تي استعمال ڪرڻ لاءِ استدلال دوران گهربل هوندو، KVCache جي سائيز اهم محدود ڪندڙ عنصر هوندي؛ MLA KVCache جي سائيز کي خاص طور تي گھٽائي ٿو،" چوانجنگ ٽيڪنالاجي جي هڪ محقق AI ٽيڪنالاجي ريويو جي تجزيي ۾ نوٽ ڪيو. مجموعي طور تي، ڊيپ سيڪ جي ڪاميابي صرف هڪ هڪ ٽيڪنالاجي نه پر مختلف ٽيڪنالاجي جي ميلاپ ۾ آهي. انڊسٽري جا اندروني ماڻهو ڊيپ سيڪ ٽيم جي انجنيئرنگ صلاحيتن جي تعريف ڪن ٿا، متوازي تربيت ۽ آپريٽر آپٽمائيزيشن ۾ انهن جي شاندار ڪارڪردگي کي نوٽ ڪندي، هر تفصيل کي بهتر بڻائي ڪري شاندار نتيجا حاصل ڪن ٿا. ڊيپ سيڪ جو اوپن سورس طريقو وڏن ماڊلز جي مجموعي ترقي کي وڌيڪ تيز ڪري ٿو، ۽ اهو توقع ڪئي وڃي ٿي ته جيڪڏهن ساڳيا ماڊل تصويرن، وڊيوز ۽ ٻين ۾ وڌندا، ته اهو صنعت ۾ طلب کي خاص طور تي متحرڪ ڪندو.
ٽئين پارٽي جي استدلال جي خدمتن جا موقعا
ڊيٽا ظاهر ڪري ٿو ته ان جي رليز کان وٺي، ڊيپ سيڪ صرف 21 ڏينهن اندر 22.15 ملين روزاني فعال استعمال ڪندڙ (DAU) گڏ ڪيا آهن، چيٽ جي پي ٽي جي استعمال ڪندڙن جي بنياد جو 41.6٪ حاصل ڪيو آهي ۽ ڊوباؤ جي 16.95 ملين روزاني فعال استعمال ڪندڙن کي پار ڪري ڇڏيو آهي، اهڙي طرح عالمي سطح تي تيز ترين وڌندڙ ايپليڪيشن بڻجي وئي آهي، 157 ملڪن/علائقن ۾ ايپل ايپ اسٽور کي مٿي ڪري ٿي. جڏهن ته، جڏهن ته استعمال ڪندڙ وڏي تعداد ۾ گڏ ٿيا، سائبر هيڪرز ڊيپ سيڪ ايپ تي بي رحمي سان حملو ڪري رهيا آهن، جنهن جي ڪري ان جي سرورز تي اهم دٻاءُ پيدا ٿي رهيو آهي. انڊسٽري تجزيه نگارن جو خيال آهي ته اهو جزوي طور تي ڊيپ سيڪ جي تربيت لاءِ ڪارڊ تعینات ڪرڻ جي ڪري آهي جڏهن ته دليل لاءِ ڪافي ڪمپيوٽيشنل پاور نه هجڻ ڪري. هڪ انڊسٽري اندروني شخص AI ٽيڪنالاجي ريويو کي ٻڌايو، "بار بار سرور جي مسئلن کي فيس چارج ڪرڻ يا وڌيڪ مشينون خريد ڪرڻ لاءِ فنانسنگ ذريعي آساني سان حل ڪري سگهجي ٿو؛ آخرڪار، اهو ڊيپ سيڪ جي فيصلن تي منحصر آهي." هي ٽيڪنالاجي بمقابله پيداوار تي ڌيان ڏيڻ ۾ هڪ واپار پيش ڪري ٿو. ڊيپ سيڪ وڏي پيماني تي خود روزي لاءِ ڪوانٽم ڪوانٽائيزيشن تي ڀروسو ڪيو آهي، گهٽ خارجي فنڊنگ حاصل ڪئي آهي، جنهن جي نتيجي ۾ نسبتا گهٽ نقد وهڪري جو دٻاءُ ۽ هڪ خالص ٽيڪنالاجي ماحول پيدا ٿيو آهي. هن وقت، مٿي ذڪر ڪيل مسئلن جي روشني ۾، ڪجهه استعمال ڪندڙ سوشل ميڊيا تي ڊيپ سيڪ تي زور ڏئي رهيا آهن ته استعمال جي حد کي وڌايو وڃي يا صارف جي آرام کي وڌائڻ لاءِ ادا ڪيل خاصيتون متعارف ڪرايون وڃن. اضافي طور تي، ڊولپرز اصلاح لاءِ سرڪاري API يا ٽئين پارٽي API استعمال ڪرڻ شروع ڪري ڇڏيا آهن. جڏهن ته، ڊيپ سيڪ جي اوپن پليٽ فارم تازو اعلان ڪيو آهي ته، "موجوده سرور وسيلا گهٽ آهن، ۽ API سروس ري چارجز معطل ڪيا ويا آهن."
هي بلاشبہ AI انفراسٽرڪچر شعبي ۾ ٽئين پارٽي وينڊرز لاءِ وڌيڪ موقعا کوليندو آهي. تازو، ڪيترن ئي ملڪي ۽ بين الاقوامي ڪلائوڊ جائنٽس ڊيپ سيڪ جا ماڊل API لانچ ڪيا آهن - پرڏيهي جائنٽس مائڪروسوفٽ ۽ ايميزون جنوري جي آخر ۾ شامل ٿيڻ وارن پهرين ماڻهن مان هئا. ملڪي اڳواڻ، هواوي ڪلائوڊ، پهريون قدم کنيو، 1 فيبروري تي سلڪون تي ٻڌل فلو جي تعاون سان ڊيپ سيڪ R1 ۽ V3 ريزننگ سروسز جاري ڪيون. AI ٽيڪنالاجي ريويو جون رپورٽون ظاهر ڪن ٿيون ته سلڪون تي ٻڌل فلو جي خدمتن ۾ صارفين جي آمد ڏٺي وئي آهي، جنهن پليٽ فارم کي مؤثر طريقي سان "ڪريش" ڪيو. وڏيون ٽي ٽيڪ ڪمپنيون - BAT (Baidu، Alibaba، Tencent) ۽ ByteDance - پڻ 3 فيبروري کان شروع ٿيندڙ گهٽ قيمت، محدود وقت جون آڇون جاري ڪيون، جيڪي گذريل سال جي ڪلائوڊ وينڊر قيمت جي جنگين جي ياد ڏيارينديون آهن جيڪي ڊيپ سيڪ جي V2 ماڊل لانچ پاران شروع ڪيون ويون هيون، جتي ڊيپ سيڪ کي "قيمت قصائي" جو نالو ڏنو ويو. ڪلائوڊ وينڊرز جا بي رحم ڪارناما مائڪروسافٽ ايزور ۽ اوپن اي آءِ جي وچ ۾ اڳوڻي مضبوط لاڳاپن جي گونج ڪن ٿا، جتي 2019 ۾، مائڪروسافٽ اوپن اي آءِ ۾ 1 بلين ڊالر جي وڏي سيڙپڪاري ڪئي ۽ 2023 ۾ چيٽ جي پي ٽي جي لانچ کان پوءِ فائدا حاصل ڪيا. بهرحال، هي ويجهي تعلق ميٽا اوپن سورس لاما کان پوءِ ٽٽڻ شروع ٿيو، جنهن مائڪروسافٽ ايزور ايڪو سسٽم کان ٻاهر ٻين وينڊرز کي انهن جي وڏن ماڊلز سان مقابلو ڪرڻ جي اجازت ڏني. هن مثال ۾، ڊيپ سيڪ نه رڳو پراڊڪٽ جي گرمي جي لحاظ کان چيٽ جي پي ٽي کي پوئتي ڇڏي ڏنو آهي پر o1 رليز کان پوءِ اوپن سورس ماڊل پڻ متعارف ڪرايا آهن، جيئن لاما جي GPT-3 جي بحالي جي چوڌاري جوش.
حقيقت ۾، ڪلائوڊ فراهم ڪندڙ پاڻ کي AI ايپليڪيشنن لاءِ ٽرئفڪ گيٽ وي جي طور تي پڻ پوزيشن ڪري رهيا آهن، مطلب ته ڊولپرز سان لاڳاپن کي مضبوط ڪرڻ سان اڳڀرائي فائدا حاصل ٿين ٿا. رپورٽون ظاهر ڪن ٿيون ته Baidu Smart Cloud وٽ ماڊل جي لانچ واري ڏينهن تي Qianfan پليٽ فارم ذريعي DeepSeek ماڊل استعمال ڪندڙ 15,000 کان وڌيڪ گراهڪ هئا. اضافي طور تي، ڪيتريون ئي ننڍيون فرمون حل پيش ڪري رهيون آهن، جن ۾ سلڪون تي ٻڌل فلو، لوچن ٽيڪنالاجي، چوانجنگ ٽيڪنالاجي، ۽ مختلف AI انفرا فراهم ڪندڙ شامل آهن جن DeepSeek ماڊلز لاءِ سپورٽ شروع ڪئي آهي. AI ٽيڪنالاجي ريويو سکيو آهي ته DeepSeek جي مقامي طور تي تعیناتي لاءِ موجوده اصلاح جا موقعا بنيادي طور تي ٻن علائقن ۾ موجود آهن: هڪ MoE ماڊل جي اسپارسٽي خاصيتن لاءِ اصلاح ڪرڻ آهي جيڪو 671 بلين پيرا ميٽر MoE ماڊل کي مقامي طور تي تعینات ڪرڻ لاءِ مخلوط دليل واري طريقي کي استعمال ڪندي جڏهن ته هائبرڊ GPU/CPU انفرنس استعمال ڪندي. اضافي طور تي، MLA جي اصلاح اهم آهي. بهرحال، DeepSeek جا ٻه ماڊل اڃا تائين Deployment Optimization ۾ ڪجهه چئلينجن کي منهن ڏين ٿا. "ماڊل جي سائيز ۽ ڪيترن ئي پيرا ميٽرز جي ڪري، اصلاح واقعي پيچيده آهي، خاص طور تي مقامي تعیناتي لاءِ جتي ڪارڪردگي ۽ قيمت جي وچ ۾ هڪ بهترين توازن حاصل ڪرڻ مشڪل هوندو،" چوانجنگ ٽيڪنالاجي جي هڪ محقق چيو. سڀ کان اهم رڪاوٽ ياداشت جي گنجائش جي حدن کي پار ڪرڻ ۾ آهي. "اسان سي پي يو ۽ ٻين ڪمپيوٽيشنل وسيلن کي مڪمل طور تي استعمال ڪرڻ لاءِ هڪ متفاوت تعاون جو طريقو اختيار ڪريون ٿا، صرف اسپارس ايم او اي ميٽرڪس جي غير حصيداري حصن کي سي پي يو / ڊي آر اي ايم تي اعليٰ ڪارڪردگي سي پي يو آپريٽرز استعمال ڪندي پروسيسنگ لاءِ رکون ٿا، جڏهن ته گھڻا حصا GPU تي رهن ٿا،" هن وڌيڪ وضاحت ڪئي. رپورٽون ظاهر ڪن ٿيون ته چوانجنگ جو اوپن سورس فريم ورڪ ڪي ٽرانسفارمرز بنيادي طور تي مختلف حڪمت عملين ۽ آپريٽرز کي اصل ٽرانسفارمرز جي عمل درآمد ۾ هڪ ٽيمپليٽ ذريعي داخل ڪري ٿو، CUDAGraph جهڙن طريقن کي استعمال ڪندي انفرنس اسپيڊ کي خاص طور تي وڌائي ٿو. ڊيپ سيڪ انهن اسٽارٽ اپ لاءِ موقعا پيدا ڪيا آهن، جيئن ترقي جا فائدا واضح ٿي رهيا آهن؛ ڪيترين ئي فرمن ڊيپ سيڪ API لانچ ڪرڻ کان پوءِ قابل ذڪر گراهڪ واڌ جي رپورٽ ڪئي آهي، اڳوڻي گراهڪن کان پڇا ڳاڇا حاصل ڪئي آهي جيڪي اصلاح جي ڳولا ۾ آهن. صنعت جي اندروني ذريعن نوٽ ڪيو آهي ته، "ماضي ۾، ڪجهه حد تائين قائم ٿيل ڪلائنٽ گروپ اڪثر ڪري وڏين ڪمپنين جي معياري خدمتن ۾ بند هوندا هئا، پيماني جي ڪري انهن جي قيمت جي فائدن سان مضبوطي سان ڳنڍيل هئا. بهرحال، اسپرنگ فيسٽيول کان اڳ ڊيپ سيڪ-آر 1/وي 3 جي تعیناتي مڪمل ڪرڻ کان پوءِ، اسان کي اوچتو ڪيترن ئي مشهور گراهڪن کان تعاون جون درخواستون مليون، ۽ اڳ ۾ به غير فعال گراهڪن اسان جي ڊيپ سيڪ سروسز کي متعارف ڪرائڻ لاءِ رابطو شروع ڪيو." في الحال، اهو ظاهر ٿئي ٿو ته ڊيپ سيڪ ماڊل انفرنس ڪارڪردگي کي وڌيڪ نازڪ بڻائي رهيو آهي، ۽ وڏن ماڊلز جي وسيع اپنائڻ سان، اهو اي آءِ انفرا انڊسٽري ۾ ترقي تي خاص طور تي اثر انداز ٿيندو رهندو. جيڪڏهن ڊيپ سيڪ-سطح جو ماڊل گهٽ قيمت تي مقامي طور تي تعینات ڪري سگهجي ٿو، ته اهو حڪومت ۽ انٽرپرائز ڊجيٽل ٽرانسفارميشن جي ڪوششن ۾ تمام گهڻي مدد ڪندو. بهرحال، چئلينج برقرار آهن، ڇاڪاڻ ته ڪجهه گراهڪ وڏي ماڊل صلاحيتن جي حوالي سان وڏيون اميدون رکي سگهن ٿا، اهو وڌيڪ واضح ڪري ٿو ته ڪارڪردگي ۽ قيمت جو توازن عملي تعیناتي ۾ اهم ٿي وڃي ٿو.
اهو جائزو وٺڻ لاءِ ته ڇا ڊيپ سيڪ چيٽ جي پي ٽي کان بهتر آهي، انهن جي اهم فرقن، طاقتن ۽ استعمال جي ڪيسن کي سمجهڻ ضروري آهي. هتي هڪ جامع مقابلو آهي:
خصوصيت/پہلو | ڊيپ سيڪ | چيٽ جي پي ٽي |
---|---|---|
ملڪيت | هڪ چيني ڪمپني پاران تيار ڪيل | اوپن اي آءِ پاران تيار ڪيل |
ذريعو ماڊل | اوپن سورس | ملڪيت وارو |
قيمت | استعمال ڪرڻ لاءِ مفت؛ سستا API رسائي جا آپشن | سبسڪرپشن يا استعمال جي ادائيگي جي قيمت |
ڪسٽمائيزيشن | انتهائي ترتيب ڏيڻ وارو، صارفين کي ان کي تبديل ڪرڻ ۽ ان تي تعمير ڪرڻ جي اجازت ڏئي ٿو. | محدود ڪسٽمائيزيشن موجود آهي |
مخصوص ڪمن ۾ ڪارڪردگي | ڊيٽا اينالائيٽڪس ۽ معلومات جي حاصلات جهڙن ڪجهه شعبن ۾ مهارت رکي ٿو. | تخليقي لکڻ ۽ گفتگو جي ڪمن ۾ مضبوط ڪارڪردگي سان ورسٽائل |
ٻولي جي مدد | چيني ٻولي ۽ ثقافت تي مضبوط ڌيان | وسيع ٻولي جي مدد پر آمريڪا تي مرڪوز |
تربيت جو خرچ | گھٽ تربيتي خرچ، ڪارڪردگي لاءِ بهتر ڪيل | اعليٰ تربيتي خرچ، جن لاءِ ڪافي ڪمپيوٽيشنل وسيلن جي ضرورت آهي |
جواب ۾ تبديلي | مختلف جواب پيش ڪري سگھن ٿا، ممڪن طور تي جيو پوليٽيڪل تناظر کان متاثر ٿي. | تربيتي ڊيٽا جي بنياد تي مسلسل جواب |
ٽارگيٽ سامعين | ڊولپرز ۽ محققن لاءِ جيڪي لچڪ چاهين ٿا | عام استعمال ڪندڙن لاءِ جيڪي ڳالهه ٻولهه جي صلاحيتن جي ڳولا ۾ آهن |
استعمال جا ڪيس | ڪوڊ جنريشن ۽ تڪڙي ڪمن لاءِ وڌيڪ ڪارآمد | متن ٺاهڻ، سوالن جا جواب ڏيڻ، ۽ ڳالهه ٻولهه ۾ مشغول ٿيڻ لاءِ مثالي. |
"اينويڊيا کي خراب ڪرڻ" تي هڪ نازڪ نقطه نظر
هن وقت، هواوي کان علاوه، ڪيترائي گهريلو چپ ٺاهيندڙ جهڙوڪ مور ٿريڊس، مُڪسي، بيران ٽيڪنالاجي، ۽ ٽيانڪسو زيڪسن پڻ ڊيپ سيڪ جي ٻن ماڊلز سان مطابقت پيدا ڪري رهيا آهن. هڪ چپ ٺاهيندڙ اي آءِ ٽيڪنالاجي ريويو کي ٻڌايو، "ڊيپ سيڪ جي جوڙجڪ جدت جو مظاهرو ڪري ٿي، پر اهو هڪ ايل ايل ايم رهي ٿو. ڊيپ سيڪ سان اسان جي موافقت بنيادي طور تي استدلال جي ايپليڪيشنن تي ڌيان ڏئي ٿي، ٽيڪنيڪل عمل درآمد کي بلڪل سڌو ۽ تيز بڻائي ٿي." بهرحال، ايم او اي جي طريقي کي اسٽوريج ۽ ورڇ جي لحاظ کان وڌيڪ مطالبن جي ضرورت آهي، گهريلو چپس سان ڊيپلائي ڪرڻ وقت مطابقت کي يقيني بڻائڻ سان گڏ، ڪيترن ئي انجنيئرنگ چئلينجن کي پيش ڪري ٿو جن کي موافقت دوران حل جي ضرورت آهي. "في الحال، گهريلو ڪمپيوٽيشنل پاور Nvidia سان استعمال ۽ استحڪام ۾ نه ملندي آهي، سافٽ ويئر ماحول جي سيٽ اپ، ٽربل شوٽنگ، ۽ بنيادي ڪارڪردگي جي اصلاح لاءِ اصل فيڪٽري شرڪت جي ضرورت آهي،" عملي تجربي جي بنياد تي هڪ صنعت جي عملي چيو. ساڳئي وقت، "ڊيپ سيڪ R1 جي وڏي پيرا ميٽر اسڪيل جي ڪري، گهريلو ڪمپيوٽيشنل پاور متوازي لاءِ وڌيڪ نوڊس جي ضرورت آهي. اضافي طور تي، گهريلو هارڊويئر وضاحتون اڃا تائين ڪجهه پوئتي آهن؛ مثال طور، هواوي 910B في الحال ڊيپ سيڪ پاران متعارف ڪرايل FP8 انفرنس کي سپورٽ نٿو ڪري سگهي." ڊيپ سيڪ وي 3 ماڊل جي هڪ نمايان ڳالهه هڪ ايف پي 8 مخلوط صحت واري تربيتي فريم ورڪ جو تعارف آهي، جنهن کي هڪ انتهائي وڏي ماڊل تي اثرائتي طور تي تصديق ڪئي وئي آهي، جيڪا هڪ اهم ڪاميابي آهي. اڳ ۾، مائڪروسوفٽ ۽ اينويڊيا جهڙن وڏن رانديگرن لاڳاپيل ڪم جو مشورو ڏنو، پر صنعت ۾ ممڪن هجڻ بابت شڪ موجود آهن. اهو سمجهيو ويندو آهي ته INT8 جي مقابلي ۾، ايف پي 8 جو بنيادي فائدو اهو آهي ته تربيت کان پوءِ ڪوانٽائيزيشن تقريبن نقصان کان سواءِ صحت واري حاصل ڪري سگهي ٿي جڏهن ته انفرنس اسپيڊ کي خاص طور تي وڌائي ٿي. جڏهن FP16 سان مقابلو ڪيو وڃي ٿو، ته ايف پي 8 اينويڊيا جي H20 تي ٻه ڀيرا تيز رفتاري ۽ H100 تي 1.5 ڀيرا وڌيڪ تيز رفتاري محسوس ڪري سگهي ٿو. خاص طور تي، جيئن گهريلو ڪمپيوٽيشنل پاور پلس گهريلو ماڊلز جي رجحان جي چوڌاري بحث تيز ٿي رهيا آهن، ان بابت قياس آرائي وڌي رهي آهي ته ڇا اينويڊيا کي خراب ڪري سگهجي ٿو، ۽ ڇا CUDA خندق کي نظرانداز ڪري سگهجي ٿو، اهو وڌيڪ عام ٿي رهيو آهي. هڪ ناقابل ترديد حقيقت اها آهي ته ڊيپ سيڪ واقعي اينويڊيا جي مارڪيٽ ويليو ۾ ڪافي گهٽتائي جو سبب بڻيو آهي، پر هي تبديلي اينويڊيا جي اعليٰ درجي جي ڪمپيوٽيشنل پاور سالميت بابت سوال اٿاري ٿي. سرمائي تي هلندڙ ڪمپيوٽيشنل جمع جي حوالي سان اڳ ۾ قبول ٿيل روايتن کي چئلينج ڪيو پيو وڃي، پر تربيتي منظرنامي ۾ Nvidia کي مڪمل طور تي تبديل ڪرڻ ڏکيو رهي ٿو. DeepSeek جي CUDA جي گہرے استعمال جو تجزيو ڏيکاري ٿو ته لچڪ - جهڙوڪ رابطي لاءِ SM استعمال ڪرڻ يا نيٽ ورڪ ڪارڊن کي سڌو سنئون هٿ ڪرڻ - باقاعده GPUs لاءِ قابل قبول ناهي. صنعت جا نقطه نظر زور ڏين ٿا ته Nvidia جو خندق صرف CUDA جي بدران پوري CUDA ايڪو سسٽم کي گهيرو ڪري ٿو، ۽ PTX (متوازي ٿريڊ ايگزيڪيوشن) هدايتون جيڪي DeepSeek استعمال ڪن ٿيون اڃا تائين CUDA ايڪو سسٽم جو حصو آهن. "مختصر مدت ۾، Nvidia جي ڪمپيوٽيشنل طاقت کي نظرانداز نه ٿو ڪري سگهجي - اهو خاص طور تي تربيت ۾ واضح آهي؛ جڏهن ته، دليل لاءِ گهريلو ڪارڊن کي ترتيب ڏيڻ نسبتا آسان هوندو، تنهنڪري ترقي ممڪن طور تي تيز هوندي. گهريلو ڪارڊن جي موافقت بنيادي طور تي انفرنس تي ڌيان ڏئي ٿي؛ ڪو به اڃا تائين گهريلو ڪارڊن تي ڊيپ سيڪ جي ڪارڪردگي جي ماڊل کي پيماني تي تربيت ڏيڻ ۾ ڪامياب نه ٿيو آهي،" هڪ صنعت تجزيه نگار AI ٽيڪنالاجي جائزو کي چيو. مجموعي طور تي، هڪ انفرنس جي نقطي نظر کان، حالتون گهريلو وڏي ماڊل چپس لاءِ حوصلا افزائي ڪندڙ آهن. تربيت جي تمام گهڻين گهرجن جي ڪري، جيڪي داخلا کي روڪين ٿيون، ان جي ڪري گهريلي چپ ٺاهيندڙن لاءِ موقعا وڌيڪ واضح آهن. تجزيه نگارن جو چوڻ آهي ته صرف گهريلو انفرنس ڪارڊ استعمال ڪرڻ ڪافي آهي؛ جيڪڏهن ضروري هجي ته، هڪ اضافي مشين حاصل ڪرڻ ممڪن آهي، جڏهن ته تربيتي ماڊل منفرد چئلينج پيش ڪن ٿا - مشينن جي وڌندڙ تعداد کي منظم ڪرڻ بوجھل ٿي سگهي ٿو، ۽ وڌيڪ غلطي جي شرح تربيت جي نتيجن تي منفي اثر وجهي سگهي ٿي. تربيت ۾ مخصوص ڪلسٽر اسڪيل گهرجون پڻ آهن، جڏهن ته انفرنس لاءِ ڪلسٽرن تي گهرجون ايتريون سخت نه آهن، ان ڪري GPU گهرجن کي آسان بڻائي ٿو. في الحال، Nvidia جي سنگل H20 ڪارڊ جي ڪارڪردگي Huawei يا ڪيمبرين کان وڌيڪ نه آهي؛ ان جي طاقت ڪلسٽرنگ ۾ آهي. ڪمپيوٽيشنل پاور مارڪيٽ تي مجموعي اثر جي بنياد تي، لوچن ٽيڪنالاجي جي باني، يو يانگ، AI ٽيڪنالاجي ريويو سان هڪ انٽرويو ۾ نوٽ ڪيو، "ڊيپ سيڪ عارضي طور تي الٽرا-لارج ٽريننگ ڪمپيوٽيشنل ڪلسٽرن جي قيام ۽ ڪرائي تي ڏيڻ کي ڪمزور ڪري سگهي ٿو. ڊگهي عرصي ۾، وڏي ماڊل ٽريننگ، استدلال، ۽ ايپليڪيشنن سان لاڳاپيل خرچن کي خاص طور تي گهٽائڻ سان، مارڪيٽ جي طلب ۾ واڌ جو امڪان آهي. ان جي بنياد تي AI جي ايندڙ ورهاڱي ان ڪري مسلسل ڪمپيوٽيشنل پاور مارڪيٽ ۾ مسلسل طلب کي هلائيندي." ان کان علاوه، "ڊيپ سيڪ جي دليل ۽ فائن ٽيوننگ سروسز جي وڌندڙ طلب گهريلو ڪمپيوٽيشنل منظرنامي سان وڌيڪ مطابقت رکي ٿي، جتي مقامي صلاحيتون نسبتاً ڪمزور آهن، جيڪي ڪلسٽر جي قيام کان پوءِ بيڪار وسيلن مان ضايع ٿيڻ کي گهٽائڻ ۾ مدد ڪن ٿيون؛ هي گهريلو ڪمپيوٽيشنل ايڪو سسٽم جي مختلف سطحن تي ٺاهيندڙن لاءِ قابل عمل موقعا پيدا ڪري ٿو." لوچن ٽيڪنالاجي هواوي ڪلائوڊ سان تعاون ڪيو آهي ته جيئن گهريلو ڪمپيوٽيشنل پاور تي ٻڌل ڊيپ سيڪ آر 1 سيريز استدلال API ۽ ڪلائوڊ اميجنگ سروسز لانچ ڪري سگهجن. يو يانگ مستقبل بابت اميد جو اظهار ڪيو: "ڊيپ سيڪ گهريلو طور تي پيدا ڪيل حلن ۾ اعتماد پيدا ڪري ٿو، اڳتي وڌڻ لاءِ گهريلو ڪمپيوٽيشنل صلاحيتن ۾ وڌيڪ جوش ۽ سيڙپڪاري کي همٿائي ٿو."

ٿڪل
ڇا ڊيپ سيڪ چيٽ جي پي ٽي کان "بهتر" آهي، اهو استعمال ڪندڙ جي مخصوص ضرورتن ۽ مقصدن تي منحصر آهي. لچڪ، گهٽ قيمت، ۽ ڪسٽمائيزيشن جي ضرورت وارن ڪمن لاءِ، ڊيپ سيڪ بهتر ٿي سگهي ٿو. تخليقي لکڻ، عام پڇا ڳاڇا، ۽ صارف دوست گفتگو واري انٽرفيس لاءِ، چيٽ جي پي ٽي اڳواڻي ڪري سگهي ٿو. هر اوزار مختلف مقصدن جي خدمت ڪري ٿو، تنهن ڪري چونڊ ان حوالي سان تمام گهڻو منحصر هوندي جنهن ۾ اهي استعمال ڪيا ويا آهن.
ڪنٽرول ڪيبل
منظم ڪيبلنگ سسٽم
نيٽ ورڪ ۽ ڊيٽا، فائبر آپٽڪ ڪيبل، پيچ ڪارڊ، ماڊلز، فيس پليٽ
اپريل 16-18، 2024 دبئي ۾ وچ اوڀر توانائي
اپريل 16-18، 2024 ماسڪو ۾ سيڪيوريڪا
9 مئي 2024 تي شنگھائي ۾ نوان پراڊڪٽس ۽ ٽيڪنالاجيز لانچ ايونٽ
آڪٽوبر 22-25، 2024 سيڪيورٽي چائنا بيجنگ ۾
نومبر 19-20، 2024 ڪنيڪٽڊ ورلڊ سعودي عرب
پوسٽ جو وقت: فيبروري-10-2025