《東方看點(diǎn)|英偉達(dá)即將發(fā)布L40s, 算力應(yīng)用交相輝映》
時(shí)間:2023-08-09
英偉達(dá)近期預(yù)告即將推出L40s,L40s的推出主要針對(duì)小幾百億參數(shù)模型推理(行業(yè)垂直應(yīng)用)、相關(guān)模型微調(diào)訓(xùn)練等無(wú)需高顯存容量和帶寬場(chǎng)景。目前大卡緊缺,小卡推理算力利用率極低,高質(zhì)量推理算力極為緊缺,同時(shí)L40s專門優(yōu)化了【FP32】的算力。
東方基金權(quán)益研究部認(rèn)為,在使用ResNet50和Bert-Large經(jīng)典模型下,L40s的推理性能和性價(jià)比皆優(yōu)于A800。L40s的推出不受臺(tái)積電CoWoS產(chǎn)能限制,供給充足,有助于改善算力產(chǎn)業(yè)鏈的預(yù)期。有助于促進(jìn)行業(yè)垂直模型更加快速、低成本落地。L40s不是完全替代A800,一方面在推理端:應(yīng)用于小幾百億及其以下的參數(shù)模型的推理(例如一些垂域模型);另一方面在訓(xùn)練端:用于微調(diào)訓(xùn)練(基于已經(jīng)完成預(yù)訓(xùn)練的模型,做fine-tuning等)??紤]到A800和H800受制于臺(tái)積電CoWoS產(chǎn)能,缺貨嚴(yán)重,L40s有助于實(shí)現(xiàn)對(duì)上述需求的增量供給。A/H卡在千億甚至未來(lái)萬(wàn)億級(jí)別參數(shù)的大模型推理,以及大模型的預(yù)訓(xùn)練階段仍然是不可替代的。建議關(guān)注人工智能的應(yīng)用端以及算力端發(fā)展。
市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。
|
關(guān)閉本頁(yè) 打印本頁(yè) |