職位描述
該職位已進行加V認證,請放心投遞
職位描述:參與內(nèi)部異構(gòu)大模型推理引擎優(yōu)化,支持大模型推理各種優(yōu)化技術(shù)在異構(gòu)硬件上的落地。包括但不限于:
1、參與日常推理引擎的優(yōu)化開發(fā),不斷優(yōu)化大模型業(yè)務(wù)在對應(yīng)硬件上的TTFT、TPOT等指標;關(guān)注業(yè)界最佳實踐,能將業(yè)界最佳實踐落地到內(nèi)部的引擎優(yōu)化中;
2、完成各種大模型推理所需的功能性開發(fā)任務(wù);
3、參與支持日常的大模型推理服務(wù)部署,參與內(nèi)部日常提效工具的研發(fā)。
任職要求:1、有扎實的C 工程基礎(chǔ);
2、有大模型相關(guān)訓(xùn)練或推理優(yōu)化經(jīng)驗;有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的實踐經(jīng)驗;熟悉LLM infer 相關(guān)技術(shù)棧,熟悉TP/PP/DP等分布式通信原理等;
3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子開發(fā)經(jīng)驗;
4、了解AI infra 整體技術(shù)棧需求,有訓(xùn)練框架或推理框架實戰(zhàn)經(jīng)驗、熟悉TensorRT、TVM 等框架的使用、有二次開發(fā)能力或開源社區(qū)貢獻經(jīng)歷更佳。
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)上地西路6號快手總部
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓(xùn)費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
HR
北京快手科技有限公司
-
計算機軟件
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)上地西路6號1幢1層101 D1-10
相似職位
-
內(nèi)容審核 面議應(yīng)屆畢業(yè)生 不限上海活多多企業(yè)服務(wù)外包有限公司
-
AI產(chǎn)品經(jīng)理 30000-50000元5年以上 本科萬得信息技術(shù)股份有限公司
-
生產(chǎn)總經(jīng)理 10000-15000元應(yīng)屆畢業(yè)生 大專攀華集團有限公司
-
發(fā)酵研究員 面議應(yīng)屆畢業(yè)生 不限江蘇神華藥業(yè)有限公司
-
產(chǎn)品經(jīng)理PM 15000-30000元應(yīng)屆畢業(yè)生 本科江蘇蘇供投資發(fā)展有限公司
-
實驗室實驗員 面議應(yīng)屆畢業(yè)生 不限江蘇赫爾膜科技有限公司

應(yīng)屆畢業(yè)生
本科
2026-02-27 10:12:07
3582人關(guān)注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
