崗位職責(zé):
1. 大模型架構(gòu)設(shè)計
? 設(shè)計千億參數(shù)級大模型架構(gòu),解決NLP/CV多模態(tài)業(yè)務(wù)場景問題
? 開發(fā)基于Transformer、MOE等架構(gòu)的分布式模型系統(tǒng)
2. 高效訓(xùn)練優(yōu)化
? 主導(dǎo)多卡分布式訓(xùn)練,應(yīng)用ZeRO-3/梯度檢查點/混合精度訓(xùn)練技術(shù)
? 優(yōu)化DeepSpeed/Megatron-LM等框架的集群資源利用率
? 實現(xiàn)訓(xùn)練吞吐量提升與顯存占用優(yōu)化
3. 模型調(diào)優(yōu)與部署
? 運用RLHF(Reinforcement Learning from Human Feedback)進行對齊優(yōu)化
? 設(shè)計Prompt
Engineering策略提升zero-shot能力
? 開發(fā)模型量化/蒸餾方案,推動千億模型端側(cè)部署
4. 多模態(tài)技術(shù)研發(fā)
? 構(gòu)建CLIP/BLIP/ViLT等跨模態(tài)對齊系統(tǒng)
? 開發(fā)多模態(tài)統(tǒng)一表征框架,支持圖文/視頻/3D多模態(tài)理解
? 優(yōu)化多模態(tài)模型的跨域遷移能力
5. 技術(shù)前瞻研究
? 跟蹤ICML/NeurIPS等頂會技術(shù)動態(tài),主導(dǎo)關(guān)鍵技術(shù)預(yù)研
? 構(gòu)建大模型技術(shù)中臺,形成專利產(chǎn)出
任職要求:
1. 基礎(chǔ)要求
? 本科及以上學(xué)歷,計算機/數(shù)學(xué)相關(guān)專業(yè)
? 具有大模型研發(fā)經(jīng)驗,完整參與過億級參數(shù)模型項目
2. 技術(shù)能力
? 精通PyTorch生態(tài),掌握HuggingFace/ColossalAI等工具鏈
? 深入理解Transformer/BERT/GPT等架構(gòu)及Attention機制
? 具備8卡以上分布式訓(xùn)練調(diào)優(yōu)經(jīng)驗,熟悉NCCL通信優(yōu)化
3. 專業(yè)能力
? 精通多模態(tài)表征學(xué)習(xí),有跨模態(tài)檢索/生成項目經(jīng)驗
? 掌握LoRA/Adapter等高效微調(diào)方法,具備RLHF實戰(zhàn)經(jīng)驗
? 熟悉LLM評估體系(HELM/LongBench等)
4. 工程能力
? 熟練使用Python/C ,能進行CUDA層優(yōu)化
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓(xùn)費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
-
電氣·電力·水利
-
1000人以上
-
國內(nèi)上市公司
-
北京市順義區(qū)竺園路天竺保稅區(qū)泰達科技園1-2號樓
-
嵌入式應(yīng)用軟件工程師 面議應(yīng)屆畢業(yè)生 不限南京藍昊智能科技有限公司
-
web前端開發(fā)工程師 面議應(yīng)屆畢業(yè)生 不限北京易米云佳網(wǎng)絡(luò)科技有限公司
-
高級硬件工程師 面議應(yīng)屆畢業(yè)生 不限中天寬帶技術(shù)有限公司
-
微電網(wǎng)算法工程師 20000-35000元應(yīng)屆畢業(yè)生 本科蘇州安極能新能源發(fā)展有限公司
-
電氣測試技術(shù)員 面議應(yīng)屆畢業(yè)生 不限蘇州源起技術(shù)服務(wù)有限公司
-
高級UI設(shè)計師 面議應(yīng)屆畢業(yè)生 本科中億豐建設(shè)集團股份有限公司

應(yīng)屆畢業(yè)生
學(xué)歷不限
最近更新
1341人關(guān)注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
