職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
崗位職責
負責AI模型工程化相關工作,如框架設計、模型優(yōu)化、推理加速等。
任職要求
1、計算機、人工智能等相關專業(yè)本科以上學歷,3年以上工作經(jīng)驗,具備扎實的C/C /Python/CUDA等編程經(jīng)驗及工程化經(jīng)驗
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應用與原理
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關工具鏈
5、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關的性能調(diào)優(yōu)經(jīng)驗,如FastTransformer、TensorRT、triton等經(jīng)驗優(yōu)先
6. 加分項:2年及以上大模型分布式推理引擎開發(fā)經(jīng)驗;國際競賽和核心會議發(fā)文
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發(fā)經(jīng)驗優(yōu)先
8、加分項:有內(nèi)存管理、算子優(yōu)化、機器學習編譯、異步并發(fā)、IO優(yōu)化相關研發(fā)經(jīng)驗優(yōu)先
負責AI模型工程化相關工作,如框架設計、模型優(yōu)化、推理加速等。
任職要求
1、計算機、人工智能等相關專業(yè)本科以上學歷,3年以上工作經(jīng)驗,具備扎實的C/C /Python/CUDA等編程經(jīng)驗及工程化經(jīng)驗
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應用與原理
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關工具鏈
5、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關的性能調(diào)優(yōu)經(jīng)驗,如FastTransformer、TensorRT、triton等經(jīng)驗優(yōu)先
6. 加分項:2年及以上大模型分布式推理引擎開發(fā)經(jīng)驗;國際競賽和核心會議發(fā)文
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發(fā)經(jīng)驗優(yōu)先
8、加分項:有內(nèi)存管理、算子優(yōu)化、機器學習編譯、異步并發(fā)、IO優(yōu)化相關研發(fā)經(jīng)驗優(yōu)先
工作地點
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號樓1B2樓D區(qū)
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
深圳市億道控股有限公司
-
電子技術·半導體·集成電路
-
500-999人
-
公司性質(zhì)未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈
相似職位
-
華東分公司-核島工藝系統(tǒng)工程師 (職位編號:HGHD000504) 12元以上應屆畢業(yè)生 不限成都海光核電技術服務有限公司
-
新媒體運營策劃師 6000-8000元應屆畢業(yè)生 不限南京蘇合新能源科技有限公司
-
小米汽車-硬件工程師-電機控制器機械開發(fā)(A63684) 20000-45000元應屆畢業(yè)生 碩士小米科技有限責任公司
-
嵌入式軟件開發(fā)工程師 面議應屆畢業(yè)生 不限常州瑞信電子科技有限公司
-
java開發(fā)工程師 15000-25000元應屆畢業(yè)生 大專南京蘇寧軟件技術有限公司
-
膜材料研發(fā)工程師-24屆畢業(yè)生 10000-20000元應屆畢業(yè)生 碩士天合星元投資發(fā)展有限公司

3年以上
本科
2026-05-02 08:07:31
883人關注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
