智駕決策規(guī)劃算法工程師/專家(RL方向)-【自動(dòng)駕駛】
40000-70000元
北京
應(yīng)屆畢業(yè)生
本科
北京
應(yīng)屆畢業(yè)生
本科
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
工作職責(zé)
1. 負(fù)責(zé)基于強(qiáng)化學(xué)習(xí)(如Online/Offline RL、Model-based RL)的自動(dòng)駕駛行為決策與運(yùn)動(dòng)規(guī)劃算法研發(fā),重點(diǎn)解決結(jié)構(gòu)化道路(高速、城市快速路)及非結(jié)構(gòu)化場(chǎng)景(自動(dòng)泊車)中的動(dòng)態(tài)交互與博弈問(wèn)題;
2. 針對(duì)復(fù)雜動(dòng)態(tài)場(chǎng)景(密集車流、無(wú)保護(hù)路口、人車混流),設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的決策規(guī)劃算法,通過(guò)大規(guī)模分布式訓(xùn)練系統(tǒng)提升策略的智能性、安全性及泛化能力;
3. 構(gòu)建與迭代仿真環(huán)境(如CARLA、NVIDIA Isaac)與世界模型,推動(dòng)強(qiáng)化學(xué)習(xí)策略的仿真訓(xùn)練與實(shí)車遷移(Sim2real),形成“真實(shí)數(shù)據(jù)→仿真訓(xùn)練→實(shí)車驗(yàn)證”的閉環(huán)優(yōu)化;
4. 參與全棧自動(dòng)駕駛決策控制系統(tǒng)的開(kāi)發(fā),對(duì)接感知、預(yù)測(cè)、端到端模塊,實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的決策規(guī)劃算法在車載平臺(tái)上的部署、性能優(yōu)化與實(shí)車路測(cè);
5. 跟蹤強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域的前沿進(jìn)展(如大模型與RL結(jié)合、逆強(qiáng)化學(xué)習(xí)、多智能體博弈),進(jìn)行技術(shù)預(yù)研與算法創(chuàng)新,推動(dòng)研究成果在量產(chǎn)項(xiàng)目中的應(yīng)用與落地。
任職資格
1. 計(jì)算機(jī)科學(xué)、自動(dòng)化、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;
2. 具備扎實(shí)的強(qiáng)化學(xué)習(xí)理論基礎(chǔ),熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一項(xiàng)自動(dòng)駕駛或機(jī)器人項(xiàng)目中具有RL算法落地經(jīng)驗(yàn);
3. 熟練掌握Python/C ,熟悉PyTorch等深度學(xué)習(xí)框架,具備大規(guī)模強(qiáng)化學(xué)習(xí)分布式訓(xùn)練(如Ray、Kubernetes)或仿真平臺(tái)開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 熟悉自動(dòng)駕駛決策規(guī)劃常見(jiàn)方法(如MDP/POMDP、搜索與優(yōu)化算法),并能夠?qū)?qiáng)化學(xué)習(xí)與傳統(tǒng)規(guī)劃方法(如MPC、Lattice)結(jié)合解決實(shí)際問(wèn)題;
5. 具備良好的數(shù)學(xué)基礎(chǔ),熟悉優(yōu)化理論、概率論、車輛動(dòng)力學(xué)建模,能夠支撐RL算法中的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)、策略優(yōu)化與安全約束處理。
加分項(xiàng):
1. 在NeurIPS、ICLR、ICML、ICRA、CoRL等會(huì)議或期刊發(fā)表過(guò)強(qiáng)化學(xué)習(xí)相關(guān)論文;
2. 具備自動(dòng)駕駛量產(chǎn)項(xiàng)目(如NOA、LCC)或L4級(jí)項(xiàng)目(Robotaxi、Robobus)中RL算法集成與調(diào)試經(jīng)驗(yàn);
3. 熟悉仿生學(xué)習(xí)、逆強(qiáng)化學(xué)習(xí)、世界模型等技術(shù),具備數(shù)據(jù)合成、評(píng)測(cè)基準(zhǔn)構(gòu)建或RL訓(xùn)練基礎(chǔ)設(shè)施開(kāi)發(fā)經(jīng)驗(yàn);
4. 熟悉ROS、Apollo等自動(dòng)駕駛框架,或具備CARLA、Isaac Gym等仿真工具鏈的使用和開(kāi)發(fā)能力。
工作地點(diǎn)
地址:北京朝陽(yáng)區(qū)北京-朝陽(yáng)區(qū)望京SOHO
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
孫先生HR
上海鈞正網(wǎng)絡(luò)科技有限公司
-
互聯(lián)網(wǎng)·電子商務(wù)
-
1000人以上
-
私營(yíng)·民營(yíng)企業(yè)
-
鼓樓街道
相似職位
-
座艙軟件測(cè)試開(kāi)發(fā)工程師(海外版) 15000-20000元應(yīng)屆畢業(yè)生 本科小米科技有限責(zé)任公司
-
過(guò)程質(zhì)量工程師PQE (MJ038950) 12000-24000元應(yīng)屆畢業(yè)生 本科寧德時(shí)代新能源科技股份有限公司
-
電子硬件工程師 8000元以上應(yīng)屆畢業(yè)生 不限維怡醫(yī)療科技有限公司
-
資深新品質(zhì)量工程師 12000-17000元應(yīng)屆畢業(yè)生 本科艾歐史密斯(中國(guó))熱水器有限公司
-
質(zhì)量工程師 面議應(yīng)屆畢業(yè)生 不限常州市瑞悅車業(yè)有限公司
-
機(jī)器人算法工程師 面議應(yīng)屆畢業(yè)生 不限南京普愛(ài)醫(yī)療設(shè)備股份有限公司

2026-02-23 01:39:44
150人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說(shuō)是在江蘇人才網(wǎng)上看到的。
