【崗位職責】
(實習3~4天/周 實習6個月以上)
1、跟蹤并研究強化學習(Reinforcement Learning, RL)領域的最新研究進展,具備較強的論文閱讀與復現能力;?
2、基于目前的E2E算法,開發與之適配的RL策略,探索其在自動駕駛場景中的應用;?
3、協助構建高質量的仿真環境與真實數據集,推動算法在實際任務中的泛化能力;?
4、優化現有RL算法的訓練效率與穩定性,提升策略收斂速度與性能表現;
【任職要求】
1.掌握python,熟悉pytorch框架,具備扎實的深度學習和大語言模型算法基礎;?
2.具備扎實的機器學習、深度學習與強化學習理論基礎,熟悉常見RL算法(如DQN、PPO、SAC、TD3等);?
3.熟悉OpenAI Gym、 Carla 、Unity ML-Agents等仿真平臺;?
4.計算機、信息、數學、電子、自動化、機械、測控、汽車等相關專業碩士及以上學歷,具有扎實的數學功底和算法基礎;計算機基礎扎實,熟練掌握Python、Pytorch編程,熟悉Linux?
5.熟悉Sparsedrive、VAD、driveVLM等端到端自動駕駛算法優先
【加分項】?
有強化學習在真實系統(如機器人、自動駕駛等)中的應用經驗;?
熟悉多智能體強化學習(MARL)、元強化學習(Meta-RL)或層次強化學習(HRL);?
掌握C++、CUDA等底層編程語言,具備高性能計算優化經驗;?
熟悉Ray RLlib、Stable-Baselines3、CleanRL等開源強化學習框架;??