崗位職責:
1、多模態大模型研發與優化
(1)負責大規模預訓練模型(LLM)的設計、開發、訓練及調優,包括架構創新、參數效率提升等 。(2)建立環衛行業的視覺感知模型和運籌學模型。(3)建立環保行業垂直大模型(如環衛車和環衛工人調度系統、設備診斷知識庫等)。
2、數據處理與工程化 - 構建高質量多模態訓練數據集,設計數據清洗、增強及標注策略
(1)開發高效數據預處理流水線,解決大數據存儲、分布式加載等工程問題。(2)構建模型微調Pipeline,對接環衛作業數據、物聯網、內部管理系統等數據流 。(3)跟蹤LLM領域最新進展(如MoE、長上下文處理、多模態對齊),推動技術迭代。
3、模型部署與性能優化
(1)實現模型的高效推理部署,優化GPU/TPU資源利用率 。(2) 研究模型服務化方案(如API服務、邊緣端部署),解決延遲、吞吐量等性能瓶頸。(3) 探索模型蒸餾、量化、稀疏化等技術,降低計算與存儲成本。
4、跨團隊協作
(1) 與產品、業務團隊深度合作,將技術能力轉化為實際應用場景 。(2) 撰寫技術文檔、專利及論文,推動團隊技術影響力。
任職要求:
1、 計算機科學、軟件工程、數學、統計學或相關領域本科及以上學歷。
2、 2年以上算法研發經驗,精通PyTorch框架,且滿足下列條件之一:
(1)大模型(10B+參數)訓練/微調實戰經驗,深入理解Transformer、注意力機制、RLHF等核心技術,具備模型源碼級調優能力;理解RAG技術鏈實現邏輯,有自研RAG算法能力 。
(2)熟悉Megatron-LM、DeepSpeed等分布式訓練工具 ,熟練使用CUDA、TensorRT等加速庫,具有模型優化部署能力。
(3)熟悉計算機視覺領域,有分類/檢測/分割的實際落地項目經驗;熟悉傳統圖像算法。
(4)熟悉運籌優化算法理論,有人員排班/車輛路徑規劃等項目經驗。
加分項:具備城市服務和制造業相關經驗優先;具備環保物聯網數據、環衛作業數據對接經驗優先;參與過環保科研項目課題研究者優先。
3、 熟悉發明專利的撰寫規范,有相應經驗者優先。