崗位職責:
1.前沿模型研發與架構設計:主導AI大語言模型(參數規模≥100億)、多模態模型(支持文本、圖像、語音等≥3種模態融合)的架構設計,需基于Transformer架構完成網絡層優化,使模型在GLUE、SuperCLUE等權威測評基準上,關鍵指標達到行業前10%水平。全面負責模型訓練,掌握分布式訓練技術(如數據并行、模型并行、流水并行),能針對訓練過程中的梯度消失、顯存不足等問題,通過混合精度訓練、優化器改進(如AdaFactor、RAdam)等策略提升訓練效率30%以上。
2.行業場景落地與應用創新:針對電商推薦、智能客服等核心業務,基于公司業務場景數據(日均處理數據量≥10TB),設計AI算法解決方案。在電商推薦領域,通過優化排序模型(如基于Transformer的DeepInterestNetwork變體),實現用戶點擊率提升15%;在智能客服場景,開發對話策略模型,使客服問題解決率提高20%,并輸出技術方案文檔及ROI分析報告。
3.全流程算法工程化與部署:統籌數據收集、清洗、標注全流程,確保數據質量(標注準確率≥95%),構建高效數據預處理流水線。負責模型在云端(如AWS、阿里云)、邊緣端(NVIDIAJetson系列等硬件平臺)的部署,使用TensorRT、ONNXRuntime等推理加速框架,將模型推理延遲降低50%以上,實現模型服務的高并發(支持QPS≥10000)與高可用(SLA≥99.9%)。
4.技術團隊引領與協作:帶領10人以上算法團隊,制定技術規劃與項目里程碑,定期開展技術分享與代碼評審,提升團隊整體技術水平。與產品團隊協作完成需求分析,將業務需求轉化為可執行的技術方案;與工程團隊配合解決模型部署中的技術難題,保障項目按時交付。
5.技術趨勢追蹤與創新推動:每周產出AI技術動態報告,梳理NeurIPS、ICML等頂會最新成果,篩選3-5項可應用于公司業務的新技術。每季度主導至少1次內部技術研討會,推動新技術在公司的落地驗證,每年申請≥3項AI相關技術專利或軟著。
任職資格要求:
1.基本要求:大學本科及以上學歷,至少具備基本要求中的2項,且至少具備(1)和(2)中的一項。
(1)博士研究生學歷(學歷和學位雙證);
(2)國家級科技人才(獲得國家授予的科技人才榮譽稱號)或知名互聯網公司、知名科技領先企業、大型科研院所、行業頭部企業等機構中重要技術團隊負責人或主要技術負責人;
(3)具有3個科創類百萬級重大項目成功經驗;
(4)從事過國家級發展規劃中新一代信息通信、人工智能、大數據等前沿領域和解決“卡脖子”技術問題;
(5)承擔過省級及以上重大創新項目、重大科技攻關,并取得一定科研成果;
(6)牽頭研發的科研項目取得重大實踐成果,多次在國家或行業榮獲獎項。
2.專業要求:計算機類、電子信息類、數學類相關專業。
3.其他任職資格要求:
(1)8年以上AI算法研發經驗,有MITCSAIL、OpenAI等國際知名機構研究經歷者優先。主導過至少3個大規模AI項目(項目預算≥500萬元,團隊規模≥15人)。有千億級參數模型訓練與調優經驗,熟悉Megatron-LM、DeepSpeed等訓練框架,曾通過模型壓縮(剪枝、量化)技術,使模型存儲成本降低70%以上。
(2)近5年內在NeurIPS、ICML、ACL等頂會以第一作者發表≥3篇論文,論文研究方向聚焦大模型優化、多模態對齊等AI核心領域,論文總引用量≥200。
(3)深度技術能力:熟練使用PyTorch、TensorFlow框架,具備開發Transformer架構核心代碼能力。擁有GPT-3、Llama系列等大模型開發經驗,熟悉模型微調、指令精調(RLHF)等技術,能獨立完成模型從訓練到上線全流程。掌握強化學習(如PPO、GRPO算法)、生成對抗網絡(GAN、DiffusionModel)等前沿技術,可應用于實際業務場景開發。
(4)卓越團隊領導與溝通能力:有成功帶領5人以上算法團隊的經驗,曾培養出至少2名團隊成員晉升為技術骨干。具備出色的溝通能力,向非技術人員(如高管、產品經理)清晰闡述復雜AI技術原理與業務價值。
(5)創新與成果轉化能力:擁有≥5項已授權的AI相關專利,主導過至少2個技術創新項目落地,為公司帶來顯著業務增長。能基于業務需求,提出創新性AI解決方案,并推動方案從原型到產品的全流程落地。
(6)加分項:在Kaggle全球競賽中獲得過Top1%排名,或在GitHub上主導開發過Star數≥5000的AI開源項目,在行業技術社區(如StackOverflow、知乎)有較高影響力。