1、基于業務場景(如計算機視覺、自然語言處理、推薦系統等)設計或改進算法模型,例如:計算機視覺:目標檢測(YOLO、Faster R-CNN)、圖像分割(Mask R-CNN)、OCR識別;自然語言處理:文本分類、命名實體識別(NER)、機器翻譯、大模型微調(LoRA、SFT);機器學習:特征工程、分類/回歸模型(XGBoost、LightGBM)、強化學習策略設計。
2、參與算法選型與評估,對比不同模型的精度、效率及可解釋性(如A/B測試驗證算法效果);
3、主導數據采集、清洗、標注與增強(如圖像裁剪、文本脫敏、數據均衡處理),確保數據質量滿足模型訓練需求;
4、設計高效特征提取方案,結合領域知識構建特征工程(如時間序列特征、用戶行為特征);
5、基于PyTorch、TensorFlow等框架搭建訓練流程,配置超參數(學習率、 batch size、迭代次數)并優化收斂效果;
6、對模型進行量化、剪枝、知識蒸餾,適配邊緣設備(如手機、嵌入式設備)或低延遲場景,降低部署成本;
7、優化推理速度(如TensorRT加速、ONNX格式轉換),滿足生產環境的實時性要求(如毫秒級響應);
8、持續跟蹤模型線上性能(如精度衰減、數據漂移),通過增量訓練或算法迭代優化效果。
任職要求:
1、具備核心數學知識,例如:線性代數:矩陣運算、特征值分解、PCA降維(模型特征提取基礎);概率統計:貝葉斯理論、概率分布(如高斯分布)、假設檢驗(A/B測試依據);最優化理論:梯度下降、隨機梯度下降(SGD)、Adam等優化器原理(模型訓練核心);微積分:偏導數、鏈式法則(反向傳播算法基礎);
2、具備機器學習/深度學習理論掌握經典模型原理:決策樹、SVM、邏輯回歸、神經網絡(CNN/RNN/Transformer架構);理解模型評估指標:準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值、ROC/AUC(模型效果量化);
3、精通Python(主流開發語言,熟練使用NumPy、Pandas、Scikit-learn);
4、熟悉C/C++(高性能計算場景,如模型推理加速)、CUDA(GPU并行編程);
5、精通至少一種主流框架(PyTorch/TensorFlow/Keras),熟悉模型構建、訓練、部署全流程;
6、自然語言處理(NLP):文本分類、命名實體識別(NER)、大模型微調(LoRA、SFT)、RAG(檢索增強生成);
7、機器學習:特征工程、集成學習(XGBoost、LightGBM)、強化學習(策略梯度、Q-learning);
8、具備模型優化能力,具備3年以上算法開發優化經驗。