簡歷篩選關鍵詞:Transformer、LoRA、RLHF、DeepSpeed、ACL/EMNLP、LLaMA、ChatGPT;
1、編程能力:精通 Python,熟悉 C++ 更佳;具備良好的代碼規范與工程能力。
深度學習框架 熟練使用 PyTorch(優先)、TensorFlow,了解 Hugging Face Transformers、DeepSpeed、Megatron-LM 等訓練/推理加速工具。
2、算法與模型理解:深入理解 Transformer、BERT、GPT、LLaMA 等主流大模型架構,掌握預訓練、微調(SFT、LoRA、RLHF)、對齊(alignment)等技術。
3、數據處理與建模:熟悉大規模語料清洗、去噪、去重、質量評估、數據配比策略,具備構建數據閉環的能力。
4、科研能力:能閱讀并復現頂會論文(如 ACL、EMNLP、NeurIPS、ICLR),具備問題建模、實驗設計、結果分析能力。
5、系統與工程經驗:熟悉 Linux 開發環境,了解分布式訓練、GPU并行計算、模型壓縮與推理優化(如 vLLM、TensorRT)