- 專業方向:計算機科學、人工智能、機器學習、數據科學、數學、統計學、自然語言處理(NLP)、計算機視覺等相關領域。
二、核心技術能力
1. 大模型理論基礎
- 深入理解大模型架構(如Transformer、GPT、BERT、Claude、Llama等),熟悉自注意力機制、位置編碼、模型并行化等技術。
- 掌握大模型預訓練、微調(Fine-tuning)、提示工程(Prompt Engineering)等核心方法。
2. 實戰經驗要求
- 模型開發:主導過大模型的全流程開發,包括數據預處理、模型訓練、壓縮優化、部署等。
- 場景應用:熟悉大模型在制造業垂直領域的落地案例,具備離散制造業解決方案設計能力。
- 問題排查:能快速定位大模型訓練中的常見問題(如梯度消失/爆炸、過擬合、幻覺現象),并提出改進方案。
3. 工具與框架
- 熟練掌握大模型開發工具鏈:
- 框架:PyTorch、TensorFlow、Hugging Face Transformers、DeepSpeed等。
- 加速工具:GPU/TPU集群、混合并行(數據并行、模型并行、流水線并行)、分布式訓練框架(如Horovod)。
- 優化工具:量化壓縮(QAT/FT)、剪枝、蒸餾(Knowledge Distillation)等。
- 熟悉大模型推理引擎(如vLLM、Triton)和部署工具(ONNX、TensorRT)。
4. 數據處理與治理
- 精通大規模數據處理(清洗、標注、對齊)、數據集構建(如Supervised/Unsupervised Data)、數據質量評估。
- 熟悉多模態數據融合(文本、圖像、語音、視頻)及跨模態建模技術。
三、行業經驗與場景理解
1. 垂直領域深耕
- 至少擁有1-2個智能制造行業的完整項目經驗,能將大模型技術與業務痛點結合。
2. 產品化思維
- 能將技術轉化為可落地的產品方案,設計高可用、低成本的大模型服務體系(如API接口、SaaS平臺)。
- 熟悉大模型相關的商業模式(如訂閱制、按token計費、企業級私有化部署)。
四、軟性素質與能力
1. 溝通與協作
- 能與技術團隊(算法工程師、開發者)、業務團隊(產品經理、行業專家)、客戶(企業決策者)高效溝通,翻譯技術語言為業務價值。
- 具備跨部門協作經驗,推動大模型項目從需求到方案落地的閉環。
2. 快速學習與創新
- 緊跟大模型前沿技術(如MoE、RLHF、聯邦學習),快速復現SOTA(State-of-the-Art)算法并適配業務場景。
- 具備創新思維,能提出針對大模型局限性的改進方案(如解決“幻覺”問題的強化學習策略)。
3.項目管理與風控
- 主導過大模型項目全生命周期管理,包括資源調配、進度把控、成本優化。
- 熟悉大模型開發中的合規與倫理風險(如數據隱私、算法偏見、知識產權保護)。
五、崗位職責
- 負責大模型技術在智能制造行業的應用場景探索與方案設計;
- 優化大模型訓練效率與推理成本,解決復雜工程問題;
- 負責項目管理,帶領團隊完成大模型項目的實施交付。