崗位職責:
1. 大模型全鏈路開發與優化:主導企業級大模型的設計、訓練與迭代優化,覆蓋文本生成、智能對話系統、代碼生成等核心應用場景,打造高性能、高可用性的底層模型底座。
2. 行業化應用落地構建:基于成熟大模型技術棧,針對特定業務場景進行應用程序開發與適配,確保模型性能與實際業務需求深度匹配,實現技術到業務價值的高效轉化。
3. 定制化模型微調實施:結合企業個性化需求,設計科學的預訓練模型微調方案,完成數據準備、訓練調參、效果驗證全流程,交付高度貼合業務場景的定制化解決方案。
4. 大規模數據體系搭建:設計并落地高效的大規模數據處理與清洗流程,構建支持模型訓練、評估與迭代的數據支撐體系,保障數據質量與模型訓練效率。
5. 前沿技術創新探索:跟蹤自然語言處理、大模型領域前沿算法與技術動態,開展技術預研與創新實踐,持續優化現有系統性能與效果,主導或參與核心技術突破項目。
6. 跨團隊協同推進:與產品、工程、業務等多團隊緊密協作,明確技術需求、同步項目進度、解決跨領域問題,共同保障項目高效落地與業務目標達成。
7. 技術知識沉淀與傳遞:撰寫規范、詳實的實驗報告、技術方案文檔及操作手冊,梳理技術經驗與方法論,實現團隊內部知識的有效沉淀與傳遞。
任職資格:
1. 學歷背景:本科及以上學歷,具備扎實的學術基礎與學習能力。專業領域:計算機科學與技術、人工智能、應用數學、數據科學等相關專業優先。
2. 經驗要求:擁有1年及以上自然語言處理(NLP)、機器學習或大模型相關領域開發經驗;有大模型訓練、微調或行業應用落地經驗者優先。
3. 技術能力:熟練掌握Python編程語言,深入理解深度學習原理,能熟練運用TensorFlow、PyTorch等主流深度學習框架開展模型開發工作。
4. 模型認知:對BERT、GPT、Qwen、LLaMA等主流大模型的架構原理、訓練邏輯與應用場景有深入理解,具備實際項目中的模型選型、調優與部署經驗。
5. NLP技術儲備:熟悉文本分類、命名實體識別、機器翻譯、文本摘要、對話生成等常見NLP任務的技術原理與實現方案,能獨立設計并落地相關任務解決方案。
6. 數據能力:具備良好的數據分析思維與統計學基礎,能熟練運用數據處理工具(如Pandas、Spark)處理、分析大規模數據集,具備數據驅動的問題解決能力。