任職要求:
1.計算機科學/人工智能相關專業本科及以上學歷;
2.精通Python語言,熟悉使用FastAP1、Flask、Django任一框架;
3.熟悉Linux開發環境,熟練使用Git等協作工具;
4.2年以上NLP算法開發應用經驗,熟悉Transformer、BERT、GPT等模型原理及調優方法
5,熟悉大模型部署工具鏈,(Xinference/0llama/VLLM),有實際部署通義千問、DeepSeek等模型經驗。
6.熟悉LangChain/Dify等應用框架,具備工作流編排與Function Caling開發經驗、
7.熟練使用Docker實現模型服務容器化,了解CI/CD流程及K8s生態;、
崗位職責:
1.負責大語言模型(LLM)的本地化部署、性能優化及推理加速,熟練使用Xinference、Ollama、vLLM等框架進行模型服務化,;確保模型在生產環境中的穩定運行和高性能表現
.2.基于LangChain、Dify等框架開發大模型應用,設計并實現復雜工作流編排與Function
3.負責知識庫的構建及優化任務。