職位描述:
1、設計和構建結構化的智能體知識庫,確保知識庫的結構合理、內容全面、質量高。持續更新和優化知識庫內容,確保信息的準確性和時效性;
2、根據模型訓練需求,收集和整理所需的訓練數據,并進行清洗、標注和分類,確保提供高質量、多樣性及代表性的訓練數據支持;
3、了解數據合成策略,能根據實際情況及業務需求,設計合適的策略,在已有數據基礎做數據增強,支持實現模型目標;
4、制定數據標注方案,并完成數據標注任務,與模型研發工程師緊密合作,支持模型訓練和優化;
5、分析訓練數據的使用情況,提出優化建議,提升智能體的訓練效果;
6、管理訓練數據、知識庫等內容的版本控制和備份,確保數據安全、可追溯性及可復用;
7、編寫和維護知識庫和訓練數據相關的文檔和報告;
8、數據安全與合規:確保數據處理符合相關法律法規,保護數據隱私和安全。
任職要求
1、統招本科及以上學歷,計算機科學、人工智能、機器學習、數據科學等相關專業,985/211高校優先;
2、有智能體或聊天機器人項目經驗,熟悉知識圖譜、結構化知識庫等相關技術者,有數據標注平臺或工具開發經驗者優先;
3、熟悉知識庫構建和管理工具(如Ontology、Semantic Web等),熟練掌握數據清洗、標注和管理的工具和技術(如Python、SQL、Pandas等),具備良好的數據處理和分析能力,能夠處理大規模數據集。熟悉機器學習和自然語言處理的基本概念和流程;
4、具備良好的溝通和團隊協作能力,能夠與跨職能團隊緊密合作;
5、具備較強的學習能力和問題解決能力,能夠快速掌握新技術和新工具;
6、具備良好的文檔編寫和報告能力,能夠清晰表達復雜的技術概念。