崗位職責:
1、負責公司智算平臺的功能、性能、安全性測試,確保平臺的穩定性和高效性;
2、設計、編寫和執行測試用例,搭建自動化測試框架,提升測試效率;
3、進行系統和接口測試,分析測試結果,編寫測試報告,并推動問題修復;
4、參與需求評審,提供測試策略和優化建議,提升產品質量;
5、研究并引入先進的測試技術和工具,提高測試覆蓋率和自動化程度;
6、監控和優化智算平臺的資源使用情況,保障大規模計算任務的穩定運行。
崗位要求:
1、計算機、軟件工程、人工智能或相關專業本科及以上學歷;
2、有AI計算平臺、分布式計算或云計算測試經驗者優先;
3、熟悉常見的軟件測試方法和流程,掌握自動化測試框架(如Selenium、pytest、Cypress, Playwrite等);
4、具備較強的Linux系統操作能力,熟悉Shell、Python或其他腳本語言,能編寫自動化測試腳本;
5、了解Docker、Kubernetes等云原生技術,有相關測試經驗者優先;
6、熟悉常見的性能測試工具(如JMeter)及監控工具(如Prometheus、Grafana);
7、具備較強的分析和問題定位能力,良好的溝通和團隊協作精神。
加分項:
有LLM(大語言模型)推理框架或分布式訓練相關測試經驗;
了解K8S或其他容器編排系統的測試方法;
熟悉GPU計算框架(如CUDA、TensorRT、TPU等)。