崗位職責(zé):
1.參與公司整體 IT 基礎(chǔ)設(shè)施建設(shè)與運維;
2.管理與運維公司高性能計算集群,保障可用性、性能優(yōu)化及資源合理分配;
3.搭建并優(yōu)化監(jiān)控與日志體系,提升系統(tǒng)可觀測性和故障定位效率;
4.參與公司內(nèi)外網(wǎng)絡(luò)架構(gòu)建設(shè)與運維,具備快速定位網(wǎng)絡(luò)瓶頸與故障的能力;
5.具備優(yōu)秀的文檔輸出、方案設(shè)計與跨團隊溝通能力;
6.完成領(lǐng)導(dǎo)交派的其他各項任務(wù);
崗位要求:
1.三年以上服務(wù)器運維經(jīng)驗,了解服務(wù)器架構(gòu),掌握服務(wù)器硬件知識;
2.熟悉主流linux操作系統(tǒng),具備獨立解決系統(tǒng)故障的能力,掌握常規(guī)運維技能技巧;
3.熟悉計算機網(wǎng)絡(luò)原理,會常用的網(wǎng)絡(luò)設(shè)備配置;
4.熟悉shell或python腳本開發(fā);
5.掌握Prometheus、Zabbix等監(jiān)控系統(tǒng)的搭建與使用;
6.具備故障分析和處理能力,責(zé)任心強,積極主動,較強團隊意識,較強的安全風(fēng)險意識和跟進能力;
7.熟悉Devops流程者優(yōu)先,結(jié)合jenkins、gitlab、ansible等工具實現(xiàn)自動化構(gòu)建平臺和服務(wù)器批量管理;
8.了解芯片設(shè)計,對EDA工具、設(shè)計流程或行業(yè)環(huán)境有所接觸者優(yōu)先。