崗位職責(zé):
1. 從事數(shù)字人視頻生成,包括人臉,人體重建等技術(shù)的開發(fā)與落地。
2. 從事多模態(tài)技術(shù)研究,包括語音驅(qū)動(dòng)人臉,人體運(yùn)動(dòng),姿態(tài)估計(jì)等。
3. 使用UE,Unity等前沿引擎進(jìn)行相應(yīng)數(shù)字人的渲染驅(qū)動(dòng)研發(fā)。
4. 負(fù)責(zé)AI圖像/視頻生成模型的核心開發(fā)與落地應(yīng)用。
5. 技術(shù)實(shí)踐與協(xié)作:編寫技術(shù)文檔并進(jìn)行實(shí)驗(yàn)分析,協(xié)助團(tuán)隊(duì)優(yōu)化系統(tǒng)性能。
6. 了解/協(xié)作知識(shí)庫與智能體技術(shù)生態(tài),能參與技術(shù)方案討論,并與相關(guān)團(tuán)隊(duì)協(xié)作完成系統(tǒng)集成。
7. 探索AI Agent框架在數(shù)字人交互場景的前沿應(yīng)用。
8. 關(guān)注并評(píng)估ComfyUI、MCP等服務(wù)化工具與協(xié)議,推動(dòng)生成流程的自動(dòng)化與工程化。
專業(yè)素質(zhì)要求:
(聚焦CV/CG和工程化能力)
1. 必需:熟練掌握C++和Python,強(qiáng)大的Linux環(huán)境下開發(fā)和調(diào)試能力。
2. 核心:有扎實(shí)的UE/Unity引擎研發(fā)經(jīng)驗(yàn),或深入理解其渲染底層原理。
3. 核心:熟練掌握PyTorch,有豐富的CV項(xiàng)目經(jīng)驗(yàn),熟悉Stable Diffusion生態(tài)及LoRA、ControlNet等微調(diào)技術(shù)。
4. 加分項(xiàng):有ComfyUI/AUTOMATIC1111等可視化工具的開發(fā)或插件編寫經(jīng)驗(yàn)。
5. 加分項(xiàng):對(duì)向量數(shù)據(jù)庫、RAG、大模型智能體有基本了解和實(shí)踐興趣。
6. 加分項(xiàng):有技術(shù)領(lǐng)導(dǎo)力或跨團(tuán)隊(duì)協(xié)作經(jīng)驗(yàn)者優(yōu)先。
此崗位是團(tuán)隊(duì)的技術(shù)核心,以數(shù)字人生成與驅(qū)動(dòng)為主要職責(zé),同時(shí)了解并能技術(shù)選型、知識(shí)庫與智能體方向,具備全棧視角。