崗位職責:
1. 大模型架構設計
? 設計千億參數(shù)級大模型架構,解決NLP/CV多模態(tài)業(yè)務場景問題
? 開發(fā)基于Transformer、MOE等架構的分布式模型系統(tǒng)
2. 高效訓練優(yōu)化
? 主導多卡分布式訓練,應用ZeRO-3/梯度檢查點/混合精度訓練技術
? 優(yōu)化DeepSpeed/Megatron-LM等框架的集群資源利用率
? 實現(xiàn)訓練吞吐量提升與顯存占用優(yōu)化
3. 模型調優(yōu)與部署
? 運用RLHF(Reinforcement Learning from Human Feedback)進行對齊優(yōu)化
? 設計Prompt
Engineering策略提升zero-shot能力
? 開發(fā)模型量化/蒸餾方案,推動千億模型端側部署
4. 多模態(tài)技術研發(fā)
? 構建CLIP/BLIP/ViLT等跨模態(tài)對齊系統(tǒng)
? 開發(fā)多模態(tài)統(tǒng)一表征框架,支持圖文/視頻/3D多模態(tài)理解
? 優(yōu)化多模態(tài)模型的跨域遷移能力
5. 技術前瞻研究
? 跟蹤ICML/NeurIPS等頂會技術動態(tài),主導關鍵技術預研
? 構建大模型技術中臺,形成專利產(chǎn)出
任職要求:
1. 基礎要求
? 本科及以上學歷,計算機/數(shù)學相關專業(yè)
? 具有大模型研發(fā)經(jīng)驗,完整參與過億級參數(shù)模型項目
2. 技術能力
? 精通PyTorch生態(tài),掌握HuggingFace/ColossalAI等工具鏈
? 深入理解Transformer/BERT/GPT等架構及Attention機制
? 具備8卡以上分布式訓練調優(yōu)經(jīng)驗,熟悉NCCL通信優(yōu)化
3. 專業(yè)能力
? 精通多模態(tài)表征學習,有跨模態(tài)檢索/生成項目經(jīng)驗
? 掌握LoRA/Adapter等高效微調方法,具備RLHF實戰(zhàn)經(jīng)驗
? 熟悉LLM評估體系(HELM/LongBench等)
4. 工程能力
? 熟練使用Python/C ,能進行CUDA層優(yōu)化



-
電氣·電力·水利
-
1000人以上
-
國內上市公司
-
北京市順義區(qū)竺園路天竺保稅區(qū)泰達科技園1-2號樓
-
DCS系統(tǒng)軟件工程師 8000-12000元青山區(qū) 應屆畢業(yè)生 本科北京廣利核系統(tǒng)工程有限公司
-
數(shù)碼師 5000-8000元富強路街道 1年以上 大專包頭市藍精靈兒童攝影有限公司
-
軟件測試助理 面議青山區(qū) 應屆畢業(yè)生 不限鄭州卓集傳媒有限公司
-
售后運維工程師 面議青山區(qū) 應屆畢業(yè)生 不限江蘇鯨充新能源技術有限公司
-
機器自動化算法分析師 8000-12000元青山區(qū) 2年以上 本科杭州海邁機械有限公司
-
網(wǎng)頁設計/制作/ PS/設計 面議青山區(qū) 應屆畢業(yè)生 不限內蒙古萬戶信息科技有限公司