職位描述
該職位還未進(jìn)行加V認(rèn)證,請仔細(xì)了解后再進(jìn)行投遞!
工作職責(zé):
1. 大模型研發(fā)與迭代:負(fù)責(zé)語言大模型(LLM)或多模態(tài)大模型(VLM)的預(yù)訓(xùn)練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務(wù)的表現(xiàn)。
2. 探索模型架構(gòu)創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓(xùn)練效率與效果突破。
673. 前沿技術(shù)研究與應(yīng)用:跟蹤并復(fù)現(xiàn)LLM/VLM領(lǐng)域頂會成果(如CVPR、NeurIPS、ICLR等),主導(dǎo)開源項目貢獻(xiàn),發(fā)表高水平論文或?qū)@?br />4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關(guān)鍵技術(shù),構(gòu)建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓(xùn)練流程優(yōu)化:設(shè)計數(shù)據(jù)配比策略,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,研究數(shù)據(jù)增強(qiáng)、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓(xùn)練的全流程,熟悉Deepspeed、Megatron等分布式訓(xùn)練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設(shè)計細(xì)粒度評估指標(biāo),分析模型異常表現(xiàn)并提出改進(jìn)方案。
7. 參與技術(shù)成果轉(zhuǎn)化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務(wù)場景落地。
任職資格:
1. 67教育背景:碩士及以上學(xué)歷,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),博士優(yōu)先。
2. 67技術(shù)能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓(xùn)練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎(chǔ),熟悉Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)及多模態(tài)融合技術(shù)。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓(xùn)練、開源項目貢獻(xiàn)、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標(biāo)導(dǎo)向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術(shù)瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團(tuán)隊協(xié)作,適應(yīng)快節(jié)奏研發(fā)環(huán)境。
1. 大模型研發(fā)與迭代:負(fù)責(zé)語言大模型(LLM)或多模態(tài)大模型(VLM)的預(yù)訓(xùn)練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務(wù)的表現(xiàn)。
2. 探索模型架構(gòu)創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓(xùn)練效率與效果突破。
673. 前沿技術(shù)研究與應(yīng)用:跟蹤并復(fù)現(xiàn)LLM/VLM領(lǐng)域頂會成果(如CVPR、NeurIPS、ICLR等),主導(dǎo)開源項目貢獻(xiàn),發(fā)表高水平論文或?qū)@?br />4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關(guān)鍵技術(shù),構(gòu)建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓(xùn)練流程優(yōu)化:設(shè)計數(shù)據(jù)配比策略,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,研究數(shù)據(jù)增強(qiáng)、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓(xùn)練的全流程,熟悉Deepspeed、Megatron等分布式訓(xùn)練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設(shè)計細(xì)粒度評估指標(biāo),分析模型異常表現(xiàn)并提出改進(jìn)方案。
7. 參與技術(shù)成果轉(zhuǎn)化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務(wù)場景落地。
任職資格:
1. 67教育背景:碩士及以上學(xué)歷,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),博士優(yōu)先。
2. 67技術(shù)能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓(xùn)練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎(chǔ),熟悉Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)及多模態(tài)融合技術(shù)。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓(xùn)練、開源項目貢獻(xiàn)、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標(biāo)導(dǎo)向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術(shù)瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團(tuán)隊協(xié)作,適應(yīng)快節(jié)奏研發(fā)環(huán)境。
工作地點
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號樓1B2樓D區(qū)


職位發(fā)布者
HR
深圳市億道控股有限公司

-
電子技術(shù)·半導(dǎo)體·集成電路
-
500-999人
-
公司性質(zhì)未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈
相似職位
-
產(chǎn)品支持崗 5000-6000元青山區(qū) 應(yīng)屆畢業(yè)生 本科中國平安財產(chǎn)保險股份有限公司內(nèi)蒙古分公司
-
招聘焊工-包吃 面議青山區(qū) 應(yīng)屆畢業(yè)生 不限南京巨浪船舶管理有限公司重慶分公司
-
人事行政助理(校招) 6元以上青山區(qū) 應(yīng)屆畢業(yè)生 本科江門臺山萬達(dá)廣場
-
總經(jīng)理秘書 15000-20000元青山區(qū) 應(yīng)屆畢業(yè)生 本科南京蘇合新能源科技有限公司
-
餓了么騎手月入過萬 6000-8000元青山區(qū) 應(yīng)屆畢業(yè)生 大專安徽眾森網(wǎng)絡(luò)科技有限公司
-
設(shè)計助理 6000元以下青山區(qū) 應(yīng)屆畢業(yè)生 本科江門臺山萬達(dá)廣場