職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
負責AI模型工程化相關(guān)工作,如框架設(shè)計、模型優(yōu)化、推理加速等。
任職資格:
1、計算機、人工智能等相關(guān)專業(yè)本科以上學歷,3年以上工作經(jīng)驗,具備扎實的C/C /Python/CUDA等編程經(jīng)驗及工程化經(jīng)驗;
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型;
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/;
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應(yīng)用與原理 ;
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關(guān)工具鏈;
5、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關(guān)的性能調(diào)優(yōu)經(jīng)驗,如FastTransformer、TensorRT、triton等經(jīng)驗優(yōu)先;
6、加分項:2年及以上大模型分布式推理引擎開發(fā)經(jīng)驗;國際競賽和核心會議發(fā)文;
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發(fā)經(jīng)驗優(yōu)先;
8、加分項:有內(nèi)存管理、算子優(yōu)化、機器學習編譯、異步并發(fā)、IO優(yōu)化相關(guān)研發(fā)經(jīng)驗優(yōu)先。
負責AI模型工程化相關(guān)工作,如框架設(shè)計、模型優(yōu)化、推理加速等。
任職資格:
1、計算機、人工智能等相關(guān)專業(yè)本科以上學歷,3年以上工作經(jīng)驗,具備扎實的C/C /Python/CUDA等編程經(jīng)驗及工程化經(jīng)驗;
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型;
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/;
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應(yīng)用與原理 ;
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關(guān)工具鏈;
5、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關(guān)的性能調(diào)優(yōu)經(jīng)驗,如FastTransformer、TensorRT、triton等經(jīng)驗優(yōu)先;
6、加分項:2年及以上大模型分布式推理引擎開發(fā)經(jīng)驗;國際競賽和核心會議發(fā)文;
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發(fā)經(jīng)驗優(yōu)先;
8、加分項:有內(nèi)存管理、算子優(yōu)化、機器學習編譯、異步并發(fā)、IO優(yōu)化相關(guān)研發(fā)經(jīng)驗優(yōu)先。
工作地點
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號樓1B2樓D區(qū)


職位發(fā)布者
HR
深圳市億道控股有限公司

-
電子技術(shù)·半導(dǎo)體·集成電路
-
500-999人
-
公司性質(zhì)未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈
相似職位
-
招聘焊工-包吃 面議青山區(qū) 應(yīng)屆畢業(yè)生 不限南京巨浪船舶管理有限公司重慶分公司
-
人事行政助理(校招) 6元以上青山區(qū) 應(yīng)屆畢業(yè)生 本科江門臺山萬達廣場
-
總經(jīng)理秘書 15000-20000元青山區(qū) 應(yīng)屆畢業(yè)生 本科南京蘇合新能源科技有限公司
-
餓了么騎手月入過萬 6000-8000元青山區(qū) 應(yīng)屆畢業(yè)生 大專安徽眾森網(wǎng)絡(luò)科技有限公司
-
設(shè)計助理 6000元以下青山區(qū) 應(yīng)屆畢業(yè)生 本科江門臺山萬達廣場
-
招聘專員 4000-7000元青山區(qū) 應(yīng)屆畢業(yè)生 大專上海尋夢信息技術(shù)有限公司