職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
工作職責(zé):
負(fù)責(zé)AI模型工程化相關(guān)工作,如框架設(shè)計(jì)、模型優(yōu)化、推理加速等。
任職資格:
1、計(jì)算機(jī)、人工智能等相關(guān)專(zhuān)業(yè)本科以上學(xué)歷,3年以上工作經(jīng)驗(yàn),具備扎實(shí)的C/C /Python/CUDA等編程經(jīng)驗(yàn)及工程化經(jīng)驗(yàn)
2、2年及以上大模型分布式推理引擎開(kāi)發(fā)經(jīng)驗(yàn);國(guó)際競(jìng)賽和核心會(huì)議發(fā)文
3、有AI Infra公司和AI芯片公司、大語(yǔ)言模型推理框架研發(fā)經(jīng)驗(yàn)優(yōu)先
4、有內(nèi)存管理、算子優(yōu)化、機(jī)器學(xué)習(xí)編譯、異步并發(fā)、IO優(yōu)化相關(guān)研發(fā)經(jīng)驗(yàn)優(yōu)先
5、熟悉深度學(xué)習(xí)算法(transformer、LLM、VLM、DM等)及及常用開(kāi)源大模型
6、熟悉AI常用訓(xùn)練和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應(yīng)用與原理
7、熟悉常見(jiàn)模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機(jī)采樣等)及相關(guān)工具鏈
8、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關(guān)的性能調(diào)優(yōu)經(jīng)驗(yàn),如FastTransformer、TensorRT、triton等經(jīng)驗(yàn)優(yōu)先
負(fù)責(zé)AI模型工程化相關(guān)工作,如框架設(shè)計(jì)、模型優(yōu)化、推理加速等。
任職資格:
1、計(jì)算機(jī)、人工智能等相關(guān)專(zhuān)業(yè)本科以上學(xué)歷,3年以上工作經(jīng)驗(yàn),具備扎實(shí)的C/C /Python/CUDA等編程經(jīng)驗(yàn)及工程化經(jīng)驗(yàn)
2、2年及以上大模型分布式推理引擎開(kāi)發(fā)經(jīng)驗(yàn);國(guó)際競(jìng)賽和核心會(huì)議發(fā)文
3、有AI Infra公司和AI芯片公司、大語(yǔ)言模型推理框架研發(fā)經(jīng)驗(yàn)優(yōu)先
4、有內(nèi)存管理、算子優(yōu)化、機(jī)器學(xué)習(xí)編譯、異步并發(fā)、IO優(yōu)化相關(guān)研發(fā)經(jīng)驗(yàn)優(yōu)先
5、熟悉深度學(xué)習(xí)算法(transformer、LLM、VLM、DM等)及及常用開(kāi)源大模型
6、熟悉AI常用訓(xùn)練和部署(如PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應(yīng)用與原理
7、熟悉常見(jiàn)模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機(jī)采樣等)及相關(guān)工具鏈
8、有CUDA性能優(yōu)化及其他硬件(如 CPU、NPU 等)的使用、相關(guān)的性能調(diào)優(yōu)經(jīng)驗(yàn),如FastTransformer、TensorRT、triton等經(jīng)驗(yàn)優(yōu)先
工作地點(diǎn)
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號(hào)樓1B2樓D區(qū)


職位發(fā)布者
HR
深圳市億道控股有限公司

-
電子技術(shù)·半導(dǎo)體·集成電路
-
500-999人
-
公司性質(zhì)未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號(hào)金富來(lái)大廈
相似職位