
崗位職責
1、負責深度學習在線推理引擎的設計與開發(fā),打造低延時,高吞吐的推理引擎;
2、參與神經(jīng)網(wǎng)絡加速技術的調(diào)研、探索和落地;
3、負責nlp大模型在實際業(yè)務場景中落地。
任職要求
1、本科及以上學歷,具備豐富的模型推理加速算法經(jīng)驗,熟悉各類主流加速庫,如:tensorrt / cudnn / mkl / xla等;熟悉各類ir,包括不限于onnx;
2、熟悉主流深度學習框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;
3、有算子開發(fā)經(jīng)驗,具備深度學習模型性能分析和優(yōu)化能力;
4、熟悉圖優(yōu)化、混合精度、剪枝、編譯優(yōu)化技術,有實操業(yè)務落地經(jīng)驗的優(yōu)先;
5、熟悉模型部署優(yōu)化,如模型量化、模型壓縮,模型轉(zhuǎn)換,模型稀疏化等;
6、熟練掌握c/c++/python編程,有大模型端到端落地經(jīng)驗者優(yōu)先;
7、熟悉pytorch源碼者優(yōu)先。




-
通信/電信
-
1000人以上
-
私營·民營企業(yè)
-
東莞市長安鎮(zhèn)烏沙步步高大道283號