工作地点:
北京市
工作职责:
1.负责深度学习模型在边缘端的推理优化,包括但不限于模型量化(INT8/FP16)、剪枝、蒸馏、神经架构搜索(NAS)等轻量化技术;
2.深度优化主流推理引擎vllm、SGlang、TensorRT等推理引擎,提升推理性能与能效比;
3.针对GPU、NPU等异构硬件平台进行算子定制、内存优化、流水线并行等底层加速;
4.设计并实现端云协同推理架构,支持动态模型卸载、联邦学习、隐私计算等边缘智能方案;
5.构建自动化模型转换与部署工具链,提升算法到边缘设备的交付效率;
6. 跟踪边缘AI领域前沿技术(如TinyML、MoE边缘化、实时推理调度),推动技术预研与专利布局。
任职资格:
1. 计算机、电子、自动化、人工智能等相关专业硕士及以上学历,3年以上边缘AI/嵌入式AI研发经验;
2. 精通至少一种深度学习框架(PyTorch/TensorFlow/PaddlePaddle),熟悉模型导出与转换流程(ONNX等);
3. 熟练掌握模型压缩与加速技术:量化(PTQ/QAT)、结构化剪枝、知识蒸馏、低秩分解等;
4. 精通C++/Python,熟悉Linux嵌入式开发环境,具备交叉编译、性能剖析(perf、nsight)、功耗优化能力;
5. 具备良好的系统工程思维,能平衡精度、延迟、功耗、内存等多目标约束。