招聘动态
更多>>
研发专家/高级后端开发工程师(公有云智能操作助手)(J11021)
  • 招聘类别:
  • 活水岗位
  • 工作性质:
  • 全职
  • 招聘人数:
  • 若干
  • 发布时间:
  • 2025-09-03
  • 截止时间:
  •  

  • 工作地点:

    北京市,上海市,四川省-成都市


    工作职责:

    专注于提升云服务器/裸金属产品的大模型推理性能,推动高性能推理引擎的开发与优化,支持公有云智能操作助手等AI产品的规模化落地。

    1、技术方案设计与实施: 参与云服务器/裸金属产品大模型推理引擎技术方案的讨论与制定,聚焦于 “硬件-编译器-运行时”协同优化的关键领域,如动态量化、计算图调度优化、跨硬件抽象等。
    2、核心模块开发与优化: 深度参与 或 牵头 推理引擎核心模块(如动态批处理系统、分布式KV缓存管理、高效异构通信等)的开发与优化工作,致力于提升关键性能指标(时延/吞吐/成本)。
    3、挑战性场景攻关: 参与解决云智能体场景下的大规模模型、长上下文、多模态推理等场景下的性能挑战,研究并应用 先进的调度算法与内存管理技术(如缓存优化、计算与通信重叠)。
    4、技术探索与协同: 参与 业界前沿技术(如开源项目vLLM, TensorRT-LLM等)的研究与评估,探索 其在公司技术栈中的应用;协助 内部技术分享与知识沉淀,参与 相关基准测试与优化工作。


    任职资格:

    1、大学本科及以上学历,并取得相应学位,计算机科学、人工智能、体系结构等相关专业背景。
    2、5年以上工作经验,其中3年以上AI系统优化/高性能计算研发经验,1年以上AI推理相关研发经验。
    3、理解主流开源推理框架(如vLLM, TensorRT-LLM, Triton等)的核心原理。
    4、熟悉公司核心技术栈和业务场景者优先。有顶会论文者可不受经验限制。
    5、具备良好的沟通能力和团队协作精神,能够独立承担复杂技术项目的研发工作。
    6、有开源社区贡献或在虚拟化/容器安全领域有技术论文/专利者优先。