工作地点:
北京市,广东省-广州市,广东省-深圳市,四川省-成都市
工作职责:
1.负责设计并实现向量数据库内置的 RAG 服务模块,提供开箱即用的 RAG 能力(包括文档摄入、分块、向量化、知识提取、上下文组装、LLM 协同等);
2.通过SQL-UDF封装标准化的 RAG 接口,支持灵活配置分块策略、嵌入模型、重排序、prompt 模板等;
3.与AI 平台团队协作,打通从原始文档到 LLM 响应的高效通路;
4.跟踪 RAG 最佳实践与前沿技术(如 LangChain、LlamaIndex、Dify、Mem0等),基于这些主流框架调用数据库内部的RAG-service构建智能体的样例。
任职资格:
1.大学本科及以上学历,并取得相应学位。计算机科学、人工智能或相关专业;
2.熟练掌握 Python/C++ 中至少一种语言,具备扎实的后端工程能力;
3.熟悉 RAG 技术栈,有实际构建或调优 RAG 系统的经验(如使用 LangChain、LlamaIndex、Dify、Mem0等)优先;
4.熟悉 LLM 推理流程、Prompt Engineering 及常见大模型 API(如 OpenAI、Claude、本地部署模型)优先;
5.对于探索新知识抱有极大的兴趣,同时对于懂得如何利用AI工具提升工作效率者优先;
具备良好的系统设计能力,能抽象通用 RAG 服务组件并兼顾灵活性与性能。