← 返回职位

大模型算法工程师

杭州实习 / Senior全职12 天前

岗位职责

模型基座与前沿方向探索:参与AI native OS中的大模型推理pipeline、多模态任务、认知架构等方向研发,持续提升模型在真实任务中的表现。 高质量数据与Post-Training:设计数据方案,完成大规模的后训练,重点包括强化学习(RLHF/DPO/GRPO等)和多模态能力提升,并能在多卡/分布式环境下稳定调优。 系统集成与工程落地:与工程团队协作,将模型能力集成至产品,关注推理延迟、吞吐、可扩展性等工程指标,确保稳定运行。 前沿跟踪与内部开源:探索多模型架构(如LLaVA、Qwen-VL等)、强化学习对齐方法、推理加速等新技术,并鼓励将有价值的数据集、模型权重、实验文档以开源或内部共享方式沉淀。 构建评估体系与Benchmark:围绕模型训练目标(如强化学习对齐效果、多模态理解能力、推理性能等),设计并构建高质量的评估基准(Benchmark),简历可持续追踪的评估流程,用于指导模型迭代与版本对比。

我们希望你

不仅了解Transformer、Attention、MoE的原理,更能独立完成从数据构建、SFT/DPO/RLHF训练到推理加速的全流程。 有过从0到1搭建多模态或RAG/Agent系统的经验,并且不满足于“跑通demo”,而是关注延迟优化、准确率提升(如从37%->91%)、系统稳定性等工程指标。 对开源有热情,愿意将高质量模型权重、数据集、技术报告沉淀下来。

任职要求

硕士研究生及以上学历,计算机、数学、通信等相关专业。 熟练掌握PyTorch、Hugging Face Transformers等工具。精通 Python。 有大模型Post-Training(SFT、RLHF/DPO/GRPO)和多卡/分布式训练实战经验。 有多模态LLM(如LLaVA、Qwen-VL系列)或RAG类项目的完整落地经验(从数据到评估到部署)。

加分项:

有CCFA/中科院1区等高水平论文发布经历。 有开源模型权重或高质量数据集的实际贡献经历(如Github、Hugging Face)。 熟悉推理加速工具(量化、LoRA、DeepSpeed)。 熟悉VLM架构及多模态数据-训练-测试全流程。 对强化学习对齐方法(DPO/GRPO/PPO等)有深入理解和实践经验。 能独立完成英文论文复现于技术报告撰写。

你将获得

极具竞争力的薪资。25-50k·16 双休,五险一金齐全,弹性工作时间,办公室近地铁。 远离 PUA,直接与创始人并肩作战,接触前沿科技行业视野。 轻松、平等、开放的硅谷式办公文化。

团队的其他职位
了解这群人
Humanify
Humanify AI is an AI-first company that brings intelligence back to what matters most—people. We design AI solutions that amplify human decision-making, transform complex data into meaningful insight, and create more intuitive, human-centered experiences across your business.
11-50 人·杭州