大模型算法工程师

杭州实习 / Senior全职12 天前

岗位职责

模型基座与前沿方向探索：参与AI native OS中的大模型推理pipeline、多模态任务、认知架构等方向研发，持续提升模型在真实任务中的表现。高质量数据与Post-Training：设计数据方案，完成大规模的后训练，重点包括强化学习（RLHF/DPO/GRPO等）和多模态能力提升，并能在多卡/分布式环境下稳定调优。系统集成与工程落地：与工程团队协作，将模型能力集成至产品，关注推理延迟、吞吐、可扩展性等工程指标，确保稳定运行。前沿跟踪与内部开源：探索多模型架构（如LLaVA、Qwen-VL等）、强化学习对齐方法、推理加速等新技术，并鼓励将有价值的数据集、模型权重、实验文档以开源或内部共享方式沉淀。构建评估体系与Benchmark：围绕模型训练目标（如强化学习对齐效果、多模态理解能力、推理性能等），设计并构建高质量的评估基准（Benchmark），简历可持续追踪的评估流程，用于指导模型迭代与版本对比。

我们希望你

不仅了解Transformer、Attention、MoE的原理，更能独立完成从数据构建、SFT/DPO/RLHF训练到推理加速的全流程。有过从0到1搭建多模态或RAG/Agent系统的经验，并且不满足于“跑通demo”，而是关注延迟优化、准确率提升（如从37%->91%）、系统稳定性等工程指标。对开源有热情，愿意将高质量模型权重、数据集、技术报告沉淀下来。

任职要求

硕士研究生及以上学历,计算机、数学、通信等相关专业。熟练掌握PyTorch、Hugging Face Transformers等工具。精通 Python。有大模型Post-Training（SFT、RLHF/DPO/GRPO）和多卡/分布式训练实战经验。有多模态LLM（如LLaVA、Qwen-VL系列）或RAG类项目的完整落地经验（从数据到评估到部署）。

加分项：

有CCFA/中科院1区等高水平论文发布经历。有开源模型权重或高质量数据集的实际贡献经历（如Github、Hugging Face）。熟悉推理加速工具（量化、LoRA、DeepSpeed）。熟悉VLM架构及多模态数据-训练-测试全流程。对强化学习对齐方法（DPO/GRPO/PPO等）有深入理解和实践经验。能独立完成英文论文复现于技术报告撰写。

你将获得

极具竞争力的薪资。25-50k·16 双休,五险一金齐全,弹性工作时间,办公室近地铁。远离 PUA,直接与创始人并肩作战,接触前沿科技行业视野。轻松、平等、开放的硅谷式办公文化。

团队的其他职位

了解这群人

Humanify AI is an AI-first company that brings intelligence back to what matters most—people. We design AI solutions that amplify human decision-making, transform complex data into meaningful insight, and create more intuitive, human-centered experiences across your business.

11-50 人·杭州