負責公司大模型的研發和應用,研究相關技術在搜索、推薦、廣告、創作、對話和客戶服務等領域的全新應用和解決方案,滿足使用者不斷增長的智慧交互需求,全面提升使用者在未來世界的生活和交流方式。 主要工作方向包括:
1. 探索超大規模模型,並進行極致系統優化;
2. 數據建設、指令微調、偏好對齊、模型優化;
3. 相關應用落地,包括生成創作、邏輯推理、代碼生成等;
4. 深入研究和探索在未來生活中的更多使用場景。
1. 全日制本科及以上学历,计算机、软件工程相关专业;
2. 具备优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3. 熟悉NLP、CV相关的算法和技术,熟悉大模型训练、RL算法者优先;
4. 在大模型领域主导过大影响力的项目或论文者优先;
5. 具备出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题;
6. 具有良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。