任职要求:
1. 全日制本科以上学历(学校后缀不要学院,比如xx学院不合适)有3年以上工作经验,一年以上的医疗数据治理经验,较强的学习能力;
2. 熟悉搭模型原理,熟练通过api等方式使用各种大模型;
3. 了解RAG技术原理,熟悉常见的RAG开发框架;
4. 熟练掌握python编程语言,熟悉hive 、spark等体系结构;
5. 熟悉Doris、ClickHourse等MPP数据库,有实践经验者优先。
岗位职责:
1. 负责医疗大模型训练数据的构建,包括数据采集、清洗和处理,构建高质量模型训练及评测数据;
2. 负责医疗大模型应用智能体的知识库构建,能结合应用场景设计知识库、构建独立知识库;
3. 打通医疗数据的全生命周期,实现自动化数据流转,辅助提升训练、评估等环节数据使用效率。