简历 Download PDF

AI4Bio · 生物信息学 · 机器学习。点击按钮下载完整简历 (PDF)。

Contact Information

Name Chunzhuo Zhang (张淳卓)
Profession AI4Bio 研究者
Email zhangchunzhuo@aaib.pku.edu.cn

Experience

  • 2024 -

    生物基础模型设计
    研究机构
    设计单细胞基础模型,并探索用于虚拟细胞建模的多模态融合方法。
    • 单细胞基础模型 (53M / 300M / 600M / 2B): 使用观测数据与扰动数据进行 in-context learning,建模细胞群体层面的状态。从数据预处理、架构设计到下游评测搭建完整流程;基于 scGPT 进行改进,并在评测中优于 scGPT、Transcriptformer 和 UCE。
    • 探索单细胞数据上的 scaling law。
    • 实现从 PyTorch 到 PyTorch Lightning 的训练框架迁移;使用 FlashAttention / FlexAttention 加速注意力计算;设计自定义损失函数与多分类头。
    • 构建多任务下游评测流程,包括批次效应校正、细胞分类、扰动预测,并为单细胞基础模型设计新的评测任务。
    • 分布式训练:FSDP、数据并行、激活检查点。
    • 指导实习生完成独立项目。
    • BindCraft 蛋白设计: 与实验团队合作,在约束结合位点下设计抗原配体并生成 binder;约 5% 的设计表现出较强结合亲和力。

Education

  • 2022 - 2024

    荷兰瓦赫宁根

    硕士
    瓦赫宁根大学与研究中心
    生物信息学
    • 计算生物学 (8.5/10)、深度学习 (8/10)、基因组学 (8/10)、高级统计学 (8/10)、机器学习 (7.5/10)、分子系统生物学 (7.5/10)、软件工程 (7.5/10)
    • 蛋白质结构与序列嵌入 (sgBERT, gBERT): 通过注意力机制融合蛋白质结构与序列信息,获得蛋白质表示;初步探索多模态融合。ChunZhuo/sgBERT
    • 蛋白质-蛋白质界面假阳性预测: 在 DeepRank-GNN 基础上引入使用调和函数的等变图神经网络,并在丙氨酸扫描任务上与 HADDOCK、传统机器学习和 GNN 基线进行比较。ChunZhuo/SEGIN
    • 课程与实践:序列组装、差异基因表达、蛋白结构域分析、基因调控网络分析;使用 Java 开发停车场出入管理系统。
  • 2018 - 2022

    中国杨凌

    本科
    西北农林科技大学
    园艺
    • 高等数学 (91/100)、线性代数 (94/100)、概率论 (92/100)、基础生物化学 (91/100)、有机化学 (94/100)
    • 猕猴桃茎尖超低温疗法脱毒研究,包括 RT-PCR 与植物组织培养。

Skills

编程: Python (PyTorch, PyTorch Lightning)、R、Java、C++
机器学习系统: FlashAttention、FlexAttention、FSDP、数据并行、激活检查点
研究领域: 单细胞基础模型、蛋白质表示学习、等变图神经网络、多模态融合

Languages

英语 : 流利;IELTS 7.0 (口语 7.0);GRE 320
普通话 : 母语