通过“筛选-扩展-优化”三步生成抗菌分子,核心逻辑是“片段决定活性,AI优化成药性”: (1)第一步:4.5亿片段的高通量虚拟筛选 研究团队整合三大片段库,构建含45,858,026个片段的数据库: GDB
化合物库与空间示例 雷蒙德的团队列举了按照化学稳定性和合成可行性的简单规则假设可以制造的分子,形成生成数据库 (Generated DataBases, GDB) :GDB-11、GDB-13和GDB-
为了提高样品效率,我们从GDB-11数据库的模拟学习中学习基本的化学规则,从而建立一个适用于所有化学计量的初始模型。然后,我们在强化学习环境中部署多个以特定化学计量为条件的模型副本。 To improve sample-efficiency we learn basic chemical rules from imitation learning on the GDB-11 database