DNA编码化合物库(DEL,DNA-Encoded Library)技术在新药发现中正得到越来越多的应用。这一技术利用具有特定序列的DNA标签对所有参与构筑的分子砌块与骨架进行编码,通过“拆分-合并”的组合方式,可快速产生数以百万甚至亿计可识别的化合物分子。同时,在此基础上也建立了一套完整且海量的“信息-结构-功能”数据系统,该系统成本较低并且可以快速地探索巨大的化学空间,正被越来越多AI领域的机构与公司所关注。
近日,加州大学Mobley团队与Anagenex公司利用成都先导OpenDEL 系列产品,结合人工智能(AI)与机器学习(ML)技术,成功建立了一套新型信息学预测系统。该成果发表在ChemRxiv1。
(资料图片)
项目团队在研究中充分利用了OpenDEL 完全开放的编码与结构信息,不仅通过针对已有筛选数据的构建模块分析,实现了基于生信手段的分子砌块分析,更进一步实现了对未加入筛选的分子砌块性质的预测与评估。这不仅能够对已经产生的筛选数据进行包含了不同分子砌块以及完整分子的评估预测,也能够为后续的筛选实验设计提供有效的指导思路。该模型具有高效、易用并且数据完整的特点,未来有望成为更多基于DEL筛选与ML的研究的基础。
通过该系统可根据DEL中的信号预测未参与到DEL构建的分子表现,并能根据单个构建模块的组合方式来预测整个系列化合物的活性。由于该模型具有较高的准确性和相对简单性,因此可以成为未来研究的新基石。研究团队指出,随着数据量的增大,深度学习模型的训练与预测表现将会更好,甚至能进一步建立更为复杂的信息网络。
基于OpenDEL 数据开放的特点,研究人员会收集到大量的筛选数据,这同时也对数据背后的信息分析与挖掘产生了较大的挑战。通过该系统,可以帮助研究人员快速地聚焦信息,指导构筑模块与分子的选择,有针对性地收缩探索空间,以最小化的成本与最大化的成功率优化药物发现历程。
OpenDEL 产品简介
OpenDEL 是成都先导自主设计开发的一款开放性DEL产品,为高校、科研院所、医药类企业、AI技术平台提供快速灵活的开放性DEL产品与便捷的使用场景。
OpenDEL 包含海量的高质量DEL分子与DEL筛选信息,可为AI及ML提供养料;丰富的结构类型与优良的类药性,可快速进行靶点验证与新Hit发现;适用于各类前沿科学研究、概念验证等。
OpenDEL 包含30个设计独特的DEL库, 其中分子数量高达20亿,丰富的化学构筑方式涵盖了近20,000个单/双官能团试剂与新颖核心骨架,同时具备优良的分子类药性。
OpenDEL ,一款真正开放、开源的DEL产品
· DEL分子结构全公开
· 试剂信息全公开
· DNA标签-小分子对应关系全公开
· 构建信息全公开
· 操作流程全公开
· IP无冲突
· 高透明度的按需服务选项
关键词: