1、GRAPH REPRESENTATION LEARNING FOR DRUG DISCOVERY王皓 副研究员中国科学技术大学|Outline BackgroundRelated workMolecular Property PredictionMolecule GenerationMolecular representation LearningOur WorkReferences2Outline BackgroundRelated workMolecular Property PredictionMolecule GenerationMolecular representation Lea
2、rningOur WorkReferences3Background我不是药神我不是药神中的天价药中的天价药为什么这么贵?新药研发平均成本15亿-20亿美元,研发周期10年以上,90%的项目失败率。制药领域中的制药领域中的EroomsErooms LawLaw法则法则Moores Law(摩尔定律)反着写。尽管技术在日新月异发展,但制药成本却在持续增加,几乎每隔9年就翻一倍。4OutlineBackgroundRelated workMolecular Property predictionMolecule GenerationMolecular representation Learning
3、Our WorkReference 5Related Work6Molecule and Protein药物设计中的研究主体药物设计中的研究主体分子(Molecule),蛋白质(Protein)通常转换成Graph 用GNN处理例如:7Fig.1:Small MoleculesFig.2:ProteinsMolecular Property PredictionGraph Neural NetworksGCN(ICLR 2017),GAT(ICLR 2018),GIN(ICLR 2019),Neural Message Passing for Quantum Chemistry,ICML 20
4、17GNN模型的一般化总结消息传播机制Message Functions:+1=,Aggregate Functions:+1=+1,Update Functions:+1=(,+1)Readout Functions:=,8Molecular Property PredictionGCN+1=1212,其中,=+,=,令=1212GCN-Message Passing+1=1,其中,是节点i的邻居节点,是节点和节点的平方根的乘积|()|Message Function+1=,=1,Aggregate Function+1=+1=+1Update Function+1=(,+1)=(+1)9M
5、olecular Property PredictionDirectional Message Passing for Molecular Graphs,ICLR 2020GCN 无法区分一个六元环(环己烷)和两个三元环(环丙烷)(节点表征相同,邻居也相同)仅使用距离信息有局限性(cutoff的设置)引入方向信息(键角)10Figure1.Aggregation scheme for message embeddings.Molecular Property Prediction键角键角(,)=Message passing+1=,()(,(,)Physically Based Represe
6、ntations密度泛函理论(DFT)电子密度决定性质电子密度通过求解薛定谔方程获得球面极坐标解球面极坐标解球面贝塞尔函数球面贝塞尔函数(Spherical Bessel Functions,SBF)11Molecular Property PredictionPhysically Based Representations2D spherical Fourier-Bessel basis(距离、角度)Radial Bessel basis(距离)12Figure1.2D spherical Fourier-Bessel basisFigure2.Radial Bessel basisMole