网站地图 原创论文网,覆盖经济,法律,医学,建筑,艺术等800余专业,提供60万篇论文资料免费参考
主要服务:论文发表、论文修改服务,覆盖专业有:经济、法律、体育、建筑、土木、管理、英语、艺术、计算机、生物、通讯、社会、文学、农业、企业

药物肝脏毒性预测中人工智能的使用与展望

来源:原创论文网 添加时间:2021-03-15

  摘    要: 药物性肝损伤(Drug-induced liver injury, DILI)是导致药物终止临床试验和退出市场的主要原因,由于评价候选药物潜在毒性的动物模型和体外细胞模型物种间的一致性较差、无法模拟人体内复杂的环境等原因导致准确度较低。随着组合化学和高通量筛选技术的发展产生了大量数据,并推动了人工智能和学习算法的进步,越来越多的人工智能应用于药物性肝损伤研究,提高了预测药物肝脏毒性的准确性。为了比较不同的建模算法在药物肝脏毒性预测中的优劣并为今后的研究提供一定的参考,对近十年使用人工智能针对肝脏毒性开发的QSAR模型进行了综述。

  关键词: 药物性肝损伤; 药物毒性; 人工智能; 机器学习; 定量构效关系(QSAR);

  Abstract: Drug-induced liver injury (DILI) is the main reason for drug candidates to suspend clinical trials and withdrawal from the market. Animal models and in vitro cell models used in evaluating the potential toxicity of drug candidates are in accurate due to poor interspecies consistency and inability to simulate complex environments in vivo. With the development of combinatorial chemistry and high-throughput screening techniques, the generation of large amounts of data promotes the advancement of artificial intelligence and learning algorithms. More and more machine artificial intelligence has been applied to the study of drug-induced liver injury, which improves the accuracy of predicting drug liver toxicity. In order to dicuss the advantages and disadvantages of different modeling algorithms in the prediction and provide some references for future research,we summarized the QSAR model for hepatotoxicity using machine learning in the past ten years.

  Keyword: drug-induced liver injury; drug toxicity; artificial intelligence; machine learning; QSAR;

  药物研发是一项复杂、昂贵、耗时的过程,并且具有很高的损耗率[1,2]。据统计,一种新型处方药物的平均研发周期约10~17年[3],税前支出约25.58亿美元[4]。然而,尽管投入了大量的时间和经济成本,新药的研发成功率仍然很低。药物性肝损伤(Drug-induced liver injury,DILI)是药物终止临床试验和退出市场的主要原因[5,6,7],目前已导致曲格列酮、布洛芬栓、替卡韦等药物的退市[8,9]。DILI是原因是药物本身或其代谢产物具有肝脏毒性[10],其表现可以从肝酶升高到肝功能衰竭[11,12]。此外,接触程度、环境因素、遗传因素等都可能在肝毒性中起作用[13,14]。因此,临床前阶段的药物肝脏毒性预测虽然非常必要,但由于涉及的因素过多往往难以准确地实现[15]。
 

药物肝脏毒性预测中人工智能的使用与展望
 

  目前,主要使用动物模型来评价候选药物潜在的肝脏毒性,由于药物的毒副作用,其损耗率已经超过20%,并且还在迅速上升[16]。此外,动物模型未涉及人体生理学的多个方面,物种间的一致性较差[17],在预测候选药物潜在毒性方面表现不佳。此后,由于体外细胞模型能够反映一定的人体生理学特征,因此提高了预测药物毒性的准确性[18,19]。然而,简单的体外细胞模型仍无法完全体现人体内复杂的环境,如酶与药物复杂的相互作用以及慢性毒性机制,其准确性仍然有待提高。因此,需尽早开发出更有效的方法来识别和淘汰安全性较差的药物。

  与动物试验和体外细胞模型相比,用于评估药物潜在毒性的计算工具几乎是没有成本的,并且适用于虚拟筛选合成前的化合物。定量构效关系(Quantitative structure–activity relationship,QSAR)是一种广泛用于预测药物毒性和生成模型的计算方法,所得模型的质量在很大程度上取决于所采用的化学描述符和建模算法。早期的模型通常基于简单的经验描述符(如物理化学性质)和线性回归算法[20,21],这类模型易于实现和解释,但仅适用于与建模集高度相似的化合物。后来,大量的数据使得人工智能和机器学习迅速发展,更复杂的算法如深度学习以及更多样的描述符应用于QSAR建模,因此提高了QSAR的普适性和准确性[22,23]。

  为了比较不同的建模算法在药物肝脏毒性预测中的优劣,并为今后的研究提供一定的参考,本文主要对近十年使用人工智能针对肝脏毒性开发的QSAR模型进行了综述。首先,简单介绍了大数据和人工智能的发展;随后,对近十年使用人工智能针对肝脏毒性开发的QSAR模型研究进行了综述;此外,讨论了目前机器学习在计算毒理学的局限性;最后,提出了人工智能在计算毒理学应用中的展望。

  1、 大数据和人工智能

  在过去的十几年中,随着组合化学和高通量筛选(high-throughput screening, HTS)技术的发展[24,25],产生了大量的生物数据[26,27],并由此推动了几个公共数据库的建立,如:包含化合物结构和生物特性的公共数据库PubChem[28],包含化合物结构、功能、ADME和毒性数据库ChEMBL[29],关注药物毒性的数据库DrugMatrix,包含所有批准的药物及其机制、相互作用和相关靶标数据库DrugBank,主要收集药物靶点和类药小分子之间相互作用亲和力的Binding数据库[30]等。大数据并不仅仅意味着大量的数据,其真正有价值的信息是数据类型的多样性[31]。药物研发恰恰是一个拥有多样数据源的领域,研究者们可通过相关的数据,利用先进的搜索技术和算法构建预测模型,该模型可将一组分子描述符与药物的关键性质(如药物的吸收、分布、代谢、排泄和毒性,即ADMET)联系起来,并利用该模型来预测新化合物的性质,从而促进药物的研发[32,33,34,35]。

  2 、学习算法

  2.1 、算法的发展

  在药物研发的早期阶段(20世纪90年代之前),常使用线性回归算法[36]和化学结构特征描述符(如原子类型和碎片描述符[37,38])来构建模型。随着数据量的增加,新型化学描述符如拓扑描述符[39]和分子指纹描述符[40]得到发展,增加了用于建模的描述符大小和类别,促进了人工智能在药物研发中的应用。从20世纪90年代到21世纪,基于非线性算法开发的机器学习算法(如K-近邻),支持向量机和随机森林被广泛应用于建模研究中。此后,随着硬件能力的提高和数据集的增加,不断有新的机器学习方法被应用于药物的研发,如图1所示。

  图1 数据大小、计算机硬件发展和算法发展的关系
图1 数据大小、计算机硬件发展和算法发展的关系

  Fig.1 Relationship between data size, computer hardware and algorithm development

  2.2 、常用的机器学习算法

  根据不同的学习方式和处理问题的类型,常用的机器学习算法有:逻辑回归(Logistic Regression)[41]、反向传递神经网络(Back Propagation Neural Network)[42]、K-Means算法[43]、支持向量机(Support Vector Machine,SVM)[44,45]、K近邻(k-Nearest Neighbor,k-NN)[46]、随机森林(Random Forest,RF)[47]、朴素贝叶斯算法(Naive Bayes classifier,NB)[48]、线性判别分析(Linear Discriminate Analysis,LDA)[49]、人工神经网络(Artificial Neural Network,ANN)[50,51,52]和深度学习(Deep Learning,DL)。其中深度学习包括深度神经网络(Deep Neural Networks,DNNs)[53]、卷积神经网络(ConvolutionalNeural Networks,CNNs)[54]、循环或递归神经网络(Recurrent orRecursiveNeural Networks,RNNs)[55]以及包含超过一个隐藏层、每层有多个神经元的深度网络,见图2。

  图2 不同类型的机器学习算法
图2 不同类型的机器学习算法

  Fig.2 Different types of machine learning algorithms

  3 、人工智能在药物肝脏毒性预测中的应用

  预测药物毒性的计算方法主要分为基于化合物结构的方法和基于代谢酶的方法。在基于化合物结构的方法中,已知毒性化合物和非毒性化合物的结构建模,导出QSAR模型进而预测新化合物的潜在毒性。在基于代谢酶的方法中,主要针对细胞色素P450酶,该酶系在外源性化合物的生物转化中起着十分重要的作用。

  3.1、 基于结构的方法

  从化学结构直接预测候选药物的肝脏毒性对于指导开发更安全的药物至关重要。2010年,Fourches等[56]使用531个化合物及其肝脏病理活性作为数据集,利用SVM算法,以Dragon描述符建立QSAR模型来预测化合物是否在人体中产生肝脏毒性。通过5倍交叉验证,模型的预测准确度为61.9%~67.5%,虽然准确度一般,但该工作开启了机器学习在肝脏毒性预测中的研究。

  2010年,Rodgers等[57]同样基于化学结构建立了药物肝脏毒性二分类的QSAR模型。研究者使用从HLAED数据库经筛选得到的295个化合物及其肝脏毒性作为数据集,利用k-NN算法,以MolConnZ和Dragon两种不同的描述符构建QSAR模型。经验证,以Dragon为描述符的模型灵敏度>73%,特异性>94%,具有较好的预测性能。以MolconnZ为描述符的模型预测能力较差,研究人员未给出相应的数据。

  为了进一步提高算法的预测性能,2011年,Liew等[58]开发了一种预测肝脏毒性的混合学习模型。研究人员使用从FDA橙皮书[59]、默克索引[60]和《药物性肝病》[61]中筛选得到1087个化合物(654种阳性化合物和433种阴性化合物)作为数据集,利用k-NN、SVM和NB算法,采用PaDEL描述符构建多个QSAR独立模型。通过验证,有794个独立模型达到要求(AUC(Area Under Curve)≥0.6,灵敏度≥0.6,特异性≥0.6)并被纳入用来构建混合模型。从随机抽取5个独立模型开始,以4个为单位递增(如5、9、……、793个独立模型),直到由793个独立模型组成混合模型,各模型的平均性能如图3所示。当独立模型数量达到617个时(408个k-NN、195个SVM、14个NB),其预测性能趋于稳定,此时的AUC为82.2%,准确度87.6%,灵敏度91.9%,特异性81.1%。在valBLACK集中,其AUC为92.4%。目前,该混合模型可在网站http://padel.nus.edu下载使用。

  图3 混合学习模型的数量和性能对比图
图3 混合学习模型的数量和性能对比图

  Fig.3 Number and performance of mixed learning algorithms

  以往的肝脏毒性模型大多数是使用分子描述符建立的,2011年,Low等[62]比较了单独或同时使用分子描述符和生物测定数据描述符(即肝脏毒性基因组学数据)对模型预测性能的影响。研究者使用日本毒性基因组学项目[63]中的127种药物作为数据集,采用k-NN、SVM、RF和DWD(distance weighted discrimination)[64]为学习算法建立预测模型。经验证,单独使用分子描述符建立的QSAR模型预测性能普遍较差,正确分类率(Correct Classification Rate,CCR)在55%~61%之间;单独使用生物测定数据描述符建立的QSAR模型,平均预测CCR在69%~76%之间;同时使用分子描述符和生物测定数据描述符构建的混合模型的CCR没有超过单纯基于生物测定数据模型的CCR,但该混合模型识别了重要的分子描述符,增强了对建模结果的解释。

  针对胆红素血症、胆囊炎、肝硬化等毒副作用,2011年,Liu等[65]从SIDER数据库中筛选出13种肝脏毒副作用分别建立预测模型,并将其进一步组合成1个DILI预测系统(DILIps)。3个独立的测试集在DILIps中的预测准确率为60%~70%,见表1。该DILIps模型有望成为筛选候选药物是否具有肝脏毒性的工具。

  表1 肝脏毒性模型的预测性能
表1 肝脏毒性模型的预测性能

  2015年,Liu等[66]针对肝脏肥大、损伤和增生性病变,使用ToxRefDB[67]和ToxCast数据库的677个化合物及其肝毒性作为数据集,采用711个体外生物活性描述符(来自ToxCast assays)和4376个化学结构描述符(来自QikProp、OpenBabel、PaDEL和PubChem),利用监督学习算法,包括LDA、NB、SVM、CART、k-NN以及这些分类器的集合(ENSMB)来构建预测肝毒性的模型。通过10倍交叉验证,混合分类器在预测肝脏肥大(准确性为0.84±0.08)、损伤(准确性为0.80±0.09)和增生性病变(准确性为0.80±0.10)方面具有最佳的准确性,该研究体现了使用多个算法的集合来构建预测模型的优势。

  2015年,Muller等[68]针对胆汁阻塞、氧化应激、线粒体损伤等7种不同的药物性肝损伤,采用分子描述符、肝脏毒性生物描述符以及两者的混合描述符,利用SVM、ANNs和RF构建药物肝脏毒性的预测模型。在独立测试集上验证表明,单独使用分子描述符的模型表现不佳,而包含肝脏毒性的生物描述符的模型具有较高的预测能力,5倍交叉验证的平均精度约90%。

  2015年,Xu等[69]首次使用深度学习算法开发药物肝脏损伤模型,研究人员使用从NCTR数据集[70]、Greene的数据集、Xu数据集和Liew数据集筛选得到的475个化合物及其毒性数据为训练集,分别采用Mold2和PaDEL两种不同的描述符进行模型的训练。结果表明,使用深度学习开发的模型,其准确度为86.9%,灵敏度为82.5%,特异性为92.9%,AUC为95.5%,比之前所有的预测模型的性能要好,如图4所示。目前,该预测模型可在http://www.repharma.cn/DILIserver/DILI_home.php免费获得,该研究展示了深度学习在处理少量数据中的巨大潜力。

  图4 不同描述符类型模型的预测ROC曲线
图4 不同描述符类型模型的预测ROC曲线

  Fig.4 ROC curve for different descriptor type models

  3.2 、基于配体的方法

  细胞色素P450(cytochromeP450,CYP450)是自然界中普遍存在的酶家族,并参与大部分药物的代谢[71]。在人类身上,已经鉴定出超过50种CYP450酶,其中CYP1A2、CYP2C9、CYP2C19、CYP2D6和CYP3A4这5种亚型催化药物分子脱烷基、氧化、环氧化、亚砜化、脱氨基化等90%的代谢反应[72,73]。通常药物经代谢反应后毒性降低,但由于某些药物分子抑制CYP450酶系(CYP)的活性,导致药物无法代谢并在体内大量积蓄,造成肝损伤。此外,部分药物经CYP450酶代谢产生亲电或氧自由基的反应性代谢产物与细胞膜发生化学反应直接导致肝损伤,或与肝细胞内大分子共价结合,通过诱发免疫反应等引起免疫病理损伤[74]。因此,利用QSAR模型研究CYP450与药物分子的相互作用,在药物开发早期检测潜在的肝毒性同样是非常重要的手段。

  2011年,Cheng等[75]使用C4.5决策树[76]、k-NN和贝叶斯组成的集合算法对包含24700种化合物的大型数据集开发了针对上述5种主要CYP酶抑制剂预测模型。通过5倍交叉验证,CYP1A2、CYP2C9、CYP2C19、CYP2D6和CYP3A4模型的AUC面积分别为:0.764~0.815,0.837~0.861,0.793~0.842,0.839~0.886和0.754~0.790。这些分类模型适用于上述5种CYP亚型抑制剂的虚拟筛选,可用于药物研发中发现具有潜在毒性的化学物。

  CYP1A2是CYP450酶系的主要成员,占人体肝脏中CYP总含量的15%。2011年,Novotarskyi等[77]使用PubChem BioAssay数据库中的3745个CYP1A2抑制剂和3741个CYP1A2非抑制剂为数据集,采用E-state, Dragon和 ISIDA SMF描述符,利用ASNN[78]、k-NN、RT和SVM算法构建并比较了80种QSAR模型。其中,最优的模型在内部和外部测试集上分别实现了83%和68%的正确分类率。

  2011年,Sun等[79]使用PubChem数据库中的17143个化合物为数据集,首次采用原子类型分子描述符,利用支持向量分类(support vector classification,SVC)[80]为上述5种CYP亚型建立预测模型。优化后的SVC模型对5种CYP450酶的测试集都具有较高的预测能力,对CYP1A2、CYP2C9、CYP2C19、CYP2D6和CYP3A4的AUC面积分别为0.93、0.89、0.89、0.85和0.87。该研究表明,从高质量的数据集中生成的原子类型描述符,能为SVM算法提供丰富的学习数据,并为药物毒性预测提供有价值信息。

  2013年,Rostkowski等[81]使用PubChem生物测定数据库中筛选得到的17143个化合物为数据集,利用SVM算法,对上述5种CYP450酶分别创建训练模型,经验证AUC值在0.88到0.95之间,见表2。除CYP2D6模型之外,所有模型的AUC值均在90%以上。该研究可以帮助药物化学家了解哪些CYP亚型会被化合物抑制,以避免药物之间的相互作用,从而避免肝脏毒性。

  表2 各CYP模型的预测性能
表2 各CYP模型的预测性能

  2015年,Su等[82]使用美国国立卫生研究院化学基因组中心(NCGC)[83]的16000多种化合物为数据集,采用PaDEL、Mold2和PubChem指纹描述符及不同的组合为描述符,利用基于规则的C5.0算法[84]和SVM来构建预测模型。通过测试,C5.0与SVM的性能相当,最佳的C5.0模型的平均灵敏度和特异性分别为74.7%和80.7%,最佳的SVM模型的平均灵敏度和特异性分别为79.4%和81.7%,两种模型的灵敏度和特异性的平均百分比差异很小。

  2015年,Hughes等[85]利用深度卷积神经网络来预测分子能否发生环氧化反应,从而预测潜在的肝脏毒性。研究人员利用702个环氧化反应数据库构建预测模型,准确率为94.9%,分离环氧化和非环氧化分子的准确率为79.3%。两年后,Hughes等[86]发现,DCNN还可以预测药物代谢中醌类化合物的形成,用来区分该化合物能否形成醌类分子,准确率为88.2%。

  4 、人工智能存在的问题及展望

  虽然HTS技术产生了大量的数据,但是由于药物研发本身高风险的特性,大多数的测试结果是阴性的,导致HTS数据库包含的活性数据往往比无活性数据少得多[87,88]。此外,深度学习虽然可以用于无监督学习,而且可以很好地处理有噪声的数据,然而,它存在数据拟合过度问题。例如,当一个DNN模型有两个隐藏层,每个隐藏层有4000个神经元,使用5000个输入层分子描述符,那么将会调整超过3600万的权重,很容易出现过拟合现象。此外,无法解释的“黑盒”现象以及计算成本比人工神经网络或其他学习方法更高也是人工智能目前面临的问题[89]。

  虽然人工智能还存在一些不足,但研究者们正在努力克服这些问题。dropout算法、无监督的预训练和早期停止可以有效地避免过拟合现象[90,91,92],谷歌公司开发的TensorFlow等程序包可以大大降低构建DNN模型的难度,GPU硬件的不断改进和云计算的发展有望减轻计算负担,经济合作与发展组织(经合组织)正在努力建立QSAR模型验证的原则来量化模型的预测性能[93,94,95]。相信随着高通量实验产生的大量体外毒性数据,以及神经网络和学习算法的发展,人工智能将成为挖掘大数据中隐藏信息强有力的工具,并在药物分子的毒性预测中“大展身手”。

  参考文献

  [1] ZHU H. Big data and artificial intelligence modeling for drug discovery [J]. Annu. rev. pharmacol. toxicol., 2020, 60: 573-89
  [2] BLOMME E A, WILL Y. Toxicology strategies for drug discovery: Present and future [J]. Chem. Res. Toxicol., 2016, 29(4): 473-504.
  [3] ASHBURN T T, THOR K B. Drug repositioning: Identifying and developing new uses for existing drugs [J]. Nat. Rev. Drug Discov., 2004, 3(8): 673-83.
  [4] DIMASI J A, GRABOWSKI H G, HANSEN R W. Innovation in the pharmaceutical industry: New estimates of R&D costs [J]. J. Health Econ., 2016, 47: 20-33.
  [5] HAY M, THOMAS D W, CRAIGHEAD J L, et al. Clinical development success rates for investigational drugs [J]. Nat. Biotechnol., 2014, 32(1): 40-51.
  [6] OSTAPOWICZ G, FONTANA R J, SCHI?DT F V, et al. Results of a prospective study of acute liver failure at 17 tertiary care centers in the United States [J]. Ann. Intern. Med., 2002, 137(12): 947-54.
  [7] XU J J, DIAZ D, O'BRIEN P J. Applications of cytotoxicity assays and pre-lethal mechanistic assays for assessment of human hepatotoxicity potential [J]. Chem. Biol. Interact., 2004, 150(1): 115-128.
  [8] HOLT M P, JU C. Mechanisms of drug-induced liver injury [J]. AAPS J., 2006, 8(1): E48-E54.
  [9] KAPLOWITZ N. Idiosyncratic drug hepatotoxicity [J]. Nat. rev. Drug discov., 2005, 4(6): 489-499.
  [10] GUNAWAN B K, KAPLOWITZ N. Mechanisms of drug-induced liver disease [J]. Clin. liver dis., 2007, 11(3): 459-475.
  [11] WILLIAMS D P. Toxicophores: Investigations in drug safety [J]. Toxicology, 2006, 226(1): 1-11.
  [12] ZIMMERMAN H J. Hepatotoxicity: The adverse effects of drugs and other chemicals on the liver [M]. Lippincott Williams & Wilkins, 1999.
  [13] KOLA I, LANDIS J. Can the pharmaceutical industry reduce attrition rates? [J]. Nat. rev. Drug discov., 2004, 3(8): 711-716.
  [14] KALGUTKAR A S, GARDNER I, OBACH R S, et al. A comprehensive listing of bioactivation pathways of organic functional groups [J]. Curr. drug metab., 2005, 6(3): 161-225.
  [15] GREENE N, FISK L, NAVEN R T, et al. Developing structure-activity relationships for the prediction of hepatotoxicity [J]. Chem. Res. Toxicol., 2010, 23(7): 1215-1222.
  [16] KOLA I, LANDIS J. Can the pharmaceutical industry reduce attrition rates? [J]. Nat. Rev. Drug Discov., 2004, 3(8): 711-715.
  [17] DRIESSEN M, VITINS A P, PENNINGS J L, et al. A transcriptomics-based hepatotoxicity comparison between the zebrafish embryo and established human and rodent in vitro and in vivo models using cyclosporine A, amiodarone and acetaminophen [J]. Toxicol. Lett., 2015, 232(2): 403-412.
  [18] BELL C C, HENDRIKS D F, MORO S M, et al. Characterization of primary human hepatocyte spheroids as a model system for drug-induced liver injury, liver function and disease [J]. Sci. Rep-UK, 2016, 6: 25187.
  [19] SCHWARTZ M P, HOU Z, PROPSON N E, et al. Human pluripotent stem cell-derived neural constructs for predicting neural toxicity [J]. P. Natl. Acad. Sci. USA, 2015, 112(40): 12516-12521.
  [20] ABRAHAM M H, KUMARSINGH R, COMETTO-MUNIZ J E, et al. Draize eye scores and eye irritation thresholds in man can be combined into one QSAR [J]. Ann. N Y Acad. Sci., 1998, 855: 652-656.
  [21] ABRAHAM M H, KUMARSINGH R, COMETTO-MUNIZ J E, et al. A quantitative structure-activity relationship (QSAR) for a draize eye irritation database [J]. Toxicol. In Vitro, 1998, 12(3): 201-207.
  [22] MA J, SHERIDAN R P, LIAW A, et al. Deep neural nets as a method for quantitative structure–activity relationships [J]. J. chem. inf. model., 2015, 55(2): 263-274.
  [23] CHING T, HIMMELSTEIN D, BEAULIEU-JONES B, et al. Opportunities and obstacles for deep learning in biology and medicine. JR Soc Interface 15: 20170387 [M]. 2017.
  [24] MALO N, HANLEY J A, CERQUOZZI S, et al. Statistical practice in high-throughput screening data analysis [J]. Nat. Biotechnol., 2006, 24(2): 167-175.
  [25] ZHU H, XIA M. High-Throughput Screening Assays in Toxicology [M]. New York: Springer-Verlag, 2016.
  [26] KLEKOTA J, BRAUNER E, ROTH F P, et al. Using high-throughput screening data to discriminate compounds with single-target effects from those with side effects [J]. J. chem. inf. model., 2006, 46(4): 1549-1562.
  [27] MACARRON R, BANKS M N, BOJANIC D, et al. Impact of high-throughput screening in biomedical research [J]. Nat. Rev. Drug Discov., 2011, 10(3): 188-195.
  [28] SAYERS E W, BARRETT T, BENSON D A, et al. Database resources of the National Center for Biotechnology Information [J]. Nucleic Acids Res., 2010, 38: D5-D16.
  [29] GAULTON A, BELLIS L J, BENTO A P, et al. ChEMBL: A large-scale bioactivity database for drug discovery [J]. Nucleic Acids Res., 2012, 40: D1100- D1107.
  [30] GILSON M K, LIU T, BAITALUK M, et al. BindingDB in 2015: A public database for medicinal chemistry, computational chemistry and systems pharmacology [J]. Nucleic Acids Res., 2016, 44: D1045- D1053.
  [31] KHOZIN S, KIM G, PAZDUR R. Regulatory watch: From big data to smart data: FDA's INFORMED initiative [J]. Nat. Rev. Drug Discov., 2017, 16(5): 306.
  [32] CAMPBELL S J, GAULTON A, MARSHALL J, et al. Visualizing the drug target landscape [J]. Drug discov. today, 2010, 15(1/2): 3-15.
  [33] GEPPERT H, VOGT M, BAJORATH J. Current trends in ligand-based virtual screening: molecular representations, data mining methods, new application areas, and performance evaluation [J]. J. chem. inf. model., 2010, 50(2): 205-216.
  [34] HASAN S, BONDE B K, BUCHAN N S, et al. Network analysis has diverse roles in drug discovery [J]. Drug discov. today, 2012, 17(15/16): 869-874.
  [35] YANG Y, ADELSTEIN S J, KASSIS A I. Target discovery from data mining approaches [J]. Drug discov. today, 2009, 14(3/4): 147-154.
  [36] EBEL S . Quantitative drug design: A critical introduction (medicinal research series, Vol. 8) von Y. C. Martin, 440 S. Preis SFrs 105,–, Marcel Dekker, Inc. New York, N. Y. 1978[J]. Archiv. der. Pharmazie, 1979, 312(5):462-463.
  [37] ZEFIROV N S, PALYULIN V A. Fragmental approach in QSPR [J]. J. chem. inf. copm. sci., 2002, 42(5): 1112-1122.
  [38] LABUTE P. A widely applicable set of descriptors [J]. J. Mol. Graph. Model., 2000, 18(4/5): 464-477.
  [39] GOZALBES R, DOUCET J, DEROUIN F. Application of topological descriptors in QSAR and drug design: History and new trends [J]. Curr. Drug Targets, 2002, 2(1): 93-102.
  [40] WILLETT P. Similarity-based virtual screening using 2D fingerprints [J]. Drug discov. today, 2006, 11(23/24): 1046-1053.
  [41] MEURER W J, TOLLES J. Logistic regression diagnostics: understanding how well a model predicts outcomes [J]. Jama, 2017, 317(10): 1068-1069.
  [42] HECHT-NIELSEN R. Theory of the backpropagation neural network [M]. Elsevier: Neural networks for perception, 1992.
  [43] ALSABTI K, RANKA S, SINGH V. An efficient k-means clustering algorithm [M]. Elsevier: Neural networks for perception, 1997.
  [44] VAPNIK V. The nature of statistical learning theory [M]. New York: Springer-Verlag doi, 1995.
  [45] BURGES C J. A tutorial on support vector machines for pattern recognition [J]. Data min. knowl. disco., 1998, 2(2): 121-167.
  [46] GARCIA V, DEBREUVE E, BARLAUD M. Fast k nearest neighbor search using GPU; proceedings of the 2008 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops, F, 2008 [C]. IEEE.
  [47] LIAW A, WIENER M. Classification and regression by randomForest [J]. R news, 2002, 2(3): 18-22.
  [48] RISH I. An empirical study of the naive Bayes classifier; proceedings of the IJCAI 2001 workshop on empirical methods in artificial intelligence, F, 2001 [C].
  [49] IOFFE S. Probabilistic linear discriminant analysis; proceedings of the European Conference on Computer Vision, F, 2006 [C]. Springer.
  [50] BURDEN F, WINKLER D. Bayesian regularization of neural networks [J]. Methods Mol. Biol., 2008, 458: 25-44.
  [51] MITCHELL J B. Machine learning methods in chemoinformatics [J]. Wiley Interdiscip Rev. Comput. Mol. Sci., 2014, 4(5): 468-81.
  [52] ROSENBLATT F. The perceptron: a probabilistic model for information storage and organization in the brain [J]. Psychol. Rev., 1958, 65(6): 386.
  [53] HINTON G, DENG L, YU D, et al. Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups [J]. IEEE Signal process. mag., 2012, 29(6): 82-97.
  [54] SUN Y, WANG X, TANG X. Deep convolutional network cascade for facial point detection; proceedings of the Proceedings of the IEEE conference on computer vision and pattern recognition, F, 2013 [C].
  [55] PINEDA F J. Generalization of back-propagation to recurrent neural networks [J]. Phys. rev. lett., 1987, 59(19): 2229.
  [56] FOURCHES D, BARNES J C, DAY N C, et al. Cheminformatics analysis of assertions mined from literature that describe drug-induced liver injury in different species [J]. Chem. res. toxicol., 2010, 23(1): 171-183.
  [57] RODGERS A D, ZHU H, FOURCHES D, et al. Modeling liver-related adverse effects of drugs using k nearest neighbor quantitative structure- activity relationship method [J]. Chem. res. toxicol., 2010, 23(4): 724-732.
  [58] LIEW C Y, LIM Y C, YAP C W. Mixed learning algorithms and features ensemble in hepatotoxicity prediction [J]. J. Comput. Aid. Mol. Des., 2011, 25(9): 855.
  [59] HOME F. Orange book: Approved drug products with therapeutic equivalence evaluations [J]. USA: FDA, 2013, 2(3):13-18.
  [60] BUDAVARI S, O'NEIL M, SMITH A, et al. The Merck index. An encyclopedia of chemicals, drugs, and biologicals. Rahway, NJ: Merck and Co [J]. Inc Google Scholar, 1989, 2(3):13-18.
  [61] NOVAK D, LEWIS J H. Drug-induced liver disease [J]. Curr. opin. gastroen., 2003, 19(3): 203-215.
  [62] LOW Y, UEHARA T, MINOWA Y, et al. Predicting drug-induced hepatotoxicity using QSAR and toxicogenomics approaches [J]. Chem.l res. toxicol., 2011, 24(8): 1251-1262.
  [63] UEHARA T, ONO A, MARUYAMA T, et al. The Japanese toxicogenomics project: application of toxicogenomics [J]. Mol. Nutr. Food Res., 2010, 54(2): 218-227.
  [64] WANG B, ZOU H. Sparse distance weighted discrimination [J]. J. Comput. Graph. Stat., 2016, 25(3): 826-38.
  [65] LIU Z, SHI Q, DING D, et al. Translating clinical findings into knowledge in drug safety evaluation-drug induced liver injury prediction system (DILIps) [J]. PLoS Comput. Biol., 2011, 7(12): e1002310.
  [66] LIU J, MANSOURI K, JUDSON R S, et al. Predicting hepatotoxicity using toxcast in vitro bioactivity and chemical structure [J]. Chem. Res. Toxicol., 2015, 28(4): 738-751.
  [67] MARTIN M T, MENDEZ E, CORUM D G, et al. Profiling the reproductive toxicity of chemicals from multigeneration studies in the toxicity reference database [J]. Toxicol. Sci., 2009, 110(1): 181-190.
  [68] MULLER C, PEKTHONG D, ALEXANDRE E, et al. Prediction of drug induced liver injury using molecular and biological descriptors [J]. Comb. Chem. High Throughput Screen., 2015, 18(3): 315-322.
  [69] XU Y, DAI Z, CHEN F, et al. Deep Learning for Drug-Induced Liver Injury [J]. J.chem. inf. model., 2015, 55(10): 2085-2093.
  [70] CHEN M, VIJAY V, SHI Q, et al. FDA-approved drug labeling for the study of drug-induced liver injury [J]. Drug discov. today, 2011, 16(15/16): 697-703.
  [71] GUENGERICH F P. Cytochrome P450s and other enzymes in drug metabolism and toxicity [J]. AAPS J., 2006, 8(1): E101-E11.
  [72] LYNCH T, PRICE A L. The effect of cytochrome P450 metabolism on drug response, interactions, and adverse effects [J]. Am. fam. physician, 2007, 76(3): 391-396.
  [73] SMITH H S. Opioid metabolism [J]. Mayo. Clin. Proc., 2009, 84(7): 613-624.
  [74] 马小超, 屠曾宏. 细胞色素P450在药源性肝损伤中的作用[J]. 世界华人消化杂志, 003, (3):338-341.
  [75] CHENG F, YU Y, SHEN J, et al. Classification of cytochrome P450 inhibitors and noninhibitors using combined classifiers [J]. J. chem. inf. model., 2011, 51(5): 996-1011.
  [76] 李楠, 段隆振, 陈萌. 决策树 C4. 5 算法在数据挖掘中的分析及其应用 [J]. 计算机与现代化, 2008, 12: 160-163.
  [77] NOVOTARSKYI S, SUSHKO I, K?RNER R, et al. A comparison of different QSAR approaches to modeling CYP450 1A2 inhibition [J]. J. chem. inf. model., 2011, 51(6): 1271-1280.
  [78] TETKO I V. Associative neural network [J]. Neural Processing Letters, 2002, 16(2): 187-199.
  [79] SUN H, VEITH H, XIA M, et al. Predictive models for cytochrome P450 isozymes based on quantitative high throughput screening data [J]. J. chem. inf. model., 2011, 51(10): 2474-2481.
  [80] HSU C , CHANG C , LIN C . A practical guide to support vector classification[J]. BJU International, 2008, 101(1):1396-1400.
  [81] ROSTKOWSKI M, SPJUTH O, RYDBERG P. WhichCyp: prediction of cytochromes P450 inhibition [J]. Bioinformatics, 2013, 29(16): 2051-2052.
  [82] SU B H, TU Y S, LIN C, et al. Rule-based prediction models of cytochrome P450 inhibition [J]. J. chem. inf. model., 2015, 55(7): 1426-1434.
  [83] NIH Chemical Genomics Center PubChem Assay ID 1851: Cytochrome panel assay with activity outcomes [M]. https://pubchem.ncbi.nlm.nih.gov/assay/assay.cgi?aid=1851 (accessed May 10, 2014).
  [84] STEVEN, L, SALZBERG. Book review: C4.5: Programs for Machine Learning by J. Ross Quinlan. Morgan Kaufmann Publishers, Inc. 1993[J]. Mach Learn, 1994, 16(3):235-240.
  [85] HUGHES T B, MILLER G P, SWAMIDASS S J. Modeling epoxidation of drug-like molecules with a deep machine learning network [J]. ACS Cent. Sci., 2015, 1(4): 168-180.
  [86] HUGHES T B, SWAMIDASS S J. Deep learning to predict the formation of quinone species in drug metabolism [J]. Chem. res. toxicol., 2017, 30(2): 642-656.
  [87] RUSSO D P, STRICKLAND J, KARMAUS A L, et al. Nonanimal models for acute toxicity evaluations: Applying data-driven profiling and read-across [J]. Environ. Health Perspect, 2019, 127(4): 47001.
  [88] ZHANG J, HSIEH J H, ZHU H. Profiling animal toxicants by automatically mining public bioassay data: A big data approach for computational toxicology [J]. PloS one, 2014, 9(6): e99863.
  [89] MAMOSHINA P, VIEIRA A, PUTIN E, et al. Applications of deep learning in biomedicine [J]. Mol. Pharm., 2016, 13(5): 1445-1454.
  [90] XIAO T, LI H, OUYANG W, et al. Learning deep feature representations with domain guided dropout for person re-identification; proceedings of the Proceedings of the IEEE conference on computer vision and pattern recognition, F, 2016 [C].
  [91] ERHAN D, COURVILLE A, BENGIO Y, et al. Why does unsupervised pre-training help deep learning? Proceedings of the Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics, F, 2010 [C].
  [92] DOAN C D, LIONG S Y. Generalization for multilayer neural network bayesian regularization or early stopping; proceedings of the Proceedings of Asia Pacific Association of Hydrology and Water Resources 2nd Conference, F, 2004 [C].
  [93] LIU H, PAPA E, GRAMATICA P. QSAR prediction of estrogen activity for a large set of diverse chemicals under the guidance of OECD principles [J]. Chem. res. toxicol., 2006, 19(11): 1540-1548.
  [94] PAVAN M, NETZEVA T, WORTH A. Validation of a QSAR model for acute toxicity [J]. SAR QSAR Environ. Res., 2006, 17(2): 147-171.
  [95] SALINER A G, NETZEVA T, WORTH A. Prediction of estrogenicity: validation of a classification model [J]. SAR QSAR Environ. Res., 2006, 17(2): 195-223.

重要提示:转载本站信息须注明来源:原创论文网,具体权责及声明请参阅网站声明。
阅读提示:请自行判断信息的真实性及观点的正误,本站概不负责。