0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习是许多生物学家用来分析数据的计算工具

姚小熊27 来源:AI人工智能网 作者:AI人工智能网 2020-10-19 15:09 次阅读

机器学习是许多生物学家用来分析大量数据的计算工具,帮助他们识别潜在的新药。麻省理工学院的研究人员现在已经在这些类型的机器学习算法中加入了一个新的特性,从而提高了他们的预测能力。

利用这种新的方法,计算机模型可以解释他们分析数据的不确定性,麻省理工学院的研究小组发现了几种有希望的化合物,这些化合物的目标是导致结核病的细菌所需的一种蛋白质。

这种方法以前曾被计算机科学家使用过,但尚未在生物学上得到应用,也可能在蛋白质设计和许多其他生物学领域有用,西蒙斯数学系教授、麻省理工学院计算机科学和人工智能实验室(CSAIL)计算和生物学小组负责人邦尼·伯杰(Bonnie Berger)说。

“这项威廉希尔官方网站 是已知的机器学习子领域的一部分,但人们还没有把它引入生物学,”Berger说。“这是一个范式的转变,绝对是生物探索的方式。”

Berger和Bryan Bryson是麻省理工学院的生物工程助理教授,也是MGH、MIT和哈佛的拉根研究所的成员,他们是这项研究的高级作者。细胞系统。麻省理工学院研究生BrianHie是论文的主要作者。

更好的预测

机器学习是一种计算机建模,在这种模型中,算法学习根据已经看到的数据进行预测。近年来,生物学家开始利用机器学习来搜索潜在药物化合物的庞大数据库,以找到与特定目标相互作用的分子。

这种方法的一个局限性是,当他们分析的数据与他们接受训练的数据相似时,这些算法表现得很好,但它们并不擅长评估那些与他们已经看到的分子有很大不同的分子。

为了克服这一问题,研究人员使用了一种叫做高斯过程的威廉希尔官方网站 ,将不确定性值分配给算法所训练的数据。这样,当模型分析训练数据时,他们也会考虑到这些预测的可靠性。

例如,如果进入模型的数据预测某一特定分子与目标蛋白质的结合程度,以及这些预测的不确定性,该模型可以利用这些信息对蛋白质-目标相互作用进行预测,这是它以前从未见过的。该模型还估计了自己预测的确定性。在分析新的数据时,模型的预测对于与训练数据有很大不同的分子来说,其确定性可能较低。研究人员可以利用这些信息来帮助他们决定实验测试哪些分子。

这种方法的另一个优点是该算法只需要少量的训练数据。在这项研究中,麻省理工学院的研究小组用72个小分子及其与400多个蛋白质的相互作用(称为蛋白激酶)对模型进行了训练。然后,他们能够使用这个算法分析近11000个小分子,这些小分子是从锌数据库中提取的,锌数据库是一个公开可用的储存库,含有数百万种化合物。其中许多分子与训练数据中的分子非常不同。

利用这一方法,研究人员能够识别出与他们所加入的蛋白激酶具有非常强的结合亲缘关系的分子。其中包括三种人类激酶,以及在结核分枝杆菌中发现的一种激酶。这种激酶,PknB,是细菌生存的关键,但不是任何一线结核病抗生素的目标。

研究人员随后通过实验测试了他们的一些最成功之处,以了解他们与目标的结合程度,并发现模型的预测非常准确。在模型给出的最确定的分子中,大约90%被证明是真正的命中--远高于现有用于药物筛选的机器学习模型的30%到40%的命中率。

研究人员还使用相同的训练数据来训练不包含不确定性的传统机器学习算法,然后让它分析相同的11000个分子库。他说:“没有不确定性,这个模型就会变得非常混乱,它提出了与激酶相互作用的非常奇怪的化学结构。”

然后,研究人员采取了一些最有前途的PknB抑制剂,并测试他们在细菌培养培养基中生长的结核分枝杆菌,并发现它们抑制细菌的生长。这些抑制剂也在感染细菌的人免疫细胞中起作用。

一个好的起点

这种方法的另一个重要因素是,一旦研究人员获得额外的实验数据,他们就可以将其添加到模型中,并对其进行再培训,从而进一步改进预测。研究人员说,即使是少量的数据也能帮助模型变得更好。

Hie说:“每次迭代都不需要非常大的数据集。”“你可以用10个新的例子重新训练这个模型,这是一个生物学家很容易产生的东西。”

布莱森说,这项研究是多年来首次提出新的分子,可以针对PknB,并且应该给药物开发人员一个很好的起点,可以尝试开发针对激酶的药物。他说:“我们现在为他们提供了一些新的线索,超出了已经公布的范围。”

研究人员还表明,他们可以利用同样的机器学习来提高绿色荧光蛋白的荧光输出,绿色荧光蛋白通常用于标记活细胞内的分子。它也可以应用于许多其他类型的生物学研究,Berger说,他现在正用它来分析推动肿瘤发展的突变。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47387

    浏览量

    238900
  • 机器学习
    +关注

    关注

    66

    文章

    8423

    浏览量

    132757
收藏 人收藏

    评论

    相关推荐

    传统机器学习方法和应用指导

    用于开发生物学数据机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常
    的头像 发表于 12-30 09:16 244次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    微流控威廉希尔官方网站 的生物学应用

    微流控威廉希尔官方网站 为在推动生物学众多领域的强大工具做出了巨大贡献。随着用于微通道中流体的注射、混合、泵送和存储的新器件和工艺的发展,近年来微流控系统在化学和生物化学中的应用越来越广泛。 尽管微流控威廉希尔官方网站 近年来
    的头像 发表于 12-01 21:50 163次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对
    的头像 发表于 11-16 01:07 443次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进威廉希尔官方网站 ,AI能够处理和分析海量
    发表于 10-14 09:12

    【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

    本人有些机器学习的基础,理解起来一点也不轻松,加油。 作者首先说明了时间序列的信息提取是时间序列分析的一个重要环节,目标是从给定的时间序列数据中提取出有用的信息和特征,以支持后续的
    发表于 08-14 18:00

    【「时间序列与机器学习」阅读体验】全书概览与时间序列概述

    的应用也很广泛,用机器学习为时间分析带来新的可能性。人们往往可以通过过往的时间序列数据来预测未来,在各行各业中都有很好的应用与发展前景。 时间序列分类: 1.单维时间序列 单维时间序列
    发表于 08-07 23:03

    数据分析除了spss还有什么

    Sciences)是一款非常流行的统计分析软件,但除了SPSS之外,还有许多其他数据分析工具和方法。 引言 数据分析是一个跨学科的领域,涉
    的头像 发表于 07-05 15:01 647次阅读

    数据分析工具有哪些

    数据分析是一个涉及收集、处理、分析和解释数据以得出有意义见解的过程。在这个过程中,使用正确的工具至关重要。以下是一些主要的数据分析
    的头像 发表于 07-05 14:54 887次阅读

    机器学习数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具
    的头像 发表于 07-02 11:22 652次阅读

    名单公布!【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来?

    ,如何将机器学习、深度学习或者大模型威廉希尔官方网站 应用在大规模的数据生产中,是一个非常关键的问题。 国内外已出版了许多关于
    发表于 06-25 15:00

    合成生物是什么-微流控芯片威廉希尔官方网站 在合成生物学的应用前景

    合成生物其实就是一种“造物”的威廉希尔官方网站 。它融合了生物学、化学和工程学等多种威廉希尔官方网站 ,以可再生生物质为原料,以生物体作为生产介质,旨在利用廉价原料,以菌群、细胞和酶为制造工厂,规模化发酵获得目标
    的头像 发表于 05-28 13:58 785次阅读
    合成<b class='flag-5'>生物</b>是什么-微流控芯片威廉希尔官方网站
在合成<b class='flag-5'>生物学</b>的应用前景

    北京大学在偏振结构光超分辨显微威廉希尔官方网站 方面获得进展

    由于细胞的高度透明性,观察其中的细胞器十分困难。通过荧光染色,生物学家可以标记特定的细胞器对其进行观察。
    的头像 发表于 05-21 09:22 543次阅读
    北京大学在偏振结构光超分辨显微威廉希尔官方网站
方面获得进展

    三郡科技:电化学生物传感器电极与生物芯片的异同

    电化学生物传感器电极 与 生物芯片 作为生物威廉希尔官方网站 领域中的两大重要工具,为现代生物分析和医学诊断提
    的头像 发表于 04-28 14:08 807次阅读
    三郡科技:电化学<b class='flag-5'>生物</b>传感器电极与<b class='flag-5'>生物</b>芯片的异同

    用于增强微生物物种间DNA转移的新型液滴微流控平台设计

    利用各种合成生物学工具和方法进行微生物工程已经取得了重大进展。
    的头像 发表于 03-17 10:41 1105次阅读
    用于增强微<b class='flag-5'>生物</b>物种间DNA转移的新型液滴微流控平台设计

    【量子计算机重构未来 | 阅读体验】+机器学习的终点是量子计算

    便对机器计算能力产生了兴趣,虽然不是这个专业的,但是可以抽出闲鱼的时间,来了解一下,可以通过学习来掌握一些技能。 目前也只有在闲暇之余做一些代码的工作了。 希望以后能够用的上。 其次大学期间也没有学
    发表于 03-10 16:33