0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Parabricks v4.1的功能

jf_pJlTbmA9 来源:NVIDIA 作者:NVIDIA 2023-07-05 16:30 次阅读

NVIDIA Parabricks 是一套加速的基因组分析应用程序,它在加速测序比对和提高深度学习变体调用的准确性方面比以往任何时候都更进一步。该版本包括 PacBio 长读数据的新工作流程,包括加速的 Minimap2 工具和谷歌的 DeepVariant ,用于对 PacBio 数据进行完整的 GPU 端到端分析。

NVIDIA Parabricks 可以免费使用,并提供付费企业支持选项。它包含各种优化的、基于人工智能的行业标准基因组工具,比基于 CPU 的工具提供高达 80 倍的加速,并将计算成本降低高达 50% 。与 CPU 上的约 24 小时相比,现在只需 16 分钟即可分析 30 倍的全基因组,相当于每年在一台服务器上分析多达 30000 个全基因组。

快速查看 Parabricks v4.1 的功能

一种新的 DeepVariant 重新训练工具,使任何人都能为自己的数据重新训练或微调 DeepVariation ,从而实现更准确的变体调用(现已在 NGC 上提供)。

PacBio 的端到端( FastQ 到 VCF )加速工作流,将在 GitHub 、 Terra.Bio 和其他云平台上的 Parabricks 工作流中提供。

新的加速 Minimap2 工具,用于调整 PacBio 的长读数。

用于 PacBio 数据的新加速 DeepVariant 变体调用程序,在 DGX 站[4xA100 GPU s]上运行 30 倍全基因组,运行时间为 8 分钟。

与 v4.0 中的 21 分钟和仅在 CPU – 上的约 24 小时相比, DGX A100 GPU [8xA100 GPU s]在 16 分钟内进一步加速了 30 倍全基因组的短读种系管道。

与新的 NVIDIA H100 GPU 兼容,其中包括强大的 DPX 指令,用于增强动态编程算法,如 Smith Waterman ,用于局部序列比对。

注册以获得 Parabricks 4.1 release 的通知,或尝试 prerelease DeepVariant re-training tool 。

支持长读分析

长读测序,即对明显较长的 DNA 片段进行测序的能力,与传统的短读测序相比具有多种固有优势。最重要的是,这些读数更容易被组装到完整的基因组中。

较低水平的模糊性和比对误差使长读测序更好地用于基因组中更具挑战性的部分(例如,高度重复的区域)或组装基因组 de novo (没有提供参考文献)。

这为测序界带来了许多改进,包括对结构变异(大插入、缺失、反转、重复等)有了更多的了解。结构变异可能导致疾病,如卢·格里格病( ALS )、帕金森病和心脏病。

它还最终使科学界能够端到端地完全完成人类参考基因组,即 2022 年发布的端粒到端粒( T2T )基因组。

long-read-tooling-workflow-parabricks.jpg 图 2:Parabricks 4.1 中提供了长阅读工具和工作流程,并为 PacBio 提供了新的 Minimap2 和 FastQ 到 VCF

PacBio 是长阅读测序领域的杰出领导者。他们的威廉希尔官方网站 产生长达 25 千碱基的读取(相比之下,每次读取的短读取测序< 300 碱基)。他们还通过基于循环一致性测序的 HiFi 读取威廉希尔官方网站 和基于 transformer 的深度学习模型 DeepConsensus 的分析,突破了测序准确性的界限。

PacBio 的 Revio 长读测序系统采用 NVIDIA GPU ,每年可将这种方法扩展到 1300 个人类全基因组。

除此之外, NVIDIA Parabricks 4.1软件可用于 GPU -与Minimap2的加速对齐,以及与DeepVariant的PacBio模型的变体调用,为PacBio数据提供完整的端到端工作流程。

DeepVariant 使用 Parabricks 重新训练

DeepVariant 是一个基于 CNN 的准确变体调用程序,用于短读和长读数据的种系工作流,作为 NVIDIA Parabricks 的一部分,在 GPU 上加速。 Parabricks 4.1 包括一个框架,用于重新训练和微调基础 CNN 模型,为分析工作流程带来更准确的变体调用。

具体来说,这具有能够将模型微调到单个数据集并识别后续数据中产生的任何非随机伪影的优点。这已经成功地应用于测序仪级别,例如 Ultima 、 Singular 和 PacBio 都生产了自己的特定模型,并根据其独特的误差分布进行了训练。

它也已应用于项目级别,例如 Regeneron Genetic Center’s exome sequencing as part of the UKBioBank project 。不同的实验室通常使用不同版本的测序仪、湿实验室试剂盒和试剂,并且通常有不同的实验室流程。所有这些差异都可能在它们的样本中引入微妙而独特的人工制品。

通过使用 DeepVariant 基础模型作为一个温暖的开端,通过对少数瓶中基因组细胞系进行测序以进行训练、测试和验证,实施实验室特定的微调可以是一个相对简单的过程。

在 Regeneron 的情况下,使用单个 V100 GPU 训练 12 小时,仅在一个样本( HG001 )上训练就足以看到模型收敛, 20% 的数据保留用于测试,第二个样本( HG002 )用于验证。这使得相对少量的数据在准确性上有了令人印象深刻的提高,例如将 INDEL 的孟德尔误差率从 0.075 降低到 0.056 。

DeepVariant-re-training-framework-flow.jpg 图 4 。 DeepVariant 重新训练框架流程图,包括使用 hap.py 进行准确性测试

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5002

    浏览量

    103233
  • AI
    AI
    +关注

    关注

    87

    文章

    31054

    浏览量

    269406
  • 深度学习
    +关注

    关注

    73

    文章

    5506

    浏览量

    121265
收藏 人收藏

    评论

    相关推荐

    请问ESP-IDF v4.1怎么生成静态库和调用静态库?

    ESP-IDF v4.1怎么生成静态库和调用静态库
    发表于 06-24 09:00

    dy3208电子钟_v4.1

    dy3208电子钟_v4.1
    发表于 04-12 12:31

    RVDS v4.1 官方开发工具

    this compiler build and previous v4.1 builds, see the latest release note for ARM Compiler v4.1 located
    发表于 10-15 10:30

    《Camera_for_RockChipSDK参考说明_v4.1》下载

    关于摄像头调试的文档《Camera_for_RockChipSDK参考说明_v4.1》 下载地址:http://developer.t-firefly.com/thread-12429-1-1.html
    发表于 09-19 16:51

    uniflash V4.1 无法为CC3220SF下载代码

    uniflash V4.1 无法通过串口为CC3220SF下载代码,显示的错误如下,有人知道是为什么吗?
    发表于 05-14 02:12

    电机控制工作台4.1如何通过ST MC Workbench v4.1计算系数

    嗨, 我正在使用状态观察器+ PLL算法和观察者+ CORDIC,我试图找出GAIN1,GAIN2,缩放因子和PLL KP / KI如何通过ST MC Workbench v4.1计算系数
    发表于 10-10 17:54

    有人有ESP-WROVER-KIT V4.1的BOM吗?求分享

    有人有ESP-WROVER-KIT V4.1的BOM吗?我正在尝试找出该套件上使用的外部 RTC 晶体(品牌、类型、负载电容器等),因此,我可以在我设计的 ESP32-WROOM-32 板上测试相同类型的晶体,并面临稳定性RTC 振荡器启动和一般操作的行为
    发表于 04-12 06:24

    Altera发布无线基站和远程射频前端设计CPRI v4.1

    Altera发布无线基站和远程射频前端设计CPRI v4.1 IP内核 Altera公司宣布,开始提供通用公共射频接口(CPRI) v4.1知识产权(IP)内核。CPRI v4.1 IP内核可实现高达6.144 Gbps的通道
    发表于 08-11 09:13 571次阅读

    中学电路虚拟实验室 V4.1下载

    中学电路虚拟实验室 V4.1下载
    发表于 02-26 17:28 5次下载

    NetAssist网络调试助手V4.1应用程序免费下载

    本文档的主要内容详细介绍的是NetAssist网络调试助手V4.1应用程序免费下载。
    发表于 03-16 08:00 11次下载
    NetAssist网络调试助手<b class='flag-5'>V4.1</b>应用程序免费下载

    关于Wi-Fi CERTIFIED EasyMesh测试计划v4.1版本

    近日,Wi-Fi联盟更新了Wi-Fi CERTIFIED EasyMesh测试计划v4.1版本,以阐明与测试用例适用性的相关条件,此版本将Wi-Fi Agile Multiband (MBO) 添加为认证前提条件。
    的头像 发表于 06-24 11:31 2947次阅读

    SSC 通信板 V4.1 数据表

    SSC 通信板 V4.1 数据表
    发表于 03-15 19:30 0次下载
    SSC 通信板 <b class='flag-5'>V4.1</b> 数据表

    SSC 通信板 V4.1 数据表

    SSC 通信板 V4.1 数据表
    发表于 07-06 18:41 0次下载
    SSC 通信板 <b class='flag-5'>V4.1</b> 数据表

    DMA/Bridge Subsystem for PCI Express v4.1指南

    电子发烧友网站提供《DMA/Bridge Subsystem for PCI Express v4.1指南.pdf》资料免费下载
    发表于 09-14 10:33 2次下载
    DMA/Bridge Subsystem for PCI Express <b class='flag-5'>v4.1</b>指南

    NVIDIA Parabricks v4.3.1版本的新功能

    会(ESHG)上发布,其加入了新的体细胞数据变异检测功能,并将业内领先的工具升级到最新版本。这个版本是继在 NVIDIA GTC 2024 大会上发布 Parabricks v4.3
    的头像 发表于 09-10 10:22 395次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Parabricks</b> <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>