立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 555|回复: 5

[分享] 生物信息学的最新前沿以及发展到什么程度?

[复制链接]
发表于 2025-3-1 16:38 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2025-3-1 16:39 | 显示全部楼层
Part12023 年生物信息学十大进展

转载自:https://omicstutorials.com/top-10-advances-in-bioinformatics-in-2023/
在生物信息学的动态领域,2023年带来了一波变革性进步,有望彻底改变我们理解、分析和利用生物数据的方式。本文探讨了生物信息学的十大突破,这些突破正在重塑生命科学和医疗保健的格局。
1人工智能驱动的药物发现

人工智能(AI)和机器学习(ML)与生物信息学工具的整合加速了药物发现过程。AI算法可以分析大量数据集,预测分子相互作用,并以前所未有的速度和准确性识别潜在的候选药物。



人工智能在药物发现和开发中的应用



人工智能在药物发现中的作用
图片来源:Paul, D., Sanap, G., Shenoy, S., Kalyane, D., Kalia, K., & Tekade, R. K. (2021). Artificial intelligence in drug discovery and development. Drug discovery today, 26(1), 80–93. https://doi.org/10.1016/j.drudis.2020.10.010
2个性化医学和基因组学

由于遗传学和生物信息学的进步,个性化医学的时代正在蓬勃发展。尖端工具能够分析单个基因组,为基于一个人独特基因构成的定制治疗计划铺平了道路。




2023年4月13日,北京大学生物医学前沿创新中心(BIOPIC)张泽民教授受邀于Cell发表了题为Accelerating the understanding of cancer biology through the lens of genomics 的综述文章,全面总结了肿瘤基因组学的发展历程以及其对理解肿瘤驱动机制与异质性、促进个体化精准肿瘤治疗的重要贡献,并强调了目前肿瘤基因组学研究视野的转化,即从对癌细胞本身特性的关注提升到对整个肿瘤“生态系统”的研究,最后讨论了肿瘤基因组学未来在推动基础肿瘤生物学理解与临床转化应用方面潜在的发展方向。
3单细胞组学

单细胞组学技术已经达到了新的高度,使研究人员能够深入研究单个细胞的复杂性。这种粒度水平有助于更深入地了解细胞异质性,并促进癌症研究和发育生物学等领域更精确的分析。
北京大学生命科学学院、生物医学前沿创新中心(BIOPIC)汤富酬教授与文路副研究员受邀在Precision Clinical Medicine杂志上发表题了为“Recent advances in single-cell sequencing technologies”综述性文章。从单细胞表观基因组测序、单细胞基因组测序技术用于谱系追踪、单细胞空间转录组技术、基于第三代测序平台的单细胞基因组测序,四个方面系统总结了单细胞测序技术的最新进展,并探讨了单细胞测序技术的潜在应用和未来发展方向。



图片来源:Wen, L., & Tang, F. (2022). Recent advances in single-cell sequencing technologies. Precision clinical medicine, 5(1), pbac002. https://doi.org/10.1093/pcmedi/pbac002
单细胞多组学测序技术近年来进展迅速,但是仍然有诸多可改进之处。单细胞多组学测序技术有很强的普适性。它具备高灵敏度和高精确度但仍有待加强。它的通量、自动化和检测速度近年来迅速提高且成本不断下降,但是仍未达到临床检测等未来应用场景的要求。尤其对于人类在体干细胞研究,它的时空分辨率还有待大幅提高。




比利时鲁汶大学的研究团队在《Nature Reviews Genetics》发表题为“Methods and applications for single-cell and spatial multi-omics” 的综述,重点介绍了快速发展的单细胞和空间多组学技术(也称为多模态组学方法)领域的进展,以及跨分子层整合信息所需的计算策略。该文展示了单细胞和空间多组学对基础细胞生物学和转化研究的影响,讨论了当前的挑战,并对未来研究进行了展望。
4宏基因组学和微生物组研究

生物信息学在解开微生物组的奥秘方面发挥着关键作用。宏基因组方法正在揭示居住在人体内和人体上的复杂微生物群落,影响健康和疾病。
5结构生物信息学和冷冻电镜

结构生物信息学的进步,加上冷冻电子显微镜(cryo-EM),正在改变我们在原子水平上可视化生物分子结构的能力。这对药物设计、蛋白质工程和理解细胞过程有深远的影响。
6网络生物学

网络生物学的整体方法越来越突出,允许研究人员将生物系统分析为相互连接的网络。这种系统层面的视角增强了我们对细胞途径、疾病机制和遗传变异影响的理解。



图片来源:Zitnik M, Li MM, Wells A, et al. Current and future directions in network biology. arXiv preprint arXiv:2309.08478, 2023.
网络生物学对于研究我们民族瑰宝中医药有重要作用,因为中医药有多靶点、多途径、多通路的特点,传统的生物学是不能将其特质全面阐述出来的!
7CRISPR生物信息学

基于CRISPR的技术已成为基因组编辑不可或缺的工具,生物信息学在设计和优化CRISPR实验方面发挥着至关重要的作用。计算工具有助于预测目标外效应,并完善基因编辑技术的精确度。
关于CRISPR的基础知识可看之前的推文
生信|基因组变异

8生物信息学中的区块链

区块链技术的集成解决了生物信息学中的数据安全、完整性和隐私问题。区块链确保基因组和临床数据的透明和安全共享,促进协作,同时保持机密性。
9生物信息学中的量子计算

量子计算正在成为生物信息学的游戏规则改变者,能够以前所未有的速度处理大量数据集和复杂算法。这对模拟生物过程、优化药物发现和解决复杂的计算问题有影响。



量子计算生物学的实际应用
10道德考虑和负责任的人工智能

随着生物信息学的不断发展,围绕数据隐私、同意和负责任的人工智能实施的道德考虑越来越突出。该领域正在积极解决这些问题,以确保在道德上取得进展,并重点关注社会福祉。

总之,2023年见证了一系列非凡的生物信息学突破,这些突破正在重塑生命科学的格局。从人工智能驱动的药物发现到围绕这些进步的道德考虑,生物信息学处于解开生命奥秘的最前沿,突破了理解和利用生物信息的界限。随着这些技术继续成熟,并在研究、医学等领域找到新的应用,未来有望实现更令人兴奋的发展。
回复 支持 反对

使用道具 举报

发表于 2025-3-1 16:39 | 显示全部楼层
生物信息学是一个快速发展的领域。它结合了生物学、计算机科学和信息技术,用于分析和解释生物数据。在过去的几十年中,生物信息学的许多里程碑对我们对生物学的理解和新疗法、治疗方法的发展产生了重要影响。
1965年:Margaret Dayhoff开发了第一个蛋白质序列数据库,名为蛋白质序列和结构图谱(Atlas of Protein Sequence and Structure)。这是理解蛋白质结构与功能关系的重要一步。


1970年:Saul B. Needleman和Christian D. Wunsch发表了第一个序列比对方法,用于比对和比较蛋白质和核苷酸序列。
1971年:RCSB蛋白质数据银行(Protein Data Bank)成立。
1977年:Frederick Sanger开发了一种快速测定DNA碱基序列的方法。这是DNA测序首次实现自动化,为人类基因组计划铺平了道路。
1981年:Smith-Waterman序列比对算法,用于识别可能表示两个序列之间功能、结构或进化关系的相似区域。
1982年:GenBank核苷酸序列数据库成立,由美国国立卫生研究院(NIH)创建,用于存储和共享遗传信息。
1984年:PIR-International蛋白质序列数据库成立。
1990年:人类基因组计划启动。这个雄心勃勃的项目旨在测序整个人类基因组,于2003年完成。
1996年:第一个蛋白质组学数据库SWISS-PROT成立。该数据库包含有关蛋白质序列、功能和结构的信息。
20世纪90年代末和21世纪初:建立了宏基因组学领域。该领域专注于研究整个微生物群落的遗传物质,而不仅仅是个体生物。
2001年:人类基因组的第一份初稿发表。这是我们对人类生物学认识的重大突破,为研究和药物开发开辟了新途径。
2002年:UniProt蛋白质序列数据库成立。
2010年:首次创造合成基因组。这是合成生物学领域的里程碑成就,为创造具有定制基因组的新生物奠定了基础。
2012年:发现CRISPR-Cas9系统。这一革命性技术使科学家能够以前所未有的精确性和准确性编辑基因组。
2023年:人工智能(AI)和机器学习(ML)被整合到生物信息学工具和工作流程中,革命性地改变了该领域。AI和ML被用于分析大型数据集、预测蛋白质结构和开发新药物。


基因组学

基因组学的概念从基因组的概念开始。基因组的概念在基因组学中具有基础性作用,为理解生命的遗传基础和基因与疾病之间的关系提供了框架。德国植物学家汉斯·温克勒于1920年首次提出了“基因组”一词,用来描述决定物种遗传构成的染色体组。温克勒对遗传机制和染色体数目与孤雌生殖之间的关系有浓厚的兴趣。他之前使用相关术语如“全基因”和“基因型”来指代物种的遗传物质。
“基因组”一词在其引入后的几十年里偶尔被使用,但到了1970年,它已经被科学界广泛接受。其使用在随后的十年中大幅扩展。1986年,加拿大《遗传学与细胞学杂志》更名为《基因组》,标志着其历史的一个新时期。在《基因组》期刊之后,另外几本期刊在1990年代初出现,包括《人类基因组评论》、《哺乳动物基因组学》和《国际基因组研究杂志》。
真正的革命发生在1990年10月,当时人类基因组计划(HGP)和国际人类基因组测序联盟(IHGSC)启动了人类基因组计划。这个项目于1988年由美国国家科学院特别委员会提出,旨在测序整个人类基因组。这项庞大的工程涉及多个国家的科学家和研究人员。大约在启动后的几年,1995年,J·克雷格·文特的实验室发布了两种病原体——流感嗜血杆菌和生殖支原体的完整基因组。这个术语“基因组”甚至成为普通大众中的热门词汇,并标志着现代基因组学的诞生,导致了同年新的期刊的爆发。
基因组测序本身并不属于生物信息学,但湿实验产生的序列数据需要复杂的计算算法将这些数据转化为连贯、连续且可读的形式。此外,庞大的测序数据需要适当的存储方式以及搜索数据库和比较序列的方法,以进行各种进一步的研究。
测序

弗雷德里克·桑格尔在他的著作中表达了他的信念:“...对序列的了解可以为我们理解生命物质做出很大贡献”(Sanger F. 1980)。早在1950年代初,弗雷德里克·桑格尔就利用他获得诺贝尔奖的方法对胰岛素分子的两条链进行了测序。
在1957年发现DNA的结构后,许多科学家都付出了很大努力来确定DNA的核苷酸顺序。二十年后,桑格尔成功地利用他最初的“正负系统”在1977年对噬菌体phi X174的基因组进行了测序,共计5,375个核苷酸。
马克萨姆和吉尔伯特在同一年发表了他们的测序方法,同年底,桑格尔发表了他的第二种方法,最初产生大约100个核苷酸长度的读长。
吉尔伯特和桑格尔因他们的工作共同获得了1980年的诺贝尔化学奖。然而,随着时间的推移,桑格尔测序方法的应用更加广泛,因为马克萨姆-吉尔伯特方法需要使用放射性标记。
自20世纪70年代以来,测序技术一直在不断发展和改进。最早的测序方法使用手工操作进行DNA序列的决定。随着时间的推移,自动测序方法的出现使大规模的基因组测序成为可能。自20世纪90年代中期以来,高通量测序技术的引入使得更快、更便宜、更高效的基因组测序成为现实。高通量测序方法包括Sanger测序、454测序、Illumina测序和Ion Torrent测序等。这些技术的不断发展为大规模基因组测序和个体基因组学研究提供了强有力的工具。
计算工具和算法

在桑格尔发明蛋白质测序方法之后的几年里,许多科学家对蛋白质进行了测序,导致序列数量不断增加。然而,50年代和60年代仍缺乏适用于蛋白质序列的适当计算机分析方法。
计算机仍然昂贵,需要整个房间,并且需要使用汇编语言进行编程。使用汇编语言进行编程是一项繁琐的工作。约翰·贝克斯与IBM的团队在1957年发布了FORTRAN编程语言,它至今仍在不断发展,并且NASA在关键任务中使用它。
随后出现了其他几种编程语言,如LISP、COBOL、Pascal以及丹尼斯·里奇和贝尔实验室的同事们在1970年代创造了C编程语言。值得注意的是,他们还用C重写了UNIX代码。
60年代的早期先驱者包括Magaret Dayhoff和Richard Eck。他们从已发表的文献中汇编了所有已知的蛋白质序列,并使用打孔卡将它们存储在计算机中进行进一步分析。具体而言,他们估计了一段时间内氨基酸的变化数量,并利用这些信息构建了一个描述蛋白质祖先关系的系统发生树。
他们的工作在1978年以PAM矩阵的形式呈现了蛋白质进化变化模型。此外,Magaret Dayhoff和Richard Eck提出了氨基酸的一字母代码,这是今天的标准,但有些进行了一些修改。
在1970年,Saul B. Needleman和Christian D. Wunsch发表了第一种序列比对方法,用于比对和比较蛋白质以及核苷酸序列。他们的方法基于数学家Richard E. Bellman在1953年已经开发的动态规划方法。通过Needleman-Wunsch方法,科学家现在能够使用计算机充分比对序列。Needleman-Wunsch方法也被称为“全局序列比对”算法。
在1981年,Temple F. Smith和Michael S. Waterman发表了Smith-Waterman序列比对算法,这是一种用于比对两个核苷酸或氨基酸序列的动态规划算法。它对于发现可能指示两个序列之间功能、结构或进化关系的相似区域非常重要。
该算法的重要之处在于它能够找到其他比对方法可能忽略的局部比对。它还可以识别出在理解一组序列的进化历史中可能重要的次优比对。该算法在生物信息学中被广泛应用于序列注释、基因组组装和蛋白质结构预测任务。它对生物信息学产生了重大影响,并仍然是许多生物信息学应用的基本工具。
人类基因组计划

人类基因组计划(HGP)是一项于1990年启动的大规模国际研究项目,旨在绘制和测序整个人类基因组。来自至少20个不同国家的科学家参与了该项目。该项目是对人类健康和疾病中遗传学重要性认识不断增长的回应。绘制人类基因组的想法最早在20世纪70年代提出,但直到20世纪80年代新技术的发展,该项目才变得可行。人类基因组计划于2003年完成,其结果对我们对遗传学和人类健康的理解产生了深远影响。
宏基因组学

宏基因组学领域于20世纪90年代末和21世纪初得以确立,基于DNA测序技术的发展。传统的微生物学技术涉及分离和培养单一细菌菌株以进行研究。然而,很明显,自然环境中绝大多数细菌无法在实验室中培养,这使得研究这些群落的多样性和功能变得困难。
宏基因组学通过使用DNA测序直接从环境样品中研究整个微生物群落,解决了这个挑战,使研究人员能够分析给定样本中所有微生物的遗传物质,而不管它们是否可培养。宏基因组学的发展彻底改变了我们对自然环境中微生物多样性和功能的理解,为环境微生物学和生物技术等领域的研究开辟了新的研究途径。
宏基因组学领域的一个重要的早期里程碑是1998年发表的一项研究,该研究使用PCR扩增和测序环境样品中无法培养的微生物的核糖体RNA基因。该研究展示了宏基因组学的潜力,并为进一步的研究铺平了道路。
另一个重要的里程碑是2004年发表的一项研究,该研究使用Shotgun测序分析了萨尔加索海的微生物群落。该研究通过宏基因组学提供了对复杂微生物群落的首次全面分析,并揭示了比先前认识到的更高水平的多样性。
宏基因组学领域仍在迅速发展,不断涌现出新的技术和方法。该领域在环境监测、生物技术和人类健康等领域具有重要应用,预计在未来的许多年里将继续成为重要的研究领域。
最近,宏基因组学已被应用于研究各种环境中的微生物群落,包括土壤、海洋和人体肠道。通过分析这些群落的遗传物质,研究人员对它们在各种生态过程中的作用,如营养循环和疾病传播,获得了新的认识。
高通量测序技术的发展也使得研究人员能够在短时间内分析大量的宏基因组数据。高通量测序技术带来了新的计算工具和算法,用于分析和解释这些数据。它使研究人员能够探索微生物分类群在群落中的功能与作用之间的关系。
宏基因组学领域目前面临的一个挑战是开发出标准化的样品采集、储存和分析方法。由于宏基因组学是一个相对较新的领域,在不同环境中研究微生物群落的最佳实践还有很多需要学习的地方。然而,随着这个领域的发展,新的技术和方法将不断涌现,以解决这些挑战。
总体而言,宏基因组学领域的建立对我们理解自然环境中微生物多样性和功能产生了重大影响。它为环境微生物学、生物技术和人类健康等领域开辟了新的研究发现的可能性。
数据库

RCSB蛋白质数据库提供有关蛋白质、核酸和复合体的三维结构的信息。它于1971年成立,作为结构数据的存储库,并且目前已经包含了超过15万个结构。该数据库为研究生物大分子的结构和功能的科研人员提供了宝贵的资源,并在推动结构生物学领域的发展中发挥了重要作用。近年来,该数据库还开始整合药物发现和设计数据,使其成为制药行业的重要工具。
1982年,美国国立卫生研究院(NIH)创建了一个核苷酸序列数据库GenBank,用于存储和共享基因信息。如今,该数据库包含了来自各种生物的数百万个序列,已成为生物信息学领域研究人员的重要工具。
GenBank自成立以来经历了重大变化。在早期,数据库是手动维护的,研究人员通过纸质表格提交其序列。然而,随着提交数量的增加,这种方法变得不切实际。
1986年,NIH开始接受电子提交;到1988年,整个GenBank数据库已经以电子形式提供。在接下来的几年里,数据库不断增长,并添加了新的功能,以使数据的搜索和分析更加容易。
1992年,GenBank通过互联网公开提供,使其可以让全世界的研究人员访问。通过互联网的访问是生物信息学历史上的一个重要里程碑,因为它使研究人员能够比以往更高效地共享和获取基因信息。
此后,GenBank继续发展,不断添加新的数据类型,并开发新的工具来分析这些数据。如今,它仍然是生物信息学研究人员最重要的资源之一,并且在推动我们对遗传学和基因组学的理解方面继续发挥着关键作用。
PIR国际蛋白质序列数据库是在1984年建立的最早的数据库之一。它是生物信息学领域的一个重要里程碑,使研究人员能够大规模地分析和比较蛋白质序列。后来,该数据库并入了UniProt知识库,现在是全球最广泛使用的蛋白质序列数据库之一。
UniProt是一个综合性的蛋白质数据库,于2002年由三个独立的数据库——Swiss-Prot、TrEMBL和PIR-PSD——合并而成。Swiss-Prot最初于1986年由阿莫斯·巴罗克(Amos Bairoch)及其在日内瓦大学的团队创建,是一个蛋白质序列数据库。而TrEMBL则是在1996年创建的Swiss-Prot的计算机注释补充。之后,Swiss-Prot和TrEMBL与PIR-PSD数据库合并,形成了UniProt。
如今,UniProt是全球最大的蛋白质数据库之一,包含来自各种物种的数百万个蛋白质的信息。生物信息学领域的研究人员广泛使用它进行蛋白质的鉴定、特征描述和注释等多种应用。UniProt还提供许多工具和资源,帮助研究人员分析和解释蛋白质数据,因此对科学界来说是一个宝贵的资源。
人工智能

将人工智能(AI)和机器学习(ML)整合到生物信息学工具和工作流程中正在彻底改变这一领域。这些技术有助于解决生物信息学中的一些最紧迫的挑战,包括分析大规模复杂数据集、识别数据中的模式和关联以及预测生物学结果。
AI和ML在生物信息学中的关键应用领域之一是基因组数据分析。人类基因组含有超过30亿个碱基对,对这些庞大的数据进行分析对研究人员来说是一个巨大的挑战。AI和ML算法可以帮助识别数据中的模式和关联,使研究人员更好地理解其潜在的生物学意义。
另一个应用AI和ML的领域是药物研发。新药物的开发时间长、成本高且失败率高。AI和ML算法可以帮助识别潜在的药物靶点,并预测新药物的疗效,从而加快药物研发过程并降低成本。
AI和ML还被用于开发生物信息学分析的新工具和工作流程。例如,机器学习算法可以对不同类型的生物数据(如基因表达数据或蛋白质结构)进行分类,自动化分析过程,减少手动干预的需求。
尽管AI和ML在生物信息学中有许多优点,但也面临一些挑战。其中一个主要挑战是需要高质量的数据来训练这些算法,而这需要广泛且多样化的数据集,有时可能难以获取。此外,还需要标准化的数据收集和分析方法,以确保结果准确可重复。
将AI和ML整合到生物信息学中已经取得了重大突破。例如,旧金山加利福尼亚大学的研究人员利用机器学习算法分析了超过10,000个肿瘤的基因组数据。这些算法能够识别出能够预测哪些肿瘤可能对特定免疫疗法有反应的模式,改善患者的预后,并减少昂贵且耗时的临床试验的需求。
AI和ML在生物信息学中的潜力还体现在发展用于预测蛋白质结构的深度学习算法上。蛋白质是生命的基本组成部分,在许多生物过程中起着关键作用的机器学习算法在这个领域显示出了潜力,华盛顿大学的研究人员开发了一种深度学习算法,可以几乎以原子级的准确度预测蛋白质的结构。
除了这些例子,还有许多其他领域正在应用AI和ML在生物信息学中,包括单细胞数据分析、药物毒性预测和疾病致病突变的识别等。
与任何新技术一样,使用AI和ML在生物信息学中也存在一些关注点。其中一个关注点是这些算法可能会强化数据中现有的偏见,导致不准确或具有歧视性的结果。另一个关注点是确保这些算法是透明和可解释的,以便研究人员能够理解它们是如何进行预测和决策的。
研究人员正在开发新的方法来训练和测试生物信息学中的AI和ML算法,以解决上述问题,包括创建更多样化和具有代表性的数据集以及评估这些算法准确性和公平性的新策略。
在药物研发方面,AI和ML算法已经被用于识别新的药物候选物、预测药物的疗效和降低不良副作用的风险。这些算法可以分析药物与靶点的相互作用、药物结构和分子特性等大量数据,以识别潜在的药物候选物,并帮助制药公司简化药物研发过程,减少开发新药物的时间和成本。
另一个应用AI和ML的领域是开发用于疾病诊断和预后的预测模型。这些模型可以分析患者数据,如基因组数据、病史和临床数据,以预测患病的可能性、疾病的严重程度和对治疗的反应。
AI和ML的整合对生物信息学具有巨大的潜力,它们正在推动生物学研究和医学领域的进步,并有望为疾病治疗和药物研发带来重大突破。然而,还需要持续的研究和努力来解决相关的挑战,并确保这些技术的正确应用和发展。
本文翻译自:https://bioinformaticshome.com/bioinformatics_tutorials/History and major milestones in bioinformatics.html
了解更多生物信息学知识,关注vx公众号”生物信息技术“。
回复 支持 反对

使用道具 举报

发表于 2025-3-1 16:40 | 显示全部楼层
我就说一点多层网络模型在生物信息学的最新前沿以及发展


近年来,多层网络的形成为多层网络系统的发展提供了新的技术。许多生物信息系统由相互连接的单元组成,可以有效地建模为网络,这些单元是描述点之间连接的数学结构。复杂网络系统为生物信息领域提供了强大的研究工具和方法,从基因和蛋白质之间的相互作用,到组织器官功能研究,甚至人脑研究。生物系统的复杂性和进化性质使得多层网络和相关方法的广泛使用成为可能。


网络表示是对更复杂的多方面系统的简化描述。一个社会系统可以包括具有不同生物学意义的不同类型的交互(例如,合作或竞争),而标准网络方法通常会忽略这些交互或通过分别分析具有不同边缘类型的网络来实现集成。在使用网络结构的生物信息学领域中,每个生物系统的进步都依赖于数据量和未知生物领域的新发现。例如,在研究基因和蛋白质之间的转录-翻译关系时,基因和蛋白质用节点表示,基因和蛋白质之间的对应关系用网络中的链接表示。只有这样,才能通过网络的聚类或连锁分析确定与疾病或症状最相关的基因和相应的蛋白质,从而进一步研究疾病症状的靶向治疗。这些应用都依赖于数据集以及基因和蛋白质的生物学对应关系。


多层网络发展

随着人们对 DNA 结构和功能的认识逐渐提高,对基因与蛋白质、基因与疾病、疾病与药物之间的关系的理解有了很大的发展。例如,通过网络结构挖掘基因与疾病之间的对应关系,该方法利用联合学习方法,利用蛋白质的功能和连接模式,使用人类相互作用网络预测疾病-基因关系。
对大量候选致病基因进行测序和变异检查,以帮助确定疾病与基因之间的关系。观察到与类似疾病相关的基因具有更高的相互作用概率,其中许多方法依赖于对生物网络拓扑特性的分析。
基因功能也可以通过收集生物学数据来确定。例如,果蝇卵巢表皮细胞 (EC) 从外部控制生殖系干细胞 (GSC) 的维持和后代分化。
还可以针对不同的生物数据和特定学科设计相应的网络结构来分析特定的生物系统。目前,在亚细胞水平,这些网络主要包括基因调控网络, 蛋白质功能网络、代谢调控网络和药物靶向网络。
利用脑网络研究人脑功能和结构机制也是一个热门领域。目前,研究主要通过获取受试者的脑电波来研究大脑功能,大脑的功能分区主要通过功能实验或脑磁图获得。
现代网络理论越来越多地应用于神经科学,以了解不同尺度和实验可达到的生理和病理生理条件下的神经生理学和解剖学。
基于网络的分析也有助于解决生态学中的几个问题和保护问题。第一项研究是在所谓的物种相互作用的背景网络中进行的。食物网是生态研究中的基本问题之一,尽管在网络结构中检测到相当高的可变性,但食物网呈现出类似于其他类型的真实网络和宿主寄生虫网络的复杂拓扑。这些方法的主要优势之一是直接评估给定生态系统对物种丧失或其他扰动的稳健性和敏感性。
多层网络在脑研究中的应用





大脑是大多数动物活动的控制中心,解开大脑的奥秘,用计算机等外部设备模拟人脑一直是许多研究人员的目标。在此之前,需要弄清楚大脑的结构和机制,而研究人脑由于其复杂性,成本很高。人脑是一个由其组成部分之间的结构和功能关系组织起来的复杂系统。最近的实验进展产生了前所未有的大量数据来描述大脑的结构和功能,现在可以通过测量大脑各个单元之间的成对相互作用来将大脑建模为网络。这种建模可以跨多个尺度进行,其中网络节点代表大脑的单位,包括蛋白质、神经元、大脑区域或其他测量单位。功能性磁共振成像 (fMRI)、脑磁图 (MEG) 和脑电图 (EEG) 等记录技术能够跨时间和跨多个频段捕获大脑动态。
最近的神经科学研究还利用多层框架的多功能性来模拟神经数据中的复杂关系。例如,给定单个受试者的 fMRI 和扩散张量成像 (DTI),可以构建多层网络,其中一层代表 fMRI 网络,另一层代表 DTI 网络。使用 fMRI 数据,可以构建一个功能网络,其中节点代表大脑区域,边缘代表区域活动之间的连贯性。在 DTI 数据的基础上,可以通过将大脑划分为区域,然后测量这些区域之间的物理连接强度来构建结构网络。最后,将每个网络视为多层网络中的一层,
大脑是一个固有的动态系统,认知的表现需要高度进化的大脑区域网络的动态重构,这些区域在复杂和短暂的交流中相互作用。然而,人类认知功能过程中这些重构过程的准确描述仍然难以捉摸。因此,许多研究都使用时间网络来研究大脑网络的动态集群结构,并揭示学习过程中潜在的人脑动态变化。包含时间信息的时间网络的优点是可以保留数据的完整信息,而无需将连接聚合到单个网络中。
生物信息学中存在大量的多层网络应用,但多层网络在生物信息学的任何一个子领域的应用仍然依赖于生物信息学数据的获取和积累,大脑研究也不例外。因此,跨学科合作是一个非常有效和必要的选择。在大脑数据采集的驱动下,大脑结构和功能逐渐被理解。根据这些研究,结合时间维度的脑功能动态建模是一种有效的研究手段。或许随着科技的进步,会增加新的数据维度。

参考资料:
Lv Y, Huang S, Zhang T, et al. Application of Multilayer Network Models in Bioinformatics[J]. Frontiers in Genetics, 2021, 12: 380.
回复 支持 反对

使用道具 举报

发表于 2025-3-1 16:40 | 显示全部楼层
就说一个点吧
生信和云计算的结合

毕竟我也不是专业的
大家轻拍

本来呢
从去年开始的新冠疫情
其实是生信的机遇期
特别是国外的疫情一波未平N波又起起起……
不管大的小的有钱没钱的国家
大家都在不断地爆发疫情
这就逼着全球不计成本地开发疫苗或者特效药

不计成本懂吧?
意思就是老子有的是钱!!!!!!!!
这句话老牛逼了

想象一下
你正在实验室里精打细算
一分一分地用着老板给你的预算和资源
你老板会不会突然地出现
在街角的咖啡店(划掉)
Ta严肃地告诉你
从现在开始
不用省钱了
使劲花!!!
毕竟——
老子现在有的是钱

就是现在!
研发费用加一串儿零
麻溜滚去干活!!!

有些事可能只靠钱还不行
但生信真的行
比如药物研发
这里面有一个重要步骤
虚拟筛选

如今能够用于药物发现虚筛的有机分子数量
已经达到了10的60次方
这个惊人的数字

那我们一般虚筛多少个分子呢?
大概在百万到千万级别的分子
差了有50多个零
为什么?
没有钱呗……

但是老板刚才说的是啥?
老子现在有的是钱!!!
于是思路瞬间就开阔了是不是?

2020年3月
哈佛大学医学院在《Nature》上发了篇论文
说他们现在有钱了(不是)
开始大吃大喝(绝对不是)
吃撑了之后(???)
用剩下的搞了一个开源药物发现云平台
这个平台可能耐了
它可以整合海量的CPU资源
对超大规模的化合物库进行虚拟筛选

比方说
原本他们在1个CPU上筛选1种化合物需15秒
而现在
他们用这个云平台
搞到了16万核CPU资源
对接10亿分子只需要15小时


关于这个云平台的详情可看这里——
速石科技 fastone:15小时虚拟筛选10亿分子,《Nature》+HMS验证云端新药研发未来所以
作为云计算的从业人员
我们真的觉得我们的未来充满了光明

哎哎?????
不好意思
串台了
重来——
我们是真的真的真的真的真的真的真的觉得
生物信息的未来充满了光明!!!!!
加油吧 !!
我们等着你们!!!!!!!!!!
在天上!!!!


码字不易,喜欢请点个赞哦~
回复 支持 反对

使用道具 举报

发表于 2025-3-1 16:41 | 显示全部楼层
生物信息学作为研究生物学问题的工具学科,下面选取了Science发布的全世界最前沿的125个科学问题中的生物学问题。希望能够回答这个问题。

意识的生物学基础是什么?
为什么人类基因会如此之少?
遗传变异与人类健康的相关程度如何?
人类寿命到底可以延长多久?
是什么控制着器官再生?
皮肤细胞如何成为神经细胞?
单个体细胞怎样成为整株植物?
地球生命在何处产生、如何产生?
什么决定了物种的多样性?
什么基因的改变造就了独特的人类?
记忆如何存储和恢复?
怎样从海量生物数据中产生大的可视图片?
我们能否有选择地切断某些免疫反应?
能否研制出有效的HIV疫苗?
能否预测蛋白质折叠?
人体中的蛋白质有多少存在方式?
蛋白质如何发现其作用对象?
细胞死亡有多少种形式?
是什么保持了细胞内的通行顺畅?
为什么细胞的成分可以独立于DNA而自行复制?
基因组中功能不同于RNA的角色是什么?
基因组中端粒和丝粒的作用是什么?
为什么一些基因组很大,另一些又相当紧凑?
基因组中的“垃圾”(“junk”)有何作用?
新技术能使DNA测序的成本降低多少?
器官和整个有机体如何了解停止生长的时间?
除了继承突变,基因组如何改变?
在胚胎期,不对称现象是如何确定的?
翼、鳍和面孔如何发育进化?
是什么引发了青春期?
干细胞是否位于所有肿瘤的中心?
肿瘤更容易通过免疫进行控制吗?
肿瘤的控制比治愈是否更容易?
炎症是所有慢性疾病的主要原因吗?
疯牛病会怎样发展?
脊椎动物在多大程度上依赖先天免疫系统来抵抗传染病?
对抗原而言,免疫记忆需要延长暴露吗?
为什么孕妇的免疫系统不拒绝其胎儿?
什么与有机体的生物钟同步?
迁徙生物怎样发现其迁移路线?
为什么要睡眠?
人类为什么会做梦?
语言学习为什么存在临界期?
信息素影响人类行为吗?
一般麻醉剂如何发挥作用?
导致精神分裂症的原因是什么?
引发孤独症的原因是什么?
阿兹海默症患者的生命能够延续多久?
致瘾的生物学基础是什么?
大脑如何建立道德观念?
通过计算机进行学习的极限是什么?
有多少个性源于遗传?
性别倾向的生物学根源是什么?
生命树是生命之间系统关系最好的表达方式吗?
地球上有多少物种?
什么是物种?
横向转移为什么会发生在众多的物种中以及如何发生?
谁是世界的共同祖先?
植物的花朵如何进化?
植物怎样制造细胞壁?
如何控制植物生长?
为什么所有的植物不能免疫一切疾病?
外界压力环境下,植物的变异基础是什么?
能否避免物种消亡?
一些恐龙为什么如此庞大?
生态系统对全球变暖的反应如何?
至今共有多少人种,他们之间有何关联?
什么是人种,人种如何进化?
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表