立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 307|回复: 5

[讨论] 最近十年,化学有哪些重大突破?

[复制链接]
发表于 2025-3-10 13:38 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
基础科学现今已经到了一个平稳发展的时期,相比于物理和生物的发展,化学作为一门独立的一级学科的发展也似乎严重依赖和物理,生物的交叉。两个比较新的领域:计算化学发展到现在严重依赖计算机运算速度的提高,生物化学正蓬勃发展,可是产业化速度却不明显。而且有机化学最大应用,制药行业化药的研发速度变慢,隐隐有被生物药赶超的趋势。所以问问化学近年的发展(十年),以及未来可能的突破口。

同类问题:
最近十年,基础物理理论有哪些重大突破? - 物理学
最近十年,化学工程有哪些重大突破和进展? - 科研
原文地址:https://www.zhihu.com/question/28441193
楼主热帖
回复

使用道具 举报

发表于 2025-3-10 13:39 | 显示全部楼层
博士的方向涉及一些计算化学,这问题是偶尔看到,占个坑,随时补充修改。
此帖对于我来说 更好像是笔记整理和知识的回顾,如果专门搞量化和模拟的,这些其实应该都很熟悉了,考虑到大家大多是做实验的,我也尽量和实验相结合起来。
我就这些年所学的在计算化学的心得稍微说说。主要包含2010-2020这十年间计算化学的一些发展
要说近十年的发展,就不展开讲更早以前的了,这里就放一个时间表,记录了之前所做的理论方法的重大进步的历史,特别是那些对计算有机化学和生物化学产生影响的理论方法。


QM / MM组合方法的发展以及密度泛函理论DFT的功能逐步完善,使我们进入了现在的研究领域
然后就讲讲近十年的吧,先说QM这块,再说MD,最后说QM/MM。

1:DFT泛函相关的发展
目前日常研究中最常用的泛函是B3LYP,M06-2X,PBE0,wB97XD,PBE,M06,CAM-B3LYP这些。虽然不断有新的泛函提出,但是做量化的大多知道,DFT是存在瓶颈的,虽然实用性不错,精度也挺好,但是继续提升精度没有太多的潜力,基本都是不断去拟合参数,校正修补,和后HF相互杂化来改进。高精度的计算肯定还是后HF,多参考方法的天下,这里贴一张图,来自J. Chem. Theory Comput. 2016, 12, 9, 4303-4325,主要讲了14种明尼苏达州密度泛函的比较,可以发现和最常用的M06-2X相比,后来开发的MN15,MN15-L也并不很突出。


要说明,即便真的找到了精确的交换-相关泛函,形式肯定也很复杂,计算量不会比高级别的后HF小的,所以做实验的同仁或者初学者选用主流常见的DFT泛函即可,多看相关文献心里就有数了。
2:量子化学程序的发展
我是Gaussian的用户,Gaussian发展不大,很多问题,Gaussian16能解决的,其实Gaussian09就可以。但Gaussian还是绝对的主流,每10个量化工作者里就至少有9个人频繁使用Gaussian,其余的ORCA,ADF, Molpro,GAMESS-US,Q-Chem,CP2K,Turbomole等加起来只占一成。
简单说下ORCA
ORCA是免费的,当前是4.1版,优点是支持了很多Gaussian不支持的重要方法,又因为充分利用了RI技术,使得DFT、TDDFT的效率极高,从基态到激发态,从单点到几何优化,从大体系DFT计算到小体系高精度耦合簇计算,以及NEVPT2、MRCI等多参考态计算全都做得挺好。溶剂模型、标量相对论计算、NMR计算等ORCA也都支持。
另外对我平时计算产生便利的是xTB, xTB是做GFN-xTB计算的程序。GFN-xTB(Geometry, Frequency, Noncovalent, eXtended TB),可以以很便宜的方式把几何优化、频率计算、弱相互作用这些问题都算得不错,能用于上千原子大体系‌。目前最新的是GFN2-xTB,结合了DFT-D4,基本可以做到在计算弱相互作用方面完胜PM7,PM6D3这些。顺手贴个GFN2-xTB的文献链接,引用已近400次了,J. Chem. Theory Comput. 2019, 15, 3, 1652-1671




xtb程序目前可以做单点、优化、振动分析等任务,覆盖是元素很全了,体系可以很大,几百上个原子。这是一大优势,多孔金属有机材料,高分子聚酯,都能搞,但是找过渡态、产生IRC,振动分析还做不到。因为大体系算起来很快,做构象搜索的可以利用基于xtb的Crest(Conformer–Rotamer Ensemble Sampling Tool))程序,亲测很方便。
然后计算化学中值得一提的发展和突破不止于此, 不得不提的是DFT-D色散校正的发展
2010年Grimme在JCP上发了篇文章,提出了DFT-D3的思想,2017年他又提出了DFT-D4的思想,做实验的可能不太了解这个的重要性,最直接的我就贴JCP关于DFT-D3文献的被引次数,我记得 知乎上曾经有个问题:有哪些被引过万的文章,喏这篇就是。




我稍微展开说下: 原子在不同化学环境下的色散系数是不同的,比如原子在分脑子中的色散系数就远比它在自由状态小。为了体现这一点,DFT-D3就利用特定公式根据体系坐标计算每个原子的配位数,进而影响色散参数,DFT-D3的本质就是对体系的势能面进行校正,所以单点,几何优化,振动分析,走IRC,AIMD等依赖于势能面的任务都会受到影响。DFT-D3 就可以令描述色散作用不加的泛函都达到了不错的水平,原理上DFT-D3可以结合任何泛函,然后比如结合在B3LYP上就成了B3LYP-D3。 DFT-D3可以用于1-94号元素 。


所以体系涉及弱相互作用的,基本都要加色散校正,pai-pai堆积,范德华吸引,氢键作用的存在。或者要研究分子间的结合能,团簇的稳定性,物理吸附,柔性分子构型现象对能量等情况时都会涉及。


上图来自 J. Am. Chem. Soc. 2008, 130, 47, 16055-16059,左边是加色散校正的,右图没加,导致结构中配对碱基的结构就发送了扭曲,本文的题目也说明了问题:Double-Helica Ladder Structural Transition in the B-DNA is Induced by a Loss of Dispersion Energy.
3:分子动力学(MD)模拟
我主要用AMBER,也会用些Gromacs,没用过CHARMM,NAMD,Lammps。这块发展特别快,我分几个子模块来讲吧:
3.1 力场
蛋白模拟的力场,ff14SB是最主流的,是目前AMBER和Gromacs中可以用的最主流的,这个力场主要是在AMBER99SB-ILDN基础上对骨架参数略微修正,对氨基酸侧链参数重新拟合搞了下,这样就和实验数据对的更准,去年出了个AMBER19SB, 改进了骨架二面角的数据。核酸模拟的话,适合RNA的改进是xOL3,对于DNA的是parmbsc1和OL15,我推荐使用(其实是manual推荐的哈)
OPLS力场的话,最近的改进是OPLS-AA/M 和OPLS-AA/L 但测试表明蛋白质模拟PK不过其它力场
CHARMM力场的话,最近几年是出了个CHARMM36m,对核酸,磷酯,蛋白方面均有改进,比如蛋白是重新拟合了CHARMM22/CMAP的骨架参数,解决其偏向出现α螺旋的倾向,还优化了侧链参数。
溶剂模型的话 顺便提下,最广泛的水模型还是3点水模型(TIP3P和SPC)都是上世纪80年代的事情了,四点水模型TIP4P是OPLS御用的(用TIP3P,SPC也完全可以),OPLS2.0后御用SPC,然后还有五点水,六点水,七点水模型,比较小众,比如七点水唯一的亮点是可以在较大温度范围内较准确地重现密度和介电常数。也有文献提到可极化水模型,因为极性环境会显著对水的电荷分布产生极化作用,但计算量会比固定电荷水模型大很多,且被主流程序支持不广泛,也不是非用不可的,所以我在生物大分子的模拟中也见得不多。对水模型参数的标准优化方法感兴趣的可以看看2014年的一篇JPCL: J. Phys. Chem. Lett. 2014, 5, 11, 1885-1891。
3.2 采样方法
我们知道MD模拟基本就是干两件事,一是采样,也就是构象空间的搜索,二是自由能的计算
先说采样,为什么采样这要紧又这么难呢  且看下图


这一看就知道了,键振动(10–100 fs),侧链旋转(ps至μs),局部域波动(ns至ms),变构转变(μs至s)以及蛋白质结构motif的折叠( μs至s)。要注意蛋白折叠的时间尺度(us)和我们当今主流的算力跑几百ns是完全不一样的,那么我们怎么样有效地把模拟时间加长或者通过通过几百ns的模拟 去推测蛋白结构的变化呢,这是个难题1。
第二个很头疼的问题便是下图讲述的


键断裂和形成的尺度(数十fs)比与蛋白质或溶剂碰撞或分子内振动弛豫的时标要短得多。所以一般的模拟,我们也无法去模拟键的断裂和形成,这是难题2。
所以基于力场和基于 QM/MM 的 MD 模拟的空间采样应该足够使结果接近平衡分布。只有这样,才能应用统计力学机制,计算结合亲和力等特性,并与湿实验进行比较。最近十年,主要对于这两个难题,诞生了很多方法,以采样为例,包括靶向分子力学模拟(targeted MD, TMD、拉伸分子动力学模拟(steered MD, SMD) 加速MD(accelerated MD, AMD)、副本交换分子动力学模拟(replica exchange MD, REMD)以及 metadynamics, GaMD等等。我这里拿acceleratedMD(aMD)稍微展开下,aMD增强采样有2种方式,一是升高谷底,二是降低能垒,用500ns的尺度就可达到通常在毫秒级上发生的蛋白质构象变化,贴一个J. Chem. Theory Comput. 2012, 8, 9, 2997–3002的例子,达到这样的效果归功于结合GPU加速的能力以及aMD提高最小值的采样能力。


如果我们稳定住某些特定的感兴趣的构象的话,最近十年发展起来的有元动力学(metadynamics),SMD(steered MD),伞形抽样(umbrella sampling)等,这一块尤为重要,因为如果想知道自由能随特定反应坐标的分布情况. 这种分布被称为平均力势(PMF), 它对识别过渡态, 中间产物和终点的相对稳定性是非常有用的, 运行一次MD模拟来产生自由能随特定反应坐标的变化, 然后查看采样的概率, 但因为过渡态的能垒存在,比反应物以及产物都要高,所以MD模拟将仍然处在它一开始的局部最小值或者跨越不同的最小值, 但极少会采样到类似过渡态的结构. 采样的缺乏也就使我们不能产生一个精确的PMF,一种解决方法就是上面提到的伞形抽样umbrella sampling. 通过分解反应坐标成为一系列窗口, 然后采用限制迫使反应坐标维持在靠近窗口的中心。上述方法增强了 MD 的采样效率,但是它们仍然具有一定的局限,例如, TMD、 SMD 和 AMD 等方法通过引入外力而使初始结构在较短时间内实现向目标结构的转换,但外力的引入会使真实的转化路径发生偏移。
metadynamic yyds我觉得太厉害了!


另外AIMD必须有名字,基于量子化学方法的动力学一般称为从头算动力学(Ab initio molecular dynamics, AIMD),相比于基于一般的经典力场的动力学,其关键优势在于精度高、普适性强、能够描述化学反应,代价是耗时相差N个数量级。之前提到的ORCA有不错的做BOMD形式的从头算动力学的功能,使用很方便,而且本身ORCA做DFT的效率又高,是做孤立体系AIMD的首选程序之一。虽然有些特性不支持,比如没法像Gaussian的BOMD那样直接做准经典动力学,不能根据原子距离等标准判断什么时候自动结束任务等等,但都不是大问题。不过AIMD太烧机器了, 一般是作为QM之后对TDTS来NMA虚频统计采样后跑几百飞秒。CP2K 也能做AIMD,但CP2K的输入文件实在是太难写了。。(空了更)
这边说到TDTS 正好插播一条,也是近十年完善的理论基础,关于多步催化循环中能量模型,很长一段时间,其实计算化学和实验方之间缺乏一个有效的话语系统,计算化学往往聚焦在单步基元反应的能量势能面的变化,而生物学家则侧重表型如生物量、代谢流量、基因调控等。近十年来,Kozuch教授从相对简单的金属有机催化循环为研究对象阐明了多基元、多底物、多进程的催化循环的能量跨度模型,以蛋白质工程度整体催化循环效率的周转频率 TOF 为目标函数,而非单基元反应速率,从催化循环的全系统考虑各个参变量变化对蛋白质催化效率的影响。他利用Eyring 方程重构了基元反应速率 k 空间和势能面表示方法,提出了整合催化反应动力学与量子力学的催化循环模型,揭示了催化循环的周转效率 TOF 与反应能量校正后的能量跨度模型的关系,指出 TOF 的精确表达式与催化循环势能面中过渡态和中间的能量点贡献度,提出最高能量过渡态点和最高浓度中间体点和反应能来快速预测催化效率。从优化 TOF 的角度来讲,控制度接近 1的中间体和过渡态是决速中间体(TDI)和决速过渡态(TDTS)。个人觉得这理论如同物理数学定律是非常简洁而普适的的,相关文献我放两篇吧 文献的题目就很秀:第一篇How to Conceptualize Catalytic Cycles:The Energetic Span Model, Acc. Chem. Res. 2011, 44, 2, 101-110。第二篇:“Turning Over” Definitions in Catalytic Cycles, ACS Catal. 2012, 2, 12, 2787–2794


让我们继续说,很多时候,我们做MD模拟的目的就是想看看构象的变化,探究结构和催化行为的关系。
如果我们跑了很长时间的模拟,甚至可以构建马尔科夫模型(Markov state model简称MSM)最近几年很流行,文献奉上:Markov State Models: From an Art to a Science J. Am. Chem. Soc.2018, 140, 7, 2386-2396。MSM 通过构建跃迁几率矩阵的方式描述体系在不同亚稳态结构之间相互转换的概率,从而获得体系长时间尺度的热力学和动力学信息。MSM 是一个数学模型,它包含一个构象状态网络和一个描述这些构象之间转几率的转移概率矩阵 T。此模型的基本假设是时间 t 时的状态分布 X(t)足以确定经历时间∆t(∆t>0)后的状态分布 X(t+∆t),并且每个∆t 之后的状态分布 X(t+∆t)仅取决于当前的分布 X(t), 而与之前的任何状态无关, 这即为马尔科夫性也称为“无记忆”性。构建MSM模型,一般要选择n个状态,使得它们涵盖了整个动力学行为,并且滞后时间τ足够长以成为马尔可夫模型,但又短得足以解决系统动力学问题。下面是一般的流程:


我觉得比较不错的方法就是通过细分再聚类的方法构建 MSM。首先对 MD 轨迹进行降维处理,所用方法为时间-结构独立成分分析(time-structure independent component analysis, tICA)。然后再将降维后的数据聚类成数百个微态,所用方法为 K-Centers;最后,再根据力学性质将微态进一步划分为若干亚稳态,所用方法为 PCCA(Perron cluster cluster analysis)。


往大了说 我们可以利用MD模拟得到轨迹数据进行无监督学习


3.3 结合自由能的计算
我决定专门在这个版本讲讲 近十年结合自由能计算的发展和突破
我经常遇到药物化学或是生物化学相关的实验组来询问我,蛋白-配体相互作用,蛋白-蛋白相互作用的问题,确实,大多数药物通过作用于特定的生物靶标发挥作用。能否准确预测药物和靶标之间的相互作用,是实现分子设计的一个关键问题。在文献Journal of Medicinal Chemistry, 2016, 59, 4033中就提到准确计算药物-靶标的结合能是该领域中过去30年以来的圣杯,现在也仍是这样。


上世纪80年代以来,出现了各种门类的理论方法用于定量计算蛋白-配体亲合性,很多商业的软件比如薛定谔,discovery studio,MOE等, 以及最近几年发展的数十种各种对接软件,Autodock,HADDOCK, ZDOCK,RosettaDock server都提供了打分函数,还有很多网页版的,方便做实验的同学快速计算,比大小 就知道结合的趋势。打分函数一般作为结构的初筛,然后再用Amber或者Gromacs跑MD,用MM/GB(PB)SA的方法计算结合自由能,这种方法的误差也有10kcal/mol,还是蛮大的,实际应用中常见的形式的是 Gbind,因为这是最常见的,我贴一个计算流程,国内做的不错的比如来自浙大的侯廷军组,侯老师回国后从2011年开始致力于相关的研究,发表了一系列Assessing the Performance of the MM/PBSA and MM/GBSA Methods的文章,在2020年底时,J. Chem. Inf. Model期刊发表了一个专刊,其中收录了10篇 60年来在JCIM发表的最具影响力的研究论文,其实就有侯老师的一篇:J. Chem. Inf. Model. 2011, 51, 1, 69-82


我们知道分子对接的预测能力依赖于其所用蛋白−配体打分方法的预测精度,MM/PB(GB)SA方法已成为近10年应用最为广泛的结合自由能预测方法之一,但其在虚拟筛选中的总体预测能力和应用范围一直未有定论,阻碍了其在创新药物发现中的应用。于是对6个蛋白质体系的59个配体小分子的结合自由能进行了系统的评估研究,研究了分子动力学模拟时间、溶质介电常数、构象熵的计算以及不同PB和GB模型对预测结果的影响。研究确定了介电常数和靶点–小分子界面性质之间的定量关系,为自由能计算中介电常数的选取提供了比较可靠的依据。研究还发现,MM/PBSA的预测结果更接近实验数值,而MM/GBSA则对相对结合自由能预测性能更优。在后续的研究中,还深入探讨和评估了分子力场、溶剂化模型、原子电荷、构象熵、动力学采样时间等多种因素对MM/GBSA预测精度的影响。这里贴一篇前年发表的综述,对MM/GB(PB)SA方法感兴趣的可阅读:Chem. Rev. 2019, 119, 16, 9478-9508。


然后如果精度再往上走,误差达到1~2kcal/mol的计算方法,就要涉及炼金术(Alchemical)结合自由能的计算了,热力学积分(Thermodynamic Integration ),自由能微扰(free energy perturbation)等就属于这个范畴,很多用荧光偏振实验,IC50实验测定差异不大的,在计算上重现就要上用方法,药化,生化相关专业的同学值得关注。炼金术自由能计算涉及热力学循环的概念,从上世纪80,90年代开始有人做,到近十年通过Gpu加速计算,使得这种昂贵的精度极高的方法越来越普及,对于小分子官能团的一系列改变,以及蛋白残基的一系列突变都能进行。由于自由能是一种状态函数,热力学终态(结合和未结合)可以通过任何途径连接起来,在实践中可以构建多条热力学循环路径,利用可以优化计算的最终状态之间的“炼金术”途径。Gromacs和Amber都可以跑,用商业的薛定谔软件FEP+也可以。我用的最多的就是Amber,大概从AMBER16开始,应用Alchemical方法的文献是越来越多, 在2014,2015,2016年,用此技术方法纯计算发JACS还是可以的。在计算中容易遇到的问题有三种:“终点灾难”、“粒子崩溃问题”和“大梯度跳跃问题”,比如终点灾难就比较常见,在热力学终点(λ 值接近 0 和 1),dV/dλ的数值会发生跳跃。





3.4 自由能计算
先空着

QM/MM的发展
我们知道分子力学(MM)精度低,不适合描述化学反应,但可以处理很大的体系,QM精度高,但能处理的体系较小,将两者结合,就可以将体系最重要的区域用QM,不重要的区域用MM,就可以处理尺度介于QM和MM之间的体系,比如溶质和溶剂的体系,酶催化的反应等等。
这个思想是1976年就有了,就是2013获得诺奖的三个大佬弄的


The Nobel Prize in Chemistry 2013 was awarded jointly to Martin Karplus, Michael Levitt and Arieh Warshel "for the development of multiscale models for complex chemical systems.
近十年,由于计算能力的提升,使得QM/MM方法成为十分广泛的手段,实现QM/MM的程序也很多,比如Gaussian就支持AMBER,UF力场,以ONIOM方式将QM与MM结合做优化,振动分析等;Q-chem也能做,支持AMBER,OPLS-AA,CHARMM力场;ORCA能做,支持把CHARMM力场转化成自身格式然后做QM/MM单点,优化,找TS,IRC,动力学等。CP2K可直接做QM/MM的优化和动力学,然后也有如Chemshell这样的接口程序,将分子动力学程序GROMOS,GULP,CHARMM与量化程序Gaussian,ORCA,Dmol3,Q-Chem相连接做优化,动力学等。对于酶催化的很多机理探究,协同反应,分布反应,从反应物 到产物释放,我们往往就是先跑MD,跑完MD模拟之后,计算 QM/MM反应势垒来确定多种反应途径之间的竞争关系,最常用的是ONIOM方法,以及最近几年发展起来的簇模型(Cluster model)。
想了解ONIOM的 可以看Chem. Rev.2015, 115, 12, 5678–5796:The ONIOM Method and Its Applications


个人用起来 觉得比较麻烦的就是1:边界原子的处理,2:补全参数,也像TAO包,这样的Gaussian做ONIOM的辅助工具,包含了一套Perl脚本文件来构建输入文件,监控计算,还是不错的。
想了解簇模型的 可以看Fahmi Himo组的文章,他们组不用ONIOM方法,一律用簇模型,因为用ONIOM(QM:MM)方法计算酶催化等生物体系时,通常的处理会讲反应位点取做QM区域,周围一定距离的残基取作MM区域,而簇模型也叫all-QM或者QM-only模型,选取的原子数会多一些,大概200-300个。列举两篇:Recent Trends in Quantum Chemical Modeling of Enzymatic Reactions. J. Am. Chem. Soc. 2017, 139, 6780-6786以及Modeling Enzymatic Enantioselectivity using Quantum Chemical Methodology ACS Catal. 2020, 10, 11, 6430–6449.
4.突破性的发展
我发现有些进展和方法 既不属于QM,或者MD,QM/MM,于是我设置了这一章节,从何讲起呢?就从2018年的诺贝尔化学奖开始吧,我直接引用官网的文字:The Nobel Prize in Chemistry 2018 was divided, one half awarded to Frances H. Arnold "for the directed evolution of enzymes", the other half jointly to George P. Smith and Sir Gregory P. Winter "for the phage display of peptides and antibodies."


阿诺德的领域就是涉及酶的定向进化(Directed Evolution)。最初,引入了随机氨基酸变化的迭代循环,随后选择了具有改进的热稳定性,底物特异性和对映选择性的变体。不仅在实验上批量突变筛选选择,计算化学上也因为分子动力学方法和技术的飞速发展,使得对酶的研究高速推进,我列举一些高速发展的分支:酶的机制和选择性,新型催化酶的预测,立体选择性有机反应,催化剂的机理和设计,有机金属反应机理等等,每个分支还有很多二级三级的分支,我很难对每一块都像写综述一样去介绍和列举,就挑一些典型作为例子,抛砖引玉。
4.1 理论酶(theozyme),  
如果你从事有机化学或者对有机化学有些了解,便知道取代反应,自由基反应,加成反应,消除反应,氧化还原反应,各种重排反应,看得直接头大,但在生物体内的化学反应,种类其实并不多,又因为酶的高效性,计算上就能通过计算模型官能团去稳定过渡态的最佳几何构形 去构建,像造飞机造汽车一样去设计改造enzyme. 这一块的大佬我列举三位:K. N. Houk;Donald Hilvert;David Baker


顺着定向进化说,如何通过氨基酸残基突变优化在新底物和新环境下高活化能反应势能面的生物合成酶?实验科学家通过多轮定向进化对氨基酸序列进行随机性的优化和改进。但是计算化学领域的科学家则提出了诸多催化的模型 用于生物合成酶和工业酶的理性设计和优化。通过对反应势能面上反应物、产物、过渡态、中间体等驻点(能量极值点)的计算来透彻刻画酶催化反应机理,理论学家基本认同了酶具有将反应的总活化能(或表观活化能)减低到 15-20 kcal/mol 的能力,等价于半反应时间缩短到毫秒 (millisecond) 至秒 (second) 的范围。
对蛋白质分子如何降低总反应活化能的机制理解上存在一些不同的看法,比如上面提到的来自UCLA的Houk教授就认为,类似有机化学催化反应,酶催化能力主要来自蛋白质的特殊氨基酸残基稳定了催化过程中的关键过渡态具体的计算一般是了解酶活中心催化的机理,一个生化反应有非常多的可能途径,特定蛋白质分子的结构具有降低关键过渡态的作用,可以通过计算底物与周边关键氨基酸残基复合体 Theozyme模型来理解,然后利用所获得的过渡态与周边残基复合物的几何结构利用inside-out 等策略构建蛋白质框架,来开发和优化新酶。我就举两个例子,第一个是水解酶,很多会有个Ser-His-Asp的催化三联体,或者Cys-His这样的催化二联体,以及一个氧离子穴,Ser或者Cys就可以作为亲核试剂,并通过氢键  His去质子化,就能进攻底物的酯键的C原子,形成一个四面体,His上的H会和底物的C=O的O原子结合 释放醇,这就完成了酰化的步骤,接着就是水分子的进攻 水解,这样一轮反应cycle就完成了。知道机制后 就可以去设计改造酶了


J. Am. Chem. Soc. 2012, 134, 39, 16197–16206 ; Nat Chem Biol. 2014;10(5):386-391.
4.2 机器学习
很多时候在MD模拟中的ML,指结合人工神经网络(ANN)的方法,这方面先起个头



5.波函数分析软件Multiwfn
Multiwfn是极为流行、功能最全面的的量子化学波函数分析程序。通过现成的量子化学程序,在各种近似条件下求解薛定谔方程,就可以得到体系的波函数。波函数包含了体系中一切信息,可以视为是个黑箱,通过对波函数及其衍生信息(如电子密度)进行各种方式的分析,就可以从这个黑箱中提取各种具有化学意义的信息,使体系的内在特征能够被我们透彻地认知,诸如原子间键的强度与本质、电子在体系中的行为和分布方式等,同时也可以预测当前体系如何与其它体系相互作用,诸如预测反应位点。
因为十分容易上手,十分强大,被引率快破万了,在此感谢sobereva大大

回复 支持 反对

使用道具 举报

发表于 2025-3-10 13:39 | 显示全部楼层
先来正面的:
       微反应器技术: 微反应器是利用精密加工技术制造的特征尺寸在10到300微米(或者1000微米)之间的微型反应器,应用在许多领域中,在化学工业中发挥着巨大的作用。
       微反应器,即微通道反应器,利用精密加工技术制造的特征尺寸在10到300微米(或者1000微米)之间的微型反应器,微反应器的“微”表示工艺流体的通道在微米级别,而不是指微反应设备的外形尺寸小或产品的产量小。微反应器中可以包含有成百万上千万的微型通道,因此也实现很高的产量。
       微反应器独特的结构给它带来了一系列优质的性能,故它被应用到许多领域中。例如对于小规模的光化学过程,采用透明的微反应器可有利于薄流体层靠近辐射源。德国美因兹微技术研究所开发了一种平行盘片结构的电化学微反应器。使用这个装置,提高了由4一甲氧基甲苯合成对甲氧基苯甲醛反应的选择性。由于微反应器高的传热效率,使反应床层几近恒温,有利于各种化学反应的进行。Wan等在微反应器中将苯胺氧化成氧化偶氮苯,DelSman等在微系统中研究了一氧化碳的选择氧化,同时微反应器也被应用到加氢反应、氨的氧化、甲醇氧化制甲醛、水煤气变换以及光催化等一系列反应。另外,微反应器还可用于某些有毒害物质的现场生产,进行强放热反应本征动力学研究以及组合化学如催化剂、材料、药物等的高通量筛选

负面的:
     各种逼学生搬砖的技术,各种限制学生人身自由的技术,各种把化学的前景和学生出路吹的天花乱坠的技术,各种误人子弟的技术,各种掩盖化学专业现实问题的技术,各种明明舍不得安防投入却宣传实验室多么美好的技术。各种下三烂争权夺利,争夺科研经费的技术。各种把人才引进来而不兑现入职承诺不解决住房的技术。各种仅仅发了个高影响因子的文章就敢鼓吹多么具有潜在应用价值的技术。各种卖情怀画大饼的技术。各种把学生逼成神经病、抑郁症和神经错乱的技术。
分享下化学专业老师奇葩理论娱乐一下
比如:博士毕业找不到教职当一辈子千年老博后也挺好的,可以周游世界啊;找不到教职是因为你没学好(这得需要学的多好啊?难道大家都要像何智赵永芳那样好吗?人都死了,钱、职务还有个屁用啊);科研的热情就是一周70小时的实验室工作时间,吃饭睡觉都在实验室,没准半夜有科研的火花产生呢;女性科研工作者成功的关键是有家庭一直支持你鼓励你(你老公孩子谁来管);喜欢化学就坚持下去(没准儿哪天就评青千评院士得诺奖了呢);学化学国内找不到工作你们就都出国(老师成人贩子了,本来中国人就得在国内呆着,出国肯定受歧视受欺负),云云。不靠谱的程度堪比传销。
供大家一笑。
回复 支持 反对

使用道具 举报

发表于 2025-3-10 13:40 | 显示全部楼层
更新:
第一次收到这么多赞,表示这几天的柱子过得很开心哈哈。看了这几天的评论,在这里表达一下几个可能比较受关注的话题。
1. 有很多童鞋表示我说的化学更像是化工的作用。
我所理解的化工,就是化工的工艺设计。包括反应器的设计,适应反应的温度压力加料方式等条件;物料运送包括传质传热,管道流程设计;能量,热量,电力和自动控制等等。他们所需要解决的问题就是,如何将若干个化学反应大规模化,高效的实现反应条件并且解决其中因为质量增加而产生的动力学问题。
而化学呢,是以反应机理为出发点,从精确到化学键的角度来优化反应,基于对物质性质的理解来提供更高的产率,更温和的反应条件,更简单操作和更方便的纯化过程。和化工的出发点不一样,所需知识也不同。
2. 我自己以前做纳米,总觉得发了paper之后内心空虚的不行,后来转行做有机,直到现在做配位化学。难说没有心里落差,以前纳米实验室,管式炉热沉积静电纺丝semtem,仪器加起来不下2千万。后来转了行,买根新柱子都能高兴两天,可是却觉得很踏实,因为知道自己在做什么,为什么这么做,做了有什么用。
本科学化学的时候总想做最不毒的,最environmental friendly的,现在做有机够毒了,还特么做砷,砷都够毒了,还特么做放射性的砷。。真是做得一手好死。
3.这个问题之前排名第一的答案,让我这个化学狗看了情何以堪。他的观点认为化学的发展依靠cpu的发展。
我个人对于搞计算化学的人有很强烈的我反感。以前有个搞计算的小哥跟我说,嗨你看我这里有一个反应,根据计算结果应该产率回很高,这样就有了一个新型的合成方法,是不是很牛b!我说哎哟不错哦,这个屌!于是做了一个月什么都没做成,然后我去找他说,小哥你这个不行啊,我书读得少你不要骗我啊!小哥说,哦你看 这个反应不成功也是有原因的,计算结果里面也表明了他会出现这样的问题。。。
所以我觉得吧,不能因为做计算化学的在电脑前待得时间长,就觉得可以在网上代表所有搞化学的人了吧。
我可以完全不依靠任何理论计算结果,就完成一个独立的科学项目。怎么样我就是不懂数学,可我活好啊~
@余旷同学应该是做计算化学的大神了,小伙伴们有问题可以问他。不过我觉得写回答b格太高了不好。那么多缩略词,谁看得懂你的答案。。说实话大家都是phd了,写点东西让所有人除了自己老板之外都看不懂,很随意嘛。但是不要忘了,scientific writing第一课就是不要用太多缩略词。而且在此声明,我们留学生之间讨论学术问题没有那么多缩略词。和外国人聊学术都是英语,说不清楚了就画画结构式都很正常,很少用缩略词。我们和中国小伙伴聊天都是这样:骚年最近柱子过得怎么样了?带的本科生瓶子洗的干不干净啊,现在还边做NMR边打dota了么?大家没事了用液氮互相泼着玩一下,帮心仪的妹子配点卸甲水啊,偶尔在家里开个酯化反应净化一下空气什么的,借同学的3d打印机给妹子做个mug什么的,小伙伴们的生活还是很有趣的,没有那么高大上啦。

------------------------------------------------------------
不请自来。
身为一个化学狗,从来都在各个学科里没什么存在感。看到这个问题,读了排名前几位的答案,含泪决定来这根据自己这么多年在化学领域的经验,把这个问题回答好。
先自我介绍吧。本科985化学系毕业,现在在美帝化学phd在读。
下面含泪讲讲我的化学血泪史。
题主问化学领域的发展。化学领域,不是生物化学,不仅是计算化学,更不是纳米科学。回到初中第一次接触化学,教材上的定义,化学是研究物质的学科。
一个chemist,应当致力于发现物质,了解物质,进一步合成物质。这才是真正的hard core chemistry。
化学界公认的顶级期刊是以下两个:journal of american chemical society, angewandte chemie。浏览一下就会发现,除过交叉学科的突破之外,真正纯化学领域的论文,无非就是说:我们可以更简单,更快,更高产率的合成一种物质。
化学家们存在感不高,因为科学进步往往不会是化学家直接的贡献。科学家们在解释自己的发现多么牛逼的时刻,化学家们在默默的将想法实现。从这个角度想,任何科学,首先需要化学家讲研究对象做出来,再把研究对象从一堆杂质中分离开来,这是科研的基石之一。
如果说数学在一个领域应用的程度,体现了这个领域发展的程度,那么化学在一个领域应用的程度,体现了这个领域离变成现实的距离。并且,化学无法用数学来体现发展程度。对于某一种物质来说,化学家可以想出无数种手段来合成他,并且在动手之前,可能本本不需要任何理论计算对合成做出预测。
That being said,化学家都是务实者。没有废话,没有吹牛,没有那些纷繁复杂的假大空概念理论,也没有那些键盘侠们种种假设讨论。化学家们默默的让人们穿到更舒服的衣服,吃到更好吃的食物,享受更便宜的药,让一切想法的实现变的更简单,让这些复杂如shi的物质变的不再神秘,甚至可以人工复制。
化学家们没法装逼吹牛,we make things and get things done.
这TM才是真正的化学。
下面来说突破。
作为一个基础学科,不与其他学科合作,已经很难再有重大的突破了。数学,物理这些基础学科都面临一样的问题。一个高阶偏微分方程,现在的数学家们并不能比200年前的数学家们解的更好。物理界,爱因斯坦之后不知会有多少年,才能有改变人们世界观的突破。要讨论突破,就离不开交叉学科。说小一点,和我同届毕业的化学生,投身科研的不少,绝大多数我的同学要么投身纳米材料,要么投身生物蛋白,只剩下我一个人还在啃着金属配位这个传统的hardcore chemistry。下面逐一分析各交叉学科。
生物领域。生物研究具有直接性,研究对象可以直接到一个生物体,也可以直接到一个蛋白质,一个核酸分子。而化学具有精确性。精确到一个化学键,一个原子甚至一个电子。
而化学的突破对于生物领域,我认为最会对整个学科发展有推动作用的有以下几个方面。
1. 蛋白质合成。化学手段利用氨基酸合成蛋白质,受成本等的影响,发展受到限制。而从氨基酸出发化学合成蛋白质,很难能够还原蛋白质二级和三级结构,而蛋白的活性往往藏在这里。传统的蛋白合成方法是利用基因技术,培养细胞让其定向表达蛋白。就像是养不同的奶牛产不同的奶。这种方法周期长,所合成的蛋白领域不广没有普适性。人工化学合成蛋白的重大突破可以直接简化人们对蛋白质的了解,从而在生物大分子作用领域激发重大突破。
2. 特定溶液环境的化学反应。细胞里的各个位置,特定的生物环境和化学环境不同,产生的化学反应往往离开特定环境就会失效。而这些化学反应往往与抗癌等生物课题密切相关。对环境可控化学反应的研究,会让人们对生物过程了解的更深刻,更准确。
3. 大分子结构的预测。前面计算化学的仁兄谈到了,不在赘述。
纳米科学领域。纳米领域不断涌现出的新型材料正在一点点的改变这个世界。20nm技术已经让硅电路板做的不能再小,石墨烯等碳基材料有可能会带来计算机科学的革命,但是化学能在其中起什么作用呢。
1.可控纳米材料的合成。纳米材料之所以神奇,是因为其特定尺寸的微结构能将表面性能改善甚至根本改变。化学家的本事,就是可以通过改变合成条件,控制材料的形貌,从而改变性质。我作为一个化学家,来问问做纳米材料的同仁:你们做纳米材料的时候,到底特么知不知道为什么某个条件能长成某个特定形貌?!化学家的介入,或许可以介入一个体系。在对机理充分研究的前提下,可以随心所欲控制条件来控制材料形貌。that's the dream fellows!
2.材料规模化生产。纳米材料牛是牛。前两天上日报的一个答案,讲的是cvd法合成铝电池的突破性研究。好文章也发了,牛逼也吹了,那我来问问你们,cvd法的成本,你们怎么解释。哇哈哈哈cvd的成本可不是偏高哦亲,是特么高的离谱,为什么企业家们没钱投产做规模化,为什么做纳米的找不到企业里的工作,你们想想看啊!这时候就需要化学家来拯救世界了。让反应条件更温和,让产率更高,让周期更短,化学家们让世界更美,也让读纳米的phd们能在工业界找得到工作,迎娶白富美走上人生巅峰。
今天更新到这里,有更多化学问题我们可以继续讨论。纯手机码字,嫌有错别字就别看。
回复 支持 反对

使用道具 举报

发表于 2025-3-10 13:41 | 显示全部楼层
这个问题很有意思。其他方向不懂不敢妄言,对于计算化学的发展,前面
@余旷  同学绝对的大神级人物,写的太专业了,我估计别说非专业人士了,计算化学低年级研究生都不一定看得懂。。我就再做点图文补充好了。
十年之前,我们假设是2005年左右。跟十年之后的今天比,计算化学或者说计算生物化学的发展极大的归因于计算机水平的提升
十年之前,我们用的CPU是这样的:


单核啊亲,就这玩意现在估计win7都带不动了。现在呢,是这样的:


10核 12核的霸气ivy bridge,计算人士的最爱。
由于计算机水平及其巨大的提升,计算化学才敢去解决很多以前解决不了的问题。比如,酶催化反应是非常奇妙的东东,又不给升温,又要求迅速完成,你这甲方没完没了了是不,为了解决这一问题,十年前,我们搭建了这样的体系:


我了个大槽,震惊了,这尼玛叫蛋白质???这叫酶催化反应?请问1-70号氨基酸呢???
额,不好意思,图中没有的氨基酸都用真空代替了。。。
真空……你没有看错。
也就是用几个氨基酸跟一个底物放在真空环境下来研究催化反应…
不是应该在细胞环境下用完整的蛋白来研究吗???
不是我不想,臣妾做不到啊,加上其他氨基酸算到我延期也算不完啊。真心算不动
现在:


不仅可以搭建完整的蛋白质-催化底物体系,同时方法要比之前好得多,精确度什么的更不用提了,半个月左右就能算完。
计算尺度有很大提升,十年之前,大概只能算一个蛋白质左右的东西,加上水溶剂模型,也就2,3万,3,4万,4,5万,反正也就不到10万个原子吧。图就不放了,就上图那样大小的东西。
十年后:


我勒个去,这个东西其实刚出现的时候大家也都震惊了一把。都能算这么大的HIV外壳结构了???大概100W个原子
十年之前的计算化学,解决的问题是这样的:


……
似乎没啥变化啊,恩……
其实有的。。。
变化很微小,只能观察趋势……

十年后:
我们都知道,RNA在核糖体制造蛋白质,那么问题来了,氨基酸是核糖体一个一个制造的,恩,其实就是跟大便一样一点一点拉出来的,奇怪的是,怎样让着一点一点拉出来的东西在极短的时间内形成固定的结构呢?也就是说,假如拉的成分一样,那么,拉出来的都是一个结构。为什么?




一个无规卷曲的蛋白在计算机程序中,自发的折叠成了其应有的三维结构,与实际的晶体结构非常类似。
计算化学非常适合研究蛋白折叠/去折叠问题,相信将来在破解传说中的“第二遗传密码”以及阿兹海默病等方面会有很大的发挥空间。
2003年左右,我们模拟的时间是这样的:


1ps=0.000000000001秒,也就是模拟了0.000000004秒时间内的运动情况。
十年后:


模拟了200us,也就是0.0002秒。这个尺度马上就可以用秒表观测了!
另外需要概叹的是,由于计算化学发展的非常快,很多东西都是迅速被淘汰,导致计算化学专业的学生及其的苦逼,你需要不停的学习新东西,新方法。比如十年前:




2005年时期的同源模建homology modeling是有这光明前途的,一个模建,一个对接,一篇IF 2-3的文章就出来了。模建最辉煌的时候,其结果居然被收录到蛋白质结构数据库(protein data bank,PDB)!!!
当然,现在的情况是,该数据库已经全面移除所有模建结果,同源模建已逐渐沦为非常非常边缘化的东西,专业搞计算的几乎不用,大牌文章会随便做点模建作为自己的理论依据。(真是无奈啊)
现在的模建:


MOLECULAR SIMULATION 影响因子1.0,JBSD SCI除名,今年刚重新被录入。同时必须要加分子动力学模拟才行,纯的模建对接,连国内核心也发不了
另外最近发展的飞速的就是GPU了。
GPU对于计算化学的影响很难说,但是GPU对于计算化学屌丝的影响是革命性的!
2005年,我用的SGI服务器,大概就这个样子:


一天只能算100ps不到,ps是多长大家也知道了。这个机器大概是几十万。
现在,我买了一块2.5W的GPU:


速度是这样的:


30ns一天。一周100多纳秒。老板再也不用担心我的学习了。
GPU,屌丝福音!屌丝必备!
计算化学发展到现在,主要的发展方向是两块:
1,方法,必须要尽快改进各种理论方法,增加知识储备。参见
@余旷的专业级回答。
2,计算化学到底能解决什么科学问题?
解决科学问题才是我们最终的目的。
我觉得D.E.SHAW有一篇文章非常的棒,贴图如下:


我们吃药,然后药通过代谢进入细胞内,接着问题来了,药物是如何运动到靶点蛋白上的??你咋知道你吃的感冒药是去治感冒了而没有去肾上腺素受体那活动去?
该文章就模拟了一个药物分子在外面随便运动,接着被蛋白捕获(红色,绿色),最终进入催化区域(蓝紫色)。以上过程全都是自发进行的。
可以说计算化学在这10年的发展是非常大的,比10年之前大,我觉得比未来的十年也大。计算模拟现在不仅仅是在方法论方面的发展,一些方法理论的成熟也使得计算化学/生物学在很多领域都开始解决具体的科学问题。比如材料,环境等。未来10年感觉计算机水平很难有革命性的提高了,不管是主频、架构、工艺等等,当然我是非专业人士是指我个人的看法。进步的幅度可能不如这10年。不过相信这门学科也会慢慢的跟实际生产想结合的。
回复跟私信都有问文章名称跟出处的:
最后一篇
Pathway and mechanism of drug binding to G-protein-coupled receptors其他的我当时写完随手删掉了……不过很多都是D.E.SHAW的,他的文章基本是计算模拟用于解决实际科学问题的TOP1了,可以上他的主页看。
回复 支持 反对

使用道具 举报

发表于 2025-3-10 13:41 | 显示全部楼层
谢邀。
我的感觉:反正在理论计算这一块,特别震惊,特别具有突破性的进展应该没有,但是小的进步累加起来也挺可观的。很多以前就有的想法这几年越发完善了。或者以前算不动的现在能算动了。我们这个领域的发展都是非常渐进式的,很多想法要经历十几甚至几十年的发展和数代人的努力才能逐渐成熟,所以有的时候不太好定义什么是十年内的。这里随便写一点关于计算化学的流水账,不结尾,不定期补充,写到哪算哪,大家看个意思。水平有限欢迎补充。
首先DFT方面整出了一些还不错的泛函,顺着range-separated hyrid的思路有wB97X-D和HSE-06。correlation里再掺一点RPA就有了double hybrid functional。修正弱相互作用方面有Grimme的D2/3经验修正,Langreth的vdw-df和Troy van Voorhis的VV系列。修正self-interaction error方面,涛哥整了一些linearize correction,听说效果拔群。当然我们绝对不能忘记拟合狂魔Don Truhlar持续不断更新中的M系列。算机理的同学都可以感受一下,别整天B3LYP,B格太低。
基组方面,Werner搞了一套explicitly correlated的F12系列,亲测有效,算是有一点点新的想法。还有denisty fitting(或者说叫resolution identity)的应用也越来越多,尤其是在MP2上大大加快了计算速度。
QM方面除开DFT,QMC这几年的发展貌似很快,至少应用文章是越来越多了。70年代就整出来的SAPT现在终于能用来算10个原子以上的体系了。Spin flipped method不知道算不算这十年的进展。MP2和Coupled Cluster被陆续移植到了使用平面波基组的延展体系中,大家算固体的时候除了DFT开始有一点其他的选择了。同样被移植到延展体系中的还有PCM溶剂化模型。大家以后在跑VASP的时候可以考虑一点溶剂化效应了。顺着Divide&Conquer的思路,JIali Gao的XPOL,还有Mark Gordon的FMO也在持续发展中。
MM领域,非经验性基于ab inito的力场进展很大(这个是我博士论文的题目,私货...),现在至少有一部分算是可用了。Greg Voth整了一套基于Force Matching的coarse grain方法,很好。另外新的水模型估计发展了没有一百也有几十了。不管是MD还是MC,新的采样方法发展了不少,大的想法还是那些,小修小补,不详述。
在Mixed resolution方面,QM/MM这是多年前的想法了,这几年主要是扩大应用范围并不断完善,好像有人做了一些adaptive QM/MM,给原方法增加了一些弹性。QM/QM层次的所谓Embedding方法最近这几年也发展了不少(这是我现在的课题,也是私货),总之现在在DFT的环境里做CCSD也不是梦了。
还有一个比较重要的事是GPU的崛起,这个能带来多大的变革还有待进一步的考察。
量子动力学领域我不熟,查了一下RPMD好像是这十年间发展起来的,个人认为是一个比较重要的进展。
-------------------------------------------------
很多人可能对中英文夹杂的文风比较反感。其实写的时候没想那么多,我们平时中国留学生交流学术的时候的说话风格就是这样,国内可能觉得我是在装b,真没这个意思。这里中英文夹杂的现象并没有那么严重,多数英语是难以翻译的术语,英文反而比中文更易理解。不过我还是改了一下有些没必要的英语单词,比如idea之类的,希望大家能理解的更好。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表