《自然》:第一个完整的常染色体的结构、功能和进化

 

1、《自然》:第一个完整的常染色体的结构、功能和进化

 

2021年4月7日,来自美国华盛顿大学医学院Evan E. Eichler小组在《自然》发表了题为“The structure, function and evolution of a complete human chromosome 8”的一项新突破研究成果,他们揭示了人完整8号染色体的结构、功能和进化关系。

 

第一个完整的常染色体的结构、功能和进化

 

研究人员使用互补长读测序技术,完成了人8号染色体的线性组装。该组装克服了以前长期存在的五个缺口序列,包括一个2.08Mb着丝粒α-卫星阵列、在644kb拷贝数多态性β-防御素基因簇中这种蛋白质对疾病发生很重要,并且在8q21.2号染色体上有一个863kb可变数目的串联重复序列,其可以充当新着丝粒。研究表明除了73 kb的低甲基化区域,着丝粒α卫星序列通常被甲基化,其中富含高浓度CENP-A的核小体各种高阶α卫星与动粒的位置一致。

 

此外,研究人员还揭示了人二倍体基因组中着丝粒的整体组织和甲基化模式。使用双重长读测序方法,研究人员完成了黑猩猩、猩猩和猕猴中第8号染色体直系着丝粒的高质量装配草图,以重建其进化史。比较和系统发育分析表明,高阶α-卫星结构在层状对称祖先中演化,其中更古老的高阶重复序列位于单体α-卫星的外围。研究人员估计,与基因组的独特序列相比,着丝粒卫星DNA的突变率增加了2.2倍以上,并且这种加速可扩展到侧翼序列中。

 

据悉,人单个染色体的完整组装对于理解人类生物学和进化是必不可少的。

 

(评论:人类常染色体第一个完整的端粒到端粒序列已经完成。8号染色体的序列不仅填补了目前参考基因组中300多万个碱基缺失的空白,而且这些DNA含量和排列在进化背景下,在几种免疫和发育障碍中,以及通常在染色体测序结构和功能中都是有意义的。

 

文章来源:

Glennis A. Logsdon, Mitchell R. Vollger et al, The structure, function and evolution of a complete human chromosome 8. DOI: 10.1038/s41586-021-03420-7, Nature:最新IF:43.07

 

2、Nature Methods:活细胞中GPCR二聚体smFRET成像

 

2021年3月8日,来自美国哥伦比亚大学Jonathan A. Javitch和美国圣裘德儿童研究医院Scott C. Blanchard研究组合作,在发表了题为“Single-molecule FRET imaging of GPCR dimers in living cells”的研究成果,开发了活细胞中G蛋白偶联受体(GPCR)二聚体的单分子荧光共振能量转移(smFRET)成像技术。

 

他们报告使用smFRET来检测和追踪哺乳动物细胞质膜内扩散的跨膜蛋白的普适方法。他们利用这种细胞内smFRET方法来显示激动剂诱导的个体代谢型谷氨酸受体二聚体内的结构动力学。他们将这些方法应用于代表性的A、B和C类受体,分别找到受体单体,密度依赖二聚体和组成型二聚体的证据。

 

据了解,已知C类GPCR形成稳定同型二聚体或异二聚体对功能至关重要,但是构成所有GPCR的> 90%的A和B类受体的低聚状态仍是研究重点。

 

(评论:SmFRET是一种强大的方法,有可能揭示有关GPCR组织的宝贵见解,但很少在活细胞中用于研究蛋白质系统。

 

文章来源:

Wesley B. Asher, Peter Geggier et al, Single-molecule FRET imaging of GPCR dimers in living cells. DOI: 10.1038/s41592-021-01081-y, Nature Methods:最新IF:28.467

 

3、Nature Methods:高效数据挖掘优化蛋白质筛选方法

 

2021年4月7日,来自美国哈佛大学George M. Church研究团队在出版的《自然-方法学》上发表了题为“Low- N protein engineering with data-efficient deep learning.”的研究成果,利用高效数据挖掘研发出低氮蛋白工程方法。

 

研究人员介绍了一种基于机器学习的算法,该算法可以使用多达24个经过功能分析的突变体序列来构建精准的虚拟环境,并通过计算机定向进化筛选一千万个序列。正如对维多利亚水母的GFP(avGFP)和大肠杆菌TEM-1β-内酰胺酶这两种不同的蛋白质进行测试,通过单轮筛选的最优候选物是多样的,并且与先前的高通量研究中所获得的工程突变体一样活跃。

 

通过从天然蛋白质序列图谱中提取信息,该模型学习了“非自然性”的潜在表示形式,这有助于引导检索远离非功能性序列的邻域。然后,利用低N筛选对所感兴趣的对象进行改进。

 

总而言之,该算法可在不牺牲通量的情况下有效利用资源密集型数据进行高保真测定,并有助于加速工程蛋白应用于发酵罐、农业和临床。

 

(评论:蛋白质工程具有巨大的学术和工业应用潜力。然而,由于缺乏与设计目标相符的实验方法以及高通量方法来发现稀有的、强化变体而受到局限。

 

文章来源:

Surojit Biswas, Grigory Khimulya et al,  Low- N protein engineering with data-efficient deep learning. DOI: 10.1038/s41592-021-01100-y, Nature Methods:最新IF:28.467

 

艾美捷科技优势代理品牌

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: