动漫X

欧美激情你的位置:动漫X > 欧美激情 >

偷窥自拍美女 深度学习算法想象CRE, 机器学习引颈细胞特异性反式调控元件想象, 临床应用的新纪元

发布日期:2024-12-12 05:17    点击次数:191

偷窥自拍美女 深度学习算法想象CRE, 机器学习引颈细胞特异性反式调控元件想象, 临床应用的新纪元

转自:生物谷偷窥自拍美女

著作解读+变调点拓展,为您带来科研新体验~

导读

在生物医学议论中,细胞特异性反式调控元件(cell-type-specificcis-regulatoryelement,CRE)的想象是一个热点议论界限。最近发表于《Nature》的一项议论《Machine-guideddesignofcell-type-targetingcis-regulatoryelements》,愚弄机器学习模子指挥合成具有高度细胞类型特异性的CRE,为精确医疗提供了全新的器具。这项时期不仅有望经管现存基因调节中靶向寄递不及的问题,还可能为基因裁剪、讲解基因开导等提供新的经管决策。

议论配景

基因抒发是一个复杂的过程,受到多种身分的调控,其中CRE饰演着要津扮装。这些DNA序列通过与特定转录因子蚁合来退换观念基因的活性。尽管频年来的议论照旧坚定了数百万个潜在的东谈主类CRE,但这些当然进化的序列只是是所有这个词可能性的一小部分,并不一定合适临床应用中的最好抒发需求。表面上,一段200碱基对的DNA不错包含率先2.58×10120种不同的组合——比可不雅测六合中的原子数目还要多。这些DNA序列组成了一个尚未被充分发掘的DNA序列空间,亦然挖掘具有临床和生物时期应用后劲的CRE的储备库。

议论想象与闭幕

为了克服传统步调在识别和考据CRE时碰到的挑战,Gosai团队引入了三项要津时期:

1)大限度平行讲解基因检测(MassivelyParallelReporterAssay,MPRA):或者同期评估屡见不鲜个CRE的功能,从而得回对于退换语法(regulatorygrammar)的平常意志。

2)深度学习算法(Malinois):用于预测不同细胞类型中遗传序列怎样影响CRE活性,构建出精确的“调控语法”模子。

3)基于预测模子的定向CRE生成(CODA):基于上述CRE序列评分算法,对当场序列进行迭代,允许议论东谈主员字据所需功能和特定细胞定制合成CRE。

实验闭幕泄露,使用这些合成的CRE不错在斑马鱼和小鼠中闭幕细胞类型特异性的驱动效力。此外,该议论也展示了怎样愚弄CODA软件库及Malinois模子来坐褥合成序列,并通过体外和体内实验考据了其效力。

图1:Malonis模子的开导历程绝顶预测CRE的才能

为了设立精确的CRE活性模子,议论东谈主员泉源在K562(红系前体细胞)、HepG2(肝细胞)和SK-N-SH(神经母细胞瘤)三种东谈主类细胞类型中通过MPRA远隔分析了率先77万段200nt长的DNA序列,筛选具有细胞特异性CRE活性的基因组序列信息(图1a)。

使用这些数据,议论东谈主员模仿了Basset模子(一个用于预测染色质可及性的模子),构建了基于卷积神经累积(ConvolutionalNeuralNetwork,CNN)的深度学习模子Malonis(图1b)用以预测DNA序列的细胞特异性CRE活性。Malonis在K562、HepG2和SK-N-SH细胞中的预测值与实践测量值之间泄透露高度关联性(Pearson’sr=0.88–0.89;Spearman’sρ=0.81−0.83;P

Malinois预测重现了MPRA筛选的类似片断,这些片断来自以GATA1基因为中心的2.1Mb窗口(图1d)。此外,在K562细胞中,Malonis预测的CRE区域与DNaseI超敏锐位点(DHS)、H3K27乙酰化(H3K27ac)和STARR-seq峰均有很好的一致性(图1e)。这些闭幕阐明Malonis具有邃密的CRE活性预测功能。

图2:CODA灵验地想象了细胞类型特异性的CRE

接着,议论东谈主员又想象了一个名为CODA的模子,用以从新想象新CRE序列。CODA撤职一个迭代轮回:预测序列的活性(通过上文提到的Malonis)、量化序列是否合适想象观念,并更新序列以增多观念值(图2a)。想象观念是得回在模子细胞系中驱动特定细胞类型讲解基因转录的CRE序列。通过计算序列在观念细胞类型中预测MPRA活性值与两个非观念细胞类型中预测MPRA活性最大值之间的最小差距(MinGap)来权衡得胜进程。迭代方规定远隔尝试了进化式的AdaLead、基于概率的模拟退火以及基于梯度的FastSeqProp。

通过使用不同迭代步调的CODA,议论东谈主员想象了36000个细胞特异性CRE序列,却发现CODA对某些最大化细胞特异性的特定序列具有偏好性。为此,议论东谈主员通过在观念函数中引入处分机制来减少这种偏好性的产生,尽管这会点燃细胞特异性偷窥自拍美女,但极大丰富了序列的千般性。

通过MPRA,对Malonis预测的自然CRE序列、CODA想象(处分/非处分)的CRE序列以及基于DHS(蚁合H3K9ac和染色质可及性)预测的自然CRE序列(统称为MPRA测试库)的活性进行考据,进一步阐明注解了Malonis的CRE活性预测才能(图2b&c)。况且Malonis对CRE细胞特异性的预测才能权臣强于基于DHS的预测(图2d&e)。

此外,CODA想象的CRE序列对比自然序列展现出更高的细胞特异性(图2d&e)。况且,基于FastSeqProp的CODA步调所想象的CRE序列具有更好的清醒性和更高的MinGap。而处分模式会裁汰想象序列的细胞特异性但仍权臣优于自然CRE序列(图2d&e)。

图3:解释功能序列的内容

为了将序列内容与对应的转录因子(TF)权衡起来,议论东谈主员通过Malinois和矫正的集成梯度步调,远隔预测每个序列在三种细胞类型中单核苷酸分辨率的活性孝顺分数(contributionscore),并基于孝顺分数筛选出66种DNA基序(motif)序列模式。

然后通过TF-MoDISco步调,从中索要出在MPRA测试库中富集的36种非冗余的中枢基序模式(7-18bp),其中31种与已知的东谈主类TF蚁合位点高度吻合。在36个中枢基序中,28个对序列活性具有阳性预测孝顺,而其余8个具有扼制作用(图3b)。这包括各人皆知的激活因子,如GATA63,GATA63是在K562细胞中抒发的必需TF,Malinois预测其仅在K562细胞中驱动活性。

使用孝顺分数为基础的模式扫描,发现所有这个词36个中枢基序模式在算法想象和自然序列中齐至少出现一次,标明这两种类型的序列分享TF库(图3b)。词法分析标明,算法想象序列闲居包含更多的专有基序模式以及模式类型数,而处分性想象则泄透露比非处分性想象更高的非冗余基序使用。

此外,合成序列中特定的基序组合使用频率更高(图3c),大大齐非处分性和Malinois自然序列中齐存在不同的激活-激活基序对(95.7%和93.4%),而激活-扼制和扼制-扼制基序对在自然序列中出现的比例较低。

除了单个TF基序和成对的使用外,细胞类型特异性还被觉得通过更高阶的基序语义产生。这些基序语义不错介导好多转录因子之间的复杂相互作用,并赋予CRE活性。议论东谈主员剿袭非负矩阵剖释(NMF)将序列库中每一条序列剖释由12种功能形态组成的基序组合。NMF坚定出5种细胞特异性的形态,1种出现于K562细胞,2种出现于HepG2细胞,2种出现于SK-N-SH细胞中(图3d)。

与自然的CRE比拟,算法想象的CRE包含更多形态,这与较多的基序使用一致。此外,当然序列主要依赖激活形态,而合成序列也常常使用非观念细胞类型中具有扼制作用的形态。这些闭幕教唆,算法想象序列性能的普及是由于细胞特异性激活和非观念细胞特异性扼制基序的蚁合。

泰国人妖

图4:合成元素的体内考据

为了CODA序列在更多细胞类型中的特异性,议论东谈主员针对A549细胞(肺上皮癌细胞)和HCT116(结直肠上皮癌细胞)也进行了教训,依旧发现CODA想象序列在特定细胞类型中展现出最高的预测活性。

接着,议论东谈主员尝试在体内考据这种CODA想象序列的特异性。他们泉源通过Enformer筛选计算了东谈主工序列的表不雅调控才能,并阐明注解组织特异性的Enformer评分与MPRA考据的细胞特异性CRE活性关联。接着,基于MPRA实验闭幕、Malinois孝顺分数、Enformer评分以及基序组成的东谈主工查验,议论东谈主员筛选出3个HepG2细胞和3个SK-N-SH细胞特异性的CRE,并觉得他们可能远隔具有肝脏和神经组织特异性(图4a)。

然后,他们构建了一个讲解基因质粒,在驱动GFP抒发的最小启动子上游插入了东谈主工合成序列,并导入斑马鱼胚胎,发现三个预测肝脏特异性CRE中的两个或者指挥GFP在斑马鱼胚胎发育过程中肝细胞的浓烈抒发,而在非观念细胞中仅有较低的非特异性抒发(图4b),神经特异性CRE也展现出类似的闭幕(图4c)。

在小鼠胚胎上的进一步考据,发现神经特异性的CRE(synN1CRE)或者驱动讲解基因在发育的皮层中抒发,而这种皮层特异性的抒发在出死后的小鼠中也存在(图4d),主若是新皮质第6层的神经元和板下神经元(图4e-g)。

基于Malinois孝顺分数,在synN1CRE中发现一个ETSGGA(A/T)蚁合域和四个CREB样TGACGCA蚁合域,教唆ETS因子与CREB造成异源二聚体的可能性,而在SK-N-SH细胞上的填塞突变MPRA议论考据了ETS和CREB蚁合区域的作用。

拓展延迟

东谈主工想象CRE具有平常的应用出路。

●个性化医疗与精确医学

1.基因调节和药物开导

合成CRE的应用不错径直改善现存基因疗法中存在的主要隔断之一——即短少灵验的细胞类型特异性寄递机制。通过创建高度组织特异性的合成CRE,咱们不错更好地铁心调节性基因的抒发模式,减少脱靶效应的风险,普及疗效的同期裁汰反作用的发生几率。这对于调节那些由单基因突变引起的淡薄病尤其进犯,因为这类疾病时时需要绝顶精确地竖立或替换受影响的基因。此外,借助机器学习的力量,咱们还不错针对不同类型的癌症细胞想象特意的CRE,使其仅在肿瘤细胞内激活特定的调节性基因,而不影响正常细胞。这种计谋不仅不错增强抗癌药物的闭幕,还能权臣减少传统化疗所带来的全身性毒性反应。

2.疾病模子构建

愚弄合成CRE不错更精良地模拟东谈主类疾病中的基因抒发变化,从而设立愈加竟然的动物模子。举例,在神经系统疾病的议论中,科学家们不错使用这些器具来驱动神经元特异性基因的抒发,以议论帕金森病、阿尔茨海默病等复杂病症背后的分子机制。通常地,在心血管疾病界限,合成CRE不错匡助议论东谈主员探索腹黑发育过程中要津信号通路的作用,进而找到新的调节步调。

基础生物学议论

3.发育生物学

在发育生物学中,意会细胞红运决定过程是中枢问题之一。合成CRE使得科学家或者往常所未有的精度主宰特定细胞群体中的基因抒发,揭示出哪些因子在胚胎造成早期阶段起着决定性作用。比如,通过在斑马鱼胚胎中引入合成CRE,议论者不错不雅察到不同器官原基造成时的要津事件,深化了解多耀眼细胞向各式熟识细胞类型分化的过程。

4.进化生物学

从进化的角度来看,合成CRE提供了一个全新的视角去考虑物种间基因调控累积的变化。由于这些序列不是当然界存在的产品,而是基于对已知调控语法的意会东谈主工想象出来的,因此它们不错行为“实验探针”,匡助咱们锻练对于遗传变异怎样塑造生物千般性的假定。举例,比较两种亲缘干系较近但表型相反赫然的物种之间的合成CRE活性,可能有助于识别出导致二者分化的要津调控变化。

●农业与环境科学

1.作物矫正

农业界限通常不错从这项新时期中获益匪浅。通过想象或者反馈环境信号(如光照强度、水分含量等)的合成CRE,科学家们不错培育出稳当性强的新品教学物。这些矫正后的农作物不仅能在恶劣条款下保握产量清醒,还可能具备更好的养分品性或抗病虫害才能。举例,合成光敏型CRE不错让作物在低光照环境下依然保管高效的光相助用;而干旱耐受型CRE则不错使植物在缺水时辰关闭无用要的代谢行径,纯粹资源。

2.生态工程

合成生物学旨趣也被应用于构建东谈主工生态系统,其中合成CRE饰演着至关进犯的扮装。举例,在浑水处理厂中,工程师不错愚弄合成微生物群落来降解无益物资。为了确保这些成心菌或者在特定条款下阐扬最好性能,科学家们不错通过合成CRE精确退换其基因抒发水平,保证通盘系统的高效启动。类似的步调也不错用于泥土竖立、空气净化等多个方面,促进可握续发展。

临床应用与估计

对于临床医师而言,这项新时期带来的最大益处在于它有可能改善现在基因疗法中存在的主要隔断之一——即短少灵验的细胞类型特异性寄递和抒发机制。通过创建高度组织特异性的合成CRE,咱们不错更好地铁心调节性基因的抒发模式,减少脱靶效应的风险,普及疗效的同期裁汰反作用的发生几率。这对于调节那些由单基因突变引起的淡薄病尤其进犯,因为这类疾病时时需要绝顶精确地竖立或替换受影响的基因。

总之,SagerJ.Gosai绝顶共事的责任象征着咱们正站在一个新时期的门槛上,在这个时期里,借助先进的东谈主工智能时期和生物学常识,咱们将或者书写出前所未有的生命密码,为东谈主类健康业绩开辟新天地。

注:本文旨在先容医学议论进展,不作念调节决策推选。如有需要,请征询专科临床医师。

参考文件

GosaiSJ,CastroRI,FuentesN,ButtsJC,MouriK,AlasoaduraM,KalesS,NguyenTTL,NocheRR,RaoAS,JoyMT,SabetiPC,ReillySK,TewheyR.Machine-guideddesignofcell-type-targetingcis-regulatoryelements.Nature.2024Oct;634(8036):1211-1220.

(转自:生物谷)偷窥自拍美女



Powered by 动漫X @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024