人工智能在空间转录组学领域的最新研究进展|顶刊速递·24(人工智能transformer)

人工智能在空间转录组学领域的最新研究进展|顶刊速递·24小罗碎碎念 本期推文的主题:人工智能在空间转录组学领域的最新进展 提到空间转录组学就不可避免会与单细胞测序、免疫治疗以及肿瘤微环境扯上关系,所以这也是当下的

小罗碎碎念

推文主题:人工智能在空间转录组学领域的最新进展

说到空间转录组学,这也是目前的热点之一,因为它不可避免地涉及到单细胞测序、免疫治疗和肿瘤微环境。

我个人认为这个领域比放射学或病理学更难驾驭,需要相对系统的临床知识。我准备这条推文是因为我感觉很糟糕,因为我无意识地回避了这一部分有一段时间了。

我是洛小洛,明天见!

一、晚期透明细胞肾细胞癌(aRCC)患者接受免疫检查点阻断(ICB)治疗的多组学研究

文献概述

本文是一项针对接受免疫检查点阻断(ICB) 治疗的晚期透明细胞肾细胞癌(aRCC) 患者的多组学研究。

通过综合分析肿瘤多组学数据,研究团队开发了一种新的肿瘤转录组特征——人类白细胞抗原(HLA)抗原肽结合特异性低肿瘤特征(HLAprLOW)。这可以预测患者对肿瘤临床反应的反应。 ICB治疗。

这项研究包括对来自1,000 多名患者的肿瘤转录组数据的分析,并通过单细胞和空间分辨率验证,表明炎症性肿瘤相关巨噬细胞和(预)耗尽的CD8+ T 细胞之间的患者特异性关系和相互作用被揭示。通过跨组学生物信息学机器学习流程进一步分析这些细胞特征,并与ICB 治疗后的积极结果相关联。

此外,本研究还使用RENCA肿瘤小鼠模型进行实验,CD40激动剂和PD1抑制剂联合使用可以增强肿瘤相关巨噬细胞和CD8+T细胞的炎症反应,从而测试发现相比之下具有最大的抗肿瘤效果。到其他方案。影响。

这一发现表明,通过多组学和空间图谱可以更好地理解驱动ICB反应的免疫群落结构,为aRCC患者的临床治疗提供新的生物标志物和治疗策略。

重点关注

图1 概述了鲁汶RWD 队列中晚期透明细胞肾细胞癌(aRCC) 患者的免疫检查点阻断(ICB) 治疗研究。

a. 研究设计概述:我们首先描述鲁汶RWD 队列中研究的发现阶段,然后使用机器学习(ML) 模型开发生物标志物,然后使用外部(批量)数据集和外部测试数据集。它已在单细胞和空间水平上得到验证,并从基因组学角度进行了表征。最后,通过小鼠RCC/RENCA 模型提供体内功能验证。

b. PFS 的Kaplan-Meier 曲线:Kaplan-Meier 曲线显示鲁汶RWD 队列中开始ICB 治疗后的无进展生存期(PFS),按ICB 治疗类型分层(伊匹单抗-纳武单抗与纳武单抗)。使用Cox 比例风险回归模型计算风险比(HR) 和置信区间(CI),比较接受伊匹单抗加纳武单抗治疗的患者与单独接受纳武单抗治疗的患者。

c. OS 的Kaplan-Meier 曲线:与b 部分相同,但显示总生存(OS) 的Kaplan-Meier 曲线,也根据ICB 治疗类型进行分层,并计算HR 和CI。

d. 最佳缓解堆积条形图:根据iRECIST 标准的ICB,包括完全缓解(CR)、部分缓解(PR)、疾病稳定(SD)、疾病进展(PD) 和不可评估(NE) 表示最佳缓解。来治疗。 )。使用Fisher精确检验计算两组之间的P值。

e. 瀑布图:显示iRECIST 评估的每位患者的最大肿瘤缩小程度。 CT 是指计算机断层扫描,用于评估肿瘤大小的变化。

总体而言,图1显示了ICB治疗反应的综合评估,包括生存数据、治疗反应的统计分析以及不同治疗组之间的比较。这些数据对于了解ICB 治疗aRCC 患者的临床疗效非常重要。

二、BIDCell:专为亚细胞空间转录组数据的细胞分割而设计的新型自监督深度学习框架

文献概述

在本文中,我们介绍了一种名为BIDCell 的新型自监督深度学习框架,旨在对细胞内空间中的转录组数据进行细胞分割。

BIDCell 利用生物学信息损失函数来了解空间分辨基因表达与细胞形态之间的关系。该框架结合了单细胞转录组数据和细胞形态信息,通过综合评估框架,BIDCell 能够评估多种组织类型和技术平台的细胞分割性能指标,并被证明优于最先进的方法。

BIDCell的关键创新在于生物信息损失函数的多个组成部分的协同作用以及单细胞序列数据先验知识的显式整合以估计不同的细胞形态。这些损失函数的结合以及现有scRNA-seq 数据的使用提高了性能,并使BIDCell 可在不同的SST 平台上推广。此外,作者创建了CellSPA,这是一个全面的细胞分割性能评估框架,涵盖五个补充标准类别,旨在促进新兴生物技术数据中采用新的分割方法。

研究结果表明,BIDCell 在改善细胞形态表示方面表现出优越的性能,并且比主要依靠SST 图像强度值进行细胞分割的现有方法能够生成更多样化的细胞形态特征,这表明您可以克服自身的局限性。 BIDCell 还通过利用细胞核内的表达模式来指导体细胞像素的识别,并通过消融研究证明不同损失函数的协同效应。

本文还展示了BIDCell在多个SST平台上的可复制性和泛化能力,并通过案例研究进一步评估了BIDCell在精确分割密集细胞方面的性能。最后,作者强调了BIDCell 作为亚细胞空间分辨转录组数据中细胞分割方法的潜力,以及CellSPA 评估框架在促进可重复科学和透明度方面的重要性。

重点关注

图1显示了BIDCell框架及其用于训练的损失函数的示意图。

该框架是一个自监督深度学习模型,专门为细胞分割任务而设计,特别是在处理空间转录组数据时。

A 部分描述了BIDCell 框架的结构。

该框架包括编码层(E1-E5)和解码层(D1-D4),负责特征提取和细胞分割图重建。每个解码层连接到多个编码层以恢复图像细节。例如,层D3 由绿色箭头表示。

在b 部分中,我们在公开的Xenium-BreastCancer1 数据集上比较了BIDCell 和其他细胞分割方法的预测结果。

BIDCell可以更好地捕获与输入图像相对应的细胞形态,包括更多样化的细胞形状,例如长带状细胞。该图还显示了BIDCell 与10x Genomics、Baysor 和Cellpose 等其他方法产生的分割结果之间的比较。 HE 图像(一种常见的组织学染色技术)仅用于说明目的,不用作任何方法的输入。

总体而言,图1 突出了BIDCell 在处理复杂细胞形态方面的优势,特别是在识别和分割不同形状和大小的细胞方面。通过自我监督学习,BIDCell 可以利用生物信息和空间基因表达数据来提高分割准确性和生物相关性。

三、数字病理学和空间组学技术在脂肪肝病的临床应用和潜力

文献概述

本文主要讨论数字病理学(DP)和空间组学技术在脂肪肝疾病(脂肪性肝炎)中的临床应用和发现潜力。

本文首先介绍脂肪肝疾病的背景,包括其定义、病因和组织学表现。然后,我们讨论数字病理学如何通过数字化传统病理切片并将其与人工智能(AI)算法相结合来提高组织学解释的准确性和速度。

此外,在本文中,研究人员绘制了肝组织切片上特定感兴趣区域(ROI) 内的基因和蛋白质表达图,以表征组织内的疾病异质性以及定性和分子变化。我们正在探索空间生物学的新领域,使我们能够理解。关系。以及具体的组织形式。

本文强调了将传统临床数据与人工智能增强的DP 和空间生物学相结合的多模态整合对于提高脂肪肝疾病诊断和组织学终点评估准确性的重要性。最后,本文讨论了这些工具和技术的当前知识差距、局限性和先决条件,并讨论了未来的研究方向。

关键点是:

虽然肝活检是诊断脂肪肝的金标准,但MASLD/MASH 和酒精相关性肝病之间没有独特的组织学特征。数字病理学的发展和机器学习(ML)算法的应用从诊断角度显着提高了脂肪肝疾病组织学解释的准确性和速度,并大大提高了肝活检的可检测性。空间组学技术的快速发展为基于基因、蛋白质和代谢物表达的广泛分析的与肝脏组织形态学相关的空间生物学新领域奠定了基础。空间生物学目前被用来破译肝脏的免疫微环境、细胞异质性和细胞间信号传导途径,以识别新的病理介质、疾病生物标志物和脂肪肝疾病的治疗靶点。传统临床数据与人工智能增强的DP和空间生物学的多模态整合有望提高脂肪肝疾病诊断和组织学终点评估的准确性。

本文由梅奥诊所研究人员撰写,并得到美国国立卫生研究院(NIH) 的支持。作者声明他们没有利益冲突。

重点关注

图2显示了评估和量化脂肪肝疾病组织病理学特征和纤维化的两种方法的示意图。

这两种方法的分析如下。

基于机器学习算法的组织学特征量化:

该方法首先使用机器学习(ML) 算法分析苏木精和伊红(HE) 染色的载玻片,以识别脂肪肝疾病的三个主要组织学特征:脂肪肝、小叶炎症和气球样变。这种基于机器学习的分析可以集成到日常工作流程中,使病理学家能够验证机器学习算法的预测。 基于非线性光学显微镜的无损定量:

第二种方法利用单个未染色的载玻片,并使用二次谐波发生(SHG)和双光子激发荧光(TPEF)技术对其进行非破坏性分析,以检测肝脏脂肪变性、炎症、量化脂肪肝疾病的相同组织学特征,例如气球样变性。纤维化。该方法的优点是不需要组织染色,不会破坏样品,可以进行额外的分析或保留原始组织状态。

两种方法的共同点是它们都旨在提高组织病理学评估的准确性和效率。第一种方法侧重于利用ML 算法处理传统染色的载玻片,第二种方法使用先进的光学技术处理未染色的组织样本。这两种方法都为病理学家提供了更客观、更准确地评估脂肪肝疾病组织学特征的工具,有可能改善诊断和治疗决策。

四、stKeep:分析空间分辨的转录组学数据,精确解析肿瘤微环境的新型异构图学习方法

文献概述

在本文中,我们介绍了一种称为stKeep 的新型异构图学习方法,用于分析空间解析转录组数据(SRT),以准确分析肿瘤微环境(TME)。

stKeep 可以通过集成多模态数据和基因间相互作用来识别TME 中的细胞模块、基因模块和细胞间通讯(CCC)。该方法利用异构图学习来捕获细胞、基因和组织区域之间的复杂关系,从而在低维空间中发现更多的细胞状态和细胞状态特定的基因-基因关系。此外,stKeep 使用对比学习来推断每个细胞的CCC 模式,确保学习到的CCC 模式在不同的细胞状态之间具有可比性。

研究人员使用stKeep 分析了多种癌症样本,包括乳腺癌、肺癌、结直肠癌和肝转移瘤,发现它在解释TME 方面优于其他工具。 stKeep可以识别与疾病进展相关的关键转录因子、配体和受体,并可以通过独立临床数据的功能和生存分析进一步探索其在临床预后和免疫治疗中的潜在应用。

本文还讨论了stKeep 在处理SRT 数据时面临的挑战,包括低吞吐量、敏感性以及数据稀疏和噪声问题。通过与其他方法的比较,证明了stKeep 在分析人类背外侧前额叶皮层(DLPFC) 数据集方面的性能。此外,stKeep 还可以帮助识别具有生物学意义的细胞和遗传模块,这对于理解肿瘤生态系统的复杂性非常重要。

最后,本文分析了不同癌症类型中的异质TME,确定了与疾病进展和远处转移相关的细胞状态和机制,并可能阐明抗癌治疗的新靶标,我们讨论了stKeep 的潜在应用,包括:作者还指出了stKeep 的局限性,并提出了未来的改进建议,例如更复杂的算法来推断更多基因及其方向之间的关系,以及开发肿瘤区域自动分割的计算模型提出了一个方向。

重点关注

图1 概述了stKeep 模型,这是一种用于分析肿瘤生态系统的异构图学习方法。

对该图的分析如下。

ac. stKeep 模型采用四个SRT 数据层作为输入。

组织成像(I):提供有关细胞和组织空间结构的信息。空间位置(S):记录组织内细胞或点的具体位置。基因表达(X):包含有关细胞或斑点中基因表达的数据。组织区域(Y):定义有助于区分不同细胞状态和类型的不同组织区域。

此外,该模型还考虑了基因-基因相互作用,例如蛋白质-蛋白质相互作用(PPI)、基因调控网络(GRN) 和配体-受体对(LRP)。

d. 电池模块:

以细胞/点为中心的异质图(HG)用于通过注意机制聚合来自基因和区域的特征,以捕获局部层次表示(Ri1)。我们利用多种语义图,例如空间位置图(SLG)、组织学相似性图(HSG)和转录相似性图(TSG)来学习全局语义表示(Ri2)。通过自我监督学习整合局部层次表示和全局语义表示。

e. 基因模块:

以基因为中心的异构图用于学习低维表示,这些表示通过注意机制结合细胞/点和簇的特征。对比学习用于确保相关基因对在表示空间中彼此相邻。

f. 细胞间通信(CCC)模块:

利用基于注意力的异质性图来推断每个细胞/点的配体-受体相互作用强度(Hi)。 CCC 是通过聚合中心细胞/点周围邻近细胞的配体信息来估计的,确保学习到的CCC 模式反映了各种细胞状态的差异。

统一框架:

结合细胞、基因和CCC 模块的统一框架可用于:

空间聚类检测和可视化。细胞状态特异性基因模块和受体基因相互作用网络的鉴定。估计细胞之间的通讯强度。

总体而言,图1 显示stKeep 模型集成了多模态数据和多个生物分子的相互作用,并构建了异构图来识别细胞状态、基因模块和细胞通信模式。我们演示了如何分析微环境中的复杂相互作用。

五、使用机器学习集成方法推进计算免疫学的研究

文献概述

本文介绍了如何使用机器学习集成技术来推进计算免疫学研究。

文章首先指出,虽然传统的免疫学研究依赖蛋白质组学来评估个体免疫细胞,但单细胞RNA-seq 技术的发展使计算免疫学家分析这些数据集成为可能。超越传统的蛋白质标记鉴定的更详细的观察。细胞表型及其功能作用。

在本文中,我们讨论了最新的进展,这些进展允许在单细胞水平上同时测量转录组、蛋白质组、染色质、表观遗传修饰和代谢物等多种细胞成分,从而产生复杂的多尺度数据集。现代机器学习技术可以集成多个“组学”数据,而不需要对每个模式进行广泛的独立建模。

本文重点介绍应用于免疫学研究的ML 集成方法的最新进展,以及这些技术在创建多尺度数据集合的统一表示方面的优势,特别是在单细胞和空间分析方法中的重要性。最后,我们讨论了这些综合方法的挑战,并展望了它们在开发多尺度研究的通用协调框架中的作用,从而加速研究并改进计算免疫学领域,促进发现。

背景部分解释了免疫系统如何成为一个复杂的细胞网络,这些细胞协同工作以协调对未知扰动的防御反应。在这篇文章中,我们将讨论免疫细胞如何不被设计为局限于特定位置,适应不同微环境中的功能,并在健康和疾病状态中发挥作用,使得免疫学不断发生变化。一个研究领域。研究揭示了免疫系统在神经病、糖尿病和癌症等复杂疾病中的重要作用。

本文还讨论了单细胞测量在免疫学中并不新鲜,但单细胞测序技术的出现极大地推进了该领域的发展。新技术能够测量多种分子读数,例如转录组、表面和细胞内蛋白质组、染色质、表观遗传修饰、免疫组库和代谢物。本文描述了一系列空间蛋白质组学技术的发展,这些技术结合了显微成像和基因表达,同时保留了空间位置信息。

从数据集成的角度来看,本文提到了线性模型和深度学习技术,例如自动编码器、变分自动编码器、图神经网络和生成对抗网络。这些方法用于降低数据维度、消除噪声和识别细胞状态。

最后,我们讨论如何将单细胞数据与空间分析数据集成以及如何预测空间数据中特征表达的空间分布和细胞类型变化。本文还强调了创建通用参考框架的重要性以及在处理多模式数据时对数据基础设施和多学科团队的需求。

文章的结论是,免疫学家使用多模态技术收集了丰富的多尺度测量数据。整合和解释这些数据的机器学习技术对于理解健康和疾病中免疫系统的微妙调节机制非常重要。作者敦促开发人员确保方法的可解释性、跨多种条件的基准的可用性以及用例的文档。文章还展望了未来,计算免疫学家将开发个性化的免疫干预措施,例如针对个体免疫系统精确定制的疫苗设计、免疫疗法和治疗计划。他们认为,使用综合方法进行开发将推动科学的发展。

重点关注

图2A和图2B提供了多模式数据集成方法和数据存储结构的示意图。

图2A

典型多模态数据集成方法的示意图。这可能包括用于处理和分析来自不同来源的具有不同特征的数据的不同算法和技术。综合方法旨在融合这些数据集,以实现对复杂生物系统的整体理解。示例可能包括线性模型、深度学习架构、生成对抗网络(GAN)、自动编码器(AE) 等。这些技术有助于识别数据中的模式和关系,从而为生物医学研究提供见解。

图2B

据解释,多模态数据集具有不同的数据格式,并且可以存储在专门的数据结构中,从而允许单独或联合地有效访问和处理每个级别的数据。这意味着数据的组织方式允许研究人员快速检索和操作数据以满足特定的分析需求。例如,单细胞技术可以产生稀疏矩阵,其中行和列分别代表细胞和特征(基因、蛋白质、染色质区域),而空间分析技术不仅可以产生组织图像,还可以提供细胞内的分子分析。或细胞聚集体。

这些数据基础设施构成了集成机器学习方法的核心,并提供了各种生物医学见解。换句话说,通过有效地存储和组织数据,可以应用机器学习技术来集成和分析数据,以揭示对生物过程的新见解。集成方法不仅可以帮助您了解各个数据集,还可以帮助您在不同数据类型之间建立联系。这对于全面了解复杂疾病和生物系统非常重要。

总的来说,这两个数字强调了数据集成在现代生物医学研究中的重要性,以及如何通过先进的数据处理和机器学习技术来实现这一点。

六、关于非小细胞肺癌的单细胞和空间转录组学分析研究

文献概述

本文是一项关于非小细胞肺癌(NSCLC)的单细胞和空间转录组分析的研究。

由Marco De Zuani 和Haoliang Xu 领导的研究小组对取自25 名未经治疗的肺腺癌和鳞状细胞癌患者的约900,000 个细胞进行了详细分析。研究表明,肿瘤生态系统包含多种类型的免疫细胞,特别是骨髓细胞,它们在疾病进展中发挥着重要作用。

研究表明,抗炎巨噬细胞与NK 细胞/T 细胞之间呈反比关系,瘤内NK 细胞的细胞毒性降低。尽管肺腺癌和鳞状细胞癌具有相似的细胞类型组成,但它们在多种免疫检查点抑制剂的共表达方面存在显着差异。此外,这项研究还发现了巨噬细胞的转录“重编程”,使得肿瘤内的巨噬细胞采用类似胎儿的转录特征,促进胆固醇流出和铁流出。

这种多组学资源提供了肿瘤相关巨噬细胞的高分辨率分子图谱,并提高了我们对其在肿瘤微环境中的作用的理解。这一发现不仅为肺腺癌和鳞状细胞癌的肿瘤微环境提供了新的见解,而且还支持新的治疗策略的开发,特别是针对免疫检查点抑制剂和巨噬细胞重编程过程的策略。

本文还描述了肿瘤微环境中的细胞间相互作用网络以及不同NSCLC 亚型(肺腺癌LUAD 和肺鳞状细胞癌LUSC)之间这些网络的差异。此外,这项研究还调查了肿瘤巨噬细胞可能经历的“癌胎重编程”,这可能与肿瘤生长和转移有关。

重点关注

图1 显示了非小细胞肺癌(NSCLC) 异质性的单细胞转录组分析。

图中各部分详细分析如下:

一、研究概况:

使用来自切除肿瘤组织、邻近未受累组织(背景)和来自已故捐赠者的健康肺组织的单细胞悬液。这些细胞富集CD45+ 或CD235-,然后进行单细胞RNA 测序(scRNA-seq)。同时,我们使用新鲜冷冻肿瘤、背景和健康组织切片进行10x Genomics Visium 空间转录组分析。

B.队列概述:

符号用于代表个体患者和进行的分析。

C. UMAP 投影:

演示了将肿瘤统一流形近似和投影(UMAP)与背景和健康数据集相结合。

D、点图:

用于注释肿瘤样本中多种细胞类型的代表性基因点图。

E. 等高线图:

显示了AT2 细胞(44,399 个细胞)、CAML(2520 个细胞)和AIM(16,120 个细胞)中骨髓(LYZ、CD68、MRC1)和上皮细胞(EPCAM)基因的共表达。基因表达被标准化、缩放和对数转换。

F.箱线图:

显示了AT2 细胞、CAML 和AIM 中骨髓(LYZ、APOE、CD68、MRC1)和上皮(EPCAM、KRT8、KRT19)基因的标准化、缩放和对数转换基因表达。箱线图的方框部分代表四分位数,须线代表四分位距的1.5 倍。

G.非免疫细胞亚群的相对比例:

计算肿瘤和背景组织中非免疫细胞亚群的相对比例,仅限于富含CD235 的细胞。箭头表示与背景相比肿瘤的增加()或减少()。使用带有Bonferroni 校正的双边Wilcoxon 秩和检验进行多重比较。 **P 0.01,不带星号的箭头表示仅在肿瘤或背景中发现细胞类型。

H. 广泛分布的免疫细胞的相对比例:

我们计算了肿瘤和背景组织中所有免疫细胞的相对比例,仅限于富含CD235 的细胞。箭头和星号的使用与上面相同,但P值的标准不同(*P 0.05,**P 0.01,***P 0.001)。

一、肿瘤和背景中NK、DC、B、T细胞和巨噬细胞亚群的相对比例:

我们计算了肿瘤和背景组织中NK 细胞、树突状细胞、B 细胞、T 细胞和巨噬细胞亚群(仅限于富含CD235 的细胞)的相对比例。统计方法和记法同上,但P值标准为***P0.001。

总体而言,图1通过各种统计图和分析方法展示了NSCLC肿瘤组织和邻近正常组织之间细胞组成和基因表达的差异,揭示了肿瘤微环境中的细胞异质性。

#以上是关于人工智能在空间转录组学领域的最新研究进展| 头条快讯24相关内容来源网络仅供参考。相关信息请参见官方公告。

原创文章,作者:CSDN,如若转载,请注明出处:https://www.sudun.com/ask/91641.html

(0)
CSDN's avatarCSDN
上一篇 2024年6月22日 下午11:13
下一篇 2024年6月22日 下午11:31

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注