【单细胞】使用Scanpy进行单细胞数据预处理

1 基本的数据处理

# 显示在所有细胞中在每个单细胞中产生最高计数分数的基因
sc.pl.highest_expr_genes(adata, n_top=20, )

# 过滤低质量细胞样本
# 过滤在少于三个细胞中表达,或一个细胞中表达少于200个基因的细胞样本
sc.pp.filter_cells(adata, min_genes=200)
sc.pp.filter_genes(adata, min_cells=3)

# 归一化,使得不同细胞样本间可比
sc.pp.normalize_total(adata, target_sum=1e4)
sc.pp.log1p(adata)

# 存储数据
# 将 AnnData 对象的 .raw 属性设置为归一化和对数化的原始基因表达,以便以后用于基因表达的差异测试
# 和可视化。这只是冻结了 AnnData 对象的状态。
adata.raw = adata

# 主成分分析(Principal component analysis)
# 通过运行主成分分析 (PCA) 来降低数据的维数,可以对数据进行去噪并揭示不同分群的主因素。
# 绘制 PCA 图
sc.pl.pca(adata, color='CST3')

2 参考文献

[1]scanpy 单细胞分析包图文详解
[2]用VSCode Jupyter 学习Scanpy——预处理与分群

猜你喜欢

转载自blog.csdn.net/zfhsfdhdfajhsr/article/details/128860891
今日推荐