【单细胞】Scanpy进行高可变基因的筛选

企业开发 2023-04-06 17:08:48 阅读次数: 0

1 功能

取出高可变基因，默认使用log的数据，当使用flavor=seurat_v3的时候，采用count data。

flavor参数可以选择是使用Seurat，Cell ranger还是seurat v3的算法。

Seurat and Cellranger中，使用的是dispersion-based方法，获得归一化的方差。先对基因按照表达量平均值进行分bin，然后计算落在每个bin的基因的离散度（dispersion）的均值和SD，最终获得归一化的dispersion。对于每个表达量的bin，选择不同的高可变表达基因。

而Seurat3的算法，计算每个基因的方差进行归一化。首先对数据在规范化标准偏差下（a regularized standard deviation）进行标准化（使用z标准化），之后计算每个基因的归一化的方差，并且进行排序，获得高可变基因。

2 参数

adata：输入的数据，每行是一个细胞，每列是一个特征
layer：使用的是哪一个layer
n_top_genes：如果是使用seurate_v3的方法，那么需要指定该参数。
min_mean：默认0.0125 ；max_mean：默认是3 ；min_disp: 默认0.5， max_disp: 默认是inf。如果指定了n_top_genes , 这个和其他所有mean和disp参数都会无效，因此设置了 flavor=‘seurat_v3’ 该参数无用。
span：默认是0.3；当flavor=seurat_v3的时候，用loess模型来估计variance的数据的比例。
n_bins : 默认是20，对表达量分bin的数目，对每个bin里的数据进行归一化，如果只有一个基因落到bin里，那么该bin的dispersion会设为1。
flavor: {‘seurat’, ‘cell_ranger’, ‘seurat_v3’} (default: ‘seurat’)
subset：默认是false，只是返回高可变基因，否则就原位替换
inplace：默认是True，在var中进行存储矩阵
batch_key：没看懂

3 参考文献

[1]使用scanpy进行高可变基因的筛选

猜你喜欢

转载自blog.csdn.net/zfhsfdhdfajhsr/article/details/128869062

【单细胞】Scanpy进行高可变基因的筛选

【单细胞】使用Scanpy进行单细胞数据预处理

【单细胞】Scanpy进行数据归一化

python小白入门单细胞分析scanpy

【Scanpy】单细胞转录组分析思路之细胞分类

你知道红细胞基因对单细胞分析的影响吗

易基因-单细胞甲基化测序&单细胞转录组测序

Seurat 单细胞转录组测序数据分析教程（三）——python(scanpy)

Seurat 单细胞转录组测序数据分析教程（二）——python(scanpy)

单细胞Marker基因可示化包Nebulosa

【生物信息学】scRNA-seq数据分析（一）：质控~细胞筛选~高表达基因筛选

对一篇单细胞RNA综述的评述：细胞和基因质控参数的选择

Science综述 | 用单细胞基因组学将人类细胞表型匹配到基因型

单细胞表观基因组学:记录过去和预测未来

易基因单细胞转录组测序（smart-seq2）｜技术推介

单细胞测序——scImpute

单细胞测序

单细胞转录组测序数据的可变剪接(alternative splicing)分析方法总结

.raw 是一个 Anndata 包中的对象，用于存储原始的单细胞数据。scanpy种如何查看 .raw 对象的内容，

单细胞RNA-seq比对定量用什么工具好？使用哪个版本的基因组？数据来说话

数据库|scMethBank：单细胞全基因组 DNA 甲基化图谱数据库

基于炼丹神器深度学习下的生命科学冷冻电镜单细胞基因分析的解决方案

【单细胞】Python单细胞分析数据结构AnnData

DeepDRIM：使用单细胞 RNA-seq 数据重建细胞类型特异性基因调控网络的深度神经网络

Seurat | 单细胞分析工具

单细胞基础知识

《单细胞生物》教学反思

使用scater包对单细胞转录组数据进行降维分析

Nature Methods | 新软件SAVER-X可对单细胞转录组学数据进行有效降噪

单细胞测序方法大比拼

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)