草庐IT

cluster-analysis

全部标签

scanpy不同cluster及细胞类型合并

在用scanpy进行单细胞分析时往往要对聚类(leiden)后的簇进行细胞类型的标注并生成细胞图谱,但是在通常使用的更改注释的方法中new_cluster_names=[]adatas.rename_categories('leiden',new_cluster_names)new_cluster_names的字符不允许重复,而我无法确保每一个簇的细胞类型都不相同(一般都需要手动调整),于是我只能在相同的细胞类型后添加_num进行注释,如Bcell_1,Bcell_2,用此方法生成的细胞图谱如下所示image.png真的是相当难看,观察起来也很费劲。所以我一直在想怎么才能把相同的celltyp

scanpy不同cluster及细胞类型合并

在用scanpy进行单细胞分析时往往要对聚类(leiden)后的簇进行细胞类型的标注并生成细胞图谱,但是在通常使用的更改注释的方法中new_cluster_names=[]adatas.rename_categories('leiden',new_cluster_names)new_cluster_names的字符不允许重复,而我无法确保每一个簇的细胞类型都不相同(一般都需要手动调整),于是我只能在相同的细胞类型后添加_num进行注释,如Bcell_1,Bcell_2,用此方法生成的细胞图谱如下所示image.png真的是相当难看,观察起来也很费劲。所以我一直在想怎么才能把相同的celltyp

关于 java:JBoss Clustering 和 Lighttpd 负载平衡显示不一致的行为

JBossClusteringandLighttpdLoadBalancingdisplayinginconsistentbehaviour问题我们在不同的机器上安装了两个JBossAS4.2.3,它们是集群的。我们还使用Lighttpd作为负载平衡器,并放置在我们的Tomcat服务器(Tomcat服务器没有集群)和JBoss服务器之间。一旦所有服务器都启动并运行,应用程序就会完美运行。如果我关闭了一台JBoss服务器,请求将按预期重定向到另一台服务器。注销应用程序后,我的问题就开始了。在尝试重新登录应用程序时,我收到一个异常,提示Tomcat无法连接到已关闭的服务器。服务器设置Machine

关于 java:JBoss Clustering 和 Lighttpd 负载平衡显示不一致的行为

JBossClusteringandLighttpdLoadBalancingdisplayinginconsistentbehaviour问题我们在不同的机器上安装了两个JBossAS4.2.3,它们是集群的。我们还使用Lighttpd作为负载平衡器,并放置在我们的Tomcat服务器(Tomcat服务器没有集群)和JBoss服务器之间。一旦所有服务器都启动并运行,应用程序就会完美运行。如果我关闭了一台JBoss服务器,请求将按预期重定向到另一台服务器。注销应用程序后,我的问题就开始了。在尝试重新登录应用程序时,我收到一个异常,提示Tomcat无法连接到已关闭的服务器。服务器设置Machine

关于hadoop:最新的\\”apache mahout\\” 库中\\”clusterdump\\” 是否有任何seqFileDir 选项?

isthereanyseqFileDiroptionfor"clusterdump"inthelatest"apachemahout"library?我正在尝试在输出上执行"clusterdump"mahoutkmeans聚类示例(synthetic_control示例)。但我遇到以下错误:1234567891011>~/MAHOUT/trunk/bin/mahoutclusterdump--seqFileDirclusters-10-final--pointsDirclusteredPoints--outputa1.txtMAHOUT_LOCALisnotset;addingHADOOP_C

关于hadoop:最新的\\”apache mahout\\” 库中\\”clusterdump\\” 是否有任何seqFileDir 选项?

isthereanyseqFileDiroptionfor"clusterdump"inthelatest"apachemahout"library?我正在尝试在输出上执行"clusterdump"mahoutkmeans聚类示例(synthetic_control示例)。但我遇到以下错误:1234567891011>~/MAHOUT/trunk/bin/mahoutclusterdump--seqFileDirclusters-10-final--pointsDirclusteredPoints--outputa1.txtMAHOUT_LOCALisnotset;addingHADOOP_C

redis优化系列(六)高可用集群Redis Cluster的认识

一、redis哨兵+主从的问题假设我们在一台主从机器上配置了200G内存,但是业务需求是需要500G的时候,主从结构+哨兵可以实现高可用故障切换+冗余备份,但是并不能解决数据容量的问题,用哨兵,redis每个实例也是全量存储,每个redis存储的内容都是完整的数据,浪费内存且有木桶效应。为了最大化利用内存,可以采用cluster集群,就是分布式存储。即每台redis存储不同的内容。Redis分布式方案一般有两种:①、客户端分区方案:优点是分区逻辑可控,缺点是需要自己处理数据路由、高可用、故障转移等问题,比如在redis2.8之前通常的做法是获取某个key的hashcode,然后取余分布到不同节

redis优化系列(六)高可用集群Redis Cluster的认识

一、redis哨兵+主从的问题假设我们在一台主从机器上配置了200G内存,但是业务需求是需要500G的时候,主从结构+哨兵可以实现高可用故障切换+冗余备份,但是并不能解决数据容量的问题,用哨兵,redis每个实例也是全量存储,每个redis存储的内容都是完整的数据,浪费内存且有木桶效应。为了最大化利用内存,可以采用cluster集群,就是分布式存储。即每台redis存储不同的内容。Redis分布式方案一般有两种:①、客户端分区方案:优点是分区逻辑可控,缺点是需要自己处理数据路由、高可用、故障转移等问题,比如在redis2.8之前通常的做法是获取某个key的hashcode,然后取余分布到不同节