R 从成对矩阵中，找到等于某个值的最大个体群体

发布于09月15日

我有一个成对关联度39x39矩阵，包含39个个体的所有成对组合的关联性值.我想找出最大的一组完全不相关的个体，也就是说，其中所有两两相关的值都等于0.

在R中有什么简单的方法可以做到这一点吗？

一个更简单的例子:

set.seed(420)

#Create the matrix
relatedness.matrix <- matrix(data = sample(x = c(0.5, 1, 0,0), size = 25, replace = TRUE), nrow = 5, ncol = 5)

# Matrix has the same upper and lower triangles
relatedness.matrix[upper.tri(relatedness.matrix)] <- relatedness.matrix[lower.tri(relatedness.matrix)]

# Add names for simplicity of reference
colnames(relatedness.matrix) <- letters[1:5]
rownames(relatedness.matrix) <- letters[1:5]

# Relatedness between the same individual does not count
diag(relatedness.matrix) <- NA

在这种情况下，有三种可能的解决方案:只有e和b的2x2矩阵，只有c和d的2x2矩阵，以及只有a和e的2x2矩阵.将任何其他个人添加到这些矩阵中的任何一个都将添加相关的个人.

编辑:添加了上边和下边的三角形是相同的，并且在本例中实际上有多个2x2解.

isSymmetric(m) #> [1] TRUE m #> a b c d e f g h i j k l m n o p q r s t u v w x y z #> a NA 0 1 2 1 2 0 2 2 0 1 2 0 1 2 2 0 0 0 0 0 2 2 2 1 1 #> b 0 NA 0 1 2 2 0 2 0 2 0 2 2 2 1 2 2 1 1 0 1 2 1 2 0 1 #> c 1 0 NA 0 1 0 2 1 2 1 0 1 0 1 2 2 2 2 1 2 2 0 2 0 1 0 #> d 2 1 0 NA 2 2 2 2 2 2 1 1 0 1 2 1 2 2 1 2 1 0 1 0 2 1 #> e 1 2 1 2 NA 2 1 0 1 0 1 0 0 0 1 2 0 2 0 2 2 1 2 1 2 2 #> f 2 2 0 2 2 NA 2 2 2 1 1 2 1 2 0 2 0 2 2 0 1 1 0 2 2 2 #> g 0 0 2 2 1 2 NA 0 2 1 2 2 2 2 0 1 2 0 2 1 0 0 1 1 2 1 #> h 2 2 1 2 0 2 0 NA 2 2 1 0 2 2 1 0 1 1 1 1 2 1 1 1 1 2 #> i 2 0 2 2 1 2 2 2 NA 1 2 1 0 2 2 0 2 2 2 0 2 0 0 0 0 2 #> j 0 2 1 2 0 1 1 2 1 NA 1 1 2 2 0 0 1 1 2 2 2 1 0 0 2 2 #> k 1 0 0 1 1 1 2 1 2 1 NA 2 2 1 0 0 2 0 2 0 0 1 1 1 1 2 #> l 2 2 1 1 0 2 2 0 1 1 2 NA 1 1 2 0 2 2 1 2 1 0 0 2 1 1 #> m 0 2 0 0 0 1 2 2 0 2 2 1 NA 0 2 2 0 2 1 1 1 1 0 2 1 1 #> n 1 2 1 1 0 2 2 2 2 2 1 1 0 NA 1 0 1 2 1 2 0 1 0 1 1 2 #> o 2 1 2 2 1 0 0 1 2 0 0 2 2 1 NA 2 2 0 1 2 1 2 2 1 1 0 #> p 2 2 2 1 2 2 1 0 0 0 0 0 2 0 2 NA 2 2 2 1 0 2 0 0 1 2 #> q 0 2 2 2 0 0 2 1 2 1 2 2 0 1 2 2 NA 1 0 1 2 2 1 0 1 1 #> r 0 1 2 2 2 2 0 1 2 1 0 2 2 2 0 2 1 NA 1 1 2 1 2 2 2 1 #> s 0 1 1 1 0 2 2 1 2 2 2 1 1 1 1 2 0 1 NA 2 1 1 2 1 1 1 #> t 0 0 2 2 2 0 1 1 0 2 0 2 1 2 2 1 1 1 2 NA 0 0 1 2 2 0 #> u 0 1 2 1 2 1 0 2 2 2 0 1 1 0 1 0 2 2 1 0 NA 2 2 0 2 0 #> v 2 2 0 0 1 1 0 1 0 1 1 0 1 1 2 2 2 1 1 0 2 NA 2 0 1 1 #> w 2 1 2 1 2 0 1 1 0 0 1 0 0 0 2 0 1 2 2 1 2 2 NA 0 2 0 #> x 2 2 0 0 1 2 1 1 0 0 1 2 2 1 1 0 0 2 1 2 0 0 0 NA 1 2 #> y 1 0 1 2 2 2 2 1 0 2 1 1 1 1 1 1 1 2 1 2 2 1 2 1 NA 0 #> z 1 1 0 1 2 2 1 2 2 2 2 1 1 2 0 2 1 1 1 0 0 1 0 2 0 NA

library(igraph) is <- largest_ivs(graph_from_adjacency_matrix(m, "undirected")) is #> [[1]] #> + 4/26 vertices, named, from 272900e: #> [1] i p w x #> #> [[2]] #> + 4/26 vertices, named, from 272900e: #> [1] c d v x #> #> [[3]] #> + 4/26 vertices, named, from 272900e: #> [1] j p w x

lapply(is, \(i) m[i, i]) #> [[1]] #> i p w x #> i NA 0 0 0 #> p 0 NA 0 0 #> w 0 0 NA 0 #> x 0 0 0 NA #> #> [[2]] #> c d v x #> c NA 0 0 0 #> d 0 NA 0 0 #> v 0 0 NA 0 #> x 0 0 0 NA #> #> [[3]] #> j p w x #> j NA 0 0 0 #> p 0 NA 0 0 #> w 0 0 NA 0 #> x 0 0 0 NA

microbenchmark::microbenchmark( cliques = largest_cliques(graph_from_adjacency_matrix(!m, "undirected")), ivs = largest_ivs(graph_from_adjacency_matrix(m, "undirected")) ) #> Unit: microseconds #> expr min lq mean median uq max neval #> cliques 319.7 348.6 372.581 368.90 388.55 555.0 100 #> ivs 560.8 589.6 629.992 616.55 654.35 1187.6 100

m <- matrix(sample(0:2, 1e4, 1), 100, 100, 0) m[lower.tri(m)] <- t(m)[lower.tri(m)] diag(m) <- NA microbenchmark::microbenchmark( cliques = largest_cliques(graph_from_adjacency_matrix(!m, "undirected")), ivs = largest_ivs(graph_from_adjacency_matrix(m, "undirected")) ) #> Unit: milliseconds #> expr min lq mean median uq max neval #> cliques 2.5735 2.7651 3.275977 2.9013 3.3138 7.9742 100 #> ivs 161.9572 182.3812 191.595736 191.2344 202.1377 243.5654 100 m <- matrix(sample(0:2, 4e4, 1), 200, 200, 0) m[lower.tri(m)] <- t(m)[lower.tri(m)] diag(m) <- NA system.time(cl <- largest_cliques(graph_from_adjacency_matrix(!m, "undirected"))) #> user system elapsed #> 0.05 0.00 0.05 system.time(is <- largest_ivs(graph_from_adjacency_matrix(m, "undirected"))) #> user system elapsed #> 10.14 0.00 10.15

R 从成对矩阵中，找到等于某个值的最大个体群体

推荐答案

R相关问答推荐

根据列表中项目的名称多次合并数据框和列表

更改Heatmap Annotation对象的名称

如何将在HW上运行的R中的消息(错误、警告等)作为批处理任务输出

如何在R中合并和合并多个rabrame？

手动打印线型gplot

Rplotly中的Sankey Diagram：意外连接&

非线性混合效应模型(NLME)预测变量的置信区间

无法正确设置动态创建的Quarto标注的格式

哪一行和行和 Select 特定行，但是考虑到Nas

展开对数比例绘图的轴(添加填充)

在另一个包中设置断点&S R函数

使用不同的定性属性定制主成分分析中点的 colored颜色和形状

如何将这个小列表转换为数据帧？

ggplot R：X，Y，Z使用固定/等距的X，Y坐标绘制六边形热图

如何提取R中其他字符串和数字之间的字符串？

R仅当存在列时才发生变异

TidyVerse中长度不等的列结合向量

整理ggmosaic图的标签

如何在R中创建这些列？

将数据从一列转换为按组累计计数的单个虚拟变量