我们正试图在四个不同的城市:BKI、Daus、SRINA和Palla寻找土壤有毒元素与表观遗传年龄加速之间的联系.利用电感耦合等ionic 体质谱(ICPMS)对土壤中的有毒元素进行了测定,并与年代进行了回归,计算了表观遗传年龄加速度.我们总共使用了10种有毒元素.

然而,我面临着两个问题: 1.所有四个城市的参与者人数各不相同:BKI(1000名参与者)、Daus(250名参与者)、SRINA(200名参与者)、Palla(100名参与者).我应该如何解释这些不同数量的个人?

2.我们想在每个城市测量所有10种有毒元素与表观遗传年龄的关联.

目前,我正在使用下面的模型,但它提供了所有元素和表观遗传年龄加速之间的关联.我们还希望根据城市将yields 分开.

library("QuantPsyc")
data <- read.table("clr.clean.file2.txt", header=T, sep=",")

model1 <- lm (epigenetic_age_acceleration ~ 
   As + Se + Fe + Co + Zn + Mn + Hg + Sb + Mo + Pb + 
   Smoking_Status + Sex + Age, data = data)
model1
model1.stat<-lm.beta (model1)

model1.stat

As
0.0256056478741109
Se
0.00499178037586947
Fe
0.00210283404005497
Co
-0.00916637143431217
Zn
0.0639371964557919
Mn
-0.0213600659139311
Hg
0.0328431516176923
Sb
0.000169338014091565
Mo
-0.0200956999960768
suggested code work of me;
IEAA_elements <- lm (epigentic_age_acceleration ~ 0 + city + 
  city:(As +Se + Fe + Co + Zn +Mn + Hg + Sb+ Mo +Pb +   
        Smoking_Status + Sex + Age), data = data)

cf <- confint(IEAA_elements)
cf

现在不确定如何将置信度区间与回归输出合并?

Also not sure if I have to use GLM model then should I use gaussian family but not sure about link type? and what role does it has in GLM model
# Fit a GLM
  formula <- as.formula(epigentic_age_acceleration ~ 0 + city + 
  city:(As +Se + Fe + Co + Zn +Mn + Hg + Sb+ Mo +Pb +   
        Smoking_Status + Sex + Age))
  model <- glm(formula, data = data, family = gaussian(link="identity"))

推荐答案

假设city是数据集中的一个分类(因子)变量,您可能需要:

epigenetic_age_acceleration ~ 
   0 + city + city:(As + Se + Fe + Co + Zn + Mn + Hg + Sb + Mo + Pb + 
   Smoking_Status + Sex + Age)

0+city表示 for each 城市设置单独的拦截(并 suppress 整体拦截).city:(<stuff>)表示适合在city<stuff>之间的interaction.

您通常不需要明确说明不同城市的不同样本强度:这将由回归框架处理.

R相关问答推荐

提取rame中对应r中某个变量的n个最小正值和n个最大负值的条目

跨列应用多个摘要函数:summerise_all:列表对象无法强制为double类型'

查找具有平局的多个列的最大值并返回列名或平局 destruct 者NA值

如何计算R数据集中每个女性的子元素数量?

用预测NLS处理R中生物学假设之上的误差传播

在某些栏和某些条件下,替换dfs列表中的NA

如何在格子中添加双曲曲线

在for循环中转换rabrame

如何使用列表中多个列表中的第一条记录创建数据框

将. xlsx内容显示为HTML表

使用data.table::fcase()而不是dplyr::case_When()时保持值

将二进制数据库转换为频率表

从圆到R中的多边形的标绘雷达图

减go R中列表的所有唯一元素对

为什么我对圆周率图的蒙特卡罗估计是空的?

在散点图中使用geom_point放置线图例

避免在图例中显示VLINS组

在ggploy中创建GeV分布时出错

GOGPLATE geom_boxploy色彩疯狂

向数据添加标签