我有一个来自组织切片数据集的数据帧,其中包含以下列
- 图像
- 名字
- Tumor_stroma_epi_NSCLC_v2:上皮%
- Tumor_stroma_epi_NSCLC_v2:上皮区
- Tumor_stroma_epi_NSCLC_v2:坏死率
- Tumor_stroma_epi_NSCLC_v2:坏死区微米^2
- Tumor_stroma_epi_NSCLC_v2:间质百分比
- Tumor_stroma_epi_NSCLC_v2:间质面积微米^2
- Tumor_stroma_epi_NSCLC_v2:Tumor%
- Tumor_stroma_epi_NSCLC_v2:肿瘤面积微米^2
- 面积Δm^2
根据不同的组织类型,列的nsclc_v2分量在多个不同的数据集上是可变的.我想创建一个regex来删除%Columns,它可以识别具有相同格式但不同组织类型的所有列.到目前为止,这就是我能想到的全部.
tumor_temp.drop(columns=['图像','名字',
'^tumor_stroma_epi_[a-z0-9_]: Epithelium %$',
'^tumor_stroma_epi_[a-z0-9_]: Necrosis %$',
'^tumor_stroma_epi_[a-z0-9_]: Stroma %$',
'^tumor_stroma_epi_[a-z0-9_]: Tumor %$',
'Area µ?m^2'], inplace=True)
抱歉,如果这有点基本的话,我大部分都有R背景.