我在RStudio中有一个Height列,它包含character个字符串(例如188厘米)以及一些以英尺和英寸为单位的条目(例如5‘11")!脏数据..
我的问题是:如何从列中删除"厘米"单位,并将英尺/英寸行转换为保持列一致性所需的数字厘米值?我希望整个列的值严格以厘米(如188)为单位.谢谢您抽时间见我!我是一名初级数据分析师,已经独自完成了一个 case 研究,但这项看似简单的任务却让我望而却步.请记住,我有18,979个条目,因此我需要一个代码来处理整个专栏.谢谢!
我使用:
gsub("cm","",paste(fifa21_v2$Height))
这就产生了一个go 掉了"cm"的表格(好消息) 但后来我注意到英尺/英寸的变量,然后出现了"6 '0""(不好)
dput(fifa21_v2$Height[820:875])
c("195cm", "179cm", "191cm", "170cm", "182cm", "195cm", "178cm",
"187cm", "187cm", "190cm", "188cm", "198cm", "180cm", "172cm",
"189cm", "192cm", "179cm", "184cm", "186cm", "178cm", "173cm",
"176cm", "173cm", "187cm", "182cm", "186cm", "188cm", "170cm",
"6'3\"", "6'5\"", "185cm", "179cm", "195cm", "179cm", "185cm",
"174cm", "183cm", "180cm", "181cm", "186cm", "178cm", "5'11\"",
"6'4\"", "6'1\"", "6'0\"", "6'1\"", "5'11\"", "6'2\"", "6'0\"",
"6'3\"", "6'0\"", "184cm", "5'10\"", "5'9\"", "5'11\"", "5'6\""
)