我正在try 从R工作室的GitHub加载一个码本.URL是here.这是一个基于链接的md文件,但我想加载它的原始文件.(如右上角所示,这是一个名为raw的选项卡,当我单击它时,它显示pic2).我try 使用提供的链接,但它不起作用.有人能告诉我如何做到这一点吗?非常感谢!

cddf<-url("https://github.com/HimesGroup/BMIN503/blob/master/DataFiles/NHANES_2007to2008_DataDictionary.md")
cd<-read.table(cddf )

Update: enter image description here When I changed the code :

codebook<-read.table("https://raw.githubusercontent.com/HimesGroup/BMIN503/master/DataFiles/NHANES_2007to2008_DataDictionary.md",skip = 4, sep = "|", head = TRUE)

The r successfully read most of them, but the sep "|" did not work for two variables: INDHHIN2 and MCQ010. See pic. Can anyone help to figure out why? Thanks~~! enter image description here

enter image description here

推荐答案

这里有两个问题.

首先,原始文件在链接https://raw.githubusercontent.com/HimesGroup/BMIN503/master/DataFiles/NHANES_2007to2008_DataDictionary.md处可用.但是,如果没有一些帮助,read.table将无法读取该文件:read.table用于制表符或逗号分隔的文件,这是一个标记为Markdown的表.这几乎是:

read.table("https://raw.githubusercontent.com/HimesGroup/BMIN503/master/DataFiles/NHANES_2007to2008_DataDictionary.md",
 skip = 4, sep = "|", head = TRUE)

但它仍然需要一些清理,以删除它添加的第一列和最后一列垃圾,并删除第一行.

R相关问答推荐

如何将多个数据帧附加到R中的多个相应的CSV文件中?

如何根据包含相同值的某些列获取总额

混淆矩阵,其中每列和等于1

查找具有平局的多个列的最大值并返回列名或平局 destruct 者NA值

根据列表中项目的名称多次合并数据框和列表

在位置周围设定一个半径并识别该半径内的其他位置

名称输出pmap on tible

如何从当前行上方找到符合特定条件的最接近值?

为什么在ggplot2中添加geom_text这么慢?

然后根据不同的列值有条件地执行函数

将数据集中的值增加到当前包含的最大值

如何同时从多个列表中获取名字?

将. xlsx内容显示为HTML表

如何识别倒排的行并在R中删除它们?

如何从向量构造一系列双边公式

如何在ggplot2中创建多个y轴(每个变量一个)

有没有办法一次粘贴所有列

通过初始的shiny 应用更新部署的shiny 应用的数据和参数,其中部署的应用程序显示为URL

R中治疗序列的相对时间指数

Ggplot2:添加更多特定 colored颜色 的线条