我有一个以制表符分隔的文件,有超过2亿行.在linux中,将其转换为csv文件的最快方式是什么?这个文件确实有多行标题信息,我需要沿着这条路go 掉这些信息,但是标题的行数是已知的.我已经看到了sedgawk的建议,但我想知道是否有一个"首选"的 Select .

只是澄清一下,该文件中没有嵌入选项卡.

推荐答案

如果你只需要translate个制表符到逗号,那么tr个可能是最好的 Select .

这里的空白是一个文字标签:

$ echo "hello   world" | tr "\\t" ","
hello,world

当然,如果在文件中的字符串文本中嵌入了制表符,这也会错误地转换它们;但嵌入文字标签是相当罕见的.

Linux相关问答推荐

通过ssh传输参数时避免字符串拆分

在新环境中使用Unicode范围的sed表达式有问题

如何告诉链接器不要在链接的共享库中查找某些符号?

ShellScript,有更好的方法来查找具有特定名称和日期的文件吗?

如何在 Linux 上打印带有屏蔽值的环境名称?

如何使用 Golang 清除终端中的最后一行

如何计算文本的时差,如 YYYYMMDDHHMMSSXXX 格式,包括毫秒

nohup 是否可以跨管道工作?

DMA 和内存映射 IO 有什么区别?

在 Linux 下将 TCP 流量重定向到 UNIX 域套接字

具体来说,fork() 如何处理 Linux 中 malloc() 动态分配的内存?

Bash 命令 :(){ :|:& };: 将产生进程导致内核死亡.你能解释一下语法吗?

如何知道linux调度器时间片?

将原始数据发送到 TCP 服务器的 Linux 工具

命令行 Arduino 编译和上传?

在 PHP / Apache / Linux 环境中,为什么 chmod 777 是危险的?

在没有 python 命令的情况下在终端中运行 python 脚本

我可以使用 awk 将所有小写字母转换为大写吗?

id_rsa.pub 文件 SSH 错误:格式无效

从文件中随机 Select 行而不用 Unix 啜饮它