我想结合awk和R语言.问题是我在指定的目录中有一组* .txt文件,我不知道文件中标题的长度.在某些情况下,我必须跳过25行,而在其他情况下,我必须跳过27等等.所以我想键入一些awk命令来获取要跳过的行数.一旦我有了这个值,我就可以用R开始处理数据了.
此外,在R文件中我将R和bash结合起来,所以我的代码如下所示:
!/usr/bin/env Rscript ... argv <- commandArgs(T) **error checking...** import_file <- argv[1] export_file <- argv[2] **# your function call** format_windpro(import_file,export_file)
我在哪里以及如何键入我的awk命令.谢谢!
我试着做你告诉我关于awk命令的事情,但我仍然得到一个错误.程序无法识别我的命令,所以我无法输入要跳到我的功能的行数.这是我的代码:
** nline< - paste('$(grep -n'm / s'import_file | awk -F“:”'{print $1}')')') nline< - scan(pipe(nline),quiet = T)** 我在第一列中查找模式m / s,以便知道我的头文本在哪里.我在W7下使用R.
解决方法
除了Vincent使用系统的提示(“awk …”,intern = TRUE)之外,您还可以使用作为常用文本连接一部分的pipe()函数:
R> sizes <- read.table(pipe("ls -l /tmp | awk '!/^total/ {print $5}'")) R> summary(sizes) V1 Min. : 0 1st Qu.: 482 Median : 4096 Mean : 98746 3rd Qu.: 13952 Max. :27662342 R>
在这里,我将命令输入awk,然后读取awk的所有输出,也可以是一行:
R> cmd <- "ls -l /tmp | awk '!/^total/ {sum = sum + $5} END {print sum}'" R> totalsize <- scan(pipe(cmd),quiet=TRUE) R> totalsize [1] 116027050 R>