这是我的情况:我有一个大文本文件,我想从中提取某些信息.我使用sed根据
regexp提取所有相关信息,但我提取的每一条“信息”都在一个单独的行上,我希望每个“记录”都在它自己的行上,这样它就可以很容易地导入到一个DB.
这是我现在的数据示例:
这是我现在的数据示例:
92831,499,000
,0644321
79217,999,5417178
,PK91622
,PK90755
理想情况下,我希望此输出看起来像:
92831,PK91622
79217,PK90755
这可能更难做到,所以我会满足于最后一个“记录”的输出只出现一次,附加的“PK ……”成为该行的第4个“字段”.
最后,我能想到的最简单的方法是,如果该行以逗号(^,)开头,则应该删除它之前的新行…我不太熟悉awk但是如果你能给我一个从这开始它真的很感激!谢谢!
$perl -0pe 's/\n,/,/g' < test.dat 92831,000,0644321 79217,5417178,PK91622,PK90755
翻译:在没有行分隔的情况下批量阅读,只用逗号换掉换行符后面的每个逗号.
这里最短的代码!