admin管理员组

文章数量:1794759

【awk】诡异的错误,linux和windows换行的区别

【awk】诡异的错误,linux和windows换行的区别

题目:文件a,每行两列,格式为url ip,文件b每行一列,格式为url,通过awk实现找出b文件中的url是否在a文件中,如存在,将此url和对应的ip输出(文件大小不考虑) 编写文件a如下:

 

www.baidu 61.135.169.125im.baidu 123.125.115.69zhidao.baidu 123.125.115.90tieba.baidu 123.125.65.93mp3.baidu 123.125.114.76img.baidu 123.125.114.171video.baidu 123.125.114.32

编写文件b如下:

im.baidump3.baiduvideo.baidu

预期输出结果为:

im.baidu 123.125.115.69mp3.baidu 123.125.114.76video.baidu 123.125.114.32

设计awk命令如下:awk 'ARGIND==1{s[$0]}ARGIND==2{if($1 in s) print $0}' b a 实际输出结果为空。————————————————————————————————————解决方法:文件a和b是在windows下编写的,而windows下的换行为/r/n,linux下为/n。因此a文件的$0实则在末尾包含了“/r”。因此,重写awk代码如下:awk 'ARGIND==1{s[$1]}ARGIND==2{if($1"/r" in s) print $0}' b a 得到预期的输入结果。另外,要是windows和linux下的文件都有效,则可写代码如下:awk 'ARGIND==1{s[$1]}ARGIND==2{if(($1"/r" in s)||($1 in s)) print $0}' b a ————————————————————————————————————参考资料:hi.baidu/fangm/blog/item/2e13fdfab2f739ddb48f31cb.html

本文标签: 诡异换行区别错误awk