最近碰到两道脚本题:
1、写脚本实现,可以用shell、perl等。在目录/tmp下找到100个以abc开头的文件,然后把这些文件的第一行保存到文件new中。
2、写脚本实现,可以用shell、perl等。把文件b中有的,但是文件a中没有的所有行,保存为文件c,并统计c的行数。
解答思路:
1:觉得用shell更好一些,代码如下
#!/bin/sh for filename in `find /tmp -type f -name "abc*"|head -n 100` do sed -n '1p' $filename>>new done
注释:第一,用到了find命令,其中-type f表示选取普通文件,-name用于设定文件名;第二,head -n 100命令用于取出前100项。第三,sed -n ‘1p’用于取出文件的第一行内容。第四,>>new表示追加到文件new中。
2:第二个题目还是用perl更方便一些,代码如下:
[rocrocket@wupengchong shellstudy]$ cat roc.pl
#!/usr/bin/perl -w open B,"<b" or die "b error.($!)"; open C,">c" or die "c error.($!)"; my $find=0; my ($myb,$mya); while(<B>){ $find=0; chomp($myb=$_); print "B ",$myb,"\n"; open A,"<a" or die "a error.($!)"; while(<A>){ chomp($mya=$_); print "A ",$mya,"\n"; if($mya=~/$myb/){ $find=1; print "FIND!\n"; } } if($find==0){ print C $myb,"\n"; } } close A; close B; close C; $linenum=`cat c|wc -l`; print "c line count:",$linenum;
第二题一直没有很好的思路,就只好用笨方法实现了。
看看哪位能有更好的方法和思路?希望能留言交流:D
当然shell、perl、python都欢迎!
over~
通过RSS订阅
October 26th, 2008 at 9:53 pm
with open(“b”,”r”) as f:
set1 = set(f.readlines ());
with open(“a”,”r”) as f:
set2 = set(f.readlines ());
count = 0;
with open(“c”, w) as f:
for line in list(set1 – set2):
f.write (line);
count += 1;
print count;
回复
October 26th, 2008 at 9:55 pm
TMD又没有格式,凑合看看吧。
用了2.6的with语法,简洁多了。2.5以下需要启用或者干脆自己close。
其实核心就一句set1 – set2
回复
October 26th, 2008 at 9:57 pm
find /tmp -type f -name “abc*”|head -n 100|xargs head -q -n 1
回复
October 26th, 2008 at 10:05 pm
第二题 Ruby实现:
#!/usr/bin/ruby
File.open(ARGV[2]) do |f|
f.write((File.readlines(ARGV[0]) – File.readlines(ARGV[1])).join(“\n”))
end
回复
October 26th, 2008 at 10:06 pm
第二题Ruby实现
File.open(ARGV[2]) do |f|
f.write((File.readlines(ARGV[0]) – File.readlines(ARGV[1])).join(“\n”))
end
回复
October 26th, 2008 at 10:07 pm
第二题Ruby实现:
File.open(ARGV[2]) do |f|
f.write((File.readlines(ARGV[0]) – File.readlines(ARGV[1])).join(“\n”))
end
回复
November 21st, 2008 at 3:52 pm
不懂perl。。。
awk ‘NR==FNR{a[$0]=1}NR!=FNR&&!a[$0]{print > “c”}’ a b
回复
qsxing Reply:
July 9th, 2009 at 1:13 pm
@sanding, 能解释一些是什么意思吗?
回复
December 4th, 2008 at 12:46 pm
第二题解法:
1 sort a b | uniq -u | tee c | wc -l
2 grep -vFf a b | tee c | wc -l
第一题这个比较短:
find /tmp -type f -name “abc*” | head -n 100 | xargs head -q -n 1 >> new
回复
December 5th, 2008 at 2:44 pm
[引用开始]
第二题解法:
1 sort a b | uniq -u | tee c | wc -l
2 grep -vFf a b | tee c | wc -l
[引用结束]
方法1不正确。原题中”文件b中有的,但是文件a中没有的所有行”,而不是”文件b中有的但是文件a中没有的,或者,文件a中有的但是文件b中没有的”。
方法2还差一步,grep时要指定-x参数,表示是整行匹配。
回复
March 10th, 2010 at 12:10 pm
第二个可以用comm
sort a > a2
sort b > b2
comm -23 a2 b2 | wc -l
回复
April 1st, 2010 at 3:43 am
1:
dir ./test* | xargs tail -qn1 >t
or:
for i in `dir ./test*`; do tail -n1 $i > tt; done
2:
diff t1 t2 | grep “<" | sed 's/^ tt ; cat tt | wc -l
回复
April 1st, 2010 at 3:47 am
alert(“test”);
回复
August 5th, 2010 at 9:48 am
第二题
办法以比较笨
diff b a | sed ‘/^>/d’| sed ’s/c
回复
August 5th, 2010 at 12:19 pm
突然想到是否可能用awk???
回复
rocrocket Reply:
August 7th, 2010 at 9:58 am
完全可以:)
有兴趣可以编写一个,分享上来
回复