admin 管理员组

文章数量: 1087139


2024年3月9日发(作者:linux系统开发)

Perl的经典用法<编者按:本月的专栏文章将介绍一些Perl的经典用法,以便帮助你创建短小精悍,可靠性更高的程序>perl复制文件夹useFile::Copyqw(cp);cp"/dira/dfsdf","/dirb/sdfsdf/dddddd";我用system('cpsourcetarget'),如果我把程序移植到WINDOWS能否正确运行?useFile::Copy;copy($original,$new_copy)ordie"Copyfailed:$!";学Perl有几本书要常备:Q打印数据的方法:一:print"@arrayn";二:for$row(@array){print"@$rown";}三:for$row(0..$#array){print"row$rowis:@{$geno_sample[$row]}n";

}用Open()函数打开文件打开文件的常用方法是:open(FH,"<$filename")ordie"Couldn'topen$filenameforreading:$!";open()函数通常带有两个参数,第一个为文件句柄,用于指向打开的文件,第二个参数是文件名及模式(文件的打开模式)的混合体,如果文件被成功打开,open()函数返回true,否则为false。我们用“or”来测试该条件。上述代码中的模式由小于字符(<)来表示。如果文件不存在,open()将返回false。此时,你可以读文件句柄,但不可以写。大于字符表示写。如果文件不存在,就会被创建。如果文件存在,文件被清除,以前的数据将会丢失。你可以写入文件句柄,但不可以读入。#如果文件不存在,就创建它open(FH,">$filename")ordie"Couldn'topen$filenameforwriting:$!";如果文件不存在,添加模式(用两个大于符号表示)可以用来创建新文件,如果文件

存在,该模式并不会清除原来的数据。同“<”或“读”模式一样,你只能对文件句柄进行写操作。(所以的写入内容都添加到文件尾)。企图进行读操作,会产生运行错误。open(FH,">>$filename")ordie"Couldn'topen$filenameforappending:$!";通过“+<”模式,你可以既可以读文件,又可以写文件。你可以通过tell()函数在文件内部移动,通过seek()函数进行定位。如果文件不存在,就会被创建。如果文件已经存在,原来的数据不会被清除。如果你打算清除原来的文件内容,或者自己调用truncate()函数,或者使用“+>”模式。open(FH,"+>$filename")ordie"Couldn'topen$filenameforreadingandwriting:$!";注意“+<”和“+>”的区别,两者都可以可读可写。前者为非破坏性写,后者为破坏性写。错误错误是如何出现的?很多地方都会出现错误:如目录不存在,文件不可写入,你的程序丢失了文件句柄等等。

你应该检查系统调用的结果(如open()和sysopen()),看看是否调用成功。为了帮助用户查错,通常使用“ordie()”,你应记住这些用法。首先,应写出系统调用失败(“open”)的信息。其次,应写出文件名的信息,以便修正错误时更容易地定位。第三,要写出打开文件的方式,(“forwriting,”“forappending”)。第四,输出操作系统的出错信息(包含在$!中)。这样,一旦出现文件不能打开的问题,使用你的程序的用户会大体上知道为什么不能打开。有时,我们把第一个和第三个合并在一起:ordie"unabletoappendto$filename:$!";如果在open()和出错信息中都写了文件的全名,你会冒改变了open()的风险,使得出错信息不合时宜或不正确。#下面会出现虚假的出错信息open(FH,"

函数sysopen()带有四个参数,第一个是同open()函数类似的文件句柄参数,第二个参数是不带模式信息的文件名,第三个参数是模式参数,由Fcntl模块提供的逻辑OR运算组合起来的常数构成,第四个参数(可选),为八进制属性值(0666表示数据文件,0777表示程序)。如果文件可以被打开,sysopen()返回true,如果打开失败,则返回false。不同于open()函数,sysopen()不提供模式说明的简写方式,而是把一些常数组合起来,而且,每个模式常数有唯一的含义,只有通过逻辑OR运算才能将它们组合起来,你可以设置多个行为的组合。O_RDONLYRead-onlyO_WRONLYWrite-onlyO_RDWRReadingandwritingO_APPENDWritesgototheendofthefileO_TRUNCTruncatethefileifitexistedO_CREATCreatethefileifitdidn'texistO_EXCLErrorifthefilealreadyexisted(usedwithO_CREAT)当你需要小心行事的时候,就使用sysopen()函数,例如,如果你打算添加内容到文件中,如果文件不存在,不创建新文件,你可以这样写:sysopen(LOG,"/var/log/",O_APPEND,0666)

ordie"Can'topen/var/log/appending:$!";读入单个记录有一个容易的方法读入filehandles:用操作符。在标量内容下,它返回文件中的下一个记录,或者返回未定义出错信息。我们可以使用它来把一行读入到一个变量中:$line=;die"Unexpectedend-of-file"unlessdefined$line;在循环语句中,我们可以这样写:while(defined($record=)){#long-winded#$recordissettoeachrecordinthefile,oneatatime}因为要大量进行这样的工作,通常再进行一下简化,把记录放到$_中,而不是$record中:while(){#$_每次为文件中的一个记录}

在Perl5.004_04中,我们可以这样做:while($record=){#$record每次为文件中的一个记录}defined()将自动加上,在Perl5.004_04以前的版本中,该命令给出一个警示。要了解所用的Perl版本,可在命令行下打入:perl-v一旦我们读出了一个记录,通常打算去掉记录分隔符,(缺省值为换行符字符):chomp($record);Perl4.0版本仅有chop()操作,去掉串的最后一个字符,不管该字符是什么。chomp()没有这么大的破坏性,如果有行分隔符存在,它仅去掉行分隔符。如果你打算去掉行分隔符,就用chomp()来代替chop()。读入多个记录

如果你调用,返回文件中剩余的记录。如果你处于文件尾,则返回空表:@records=;if(@records){print"Therewere",scalar(@records),"recordsread.n";}在下面的一步中,进行赋值和测试两项工作:if(@records=){print"Therewere",scalar(@records),"recordsread.n";}chomp()也可适用对数组操作:@records=;chomp(@records);对于任何表达式,都可以进行chomp操作,故你可以在下面的一步中这样写:chomp(@records=);

什么是记录?记录的缺省定义为:“行”。记录的定义由$/变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“n”。例如,你可以用任何你想要替换的符号来代替“n”。$/=";";$record=;#读入下一个用分号分隔的记录$/可以取其它两个有趣的值:空串("")和undef。读入段落$/=""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为"nn",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“textnnnn”,你既可以把它解释为一个段落("text"),也可以解释为两个段落("text",后面跟两个换行符,以及一个空段落,后面跟两个空行。)在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。$/="nn";while(){chomp;

nextunlesslength;#跳过空段#...}你可以把$/设置为undef,它用于读入后面跟着两个或多个换行符组成的段落:undef$/;while(){chomp;#...}读入整个文件$/的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:undef$/;$file=;因为改变了$/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中:{

local$/=undef;$file=;}记住:Perl变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。用正则表达式对文件进行操作一旦你有个包含了整个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s和/m。一般,Perl的正则表达式对行进行处理,你可以这样写:undef$/;$line=;if($line=~/(b.*grass)$/){print"found$1n";}如果把我们的文件填入如下内容:browngrassbluegrass则输出为:foundbluegrass

它没有找到“browngrass”,这是因为$仅在串尾寻找其匹配,(或者在串结束前的一行)。如果在包含很多行的串中,用"^"和"$"来匹配,,我们可以使用/m("multiline")选项:if($line=~/(b.*grass)$/m){}现在程序会把如下的信息输出:foundbrowngrass类似地,句点可以匹配除了换行符之外的所有字符:while(){if(/19(.*)$/){if($1<20){$year=2000+$1;}else{$year=1900+$1;}}}

如果我们从文件中读入“1981”,$_将包含“1981n”。正则表达式中的句点匹配“8”和“1”,而不匹配“n”。这里正需要这样做,因为换行符不是日期的组成部分。对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行分隔符。在这种情况下,我们可以使用/s选项,并用句点来匹配除了换行符以外的所有字符。if(m{(.*?)}s){print"Foundboldtext:$1n";}此处,我用了{}来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉Perl我正在匹配,起始字符为"m",结束字符为"s"。你可以把/s和/m选项组合使用:if(m{^(.*?)}sm){#...}总结有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过操作符,可以读入一个记录,$/变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s和/m这两个正则表达式标记。

本篇文章来源于站长中国转载请以链接形式注明出处/edu/20071014/网址:


本文标签: 文件 记录 打开 进行 读入