LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 2945|回复: 7

Perl 作为命令行实用程序[转贴]

[复制链接]
发表于 2003-7-5 11:14:58 | 显示全部楼层 |阅读模式
Teodor Zlatanov(tzz@iglou.com)
程序员,Northern Light
2001 年 4 月

那些将 Perl 用作编程语言的人经常忽视了:Perl 用作命令行操作的快速而又难看的脚本编制引擎时是很有用的。通过命令行,Perl 仅用一行就可以实现大多数其它语言需要数页代码才能完成的任务。跟着 Teodor,他会教给您一些有用的示例。

为了完成这一篇 how-to 文章,您需要在系统上安装 Perl 5.6.0。您的系统最好安装比较新(2000 或更新)的 Linux 或 Unix,但是其它操作系统也能照样工作。所有的示例都使用 tcsh shell(尽管 bash 及其它 shell 也能工作)。虽然这些示例也许可以和较早版本的 Perl、Linux 及其它操作系统一起工作,但是如果它们不能一起工作,那么它们无法工作的原因可以作为练习,让读者去解决。


我想说的第一点是:有经验的程序员不应回避快速而又难看的解决方案。在其它专栏文章中,我已经强调了文档编制和彻底性。本专栏文章将集中在编程的消极面,其中文档编制是可选的,而咖啡因却无从选择。因为我们已经身陷其中。


第二点和第一点一样重要:快速而又难看的解决方案很难正确完成。如果您知道如何记录、测试和调试完整的脚本,那么您就非常有可能在一行程序中取得成功。如果您不知道怎样做,那么这就像是企图用鲱鱼来砍倒红杉树(而您的技能就是那条鲱鱼)。


第一步,您应该学习 shell 的特性:Unix 将命令行参数传递给 Perl 的方式及这些参数的 Perl 解释方法。


命令行的实质
在 Unix 中您将看到可执行任务的概念,一个进程通常是装入内存的程序。除了初始进程外,进程都可以由其它进程来启动,初始进程通常是由内核(有时由内核进程)来启动的。就用户的观点而言,启动进程需要 shell 或启动程序。因此,当用户在 shell 命令行输入"xeyes"或者从启动程序菜单(类似于 GNOME 任务栏)选择 X Eyes 应用程序时,shell 或启动程序创建新的进程以运行该程序。


进程获得命令行参数。因此,例如,"perl"和"perl -w"是对同一个程序的两种不同调用。在内部,Perl(类似于 C)将参数传递给它用 @ARGV 数组解释的脚本。但是和 C 不同的是,Perl 偷偷地从脚本中"窃取"其中一些参数以用于自己的用途。例如,正在解释的脚本看不到传给 Perl 解释器的"-w"参数,除非脚本看来需要它。shell 用空格字符隔开参数。


传给 Perl 的"-e"参数告诉 Perl 获取命令行中"-e"后的任何内容并将它当作脚本来运行。"-M"参数表示获取其后的任何内容并将该内容作为模块导入,类似于正规脚本中的"use ModuleName"。请参阅 perldoc perlrun 页面以获取有关 Perl 必须从命令行提供的开关的更多信息。


可能最好在这里举些示例。根据本专栏文章的精神,让我们使用一行程序。脚本的 -MData:umper -e'print Dumper -@ARGV' 部分只是打印出了 @ARGV 数组的内容。

清单 1. 命令行参数


# at the command line, type each line after the '>'
# and you'll get the output that
# follows it

# print the @ARGV contents with no program arguments
> perl -MData:umper -e'print Dumper \@ARGV'
$VAR1 = [];

# print the @ARGV contents with arguments "a" and "b"
> perl -MData:umper -e'print Dumper \@ARGV' a b
$VAR1 = [
          'a',
          'b'
        ];

# print the @ARGV contents with warnings on, and arguments "a" and "b"
> perl -w -MData:umper -e'print Dumper \@ARGV' a b
$VAR1 = [
          'a',
          'b'
        ];

# print the @ARGV contents with arguments "a", "b", and "-w"

# note how the -w is not stolen by Perl if it follows arguments
# that Perl knows it doesn't want

> perl -MData:umper -e'print Dumper \@ARGV' a b -w
$VAR1 = [
          'a',
          'b',
          '-w'
        ];
Here is the final line that includes some <angle brackets>



除非您的 shell 限制了参数的数量或长度,不然您可以向 Perl 传递任意数量的参数。在 Perl 中打开神奇的文件句柄(filehandle)<>,这会将传送给 Perl 的每个参数作为文件名打开并逐行读取每个文件的内容。缺省情况下,$_ 变量会保存每一行。


Shell 使引号之间的所有内容都成为一个参数。这就是为什么在清单 1 中我们可以写成 -e'print Dumper \@ARGV' 并且 Perl 可以将其看成单个一行程序脚本的原因。单引号更好,因为使用单引号后您可以在一行程序内使用双引号。Perl 中的双引号用于解释双引号之间的任何内容。另一个示例或许会有助于进一步说明这一点:

清单 2. 单引号 vs. 双引号


# print the Perl process ID, followed by a newline
> perl -e'print "$$\n"'
2063

# error: the first two double quotes go together, the rest is passed
# to the script directly

> perl -e"print "$$\n""
Bareword found where operator expected at -e line 1, near "1895n"
        (Missing operator before n?)
syntax error at -e line 1, next token ???
Execution of -e aborted due to compilation errors.



用 bash 比用 tcsh 要好些,因为 bash 允许内部的双引号用 \ 字符进行转义。但是 shell 仍然在将双引号内的 $$ 传递给 Perl 之前对其进行解释。结论是:不要使用双引号来指定以 -e 开始的一行程序脚本参数。请参阅 perldoc perlrun 以获取更多的详细信息,但是您主要应清楚什么在系统上有效并坚持下去。


到目前为止您已经了解了 -e 和 -M 开关所起的作用:导入模块和运行语句。下面我列出了一些有用的其它开关;为了不把您搞糊涂,所以省略了那些更复杂的开关。请参阅 perldoc perlrun 以获取完整的列表和一些使用想法。


整洁性


-w
打开警告


-Mstrict
打开严格编译指示(pragma)


数据


-0
(这是个零)指定输入记录分隔符


-a
将数据分割成名为 @F 的数组


-F
指定分割时 -a 使用的模式(请参阅 perldoc -f split)


-i
在适当的位置编辑文件(请参阅 perldoc perlrun 以获取大量详细信息)


-n
使用 <> 将所有 @ARGV 参数当作文件来逐个运行


-p
和 -n 一样,但是还会打印 $_ 的内容


执行控制


-e
指定字符串以作为脚本(多个字符串迭加)执行


-M
导入模块


-I
指定目录以搜索标准位置前的模块


文件操作
假定您在一个目录中有一些文件需要用特定的方式重命名。例如,所有包含单词"aaa"的文件应进行重命名,用单词"bbb"进行代替。我们将不使用 Unix"mv"命令,因为用 Perl 的 rename() 函数来重命名文件已经相当不错了(请参阅 perldoc -f rename 以获取当使用 rename() 出问题时的详细信息)。


请参阅清单 3 以获取将文件从 aaa 重命名为 bbb 的一行程序脚本。


find . 命令打印出当前目录下的所有文件和目录列表。如果您只想要查看文件,那么就给 find 添加"-type f"参数。获取 find 的输出(一个文件列表)并将其传递给一行程序。


一行脚本使用 -ne 参数,该意味着它会被重写成:

清单 4. 将文件从 aaa 重命名为 bbb(已分解)


while (<>)
{
chomp;                                 # trim the newline from the filename
next unless -e;                        # the filename ($_) must exist
$oldname = $_;                         # $oldname is now $_
s/aaa/bbb/;                            # change all "aaa" to "bbb" in $_
next if -e;                            # the new filename mustn't exist
rename $oldname, $_;                   # rename the old to the new name
}



正如您所看到的那样,这是个相当复杂的七行脚本。-n 开关简化了很多东西。但是尽管如此,您还是必须知道 $_ 变量和 s/// 及 -e 运算符(请参阅 perldoc perlop 页面以获取详细信息)。File::Find 标准 Perl 模块本来可以代替 Unix find 命令用于进行文件查找,但是脚本也会随之变得太大而不再是一行程序了。


一行程序巧妙地平衡了有用性和复杂性,您必须准备好在需要时将它们重写成实际脚本,而不应让程序过于麻烦而无法控制。


下面是文件处理的另一个示例:用已知的命名结构浏览 MP3 文件的目录并抽取专辑名。让我们假设文件名是"Artist-Album-Track#-Song.mp3"。

清单 5. 查找 Artist-Album-Track#-Song.mp3 的专辑名


> find . -name "*.mp3" | perl -pe 's/.\/\w+-(\w+)-.*/$1/' | sort | uniq



这个脚本非常简单。它依靠 find 的行为,总是在每个文件名前打印"./"。随后它仅用专辑名代替 $_,并且 -p 开关自动打印专辑名。最后,按顺序的 sort 和 uniq 确保了重复的专辑名只打印一次。所有的 find、sort 和 uniq 调用都可以用 Perl 完成,但是在操作系统已经为我们编写了这一切时为何还烦恼呢?作为练习这会很有趣,但是实际上一行程序可能会变成 20-30 行不必要的代码。


让我们分解 Perl 脚本(用一种简化的方式 - 省略 -p 开关的一些复杂性):

清单 6. 查找 Artist-Album-Track#-Song.mp3 的专辑名(已分解)


while (<>)
{
s/.\/\w+-(\w+)-.*/$1/;                 # extract the album name into $_
} continue
{
print;                                 # print the album name
}



此外,请注意 Perl 是如何成为 find、sort 和 uniq 之间的中间工具的。不必尝试用 Perl 编写所有东西。您可以这么做,有时也必须这么做,但一行程序可以重用。还有,看看正则表达式是多么的简单。当然,如果 MP3 文件未正确命名,那么我们可能会获得一些异常的专辑名,但是这值得去尽力完善正则表达式吗?如果您需要做大量工作,那么或许该使用 CPAN MP3 ID3 标记模块,而不是解析文件名。要明白:在什么时候一行程序会成为一桩麻烦事,而不是一个工具。这就是我在前面说到在开始使用一行程序之前应该非常清楚 Perl 时所指的意思。在编程方法中使用所有工具会使您成为一名优秀的 Perl 程序员,同时也成为一名优秀的程序员。


数据操作
上面的概念同样适用于数据操作。您还应记住 -i 开关,因为它让您适当地编辑文件,极少有工具能完成这一任务。下面说的是您将如何编辑文件内容,用"bbb"代替每个"aaa":

清单 7. 编辑文件内容以用"bbb"替换"aaa"


> cat test
aaa
bbb
ccc
ddd
aaa
> perl -pi -e's/aaa/bbb/' test
> cat test
bbb
bbb
ccc
ddd
bbb



当然我们可以使用任何正则表达式来替换"aaa"。


请注意,我们使用 -p 开关为每行打印 $_。这是必需的,因为 Perl 脚本的输出就是文件的内容!这意味着我们可以玩一些有趣的小伎俩。例如:

清单 8. 在文件中插入行号


> perl -pi -e'$_ = sprintf "%04d %s", $., $_' test



这个脚本在文件中的每一行前面插入 4 位数的行号。如果您对查看语法感到头疼,那么盯着离您最近的人并问他们是否知道有关动物园里两头骆驼的笑话。他们会用重器敲您的头,这会暂时分散您头疼的感觉,之后您可以重新工作了。


现在要处理更棘手的事了。我们将使用 Uri Guttman 优秀的 File::ReadBackwards 模块反向查看日志文件以寻找某些有趣的事件(您必须从 CPAN 安装 File::ReadBackwards)。我们将搜索字符串"sshd"以查阅来自 sshd 守护程序的所有通知。

清单 9. 向后查看文件以寻找 sshd 消息


> perl -MFile::ReadBackwards -e'foreach my $name (@ARGV) \
   { $f = File::ReadBackwards->new($name) || next;       \
     while( $_ = $f->readline ) {print $_ if m/sshd/}}'  \
  /var/log/messages



每一行尾部的 \ 字符告知 shell 后面还有内容;该行还未结束。这个 3 行脚本在您必须将其重写成实际脚本前大约和一行程序一样大。通过保存这个文件中的所有行并反向打印它们,可以用更少的代码达到同样的效果,但是这不及 File:ReadBackwards 有效,后者实际上反向读取文件并在新行上停下来。通过命令行不太容易达到这个效果。


但是为何在此处停下来呢?让我们抽取 sshd 日志消息中所提及的所有 IP 地址。

清单 10. 反向查看文件以查找 sshd 消息中的 IP


> perl -MFile::ReadBackwards -e'foreach my $name (@ARGV) \
   { $f = File::ReadBackwards->new($name) || next;       \
     while( $_ = $f->readline ) \
     {print "$1\n" if m/sshd/ && m/connection from\D*([\d.]+)/ }}' \
  /var/log/messages



这十分糟糕!我们现在就将其移到实际脚本中。


请注意,上面的正则表达式如何只捕获"connection from"和一个非数字的字符串后面的数字和点。这还不完善,但是它在使用 IPv4 地址的实际情况中能很好地工作。您应该理解您的一行程序需要什么,并正确执行。不要在用过就丢弃的脚本的设计上花太多的功夫。您会感到很难过。相反,要清楚脚本何时不会被丢弃,并编写相应的代码!


实际示例
我的妻子曾经在 Windows 中重新命名我们在假期中拍摄的大量照片。类似于"Our Christmas Tree.jpg"这样的文件名很好。当我尝试运行 indexpage.pl - 一个创建用于图像集的 HTML 页面的 Perl 脚本时,这个脚本无法工作。作者没有仔细考虑过文件名,引号和空格引起了问题。


我使用了一个一行程序,而不是自己动手修正 indexpage.pl(这是个很好的练习,但是像我这样的人在凌晨两点是没空的)。请参阅清单 11 以获取重命名 JPG 文件的一行脚本。


这有些棘手,因为我在脚本中不能使用单引号。最后我使用了单引号的 ASCII 值 - 39,将单引号放在 $quote 变量中,并用它进行间接置换。


这打印出了一连串的"mv"命令,我可以检查它们以确保我做对了。最后,我将这些命令保存到一个文件中并使用 shell"source"命令运行文件中的每个命令。清单 12 显示了正在进行 JPG 重命名。


重命名后,indexpage.pl 脚本运行得很好。


结束语
我希望您现在能明白编写一行程序并不是那么容易的。在您接触一行程序之前先完善您的脚本编制技能,否则您在为使它们正确运行而进行的工作中会遇上许多麻烦。请确保您了解您的正则表达式、流控制和缺省变量操作。


使功能和易读性平衡。一行程序应该像原型那样被丢弃。否则您会再次看到它们,就像一只漂亮的狮子狗走掉了,回来的却是 Cujo。


一行程序的常规使用中所遇到的一些异常是可接受的。它们是一次性的东西,并非金字塔。


您永远不应立即运行一行程序;在您真正运行命令之前应该总是先打印出该命令会执行什么内容。这样您的头上会少很多白头发。


请省着点使用一行程序技能。对付这样的"野兽"时是最好不要掉以轻心。


最后,有一些趣事。一行程序是使 Perl 为您干苦差事的最好办法。查看专用于 Perl 的 Usenet 新闻组和邮件列表以获取一些看法和批评。


参考资料

通过单击本文顶部或底部的讨论参与有关本文的论坛。
CPAN 就是综合 Perl 档案网络(Comprehensive Perl Archive Network)。它旨在包含您需要的所有 Perl 资料。到 2001 年 1 月为止,它包含了 749 兆字节的信息,在全球有一百多个镜像站点。
访问 Perl.com 以获取 Perl 信息和相关参考资料。这个网站包含了 Perl 社团感兴趣的所有内容。
以下 perldoc 页面很有用:perlrun、perlop。
Programming Perl,第三版,由 Larry Wall、Tom Christiansen 和 Jon Orwant 合著(O'Reilly & Associates 2000),是现今最好的 Perl 指南,现在的最新版本是 5.005 和 5.6.0。
Unix Power Tools,第二版,由 Jerry Peek、Tim O'Reilly 和 Mike Loukides 合著(O'Reilly & Associates 1997),是着手学习 UNIX shell 和相关工具的极佳指南。虽然该书有点过时了,但仍然很优秀。
访问 O'Reilly & Associates - Programming Perl 和许多其它好书的出版社。

关于作者
Teodor Zlatanov 于 1999 年获得了波士顿大学计算机工程的硕士学位。他从 1992 年就开始担任程序员,使用过 Perl、Java、C 和 C++。他的兴趣在于有关文本解析、3 层客户机-服务器数据库体系结构、UNIX 系统管理、CORBA 和项目管理的开放源码工作。欢迎通过电子邮件提供建议和指正。可以通过 tzz@iglou.com 与 Teodor 联系。
 楼主| 发表于 2003-7-5 11:16:20 | 显示全部楼层

更多一行的perl脚本

通过描述从打印一系列行到从尾到头地列出文件内容,演示了如何更少地使用这些简洁的一行 Perl 脚本来做更多的事。

正如老读者可能已猜到的那样,本文是"一行程序 101"("功能丰富的 Perl"的上一篇专栏文章)的续篇。要理解这里的内容,务必要了解上篇文章,所以在继续阅读本文之前请看一下上篇文章。


本文的目的与上一篇相同,即要演示清晰且可重用的代码,而这些代码未必是某个程序的最简短或最有效的版本。记住了这一点,就让我们开始认识这些代码!


Tom Christiansen 的列表
几年前,Tom Christiansen 在 Usenet 上贴了一个一行程序列表,对于任何 Perl 程序员而言,该列表至今仍很有趣且有用。我们将以该列表为基础查看更复杂的一行程序;该完整列表可在 tomc.txt 文件中获得(请参阅参考资料以下载这个文件)。该列表与"One-liners 101"一文稍微有点重复,我将设法指出那些重复之处。


awk 常用于诸如将一个文本分解成几段之类的基本任务;Perl 擅长进行有目的的文本操作。因此,我们来查看第一个一行程序,它旨在将文本输入中的两列添加到脚本中。

清单 1. 象 awk 吗?

# add first and penultimate columns
# NOTE the equivalent awk script:
# awk '{i = NF - 1; print $1 + $i}'
perl -lane 'print $F[0] + $F[-2]'



那么这个小程序做了什么呢?几个开关是其神奇所在。-n 开关和 -a 开关使该脚本成为对输入的包装器,该包装器根据空格将输入组成 @F 数组;-e 开关对该包装器额外添加了一条语句。实际产生的有趣代码是:

清单 2:完整代码

while (<>)
{
  @F = split(' ');
  print $F[0] + $F[-2]; # offset -2 means "2nd to last element of the array"
}



另一个常见任务是打印两个标记之间或两个行号之间的文件内容。

清单 3:打印一系列行

# 1. just lines 15 to 17
perl -ne 'print if 15 .. 17'

# 2. just lines NOT between line 10 and 20
perl -ne 'print unless 10 .. 20'

# 3. lines between START and END
perl -ne 'print if /^START$/ .. /^END$/'

# 4. lines NOT between START and END
perl -ne 'print unless /^START$/ .. /^END$/'



清单 3 中第一个一行程序有个问题:它会遍历整个文件,即使它已找到所需范围的时候。第三个一行程序就没有这个问题,因为它将打印 START 标记和 END 标记之间的所有行。如果有八组 START/END 标记,那么第三个一行程序将打印所有八组标记中的行。


要防止出现第一个一行程序的效率低下很容易:就是使用 $. 变量,它会告知您当前的行。如果 $. 超过 15 就开始打印,而如果 $. 大于 17 就退出。

清单 4:更有效地打印数字范围中的行

# just lines 15 to 17, efficiently
perl -ne 'print if $. >= 15; exit if $. >= 17;'



打印已经讨论得够多了,让我们做一些编辑。勿庸置疑,如果您正在测试一行程序(特别是那些旨在修改数据的程序),那么您应该作备份。大多数程序员都认为细微的修改可能不会对一行程序产生显著改变;在编辑 Sendmail 配置或您的邮箱时可不要做那样的假设。

清单 5:进行适当编辑

# 1. in-place edit of *.c files changing all foo to bar
perl -p -i.bak -e 's/\bfoo\b/bar/g' *.c

# 2. delete first 10 lines
perl -i.old -ne 'print unless 1 .. 10' foo.txt

# 3. change all the isolated oldvar occurrences to newvar
perl -i.old -pe 's{\boldvar\b}{newvar}g' *.[chy]

# 4. increment all numbers found in these files
perl -i.tiny -pe 's/(\d+)/ 1 + $1 /ge' file1 file2 ....

# 5. delete all but lines between START and END
perl -i.old -ne 'print unless /^START$/ .. /^END$/' foo.txt

# 6. binary edit (careful!)
perl -i.bak -pe 's/Mozilla/Slopoke/g' /usr/local/bin/netscape



为什么 1 .. 10 指定的行号是从第 1 行到第 10 行?请阅读"perldoc perlop"手册页。基本上,.. 运算符在一个范围内迭代。因此,该脚本并不是数 10 个行,而是对 -n 开关生成的循环迭代 10 次(请参阅"perldoc perlrun"和清单 2,以获得该循环的示例)。


-i 开关的神奇之处在于它对 @ARGV 中的每个文件都用该脚本对该文件输出所产生的文件版本进行替代。因此,-i 开关使 Perl 成为可用于编辑文本的过滤器。不要忘了对 -i 开关使用备份选项。在 i 之后跟着一个扩展名将使用该扩展名对已编辑的文件作备份。


请注意 -p 开关和 -n 开关的使用。当您想显式打印数据时,使用 -n 开关。-p 开关隐式地将 print $_ 语句插入到 -n 开关所产生的循环中。因此,-p 开关更适用于对文件进行的完全处理,而 -n 开关更适用于选择性文件处理,这样的处理只需打印特定数据。


"One-liners 101"一文中也可以找到进行适当编辑的示例。


使文件内容反向排列并不是常见的任务,但是以下几个一行程序显示了 -n 开关和 -p 开关并不总是处理整个文件的最佳选择。

清单 6:文件颠倒排列的变化情况

# 1. command-line that reverses the whole input by lines
#    (printing each line in reverse order)
perl -e 'print reverse <>' file1 file2 file3 ....

# 2. command-line that shows each line with its characters backwards
perl -nle 'print scalar reverse $_' file1 file2 file3 ....

# 3. find palindromes in the /usr/dict/words dictionary file
perl -lne '$_ = lc $_; print if $_ eq reverse' /usr/dict/words

# 4. command-line that reverses all the bytes in a file
perl -0777e 'print scalar reverse <>' f1 f2 f3 ...

# 5. command-line that reverses each paragraph in the file but prints
#    them in order
perl -00 -e 'print reverse <>' file1 file2 file3 ....



如果您想将整个段落或整篇文件读入到单个字符串,那么 -0(零)标志非常有用。(它还可以使用任何字符数字,所以您可以将特殊字符用作标志。)在一个命令(-0777)中读取整个文件时要小心,因为大型文件将耗尽所有内存。如果您要从尾到头读取文件的内容(例如,为了分析日期从近到远排列的日志记录),那么使用 CPAN 模块 File::ReadBackwards。另请参阅"One-liners 101",其中显示了使用 File::ReadBackwards 进行日志记录分析的示例。


请注意清单 6 中第一和第二个脚本间的相似之处。不过,第一个脚本与第二个完全不同。区别在于 <> 在标量上下文中的使用(如第二个脚本中使用 -n)或在列表上下文中的使用(如第一个脚本所做的)。


第三个脚本是回文检测器,它最初没有 $_ = lc $_; 段。我添加了该段以捕捉那些类似"Bob"的不完全相同的回文。


我所添加的段也可以写成 $_ = lc;,但是我认为显式地声明 lc() 函数的对象使一行程序更清晰。


Paul Joslin 的列表
Paul Joslin 真好,给我发了一些他的一行程序,让我在本文中使用。

清单 7:用随机数重写

# replace string XYZ with a random number less than 611 in these files
perl -i.bak -pe "s/XYZ/int rand(611)/e" f1 f2 f3



这是一个过滤器,它将 XYZ 替代成小于 611(该数字是任意选择的)的随机数。请记住 rand() 函数返回 0 和该函数的参数之间的一个随机数。


请注意每次都会用不同的随机数来替代 XYZ,因为迭代每次都对"int rand(611)"求值。

清单 8:揭示几个文件的基本性质

# 1. Run basename on contents of file
perl -pe "s@.*/@@gio" INDEX

# 2. Run dirname on contents of file
perl -pe 's@^(.*/)[^/]+@$1\n@' INDEX

# 3. Run basename on contents of file
perl -MFile::Basename -ne 'print basename $_' INDEX

# 4. Run dirname on contents of file
perl -MFile::Basename -ne 'print dirname $_' INDEX



一行程序 1 和 2 是 Paul 编写的,而我用 File::Basename 模块对它们进行了重写,这就是 3 和 4。它们的目的很简单,但是任何系统管理员都会觉得这些一行程序很有用。

清单 9:移动或重命名,它们在 UNIX 中是完全相同的操作

# 1. write command to mv dirs XYZ_asd to Asd
# (you may have to preface each '!' with a '\' depending on your shell)
ls | perl -pe 's!([^_]+)_(.)(.*)!mv $1_$2$3 \u$2\E$3!gio'

# 2. Write a shell script to move input from xyz to Xyz
ls | perl -ne 'chop; printf "mv $_ %s\n", ucfirst $_;'



对于老用户或系统管理员,基于某种模式来重命名文件是个很常见的任务。上面的几个脚本将完成两类作业:将 _ 字符前的文件名部分删除,或更改每个文件名,以便其第一个字母依照 Perl ucfirst() 函数而变成大写。


有一个被 Vladimir Lanin 称为"mmv"的 UNIX 实用程序,它也很有趣。它允许您根据简单模式来重命名文件,而且它的功能大得惊人。请参阅参考资料部分,以获取该实用程序的链接。


我的某些脚本
下面并不是一个一行程序,但它是个相当有用的脚本,它在刚出现时充当一行程序。它与清单 7 的相似之处在于它替换了固定字符串,但诀窍在于替代该固定字符串的字符串本身在下次替换时又成了固定字符串。


这个想法来自很久以前某个新闻组上的一个贴子,但我没能找到其最初版本。倘若您要在您所有系统文件中对一个 IP 地址用另一个 IP 地址替代(例如,如果您缺省的路由器已更改了),则该脚本很有用。该脚本在要重写的文件列表中包含 $0(在 UNIX 中,通常是脚本的名称)。


这个脚本作为一行程序来说,最终被证实太复杂,所以在要修改系统文件时,需要提供有关要执行什么的消息。

清单 10:对一个 IP 地址用另一个地址替代

#!/usr/bin/perl -w

use Regexp::Common qw/net/; # provides the regular expressions for IP matching

my $replacement = shift @ARGV; # get the new IP address

die "You must provide $0 with a replacement string for the IP 111.111.111.111"
unless $replacement;

# we require that $replacement be JUST a valid IP address
die "Invalid IP address provided: [$replacement]"
unless $replacement =~ m/^$RE{net}{IPv4}$/;

# replace the string in each file
foreach my $file ($0, qw[/etc/hosts /etc/defaultrouter /etc/ethers], @ARGV)
{
# note that we know $replacement is a valid IP address, so this is
# not a dangerous invocation
my $command = "perl -p -i.bak -e 's/111.111.111.111/$replacement/g' $file";

print "Executing [$command]\n";
system($command);
}



请注意 Regexp::Common 模块的使用,它是当今任何 Perl 程序员都必不可少的资源。没有 Regexp::Common,您将耗费大量时间尝试手工匹配某个数字或其它常用模式,而且很可能出错。


结束语
感谢 Paul Joslin 给我发来他的一行程序列表。根据一行程序所崇尚的简明精神,我希望您参阅"One-liners 101",以获得有关一行 Perl 脚本的一些最终想法。


参考资料

下载 Tom Christiansen 的一行程序完整列表。

CPAN 拥有您可能一直想要的所有 Perl 模块。

到 Perl.com 获取更多 Perl 信息及相关参考资料。

File::ReadBackwards 模块让您可以反向读取文件内容。

Regexp::Common 模块提供了正则表达式来进行 IP 匹配。

最初的 mmv 程序让您根据简单模式来重命名文件。它非常有用。

请阅读 Ted 编写的"功能丰富的 Perl"系列的其它有关 Perl 的文章:
用 Perl 模块进行解析(developerWorks,2000 年 4 月)
Perl:化繁为简 (developerWorks,2000 年 6 月)
用 Perl 保存(developerWorks,2000 年 7 月)
编写说英语的 Perl 程序(developerWorks,2000 年 8 月)
《Programming Perl》第三版简介(developerWorks,2000 年 9 月)
轻松调试 Perl (developerWorks,2000 年 11 月)
用 Perl 进行应用程序配置(developerWorks,2000 年 10 月)
吸引 C 和 Java 程序员目光的 Perl 5.6 (developerWorks,2001 年 1 月)
程序员面向 Linux 的设置 (developerWorks,2001 年 3 月)
一行程序 101(developerWorks,2001 年 4 月)
使用 Perl 自动化 UNIX 系统管理(developerWorks,2001 年 7 月)
JAPH 的精致(developerWorks,2001 年 7 月)
Perl 用于实现遗传算法(developerWorks,2001 年 8 月)
用 Perl 读写 Excel 文件(developerWorks,2001 年 9 月)
介绍用于系统管理的 cfengine(developerWorks,2002 年 2 月)
用 Perl 进行应用程序配置,第 2 部分(developerWorks,2002 年 7 月)

在 developerWorks Linux 专区查找更多适用于 Linux 和 Perl 开发人员的参考资料。

关于作者
Teodor Zlatanov 1999 年毕业于波士顿大学,获得计算机工程硕士学位。他从 1992 年起成为程序员,使用的语言有 Perl、Java、C和 C++。他的兴趣在于文本解析、三层客户机-服务器数据库体系结构、UNIX 系统管理、CORBA 和项目管理方面的开放源码工作。可以通过 tzz@iglou.com 与 Teodor 联系
发表于 2003-7-5 11:43:39 | 显示全部楼层
不错,顶
 楼主| 发表于 2003-7-5 13:05:23 | 显示全部楼层
在命令行的操作中,perl,有很多值得我借鉴东西!是很值得学学的!当用shell感到麻烦的时候,试试perl吧~~;)
发表于 2003-7-5 15:33:01 | 显示全部楼层
IBM developerWorks, perl 专栏
 楼主| 发表于 2003-7-5 15:45:10 | 显示全部楼层
IBM developerWorks, perl 专栏
没错!
发表于 2003-7-7 12:55:01 | 显示全部楼层
请把文中的笑脸去了吧,别这么客气:p
 楼主| 发表于 2003-7-7 14:50:04 | 显示全部楼层
谢谢提醒
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表