Linux培训
达内IT学院

400-996-5531

如何使用Linux做高效的数据统计?


今天小编要跟大家分享的文章是关于如何使用Linux做高效的数据统计?正在使用Linux系统工作和刚刚接触Linux系统的小伙伴们是否对此有所了解呢?想要使用Linux做高效的数据统计首先要为大家介绍一个命令。

wc(world count)是一个统计文件字词,字节,行数的命令,它可以帮我们非常方便的统计以上信息。

如何使用Linux做高效的数据统计?

常见参数如下:

· -c 统计字节数。

· -l 统计行数。

· -m 统计字符数。这个标志不能与 -c 标志一起使用。

· -w 统计字数。注意,这里的字指的是由空格,换行符等分隔的字符串。

我们接下来直接看几个实例。

一、统计文件行数,词数和字节数

$ wc test.txt

1 1 7 test.txt

打印结果表明该文件有1行,1个词,7字节。

要特别提醒的是,这里的词是以空格,换行符等分隔开的字符串,也就是说

words 字词

这里只有两个词。

二、仅统计文件行数,词数,字符数或字节数

仅统计单项内容时,仅需要带上对应的参数即可,例如:

$ wc -l test.txt

1 test.txt

使用-l参数,使得只显示行数。

但是这里特别要注意的是字符数和字节数的区别。字节数是数据占用的空间大小,而一个字符可能占多个字节,例如,UTF-8编码中,一个英文字母就是一个字符,占用空间一个字节,而一个中文,则占用3字节大小。

举个例子:

编程

编程,在这里是两个字符,而占用空间是6字节,但是使用wc -m统计会比两个多一个,是3个字符。

$ echo 编程|wc -m

3

$ echo 编程|wc -c

7

各编码字符占用字符情况如下:

编码英文字母中文

UTF-81字节3字节

Unicode1字节2字节

你可以使用:

$ echo $LANG

en_GB.UTF-8

查看编码格式。

三、统计命令执行结果数量

实际上个人认为,最常用的还是-l参数,它用来统计文件或标准输出有多少行,那么实际上就可以用来做很多统计的事情了。

例如,统计当前目录下有多少个普通文件:

$ ls -l

total 4

-rw-rw-r-- 1 hyb hyb 0 3月 21 20:32 test2.txt

-rw-rw-r-- 1 hyb hyb 13 3月 21 20:18 test.txt

$ ls -l |grep "^-"|wc -l

2

可以得到文件数量为2。grep "^-"的意思是,获取哪些以-开头的行,因为普通文件都是以-开头的。

当然如果想统计包括子目录的总文件数量,可以加上-R参数:

ls -lR |grep "^-"|wc -l

再例如,查看chrome相关进程数量:

$ ps -ef|grep google|grep -v grep |wc -l

23

类似这样的用法还有很多,只要你想统计都可以做。

这里再多说两句:

· |是管道符,ls -l|wc -l表示将ls -l的结果传给wc命令处理

· grep用于文本查找,grep "a",表明查找包含a的行,而grep -v "b",表明过滤包含b的行。

总结

wc命令可用于统计行数,字节数和字符数等,而用于统计命令执行结果的数量的时候非常有效。

以上就是小编今天为大家分享的关于如何使用Linux做高效的数据统计?的文章,希望本篇文章能够对正在从事Linux相关工作的小伙伴们有所帮助。想要了解更多Linux相关知识记得关注达内Linux培训官网。最后祝愿小伙伴们工作顺利哦。

文章来源:守望【编程珠玑】

【免责声明:本文图片及文字信息均由小编转载自网络,旨在分享提供阅读,版权归原作者所有,如有侵权请联系我们进行删除。】

预约申请免费试听课

填写下面表单即可预约申请免费试听! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!

上一篇:云计算的时代已经到了,你准备好了吗?
下一篇:Linux入门必看的Is命令实用范例!

运维培训班出来好找活吗?

新能源运维工程师是干什么的

云计算就业岗位有哪些?

学物联网工程好就业吗?

Copyright © 2023 Tedu.cn All Rights Reserved 京ICP备08000853号-56 京公网安备 11010802029508号 达内时代科技集团有限公司 版权所有

选择城市和中心
黑龙江省

吉林省

河北省

湖南省

贵州省

云南省

广西省

海南省