科技常识:linux awk 数组排序多种实现方法

2021-06-24 17:15:45
导读 今天小编跟大家讲解下有关科技常识:linux awk 数组排序多种实现方法,相信小伙伴们对这个话题应该也很关注吧,小编也收集到了有关科技常

今天小编跟大家讲解下有关科技常识:linux awk 数组排序多种实现方法,相信小伙伴们对这个话题应该也很关注吧,小编也收集到了有关科技常识:linux awk 数组排序多种实现方法的相关资料,希望小伙伴会喜欢也能够帮助大家。

复制代码代码如下:[chengmo@localhost ~]$ awk 'BEGIN{info ="this is a test";split(info,tA,"");for(k in tA){print k,tA[k];}}'4 test1 this2 is3 a

如果需要按照顺序输出,通过键值定位方式输出。

复制代码代码如下:[chengmo@localhost ~]$ awk 'BEGIN{info ="this is a test";slen=split(info,tA,"");for(i=1;i<=slen;i++){print i,tA[i];}}' 1 this2 is3 a4 test

一、通过内置函数(asort,asorti使用) awk 3.1以上版本才支持

1、asort使用说明 srcarrlen=asort[srcarr,dscarr] 默认返回值是:原数组长度,传入参数dscarr则将排序后数组赋值给dscarr. 复制代码代码如下:[chengmo@localhost ~]$ awk 'BEGIN{a[100]=100;a[2]=224;a[3]=34;slen=asort(a,tA);for(i=1;i<=slen;i++){print i,tA[i];}}'1 342 1003 224

asort只对值进行了排序,因此丢掉原先键值。

2、asorti 使用说明

复制代码代码如下:[chengmo@localhost ~]$ awk 'BEGIN{a["d"]=100;a["a"]=224;a["c"]=34;slen=asorti(a,tA);for(i=1;i<=slen;i++){print i,tA[i],a[tA[i]];}}'1 a 2242 c 343 d 100

asorti对键值 进行排序(字符串类型),将生成新的数组放入:tA中。

二、通过管道发送到sort排序

复制代码代码如下: [chengmo@localhost ~]$awk 'BEGIN{a[100]=100;a[2]=224;a[3]=34;for(i in a){print i,a[i] |"sort -r -n -k2";}}'2 224100 1003 34

通过管道,发送到外部程序“sort”排序,-r 从大到小,-n 按照数字排序,-k2 以第2列排序。通过将数据丢给第3方的sort命令,所有问题变得非常简单。如果以key值排序 –k2 变成 -k1即可。

复制代码代码如下:[chengmo@localhost ~]$ awk 'BEGIN{a[100]=100;a[2]=224;a[3]=34;for(i in a){print i,a[i] |"sort -r -n -k1";}}'100 1003 342 224

三、自定义排序函数

awk自定义函数结构:

复制代码代码如下:function funname(p1,p2,p3){ staction; return value; }</p><p>以上是:awk自定义函数表示方式,默认传入参数都是以引用方式传入,return值,只能是字符型或者数值型。 不能返回数组类型。 如果返回数组类型。需要通过形参 方式传入。再获得。</p><p>awk返回数组类型</p><p>awk 'function test(ary){ for(i=0;i<10;i++){ ary[i]=i; } return i;}BEGIN{ n=test(array); for(i=0;i<n;i++){ print array[i]; }}'

排序函数

复制代码代码如下:#arr 传入一维数组 </p><p>#key 排序类型 1是按照值排序 2按照键值 </p><p>#datatype 比较类型 1按照数字排序 2按照字符串排序 </p><p>#tarr 排序返回的数组 </p><p>#splitseq 分割字符串 数组中键与值之间分割字符串 </p><p>#return 数组长度 </p><p>#实现思路,将原始数组a[‘a’]=100 排序后变成 a[1]=a分隔符100 ,然后按照下标递归显示内容。 本排序使用冒泡方式进行。 </p><p> </p><p>function sortArr(arr,key,datatype,tarr,splitseq){ </p><p> if(key ~ /[^1-2]/) {return tarr;} for(k in arr) { tarr[++alen]=(k""splitseq""arr[k]); } </p><p> for(m=1;m<=alen;m++) { for(n=1;n<=alen-m-1;n++) { split(tarr[m],tm,splitseq); split(tarr[n+1],tn,splitseq); </p><p> tnum=tarr[m]; if(datatype==1) { if(tm[key]+0<tn[key]+0) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } else { if((tm[key]"") < (tn[key]"")) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } } } return alen;}

完整代码如下:

复制代码代码如下:[chengmo@centos5 ~]$ awk 'BEGIN{a["a"]=100;a["b"]=110;a["c"]=10;splitseq="%%";alen=sortArr(a,2,1,tarr,splitseq);for(m=1;m<=alen;m++){ split(tarr[m],ta,splitseq); print m,ta[1],ta[2];}}function sortArr(arr,key,datatype,tarr,splitseq){ </p><p> if(key ~ /[^1-2]/) {return tarr;} for(k in arr) { tarr[++alen]=(k""splitseq""arr[k]); } </p><p> for(m=1;m<=alen;m++) { for(n=1;n<=alen-m-1;n++) { split(tarr[m],tm,splitseq); split(tarr[n+1],tn,splitseq); </p><p> tnum=tarr[m]; if(datatype==1) { if(tm[key]+0<tn[key]+0) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } else { if((tm[key]"") < (tn[key]"")) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } } } return alen;}' </p><p>1 b 1102 a 1003 c 10

以上是awk数组排序一些方法。对于少量数据排序,就性能而言,使用自定义函数性能要高,不需要另外再开启进程。对于大量数据,排序第2种方法还是很不错的。

来源:爱蒂网

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章