中位数及带权中位数

信息学竞赛总是时不时与数学产生微妙的关系,中位数及带权中位数问题有时常常成为解题的关键,今日有时间,所以梳理一下。

先从一到简单的题看起:

士兵站队问题

在一个划分成网格的操场上,n个士兵散乱地站在网格点上。网格点由整数坐标(x,y)表示。士兵们可以沿网格边上、下、左、右移动一步,但在同一时刻任一网格点上只能有一名士兵。按照军官的命令,士兵们要整齐地列成一个水平队列,即排列成(x,y),(x+1,y),…,(x+n-1,y)。如何选择x和y的值才能使士兵们以最少的总移动步数排成一列。

分析:这个问题我们可以把X,Y分开看,两者互不影响。其实就是求所以横坐标的中点,也就是中位数,那么为什么呢?


我们可以把所选定的位置左右的两个点看成一对,只要所选位置在两者之间,那么长度恒等于两点的线性距离和,所以我们可以根据每一对不断缩小我们所选位置的范围,最后如果有奇数个点,那么就会在中间的那个点上,如果是偶数那么在中间两个数和他们所构成的区间,这样想就容易发现中位数这一规律了。

[cpp]  view plain  copy
  1. #include<iostream>  
  2. #include<cstdio>  
  3. #include<algorithm>  
  4. using namespace std;  
  5. int x[10010],y[10010];  
  6. int main()  
  7. {  
  8.     freopen("sol.in","r",stdin);  
  9.     freopen("sol.out","w",stdout);  
  10.     int n,i,sum=0,s;  
  11.     cin>>n;  
  12.     for (i=1;i<=n;i++)  
  13.       scanf("%d%d",&x[i],&y[i]);  
  14.     sort(x+1,x+n+1);  
  15.     sort(y+1,y+n+1);  
  16.     s=y[(1+n)/2];  
  17.     for (i=1;i<=n;i++)  
  18.       sum+=abs(y[i]-s);  
  19.     for (i=1;i<=n;i++)  
  20.       x[i]-=i;  
  21.     sort(x+1,x+n+1);  
  22.     s=x[(1+n)/2];  
  23.     for (i=1;i<=n;i++)  
  24.       sum+=abs(x[i]-s);  
  25.     cout<<sum<<endl;  
  26.     fclose(stdin);  
  27.     fclose(stdout);  
  28.     return 0;  
  29. }  

再看看中位数与动归结合的应用:

[问题描述]

一些村庄被建在一条笔直的高速公路边上。我们用一条坐标轴来描述这条高速公路,每一个村庄的坐标都是整数。没有两个村庄坐标相同。两个村庄间的距离,定义为它们坐标值差的绝对值。

人们需要在一些村庄建立邮局——当然,并不是每一个村庄都必须建立邮局。邮局必须被建在村庄里,因此它的坐标和它所在的村庄坐标相同。每个村庄使用离它最近的那个邮局,建立这些邮局的原则是:所有村庄到各自所使用的邮局的距离总和最小。

你的任务是编写一个程序,在给定了每个村庄的坐标和将要建立的邮局数之后,按照上述原则,合理地选择这些邮局的位置。

输入文件的文件名是post.in

文件的第输入文件中同一行相邻两项之间用一个或多个空格隔开。

一行是包含两个整数:第一个整数是村庄的数目V,1〈=V〈=300,第二个整数是将建立的邮局数P,1〈=P〈=30且P〈=V。

文件的第二行按照递增顺序列出了V个整数。这V个整数分别表示了各村庄的位置坐标。对于每一个位置坐标X,1〈=X〈=10000。

输出文件名是post.out

文件的第一行是一个整数S,表示你所求出的所有村庄到离它最近邮局的距离的总和。

相应地,文件的第二行按照递增顺序列出了P个整数,分别表示你所求出每个邮局的建立位置。虽然对于同一个S,可能会有多种邮局建立的方案,但只需输出邮局位置尽量靠前的一组。

Example

Post.in

10   5

1 2 36 7 9 11 22 44 50

Post.out

9

2 7 2244 50 

这一道题是很经典的区间动态规划题,在预处理中就用到了上述思想。

[cpp]  view plain  copy
  1. #include<iostream>  
  2. #include<cstdio>  
  3. #include<cmath>  
  4. using namespace std;  
  5. int n,m,len[320][320],f[320][320],a[320],s[320][320],m1[320][320];  
  6. void print(int x,int y)  
  7. {  
  8.     if (x==0)  
  9.      return;  
  10.     print(x-1,s[x][y]);  
  11.     printf("%d ",a[m1[s[x][y]+1][y]]);  
  12. }  
  13. int main()  
  14. {  
  15.     freopen("post.in","r",stdin);  
  16.     freopen("post.out","w",stdout);  
  17.     int i,j,k;  
  18.     scanf("%d%d",&n,&m);  
  19.     for (i=1;i<=n;i++)  
  20.       scanf("%d",&a[i]);  
  21.     for (i=1;i<=n;i++)  
  22.       for (j=i;j<=n;j++)  
  23.         {  
  24.             m1[i][j]=(i+j)/2;  
  25.             int temp1=0;  
  26.             for (k=i;k<=j;k++)  
  27.               {  
  28.                 len[i][j]+=abs(a[k]-a[m1[i][j]]);  
  29.               }  
  30.               
  31.         }  
  32.     memset(f,127,sizeof(f));  
  33.     for (i=1;i<=n;i++)  
  34.       {  
  35.         f[1][i]=len[1][i];  
  36.         s[1][i]=0;  
  37.       }  
  38.     for (i=2;i<=m;i++)  
  39.       for (j=i;j<=n;j++)  
  40.         for (k=i-1;k<=j-1;k++)  
  41.            if (f[i][j]>f[i-1][k]+len[k+1][j])  
  42.              {  
  43.                 f[i][j]=min(f[i][j],f[i-1][k]+len[k+1][j]);  
  44.                 s[i][j]=k;  
  45.              }  
  46.     cout<<f[m][n]<<endl;  
  47.     print(m,n);  
  48.     return 0;   
  49. }  
中位数解决了,那么就来看一下带权中位数问题,这个问题如果不知道,一定会觉得某些题十分的高大上,无从下手。例如



典型的带权中位数问题,把平面转成线性即可。为何带权中位数问题就是就权值的中位数呢,我们可以这么想,不带权的相当于权为1,每个点只有一个人,那么带权就相当每个点有该点权值个人,这样理解就与上面的思路神合了
ps:证明过程
若最优点在T
则有:
∑{D*DIST(I,T)}(I<>T)<=∑{D*DIST(I,T+1)}(I<>T+1)
将此式化为:
∑{D[L]}*DIST(L,T)}+∑{D[R]*DIST(R,T)}+D[T+1]*DIST(T+1,T)
<=∑{D[L]}*DIST(L,T+1)}+∑{D[R]*DIST(R,T+1)}+D[T]*DIST(T,T+1) (L<T&R>T+1)
即:
∑{D[L]*DIST(L,T+1)}-∑{D[L]*DIST(L,T)}(L<T)+D[T]*(DIST(T,T+1))>=∑{D[R]*DIST(R,T)}-∑(D[R]*DIST(R,T+1))(R>T+1)+D[T+1]*(DIST(T,T+1))进一步化简为:
∑{D[L]*(DIST(L,T)-DIST[L,T+1])}(L<=T)<=∑{D[R]*(DIST(R,T+1)-DIST(R,T))}(R>=T+1)∵DIST(L,T)-DIST(L,T+1)=DIST(T,T+1)
DIST(R,T+1)-DIST(R,T)=DIST(T+1,T)
OBVIOUSLY : DIST(T,T+1)=DIST(T+1,T)
因此:
∑D[L](L<=T)>=∑(D[R])(R>=T+1)
即:∑D[L](L<T)+D[T]>=∑(D[R])(R>T)
因此我们发现,若T是最优点,则必有其左边的权值和加上D[T]后大于右边的权值和
而类似的,我们可以证明其右边的权值和加上D[T]后大于左边的权值和
因此我们要找的点也就是满足以上条件的点。
注意到此时我们的选择已经和具体的位置(坐标)没有关系了,而成为主要考虑因素的仅仅是各点上的权值。
因为左边的权值和数+D[T]>=右边的权值和,那么:
LEFTSUM+D[T]>=RIGHTSUM=SUMALL-(LEFTSUM+D[T])
=>2*(LEFTSUM+D[T])>=SUMALL
=>2*RIGHTSUM<=SUMALL
同理可得:
RIGHTSUM+D[T]>=LEFTSUM=SUMALL-(RIGHTSUM+D[T])
=>2*(RIGHTSUM+D[T])>=SUMALL
=>2*LEFTSUM<=SUMALL
此时我们发现:
2*LEFTSUM<=SUMALL 而 2*(LEFTSUM+D[T])>=SUMALL
也即是说当前的位置T上的数包含了第[(SUMALL)/2]个数,由开篇的简述可知,这第[(SUMALL)/2]个数,就是这个序列中的带权中位数。所以这一类问题,实质上就是带权中位数问题。
[cpp]  view plain  copy
  1. #include<iostream>  
  2. #include<cstdio>  
  3. #include<cstring>  
  4. #include<cmath>  
  5. #include<algorithm>  
  6. using namespace std;  
  7. struct data  
  8. {  
  9.  int x,y,w;  
  10. };data num[50003];  
  11. int n,i,j,k;  
  12. double sum,ans,xx,yy;  
  13. int xl,yl;  
  14. int cmp(data a,data b)  
  15. {  
  16.     return a.x<b.x;  
  17. }  
  18. int cmp1(data a,data b)  
  19. {  
  20.     return a.y<b.y;  
  21. }  
  22. int main()  
  23. {  
  24.     freopen("ball.in","r",stdin);  
  25.     freopen("ball.out","w",stdout);  
  26.     scanf("%d",&n);  
  27.     sum=ans=xx=yy=0;  
  28.     for (i=1;i<=n;i++)  
  29.      {  
  30.      scanf("%d",&num[i].w);  
  31.      sum+=num[i].w;  
  32.      }  
  33.     for (i=1;i<=n;i++)  
  34.      scanf("%d%d",&num[i].x,&num[i].y);  
  35.     sort(num+1,num+n+1,cmp);  
  36.     double mid=sum/2;  
  37.     for (i=1;i<=n;i++)  
  38.      {  
  39.         xx+=num[i].w;  
  40.         if (xx>mid)  
  41.          {  
  42.             xl=num[i].x;  
  43.             break;  
  44.          }  
  45.      }  
  46.     for (i=1;i<=n;i++)  
  47.      ans+=num[i].w*(abs(num[i].x-xl));  
  48.     sort(num+1,num+n+1,cmp1);  
  49.     for (i=1;i<=n;i++)  
  50.      {  
  51.         yy+=num[i].w;  
  52.         if (yy>mid)  
  53.          {  
  54.             yl=num[i].y;  
  55.             break;  
  56.          }  
  57.      }  
  58.     for (i=1;i<=n;i++)  
  59.      ans+=num[i].w*(abs(num[i].y-yl));  
  60.     printf("%0.2lf",ans);  

猜你喜欢

转载自blog.csdn.net/dk1543100966/article/details/77199826