最短距离计算文档.docx

资源描述

最短距离计算文档.docx

《最短距离计算文档.docx》由会员分享，可在线阅读，更多相关《最短距离计算文档.docx（21页珍藏版）》请在冰豆网上搜索。

最短距离计算文档.docx

最短距离计算文档

最短距离计算

1问题说明

1某公司国内市场IC与PC各占一半，规定了它们的支点位置，IC的支点总在PC的支点左边

2（x1,y1）与（x2,y2）之间的距离定义为|x1–x2|+|y1–y2|.

3IC与PC支点间的位置集合为I和P，计算出i∈I,p∈P的所有点的最短距离.

例如：

蓝色为IC支点，红色为PC支点。

IC与PC之间的最短距离为5

2输入

1FileName？

data.txt

2data.txt文件在下面内容中顺次储存

-属于I的点的数n（1≤n≤100,000）

-（x,y）储存n个（-106≤x≤106,-106≤y≤106）,x与y是整数

-属于P的点的数n（1≤n≤100,000）

-（x,y）储存m个（-106≤x≤106,-106≤y≤106）,x与y是整数

3使用fopen与fscanf函数，读出在data.txt文件储存的内容

3输出

1I与P之间最短距离与形成最短距离的两个点i与p的坐标

2程序所要时间（使用clock函数计算）

4作业评价方法（两个程序都提交的话满分30分）

1程序1：

具体体现出I的所有点（n个）与P的所有点（m个）之间的比较计算时（10分）

2程序2：

改善程序1的缺点的算法具体体现时（20分）

-100000个坐标各个输入时，程序1的实行时间与程序2的实行时间比较时要有悬殊的差异。

-改善的算法的基本概念做成文书

5实行的例子

参考文献：

寻找满足条件的子序列（之二）：

将一个集合拆分为和相同/最接近的两个子集

（1）

上面我们谈到的问题“从一个数组中取得和为C的两个数”，数组可以理解为一个集合，集合也可以理解为一个数组，我们引入下面一个问题：

有一个包含n个正整数元素的集合，能否将其拆分为两个子集A,B，使A中元素之和与B中元素之和相等？

其实该问题只要找出一个集合即可，可以变换为：

有一个包含n个整数元素的集合U，存不存在一个子集A，是自己A的元素之和为U中元素之和的一半？

用数组array[n]来表示集合U，则U元素之和sum=array[0]+array[1]+…+array[n-1]。

那么只要判定是否存在子集A，A中元素之和为sum/2。

这个问题类似于背包问题，先让我们回顾一下背包问题，背包问题可以表述为：

有n个宝物，每个宝物有容积v和价值e属性，现有一个背包容积为V，问如何取宝物才可以保证背包中宝物价值最大。

背包问题动态规划方法：

S[i][v]表示对于前k个元素，背包总空间为v的情况下可以存放宝物的最大价值。

v[i]表示元素i的体积，e[i]表示元素i的价值，元素下表设为从0开始。

S[i][v]=max{S[i-1][v],S[i-1][v-v[i]]]+e[i]}i>=1andv>v[i]

S[0][v]=0ifv

S[0][v]=e[0]ifv>=v[0]

当前问题可以表述成，一个背包容积为sum/2，可否用宝物将其装满？

其实问题比背包问题还要简单许多：

设isOk[i][v]：

前i个元素可否将空间v装满，true?

false。

问题可以表述为：

ifi>=1andi<=n-1

ifv>=v[i]

isOk[i][v]=isOk[i-1][v]||isOk[i-1][v-[v[i]]]

else

isOk[i][v]=isOk[i-1][v]

isOk[0][v]=falseifv!

=v[0]

isOk[0][v[0]]=true

isOk[0][0]=true蕴含着isOk[k][0]的意思

代码如下：

boolexist（int*v,intlen）

{

/*初始化*/

intsum=0;

for（inti=0;i

{

sum+=v[i];

}

inthalf=sum/2;

int**isOk=newint[len][half+1];

for（inti=0;i

{

for（intk=0;k

{

if（i==0&&（k==0||k==v[0]））

isOk[i][k]=true;

else

isOk[i][k]=false;

}

/*算法主体*/

for（inti=1;i

{

for（intk=0;k<=half;k++）

{

if（k>=v[i]）

{

isOk[i][k]=isOk[i-1][k]||isOk[i-1][k-v[i]];

}else

{

isOk[i][k]=isOk[i-1][k];

}

returnisOk[len-1][half];

}

如果我们要找和最接近中位数的集合元素之和，这一表述与两个子集合元素和之差最小其实一致，我们需要怎么做呢？

先来证明上述表述：

假设集合U被分为子集A，B，那么：

half=sum（U）/2

sum（A）+sum（B）=sum（U）=2*half

假设sum（A）

B=U-A。

所以，我们只要求和在[0,half]范围内的子集A即可，B集合元素之和与half的差必与half和集合A元素之和差绝对值相等，只要|half-sum（A）|最小，那么|sum（B）-sum（A）|最小。

要找最接近中位数的集合元素之和，我们可以使用上述算法，在更新完isOk[][]之后，只要扫描一遍isOk[len-1][s]找出s最靠近half且isOk[len-1][s]=true，返回s即可。

该方法的时间复杂度O（n*half），空间复杂度也是O（n*half），在实际应用中，half不应该过大，否则内存会难以容纳，比如对于集合：

U{10^9+1,1,10^8+2}，对于这种情况穷举各种可能性即可。

但是我们只找到了有没有满足条件的子集，却没有找出子集的元素包含哪些元素，下一篇我们再继续探讨该问题。

问题：

找出二个集合S1与S2之间的最接近点对的距离

这个问题很容易理解，似乎也不难解决。

我们只要将S1每一点与S2每一个的距离算出，找出达到最小距离的两个点即可。

然而，这样做效率太低，需要O（n2）的计算时间。

在问题的计算复杂性中我们可以看到，一个集合S找出最接近点对的计算时间下界为Ω（nlogn）。

这个下界引导我们去找这个问题的一个θ（nlogn）算法。

一．先讨论一个集合最接近点对的情况（参考《计算机算法设计与分析》）

这个问题显然满足分治法的第一个和第二个适用条件，我们考虑将所给的平面上n个点的集合S分成2个子集S1和S2，每个子集中约有n/2个点，·然后在每个子集中递归地求其最接近的点对。

在这里，一个关键的问题是如何实现分治法中的合并步骤，即由S1和S2的最接近点对，如何求得原集合S中的最接近点对，因为S1和S2的最接近点对未必就是S的最接近点对。

如果组成S的最接近点对的2个点都在S1中或都在S2中，则问题很容易解决。

但是，如果这2个点分别在S1和S2中，则对于S1中任一点p，S2中最多只有n/2个点与它构成最接近点对的候选者，仍需做n2/4次计算和比较才能确定S的最接近点对。

因此，依此思路，合并步骤耗时为O（n2）。

整个算法所需计算时间T（n）应满足:

　 T（n）=2T（n/2）+O（n2）

它的解为T（n）=O（n2），即与合并步骤的耗时同阶，显示不出比用穷举的方法好。

从解递归方程的套用公式法，我们看到问题出在合并步骤耗时太多。

这启发我们把注意力放在合并步骤上。

为了使问题易于理解和分析，我们先来考虑一维的情形。

此时S中的n个点退化为x轴上的n个实数x1,x2,..,xn。

最接近点对即为这n个实数中相差最小的2个实数。

我们显然可以先将x1,x2,..,xn排好序，然后，用一次线性扫描就可以找出最接近点对。

这种方法主要计算时间花在排序上，因此如在排序算法中所证明的，耗时为O（nlogn）。

然而这种方法无法直接推广到二维的情形。

因此，对这种一维的简单情形，我们还是尝试用分治法来求解，并希望能推广到二维的情形。

假设我们用x轴上某个点m将S划分为2个子集S1和S2，使得S1={x∈S|x≤m}；S2={x∈S|x>m}。

这样一来，对于所有p∈S1和q∈S2有p

递归地在S1和S2上找出其最接近点对{p1,p2}和{q1,q2}，并设δ=min{|p1-p2|,|q1-q2|}，S中的最接近点对或者是{p1,p2}，或者是{q1,q2}，或者是某个{p3,q3}，其中p3∈S1且q3∈S2。

如图1所示。

图1一维情形的分治法

我们注意到，如果S的最接近点对是{p3,q3}，即|p3-q3|<δ，则p3和q3两者与m的距离不超过δ，即|p3-m|<δ，|q3-m|<δ，也就是说，p3∈（m-δ,m]，q3∈（m,m+δ]。

由于在S1中，每个长度为δ的半闭区间至多包含一个点（否则必有两点距离小于δ），并且m是S1和S2的分割点，因此（m-δ,m]中至多包含S中的一个点。

同理，（m,m+δ]中也至多包含S中的一个点。

由图1可以看出，如果（m-δ,m]中有S中的点，则此点就是S1中最大点。

同理，如果（m,m+δ]中有S中的点，则此点就是S2中最小点。

因此，我们用线性时间就能找到区间（m-δ,m]和（m,m+δ]中所有点，即p3和q3。

从而我们用线性时间就可以将S1的解和S2的解合并成为S的解。

也就是说，按这种分治策略，合并步可在O（n）时间内完成。

这样是否就可以得到一个有效的算法了呢？

还有一个问题需要认真考虑，即分割点m的选取，及S1和S2的划分。

选取分割点m的一个基本要求是由此导出集合S的一个线性分割，即S=S1∪S2，S1∩S2=Φ，且S1{x|x≤m}；S2{x|x>m}。

容易看出，如果选取m=[max（S）+min（S）]/2，可以满足线性分割的要求。

选取分割点后，再用O（n）时间即可将S划分成S1={x∈S|x≤m}和S2={x∈S|x>m}。

然而，这样选取分割点m，有可能造成划分出的子集S1和S2的不平衡。

例如在最坏情况下，|S1|=1，|S2|=n-1，由此产生的分治法在最坏情况下所需的计算时间T（n）应满足递归方程:

T（n）=T（n-1）+O（n）

它的解是T（n）=O（n2）。

这种效率降低的现象可以通过分治法中“平衡子问题”的方法加以解决。

也就是说，我们可以通过适当选择分割点m，使S1和S2中有大致相等个数的点。

自然地，我们会想到用S的n个点的坐标的中位数来作分割点。

在选择算法中介绍的选取中位数的线性时间算法使我们可以在O（n）时间内确定一个平衡的分割点m。

至此，我们可以设计出一个求一维点集S中最接近点对的距离的算法CPAIR1如下。

functionCPAIR1（S）;

begin

if|S|=2thenδ=|x[2]-x[1]|//x[1..n]存放的是S中n个点的坐标

elseif（|S|=1）

thenδ:

=∞

elsebegin

=S中各点的坐标值的中位数;

构造S1和S2,使S1={x∈S|x≤m}，S2={x∈S|x>m};

δ1:

=CPAIRI（S1）;

δ2:

=CPAIRI（S2）;

=max（S1）;

=min（S2）;

δ:

=min（δ1,δ2,q-p）;

end;

return（δ）;

end;

由以上的分析可知，该算法的分割步骤和合并步骤总共耗时O（n）。

因此，算法耗费的计算时间T（n）满足递归方程：

解此递归方程可得T（n）=O（nlogn）。

这个算法看上去比用排序加扫描的算法复杂，然而这个算法可以向二维推广。

下面我们来考虑二维的情形。

此时S中的点为平面上的点，它们都有2个坐标值x和y。

为了将平面上点集S线性分割为大小大致相等的2个子集S1和S2，我们选取一垂直线l:

x=m来作为分割直线。

其中m为S中各点x坐标的中位数。

由此将S分割为S1={p∈S|px≤m}和S2={p∈S|px>m}。

从而使S1和S2分别位于直线l的左侧和右侧，且S=S1∪S2。

由于m是S中各点x坐标值的中位数，因此S1和S2中的点数大致相等。

递归地在S1和S2上解最接近点对问题，我们分别得到S1和S2中的最小距离δ1和δ2。

现设δ=min（δ1,δ1）。

若S的最接近点对（p,q）之间的距离d（p,q）<δ则p和q必分属于S1和S2。

不妨设p∈S1，q∈S2。

那么p和q距直线l的距离均小于δ。

因此，我们若用P1和P2分别表示直线l的左边和右边的宽为δ的2个垂直长条，则p∈S1，q∈S2，如图2所示。

图2距直线l的距离小于δ的所有点

在一维的情形，距分割点距离为δ的2个区间（m-δ,m]（m,m+δ]中最多各有S中一个点。

因而这2点成为唯一的末检查过的最接近点对候选者。

二维的情形则要复杂些，此时，P1中所有点与P2中所有点构成的点对均为最接近点对的候选者。

在最坏情况下有n2/4对这样的候选者。

但是P1和P2中的点具有以下的稀疏性质，它使我们不必检查所有这n2/4对候选者。

考虑P1中任意一点p,它若与P2中的点q构成最接近点对的候选者，则必有d（p,q）<δ。

满足这个条件的P2中的点有多少个呢？

容易看出这样的点一定落在一个δ×2δ的矩形R中，如图3所示。

图3包含点q的δ×2δ的矩形R

由δ的意义可知P2中任何2个S中的点的距离都不小于δ。

由此可以推出矩形R中最多只有6个S中的点。

事实上，我们可以将矩形R的长为2δ的边3等分，将它的长为δ的边2等分，由此导出6个（δ/2）×（2δ/3）的矩形。

如图4（a）所示。

图4矩形R中点的稀疏性

若矩形R中有多于6个S中的点，则由鸽舍原理易知至少有一个δ×2δ的小矩形中有2个以上S中的点。

设u,v是这样2个点，它们位于同一小矩形中，则

因此d（u,v）≤5δ/6<δ。

这与δ的意义相矛盾。

也就是说矩形R中最多只有6个S中的点。

图4（b）是矩形R中含有S中的6个点的极端情形。

由于这种稀疏性质，对于P1中任一点p，P2中最多只有6个点与它构成最接近点对的候选者。

因此，在分治法的合并步骤中，我们最多只需要检查6×n/2=3n对候选者，而不是n2/4对候选者。

这是否就意味着我们可以在O（n）时间内完成分治法的合并步骤呢？

现在还不能作出这个结论，因为我们只知道对于P1中每个S1中的点p最多只需要检查P2中的6个点，但是我们并不确切地知道要检查哪6个点。

为了解决这个问题，我们可以将p和P2中所有S2的点投影到垂直线l上。

由于能与p点一起构成最接近点对候选者的S2中点一定在矩形R中，所以它们在直线l上的投影点距p在l上投影点的距离小于δ。

由上面的分析可知，这种投影点最多只有6个。

因此，若将P1和P2中所有S的点按其y坐标排好序，则对P1中所有点p，对排好序的点列作一次扫描，就可以找出所有最接近点对的候选者，对P1中每一点最多只要检查P2中排好序的相继6个点。

至此，我们可以给出用分治法求二维最接近点对的算法CPAIR2如下:

functionCPAIR2（S）;

begin

if|S|=2thenδ:

=S中这2点的距离

elseif|S|=0

thenδ:

=∞

elsebegin

1. m:

=S中各点x坐标值的中位数;

构造S1和S2，使S1={p∈S|px≤m}和S2={p∈S|px>m}

2. δ1:

=CPAIR2（S1）;δ2:

=CPAIR2（S2）;

3. δm:

=min（δ1,δ2）;

4. 设P1是S1中距垂直分割线l的距离在δm之内的所有点组成的集合，P2是S2中距分割线l的距离在δm之内所有点组成的集合。

将P1和P2中的点依其y坐标值从小到大排序，并设P1*和P2*是相应的已排好序的点列;

5. 通过扫描P1*以及对于P1*中每个点检查P2*中与其距离在δm之内的所有点（最多6个）可以完成合并。

当P1*中的扫描指针逐次向上移动时，P2*中的扫描指针可在宽为2δm的一个区间内移动。

设δl是按这种扫描方式找到的点对间的最小距离;

6. δ=min（δm,δl）;

end;

return（δ）;

end;

下面分析一下算法CPAIR2的计算复杂性。

设对于n个点的平面点集S，算法耗时T（n）。

算法的第1步和第5步用了O（n）时间，第3步和第6步用了常数时间，第2步用了2T（n/2）时间。

若在每次执行第4步时进行排序，则在最坏情况下第4步要用O（nlogn）时间。

这不符合我们的要求。

因此，在这里我们要作一个技术上的处理。

我们采用设计算法时常用的预排序技术，即在使用分治法之前，预先将S中n个点依其y坐标值排好序，设排好序的点列为P*。

在执行分治法的第4步时，只要对P*作一次线性扫描，即可抽取出我们所需要的排好序的点列P1*和P2*。

然后，在第5步中再对P1*作一次线性扫描，即可求得δl。

因此，第4步和第5步的两遍扫描合在一起只要用O（n）时间。

这样一来，经过预排序处理后的算法CPAIR2所需的计算时间T（n）满足递归方程：

显而易见T（n）=O（nlogn），预排序所需的计算时间为O（n1ogn）。

因此，整个算法所需的计算时间为O（nlogn）。

在渐近的意义下，此算法已是最优的了。

二．再讨论二个集合间最接近点对的情况

对于求二个集合间的最接近点对的算法，其实和普通一个集合的最近点对一样，分治，复杂度O（nlogn）,只不过在合并的时候只有两个点属于不同的集合才会更新。

这么做已经证明是对的，因为递归到2个点的时候最近的点对一定是合并的时候产生的，所以其实在整个算法过程中不断更新的答案一定是在合并的时候产生的，因此只需在合并的时候注意两个点属于不同集合就好了。

因此在S1与S2集合中的每个点增加一个标记域，表示此点属于哪一个集合。

时间复杂度与一个集合的是一样，为O（nlogn）。

if|S1|=0|||S2|=0

{

δ:

=∞

returnδ;

}

else

begin

先给S1中的每一个点增加一个标识1，表示属于集合S1。

给S2中的每一个点增加一个标识2，表示属于集合S2。

合并S1，S2为S，并对S按照横坐标值快速排序（也可以利用随机化快速排序，从而减小排序平均复杂度）。

functionCPAIR2（S）;

begin

if|S|=2

if这二个点属于不同集合

δ:

=S中这2点的距离

else

δ:

=∞

elseif|S|=0

δ:

=∞

else

begin

1. m:

=S中各点x坐标值的中位数;

构造S1*和S2*，使S1*={p∈S|px≤m}和S2*={p∈S|px>m}

2. δ1:

=CPAIR2（S1*）;δ2:

=CPAIR2（S2*）;

3. δm:

=min（δ1,δ2）;

4. 设P1是S1*中距垂直分割线l的距离在δm之内的所有点组成的集合，P2是S2*中距分割线l的距离在δm之内所有点组成的集合。

将P1和P2中

展开阅读全文