数据处理查找重复方法总结
在数据处理过程中,我们可能会遇到有重复数据的情况,下面主要针对数据重复查找总结以下几种方法:
一、 同一数据层中查找重复
1.按照查找频数查重复(前提:重复数据属性中有相同字段)
图 1
如上图(图1),通过属性表可以看出一共7条数据,但是图形只有6个。主要就是图形覆盖了(此处主要是图形完全一样所致);我们可以通过查找属性的频数即可快速查找出重叠的图像。
首先在ArcToolBox工具箱中,找到分析工具Analysis Tool/Statistics/Frequency(查找频数工具);如图2。
图 2
左键单击Frequency工具,出现如下图(图3)窗口:
图 3
点击OK按钮即可统计,待屏幕右下角出现下图时,说明统计完成。
此时,ArcMap会自动将统计结果表加载进来,右键点击统计表,打开该表,如下图(图4):
图 4
选中Frequency列,右键进行排序(一般按照降序排列),Frequency列数值>1,即可能为重复数据(a.重复数据;b.图形完全压盖的数据);如图5:
图 5
接下来,自己可以通过相关字段进行快速查找判断、如果数据重复删除即可,在处理结束后建议再次统计频数,确保无重复数据后方可。 2.通过拓扑进行查找重复数据;
首先通过ArcCatalog建立拓扑规则。(仍然以上述练习数据为例)
①拓扑的建立必须在数据库中,shp数据无法建立拓扑;如果为shp数据可以先将shp数据导入.mdb数据库中,再进行操作。
②找到将要建立拓扑的数据所在的数据集,右键点击该数据集,选择New/Topology开始建立拓扑关系。如下图(图6):
图 6
③具体建立拓扑关系的步骤如下:
I.在上一步点击Topology之后,进入建立拓扑规则界面;如下图(图6-1)
图 6-1
II.此处,点击下一步即可,进入建立拓扑容差见面,一般我们容差设定为0.001(容差越小,精度越高);如下图(图6-2)
图 6-2
III.点击下一步,即可勾选需要建立拓扑关系的要素层;如图6-3;
相关推荐: