点线覆盖层-加速它?

Question

我刚刚在Workbench 2019中运行了一个工作空间来分析软件并发使用数据。基本上，数据集包含用户启动软件的每个实例的一个特性，并包含开始和结束时间。数据集仅覆盖4周左右，有55,466个特性…一点也不大。

为了解决这个问题，我使用结束时间作为第二个坐标(y=0, X1=开始，X2=结束)来绘制每个开始时间和直线的点。实际上，这将生成一个包含X轴上所有直线和点的甘特图。然后我使用PointOnLineOverlayer来查找每个起始点下有多少行，从而给出每个时间点上的用户数量。对该计数进行排序可以获得最大的并发使用率。

然而，问题是，在处理点输出之前，该转换器首先将每条线按其上的点进行分割。所以我最终得到了31,829,560个我根本不需要的新特性。结果，我花了5小时14分钟来运行工作空间，把大部分时间浪费在了我不需要的东西上。我只需要一些分配给相交点的(原始)线属性的列表。

还有其他选择吗?也许这是一个很好的用例来增强这个转换器，如果不需要的话，可以切换行分割功能/输出…想法欢迎!谢谢。

Answer 1 · 2019-04-29T12:49:47Z

回答通过 dellerbeck ·四月二十九日下午十二时四十九分

如果您只是对“周围”的东西感兴趣，那么邻居查找器也是一个令人惊奇的转换器。就性能而言，如果您可以在任何一个有大量数据的转换器中创建一个组，那么您将看到巨大的好处。

如果可能的话，你也可以看看空间排序，这允许“相同区域”中的数据拥有一个group by参数(如果您还没有的话)。也拓扑生成器是一个计算空间相互作用的神奇工具，而且速度也非常快。

添加注释· 显示1· 分享

10 | 4000字符所需剩余字符超出字符

附件：多达10个附件（包括图像）可以具有最大的每4.0 MB和4.0 MB总被使用。

dbaldacchino ·4月29日在下午2点17分 0

感谢您的提示:)我会做一些更多的测试和后回来。到目前为止，我发现速度是值得注意的几个问题。在这种情况下，功能缓存具有相当的影响和禁用它加快了一点东西。使用SpatialRelator为@takashi建议似乎是最有前途的。

最后，我是执行数据的“清理”后的“并发”数据被计算。有迹象表明，需要拆除多个实例（如：我正在清点在同一时间或同一软件套件/不同的版本上运行不消耗额外的许可软件的多个实例）。我使用的是ListDuplicateRemover和ListElementCounter来解决这个问题，但后来想通我需要更有效地做事情和处理之前删除重复。所以我增加了一个部门间和LineCombiner处理数据之前，通过加入我（用户名和计算机名的级联），使得任何重叠线被组合成一个，而不是一个属性分组。这实际上减少到一半进行空间分析的数据。然后我用一个CoordinateExtractor和VertexCreator比较使用SpatialRelator行startpoints到线本身，现在我得到了约35分钟的结果，这是一个明确的改善。问题是，大多数点太远相交，如果我能找到一种方法，不打扰处理这些显而易见的，它会去了，不是检查对所有线路的所有点快得多。哦，最后一...在笔记本插上的作品比使用电池电源快...咄！再次感谢。

Answer 2 · 2019-04-29T01:12:24Z

回答通过隆 ·4月29日凌晨1点12分

如果我正确地理解了需求，数据库操作也可以是一种替代方法，而且它可能比空间方法快得多。

也就是说，一旦您为每一行提取了最小x和最大x(例如。您可以使用这个SQL查询的InlineQuerier来获得每个起始点的并发行数(= _xmin)。在本例中，结果“n”表示每个起始点的并发行数。

SQL查询

选择一个。*，（选择从行计数（*）作为b，其中b._xmin之间a._xmin和b._xmax），如从线作为正

1556500304988.png （51.1 KB）

添加注释· 显示1· 分享

10 | 4000字符所需剩余字符超出字符

附件：多达10个附件（包括图像）可以具有最大的每4.0 MB和4.0 MB总被使用。

dbaldacchino ·年04月29在下午2点21分 0

感谢这个替代的方法！出于某种原因，我的号码不匹配，所以我需要仔细看看。至于速度，它似乎并不比SpatialRelator更快。主要缺点是，我不能（或不知道如何！）在每个计算点创建的其他重要属性的列表。这是我想有，并且很容易与空间的变压器来完成。我会做这种方法的一些更多的测试，但。

Answer 3 · 2019-04-28T17:23:53Z

回答通过 dbaldacchino ·4月28日在下午5时23分

你好@takashi，谢谢...会看一看。在此期间，这里是我与一个非常小的数据集初始测试一个小图形来解释我在做什么。在这个例子中，我呈现出Y线之间的偏移，但我绘制他们都在彼此的顶部。我感兴趣的只是发现该线位于下面的每个开始各行的点，没有必要，也没有兴趣，在分割线。谢谢。

1556471874905.png （34.7 KB）

1556472191841.png （59.3 KB）

添加注释· 分享

10 | 4000字符所需剩余字符超出字符

附件：多达10个附件（包括图像）可以具有最大的每4.0 MB和4.0 MB总被使用。

Answer 4 · 2019-04-28T15:42:41Z

回答通过隆 ·4月28日在下午3点42

我不知道如果我了解的情况完全是，但可能是SpatialRelator可能是一个解决办法。

添加注释· 显示2· 分享

10 | 4000字符所需剩余字符超出字符

附件：多达10个附件（包括图像）可以具有最大的每4.0 MB和4.0 MB总被使用。

dbaldacchino ·4月28日下午5:44 0

非常感谢@takashi！我不知道有关变压器和它正是我需要的:)我连接点给请求者输入，线路的供应商输入和使用的空间谓词“请求者相交供应商”得到的结果。

dbaldacchino ·4月28日下午7:52 0

我不得不说，虽然，这不是一样快，我认为这将是。我缩小的数据集44514层的功能，但它会通过非常缓慢。我认为这将是更快（虽然我知道它要经过45514 X 45514个比较... 2071524196！）

点线覆盖层-加速它?

4回复

跟进这个问题

相关问题