主题问题:“数据科学” https://knowledge.亚搏在线safe.com/questions/topics/single/64392.html网站 “数据科学”主题的最新问题 基本统计自定义变压器 https://knowledge.亚搏在线safe.com/articles/69900/basic-statistical-custom-transformers.html(http://knowledge.safe.com/articles/69900/basic-statistical-custom-transformers.html)

介绍

FME的强大功能是能够从多个来源获取数据并有效地操作它。那么为什么不把FME用于数据科学呢?

我们最近在FME集线器中添加了一系列变压器,这些变压器使用RCaller或pythoncaller执行一些基本的统计测试。

如果你没有在这个列表中看到你要找的统计测试,您可以创建自己的并将其上载到FME集线器与其他用户共享或创建新的想法如果得到足够的选票,就会把它添加到名单上。

学习

使用r或python执行shapiro-wilks统计测试

了解如何使用r或python创建自定义转换器来执行shapiro-wilks测试(测试分布的正常性)。此工作流可亚搏在线以适用于使用R或Python的任何统计测试。

变压器

列出的每个转换器都有一个指向FME中心页面的链接,以及一个测试工作区下载。由于R的外部软件需求,无法将这些测试工作区上载到集线器。每个R变压器都需要R安装在用户机器上以及SqLDF R包.对于巨蟒变形金刚,这个scipy python包需要安装。

相关性

相关性是两个变量之间的一个测试,用于确定它们之间的关联。

r相关计算器

使用r计算两个变量之间是否存在关联。

rcorrelation-testworkspace.fmwt

聚类分析

聚类分析是一种确定数据组的方法。

循环计算器

使用r使用三种算法之一计算相似的数据组。此变压器仅适用于2018.0+

rclustercalculator-testworkspace.fmwt

夏皮罗-威尔克斯测验

这个夏皮罗-威尔克斯测验计算随机数据样本是否来自正态分布。

rshapirowilksCalculator(rshapirowilksCalculator)

使用r和rcaller,该变压器使用shapiro-wilks测试计算随机数据样本是否来自正态分布。

rshapirowilks-testworkspace.fmwt

皮夏皮罗威尔克斯计算器

用scipy和pythoncaller,该变压器使用夏皮罗-威尔克斯试验计算随机数据样本是否来自正态分布。

pyshapirowilks-testworkspace.fmwt

t检验

t检验是检验两个样本的平均值是否明显不同于随机样本的统计检验。

RonesamplettestCalculator(RonesamplettestCalculator)

一个样本t检验检验了总体平均值等于规定值的无效假设,换言之,它告诉你样本的平均值是否接近某个数字,从而具有统计意义。此测试输出t值,p值置信区间和估计。

ronesamplettest-testworkspace.fmwt

RTWOSAMPLETTESCalculator(RTWOSAMPLETTESCalculator)

两个样本t检验两组的平均值,以确定它们是否显著不同或是随机的。此测试输出t值,p值置信区间和估计。

rtwottest-testworkspace.fmwt

蟒蛇 自定义变压器 统计学 R 相关性 数据科学 夏皮罗 T检验 星期二,2018年5月8日格林威治标准时间17:01:54 利兹桑德森
开发更多的统计变压器或功能 https://knowledge.亚搏在线safe.com/idea/64394/develop-more-statistical-transformers-or-functions.html

这将允许在FME中进行进一步的地理空间和一般数据分析,包括聚类分析的类型,如Jenkins自然断裂或K均值分析。目前最好的选择似乎是脚本(python,r)或其他软件(ESRI,QGIS)。

统计学 聚类分析 数据科学 星期二,2018年2月20日00:20:54格林尼治标准时间 法梅扎德