我对这种数据挖掘非常陌生。我有两个数据集,分别是人类发展指数和预期寿命指数,我想知道预期寿命数据集是否正在影响HDI数据集的价值。知道这一点的最好方法是什么?谢谢
HDI数据集如下所示:
预期寿命数据集如下所示:
您将需要加入这两个数据集。
这可能涉及收集其他数据以填充丢失的值,或丢弃一些仅存在于一组数据中的数据点。由于加入键可能有所不同,因此您可能还需要在两个键之间构造一个映射。