pyspark mllib
包和pyspark ml
包的区别是什么
https://spark.apache.org/docs/latest/api/python/pyspark.mllib.html
https://spark.apache.org/docs/latest/api/python/pyspark.ml.html
pyspark mllib
似乎是数据帧级别pyspark ml
的目标算法
我发现的一个区别是pyspark ml
个工具pyspark.ml.tuning.CrossValidator
,而pyspark mllib
个没有.
我的理解是,如果在ApacheSpark框架上实现的算法是mllib
,但似乎存在分歧,那么库应该使用什么呢?
在不转换类型的情况下,每个框架之间似乎不存在互操作性,因为它们都包含不同的包 struct .