Python Spark Row对象的实例化方式与重载原型不同吗

发布于10月18日

pyspark/sql/types.py中的Spark Row类不包含__init__ 方法，但显示__new__的以下重载类型提示:

@overload
def __new__(cls, *args: str) -> "Row"

@overload
def __new__(cls, **kwargs: Any) -> "Row"

def __new__(cls, *args: Optional[str], **kwargs: Optional[Any]) -> "Row"

Row的文档字符串显示了各种实例化:

>>> Person = Row("name", "age")
>>> row1 = Row("Alice", 11) # This is the one that is hard to understand
>>> row2 = Row(name="Alice", age=11)
>>> row1 == row2
True

上面的second行不适合任何超载的原型. 它almost与原型匹配*args，除了所有在支持*args的论点中，应该有strings个.这是显然不是Row("Alice",11)的情况，而是那个调用在REPL提示符下发出时，不会生成任何消息. 显然，我遗漏了一些关于类型提示和重载工作.有没有人能解释一下？

P.S.对于上下文，我通过try 了解构造函数是如何实现的知道Row("name","age")指定字段名称，而 Row("Alice", 11)指定字段值.的源代码 __new__表示这取决于参数列表是否为 *args或**kwargs.中的Row个方法调用本段使用*args，但第二个根本不适合上面*args的原型.

Python Spark Row对象的实例化方式与重载原型不同吗

推荐答案

Python相关问答推荐

try 使用tensorFlow.keras.models时optree Import错误

使用decorator 重复超载

Python中的锁定类和线程以实现dict移动

Python：MultiIndex Dataframe到类似json的字典列表

每个组每第n行就有Pandas

如何处理必须存在于环境中但无法安装的Python项目依赖项？

如何使用Tkinter创建两个高度相同的框架(顶部和底部)？

Python panda拆分列保持连续多行

在Pandas 日历中插入一行

追溯(最近最后一次调用)：文件C：\Users\Diplom/PycharmProject\Yolo01\Roboflow-4.py，第4行，在模块导入roboflow中

按顺序合并2个词典列表

我想一列Panadas的Rashrame，这是一个URL，我保存为CSV，可以直接点击

利用Selenium和Beautiful Soup实现Web抓取JavaScript表

使用密钥字典重新配置嵌套字典密钥名

计算每个IP的平均值

实现神经网络代码时的TypeError

如何使用SentenceTransformers创建矢量嵌入？

dask无groupby(ddf. agg([min，max])？''''

在Python中从嵌套的for循环中获取插值

Pandas—MultiIndex Resample—我不想丢失其他索引的信息´