假设我有一个dataframe,其中的值列如下:
ABC00909083888
ABC93890380380
XYZ7394949
XYZ3898302
PQR3799_ABZ
MGE8983_ABZ
我想修剪这些值,比如,删除前3个字符,如果以ABZ结尾,则删除最后3个字符.
00909083888
93890380380
7394949
3898302
3799
8983
try 了一些方法,但没有奏效.
from pyspark.sql import functions as f
new_df = df.withColumn("new_column", f.when((condition on some column),
f.substring('Existing_COL', 4, f.length(f.col("Existing_COL"))), ))
谁能告诉我pyspark中可以使用哪种功能.