Как найти среднее из набора столбцов в строке с pyspark dataframe и добавить его в другой столбец в той же dataframe?

голоса
0

У меня есть DataFrame , состоящий из 500 колонн из которых, для каждой строки , мне нужно , чтобы получить среднее значение набора столбцов , начиная с country_.

expr=[F.sum(train_data_df[x])/colCount for x in train_data_df.columns if 'country_' in x]
avg_train_data_df = train_data_df.withColumn('avg', *expr)

Я получаю следующий ответ об ошибке:

TypeError: withColumn() takes 3 positional arguments but 212 were given

Задан 19/09/2018 в 13:23
источник пользователем
На других языках...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more