我正在try 使用pd.melt
来取消我的数据轴,但到目前为止还没有成功.每一行都是一家企业,数据包含关于该企业和多个 comments 的信息.我希望我的数据每一次审查都是连续的.
我的前150列以15列为一组,每个组列名称共享相同的模式reviews/n/
:0 < n < 9
.(reviews/0/text
,reviews/0/date
,...,reviews/9/date
).
数据帧中接下来的65列包括关于业务的更多数据(例如,business_id
,address
),这些数据应该保留为id_Variables.
我目前的数据是这样的:
business_id | address | reviews/0/date | reviews/0/text | reviews/1/date | reviews/1/text |
---|---|---|---|---|---|
12345 | 01 street | 1/1/1990 | "abc" | 2/2/1995 | "def" |
我的新数据框架应该将每一项审查作为一行,而不是每一项业务,并如下所示:
business_id | address | review_number | review_date | review_text |
---|---|---|---|---|
12345 | 01 street | 0 | 1/1/1990 | "abc" |
12345 | 01 street | 1 | 2/2/1995 | "def" |
我try 使用pd.melt
,但无法成功地编写出对我有价值的代码.