我有一个数据框:
> df = batch Code. time
> a 100. 2019-08-01 00:59:12.000
> a 120. 2019-08-01 00:59:32.000
> a 130. 2019-08-01 00:59:42.000
> a 120. 2019-08-01 00:59:52.000
> b 100. 2019-08-01 00:44:11.000
> b 140. 2019-08-02 00:14:11.000
> b 150. 2019-08-03 00:47:11.000
> c 150. 2019-09-01 00:44:11.000
> d 100. 2019-08-01 00:10:00.000
> d 100. 2019-08-01 00:10:05.000
> d 130. 2019-08-01 00:10:10.000
> d 130. 2019-08-01 00:10:20.000
我想知道每个组从第一个‘100’代码到最后一个‘130’代码之间的秒数. 如果对于一个组,后面没有代码100和代码130(其中一个缺失)-PUT NaN. 因此,输出应为:
df2 = batch duration
a 30
b. nan
c. nan
d. 20
做这件事最好的方法是什么?