我有一个总结汽车旅行的数据集,但它没有确定有多少独特的汽车.我想创建一个loop/if语句,根据旅行开始的位置和时间分配一个唯一的数字,以计算出一个近似的唯一汽车数量.
例如,如果第一辆车的下车位置与第二辆车的取车位置相匹配,并且时间范围在2分钟内,则分配与第一辆车相同的车号.如果完全不同,请指定一个新号码.
我try 了不同的 Select ,但无法成功(初学者).非常感谢您在这个时候提供的任何帮助.(R或Python)
这大致就是我所拥有的:
Pickup time | Dropoff time | Pickup location | Dropoff location |
---|---|---|---|
2016-06-09 21:06:36 | 2016-06-09 21:13:08 | A | B |
2016-06-09 21:13:31 | 2016-06-09 21:23:59 | A | C |
2016-06-09 21:13:45 | 2016-06-09 21:26:29 | B | C |
2016-06-09 21:15:33 | 2016-06-09 21:44:31 | A | B |
2016-06-09 21:24:49 | 2016-06-09 21:39:29 | C | D |
这就是我想要实现的目标:
Pickup time | Dropoff time | Pickup location | Dropoff location | Car # |
---|---|---|---|---|
2016-06-09 21:06:36 | 2016-06-09 21:13:08 | A | B | 1 |
2016-06-09 21:13:31 | 2016-06-09 21:23:59 | A | C | 2 |
2016-06-09 21:13:45 | 2016-06-09 21:24:29 | B | C | 1 |
2016-06-09 21:15:33 | 2016-06-09 21:44:31 | A | B | 3 |
2016-06-09 21:24:49 | 2016-06-09 21:39:29 | C | D | 2 |