I have a dataset with two variables ("Aufzeichnungen" , "ID"). I want to remove all lines of the Dataset that contains the word "next" and also remove the following lines until the next ID-Number starts.
I have different cases and every ID is a customertreatment, but the word "next" and all the following lines of the same ID have to be removed.
That's my input:
Aufzeichnungen ID
1 07.03.22 A: stechender Schmerz, scharfkantig 1
2 D/B: 1
3 T: 1
4 pat aht an 36 üz distal, seit paartagen 1
5 36 vipr++, perk-, keine c zu entdekcne,üz bilfuird 1
6 pat aufgekläörtggf RÖ um c auszuschileßen, pat verweigert RÖ aus Angst vor Strahlung, pat 1
7 aufgeklärt angst nicht nötig und c unter fllg oder apprx nicht auszuschließen, 1
8 pat knirscht, schiene empohlen, pat meldet sich.. 1
9 next: noch schmerezn 1
10 an 36? 1
11 20.11.21 A: kontrolle 2
12 D/B: 2
13 T: 2
14 ->Pat. geht es besser hat keine blutung mehr, bltung stabil, pat aufgeklärt muss noch 1 tag stabil 2
15 bleiben dann sollten keine Nahcbltung mehr kommen! wenn doch dann montag gleich wieder zu 2
16 rkontrolle und in towche Nahtx 2
17 ->gute wundheilung, tupfer mitgegeben 2
18 -> 2
19 <NA> 2
20 next 0 1+Kontrolle+Naht 2
21 ex bei F2 2
22 K3/BV 2
that's my input.
My output should look like:
Aufzeichnungen ID
1 07.03.22 A: stechender Schmerz, scharfkantig 1
2 D/B: 1
3 T: 1
4 pat aht an 36 üz distal, seit paartagen 1
5 36 vipr++, perk-, keine c zu entdekcne,üz bilfuird 1
6 pat aufgekläörtggf RÖ um c auszuschileßen, pat verweigert RÖ aus Angst vor Strahlung, pat 1
7 aufgeklärt angst nicht nötig und c unter fllg oder apprx nicht auszuschließen, 1
8 pat knirscht, schiene empohlen, pat meldet sich.. 1
9
11 20.11.21 A: kontrolle 2
12 D/B: 2
13 T: 2
14 ->Pat. geht es besser hat keine blutung mehr, bltung stabil, pat aufgeklärt muss noch 1 tag stabil 2
15 bleiben dann sollten keine Nahcbltung mehr kommen! wenn doch dann montag gleich wieder zu 2
16 rkontrolle und in towche Nahtx 2
17 ->gute wundheilung, tupfer mitgegeben 2
18 -> 2
19 <NA> 2
20
So that lines 9,10 and 20,21,22 are removed.
I tried with new_df= PKV[!grepl("ext",PKV$Aufzeichnungen),]
but this removes just one line and is not specific for the ID