以下是前input string examples名:
#example 1.1
colloquial_hour = "Hola nos vemos a las diez y veinte a m, ten en cuenta que al amanecer tendremos que estar despiertos, porque debemos estar alli a eso de nueve a m o las diez y cuarto a m"
#example 1.2
colloquial_hour = "A mi me parece entre las 10 15 am y las 11 a m, o a las 15 a m aunque quizas a medianoche este bien a eso de las 00:00 a m"
#example 1.3
colloquial_hour = "Puede que a las 10 am. Hay 10 a medias, a m mmm... creo que en 10 estarian para terminar a las 11:00 hs a m 11:59 a m"
#example 1.4
colloquial_hour = "Amediados a mediados del 30 antes de y dia; me parace que hay que estar en casa. Medianamente a, mediados de las 05 a m o cerca de 6 a m."
我已经try 了一个简单的替换,但我认为必须用正则模式进一步限制 case ,这样就不会进行不需要的替换……
colloquial_hour = colloquial_hour.replace('a m', 'am ')
,并能够获得此字符串作为输出...
这些例子中每一个都有correct output:
#example 1.1
colloquial_hour = "Hola nos vemos a las diez y veinte am, ten en cuenta que al amanecer tendremos que estar despiertos, porque debemos estar alli a eso de nueve am o las diez y cuarto am"
#example 1.2
colloquial_hour = "A mi me parece entre las 10 15 am y las 11 am, o a las 15 am aunque quizas a medianoche este bien a eso de las 00:00 am"
#example 1.3
colloquial_hour = "Puede que a las 10 am. Hay 10 a medias, a m mmm... creo que en 10 estarian para terminar a las 11:00 hs am 11:59 am"
#example 1.4
colloquial_hour = "Amediados a mediados del 30 antes de y dia; me parace que hay que estar en casa. Medianamente a, mediados de las 05 am o cerca de 6 am."
在本例中,伪模式为: 有些数字"a m" to replace with the string "am"有一个或多个空格、句点、逗号或直接位于字符串末尾
还应考虑这样的情况,其中可能存在不完整的书面时间表,在该时间表之前可能有":"
、" :"
、": "
、" hs"
、"hs"
、"hs "
、" h.s. "
、"h.s."
、"h.s. "
、" h.s"
、"h.s"
或"h.s "
,例如,
input_t = "a las 12: a m"
output = "a las 12: am"
input_t = "a las 12 : a m"
output = "a las 12 : am"
input_t = "a las 12 hs a m"
output = "a las 12 hs am"
input_t = "a las 12:hs a m"
output = "a las 12:hs am"
input_t = "a las 12: hs a m"
output = "a las 12: hs am"
input_t = "a las 12hsa m"
output = "a las 12hs am"
input_t = "a las 12h.sa m"
output = "a las 12h.s am"
input_t = "a las 12 h.sa m"
output = "a las 12 h.s am"
input_t = "a las 12 h.s.a m"
output = "a las 12 h.s. am"