Python3.x 从 h264 帧解析数据包时 PyAV 不一致

发布于04月03日

当生成H.264帧并使用pyAV对其进行解码时，只有在两次调用parse种方法时，才会从帧中解析数据包.

Consider the following test H.264 input, created using:

ffmpeg -f lavfi -i testsrc=duration=10:size=1280x720:rate=30 -f image2 -vcodec libx264 -bsf h264_mp4toannexb -force_key_frames source -x264-params keyint=1:scenecut=0 "frame-%4d.h264"

现在，使用pyAV解析第一帧:

import av
codec = av.CodecContext.create('h264', 'r')
with open('/path/to/frame-0001.h264', 'rb') as file_handler:
    chunk = file_handler.read()
    packets = codec.parse(chunk) # This line needs to be invoked twice to parse packets

除非再次调用最后一行，否则数据包将保持为空(packets = codec.parse(chunk))

此外，对于我无法描述的不同现实生活示例，似乎从数据包解码帧也需要几个解码调用:

packet = packets[0]
frames = codec.decode(packet) # This line needs to be invoked 2-3 times to actually receive frames.

有人知道pyAV这种不一致的行为吗？

(Using Python 3.8.12 on macOS Monterey 12.3.1, ffmpeg 4.4.1, pyAV 9.0.2)

while True: with nogil: consumed = lib.av_parser_parse2( self.parser, self.ptr, &out_data, &out_size, in_data, in_size, lib.AV_NOPTS_VALUE, lib.AV_NOPTS_VALUE, 0 ) err_check(consumed) # ...snip... if not in_size: # This was a flush. Only one packet should ever be returned. break in_data += consumed in_size -= consumed if not in_size: # Aaaand now we're done. break

while (size > 0 || (flush && got_output)) { int64_t next_pts = pkt->pts; int64_t next_dts = pkt->dts; int len; len = av_parser_parse2(sti->parser, sti->avctx, &out_pkt->data, &out_pkt->size, data, size, pkt->pts, pkt->dts, pkt->pos);

Python3.x 从 h264 帧解析数据包时 PyAV 不一致

推荐答案

Python-3.x相关问答推荐

math. gcd背后的算法是什么，为什么它是更快的欧几里得算法？

我在创建Pandas DataFrame时感到困惑

替换Pandas中组下的列值

我不能使用拆分来分隔数据

我没有'；无法理解此TemplateDoesNotExist错误

Select 作为 MultiIndex 一部分的两个 DatetimeIndex 之间的行

ValueError at /register/ 视图authenticate.views.register_user 未返回HttpResponse 对象.它返回 None 相反

在Pandas中，根据另一列中的重复值将数据分组为一列

在 groupby 之后，Pandas 在特定类别中获得最常见和最后的值

在 Python 中实现 COM 接口

如何将列表和字典逐行组合在一起

Python 3 - 给定未知数量的类别动态地将字典嵌套到列表中

逗号分隔列表的 argparse 操作或类型

Python3四舍五入到最接近的偶数

tensorflow 中 numpy.newaxis 的替代方案是什么？

通过多个键对字典列表进行分组和聚合

同步调用协程

首次使用后 zip 变量为空

在 Meta 中创建具有动态模型的通用序列化程序

在 PostgreSQL 上使用 SQLAlchemy 创建全文搜索索引