用C++高效解析HTTP请求的方法

发布于11月09日

我正在用C语言编写一个HTTP服务器.注意I DO KNOW如何解析a string in an HTTP request format.这意味着在我收到报头后，我可以轻松地解析出它们.

我的奋斗是这样的:

HTTP协议构建在TCP套接字之上.因此，不能保证在仅仅一次read()次操作之后，客户端发送的请求被完整地递送.因此，我需要将请求读到Header的末尾，获取Content-Length，然后继续到正文read()，知道我应该读取多少数据.

我用了nonblocking IO，以防有些读者觉得这很重要.

对于这一点，我有两个 idea ，每个 idea 都有严重的缺陷.

每次read()个字节，每次在read()之后判断缓冲区的结尾是否为"\r\n\r\n".然后拿到Content-Length，然后看身体.由于read()个系统调用的数量，效率非常低.
在更大的块中读入缓冲区，每次判断是否使用strstr()读取请求的结尾以找到"\r\n\r\n"个子字符串.当找到子字符串"\r\n\r\n"时，将其后面读取的字符数量保存在变量n中，即GET Content-Length.继续阅读Content-Length - n个字符.效率也很低，因为每隔read()次就必须拨打strstr().

对于如何更有效地完成这项工作，有什么建议吗？

IMPORTANT!个我理解第二种方法更好.我正在寻找一些比我的更好的新建议.

offset = 0; bufsz = BUFSZ; while (NOT_END_OF_HEADERS) { if (bufsz > offset) n = recv(sock, buf + offset, bufsz - offset, 0); if (ERROR_OR_NEED_TO_STOP) HANDLE_IT; RESUME_PARSE(buf + offset, buf + offset + n); offset += n; }

用C++高效解析HTTP请求的方法

推荐答案

你的问题是关于优化的

您需要在优化之前执行性能分析

您的方法存在潜在问题

解决假设的问题

不要解析两次

不复制数据

不要浪费内存

这个故事的寓意

C++相关问答推荐

Zig将std.os.argv转换为C类型argv

常数函数指针优化

增加getaddrinfo返回的IP地址数量

GCC引发不明确的诊断消息

将整数的.csv文件解析为C语言中的二维数组

为什么内核使用扩展到前后相同的宏定义？

C中的指针增量和减量(--++p)

Char变量如何在不使用方括号或花括号的情况下存储字符串，以及它如何迭代到下一个字符？

Setenv在c编程中的用法？

如何使用C for Linux和Windows的标准输入与gdb/mi进行通信？

如何识别Linux中USB集线器(根)和连接到集线器(根设备)的设备(子设备)？

S和查尔有什么不同[1]？

使用ld将目标文件链接到C标准库

正在try 理解C++中的`正在释放的指针未被分配‘错误

Makefile无法将代码刷新到ATmega328p

使用mmap为N整数分配内存

将char*数组深度复制到 struct 中？

如何使用 raylib 显示数组中的图像

Zig 中 C 的system函数的惯用替代方案

我们可以在不违反标准的情况下向标准函数声明添加属性吗？