Python 从带有字符的图像中删除背景(鬼照片)

发布于06月21日

我正在try 从一些图像中提取文本，但是，这些图像带有一点背景，我try "播放"对比度和亮度，并希望应用像otsu这样的阈值技术.

你对如何提高提取率有什么建议吗？我在下面留下一些处理部分，以及输入和输出，欢迎您提出任何建议.

Input:

输出:

处理:

enhancer = ImageEnhance.Brightness(img)
img = enhancer.enhance(1.62)  # 1.8
enhancer2 = ImageEnhance.Contrast(img)
img = enhancer2.enhance(1.8)  # 2
img = np.array(img)
thresh = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

推荐答案

您应该执行自适应阈值.该算法将图像分割为预定义大小的块.根据每个块内的像素强度， for each 块指定不同的阈值.在以下示例中，基于应用于每个块内所有像素值之和的高斯权重获得阈值(意味着基于高斯曲线为相似像素值赋予更多权重).基于每个块的该值执行二值化.判断this page for more

对于给定的图像，我try 了以下方法:

im = cv2.imread('text_block.jpg')
green_channel = im[:,:,1]
th = cv2.adaptiveThreshold(green_channel, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 27, 6)