博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
UI2CODE复杂背景无法识别?闲鱼工程师这样打造高准确率方案
阅读量:2401 次
发布时间:2019-05-10

本文共 1287 字,大约阅读时间需要 4 分钟。

引言:

复杂背景内容提取指的是从复杂的背景中提取出特定的内容,例如在图片中提取特定的文字,在图片中提取特定的叠加图层等等。

这是一个业界难题,基于传统的图像处理的方法存在准确率和召回率的问题,没法解决语义的问题。而主流的机器学习的方法,例如目标检测无法获取像素级别的位置信息,而语义分割的方法则只能提取像素而无法获取半透明叠加前的像素信息。
本文考虑到这些痛点,从UI2CODE业务的业务场景出发,采用了目标检测网络来实现内容召回,GAN网络实现复杂背景中特定前景内容的提取和复原。

处理流程:

复杂背景的处理流程分为如下几个步骤:

内容召回:通过目标检测网络召回元素,即元素是否需要做背景提取操作。区域判断:根据梯度等视觉方法判断所处区域是否是复杂区域。简单区域:基于梯度的方式找到背景区块。复杂区域:采用SRGAN网络进行内容提取。

内容召回:

内容召回我们采用目标检测网络来实现,例如Faster-rcnn或者Mask-rcnn等,如下图所示:

772638dca54d16491580f9aaf339bdfbf49.jpg

区域判断:

根据拉普拉斯算子计算周边梯度,判断所处区域是否是复杂区域。

简单背景:

由于目标检测模型本身的局限性,会导致没法达到像素级别的精确性,因此需要对位置做修正。如果是简单背景就可以基于梯度的思想做位置修正,具体计算方式如下:

0b8d8c1ae52be5ff1799ccd6df272113b99.jpg

复杂背景:

背景是复杂背景时,左图是原图,右图是提取的文字区块:

2ac76163f436aa9b00f92cae2fccda506ed.jpg

  此时提取出的框不是完全正确,那么此时根据梯度等机器视觉算法已经不能对位置做正确的修正了。本文提出了基于GAN网络的方式来解决复杂背景内容提取问题,网络的主要结构如下图所示:

dc650750d1aad6bcda4fc9b5185fcb1e022.jpg

为什么选择GAN网络?

1)基于srGAN网络,该网络加入了特征图的损失函数,这样可以很好保留高频信息,能更好的保留边缘。特征图的损失函数如下图所示:040ee199aaa4190d05e7130ccf14f298da8.jpg

2)由于有对抗损失的存在,可以很好的降低误检率。

3)最重要的一点是在有透明度的场景下,语义分割网络只能“提取”元素,无法“还原”元素。而GAN网络不仅可以在提取元素的同时还原出未叠加时的像素情况。

网络训练流程图

787f67cb201323398398f1139bdcc0c83e3.jpg

针对业务场景对GAN网络做的改进

1.由于我们不是超分辨率场景,因此不用pixelShuffler模块做上采样

2.由于场景比较复杂,可以引入denseNet和加深网络来提高准确率。

3.内容损失函数对于压制误判的噪点效果不理想,因此加大了误判的惩罚,具体如下图所示:9b335d8cc60d22ab64819e08a3640eb6dd5.jpg

预测获取的结果图I:

ee81318fe6bfa48581e6c1de1b5e19b7208.jpg

预测获取的结果图II:

9e404531d299a25338499efd6bd39d0cc00.jpg

结束语

本篇我们通过复杂背景内容提取的介绍,提出了一种机器学习为主,图像处理为辅去精确获取特定前景内容的方法,得到了高精确率、高召回率和高定位精度的识别结果。

下图分别是传统算法grabcut,语义分割方法deeplab和本文方法的各个指标的情况。565a64b036f743006b48f7f5524e0b7b1f5.jpg

经过数据论证,我们发现了一个值得进一步优化的点——需要大量样本适配不同的特征尺度,这里的投入会相对较大。如何进一步提高打标效率呢,我们将会在后续系列文章中和大家分享。

本文为云栖社区原创内容,未经允许不得转载。

转载于:https://my.oschina.net/u/1464083/blog/3071540

你可能感兴趣的文章
nt的19个秘密武器(转)
查看>>
别让IE和Office泄露了你的秘密(转)
查看>>
让Windows2000和WindwosXP和平共处(转)
查看>>
将回收站变成保密站(转)
查看>>
制作Windows2000启动的“机密钥匙”(转)
查看>>
小心防范最易被黑客盯上的注册表位置(转)
查看>>
用注册表对系统进行全方位维护和管理(转)
查看>>
修改注册表阻止OfficeXP发送错误报告(转)
查看>>
不再费时费力两招快速定位注册表项(转)
查看>>
Win2K无盘终端网组建全攻略(6)(转)
查看>>
XP鲜为人知的注册表秘技大放送(转)
查看>>
在多用户PC中密藏文件(转)
查看>>
改改注册表,识破真假死机(转)
查看>>
系统秘籍:修改注册表管理XP(下)(转)
查看>>
修改注册表停用Windows徽标键(转)
查看>>
系统秘籍:修改注册表管理XP(上)(转)
查看>>
修改注册表消除应用软件乱码显示(转)
查看>>
解开被锁注册表的四种方法(转)
查看>>
玩转注册表:XP六条未公开秘技放送(转)
查看>>
巧用注册表备份文件(转)
查看>>