美国大众点评网Yelp如何利用深度学习对美食照片进行评分.docx
《美国大众点评网Yelp如何利用深度学习对美食照片进行评分.docx》由会员分享,可在线阅读,更多相关《美国大众点评网Yelp如何利用深度学习对美食照片进行评分.docx(2页珍藏版)》请在冰点文库上搜索。
美国大众点评网Yelp如何利用深度学习对美食照片进行评分
美国“大众点评网”Yelp如何利用深度学习对美食照片进行评分
Yelp的数据库中已经存储了几千万张相片,用户们现在每天都会上传大概十万张,而且速度还在不断加快。
事实上,我们发现相片的上传增长率大于相片的查看率。
这些相片反映着本地商业的内容和质量,提供了非常丰富的信息。
关于这些相片非常重要的一方面,就是展示出来的内容的类型。
在2015年8月,我们上线了一套新系统,用于将传统饭店有关的相片分为食物、饮料、外观、内景和菜单等几大类。
从那以后,我们又为咖啡店、酒吧等类似的商店上线了类似的系统,以此来帮助用户们尽快发现他们想要寻找的那些相片。
最近的一段时间,我们又在研究如何进一步提高用户的满意度,具体方法就是给他们看更多漂亮的图片,改进我们的相片排名系统。
理解相片的质量
对比相片的质量,看起来很像是一件非常主观性的工作。
喜欢哪张相片或不喜欢哪张相片,有许多因素会影响这样的决定,而且依正在做搜索的用户个人不同,结论也会有所不同。
为了能为Yelp的用户提供更好的体验,相片理解团队必须担当起这项非常有挑战性的工作:
确定哪些特点会让相片更受人喜爱,并研发出一套算法,可以依据这些特点来可靠地对相片做出评判。
首先我们试着为相片构建一个点击率预测器,数据源就是从日志中挖掘出来的点击数据。
我们的假设是,那些被点击了更多次数的相片应该很明显地会比其它相片好。
可事实上这个想法的效果却没有想象中好,原因有几点。
首先,人们常常会点开那些比较模糊、或者里面有非常多文字的相片,这么来看看里面到底是什么内容。
另外,因为Yelp上的相片有许多种展示方法,所以很难有效地对比某些特定相片的指标。
之后,我们试用了好几种不同的计算机视觉技术,试着发现一些相片的内在特征,希望可以直接用于质量评分。
比如,对摄影师来说有个非常重要的特征叫“景深”,它用来测量相片有多少内容是在焦点里面的。
用浅景深可以非常有效地将相片中的物体与它的背景区别开来,上传到Yelp的相片也不例外。
很多时候,在关于某间饭店的许多张相片中,那些最美的总是那些非常明确地对焦到某个具体物体上的。