今日头条的推荐机制分析.docx

上传人:b****0 文档编号:17748450 上传时间:2023-08-03 格式:DOCX 页数:9 大小:137.87KB
下载 相关 举报
今日头条的推荐机制分析.docx_第1页
第1页 / 共9页
今日头条的推荐机制分析.docx_第2页
第2页 / 共9页
今日头条的推荐机制分析.docx_第3页
第3页 / 共9页
今日头条的推荐机制分析.docx_第4页
第4页 / 共9页
今日头条的推荐机制分析.docx_第5页
第5页 / 共9页
今日头条的推荐机制分析.docx_第6页
第6页 / 共9页
今日头条的推荐机制分析.docx_第7页
第7页 / 共9页
今日头条的推荐机制分析.docx_第8页
第8页 / 共9页
今日头条的推荐机制分析.docx_第9页
第9页 / 共9页
亲,该文档总共9页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

今日头条的推荐机制分析.docx

《今日头条的推荐机制分析.docx》由会员分享,可在线阅读,更多相关《今日头条的推荐机制分析.docx(9页珍藏版)》请在冰点文库上搜索。

今日头条的推荐机制分析.docx

今日头条的推荐机制分析

今日头条的推荐机制分析

今日头条,大家公认的一个超级大流量平台,其最大的特点就是文章的智能推荐系统。

但是,有些人在今日头条文章动辄几十万、几百万,甚至上千万阅读,但有些则只是几十、几百的流量。

除了内容本身的质量以及账号区别之外,最大的关键就在于其算法推荐规则。

搞懂今日头条文章推荐规则,是在这里进行精细化运营的核心关键。

那么,今日头条海量文章推荐的机制是怎么样呢?

为什么有的文章展现量几百万,有的却只有几十几百?

对于文章的推荐机制我们又能做些什么?

首先在说文章推荐规则之前,另一个机制大家一定要先了解,那就是今日头条的消重机制。

你在头条号发布的内容,在通过审核和进入推荐系统之间,还有一道难关,那就是下面要说的消重机制。

基本上,文章被消重是头条号所发布内容无推荐量的最常见的原因。

1想要被推荐,先了解消重机制

1)什么是消重?

我们都知道,在互联网上,同样的文章、图片、视频往往会被很多其他媒体转载或复制。

如果我们在XX搜索一篇内容,经常会得到多个网址。

所以,我们一般需要自己筛选和判断,哪个网址更权威,更有价值,再点击去访问就可以了。

但是今日头条不一样,它是基于算法推荐给用户的。

所以一定要保证不能连续给用户推荐了几篇相似的内容,否者用户体验会非常差:

怎么老是给我推荐一样的内容,什么鬼系统!

所以,今日头条在推荐你的文章之前,必须确定这篇内容:

●在系统里是否存在相同或者高度相似的内容?

●如果存在,那么这篇内容的来源是否是最权威、最有价值、是否最有可能是原创来源?

那么,消重就是指对重复、相似、相关的文章进行分类和比对,使其不会同时或重复出现在用户信息流中的过程。

今日头条首先会通过消重机制来决定同样主题或内容的文章是否有机会被推荐给更多用户。

2)头条号内容消重的关键项

那如何判断两个内容是否相同呢?

如果让人来判断,可能就要逐字逐句地把文章读完才能判断得出来。

通过计算机这样去判断当然也是可以的,不过,当每天需要处理的内容达到十多万篇次的时候,这么做即使对于计算机来也太麻烦了。

今日头条的做法是,通过系统的计算,一篇文章的文本、标题、图片等都是可以转换成一串数字代码,也就是信息指纹。

这就像我们每个人的身份证,如果两个人的身份证号码一模一样,那么就可以肯定这是两个一样的人。

而文字信息的「身份证」也能起到类似的作用,对于图片、视频等信息形式,原理也是类似的。

这种算法模型这里就不多说了,重点来看影响消重的关键项。

●来源头条号是否开通「原创」标记;

●发布时间(首发很重要);

●来源的权威性和在网络上被引用的次数。

除了内容消重的规则外,头条号平台上实际上还存在这一些针对内容之外的消重规则:

●标题和预览图片的消重。

这个原理与内容消重相似,只不过是只比较标题以及预览图片的「信息指纹」。

之所以要对具有相同的标题或者预览图片的内容进行消重(哪怕它们的内容并不相同),是因为,假如用户没有点击内容详情页,他是不知道内容写的什么的。

那么,光看标题和预览图就是系统把两篇一样的内容重复推荐给了自己,可想而知这样的浏览体验是很糟糕的。

况且,很少有人愿意连续点击几篇看上去一模一样的内容,因此这样的推荐也很少起效果。

●针对相似主题的消重。

你肯定对这样的景象不陌生:

每当有某个社会热点事件或者话题出现的时候,媒体、自媒体、KOL们一拥而上,竞相报道事件细节或者发表观点,让你的微博、朋友圈被有关这件事的种种内容“刷屏”。

但是,对于用户来说,需要的其实并不是反复看到相同的信息,如果有足够优质的报道或者观点的话,其实看有限的几条就够了。

相似主题的消重其实和内容的消重其实原理是一样的,是对文章中全部的关键词(也就是我们常说的标签)进行统计并计算信息指纹,当然也可以对其中与话题相关的关键词进行统计分析。

一旦系统发现了可能对某篇内容感兴趣的用户,那么系统会自动把具有同样「信息指纹」的内容或话题中,经过挑选最优的一篇推荐到用户的信息流。

剩下具有相同「信息指纹」的内容,就几乎不可能获得推荐了。

这里,我重点说一下相似主题消重,这个与我们是最最最相关的。

因为头条要追热点,基本是大家公认的事实。

3)追热点小心被消重

在头条号追热点话题的时候,一定要谨慎追逐。

因为有这个相似主题消重,那具有相同「信息指纹」的话题或热点,几乎不可能获得推荐了。

这就是为什么很多时候我们的热点文章在头条号会推荐惨淡。

一个热点再热,用户的兴趣也是有限的,特别是如果你的热点角度没什么区别,平台已经推荐过相似内容了,那系统是不愿意再推荐的,因为用户他已经懂了,再推荐就是打扰了!

所以说你追热点的角度一定要差异化,写热点文章有很多切入点,你可以把一个热点进行拆分关键词,每一个都可以是一个很好的切入口,这就是所谓的“同主题异角度”。

与此同时,你的标题也要明显的差异化,因为这个热点标签的提取统计,主要来自于标题,而后才是内容。

并且,在一个大热点下,用户想知关于热点的各个方面,所以标题角度也要明显。

如果不能确定自己创作的角度足够独特,及自己的内容足够优质,那么就不要随意地追逐热点,免得做了无用功。

2今日头条文章推荐规则解析

我们知道,文章的阅读量很大程度上取决于系统的推荐量,那么一篇文章的推荐量,是由什么因素决定的呢?

之前,头条官方给过一些标准,即影响文章推荐的8个因素是:

1)点击率+读完率:

点击标题并读完文章的人越多,推荐越高;

2)分类明确:

文章兴趣点越明确,推荐越高;

3)文题一致:

做恰如其分的标题党;

4)内容质量:

优质内容才是根本;

5)账号定位明确:

文章题材随意宽泛的账号,得到推荐的概率更低;

6)互动数、订阅数:

读者越活跃,推荐越多;

7)站外热度:

在互联网上关注度高的话题,推荐越多;

8)发文频率:

经常发文,保持活跃很重要。

不过这些都是一些表象的东西,这里更系统和深入的说一下,只有知道本质了我们才能更好的做好这些。

1)系统是怎样理解你的文章的?

今日头条的文章识别系统会对文章进行特征识别,从而判断文章讲的是什么类型和领域的内容。

特征识别的维度有很多,在这里我们重点解释「关键词」。

系统会根据文章中出现的频率,提取出一些词语作为关键词,关键词的判定原则有二:

词频高:

如一篇体育类文章内容关于某场足球比赛,那么文章可能会出现的高频词就包括球员名字、足球术语或技巧等,如「C罗」、「射门」、「突破」。

同类文章中出现次数少:

作者撰文时常用到的虚词、转折词等出现频率也很高,但它们不会作为关键词被提取出来,因为这些词在文章中是普遍存在的。

系统判定出一篇文章的关键词后,会将这些关键词与文章分类模型进行比对,命中哪些分类词库关键词的比例大,文章即被打上该分类的标签。

如,一篇文章排名靠前的关键词为「C罗」、「射门」、「西甲」、「马德里」,那么该篇文章可能会被打上「足球」、「国际足球」、「西班牙」等标签,完成对文章的初步认知。

而除文章正文关键词识别外,系统还会对标题进行关键词的识别和分类比对。

因此,在标题中露出具代表性的实体词非常重要。

2)你的文章会被推荐给哪些用户?

每个人的阅读兴趣都是大不相同的,个性化推荐机制要做的事情就是——让每位用户看到可能感兴趣的内容。

这种精准推荐,是建立在机器对每位用户都有充分认知的前提下的。

在系统里面,每位用户实际是由大量数据构成的,用户的阅读兴趣就藏在这些数据中:

●用户的基本信息

性别、年龄、所处地理位置(城市或地区);还有使用机型、授权账户(如微博、微信等)、手机上经常使用的其他App等。

●用户主动订阅或喜欢的内容

订阅帐号;订阅频道;关注的话题。

●机器通过计算得出的用户阅读兴趣

用户阅读过的文章分类和关键词;相似类型用户还喜欢阅读的其他文章类型;用户在今日头条客户端主动标记「不感兴趣」的实体词或文章类型。

根据以上数据,系统对用户的阅读兴趣就能有个基本的判断。

然后通过对数据的处理,每位用户将被系统打上各种标签。

如一个用户阅读的文章中关键词排名靠前的是:

C罗、皇家马德里、欧洲杯、小米、魅族、苹果。

那么,这位用户可能被打上「足球、「皇马」、「科技」、「手机」、「米粉」等标签。

不同的用户会被打上不同的标签。

最后,当一篇带有「C罗」、「足球」标签的文章在进行推荐时,系统会将其自动匹配给带有「C罗」或「足球」标签的用户,这便是推荐引擎的个性化推荐。

当然,系统推荐的实际情况会远比这复杂得多,但推荐的基本原理便是:

系统先通过数据来来给内容和用户打上各种标签,然后通过算法将内容标签跟用户标签进行匹配,接着根据第一批推荐情况,决定后续的推荐量,这个下面说。

3)你的文章是如何被推荐的?

为让受欢迎的内容被更多用户看到,不受欢迎的内容不占用过多推荐资源。

头条号文章在推荐时,会分批次推荐给对其感兴趣的用户。

如何理解分批次推荐呢?

文章首先会被推荐给一批对其最可能感兴趣的用户(这批用户的阅读标签与文章标签重合度最高),这批用户产生的阅读数据,将对文章下一次的推荐起到决定性作用。

数据包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。

这很好理解,能吸引众多用户点击的文章自然会被认为更可能是好文章。

文章的首次推荐,如果点击率低,系统认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。

以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。

此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时和一周。

因为这种扩大推荐的机制,你想获得更多的阅读量,就必须努力把各维度阅读数据(点击率、用户阅读时间、收藏数、评论数、读完率等)维持在高位水平。

这也就上面官方的一些标准。

其中,至关重要的当然是点击率,也因此,标题和封面图的重要性便不言而喻。

这也是今天注意力稀缺时代,文章获得好的传播的关键要素。

虽然如此,但除了点击率,有一个特别重要的点总是被大家忽视,就是:

文章所对应的标签,直接决定了匹配的相对应标签的用户量。

有的标签本身就对应很大体量的用户,而有的标签对应人群很小,就算点击率再高,天花板也很低。

这就是为什么很多专业性文章阅读不高,而情感鸡汤、娱乐八卦、社会新闻的推荐一般会很高。

这也是为什么大家都会去追热点,因为热点标题对应的用户群体非常大。

所以说,我们选题,包括文章标题以及内容里面的关键词使用,一定要基于用户量大的标签,这样可以获得更多的推荐量。

之前今日头条官方就发过最受欢迎的一些标签,这些都是一级标签,你有没有经常使用?

而且,今日头条还专门推出了热词分析功能,帮助大家找到不错的标签。

利用热词分析功能可以大大增加系统推荐量,提高文章的阅读量。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 历史学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2