1.保荐制度的本质
推荐系统的本质是从庞大的内容池中选择用户感兴趣的内容。
内容池有几十万、几百万的内容,涵盖文章、图片、小视频、问答等多种体裁。一台机器在进行内容与用户的匹配时,主要取决于三个要素:内容、用户和用户对内容的兴趣。
第一个要素,机器如何理解一段内容?
简单来说就是基于关键词识别技术的内容表征。什么是关键词识别?用一篇文章《女生自尊心受挫!c被塞普琴科的球队打死,梅西感到63年的耻辱”为例:
在这篇文章的标题和正文中,出现了“c罗、塞普琴科、梅西、博彩、球队、欧洲杯”等多个词语。很明显,都是体育词汇,所以本文会先大致归类到体育领域,再根据具体的关键词细分到“***、国际***”等两三个类别。
内容描述
机器提取的高频词是实体词,即名词和代词。像“的”、“的”、“的”、“儿”、“为”、“约”、“虽然”,但“因为”这样的虚词和屈折词,并不作为系统识别的关键词。所以,在标题和正文中揭示准确的实体词,会对机器理解你的内容很有帮助。
第二个要素,机器如何理解一个用户的阅读需求?
机器会根据用户的特征画出用户的画像。比如他的基本信息“性别、年龄、地域”等等;还有他的行为信息,比如“订阅账号、历史浏览文章、喜欢的内容、关注的话题”等。以及用户的当前环境,例如“工作、旅行和娱乐的地方”。获得这些用户信息后,系统会对用户进行分析和计算,计算出内容类别、话题、人物等。用户喜欢的,从而完成对用户的描述。
不同特征的推荐效果
当内容特征、用户特征和环境特征被提取时,机器将整合所有因素来拟合用户对内容的满意度函数。它会估算用户每篇文章的点击概率,然后根据用户的兴趣从几十万到几百万的内容池中对所有文章进行排序。脱颖而出的前十篇文章会被推荐到用户定位器上进行展示。
2.一篇文章的推荐之旅:初审–冷启动–推荐–复试
一条内容发布后,在整个系统中会经过几个步骤:首先会进入初审——初审通过后会进行权重推荐,即“冷启动”——冷启动后会正常推荐内容——在推荐过程中,用户的点击、评论、举报等行为会触发审核过程,影响后续推荐。
推荐流程
初审
初审的目的是判断该内容是否有违反国家相关法律的风险。在这个过程中,机器会判断优先级,把内容交给不同的人去审核。在机器和人力的配合下,内容会以更快的速度通过初审,从而即时呈现给用户。
初步试验
冷启动
“冷启动”是一个推荐概念,指的是一篇新文章如何能够获得最初的几千个呈现。一篇新文章与已发表的文章相比,在推荐上处于劣势。所以对于所有的新内容,系统都会进行加权推荐,让这个内容展示上千次,观察用户的点击、分享、喜欢等行为。
基于前几千个演示文稿,机器可以确定哪些人喜欢这些内容,哪些人不喜欢。当内容获得足够多的冷启动机会,就会不加权。至于内容的后续推荐,完全看实力!
正常推荐
冷启动阶段可以显示一条内容的推荐效果。如果一个内容推荐效果非常好,机器会认为这篇文章有潜力,会进一步扩大推荐给更多的用户,1万、3万、5万甚至更多。如果用户对阅读该内容不感兴趣,系统会收紧推荐,减少后续推荐。
冷启动
复审
在正常的推荐过程中,基于各种用户行为,机器会检测到很多数据异常。举个例子,如果一条内容的点击率特别高,但同时又有大量的***和报道,那么这条内容就会再次进入审核流程,也就是审核。审查过程中,如发现有标题党、封面党、低俗、虚假等问题,推荐将被停止。
3.推荐中的常见问题
创作者经常会问:为什么推荐流量不稳定?为什么推荐中间不推荐文章?为什么我的推荐无效?…也许是因为你不知道以下原因:
消重
同样的热点话题,文章的主题和风格都差不多。为什么有些文章被推荐了几百万次,而有些文章只被推荐了几千次?黑板在这里:今日头条减肥攻略。为了保护原创内容,提升用户的阅读体验,在众多同类文章中,机器会优先推送原创文章。
为了避免减肥,创作者必须坚持高质量的原创,不要用低质量的内容做无用功。面对热点内容,我们要谨慎追求,学会培养自己独特的个人风格。
同类文章挤压
对于同一个热点,推荐系统会选择最合适的内容,推送给用户。所以,如果这个热门话题的其他文章表现不错,很可能会影响到你的内容推荐。换句话说,每篇文章的推荐量不仅取决于当时的具体环境,还取决于当时整个内容池中其他文章的表现。
内容本身情况
创作内容质量不稳定,不够垂直,会影响系统对作者创作能力和专业性的评价。机器会判断一个作者的专业性,优先推送高度专业化作者的文章。如果作者频繁更换创作领域或者内容质量参差不齐,会导致系统难以对作者进行评价,影响推荐效果。
但是,如果一个内容本身属于一个小众领域,目标群体有限,那么推荐系统在推荐了这些群体之后,就没有办法再推荐给别人了。另外,短小的内容限制也会影响推荐,比如一个体育赛事报道。一个小时后,分数可能会有很大变化,推荐就不继续了。
复审拦截
如果中间推荐了一段内容,突然不推荐了,可能是这段内容存在数据索引问题。比如点击率高得惊人,***高得惊人,这种情况就会进入审核程序。
在审查中,有四种问题会被严格审查:一是标题党,标题夸张或题字不符;第二,封面是党还是低俗,比如封面图片不清晰,内容涉及低俗导向等。三是虚假,如文章内容违背科学常识,描述未经证实,或与已发生的事实相反;四是含有推广信息,如二维码、***号、微信号等联系方式或变种,或非法医疗、非法财经等恶意推广内容,会被审核拦截。
影响推荐的其他因素
当然还有冷启动的推荐效果差,粉丝的数量和质量,用户对文章的喜好,外部环境等等。也会对内容的推荐效果产生一定的影响。
4.如何获得更高的推荐?
第一,关注内容价值,针对用户需求打造优质内容。调查显示,今日头条的用户非常注重文章的内容价值,他们喜欢视角新颖、信息增量、观点清晰深入的内容。坚持原创首发,你也会得到平台的资源倾斜,在类似文章中得到更多推荐。
二、把握关键词原则。如何让机器更好的理解你的内容?在标题和正文中频繁使用实体性词语(名词、代词),避免使用非常规词语,如踢腿之年、久居、会城等。在使用姓名和地名时,尽量使用全名,而不是缩写或昵称。
第三,优化文章的视觉体验,改善文章的呈现形式。确保标题和封面图片所传达的信息足够清晰,对用户有足够的吸引力;保证图片的强关联性,利用排版工具突出重点内容,对图片进行适当的标注和说明,都有利于提高用户的阅读体验。
本文来自枯萎○还行投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/578934.html