很多做SEO的朋友应该都传闻过TF-IDF算法,网上大部门的介绍都是围绕算法的公式和介绍,他们文章虽然很专业,但对付SEO优化人员来说,要如何运用于SEO工作傍边却不太理解。本文用简单的实例进行说明,谈谈如何将TF-IDF算法运用于网站SEO优化傍边。
TF是指词频,查询的关键词在文档中呈现的次数统计。相关文档是这样介绍的,假设查询关键词在同一个文档中呈现的次数越多,代表这个关键词越重要,越能代表文档的主题意思,文章主题与关键词意思越接近,那么做SEO如何运用这个常识点呢?
假设有一篇文章的标题是:“SEO培训教程”,从字面上理解,文章主要是以SEO培训为核心,“外包”为拓展词。假设文章内容里SEO培训呈现20次,培训呈现25次,教程呈现10次,根据TF词频的法则,那么SEO培训是文章主题,这个很好理解。
实际上有些时候写文章时,在意思很明确的情况下,会省略主词。好比网站建设外包价格、网站建设外包流程、网站建设外包公司介绍,会缩写成:外包价格、外包流程、外包公司介绍。这样会导致外包呈现的次数大于网站建设,TF词频则会认为外包是主题,呈现错误的判断。
由上可知,在做SEO关键词结构的时候,提升需要优化的主关键词呈现频率。固然搜索引擎判断网页主题有很多维度,这里只是单从TF词频的角度考虑,个人认为这样做会缩短搜索引擎判断网页主题的时间,对SEO来说是有利的。
这个观点如果看文档的话有点难理解,当初笔者看百度百科好几次才大白。涉及到庞大的公式在这里就不讲,结合TF一起来理解,TF-IDF的意思是,一篇文章中某关键词呈现的次数越多,且在搜索引擎的资料库中包括该关键词文档数越少,则说明这个关键词越能代表此网页的主题。
举个例子来说明,假设有一篇文章,有两个关键词:“SEO优化”和“SEO培训”,在文章中,这两个关键词呈现的资料都是20次,但是在百度的资料库中,包括SEO优化的文档总共有一千万个,包括SEO培训的文档有五百万个,那么则说明,SEO培训越能代表这文章的意思。或者搜索引擎资料库中包括关键词的文档数量一样,文章中呈现次数越多的关键词越能代表网页主题。
从SEO的层面讲,IDF这个值是客观存在的,不必去深究,只要大白差异关键词之间的文档数几多就行,以百度为例,搜索任何一个关键词,在搜索框下面会有一个:“百度为您找到相关成果约XXX个”的这样句子,里面的数值可以作为文档数参考。每个搜索引擎的包括关键词的文档数可能纷歧样,但是整体的相比拟例值应该是差不多的。并且随着时间的推移,文档数也会不绝产生改变。
总结:TF-IDF加权算法实际上是无论我们的网站是首页、栏目页还是内容页,我们想要优化的关键词,或者通过分词合成的关键词都必需呈现最多的次数,这样我们想要优化的关键词排名自然会上升,但不能故意聚集。
Copyright © 2023 All Rights Reserved 版权所有 网络音乐文化组