TF-IDF
tf-idf是文章内容的相关性得分的统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。 是现在搜索引擎排序的核心算法,通常国内的百度、神马在相关性排序得分比率在35%以上,谷歌google在50%以上。
比如用户搜索“SEO工具”,根据我们的直觉,与SEO工具相关的词语如“百度”、“站长”、“外链”、“排名”等等,这些词语都是非常相关的关键字,这些相关的词语也决定了你的网站内容质量。
相关词越多,根据等级布局不同的密度,根据推荐建议更新你的文章。关键词密度越合理,文章排名就会越靠前,排到首页你的流量就多了。