**如何做可控的seo?
1.从常识出发得出的seo公式:
seo流量=整体收录量*整体排名*整体点击率。
排在第一名的关键词平均约有29%的流量,无关关键词可能达不到3%,一般的整体**点击率在0.5%,优化好以后能达到5%,三个因素同等重要,所有影响seo的因素不会超过这三个因素)
1)整体收录量由什么决定?
整体收录量=搜索引擎抓取量(指不重复的抓取量)*页面质量(节假日跌一半流量最多,超过了就有问题,收录只看趋势,因为收录量一般不准,但趋势是准的,点击次数/展示次数=点击率)搜索引擎在不断的删除收录的页面同时也在不断地抓取页面筛选后并存入数据库。
2)抓取量减少时应该做信息对比(减少前与减少后的信息作对比,主要是看日志看访问次数和点击次数(即抓取次数),以及抓取和访问的时间和时间间隔)
3)抓取量减少的原因:1.防采集(5分钟访问1000个页面限制,可能也限制了爬虫) 2.
防火墙规则(屏蔽ip) 3.状态码返回多个返回码导致搜索引擎不再抓取(比如两次301跳转,a跳到b,b再跳到c,则a到c经过了两次301跳转。或者301跳转后出现404等) 4.
服务器升级(win2003升级到win2008,网卡忘记打补丁出现半双工状态,导致访问速度慢)5.一个物理机分成三台虚拟机,配置分配资源的时候分配不好导致服务器访问速度慢把影响seo的因素都数据化:1.
因素2.数据化3.长期观察数据和数据之间的关系(流量涨和跌都要知道原因)很多**日志属于机密,包含了三部分:
用户的行为(机密),爬虫的数据(非机密seo关注),服务器的信息(非机密seo关注),seo可以要求看后两部分没有数据是无法判断如何优化的,长期观察数据可以积累很多经验一般下线产品或违法页面会做404,google和的后台显示抓取量是包含重复的抓取量的(有10万的抓取量但是只有1万页面被抓去,一个页面平均抓取10次)
4)搜索引擎页面的抓取量(不重复的抓取量)(不同的搜索引擎相区分后分别分析)=爬虫总的停留时间/单个页面停留时间(做nofollow改动)(晚上没人访问的时候爬虫特别活跃,晚上尽量不要停止服务器)单个页面停留时间:网速越快越好,服务器的稳定性,抓取量过大服务器会当机。一般在200-300毫秒以下,线路是北京联通,如果用电信的网络会很慢,尽量用双线(两个ip)的或者bgp(任何网络链接都很快只有一个ip)机房,有可能只换一个机房流量就下降了(dns解析的优化,减少解析的时间和稳定性,寻找热门并且稳定的dns),页面**的压缩,页面**精简化同样可以windows容易死机,linux不容易死机。
爬虫总的停留时间:1.爬虫主动给你的时间(来访的次数和每次访问的时间长短)(权重高的**时间长,30到40个爬虫且可能达到24小时以上)(权重不是pr值,权重是搜索引擎对**的重视程度)(爬虫抓取页面是不做判断的,不过会有一定优先级的划分,模板经量少抓内页是漫游方式抓取,分析单个ip的爬虫,不同ip爬虫可能抓取重复)2.
爬虫被动给的时间(被动访问靠外链)(做外部链接要有大量的入口,而不是让入口集中在一个地方(比如都集中在首页)这样做有助于增加被动抓取的时间)
注:在日志里看不出单个页面停留时间,因此单个页面平均停留时间是用爬虫总的停留时间/抓取量pr值高只能说外部链接多。
5)页面质量:1.技术上的问题(正常只有一个200返回码,搜索引擎查看网页主要看:
1)url 2)html 3)head信息,编码语言,如:中国人做英文**往往编码语言使用简体中文,在国外就没有排名,apache和iis的设置也会影响head信息,头部信息显示网页最后更新时间,如果时间没有变化则搜索引擎不抓取,减少重复抓取,属于优化,静态文件默认有,动态默认没有,对于动态网页来说默认没有最后更新时间(last-modified),因此内容长度content-length就决定了内容是否更新,但并不精准,查看seo指南,google站长指南,**http1.1手册学习)2.
内容上的问题:原创一定能收录一段时间内(7-8年)不会被删除(收录不一定是马上),搜索引擎要求使用静态页面和**唯一化和**指南的参数处理就是要解决页面重复性问题,原创影响权重,权重影响收录(影响爬虫停留时间),权重影响整体排名,伪原创—关键词替换(单纯替换不起作用)—去头尾—几篇造一篇(搜索引擎判断相似度,首先净化网页,先去模板,判断正文,先比较标点符号,标点相同则是相同文章,之后将文章分解成多个部分生成特征码,进行特征码相似度对比,只去头尾是行不通的),一个**一天能贡献500篇原创权重会非常高,可以采集搜索引擎没有抓取或者埋藏很深的内容(nofollow要慎重使用,原创不等于权重)
二、整站排名:
1)核心关键词:1.单个页面的排名和整站排名是两回事,排名不等于流量,页面的流量不是靠某个核心关键词引来的流量,而是靠多个词的组合的词得到的ip,向来都是长尾词的转化率高流量大,一个网页没有所谓的核心关键词,看网页哪些词带来的流量,分布在哪些地方,热门词流量约占5%-10%,长尾词流量约占90%-95%。
看目标关键词的多少是页面有效流量的关键,做热门关键词是想当然。从用户体验角度设计页面是符合seo的,关键词的位置比频率和密度重要,换友情链接的标准不是pr而是流量(即页面访问量大不大,能否带来直接流量,内容相关能带来很好的直接流量,因此友情链接的标准是1.流量2.
相关性)加nofollow的链接作用1.不抓取2.不给锚文本。
seo工具:httpwatch professional,抓包工具,抓取本地和**的所有通讯信息,可以查看网速慢在**,****出了问题,搜索引擎收录数只做参考,主要看收录数趋势,实际收录量可以在半年日志的抓取总页面数做参考,很多页面不抓取怎么办?主要是靠增大抓取量来提高抓取,即增大爬虫停留时间,减少单页面抓取时间,减少无效页面(即垃圾页面,注册、搜索、用户名、加入收藏、登陆、加入购物车等,)和减少重复页面的抓取(总的抓取页面不变,减少无效抓取和重复抓取,则增加有效抓取)
2)网页是排名的最基本单位,在搜索引擎看来整个互联网是网页的集合,某一个网页在某一个主题上高度集中,并有大量内外链接,则其排名就高(被相关与某一主题的大量外部网页链接的网页,认为这个网页也与这个主题相关,且相关性最高,从而在这一主题上排名最好,站内站外**是一样的),和主题不相关的外链没有太多作用,符合这个模型的网页排名都会很好,而权重起到的作用约在20%左右,因此**的结构很重要,**的结构是要点,在不影响用户体验的情况下符合结构要点,可以在网页内设置相关搜索(增加用户体验的同时增加内链结构)
3)单页排名=45%页面外部因素+25%页面内部因素+30%其他(google公式,外部因素的比例在降低,其他因素的比例在增加,在panda算法后主动删除外部链接,可以尽量避免降权),页面没有出现关键词,但搜索关键词却出现在第一位,原因在于外部链接的锚文本是这个关键词,并且外部链接很多,如果加nofollow则没有这个效果。根据数据加nofollow,根据用户体验加外部链接,不能生搬硬套的采用相关性链接,排除其他链接,排名不看外部链接的多少,而是看相关性(相关外链的比例)
外部因素(从大到小)
1.**外部链接流行度、广泛度。
2.这个网页内/外部链接的锚文本。
3.**在主题相关的**群中的链接流行度。
4.外部链接页面本身的链接流行度(权威链接)
5.**新外部链接产生的速率。
6.外部链接页面的主题性。
外链有没有用户点击是否是认为这个外链是垃圾链的理由之一?或者说是否会判断某一外链是否有点击?思考)
内部因素(从大到小):
1.网页标题(title)中是否有关键词。
2.非关键词在网页内容上的位置(密度、频率次要,不能刻意)等(好位置特点是非常显眼,如标题等,好位置要考虑用户的需求,标题要写网页内容要点,没必要大量重复关键词,如书名,作者,出版社等,又如:租房的标题可以有小区名,区域,街道,合/整租,面积等要点,保证命中长尾)
3.**内部链接结构(pr的传递)(导航条,推荐等等)
4.页面内容和关键词的相关性(语义分析)
5.关键词在**主域名中的使用。
6.关键词在页面url中的使用。
其他因素:1.权重(所有正面因素的集合)
2.内容的原创性。
3.用户的行为。
doubleclick流量和用户行为查询网。
点击率也同样影响排名,没有点击的**排名会下降)挖掘没人要的流量,整站排名就是做好所有单页排名,搜索引擎看到没有抓过的页面会增加大量爬虫进行抓取,所以nofollow以后有可能不仅不会减少抓取,反而会增大抓取,原创内容可以看其他**是怎么产生内容的,从而进行学习。伪原创如果在30%相似以上就已经很高了,原创文章相似度不会超过5%-10%。
三、点击率:
google搜索页首页第十位的能拿到2%的点击,搜索页首页第十位的能拿到3%-5%的点击。单页点击率1%一般在第二页,整站点击率1%说明整站排名在第二页。
点击率:1.对的人 2.
对的网页(google adwords关键词工具,**google adwords api工具(免费用一百万单位),申请api权限,要有截图,打算用api干嘛?人工审核,光年论坛关键词查询工具)
用户的行为:1.导航型搜索,用户知道要搜索的**,明确的知道**的存在,但是没有记住**(流量是问答型的4-5倍) 2.
问答型,以问答的方式搜索(流量是产品型的1.2-1.5倍) 3.
产品型,搜索产品和服务类(绝大部分seo在做)
导航型:导航型成为第一大流量是因为关键词多,主要是导航词极其长尾词组成,如:ipad配件(不是只有ipad官网才可以做),携程七天连锁酒店西湖分店等,导航词+服务类型+区域+评价+周边娱乐设施等构成,(有上百万次)做好自己的行业,找行业里的导航型,而不是去抢对手的品牌词(报纸,朋友,电视等对人的影响很大,从而进一步在网上搜索,形成了导航型),如兰州拉面馆可以做为大众点评网的导航型,因为官网可能没有做这个关键词问答型可以做问答频道(专门为某个问答做一个页面,有利于用户体验和搜索引擎优化),问答型转化率相对较高,可以达到10%(针对问题写的软文转化达到10%是没有问题的)
充分展示内容让流量自由生长(尽可能多的挖掘用户搜索的关键词,如:教育机构+酒店,交通要道+酒店,景点+酒店(西湖酒店,西湖雷峰塔酒店,西湖梅家坞酒店,西湖+xxx+酒店)),细分类(没有页面就去制造,用程序几万页面几万页面的去做)
10天学会SEO教程汇总
十。天。学。会。se0教。程。汇。总。by 野狼seo团队 10天学会seo 第一天 seo基础知识 一 今天是大家学习seo的第一天,不管是以前学习没有学习过seo,今天都要好好地来看我们的教程。10天不长也不短,如果是能够跟着教程一点一点的来学,你一定可以将seo学成,如果是觉得我们说的你都已经...
2019高级教程
最佳答案。1.找到 插入 菜单中的 选项,点击其中的 来自文件 就会打开 插入 对话框,通过其中的 查找范围 一步一步找到存放 的文件夹,看到你需要的 文件时双击它就可以了。2.如果你的 文件很大,插入ppt中之后还是很大,用鼠标单击该 他的周围就会出现8个控制点 小白圈 把鼠标放在任意一个控制点上...
Excel高级教程
index 在excel中统计与上报两不误 3 excel中单列 的打印方法 4 巧妙删除excel中的换行符 4 execl中为每页设置行标题 5 excel中日期与时间的快速处理 5 利用excel的函数和筛选功能巧妙分班 6 在excel单元格中设置 斜线 效果 6 将excel的文本数字转换...