蜘蛛陷阱:flash、session id(跟踪用户访问生成网址参数)、框架架构(frame)、动态url(数据库生成带有?=及参数的网址,目前抓取来说没有问题,过多参数还是不利于搜索引擎,建议生成静态,伪静态注意url唯一)、js、强制使用cookie。
导航清晰:树状结构,主次栏目导航、面包屑导航(当前位置)、避免页脚堆积栏目。
网站权重布局:首页>频道>栏目>文章页;子域名>目录。
禁止抓取:nofollow:不跟踪链接,不传递权重和锚文本;robots:禁止抓取网站内容,如淘宝网全站禁止,一般禁止抓取后台及数据库信息,可以屏蔽目录来解决重复收录的问题(如:http://yicheng.zdyrs.com/robots.txt),Canonical:地址规范标签。
动态url:数据库生成带有问好、等号及参数,容易让搜索引擎限于死循环,现在抓取没有问题,容易造成重复,所以建议Url静态化、伪静态(url重写)。
Url规范:越短越好、注意目录层次。
网站地图:用户看的文字栏目地图和给搜索引擎的链接xml地图。
尽可能多的曝光内链促进收录和内部投票(织梦做到了极致:头条、推荐、幻灯、特荐、相关、排行、最新等)。