即将穿越忧郁的森林!

网站将于2019年10月10日永远关闭!



网站地图·跟踪码


网站地图
Sitemap 就是网站上链接的列表。 制作Sitemap,并提交给搜索引擎可以使网站的内容完全被收录,包括那些隐藏比较深的页面。这是一种网站与搜索引擎对话的好方式。XML Sitemap 通常称为Sitemap(首字母大写 S)。 每个搜索引擎主要识别地图格式效果不同,建议分别采用Html、Xml、Txt格式。很多网站没有,可能是网站制作者并不了解,也许是他们不想竞争者能找到网站。

网页跟踪码
网页跟踪码是网上产品跟踪和市场调查的极佳工具。网站每一个网页都内置跟踪码。你就能发现某个国家,某个地域,某个城市的人,在浏览你的网页。更可以发现他们对那个网页,或在某特定的网页,停留了更多的时间。以此可以逆向推论出他们的意图与方向。

邀请机器人的代码
网站推广的首要关键点,就是在空间存放机器人邀请文件。 

最常用就这二行:

User-Agent: *
Allow: /

后附其它一些特殊的用法解释:
User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录
Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录
Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录
Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址
Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片
Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。
Allow: /cgi-bin/这里定义是允许爬寻cgi-bin目录下面的目录
Allow: /tmp 这里定义是允许爬寻tmp的整个目录
Allow: .htm$ 仅允许访问以".htm"为后缀的URL。
Allow: .gif$ 允许抓取网页和gif格式图片。
Sitemap: 告诉爬虫这个页面是网站地图。