首页 技术教程建站经验正文

宝塔网站如何屏蔽蜘蛛 禁止某些蜘蛛爬取

kmwl520 建站经验 2024-05-13 19:16:07 155 0 歆梦资源网

前言:有些网站不想做SEO,加上可能配置不好,各大搜索引擎蜘蛛的抓取反而给服务器造成了压力。

方案1:首先你得拥有一个宝塔防火墙,直接在防火墙里找到:User-Agent过滤,然后添加以下规则内容:

(BaIDuspider|Baiduspider|sogou spider|sogou web|360spider|Bytespider|toutiao|Sosospider|YodaoBot|msnbot|Googlebot|Amazonbot|dataforseo|DataForSeoBot|semrush|babbar|mj12bot|116.0.0.0)

方案2:在宝塔面板找到对应的网站,点击设置,点击配置文件,加入以下代码:

C
if $http_user_agent  "Baiduspider|baiduspider|sogou spider|sogou web|360spider|Bytespider|toutiao|Sosospider|YodaoBot|msnbot|Googlebot|Amazonbot|dataforseo|DataForSeoBot|semrush|babbar|mj12bot|116.0.0.0" return 403 

QQ截图20211209044235.png

Nginx内部标志UA的变量为 $http_user_agent,想要屏蔽某个UA,找到其它UA的关键词,按上面的设置即可。


如何禁止所有搜索引擎蜘蛛的爬行收录

可使用robots协议:建立 文件,上传至网站根目录:

屏蔽所有搜索引擎爬取网站的语法:

User-agent:*

Disallow:/

允许所有搜索引擎爬取网站所有内容

User-agent:*

只禁止网络抓取你网站的内容

User-agent:Baiduspider

Disallow:/

只允许网络抓取你网站的内容

User-agent:Baiduspider

User-agent:*

disallow:/

在线制作网站如何禁止蜘蛛收录网站在线制作网站如何禁止蜘蛛收录网站信息

我如何设置一个网站被禁止被爬虫收录?

网站建好之后,当然希望搜索引擎收录的页面越多越好,但是有时候我们也会遇到网站不需要被搜索引擎收录的情况。

比如启用一个新域名作为镜像网站,主要用于PPC的推广,这时候就要想办法阻止搜索引擎蜘蛛对我们镜像网站的所有页面进行抓取和索引。因为如果镜像网站也被搜索引擎收录,很可能会影响官网在搜索引擎中的权重。

下面列举几种阻止主流搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的思路。注:全网站屏蔽,尽可能屏蔽主流搜索引擎的所有爬虫(蜘蛛)。

1.被文件阻止

可以说文件是最重要的渠道(可以和搜索引擎建立直接对话),给出以下建议:

用户代理:Baiduspider

不允许:/

用户代理:Googlebot

不允许:/

用户代理:谷歌机器人手机

不允许:/

用户代理:谷歌机器人图像

不允许:/

用户代理:Mediapartners-Google

不允许:/

用户代理:Adsbot-Google

不允许:/

用户代理:Feedfetcher-Google

不允许:/

用户代理:雅虎!大声地吃

不允许:/

用户代理:雅虎!啜饮中国

不允许:/

用户代理:雅虎!-广告爬虫

不允许:/

用户代理:有道机器人

不允许:/

用户代理:Sosospider

不允许:/

用户代理:网络蜘蛛

不允许:/

用户代理:网络网络蜘蛛

不允许:/

用户代理:MSNBot

不允许:/

用户代理:ia_archiver

不允许:/

用户代理:番茄机器人

不允许:/

用户代理:*

不允许:/

2.按元标签屏蔽

将以下语句添加到所有网页头文件中:

3.通过服务器的配置文件来设置(比如Linux/nginx)

直接过滤蜘蛛/机器人的IP段。

注意:第一、二项措施只对“君子”有效,第三项措施要用来防“小人”(“君子”和“小人”一般分别指遵守协议的蜘蛛/机器人)。所以网站上线后,需要跟踪分析日志,筛选出这些badbot的ip,然后进行屏蔽。

什么网页爬虫爬不到?

被引擎K过的网站,爬虫是不会去爬的,因为已经进了黑名单还有一个就是还没被蜘蛛发现未被收录的网站,也是爬不到的

如何吸引搜索引擎蜘蛛抓取我们的网站_?

做网站优化的的目的,就是为了在搜索引擎中,拥有一个良好的排名,从而获得大量的流量。想要在搜索引擎中获得良好的排名,就必须要提升搜索引擎蜘蛛对网站的抓取速度。如果搜索引擎对网站抓取的频率低,就会直接影响到网站的排名、流量以及权重的评级。

那么,如何提升搜索引擎蜘蛛对网站的抓取速度呢?

1、主动提交网站链接

当更新网站页面或者一些页面没被搜索引擎收录的时候,就可以把链接整理后,提交到搜索引擎中,这样可以加快网站页面被搜索引擎蜘蛛抓取的速度。

2、优质的内容

搜索引擎蜘蛛是非常喜欢网站优质的内容,如果网站长时间不更新优质的内容,那么搜索引擎蜘蛛就会逐渐降低对网站的抓取率,从而影响网站排名以及流量。所以网站必须要定时定量的更新优质内容,这样才能吸引搜索引擎蜘蛛的抓取,从而提升排名和流量。

3、网站地图

网站地图可以清晰的把网站内所有的链接展现出来,而搜索引擎蜘蛛可以顺着网站地图中的链接进入到每个页面中进行抓取,从而提升网站排名。

4、外链建设

高质量外链对提升网站排名有很大作用,搜索引擎蜘蛛会顺着链接进入到网站中,从而提升抓取网站的速度。如果外链质量太差,也会影响搜索引擎蜘蛛的抓取速度。

总之,只要提升搜索引擎蜘蛛对网站的抓取速度,网站就能在搜索引擎中获得良好排名,从而获得大量流量。

服务器防火墙如何屏蔽百度蜘蛛服务器防火墙如何屏蔽百度蜘蛛网络

网站如何屏蔽部分蜘蛛爬行?

在服务器的根目录下,创建一个新的文件,添加不希望蜘蛛爬行的目录:

写作方法

1.如果您站点中的所有文件都可以被蜘蛛抓取和包含,那么语法如下所示:

用户代理:*Disallow:当然,如果你网站中的所有文件都可以被搜索引擎索引,你可以不去管这个文件。

2.完全禁止写搜索引擎访问的文件:

用户代理:*

不允许:/

2.1.禁止写入搜索引擎访问的文件:

用户代理:Googlebot

不允许:/

3.网站中的一个文件夹不希望搜索引擎包含的文件被写入:

用户代理:*

不允许:/admin/

不允许:/images/

4.谷歌被禁止抓取网站中的图片文件:

用户代理:Googlebot

更多优质资源请微信扫码访问:盘姬资源网小程序


免责声明

本文仅代表作者观点,不代表本站立场,内容的真实性请自行甄别谨防上当受骗。

本站采用 CC BY-NC-SA 4.0 国际许可协议 进行许可,转载或引用本站文章应遵循相同协议。

  1. 本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。

  2. 本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

  3. 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报。

  4. 如果有侵犯版权的资源请尽快联系站长,我们会在24h内删除有争议的资源。

站长邮箱:xm520vip@gmail.com

本文链接:https://123.775n.com/post-178.html

发表评论

评论列表(0人评论 , 155人围观)
☹还没有评论,来说两句吧...

会员中心

歆梦资源网(775n.com)-探索精品网络资源的宝藏之地

https://123.775n.com/

| 京ICP备100000000

Powered By 某某网络科技有限公司

使用手机软件扫描微信二维码

关注我们可获取更多热点资讯