如何用 Python 制作代理检查器

方法, 代理, 蟒蛇, 2022 年 11 月 22 日5 分钟阅读

代理是一种简单的工具,您可以利用它从网上收集数据,促进业务发展,而不必担心被屏蔽或禁止。代理是您的计算机与您访问的网站之间的中介。当您不使用代理服务器时,网站可以通过您的互联网协议(IP)地址识别您的身份。

代理是一种简单的工具,您可以利用它从网上收集数据,促进业务发展,而不必担心被屏蔽或禁止。代理是您的计算机与您访问的网站之间的中介。如果您不使用代理服务器,网站可以通过您的互联网协议(IP)地址识别您的身份。使用代理服务器会在您的电脑和网站之间多加一层。首先,您连接到代理服务器,代理服务器会隐藏您的 IP 地址,并在网站上显示不同的 IP 地址。 

代理服务器的一些广泛用途包括

  • 安全
  • 隐私权
  • 速度
  • 地理位置
  • 数据汇编

有些代理服务器由于一些限制而无法工作。当你尝试连接互联网时,会收到一条超时信息。这是因为代理服务器要么速度太慢,要么根本不存在。这就需要使用代理检查器。使用代理检查器测试代理可以节省时间。它可以帮助您批量扫描代理。当您使用免费代理时,您应该知道它们会在不经意间关闭。因此,您必须随身携带代理检查器。您必须每天使用它来检查哪些代理在工作。 

目录

使用代理检查器的提示

以下是使用代理检查器需要遵循的一些提示。 

  • 检查位置 - 检查位置很有必要,因为如果您使用的代理来自一个以网络攻击闻名的地方,您将很难访问所需的内容。您可能会被禁用,不得不转到列表中的下一个代理。 
  • 检查速度 - 大多数人都使用代理检查器来查找工作代理。这是必要的,但您还需要查看代理检查器的速度。有些代理工作得很好,但速度却慢得惊人。因此,您必须花费大部分时间上网等待连接。 

如何用 Python 制作代理检查器

让我们看看如何通过以下步骤用 Python 制作代理检查器。

导入图书馆

您需要导入以下两个库,即

  • urllib.request
  • 插座
导入urllib.request , socket
socket.setdefaulttimeout(180)

在这里,urllib.request 模块定义了在复杂世界中帮助打开 URL 的类和函数。URL 既可以是字符串,也可以是 Request 对象。 

另一方面,套接字可以帮助连接网络上的两个节点,使其相互通信。你可以导入套接字库,创建一个简单的套接字,然后开始双向通信。setdefaulttimeout() 设置了新套接字的默认超时时间。 

阅读代理 IP 列表

您必须在 proxyList 中读取代理 IP 列表,如下所示。

proxyList= ['140.82.61.218:8080']代理列表

上面一行代码代表一个代理 IP 示例。

定义函数

要检查代理是否正常工作,必须定义如下所示的函数。

def is_bad_proxy(pip):    
    try:        
        proxy_handler = urllib.request.ProxyHandler({'http': pip})        
        opener = urllib.request.build_opener(proxy_handler)
        opener.addheaders = [('User-agent', 'Mozilla/5.0')]
        urllib.request.install_opener(opener)        
        sock=urllib.request.urlopen('http://www.google.com')  
    except urllib.error.HTTPError as e:        
        print('Error code: ', e.code)
        return e.code
    except Exception as detail:

        print( "ERROR:", detail)
        return 1
    return 0

给你

  • urllib.request.ProxyHandler 会使请求通过代理处理。 
  • urllib.request.build_opener 会返回一个实例,该实例会按照给定的顺序链入处理程序。
  • addheaders 是 urllib.opener() 的一个属性,我们需要将其值更改为可接受的 User-Agent,以欺骗我们正在访问的网站。
  • urllib.request.install_opener 安装 OpenerDirector 实例作为默认全局打开程序。如果希望 urlopen 使用该打开程序,则必须安装该打开程序。否则,就必须调用 OpenerDirector.open() 而不是 urlopen()。 
for item inproxyList:
   ifis_bad_proxy(item):
        print ("Bad Proxy",item)
   else:
        print(item,"is working")

is_bad_proxy() 函数用于检测代理 IP 列表中的工作代理。

在上述代码中,for 循环遍历 proxyList。如果代理不起作用,我们就会得到 "坏代理 "的结果。 

代理检查器的用途

代理检查程序有很多用途。下面给出了其中一些。

  • 防火墙使用代理检查器,确保他们在网上搜索受限信息前的相对匿名性。
  • 学校管理员可以使用代理检查程序确保网络服务器正常运行。他还可以用它来监控试图绕过防火墙限制的学生。
  • 电子商务网站、媒体和广播公司使用代理检查器来控制其服务的地理使用情况,以便更有针对性地开展广告活动。
  • 代理检查程序可保护电子商务网站免受欺诈性订单和欺诈性数据请求的侵害。
  • 代理检查程序或扫描程序是抵御数据黑客的前线虚拟卫士,这些黑客想方设法绕过互联网安全措施。

哪个是最好的 HTTP 在线代理?

ProxyScrape是网上最受欢迎、最可靠的代理服务提供商之一。三种代理服务包括专用数据中心代理服务器、住宅代理服务器和高级代理服务器。那么,什么才是最佳 HTTP 代理的最佳解决方案呢?在回答这个问题之前,最好先看看每个代理服务器的特点。

专用数据中心代理最适合高速在线任务,如从不同服务器流式传输大量数据(就大小而言)以进行分析。这也是企业选择专用代理在短时间内传输大量数据的主要原因之一。

专用数据中心代理具有多种功能,如无限带宽和并发连接、便于通信的专用 HTTP 代理以及更安全的 IP 验证。专用数据中心的正常运行时间为 99.9%,在任何会话期间都能正常工作,您可以放心使用。最后但同样重要的是,ProxyScrape 提供优质的客户服务,将在 24-48 个工作小时内帮助您解决问题。 

其次是住宅代理。住宅代理是每个普通消费者的首选代理。主要原因是住宅代理的 IP 地址与 ISP 提供的 IP 地址相似。这意味着从目标服务器获得访问其数据的许可会比平常更容易。 

ProxyScrape住宅代理的另一个特点是轮换功能。旋转代理可以帮助您避免账户被永久封禁,因为住宅代理会动态更改您的 IP 地址,使目标服务器难以检查您是否在使用代理。它是网络搜刮的绝佳工具。

除此之外,住宅代理的其他功能还包括:无限带宽、并发连接、专用 HTTP/s 代理、随时会话代理(因为代理池中有 700 多万个代理)、用户名和密码验证以提高安全性,最后但并非最不重要的一点是能够更改国家服务器。您可以通过在用户名验证中附加国家代码来选择所需的服务器。 

最后一种是高级代理。高级代理与专用数据中心代理相同。功能保持不变。主要区别在于可访问性。在高级代理中,代理列表(包含代理的列表)向ProxyScrape网络上的每个用户开放。这就是为什么高级代理的成本低于专用数据中心代理的原因。

那么,最佳 HTTP 代理的最佳解决方案是什么呢?答案就是 "住宅代理"。原因很简单。如上所述,住宅代理是一种旋转代理,也就是说,你的 IP 地址会在一段时间内动态变化,这有助于欺骗服务器,在一小段时间内发送大量请求,而不会被屏蔽 IP。 

接下来,最好根据国家更换代理服务器。您必须在 IP 验证或用户名和密码验证的末尾添加国家 ISO_CODE。 

常见问题:

1.使用代理检查器有哪些技巧?
您需要在代理检查程序中查找的主要内容有: 1.检查位置(代理服务器的位置) 2.检查代理服务器的速度
2.哪种 HTTP 代理最好?
住宅代理是最好的 HTTP 代理,因为它是一种旋转代理,这意味着您的 IP 地址会在一段时间内动态变化,这有助于在较短的时间内发送大量请求,从而欺骗服务器而不会被屏蔽 IP。
3.python 代理检查程序有哪些用途?
1.匿名性2.绕过机构和学校的防火墙限制3.访问国际电子商务网站4.安全防范网络攻击5.轻松进行网络搜刮

结论

我们讨论过,代理是客户端和服务器之间的中介。代理服务器可以充当防火墙,提供共享网络连接,并缓存数据以加快普通请求的处理速度。我们可以使用代理检查器来测试我们的代理,以了解哪些代理在工作。在使用代理检查器之前,我们需要检查速度和位置。此外,我们还可以通过导入必要的库和定义代理检查函数来确定代理的性质,即功能性代理还是非功能性代理,从而用 Python 制作一个代理检查器。 

希望你能了解如何用 Python 制作代理检查器。