深色proxyscrape 徽标

用 5 个简单步骤抓取 YouTube 评论

方法, 蟒蛇, 搜索, 11-01-20215 分钟阅读

了解如何抓取 youtube 评论可以帮助人们进行简要分析,并根据分析结果做出决策。收集视频内容、点赞和评论数据将帮助用户共同了解哪些内容效果好,哪些内容效果不好。Data Reportal 关于全球受众覆盖率的报告指出,2022 年 7 月,YouTube 在全球拥有 24.76 亿用户。这些数据清楚地表明,YouTube 是最有资格开展市场调研的平台之一。本文将介绍如何利用 YouTube 如此广泛的数据做出商业或财务决策。 

目录

YouTube - 最大的娱乐平台

无论是推广项目还是为学生提供信息,Youtube都是与广大受众交流的最佳方式。它是仅次于谷歌的全球第二大搜索引擎。由于谷歌和其他搜索引擎倾向于视频,因此,在 Youtube 上分享视频时,您可以使用好的标题、标签和描述来提高搜索引擎排名。您还可以借助视频在 Youtube 上传达您的品牌信息,因为视频是捕捉您所推广产品的情感和物理属性的完美方法。

抓取 YouTube 评论

Youtube 搜刮允许您搜刮视频数据、订阅、评论、排名、推荐和广告。在 Youtube 搜刮器的帮助下,您可以从选定的 Youtube URL 页面提取数据进行搜刮。现在你可以搜刮频道、视频及其详细信息以及评论和字幕,这为分析视频数据打开了一个全新的维度。你可以使用网络搜刮功能搜刮自动生成和添加的各种语言字幕。

为什么要抓取 YouTube 评论?

从 Youtube 搜刮数据非常有用,原因如下。

  • 在正确数据的帮助下,很容易计算出品牌被提及的频率、受众覆盖率以及他们的反应。例如,企业可以利用这些有用的数据计算来自 Youtube 频道的广告或推荐的投资回报率(ROI)。这样,他们就可以相应地调整营销活动的规模。 
  • 借助 Youtube 搜索,您可以找出、分析并延缓假新闻和有害或非法内容的传播。
  • 您可以为任何研究收集数据,跟踪新出现的主题和趋势,甚至按国家、语言或全球范围预测新的主题和趋势。
  • 为了做出更好的选择,您可以查找有关您考虑购买的服务和产品的评论。
  • Youtube 评论部分包含用户情感数据,可显示对视频内容的不同反应。这对了解观众如何参与内容非常有用。但在使用 Youtube scraper 之前,你需要记住,巨魔是评论区的常见组成部分。因此,您不能将负面评论视为合法反馈。

使用 Python 搜刮 Youtube 评论

您需要按照以下步骤使用 Python 从 Youtube 搜刮评论。

安装软件包

您必须使用 Python 命令导入必要的软件包,如下所示。

!pipinstall datakund-bot-studio
!pipinstall youtube-comment-scraper-python

导入必要的软件包

现在,您需要导入所需的软件包。

youtube_comment_scraper_python导入*
导入pandaspd

打开评论部分

您需要打开所需的 Youtube 视频链接,然后使用下面的命令转到评论部分。

youtube.open("https://www.youtube.com/watch?v=rSDy5AdfRDI")
youtube.keypress("pagedown")

执行该命令将得到以下输出结果。

抓取 YouTube 评论

执行上述代码后,您需要打开已打开视频的网页浏览器。它会自动执行 "向下翻页 "并抓取评论,因此您需要等待该过程结束。这一步所需的时间会因视频评论的数量而异。

data = []
currentpagesource=youtube.get_page_source()
lastpagesource=''

while(True):
   if(lastpagesource==currentpagesource):
        break
        
   lastpagesource=currentpagesource
   response=youtube.video_comments()

   forcinresponse['body']:
        data.append(c)
        
    youtube.scroll()
   currentpagesource=youtube.get_page_source()

构建数据帧

现在,我们删除重复数据,并将列表转换为数据帧。然后,我们将数据导出为 CSV 文件。

df = pd.DataFrame(data)

df = df.replace('\n',' ',regex=True)

df = df[['Comment','Likes']].drop_duplicates(keep="first") 

df.to_csv('data.csv',index=False)

如下图所示,我们使用df.head()检查数据。

df.head()

使用代理从 YouTube 抓取评论

Youtube 代理是在设备和服务器之间进行数据交换的中间服务器。它有助于创建间接连接,让您可以绕过系统管理员或互联网服务提供商的防火墙。在代理的帮助下,您可以增加 Youtube 视频的浏览量并获得更多评论。

您需要打开命令提示符并键入以下内容。

$ gitclonehttps://github.com/MShawon/YouTube-Viewer.git

$ cdYouTube-Viewer

$ pip install -r requirements.txt

此外,请检查您的 Google Chrome 浏览器版本,并从https://chromedriver.chromium.org/downloads下载相同版本的 chromedriver.exe,然后将其放入 chromedriver_win32 文件夹。

如果您有大量的代理集合,则需要使用下面的命令过滤好的代理。之后,您必须使用 GoodProxy.txt 作为代理 python 文件。

$pythonproxy_check.py

为什么要使用代理进行 YouTube 评论搜索?

使用 Youtube 代理的几个可能原因如下:

  • 通常情况下,应管理部门的要求,Youtube 通常会在教育机构和办公网络中被禁止。因此,您需要一个Youtube 代理来避免禁令并保持稳定的访问。

  • 一些国家在国家层面禁止访问 Youtube,因为其内容不符合国家政策。这意味着任何公民都不能在国内使用 Youtube。因此,你必须找到一个拥有全球 IP 地址的 Youtube 代理服务器来解封 Youtube 视频。
  • 人们很难使用数据检索代码或工具搜刮大量数据。为了解决这个问题,我们可以使用高带宽代理,这样就可以搜刮大量数据。 

常见问题

1.搜索 YouTube 评论有哪些用途?
YouTube 评论有助于营销人员或普通用户了解公众的趋势和意见。品牌被提及、喜欢和不喜欢的频率将帮助用户衡量自己的影响力,并做出商业决策/财务决策。买家也可以利用评论中的数据来决定是否购买产品。
2.抓取 YouTube 评论需要哪些 python 软件包?
要抓取 youtube 评论,我们需要两个主要软件包,它们是 youtube_comment_scraper_python 和 pandas。前者负责执行搜索操作,而后者则允许进行数据分析操作。
3.为什么有些人需要使用代理来搜索 YouTube 评论?
一般来说,代理服务器在某些地方(如学校)是被禁止的,因为学生没有必要在上课时间接触娱乐视频。要绕过这一限制,就需要代理。另一个重要的原因是蹭网。普通的代码或工具无法轻松获取大量数据。为了解决这个问题,我们可以使用高带宽的代理服务器来支持海量数据的搜索。

关于搜索 YouTube 评论的结论

Youtube是建立个人平台的好地方,也是进行大量客户和数字营销研究的好地方。通过 Youtube 视频的评论部分,可以了解人们的期望以及他们喜欢/不喜欢什么。您可以使用 Python 搜刮 Youtube 评论,但在搜刮时应使用代理。这是因为代理可以保护你不被屏蔽,还能让你进行更有针对性的研究。您可以使用专用的代理来搜索 Youtube。虽然价格昂贵,但比其他代理更安全。

希望你能了解如何使用 Python 搜刮 Youtube 评论。