ScrapeServ:一个自托管的API,输入网址即可获取网页数据和浏览器截图

ScrapeServ:一个自托管的API,输入网址即可获取网页数据和浏览器截图。亮点:

  1. 支持滚动页面并截取不同区域的截图;
  2. 运行在Docker容器中,部署简单;
  3. 自动处理302重定向,确保网页内容完整获取

参考文献:
[1] https://github.com/US-Artificial-Intelligence/ScrapeServ


(文:NLP工程化)

欢迎分享

发表评论