admin管理员组文章数量:1794759
Python爬虫入门教程 79
写在前面
曾经有人问我,为何要写100篇关于爬虫的博客?我想说,因为吹牛吹过头了呗,100篇是真的难写。
希望在未来爬虫100例系列博客能在Python爬虫教学领域有那么一点点的位置。
今天开始,我将从一些成熟框架入手,继续提高你的爬虫知识面。
Portia是啥?这个框架在最开始就计划写一下了,没想到拖到这里,Portia属于可视化爬虫,基本描述参照下述内容
Portia is a tool that allows you to visually scrape websites without any programming knowledge required. With Portia you can annotate a web page to identify the data you wish to extract, and Portia will understand based on these annotations how to scrape data from similar pages.
大意是:Portia是一个工具,它允许你在不需要任何编程知识的情况下可视化地抓取网站。看来是不用写代码就可以操作了,不过后面的实操告诉我,没那么简单~
github地址:github/scrapinghub/portia 文档地址:portia.readthedocs.io/en/2.0-docs/
版权声明:本文标题:Python爬虫入门教程 79 内容由林淑君副主任自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.xiehuijuan.com/baike/1686755673a98703.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论