pyppeteer作者更新了,2.x版本即将来临!
原创 2020-06-19 17:11:45

    相信热衷使用爬虫技术的朋友们,一定会非常高兴,pyppeteer即将迎来一次重大更新!在此不久之前,5月8日的时候,作者将pyppeteer代码做了迁移,并且创建了2.0版本。这已经是作者时隔2年没有动这个项目了,就现在最新的那个版本,都要追溯到2018年底。而puppeteer呢!几乎1~2个月就会更新一次,随着chrome浏览器版本的不断迭代,以前的老版本被修复了许多BUG,身边许多朋友都没办法,不得不放弃pyppeteer,还有些人,直接就转行搞起了nodejs的puppeteer。现在作者的这一次更新,无疑是python党的巨大福音!

首先,在这里留下一个Pyppeteer2.0版本更新状况的传送门

https://github.com/pyppeteer/pyppeteer/projects/3

    粗略计算下,整个项目目前是直追puppeteer的2.1.1版本,完成的进度大概70%左右。

    1.为什么这是一件值得令人高兴的事情?

    自从phantomjs项目被放弃,大多数同行都选择了selenium来做为自己项目的支柱,还有部分直接选择了使用自己集成浏览器来搞,但是这2种选择在小编看来,都会显得十分吃力!selenium作为一个中间层,建立起服务端,对命令进行翻译转换传达到客户端,而客户端的界面渲染,又不能被selenium高效的感知到,效率低下不说,还经常崩溃,内存吃紧。与此不同的是,puppeteer是谷歌团队开发的项目,可以直接根据谷歌浏览器自带的DevTools工具协议,对浏览器直接进行控制。这速度有多快,谁用谁知道。不过在使用pyppeteer过程中,许多人都被博客上的一些代码限制住了想象力,如果你看过其项目的开发文档,你就会知道,它能够实现的操作,比selenium就会强上许多倍。

    2.接下来呢,我们该干什么。

    回到家,坐在电脑旁,喝着阔口阔乐,然后"弹冠相庆"