Python技术:下载苹果特别活动发布会logo彩绘图片提供新2娱乐官网,宝马娱乐平台等产品欢迎前来洽谈业务合作

宝马娱乐平台

宝马娱乐平台资讯

宝马娱乐平台新闻

Python技术:下载苹果特别活动发布会logo彩绘图片

来源:新2娱乐官网 时间:2019-02-05

  苹果公司将在美国东部时间(EDT)10月30日上午10点(对应北京时间同日晚上10点),在纽约布鲁克林音乐学院,举行一场取名“苹果特别活动”(Apple Special Event)的发布会。

  引起媒体关注的,不是发布会将发布的具体产品内容,而是各种苹果logo图案。有人注意到,收到的邀请函和苹果网站上的发布会页面会出现各种不同的苹果logo,每次刷新页面会出现不同的苹果logo的彩绘图案。于是国外有人收集了各种苹果logo图案,发现了至少86个不同的苹果logo。

  打开此次苹果发布会网页,每次刷新都会随机出现不同的苹果彩绘logo,那么该页面可能出现多少种logo呢?我们想通过技术分析找出答案,并使用爬虫抓取这些logo图片。

  鼠标移动到logo图片位置处,点击右键,然后选择检查元素,分析该元素对应的DOM对象。

  这里完全没有包含任何url信息。这就说明,图片的url地址不在html中。

  复制该url到浏览器地址栏中打开,确认得到的就是浏览器页面当前显示的logo图片。

  这时我们就需要救助强大的抓包工具Charles了。来,让我们点上阿拉灯神丁,召唤Charles。

  然后在浏览器中刷新网页,仿照上一步,在浏览器开发人员工具中找到当前图片url地址,比如此时是。

  网页中嵌入的url地址经常是相对地址,所以我们复制文件名hero_image_01__pj9kqyeokxu2_small_2x.jpg,然后在抓包工具Charles中,按下ctrl+F,打开搜索工具,通过图片文件名搜索,出现多个匹配项。

  其中有两处匹配项是下载该图片的请求,我们此时不需要。而另外的匹配项,定位在overview.built.css文件中,对应的url地址。

  双击匹配项,定位到.css文件中。选择Charles底部的CSS标签,可以看到排版漂亮的css文件,我们需要的图片url就在该文件中。选择Charles顶部的Overview标签,第一项就是该css文件的url地址。我们通过该url地址就可以下载css文件,然后分析css文件就能定位logo的url了。

  css文件属于无结构的数据,此时我们就需要祭出瑞士军刀正则表达式,来提取想要的url。

  于是,我们通过re.finditer()遍历每个图片的相对url,然后拼接出完整url,通过完整url下载图片保存即可。(文件夹apple_logoes请提前准备好)

宝马娱乐平台产品