分享好友 最新动态首页 最新动态分类 切换频道
python计算cpa的程序_Python爬取CAP之家的APP推广信息数据
2024-12-26 09:00

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

开发工具

python 3.6.5

pycharm

requests

time

csv

相关模块可pip安装

确定目标网页

获取数据内容

cap之家数据是动态数据加载的~ 开发者工具可以找到相对应的数据接口

请求数据是POST

数据内容找到了,单页数据可以直接爬取,如果想要爬取多页数据,那就要分析接口数据url的变化

因为数据接口是post请求,所以一般情况都是data参数的变化,所以查看data参数的变化就可以了~

第一页接口数据data参数

两个接口都是一样的数据,但是data参数不一样,第二个就是感觉data参数就是对应的页数号,所以可以多看几页的data参数的变化

第二页接口数据data参数

第三页接口数据data参数

这一下就很清楚的看到data参数的变化了~Pagelndex是等差数列 刚好对应的页数

所以再翻页爬取的时候只要改变Pagelndex参数就可以了

完整代码

代码还是很简单的

import requests

import time

import csv

f = open('APP推广数据.csv', mode='a', encoding='utf-8', newline='')

csv_writer = csv.DictWriter(f, fieldnames=['名称', '发布时间', '单价/元', '结算方式', '数据查看', '电话', '微信', 'QQ', '产品要求'])

csv_writer.writeheader()

for page in range(1, 81):

print('=========================================正在爬取第{}页的推广数据============================================================'.format(page))

url = 'https://www.cpajia.com/index.php?m=index&a=search'

data = {

'PageIndex': '{}'.format(page)

}

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

}

response = requests.post(url=url, data=data, headers=headers)

html_data = response.json()

lis = html_data[1:-1]

# pprint.pprint(lis)

dit = {}

for i in lis:

dit['名称'] = i['title']

data_time = int(i['updatetime'])

timeArray = time.localtime(data_time)

otherStyleTime = time.strftime("%Y--%m--%d %H:%M:%S", timeArray)

dit['发布时间'] = otherStyleTime

dit['单价/元'] = i['price']

dit['结算方式'] = i['balance']

dit['数据查看'] = i['dataview']

dit['电话'] = i['phone']

dit['微信'] = i['wxh']

dit['QQ'] = i['qq']

dit['产品要求'] = i['content']

csv_writer.writerow(dit)

print(dit)

最新文章
2024年热门儿童游戏精选推荐:高人气儿童手游下载排行榜大全
本文目录导读:一、米加小镇:世界二、贪吃蛇大作战三、会说话的汤姆猫四、汤姆猫大冒险五、天天消消乐六、宝宝厨房七、米亚大陆八、来!捏个宇宙发布公司:XiHe Digital (GuangZhou) Technology Co., Ltd.操作系统:Android、IOS游戏分类
2024年马报资料:开启新时代的赛马领域资讯宝库
h2引言/h2p随着赛马行业在澳门的持续繁荣与发展,2024年马报资料库应运而生,开启新时代的赛马领域资讯探索之旅,该资料库为广大赛马爱好者和专业人士提供了一系列宝贵的资讯,不仅涵盖最新的赛马赛事动态,还包括政策解读、赛马数据分析等
ChatGPT4.0中文版!手机、电脑都能用!
ChatGPT4.0在许多领域都有着广泛的应用,这些领域包括客户服务、虚拟助手、语言翻译以及教育等。得益于其强大的功能以及易用性,ChatGPT已在全球范围内赢得了热门技术的地位,并且还在持续发展和改良中。然而,也存在以下限制:首先是网络
jsp的10年是谁让它如此落幕?
随着容器技术(docker、k8s)以及微服务架构逐步成熟和发展,这种强调后端分离思想让jsp这个陪伴我近10年的页面渲染技术宣告落幕了,有点伤感。。。1、无法做到动静分离传统java程序通过war包形式部署到tomcat,除了java代码和jsp页面,还
JS 实现复制一个或多个内容到剪贴板
需要实现的功能:点击button,复制如下值到剪贴板,常用的方法是:document.execCommand('copy')用这个方法有三点需要注意否则将会失效1、input框不能有disabled属性2、根据第一条扩展,input的width || height 不能为0;3、input框不能有h
AI视角下的人工智能课程学习指南
随着人工智能(AI)技术的迅猛发展,越来越多的企业和个人开始关注如何学习和掌握这一领域的知识和技能。一、人工智能课程的重要性1. 提升竞争力在当今竞争激烈的市场环境中,掌握人工智能技术的企业和个人将具有更强的竞争力。通过学习人工
2020湖南大学研究生招生考试成绩专业排名可查!
①聊城中公教育咨询电话和地址②聊城中公教育课程及活动资讯 公告原文如下:一、成绩查询湖南省2020年硕士研究生招生考试成绩将于2月20日上午10:00公布,报考湖南大学的考生可通过以下4种方式查询本人成绩:1. 关注湖南省教育考试院官微湘
AI制作照片:自动生成软件、免费方法及文案撰写教程
随着人工智能技术的发展,在图像解决领域的应用越来越广泛。本文将详细介绍制作照片的自动生成软件、免费方法以及文案撰写教程帮助读者轻松掌握制作照片的技巧。### 1. ArtbreederArtbreeder是一款基于GAN(生成对抗网络)的图像生成工具。
相关文章
推荐文章
发表评论
0评