分享好友 最新动态首页 最新动态分类 切换频道
链家网页爬虫_爬虫篇 | Python 6个维度,数万条数据帮你揭秘房租大涨
2024-12-27 13:12

本文转载于公众号:恋习Python

原文地址:https://mp.weixin.qq.com/s/vvZ2yBb2eMKP800LUPoAWg

最近休息了一段时间,现在开启更新模式!

8月初,有网友在“水木论坛”发帖控诉长租公寓加价抢房引起关注。据说,一名业主打算出租自己位于天通苑的三居室,预期租金7500元/月,结果被二方中介互相抬价,硬生生抬到了10800。

过去一个月,全国热点城市的房租如脱缰野马。一线的房租同比涨了近20%。一夜醒来,无产青年连一块立锥之地都悬了。

从2018下半年开始,租金海啸汹汹来袭,资本狂欢,官方默然,房东纠结,租客尖叫。

这不是一方的过错,而更像是一场全社会的“集体谋杀作品”。最令人不安的是,过去房地产的那套玩法和上涨逻辑,今天正在转移到房租上。

房租暴涨的不只是北京。有数据显示,7月份北京、上海、广州、深圳、天津、武汉、重庆、南京、杭州和成都十大城市租金环比均有所上涨。其中北京、上海、深圳的租金涨幅最猛,北京7月份房租同比上涨3.1%,有小区甚至涨幅超过30%。

图自“21世纪经济报道”《最新房租数据出炉,你一个月要交多少钱?(附房租地图)》一文

接下来,恋习Python通过Python大法通过获取某网数万条北京租房数据,给大家说说真实的房租情况。

还是老规矩,老套路(是不是有股熟悉的味道),恋习Python常用的三部曲:数据获取、数据清洗预览、数据分析可视化,与你一起探究最近房租的状况。

一、数据获取

恋习Python今日就把目前市场占有率最高的房屋中介公司为目标,来获取北京、上海两大城市的租房信息。(目标链接:https://bj.lianjia.com/zufang/)

整体思路是

  • 先爬取每个区域的url和名称,跟主url拼接成一个完整的url,循环url列表,依次爬取每个区域的租房信息。

  • 在爬每个区域的租房信息时,找到最大的页码,遍历页码,依次爬取每一页的二手房信息。

post代码之前简单讲一下这里用到的几个爬虫Python包

  • requests: 就是用来请求对链家网进行访问的包

  • lxml: 解析网页,用xpath表达式与正则表达式一起来获取网页信息,相比bs4速度更快

详细代码如下

二、数据清洗预览

数据共14038条,10个维度,由上图可看出北京房源均价为9590元/月,中位数为7000。一半的房源价格在7000以下,所有房源的价格区间为[1000,250000],价格极差过大。

三、数据分析可视化

四维度-北京房租均价

接下来,恋习Python将北京各区域、各路段、各楼盘房屋数量、均价分布放在同一张图上,更直观地来看待房租

从图中可看出,最近,北京市各区域的房租均在6000元/月以上,其中最高区域为东城,均价达12463元/月。不过,由于房源信息过多过杂,房屋位置、面积、楼层、朝向等对价格均有较大影响,因此,价格这个维度需要进一步分析。

由上图可得,各路段的均价基本都在6000以上,其中海淀北部新区的房源数最多,但均价最低,为3308元/月,这或许与海淀北部生态科技新区作为高新技术产业的承载区、原始创新策源地的研发基地,以及科技园集聚区,目前已入驻华为、联想、百度、腾讯、IBM、Oracle等近2000家国内外知名的科技创新型企业有关。另一方面,海淀紫竹桥的房价竟一起冲天,其附近以博物馆、体育场馆为特色,交通便利,配套设施完善,均价较高也是情理之中。

可以看出,不同楼盘的均价浮动很大,但都在6000/月以上。最高的甚至达到17516/月。由于每个楼盘户型差别较大,地理位置也较为分散,因此均价波动很大。每个楼盘具体情况还需具体分析。

附详情代码

由上图可以看出,均价在8000-10000之间的房屋数量最多,同时1500-2000这个价位之间房屋数少的可怜。

据北京市统计局的数据,2017年全市居民月人均可支配收入为4769元。另据58同城和赶集网发布的报告,2017年北京人均月租金为2795元。

北京租房者的房租收入比,惊人地接近60%。很多人一半的收入,都花在了租房上,人生就这样被锁定在贫困线上。

统计数据也表明,北京租房人群收入整体偏低。47%的租房人,年薪在10万以下。在北京,能够负担得起每月5000元左右房租的群体,就算得上是中高收入人群。就这样,第一批90后扛过了离婚、秃头、出家和生育,终于还是倒在了房租面前。

附详情代码

面积&租金分布呈阶梯性

上图可以看出,80%的房源面积集中在0-90平方米之间,也符合租客单租与合租情况,大面积的房屋很少。

面积&租金分布呈阶梯性,比较符合常理。租房主力军就是上班族了,一般对房子面积要求较低,基本集中在30平。

附详情代码

大多数房屋年龄在10年以上

由上图看出,房屋年龄大多集中在10-20年、25年以上,而5年以下的不到2%;不过,别看这些都是老房子,最近房租变得这么猖狂?原因其中之一就是资本圈地。

这条网贴立马点燃了大众的情绪:“好啊,原来是这些长租平台烧钱圈地,一心只想要垄断市场房源,哄抬租金,企图赚取暴利差价!”

四、后记

拿自如举例,表面上看跟中介公司没啥两样,收了各种散盘,然后集中装修、出租、管理,因为运营成本和住房质量提高,房租肯定有所上涨。

但更关键的事情在背后。自如把项目打包起来搞起了资产证券化,以租金收益权为基础资产做担保,投放到金融市场上发行国内首单租房市场消费分期类ABS,让各路资金来认购,每年给大家搞点分红。

大量资本都在赌租房这个风口,而前期谁的规模越大、资源越多,以后的定价权就越大,利润空间就越不可想象。

这次恋习Python一共从链家网上爬取14038条数据,而那就是大概一周前,8月17日北京住建委约谈了几家中介公司。最终的结果是自如、相寓和蛋壳承诺将拿出12万间房子投入市场其中,自如将拿出8万间(链家、自如、贝壳找房,他们的实际控制人是同一个人--链家老板左晖。

也就是说,平常的时候,链家网+自如一共在网上待租的也就是1万多套房子,但是一被约谈他们就一口气拿出了8万套房子增援?怎么增?继续收房,让房源更加供不应求

昨天买不起房,今天租不起房,如果连这样的生活也要因为市场的不规范而被逼迫、被夺走,真的会让人对一个城市失去希望。

【完】 如果你觉得文章还不错,请大家点赞分享下。你的肯定是我最大的鼓励和支持 说句题外话,有不少人想加我微信,看我朋友圈的每日分享,我姑且放出来,但名额有限,先来先得。 我的朋友圈不止有技术分享,更有我的日常感悟,还有我个人商业思维观点 速速扫码添加扫码添加,备注:公号铁粉 推荐阅读爬虫篇 | 用Python获取公众号评论并生成词云图证明抖音无罪爬虫篇 | 用Python代码来下载任意指定网易云歌曲爬虫篇 | Python爬虫之舌尖上的“小龙虾”爬虫篇 | 高级爬虫(一):Scrapy爬虫框架的安装爬虫篇 | 高级爬虫( 二):Scrapy爬虫框架初探爬虫篇 | 用Python爬超级搞笑的视频
最新文章
浏览器复制粘贴以及手机端webview复制粘贴
1、document.execCommand 这部分参考文档: https://developer.mozilla.org/zh-CN/docs/Web/API/Document/execCommand 咱们再浏览器中使用的复制大部分都是用的这个原理 缺点: 使用第一种方法在浏览器上用的是很顺畅,
用AI生成超逼真美女写真,轻松搞定你的个性化需求!
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个 AI 技术快速发展的时代,想必家人们都听说过用 AI 工具生成照片的魔力吧!你可能在社
海尔400客服电话(海尔400客服电话人工)
海尔洗衣机服务电话是400-966-8255(全球客服热线)。海尔洗衣机如果遇到维修问题等,可以拨打海尔的全球客服热线咨询。在维修员找到维修方法后会及时与用户进行联系,根据客户及自身时间来确认上门维修时间。在约定时间段维修工程师要根据
鸥玛软件:公司是山东大学控股的高新技术企业,也是目前国内考试与测评领域唯一一家独立上市的公司
来源:雪球App,作者: 每日经济新闻,(https://xueqiu.com/4642157440/316967463)每经AI快讯,有投资者在投资者互动平台提问:你好,请问公司在行业内是不是属于第一梯队里?竞争对手有哪些公司?公司的核心竞争力是什么? (301185.SZ
软媒清理大师 v3.7.3.0 绿色免费版
电脑反应慢、磁盘获取慢怎么办?使用软媒清理大师深度扫描帮你清理系统陈余垃圾,扫描垃圾文件够彻底、够深入,拥有系统瘦身、注册表清理、隐私清理、重复文件清理等众多电脑清理功能,还原你一个健康的电脑。
【V10360清理大师下载】VINUS V10360清理大师8.4.2免费下载
清理大师:更简单,更畅快!6亿用户信赖的手机清理!清理大师是一款完全免费的手机加速与空间清理软件,强力加速使手机运行更流畅,一键清理快速解决空间不足问题。【一键清理】一键搞定无用垃圾,手机清理更省心【手机加速】瞬间释放手机
芙蓉王香烟多少钱一盒 芙蓉王系列价格大全
芙蓉王香烟的知名度很高,该品牌正式推出后不久,就受到了烟草行业专家和国内外消费者的高度赞誉和青睐。芙蓉王系列有很多不同类型的香烟产品,今天小编就为大家介绍一下芙蓉王所有系列的价格,下面我们一起看看芙蓉王香烟价格表大全。芙蓉
rank 开窗函数_Oracle 的开窗函数 rank,dense_rank,row_number
1、开窗函数和分组函数的区别分组函数是指按照某列或者某些列分组后进行某种计算,比如计数,求和等聚合函数进行计算。开窗函数是指基于某列或某些列让数据有序,数据行数和原始数据数相同,依然能曾现个体数据的
入库案例选介|提供非法爬虫软件行为的刑法规制
提供非法爬虫软件行为的刑法规制最高人民法院四级调研员黎鹏江苏省无锡市梁溪区人民法院2009年刑法修正案(七)增设提供侵入、非法控制计算机信息系统程序、工具罪,进一步严密保护计算机信息系统和数据安全的刑事法网。实践中,关于“专门
济南SEO网站优化,提升网站排名,助力企业腾飞,济南SEO优化专家,助力企业网站排名飞跃
济南SEO专业网站优化服务,致力于提升企业网站排名,助力企业快速在搜索引擎中脱颖而出,增强 *** 竞争力,实现互联网营销目标,助力企业腾飞。2、降低营销成本:相较于其他 *** 营销手段,SEO优化具有成本较低、效果显著的特点,通过优化
相关文章
推荐文章
发表评论
0评