在两城市之间,购票平台不同,搜索时间不同,目标时段不同,目标航线不同……机票价格会有很大差别。作为一个打工人,如何高效获取最适合的特价机票呢?
本文涉及票价时均默认包含燃油和机建费(2023/12,标准为¥90+¥50),若有特殊情况会单独说明。
机票工具的设想
作为一个普通打工人,对机票价格的要求没有最低只有更低,而每次都要花费好多时间在做机票的攻略上,所以打算做一个简单的机票工具。
该工具的后端是一个Selenium爬虫工具,输入相关搜索条件后,对全平台的机票信息进行爬取和筛选,并存入数据库;其前端类似于携程
网页界面的阉割版,可指定时间段、起止城市等搜索条件,执行搜索后可返回一组价格升序排列的机票信息。
该工具的核心是找国内最低票价,所以航司服务的水平、退改签政策的合理性、托运及携行量的大小、境外机场……均不考虑。
该工具的特点是全平台比价、模糊日期搜索、以火车/高铁票作为参考基准等。
准备工作
相关工具的调研
现有的机票比价工具的数据来源于国内外各大OTA
(Online Travel Agency Platform)平台、航空公司官网。比价工具自身不是售票平台,选好机票后需要登录到相应的航司/OTA进行购买。据知乎高赞用户的回答,有俩主流工具:
-
- 特点:国外的,搜索刷新有延迟,界面简洁高级,号称同时搜索数百家旅游网站进行比价,有添加110KM范围的
附近机场
功能(不含境外)。 - 经对比测试,相同行程下的机票,有的比国内OTA的价格贵数十至上百元,有的便宜数百元。也许是因为该软件的国外基因,搜索结果更倾向于国外OTA,国内OTA/航司的数据不全。
- 特点:国外的,搜索刷新有延迟,界面简洁高级,号称同时搜索数百家旅游网站进行比价,有添加110KM范围的
-
- 特点:国外的,搜索刷新稍有延迟,界面简洁高级,有添加
附近机场
功能(含境外,如深圳宝安附近可包括香港)。另外其网页对机器爬虫的检测更严格。 - 经对比测试,天巡搜索结果中,国内国外并重。
- 更多:可加入成为天巡的合作伙伴赚取佣金;它的traval API服务不对无盈利性质的个人开放。
- 特点:国外的,搜索刷新稍有延迟,界面简洁高级,有添加
开始设计
要爬取的平台汇总:
平台 对比价格1注1/价格2注2 有无网页版来爬取 有无开放api 备注 客涯 ¥605/¥605 客涯 ✅有,正在注册审核 天巡 ¥627/¥480 天巡 ✅有,但不对个人开放,不过人家给了测试环境的API token: .sh428739766321522266746152871799
携程已收购。反爬严格 美团 ¥432/¥432 无 ❌有,但里面没有关于机票的;另有美团企业版API,但苦于没有企业版账号。 京东 ¥940/¥540 无 ❌有,但里面没有关于机票的 飞猪 ¥542/¥480 飞猪 ❌有,但淘宝账号必须是阿里旅行商家 携程 ¥540/¥480 携程 ❌有,但里面没有关于机票的,且账号注册需要公司资质 同程 ¥540/¥480 同程 ❌有,没有关于机票的,且账号注册需要特定资质 途牛 ¥542/¥540 途牛 ❌有,没有关于机票的,且账号注册需要特定资质 去哪儿 ¥1106/¥480 去哪儿 ❌有,注册流程复杂,需要资质 - 注1:固定航班信息的机票价格对比,2024/01/04-22:30-00:55成都天府→北京大兴直飞的
东航MU6798
经济舱; - 注2:2024/01/04 成都天府→北京大兴当天直飞的最低价对比
- 注1:固定航班信息的机票价格对比,2024/01/04-22:30-00:55成都天府→北京大兴直飞的
要考虑的情况
- 附近机场搜索功能要扩大范围,如成都市,不仅要包含双流、天府,还要包含绵阳、南充、宜宾、泸州等。这需要维护一个全国民航机场距离矩阵。
- 选择了附近机场,则要同时考虑
起点->出发机场
和到达机场->终点
等路线的通勤价格、通勤时间的可行性。 - 不同平台的爬虫难度有高低,特别是美团、京东没有网页。
- 单程、往返的都要爬。
- 同一个航班信息搜索滞留久了,平台可能出现改价杀熟行为,这个无解。