阿里云盘搜索引擎项目架构图 - 迅易阁资讯

分享好友最新动态首页最新动态分类切换频道

阿里云盘搜索引擎项目架构图

2024-12-27 13:07

本项目存属于个人项目，因此考虑因素侧重方向不同于企业产品，会更倾向于节省成本方向，尽量保证稳定性。

为了完成这个项目，其实考虑了不止下面两个方案，这里包括：

搜索引擎选择：尝试过玩具版的meiliSearch / 直接用MongoDB 和最终选择的Elasticsearch
爬虫代理池的构建：必须是高匿名的，否则爬着爬着IP请求就会被限制，而且代理池的节点IP量越多并发就越多，爬取数据就越快。

接下来，就简单的说下两个备选方案.

处于数据稳定性考虑，增加了MongoDB作为数据持久化方案。

数据持久化： mongo复制集(三节点)
搜索引擎： Elasticsearch集群(三节点)
爬虫服务缓存： Redis缓存爬虫结果数据，之后通过Transfer服务同步至MongoDB。

架构图如下:

此方案评价：

数据更稳定安全, 数据操作都在MongoDB上完成后自动Monstache同步到ES集群中。
由于增加了MongoDB集群，对硬件资源要求会更多，因此部署成本更高。

为了节省成本，本方案省略了MongoDB集群，直接同步数据至ES集群，相当于上面的架构图中删掉了和。

此方案更为简单直接，对硬件资源要求减少了很多，相对而言，更适合个人项目使用。

至于数据的持久化可以选择文件方式存储，删除操作的数据只保留删除记录的信息即可，恢复数据选择全量导入后再通过删除失效的列表即可。

目前是选择方案一实现的，但集群部署成本比较高，因此可以将 MongoDB集群和爬虫相关服务放在家庭个人服务器上运行(没啥成本)，仅将ES集群和Web服务放在云服务器上（烧码内money的地方），再加上慢如蜗牛的CloudflareCDN服务，这样就可以基本上可以稳定运行了。

目前Web服务使用Golang开发的，没有Resfull API接口，正考虑用Vue实现Web前端，通过Resful API接口进行数据交互，但这必然会导致数据被爬的风险，我也是在不断的学习过程中，最终，这些眼前的问题都会被解决的。

最新文章

网站点击排名优化，提升网站流量与用户体验的全方位策略,网站点击排名优化什么意思

网站点击排名优化是指通过一系列技术和策略，提高网站在搜索引擎中的排名，从而增加网站流量和用户体验。这包括优化网站内容、结构、链接等方面，以提高网站在搜索引擎中的可见性和权威性。通过点击排名优化，网站可以吸引更多的访问者，提

搜狗浏览器下载2015官方版 v6.2 最新电脑版

是一款拥有极速浏览速度的双核浏览器。搜狗浏览器下载2015采用最新的chrome内核和ie内核，其浏览速度毋庸置疑，但是现在市场上的浏览器也同样采用这两个内核，于是搜狗推出了智能预读系统，用户在输入网址时，浏览器智能识别用户输入的地址

第三季全球手机排行榜诺基亚独占七席

　　11月4日消息，据国外媒体报道，知名电子产品批发商RCS日前表示，在今年第三季度的全球十大畅销手机排行榜上，诺基亚依然实力强劲，独占了7个席位。而在上一季度排名第五的大众宠儿iPhone 在本季度却榜上无名。　　以下是RCS统计的第三

首页此部分内容前置为铸剑山庄开启紫金熔炉，未开启则不会刷出尸体昆仑山(9,14)：尸体，第一次探查，获得【冰穿子】x1；第二次探查获得纸条，阅读得知冰面下面有东西，之后可以掩埋尸体昆仑山(18,16)：冰面，使用冰穿子挖凿，选择冰窟窿，

雅思教学培养方案怎么写(雅思培训课程是怎么设置的)

1、第三个方法，社交学习法。每个人都会有疲倦期，这个时候，我们需要内外刺激，而社交学习法就属于外部刺激。也就对应了一句话“一个人可以走得很快，但是一群人才能走得很远。2、雅思如何自学方法如下：听力：雅思词汇是雅思正常考试的核

百度快速排名优化工具(百度seo快速排名优化)

在当今竞争激烈的网络环境中，网站的排名对于企业和个人的在线存在至关重要，百度作为国内最大的搜索引擎之一，其搜索结果页面的排名直接影响着网站的流量和曝光度，为了在百度上获得更好的排名，许多网站所有者和 SEO 从业者开始寻求百度

开发销售打卡“神器”获刑

2023年8月，刚大学毕业的小张到宁波找工作，面试几家公司后发现多数公司都需要通过App来考勤打卡，他觉得特别麻烦，在和同学聚餐时聊起此事，同学向他推荐了一个可以实现虚拟定位打卡的网站。小张登录了这个网站，加了网站管理员的微信。在

使用宝塔搭建环境，以及把自己本地的Web项目通过宝塔发布到远程云服务器上

使用宝塔搭建服务器的环境什么是搭建服务器环境所谓的搭建环境其实也就是下载应用，然后把应用对应的端口号在三个地方开启，这三个地方分别是，宝塔的安全菜单的防火墙，阿里云的安全组，阿里云云服务器中

非常聪明的AI眼镜即将到来！VRETF(159786)今日微跌0.67%，利亚德涨19.94%

AI眼镜方向传来新消息。据领益智造消息，12月13日，在AndroidXR发布会上，谷歌与国内消费级AR眼镜厂商XREAL达成了战略合作，共同打造AndroidXR生态。。2024年12月13日，A股市场震荡调整。VR指数成份股中，利亚德涨19.94%，奥飞娱乐涨10.03%

重庆网站建设seo公司重庆SEO网站建设公司优化指南

重庆网站建设SEO公司：打造企业网络新生态的领航者在当今数字化时代，互联网已成为企业展示形象、拓展市场、提升品牌影响力的核心平台而对于地处西南经济重镇的重庆企业而言，拥有一个高效、美观且具备强大SEO（搜索引擎优化）能力的网站，

相关文章

推荐文章

Q： The sound of my TV is jumpy and stutters during screen mirroring. What should I do？

浙江关键词推广优化策略深度解析攻略

新闻调查｜从GPT-4o看人工智能竞争的走向和挑战

类似Visio的在线工具

贷款担保人信息一直发短信怎么办呢

直达：小榄到绥芬河物流货运-送货到家「直达不中转」2025排名一览

浏览器内核性能横评，主流的三种内核到底哪个好？

江森自控旗下泰科AI智能安防解决方案深度实测

长春宽城区考研辅导机构评测排名名单公布

怎么进行微博营销推广,有哪些方法

发表评论