热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

如何实现选品平台

可以使用二个系统进行承载,一个页面聚合系统,一个底层数据处理系统,一个批数据处理系统。首先将商品数据,门店数据等一些基本数

可以使用二个系统进行承载,一个页面聚合系统,一个底层数据处理系统,一个批数据处理系统。

首先将商品数据,门店数据等一些基本数据离线t+1导入到在线数据库中(OLAP)--clickhouse等,或者 hadoop文件系统,hbase。

页面聚合系统创建业务表,池子表,池子属性表,池子关联数据表,货品,池子与货品关系 多对多,任务表,批量处理流水表,

整体的业务流程,

根据业务id查询获取主题topic

根据主题topic查询所有的属性规则

根据topic查询池子的数据类型

然后创建池子,启动池子,关闭池子

创建池子--就是简单的保存一直池子基本信息与数据。

启动池子,是一种抽象的方式,属性一般可以是实时的选品池子,也可以是t+1更新的池子。

如果是实时的池子,调用底层数据处理系统,然后根据规则底层将数据导出到文件系统,然后给业务系统发送一个消息,业务系统监听到这个消息之后,落一个批量处理的流水,然后落一个批量文件处理的任务,批量系统进行spi回调业务系统,业务系统一条一条的处理,落池子与货品的关系,这次的操作是首圈。

后续货品的变更,搜索引擎会监听数据库表结构的变更,然后发送消息给业务系统,业务系统落货品和池子的关系。

当批系统全部处理完毕之后,回调业务系统处理完毕,业务系统批量任务状态。

如果是t+1的池子的话

底层系统需要提供创建圈集,修改,激活,导出圈集。

导出圈集可以将数据库中的数据,或者数据仓库的数据 首圈导出到文件系统,然后发消息给业务系统。

这样业务系统就统一处理,落批量处理流水,落任务,任务回调处理。

底层的圈集支持 t+1的日滚,底层系统会导出文件,然后个上一次导出的文件做比对,获取对应的增量导入,增量删除的文件,然后发送消息将文件带给业务方,业务方进行统一的处理。

目前圈集可以支持,圈选商品,门店,商户等各种互联网信息


推荐阅读
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 从码农到创业者:我的职业转型之路
    在观察了众多同行的职业发展后,我决定分享自己的故事。本文探讨了为什么大多数程序员难以成为架构师,并阐述了我从一家外企离职后投身创业的心路历程。 ... [详细]
  • 本文详细介绍了 Linux 系统中用户、组和文件权限的设置方法,包括基本权限(读、写、执行)、特殊权限(SUID、SGID、Sticky Bit)以及相关配置文件的使用。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • ArchSummit深圳2014将于7月18日拉开帷幕,所有讲师已确认,涵盖9个热门话题,共36场精彩报告。InfoQ中文站提供了详细的讲师和报告列表。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • Hadoop发行版本选择指南:技术解析与应用实践
    本文详细介绍了Hadoop的不同发行版本及其特点,帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]
  • 离线安装Grafana Cloudera Manager插件并监控CDH集群
    本文详细介绍如何离线安装Cloudera Manager (CM) 插件,并通过Grafana监控CDH集群的健康状况和资源使用情况。该插件利用CM提供的API接口进行数据获取和展示。 ... [详细]
  • 深入解析Hadoop的核心组件与工作原理
    本文详细介绍了Hadoop的三大核心组件:分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制,帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]
  • 本文探讨了随着并发需求的增长,MySQL数据库架构如何从简单的单一实例发展到复杂的分布式系统,以及每一步演进背后的原理和技术解决方案。 ... [详细]
  • 本文详细介绍了 Apache ZooKeeper 的 FileTxnLog 类中的 setPreallocSize 方法,并提供了多个实际应用中的代码示例。通过这些示例,读者可以更好地理解如何在不同场景下合理设置日志文件的预分配大小。 ... [详细]
author-avatar
WenFJ
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有