数据源，解决复杂请求逻辑外部数据获取难题

作者：孙俊啟66864 | 来源：互联网 | 2023-09-23 07:34

个人博客导航页（点击右侧链接即可打开个人博客）：大牛带你入门技术栈公司专注为各种规模和复杂程度的金融投资机构提供一体化投资管理系统，系统主要由投资组合管理、交易执行管理、实时监控

个人博客导航页（点击右侧链接即可打开个人博客）：大牛带你入门技术栈

公司专注为各种规模和复杂程度的金融投资机构提供一体化投资管理系统，系统主要由投资组合管理、交易执行管理、实时监控管理、风险管理等功能模块构成。随着企业管理产品数量的不断增多，大量数据分散在各券商系统中且数据存储格式各异，难以管理和利用。

为帮助投资机构最大限度地提高投资决策和运营效率，A公司需要实时监控自己的用户在各个交易平台的基本信息、余额、订单交易情况，并根据分析结果及时给出投资建议。

A公司的这种情况并不是个例。目前，越来越多的企业在数据传输的需求场景中，除了从上游不同业务数据库中实时、定时分配到下游系统之外，还有许多需求场景需要从外部合作商、供应商中获取业务数据。

如果想要每天从企业外部系统中获取数据，通常会采用什么方法呢？

一些用户给出的答案是：根据需要编写不同的脚本，手动调用第三方系统提供的API接口，在抓取数据后，自行编写清洗逻辑，最后实现数据落地。

然而随着第三方系统的日益增多，如果按原有方式会带来过多的脚本维护成本和数据传输任务管理成本。为解决上述痛点，DataPipeline在新版本的数据同步任务中增加了「自定义数据源」功能，用户可以通过上传JAR包的方式自定义获取数据逻辑。新功能支持任意的MySQL、Oracle、SQLServer、Hive、HBase等常见数据源，冷门数据库等（如腾讯云TDSQL），常用的API调用，用户自定义的SDK，或者通过Python抓取数据等。

「自定义数据源」提供的价值

通过「自定义数据源」，用户可以：

统一管理数据获取逻辑，快速合并JAR减少脚本开发量。

当上游发生变化时，不需要对每一个数据传输任务进行调整。

可结合DataPipeline的数据解析功能、清洗工具和目标初始化功能减少整体开发量，并提供监控和预警。

如何使用「自定义数据源」功能

用户可通过以下四步使用「自定义数据源」功能：

创建自定义数据源，并上传JAR包（或调取已上传过的JAR包）。

选择数据存放的目的地。

使用清洗工具完成数据解析逻辑。

配置目的地表结构，即可完成所有配置。

关于「自定义数据源」的核心页面：

1. 用户在选择自定义数据源和目的地后，需要在读取设置步骤中上传JAR包

用户可以上传新的JAR包，也可以点击拖放框选择历史已经上传的JAR用作本次任务。

用户通过填充类路径和读取数据所需要的配置信息即可完成数据源读取逻辑。

2. 用户可以在一个任务中选择一个或多个读取对象，每个读取对象可以映射到目标表的表中

3. 完成读取设置后，在写入设置步骤中先确定每个读取对象的数据解析逻辑

DataPipeline会提供JSON解析样例，用户也可以参考样例，自定义解析逻辑。

「样例数据」模块会显示通过读取对象配置获取的数据。

完成清洗脚本内容后，在「运行结果」模块点击「试运行」即可看到最终写入到目的地的数据格式。

4. 完成解析逻辑后，用户可以手动添加名称并选择对应的数据类型，来完成目的地表结构

完成所有配置后点击「立即激活」即可执行数据传输任务。

附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读/书籍书单大全：

（点击右侧即可打开个人博客内有干货）：技术干货小栈

=====>>①【Java大牛带你入门到进阶之路】<<====

=====>>②【算法数据结构+acm大牛带你入门到进阶之路】<<===

=====>>③【数据库大牛带你入门到进阶之路】<<=====

=====>>④【Web前端大牛带你入门到进阶之路】<<====

=====>>⑤【机器学习和python大牛带你入门到进阶之路】<<====

=====>>⑥【架构师大牛带你入门到进阶之路】<<=====

=====>>⑦【C++大牛带你入门到进阶之路】<<====

=====>>⑧【ios大牛带你入门到进阶之路】<<====

=====>>⑨【Web安全大牛带你入门到进阶之路】<<=====

=====>>⑩【Linux和操作系统大牛带你入门到进阶之路】<<=====

天下没有不劳而获的果实，望各位年轻的朋友，想学技术的朋友，在决心扎入技术道路的路上披荆斩棘，把书弄懂了，再去敲代码，把原理弄懂了，再去实践，将会带给你的人生，你的工作，你的未来一个美梦。

推荐阅读

go
Spring MVC 中利用拦截器与自定义注解实现权限控制

本文探讨了如何在 Spring MVC 框架下，通过自定义注解和拦截器机制来实现细粒度的权限管理功能。 ... [详细]

蜡笔小新 2024-11-22 14:35:02
ip
全面覆盖的前端技术资源大全

本文提供了一个详尽的前端开发资源列表，涵盖了从基础入门到高级应用的各个方面，包括HTML5、CSS3、JavaScript框架及库、移动开发、API接口、工具与插件等。 ... [详细]

蜡笔小新 2024-11-23 12:05:53
ip
Python 实现监控与运维自动化方案

本文探讨了使用Python实现监控信息收集的方法，涵盖从基础的日志记录到复杂的系统运维解决方案，旨在帮助开发者和运维人员提升工作效率。 ... [详细]

蜡笔小新 2024-11-23 11:25:14
string
优雅地记录API调用时长

本文旨在探讨如何高效且优雅地记录API接口的调用时长，通过实际案例和代码示例，帮助开发者理解并实施这一技术，提高系统的可观测性和调试效率。 ... [详细]

蜡笔小新 2024-11-25 17:56:55
string
不用任何框架你们能从头到尾写一个完整的项目吗？

现在的新手程序猿，动不动就是框架，就连外面培训的也是框架，我就问一句，没了框架是不是就啥也不会了 ... [详细]

蜡笔小新 2024-11-25 12:37:01
export
如何利用Sitecore API密钥进行项目检索

本文探讨了如何在Sitecore 9环境中通过Postman使用API密钥发送请求，包括解决常见错误的方法。 ... [详细]

蜡笔小新 2024-11-25 09:44:38
ip
iOS客户端上传流至服务器，当权限校验失败时如何避免超时问题

探讨在iOS客户端向服务器上传数据流的过程中，若服务器因权限校验失败而未接收流直接响应时，如何有效避免客户端出现超时的问题。 ... [详细]

蜡笔小新 2024-11-25 06:45:14
text
Quartz 实现 Web 工程动态定时任务调度方案

本文探讨了一个Web工程项目的需求，即允许用户随时添加定时任务，并通过Quartz框架实现这些任务的自动化调度。文章将介绍如何设计任务表以存储任务信息和执行周期，以及如何通过一个定期扫描机制自动识别并加载新任务到调度系统中。 ... [详细]

蜡笔小新 2024-11-24 16:22:58
ip
使用jQuery与百度地图API实现地址转经纬度功能

本文详细介绍了如何利用jQuery和百度地图API将地址转换为经纬度，包括申请API密钥、页面构建及核心代码实现。 ... [详细]

蜡笔小新 2024-11-24 14:33:10
buffer
使用Java调用阿里云服务发送短信验证码

本文介绍如何通过Java代码调用阿里云短信服务API来实现短信验证码的发送功能，包括必要的依赖添加和关键代码示例。 ... [详细]

蜡笔小新 2024-11-24 13:19:44
ip
使用UploadProgress实现文件上传进度条

本文介绍了如何通过安装和配置php_uploadprogress扩展来实现文件上传时的进度条显示功能。通过一个简单的示例，详细解释了从安装扩展到编写具体代码的全过程。 ... [详细]

蜡笔小新 2024-11-24 00:04:13
copy
如何高效学习鸿蒙操作系统：开发者指南

本文探讨了开发者如何更有效地学习鸿蒙操作系统，提供了来自行业专家的建议，包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]

蜡笔小新 2024-11-23 19:22:14
ip
利用R语言实现搜狗细胞词库的转换与处理

本文介绍如何使用R语言中的相关包来解析和转换搜狗细胞词库（.scel格式），并将其导出为CSV文件，以便于后续的数据分析和文本挖掘任务。 ... [详细]

蜡笔小新 2024-11-23 12:28:01
ip
Servlet基础入门指南（上）

本文介绍了Tomcat的基本操作，包括启动、关闭及首次访问的方法，并详细讲解了如何在IDEA中创建Web项目，配置Servlet及其映射，以及如何将项目部署到Tomcat。 ... [详细]

蜡笔小新 2024-11-23 11:55:30
go
特别活动 | 新配送业务启动，多重福利等你来拿！

美团安全响应中心推出全新配送业务测试活动，带来双重福利，邀您共同参与！ ... [详细]

蜡笔小新 2024-11-22 22:39:37

孙俊啟66864

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章