文章目录[隐藏]
数字资产盘活机器人是一个将机器学习应用于业务场景的解决方案,客户可以使用此解决方案中的机器人,对其上传至 Amazon Web Services(亚马逊云科技)云上的数字资产(例如,照片、PDF文档、视频等非结构化数据)进行知识标记。标记知识将有助于客户实现业务流程自动化。此解决方案利用 Amazon Simple Storage Service (Amazon S3)和Amazon Elastic Compute Cloud (Amazon EC2)的竞价型实例,使客户可以安全的、低成本的使用批处理机器人来标记数字资产。机器人将所识别出的信息存储在客户私有的Amazon S3 存储桶中来保证数据安全性,机器人将运行在EC2竞价型实例中来节省计算成本。此解决方案是一个开源框架,构建者可以通过创建自己的模型或机器人为本解决方案框架做出贡献。
数字资产盘活机器人解决方案提供两个部分功能:模型离线的训练和机器人的使用。模型离线的训练是指,在 Amazon SageMaker 上用开源数据集进行基于容器的机器学习模型训练,训练好的模型会被自动上传到 Amazon ECR 中。机器人的使用是指,当用户发出任务请求后,机器人会自动生成任务列表并执行任务。机器人任务均运行在 Amazon Batch 控制的弹性计算平台上,计算资源为按需使用,执行完成后自行释放,并可以根据您的任务规模自动扩展,同时底层的计算实例为竞价型实例,可以更进一步节省运行的成本。
等待盘活的数字资产首先需要存储在Amazon S3上,之后您只需要向Amazon API Gateway发出REST请求,指定要处理的S3文件和要应用的机器人类型即可。具体流程如下: