热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

stata中计算公式命令_Stata博文|Stata在云端的应用

随着越来越多的组织将其IT,数据管理和数据分析需求转移到云端,我经常要回答以下问题:1.Stata可以在云端运行吗?2.可以

随着越来越多的组织将其IT,数据管理和数据分析需求转移到云端,我经常要回答以下问题:

18e5c3f438cbf035918cdd8506437a56.png

1. Stata可以在云端运行吗?

2. 可以在云端运行Stata副本吗?

3. Stata在云端的最佳设置是什么?

4. Stata在云端的性能如何?

在回答这些问题之前,让我们先定义什么是云计算。以下是维基百科对云计算的定义:

“云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备,使用服务商提供的电脑基建作运算和资源。该术语通常用于描述互联网上可供许多用户使用的数据中心。”

我看到用户使用云计算的主要原因是,他们可以轻松地将更多的计算资源(内存和内核)添加到正在从事的项目中,以加快开发和分析的速度。云服务的好处在于它提供了一种轻松的方法来按需添加资源。基本上,仅在需要硬件资源时才付费,这样既节省时间和金钱,又可以相应地扩展不同的项目。

现在我们谈谈云平台。我看到用户使用的两个主要平台是Amazon Web Services和Microsoft Azure。当然还有其他平台。

那么,Stata可以在云端运行吗?Stata当然可以。大多数云计算机是运行Linux或Windows操作系统的虚拟机,Stata可以同时运行这两种系统。现在,应使用Stata的哪个版本?IC,SE或MP?如果要使用大型数据集,并且希望使用的高度并行的Stata命令,那么我绝对建议在云端使用Stata / MP。

用户经常询问是否允许他们在云端使用其Stata许可证。答案是当然可以。我们在本地工作站或服务器,本地虚拟机和云上等效虚拟机之间没有任何区别。您可以在任何所需的计算机上使用Stata许可证,无论是真实的,虚拟的还是在云端的虚拟机。

第三个问题有点难回答。最佳设置很大程度上取决于您的特定需求。您需要回答以下一些问题:

18e5c3f438cbf035918cdd8506437a56.png

1. 用户习惯使用哪种操作系统?

2. 使用的典型数据大小是多少?

3. 在云端分配多少个内核和多少内存?

4. Stata在云端的性能如何?

请注意,这些问题不是特定于云端的,它们实际上适用于任何设置、云端或本地环境,在这些环境中,资源是在用户之间共享的。最后一个问题很重要。一旦您的云端(或本地)计算机上有多个用户同时使用Stata,您必须确保拥有一台足够大的计算机,并为所有用户提供足够的内存和内核。例如,如果您拥有一个Stata / MP 4核2用户的许可证,那么您将希望有一台至少分配了8个核的云机器,每个Stata用户有4个核。或者,您将需要启动多个云实例,为用户提供自己的虚拟机。

下一个考虑因素是内存。如果用户使用的是5 GB大小的Stata数据集,则需要为云计算机分配至少16 GB的RAM,为内存中的数据分配10 GB的RAM,并为运行操作系统增加更多的内存。或者,您可以分配两台具有8 GB RAM的云计算机。

我听到的关于在云端使用Stata的最常见问题是,用户有时会争用RAM,因为一些用户试图在同一台计算机上同时将大型数据集加载到RAM中。解决此问题的最简单方法是按设计方式使用云—缓存多台虚拟机以扩展负载。培训Stata用户有效地使用内存也很容易。这样做的方法是让他们仅从Stata的内存空间中的数据集中加载需要分析的变量,而不是将整个数据集盲目地带入内存。例如,假设用户正在使用包含20,000个变量的美国人口普查数据集,但该用户实际上只希望分析其中的100个变量。Stata能够使用use命令从Stata数据集中仅加载用户所需的变量。

如果您不确定要加载哪些变量或需要搜索要加载的确切变量,则可以使用Stata 16的GUI轻松搜索变量。

一旦有了确切的use命令后,将该命令复制到一个do文件中,并保存以供将来加载数据。

最后一个问题,关于Stata在云中表现如何,同样取决于上面讨论的相同问题。这与询问有关Stata在本地计算机上的性能如何的问题相同。

您的组织将使用的数据集的典型大小是多少?正在使用哪种类型的云虚拟机,要分配多少核心和多少内存?多少用户将同时访问此云虚拟机?正在使用什么Stata命令和模型?云提供商将发布您可以使用的虚拟机实例的规范,并且Stata将在其上执行操作,就像在等效的物理机上执行一样。

数据大小,分配的资源以及同时使用资源的人数将成为构建环境时要考虑的主要问题。

免费Stata机器学习直播培训

03913e04bc6d612f755253efe1e45af4.png

免费的在线直播课程上线啦!2019年11月20日起每周三下午14:00为大家安排了Stata机器学习直播培训!本课程全程免费,准点开课,直播名额有限,大家抓紧报名!

834d0571bdfd5062b265e62f7d657067.gif

文章精选

e64dd1d14c7527b16b7e900bf03908e6.gif

Stata博文 | 使用蒙特卡罗模拟计算功率part 2:使用power运行模拟

Stata博文 | 使用蒙特卡罗模拟计算功率part 1:基础知识

免费培训 |Stata机器学习直播培训

2019 Stata洞察数据科学大会 精彩再现!

在Stata软件中如何自动执行常见任务

Stata软件处理大数据集的神器|ftools和gtools命令博文分享 | 在Stata软件中编写估计命令:编写插件案例分享 | Stata软件处理效应与案例分析Stata处理效应与案例分析网络抓取NFL数据到Stata中Stata软件教程:用 import fred命令导入数据Stata软件教程:Mata运算stata软件教程:结构方程模型stata软件教程:编程初步Stata软件教程系列:Stata在忽略干扰因素下的估计Stata软件最新版本15最全功能介绍分享Stata软件教程系列:DSGE模型的参数估计Stata教程系列:用putexcel命令创建Excel表格 Part 2:宏,图片,矩阵和公式表达式Stata教程系列: 用putexcel命令创建Excel表格 part 1:概念和框架

f47c2b8665c87284a845f76ee576df73.png

7ed13f621a596acec511aa62886a9279.gif



推荐阅读
  • Python库在GIS与三维可视化中的应用
    Python库极大地扩展了GIS的能力,使其能够执行复杂的数据科学任务。本文探讨了几个关键的Python库,这些库不仅增强了GIS的核心功能,还推动了地理信息系统向更高层次的应用发展。 ... [详细]
  • 全能终端工具推荐:高效、免费、易用
    介绍一款备受好评的全能型终端工具——MobaXterm,它不仅功能强大,而且完全免费,适合各类用户使用。 ... [详细]
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 大数据时代的机器学习:人工特征工程与线性模型的局限
    本文探讨了在大数据背景下,人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步,传统的特征工程方法面临挑战,文章提出了未来发展的可能方向。 ... [详细]
  • EasyMock实战指南
    本文介绍了如何使用EasyMock进行单元测试,特别是当测试对象的合作者依赖于外部资源或尚未实现时。通过具体的示例,展示了EasyMock在模拟对象行为方面的强大功能。 ... [详细]
  • 本文探讨了Web开发与游戏开发之间的主要区别,旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]
  • 本文将详细介绍如何在ThinkPHP6框架中实现多数据库的部署,包括读写分离的策略,以及如何通过负载均衡和MySQL同步技术优化数据库性能。 ... [详细]
  • 本文将介绍如何利用Python爬虫技术抓取国内主流在线学习平台的数据,并以51CTO学院为例,进行详细的技术解析和实践操作。 ... [详细]
  • 利用Python实现自动化群发邮件
    本文详细介绍如何使用Python语言来实现邮件的自动群发功能,适合希望提高工作效率的技术爱好者和开发者。 ... [详细]
  • 新手指南:在Windows 10上搭建深度学习与PyTorch开发环境
    本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程,包括安装必要的软件和配置环境变量等步骤,旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ... [详细]
  • 本文旨在探讨机器学习与数据分析之间的差异,不仅在于它们处理的数据类型,还包括技术背景、业务应用场景以及参与者的不同。通过深入分析,希望能为读者提供清晰的理解。 ... [详细]
  • 在Ubuntu 16.04中使用Anaconda安装TensorFlow
    本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先,需要下载并安装Anaconda,然后配置环境变量以确保系统能够识别Anaconda命令。接着,创建一个特定的Python环境用于安装TensorFlow,并通过指定的镜像源加速安装过程。最后,通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]
author-avatar
Q457423356
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有