热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

linux的lsf命令,linuxlf

求Linux下LSF使用的资料LSF(LoadSharingFacility)是分布资源管理的工具,用来调度、监视、分析联网计算机的负载。目的:1,通过集中监控和调度,充分共享计算

求Linux 下LSF使用的 资料

LSF(Load Sharing Facility)是分布资源管理的工具,用来调度、监视、分析联网计算机的负载。

目的:

1, 通过集中监控和调度,充分共享计算机的CPU、内存、磁盘、License等资源

2, 一组安装了LSF软件的计算机组成一个Cluster

3, Cluster内的资源统一监控和调度

LSF批量bkill任务

LSF:Load Sharing Facility

例:bkill所有PSUSP状态的任务

单个用户

(bkill -u username 0,删除该用户下所有提交的并行任务)

bjobs -u username | grep PSUSP|awk '{print $1}' |xargs bkill

所有用户

bjobs -u all -p -q normal | grep PSUSP|awk '{print $1}' |xargs bkill

(-p参数,可有可无,不影响命令执行结果)

PS:常用LSF命令(更详细命令使用可参考LSF的PDF手册)

bjobs 检查提交作业状态

bjobs –r 显示正在运行的作业

bjobs –a 显示正在运行的和最近完成的作业

bjobs -p 显示等待运行的作业和等待原因

bjobs –s 显示正在挂起的作业和挂起的原因

bjobs -l 显示该作业的所有信息

bhist 显示最近完成作业或正在运行作业的历史情况

bhist jobid

bkill 删除不需要的作业

bkill jobid

bkill –r jobid

bpeek 当作业正在运行时显示它的标准输出,监视作业运行

bpeek jobid

bqueues 显示队列信息

bqueues

bqueues –l queue name

bhosts 显示各节点作业相关情况

bhosts

bhosts hostname

linux的lsf和pbs的区别

LSF abbr. 分布式异构计算机环境的负载管理系统(Load Sharing Facility) Today's popular queuing systems include some pay for products such as: LSF and PBS Pro. 当今流行的队列系统包括一些付费产品,比如 LSF 和 PBS Pro。

LSF 作业管理系统

在 上一篇 中我们简要介绍了 PBS 作业管理系统,下面我们将介绍 LSF 作业管理系统。

LSF (Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。

可以通过以下三种方法使用 bsub 来提交作业:

可以直接在 bsub 的命令行中输入完整的参数来提交一个作业,比如:

其中所用的参数说明如下:

这种方式比较适合提交简单的作业,更复杂的作业控制需要编写作业脚本。

LSF 作业脚本本质上也是一个 shell 脚本,在其中可以用 #BSUB开头的行来指明 bsub作业参数。下面是一个 LSF 作业脚本示例:

其中各参数说明如下:

提交作业脚本,使用下面的命令:

在终端中输入 bsub 并回车后会进入 bsub 交互环境,在其中可输入作业参数和执行作业程序。在 bsub 交互环境下可以一次提交多个参数相同的作业,例如:

使用 Ctrl+D 可退出 bsub 交互环境。

可以用 bjobs 命令查看用户正在运行中的作业:

使用 -l参数和某个作业的 JOBID,可以查看该作业的详细信息:

使用 bkill 命令中止某个作业:

以上简要介绍了 LSF 作业管理系统,在 下一篇 中我们将介绍 SLURM 资源管理系统。

如何与多个用户环境中运行的PBS

如何在集群环境中使用fluent计算——fluent并行计算初步(超小白入门,老鸟略过:)

作者:jinsw

现在国内的开放式机群环境越来越多,许多都部署了fluent(大好事),不过还是有许多人不太清楚如何利用这些有用的资源。这里结合我所在单位的情况做一个简单的介绍,其他的机群环境大同小异。

1、 什么是机群?有什么特点?

机群又叫集群,当然就是许多的计算机(废话),因为机器太多了,又需要协同工作,所以需要按照一定的方式来管理,管理的结构形式叫做拓扑(这个不用管)。机群使用的电脑是刀片(又薄又长的机箱)形式(为了便于插入机柜),一个刀片一般称为一个节点。

一般而言,机群会分为三种节点:管理节点(若干台),编译节点(若干台),计算节点(其余全部)。这三种节点的配置略有不同(废话),管理节点主要用来存储使用机群的用户的信息,如名字,密码,可以使用机器数的权限,用户状态等等;编译节点一般用来预查程序故障,用户的程序先在这里试运行,查看是否与系统兼容等;计算节点用来直接计算其他节点提供来的程序。

就配置而言,管理节点和编译节点一般相同,会部署软件环境;计算节点只会部署简单的必要运行文件。计算机点之间会采用高速交换机,速度可达几十GB/s,如IB等;计算节点与编译、登陆节点之间采用普通的万兆交换机。

2、 如何使用机群?

机群中一般采用linux操作系统来操作(多用户情况下效率高),用户会通过远程登录软件(如xshell)来登录到登陆节点进行个人的操作(一般会通过VPN网络加密数据传输)。

Linux集群将程序任务分解发送到计算节点上时,是通过LSF作业调度系统(也有其他的,如PBS等)来实现的,这个系统的作用是使整个机群负载均衡,便于管理,所以我们使用fluent也要通过这个系统。在成熟的集群中,用户登录之后,默认便可以使用作业调度系统了。使用时,除了常见的linux命令以外,调度系统也有一些简单的命令,这个一般会有手册介绍,常用的就3、5个,很好记。

3、 如何在集群中使用fluent?

因为fluent是成熟的封装好的商业软件,所以用户直接使用命令调用即可。

但是因为大部分的linux下的远程登录是不支持图形界面的,所以我们看不到在windows下的熟悉界面,无法进行操作。其实,fluent最早也是linux下的软件,它提供了一种jou脚本来操作各种命令(即帮助中的TUI命令),我们在windows的图形界面中,也可以在控制台窗口中查看如何使用。这样,我们在启动fluent软件时,指定它的jou执行脚本即可使软件按照我们的意图来进行操作了。如果在帮助中找太慢,可以在windows的fluent图形界面下,右下角控制台中用回车键显示文字命令,q键返回。

4、 实例

这里给出一个在LSF调度系统中使用fluent的实例:

首先,使用bsub命令提交LSF脚本(名字为fluent.lsf),在命令窗口中键入:bsub fluent.lsf即可。

脚本内容如下:

#!/bin/sh (这句话是说此脚本使用/bin/sh来解释执行,小白可以略过)

APP_NAME=fluent (这句话是说此脚本调用名字为fluent的集群排序提交队列,小白继续略过)

NP=2 (这句话是说此脚本的任务将调用2个CPU core来执行)

NP_PER_NODE=1 (这句话是说此脚本的任务将在分配用来执行任务的每个节点上调用1个CPU core来执行)

RUN="fluent 2ddp -g -i fluent.jou -r15.0.0 -pib –mpi=pcmpi" (这句话是说此脚本的执行命令以及参数,2ddp 是指二维双精度类型计算,这个大家应该熟悉了;fluent.jou就是我们使用的fluent命令执行脚本的名字)

fluent.jou脚本内容实例:

/file/read-case ./boil-unstdy.cas (读取cas文件,boil-unstdy.cas)

/file/read-data ./boil-unstdy.dat (读取dat文件,boil-unstdy.dat)

define/user-defined/compiled-function/compile (定义编译函数库并制定编译文件)

libudf

yes

boiling-rpi-model.c

define/user-defined/compiled-function/load (加载编译函数库)

libudf

/file/auto-save/data-frequency 100 (自动保存)

/solve/initialize/initialize-flow(初始化)

/solve/dual-time-iterate (求解循环设置)

500

20

/file/read-data ./boil-unsteady-out.dat (保存结果)

exit (退出fluent)

yes


推荐阅读
  • 如果应用程序经常播放密集、急促而又短暂的音效(如游戏音效)那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点:1)延时时间较长,且资源占用率高 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • [转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]
  • 本文介绍了Java编程语言的基础知识,包括其历史背景、主要特性以及如何安装和配置JDK。此外,还详细讲解了如何编写和运行第一个Java程序,并简要介绍了Eclipse集成开发环境的安装和使用。 ... [详细]
  • malloc 是 C 语言中的一个标准库函数,全称为 memory allocation,即动态内存分配。它用于在程序运行时申请一块指定大小的连续内存区域,并返回该区域的起始地址。当无法预先确定内存的具体位置时,可以通过 malloc 动态分配内存。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 包含phppdoerrorcode的词条 ... [详细]
  • 操作系统如何通过进程控制块管理进程
    本文详细介绍了操作系统如何通过进程控制块(PCB)来管理和控制进程。PCB是操作系统感知进程存在的重要数据结构,包含了进程的标识符、状态、资源清单等关键信息。 ... [详细]
  • 本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用,包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]
  • 解决Parallels Desktop错误15265的方法
    本文详细介绍了在使用Parallels Desktop时遇到错误15265的多种解决方案,包括检查网络连接、关闭代理服务器和修改主机文件等步骤。 ... [详细]
  • PHP 各版本对比:标准版与最新顶级版的详细分析 ... [详细]
  • MATLAB字典学习工具箱SPAMS:稀疏与字典学习的详细介绍、配置及应用实例
    SPAMS(Sparse Modeling Software)是一个强大的开源优化工具箱,专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB,提供了丰富的算法和函数,适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例,帮助用户更好地理解和使用这一工具箱。 ... [详细]
  • 如何在PDF文档中添加新的文本内容?
    在处理PDF文件时,有时需要向其中添加新的文本内容。这是否可以直接实现呢?有哪些简便且免费的方法可供选择?使用极速PDF阅读器打开文档后,可以通过点击左上角的“注释”按钮切换到注释模式,并选择相应的工具进行编辑。此外,还可以利用其他功能丰富的PDF编辑软件,如Adobe Acrobat DC或Foxit PhantomPDF,它们提供了更多高级的编辑选项,能够满足更复杂的需求。 ... [详细]
  • 解决针织难题:R语言编程技巧与常见错误分析 ... [详细]
  • 在 CentOS 6.4 上安装 QT5 并启动 Qt Creator 时,可能会遇到缺少 GLIBCXX_3.4.15 的问题。这是由于系统中的 libstdc++.so.6 版本过低。本文将详细介绍如何通过更新 GCC 版本来解决这一问题。 ... [详细]
author-avatar
不点包子
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有