跳到主要内容
回到顶部
Augusta University LogoShield

信息:

  • 当前的学生
  • 校友
  • 社区
  • 教职员工
  • 军事
  • 病人

资源

  • a - z指数
  • 日历
  • bet365
  • 网站LMS
  • 电子邮件
  • 库
  • MyAugusta
  • 新闻
  • 工作和职业
  • 门户网站
  • 突袭
  • 航天飞机
  • 招生
  • 学者
  • 关于
  • bet365在线平台
  • 体育运动
  • 研究
  • 健康
  •  给
高性能计算
  • 关于
  • 系统
  • 软件
  • 访问
  • 支持

发现

高性能计算服务

为研究人员、教职员工提供高速操作、分析和存储大量数据的能力

  • 奥古斯塔大学
  • 信息技术
  • 高性能计算
  • 手持电脑系统

手持电脑系统

GPU处理核心

现代NVIDIA gpu具有三种不同类型的处理核心:

NVIDIA CUDA内核

计算统一设备架构(CUDA)是一个并行计算平台,建立在专用硬件和NVIDIA指令集的应用程序编程接口(API)上。CUDA核心是离散的处理器,通常在单个GPU芯片上枚举数千个,允许数据在bet365平台核心之间并行处理。

CUDA核心是通用GPU计算的主力组件。它们提高了无数科学工作负载并行处理的性能和成本效益。当它们与其他专业GPU核心类型互补时,工作负载性能进一步加快。

NVIDIA张量核心

张量是一种数据类型,可以表示几乎任何类型的有序或无序数据。它可以被认为是一个可以存储多维数据集的容器。用最简单的术语来说,它可以被认为是一个矩阵的扩展。例如,矩阵是包含数字的二维结构,但张量是数字的多维集合。

张量内核支持混合精度计算,动态调整计算以加速吞吐量,同时保持准确性。最新一代将bet365平台加速扩展到各种工作负载。例如,在人工智能(AI)、机器学习(ML)和深度学习(DL)工作负载中,高达10倍的加速是常见的,而在一般HPC工作负载中,高达2.5倍的加速是常见的。

张量核的计算速度比CUDA核快。主要是因为CUDA内核每个时钟周期执行一个操作,而张量内核每个时钟周期可以执行多个操作。对于ML和DL模型,CUDA内核在成本和计算速度方面不如Tensor内核有效,但它们仍然提高了它们的生产力。

NVIDIA光线追踪核心

光线追踪核心是NVIDIA RTX显卡所独有的。RTX技术为3D设计和渲染以及逼真的物理世界模拟(包括视觉效果)提供了细节和准确性。生成的仿真和可视化功能不仅限于事物的外观,还包括其行为。CUDA内核和api与RTX内核的结合使现实世界对象的行为和粒度数据可视化功能的精确建模成为可能。

集群存储

HOME文件系统(/ HOME)用于存储作业提交脚本、小型应用程序、数据库和其他用户文件。当登录到任何集群系统时,所有用户都将看到一个主目录。用户主目录的内容在集群系统之间是相同的。

所有用户的主目录都有20GB的配额。

SCRATCH文件系统(/ SCRATCH)是一个容量大、性能高的并行文件系统,用于计算作业。SCRATCH文件系统被认为是临时存储。

LOCAL SCRATCH文件系统(/lscratch或/tmp)是一个性能合理但容量较小的共享文件系统,位于每个计算节点的本地,也用于计算作业。LOCAL SCRATCH文件系统也被认为是临时存储。

WORK文件系统(/ WORK)用于存储跨用户或计算作业的共享数据。WORK文件系统可以被集群中的计算节点读取,但不能写入。因此,它被称为“近线存储”。

所有组工作目录都有500GB的配额。

PROJECT文件系统(/ PROJECT)用于活动作业数据的长期用户或共享组存储。如果当前或正在进行的计算作业需要计算项目数据,则将其视为活动数据。PROJECT文件系统不是遗留作业数据的存档,它被称为“脱机存储”,因为计算节点无法访问它。

所有组项目目录都有1TB的配额。

集群节点

作业提交节点

作业提交节点允许用户对集群进行身份验证,有时称为“登录节点”。它们还提供编写脚本、提交和管理批处理计算作业所需的应用程序。批量计算任务提交到集群工作队列。然后,用户等待调度作业,并在请求的计算资源可用时运行作业。

用户需要一个为AUHPCS配置的AU NetID和一个为Duo双因素身份验证配置的设备来访问作业提交节点。

数据传输节点

数据传输节点提供对集群中用户文件系统的访问。它们的作用是促进集群内bet365平台文件系统之间的高速数据传输。bet365平台节点还可用于在集群内外传输数据。

用户需要一个已经为AUHPCS配置的AU NetID,以及一个配置为Duo双因素身份验证的设备来访问数据传输节点。

计算节点概况

通用Intel计算节点:

  • 型号:戴尔PowerEdge R440服务器
  • 处理器:Intel Xeon Silver 4210R(20个Cascade Lake内核)2.4G, 13.75M Cache
  • 内存:96GB DDR4-2400
  • 本地刮刮空间:960GB SSD
  • 节点数量:18

bet365平台节点是生物信息学、基因组学、人口科学、数学、化学和物理工作负载的候选者,资源需求最适度。

中间内存Intel计算节点:

  • 型号:戴尔PowerEdge R640服务器
  • 处理器:(2)Intel Xeon Gold 5218R (40 Cascade Lake核心)2.1G, 27.5M Cache
  • 内存:768GB DDR4-2666
  • 本地刮刮空间:960GB SSD
  • 节点数量:8个

bet365平台节点是生物信息学、基因组学、人口科学、数学、化学、物理和一些具有额外资源需求的建模工作负载的候选节点。bet365平台节点也可能适用于制药、分子生物学和模拟工作负载。

高内存Intel计算节点:

  • 型号:戴尔PowerEdge R640服务器
  • 处理器:(2)Intel Xeon Gold 5220R(48个Cascade Lake核心)2.2G, 35.75M Cache
  • 内存:1.53TB DDR4-2666
  • 本地刮刮空间:1.92TB SSD
  • 节点数量:2

bet365平台节点是具有最大资源需求的生物信息学、基因组学、人口科学、数学、化学、物理、建模、制药、分子生物学和模拟工作负载的候选者

NVIDIA Quadro RTX - Intel计算节点:

  • 型号:戴尔PowerEdge R740XD服务器
  • 处理器:(2)Intel Xeon Gold 6246R (32 Cascade Lake核心)3.4G, 35.75M Cache
  • 处理器:(3)NVIDIA Quadro RTX 6000(图灵,CUDA/张量27,648/3,456核)
  • 内存:768GB DDR4-2933 (CPU), 72GB GDDR6 (GPU)
  • 本地刮刮空间:1.92TB SSD
  • 节点数量:2

bet365平台节点是数据科学、物理和生命科学建模、人工智能、推理和具有适度资源需求的仿真工作负载的候选节点。bet365平台系统还包括硬件功能,可用于加速物理世界的复杂模拟,例如用于科学和数据可视化的粒子或流体动力学。它们还可以用于电影、视频和图形渲染,甚至是特效工作负载。

NVIDIA Tesla T4 - Intel计算节点:

  • 型号:戴尔PowerEdge R740XD服务器
  • 处理器:(2)Intel Xeon Gold 6246R (32 Cascade Lake核心)3.4G, 35.75M Cache
  • 处理器:(2)NVIDIA Tesla T4(图灵,CUDA/张量10,240/1,280核)
  • 内存:768GB DDR4-2933 (CPU), 32GB GDDR6 (GPU)
  • 本地刮刮空间:1.92TB SSD
  • 节点数量:2

bet365平台节点是数学、数据科学、人工智能、推理、机器学习、深度学习和具有适度资源需求的仿真工作负载的候选节点。

NVIDIA A100 - AMD计算节点:

  • 型号:NVIDIA DGX A100 P3687
  • 处理器:(2)AMD EPYC 7742(128罗马核)2.25G, 256M高速缓存
  • 处理器:(8)NVIDIA A100张量核心(安培,CUDA/张量55,296/3,456核心)
  • 内存:1TB DDR4-3200 (CPU)、320gb、HBM2e (GPU)
  • 本地刮刮空间:15TB NVMe
  • 节点数量:1

该节点提供集群中最大的端到端高性能计算平台性能。它提供了许多增强功能,为大规模人工智能、推理、深度学习、数据分析和数字取证工作负载提供了显著的加速。

软件

红帽系统实用程序和应用程序支持

Research Technology系统管理人员可以协助大多数Red Hat Linux操作系统、应用程序和系统实用程序支持。如果需要,对Red Hat Linux的企业支持可以扩展到专业服务。然而,由于许多Linux发行版之间通常存在共性,Research Technology也可以帮助支持其他发行版上的应用程序和实用程序。

作业提交脚本支持

研究技术高性能计算系统工程和应用人员可以协助许多工作提交脚本组成和故障排除任务。然而,重要的是要理解作业提交脚本问题和调试可能很复杂,并且支持通常需要用户和工作人员之间的合作。

软件交付

将使用以下方法向集群提供软件。

  • 由用户在其主目录下安装
  • 作为LMOD环境模块安装到集群中
  • 安装在最终用户管理的Singularity容器中
  • 安装在HPCS专用网络应用服务器上
  • 一些需要GPU资源的外部托管应用程序

文档

  • BASH脚本 
  • 环境模块(LMOD) 
  • 奇点的容器 
  • 从源代码构建应用程序 
  • SLURM工作负载管理器 

访问

要访问AUHPCS研究人员,教师或工作人员必须满足以下要求:

  • 有一个活动的AU NetID和一个为Duo双因素身份验证配置的设备。
  • 使用iLAB“高性能计算和并行计算服务核心”页面注册为首席研究员(PI),或由注册PI添加到现有项目中。
  • 完成基本Linux能力(如果需要)和AUHPCS集群概念、使用和工作流程所需的培训课程。

一旦授予已批准的计算项目访问权限,遵守AUHPCS治理策略就是一个持续的需求。

 

得到帮助

支持

ITSS研究技术小组的HPC服务咨询和协助可以使用标准的AU企业支持服务。请求可以bet365平台通过“研究高性能计算服务”分配组直接发送给我们。

软件支持

HPCS将尽一切努力为安装在集群中的科学软件提供一定程度的支持。然而,由于bet365平台软件包中的许多都是开源的,因此在大多数情况下通常无法获得标准支持。在bet365平台情况下,支持将是利用HPCS员工经验、HPCS员工研究和最终用户自我支持的协作工作。对于购买的有支持的软件,HPCS人员将与最终用户和供应商联系,以支持该软件。如果科学软件需要资金获得许可和支持,而大学尚未获得许可,则必须由提出申请的部门购买。

在线服务门户
University Shield

奥古斯塔大学

佐治亚州奥古斯塔市第15街1120号30912

  •  bet365
  •  校园联系人
  • 所有的目录
  • bet365平台
  • 就业
  • 可访问性
  • 认证
  • 校园安全
  • 合规热线
  • 拐卖人口公告
  • 隐私声明
  • 第九条/不当性行为
马上申请 给现在

©2025奥古斯塔大学

脸谱网 推特 LinkedIn Youtube Instagram
©