阿里巴巴
阿里巴巴拥有中国最大的电商平台淘宝、天猫,以及中国最大的公有云平台阿里云。在互联网电商、金融及物流零售等行业积累了大量的AIGC经验,并通过阿里巴巴公有云和混合云平台,面向大规模深度学习及融合智算,提供AI工程化全流程能力。在自动驾驶、基础科研、金融等领域广泛应用。
面临的挑战
● 智算网络
阿里云平台需要为智能计算等领域提供高性能、高效率的计算服务,以满足不断增长的计算需求。为此需要采用高效的计算架构和网络架构。同时,以AI和大数据为代表的应用具备高密度、超大数据量的负载特征,阿里云平台需要能够处理大规模的数据并确保高效的计算卡数据交换。为了确保在各种情况下都能保持稳定和高效的计算服务,平台需要提供高可靠性的服务。由于计算资源有限,阿里云平台还需要提高计算效率,减少资源的浪费,以实现高效的计算服务。
● 数据中心
阿里数据中心面临着多方面的挑战和需求。首先,为了满足用户对高性能和低时延计算服务的需求,阿里需要采用高性能的交换机和传输设备,并优化网络协议,以提高数据传输的效率和速度。其次,阿里需要处理大规模的数据,包括存储、传输、计算等,因此需要采用高密度、大容量的设备和多维度的数据处理技术,以提高数据处理的能力和效率。另外,阿里需要提供高效的网络解决方案,包括高速传输、低时延、高吞吐量等,以满足用户的需求。此外,阿里需要不断拓展新的业务场景,并采用新技术和协议来满足这些新场景的需求。同时,阿里需要进行架构演进,以适应不断变化的市场需求和技术发展。
● 办公网
阿里办公网面临着多方面的挑战和需求。首先,为了解决整栋楼内无线用户漫游后的可用性和安全性问题,核心交换机需要拥有整网的用户认证表项,并定制Snooping表项同步功能。其次,阿里办公网需要部署IPv6技术特性,协助构建园区网双栈架构下的接入安全。此外,阿里办公网还需要解决无线用户在楼内漫游时的可用性和安全性问题。最后,阿里办公网需要高效的网络管理和维护,以保证网络的稳定性和可用性。
如何应对挑战
● 智算网络
锐捷网络的高密度400G/200G交换机,基于业界领先的TH5(51.2T)及TH4(25.6T)芯片,已被大规模应用于阿里云平台。该平台结合了软硬件一体优化技术,成功构建出高性能的异构算力底座,这种底座能够为AI工程化的全流程提供全面支持。更重要的是,这款产品具备高性能、高效率以及高利用率等核心优势,使得它能够满足高性能计算等领域的需求。
● 数据中心
锐捷网络作为数据中心网络全场景的主流供应商,其解决方案在交换机部署了PFC+ECN,数据报文采用RoCE v2协议,为RDMA业务提供了高吞吐低时延的网络解决方案。同时,锐捷网络还全面落地了城域网、网关、边缘计算等新场景,并在SR-TE、SRv6等技术领域与阿里进行了深度合作,积极配合阿里的架构演进。锐捷网络在数据中心网络领域拥有丰富的经验和先进的技术实力,持续为阿里提供了高性能、高效率的网络解决方案,受到了市场的广泛认可。
● 办公网
锐捷网络提供的解决方案致力于优化网络架构并提升网络安全性。首先,锐捷网络部署了大二层的网络架构,将无线用户网关上收到核心交换机,这样做不仅简化了网络结构,还有助于提高网络整体效率。其次,核心交换机拥有整网的用户认证表项,并定制Snooping表项同步功能,这一举措有效解决了整栋楼内无线用户漫游后的可用性和安全性问题,为用户提供了稳定且安全的网络环境。此外,锐捷网络还通过部署SAVI、ND等IPv6技术特性,协助构建园区网双栈架构下的接入安全,进一步提升了网络的安全性。
客户收益
锐捷的“万卡级”线性拓展技术为阿里的大模型训练提供了强有力的支持。这一技术实现了点对点通信延迟低至2微秒,使得超大规模算力资源能够平滑扩容,并保持性能的线性拓展。这对于阿里在人工智能领域的研发工作至关重要,确保了训练过程的高效和可扩展性。
其次,锐捷解决方案提供了超高吞吐和IOPS性能。针对AI训练场景中的高带宽需求,锐捷确保了训练时数据加载和写入的高效率,从而显著提升了训练效率。这种优化使得阿里能够更快地进行模型训练,并迅速响应市场需求。
最后,锐捷解决方案实现了高资源利用率。通过采用高效的流量分担技术,锐捷降低了训练中通信的占比,并对GPU资源进行了细粒度的切分调度。这种精细化的资源管理方式大幅提升了资源的利用率,使得阿里能够更充分地利用现有的计算资源,进一步提升了训练效率和经济性。
在数据中心方面,锐捷网络通过其服务器低时延与网络侧低时延的先进技术,成功地为阿里云构建了低时延网络。这种网络为AI计算以及高性能云存储业务提供了卓越的支持,使之得以大规模应用,这无疑极大地推动了阿里的业务发展。同时,锐捷网络与阿里紧密合作,积极配合端网融合架构演进,以及下一代50G/200G技术的演进工作。这使得阿里云能够在第一时间享受到新技术带来的红利,确保了在技术上的领先地位。
在办公网方面,锐捷网络提供了大量定制开发功能,这些功能在实际应用中成功降低了办公网的运维复杂度,使网络维护变得更加简单,大大减轻了后期维护的压力和工作量。阿里与锐捷网络展开了深度的合作探索,构建了稳定可靠的双栈园区网,并实现了IPv6的迅速落地。
如果您对案例感兴趣,欢迎您给我们留言
我的姓名
我的手机号*
我的邮箱
公司名称
更多客户案例
-
辽宁对外经贸学院:光速升级,畅享无线新体验
辽宁对外经贸学院通过引入极简以太全光网络解决方案,解决了原有网络基础设施的多项瓶颈问题,实现了有线无线全覆盖、带宽提升及运维效率的显著提高,为学校的数字化转型提供了坚实基础
-
#交换机
-
#高教/职教
-
#辽宁省
-
-
锐捷网络携智算中心网络方案亮相2024通用人工智能算力论坛
2024通用人工智能算力论坛在京召开,锐捷网络展示其AI-Fabric解决方案,支持大规模GPU集群,优化带宽利用效率,并在高速光通信领域取得突破,助力AI产业发展。
-
#北京市
-
#云桌面
-
-
云桌面助力蚌埠市第二人民医院办公终端云化转型
蚌埠市第二人民医院通过部署锐捷三擎云桌面解决方案,解决了PC管理效率低、信息安全及软硬件兼容性等问题,实现了办公终端的便捷运维与统一管理,提升医疗服务效率。
-
#云桌面
-
#医疗卫生
-
-
云南现代职业技术学院构建全校3000点桌面一朵云助力教育数字化
云南现代职业技术学院采用锐捷网络三擎云桌面方案,实现全校机房统一云化管理,提升教学效率与管理运维水平,助力学校数字化与智能化升级。
-
#云南省
-
#云桌面
-
#高教/职教
-