ファーウェイとPCLがCloud Brain IIを構築し、1000 PFLOPS規模でのAIクラスターの新章へと歩みだす


【深セン(中国)2019年12月3日PR Newswire=共同通信JBN】

*PCLがHuawei Atlas 900 AIクラスターを選択し、Kunpengコンピューティング業界支援態勢を強める

ファーウェイ(Huawei、華為技術)とPeng Cheng Laboratory(PCL)は2019年11月29日、共同でPeng Cheng Cloud Brain II Phase 1をリリースし、1000 petaFLOPS(PFLOPS)規模でのAIクラスターへの旅を正式に開始した。これは、Kunpengコンピューティング業界の科学研究分野における新たなマイルストーンを記すものである。Cloud Brain IIの基盤で動作しているのは、Huawei KunpengおよびAscendプロセッサーで動作するHuawei Atlas 900 AIクラスターである。Atlas 900は、堅ろうなコンピューティングパワーをCloud Brain IIに注ぎ込み、コンピュータービジョン、自然言語、自動運転、スマート輸送、スマートヘルスケアなど、AI分野の基礎研究と探査をサポートする。Peng Cheng Cloud Brainのコンピューティングパワーは現在100 PFLOPSであり、来年には1000 PFLOPS以上に拡張する予定である。


(写真説明:正式開始式でのファーウェイ上級バイスプレジデント兼ファーウェイ・クラウド& AIプロダクト&サービス・プレジデントであるホウ・ジンロン氏(左)とPeng Cheng Labディレクターのガオ・ウエン氏(右))

ファーウェイ上級バイスプレジデント兼ファーウェイ・クラウド& AIプロダクト&サービス・プレジデントであるホウ・ジンロン氏は「今年9月、ファーウェイはKunpeng + Ascendデュアルエンジン・コンピューティング戦略を開始した。この戦略に触発され、当社は世界に究極のコンピューティングパワーを提供することにコミットしている。また、世界最速のAIトレーニングクラスターであるAtlas 900もリリースした」と語った。

ホウ氏は「今日、Atlas 900がPeng Cheng Cloud Brain IIプロジェクトに選ばれたことを誇りに思う。それはCloud Brain IIの基礎を築く。Cloud Brain IIは、業界をリードするAI研究プラットフォームである。PCLは多くの学者とAI研究人材を結集してきた。ファーウェイはPCLと共同で、インテリジェントな世界のための最先端の科学研究で先頭に立つ」と付言した。

ホウ氏はまた、「現在、われわれはCloud Brain IIフェーズ1を構築しつつある。私は、共同の取り組みにより、近い将来1000 PFLOPS規模のCloud Brain IIへの道が開かれると信じている。われわれはそれが世界をリードするAI研究プラットフォームになると確信している」と語った。

ファーウェイ・インテリジェントコンピューティング・ビジネスデパートメント・プレジデントであるマイケル・マー氏は「ファーウェイは、AscendプロセッサーをベースにAtlas AIコンピューティングプラットフォームを構築し、モジュール、カード、エッジステーション、AIサーバー、クラスターの幅広いポートフォリオを提供している。当社のすべてのシナリオのAIインフラストラクチャーはクラウドエッジデバイスをカバーし、深層学習のためのフルパイプラインの推論とトレーニングをサポートしている」と語った。

マー氏は「当社主力製品のAtlas製品であるAtlas 900は、世界のAIコンピューティングの最高峰である。Atlas 900とCloud Brain IIの結合は、1000 PFLOPS規模のAIクラスターの新しい章に乗り出し、優れたコンピューティングパワーを解き放ち、業界全体でより迅速でインテリジェントな変革を推進する」と語った。


(写真説明:Atlas 900を紹介するファーウェイ・インテリジェントコンピューティング・ビジネスデパートメント・プレジデントであるマイケル・マー氏)

Peng Cheng Cloud Brainは、AIの分野における重要なテクノロジー施設である。それはAIテクノロジーの最前線を探求するための基本的な研究プラットフォームである。現在、AIは100 PFLOPSのAIコンピューティングパワーを誇り、来年のCloud Brain IIプロジェクトで1000 PFLOPS規模に達すると見込まれている。

Cloud Brain IIは、PCLとファーウェイにより共同で構築されている。Huawei KunpengおよびAscendプロセッサーで実行されるAtlas 900 AIクラスターは、優れたコンピューティングパワーを提供する。PCLは、1000 PFLOPSでのCloud Brainテクノロジーを開発している。

Atlas 900 AIクラスターは、10年以上にわたるファーウェイの技術ノウハウを継承してきた。数千のAscend 910 AIプロセッサーで構成されるAtlas 900は、ResNet画像分類モデルのトレーニングを59.8秒で完了する。これは、これまでの同じ精度での世界記録よりも10秒速い。Atlas 900の強力なコンピューティング能力は、天文探査、天気予報、自動運転、石油探査などの科学研究と技術革新に変化をもたらしている。Atlas 900のハイライトは以下の通り:

*強力なコンピューティング:数千のAscend 910 AIプロセッサーを統合したAtlas 900は半分の精度(FP16)で256 - 1024 PFLOPSをもたらす。これはパソコン50万台のコンピューティングパワーに等しい。SoC設計は、AIコンピューティング、汎用コンピューティング、およびI/O機能を統合して、トレーニングの効率を効果的に向上させる。

*高速クラスターネットワーク:Huawei Cache Coherence System (HCCS)、PCIe 4.0、100G RoCEの3つのタイプの高速ネットワークインターフェースをサポートして、グラディエント同期レイテンシーを10%から70%削減し、モデルトレーニングの効率性を飛躍的に高める。革新的なiLosslessインテリジェントスイッチングアルゴリズムを活用して、ネットワーク全体のトラフィックのリアルタイム学習とトレーニングを実現し、パケット損失ゼロとマイクロ秒のエンドツーエンド・レイテンシーを達成する。

*究極の放熱:Atlas 900は、キャビネットレベルの断熱システムを使用して、95%を超える液体冷却率と1.1未満のシステム電力使用効率(PUE)を実現する(理想的なPUEは1.0)。

これまでファーウェイは、Ascend 910および310 AIプロセッサーをベースとしてAtlas 900 AIクラスター、Atlas 800 AIサーバー、Atlas 500 AIエッジステーション、Atlas 300 AIアクセラレーターカード、およびAtlas 200 AIアクセラレータモジュールを発売してきた。この全体的なAtlasポートフォリオは、クラウドエッジデバイス全体のすべてのシナリオでトレーニングと推論のための強力なコンピューティングを提供する。

今後、ファーウェイはKunpengコンピューティング業界向けのプロセッサー、オペレーティングシステム、データベースなどのインフラストラクチャーへの投資とイノベーションの強化を継続し、Peng Cheng Cloud BrainにAIコンピューティングを提供し、AIテクノロジーをより広い範囲のアプリケーションでより速く実現していく。





Huawei and PCL Build Cloud Brain II, Embarking on a New Chapter for AI Clusters at 1000 PFLOPS Scale


SHENZHEN, China, Dec. 3, 2019 /PRNewswire=KYODO JBN/ --

- PCL Selects the Huawei Atlas 900 AI Cluster, Gearing Up for a Boost to the

Kunpeng Computing Industry

On November 29, 2019, Huawei and Peng Cheng Laboratory (PCL) jointly released

Peng Cheng Cloud Brain II Phase 1, officially launching the journey to AI clusters

at 1000 petaFLOPS (PFLOPS) scale. This marks a new milestone in the scientific

research field for the Kunpeng computing industry. Running at the bedrock of Cloud

Brain II is the Huawei Atlas 900 AI cluster, powered by the Huawei Kunpeng and

Ascend processors. Atlas 900 infuses robust computing power into Cloud Brain II,

supporting basic research and exploration in the AI field, such as computer vision,

natural language, autonomous driving, smart transportation, and smart healthcare.

The computing power of Peng Cheng Cloud Brain is currently 100 PFLOPS,

planned to scale to 1000 PFLOPS and higher next year.


Hou Jinlong (left), Senior VP of Huawei, and President of Huawei Cloud & AI Products

and Services and Gao Wen (Right), Director of Peng Cheng Lab, in the launch ceremony

"This September, Huawei embarked on the Kunpeng + Ascend dual-engine computing strategy.

Inspired by this strategy, we are committed to providing the ultimate computing power to

the world. We also released Atlas 900, the world's fastest AI training cluster," said Hou Jinlong,

Senior VP of Huawei, and President of Huawei Cloud & AI Products and Services.

"Today, we're proud to see Atlas 900 selected for the Peng Cheng Cloud Brain II project.

It lays the cornerstones for Cloud Brain II. Cloud Brain II is an industry-leading AI research

platform. PCL has brought together many academicians and AI research talents.

Huawei will join PCL in spearheading forefront scientific research for an intelligent world,"

Hou added.

Hou also said, "Right now we are building Cloud Brain II Phase 1. I believe that,

with our joint effort, this will pave the way to a Cloud Brain II at 1000 PFLOPS scale

in the near future. We are confident that it will become a world-leading AI research platform."

Michael Ma, President of Huawei's Intelligent Computing Business Dept, said,

"Huawei builds the Atlas AI computing platform based on the Ascend processors,

providing a broad portfolio of modules, cards, edge stations, AI servers, and clusters.

Our all-scenario AI infrastructure covers the cloud-edge-device, supporting full-pipeline

inference and training for deep learning."

"Our flagship Atlas product, Atlas 900, stands as the pinnacle of AI computing

in the world. The combination of Atlas 900 and Cloud Brain II will embark on a

new chapter for AI clusters at 1000 PFLOPS scale, and unlock superb computing

power to drive faster intelligent transformation across industries," said Ma.


Michael Ma, President of Huawei’s Intelligent Computing Business Dept,

introducing Atlas 900

Peng Cheng Cloud Brain is a key technology facility in the field of AI. It is a basic research

platform for exploring the frontier of AI technology. Currently it boasts an AI computing power

of 100 PFLOPS, and is expected to reach 1000 PFLOPS scale in the Cloud Brain II project next year.

Cloud Brain II is jointly built by PCL and Huawei. Running on Huawei Kunpeng and

Ascend processors, the Atlas 900 AI cluster provides superior computing power.

PCL develops Cloud Brain technologies at 1000 PFLOPS.

The Atlas 900 AI cluster has inherited Huawei's technology know-how of over a decade.

Composed of thousands of Ascend 910 AI processors, Atlas 900 completes training of

a ResNet image classification model in 59.8s, 10 seconds faster than the previous world

record at the same precision. The powerful computing capability of Atlas 900 delivers

a difference in scientific research and technology innovation, such as astronomical exploration,

weather forecasting, autonomous driving, and oil exploration. Atlas 900 highlights:

- Powerful computing: Combining thousands of Ascend 910 AI processors, Atlas 900 delivers

256–1024 PFLOPS at half precision (FP16), which equals the computing power of 500,000 PCs.

The SoC design integrates AI computing, general-purpose computing, and I/O functionality

to effectively improve training efficiency.

- High-speed cluster network: It supports three types of high-speed network

interfaces: Huawei Cache Coherence System (HCCS), PCIe 4.0, and 100G RoCE,

slashing the gradient synchronization latency by 10% to 70% for a leap in model

training efficiency. It leverages an innovative iLossless intelligent switching

algorithm to enable real-time learning and training of network-wide traffic,

achieving zero packet loss and end-to-end latency of microseconds.

- Ultimate heat dissipation: Atlas 900 uses a cabinet-level contained adiabatic

system, achieving a liquid cooling ratio over 95% and a system power usage

effectiveness (PUE) less than 1.1 (an ideal PUE is 1.0).

Up to now, based on the Ascend 910 and 310 AI processors, Huawei has launched

the Atlas 900 AI cluster, Atlas 800 AI server, Atlas 500 AI edge station, Atlas 300 AI

accelerator card, and Atlas 200 AI accelerator module. The holistic Atlas portfolio provides

powerful computing for training and inference in all scenarios across cloud-edge-device.

Looking ahead, Huawei will continue to step up investment and innovation in infrastructure

such as processors, operating systems, and databases for the Kunpeng computing industry,

and provide AI computing for Peng Cheng Cloud Brain, together bringing AI technology faster

to reality for a wider scope of application.

