-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[miyamoto] 読み進めメモ #8
Comments
マッピングはここでやっている。 https://github.com/aws/aws-ofi-nccl/blob/master/src/nccl_ofi_net.c#L1450
NCCL側はこらへん https://github.com/NVIDIA/nccl/blob/9db4b1d801624a00591b7aafd426d6dd23547443/ext-net/dummy/plugin.c おおよそ
に対応しそう? |
ringの作り方 Lines 67 to 101 in 0ceaec9
|
plug-in関係、結局 Lines 849 to 867 in 0ceaec9
Lines 61 to 106 in 0ceaec9
|
GPU Directのサポート Lines 249 to 282 in 0ceaec9
nccl/src/transport/net_socket.cc Lines 50 to 53 in 0ceaec9
Lines 218 to 231 in 0ceaec9
https://github.com/aws/aws-ofi-nccl/blob/master/src/nccl_ofi_net.c#L770
|
目的: EFA (Elastic Fabric Adapter) 実装の深堀り。
EFAのドライバはlibfabric内でプロバイダとして提供されている。
NCCL自体は、デフォルトではlibfabricを使用していないため、NCCLのplug-inとして、aws-ofi-nccl (https://github.com/aws/aws-ofi-nccl) が提供されている。
疑問:NCCLのplug-inとはなにか。どういう実装か
The text was updated successfully, but these errors were encountered: