export TORCH_CUDA_ARCH_LIST=9.0 # 指定架构,就不会编译其他架构,节省时间 export MAX_JOBS=32 # 多线程并发编译 pip install -v -U . #