Windows下安装cudarray的问题

发布于 2022-09-05 05:41:19 字数 2817 浏览 30 评论 0

报错显示找不到头文件
clipboard.png
Makefile

ifndef CUDA_PREFIX
  CUDA_PREFIX =**C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0**
endif
ifndef INSTALL_PREFIX
  INSTALL_PREFIX=C:/Users/Administrator/Anaconda3
endif


SRC_DIR = ./src

SRCS = $(SRC_DIR)/nnet/conv_bc01_matmul.cpp \
       $(SRC_DIR)/nnet/pool_b01.cpp \
       $(SRC_DIR)/nnet/cudnn.cpp

CUDA_SRCS = $(SRC_DIR)/array_ops.cu \
            $(SRC_DIR)/elementwise.cu \
            $(SRC_DIR)/reduction.cu \
            $(SRC_DIR)/blas.cu \
            $(SRC_DIR)/random.cu \
            $(SRC_DIR)/image/img2win.cu \
            $(SRC_DIR)/image/rescale.cu \
            $(SRC_DIR)/nnet/one_hot.cu


INCLUDE_DIRS = ./include
INCLUDE_DIRS += $(CUDA_PREFIX)/include

ifneq ($(wildcard $(CUDA_PREFIX)/lib64),)
  # Use lib64 if it exists
  LIB_DIRS += $(CUDA_PREFIX)/lib64
endif
LIB_DIRS += $(CUDA_PREFIX)/lib
LIBS += cudart cublas cufft curand

ifeq ($(CUDNN_ENABLED), 1)
  C_FLAGS += -DCUDNN_ENABLED
  LIBS += cudnn
endif

ifndef CUDA_ARCH
  # By default, libcudarray is built for a range of different CUDA
  # architectures. You can speed up compilation time by selecting only the
  # architecture for your GPU.
  CUDA_ARCH = -gencode arch=compute_20,code=sm_20 \
              -gencode arch=compute_20,code=compute_20 \
              -gencode arch=compute_30,code=sm_30 \
              -gencode arch=compute_30,code=compute_30 \
              -gencode arch=compute_35,code=sm_35 \
              -gencode arch=compute_35,code=compute_35
endif

export PATH := $(CUDA_PREFIX)/bin:$(PATH)

CXX = g++
NVCC = nvcc
BUILD_DIR = ./build
OBJS = $(SRCS:.cpp=.o) $(CUDA_SRCS:.cu=.o)
LIBCUDARRAY = libcudarray.so
LIBCUDARRAY_BUILD = $(BUILD_DIR)/$(LIBCUDARRAY)
LIBCUDARRAY_INSTALL = $(INSTALL_PREFIX)/lib/$(LIBCUDARRAY)

INCLUDES += $(foreach include_dir,$(INCLUDE_DIRS),-I$(include_dir))
C_FLAGS += -O3 -fPIC -Wall -Wfatal-errors -D_FORCE_INLINES
NVCC_FLAGS = $(CUDA_ARCH) -O3 --compiler-options '$(C_FLAGS)' \
             --ftz=true --prec-div=false -prec-sqrt=false --fmad=true
LDFLAGS += $(foreach lib_dir,$(LIB_DIRS),-L$(lib_dir)) \
           $(foreach lib,$(LIBS),-l$(lib))


$(LIBCUDARRAY_BUILD) : $(OBJS)
    mkdir -p $(BUILD_DIR)
    $(CXX) -shared $(C_FLAGS) -o $@ $^ $(LDFLAGS)

%.o : %.cpp
    $(CXX) $(C_FLAGS) $(INCLUDES) -c -o $@ $<

%.o : %.cu
    $(NVCC) $(NVCC_FLAGS) $(INCLUDES) -c -o $@ $<

all: $(LIBCUDARRAY_BUILD)

$(LIBCUDARRAY_INSTALL) : $(LIBCUDARRAY_BUILD)
    cp $(LIBCUDARRAY_BUILD) $(LIBCUDARRAY_INSTALL)

install: $(INSTALL_PREFIX)/lib/$(LIBCUDARRAY)

uninstall:
    rm $(LIBCUDARRAY_INSTALL)

.PHONY: clean
clean:
    rm -f $(OBJS) $(LIBCUDARRAY_BUILD)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

雨落□心尘 2022-09-12 05:41:20

之前我做过很多编译开发的工作,跟你分享一下我的经验。找不到头文件的话,你要先确定本机环境是否正确,相对应的.h头文件是否存在。如果存在的话,make -I/xxxx'x'x 用-I来指定头文件所在的文件夹目录。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文