V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhouzhou113
V2EX  ›  Ubuntu

cuda+ubuntu+nsight+动态并行报错

  •  
  •   zhouzhou113 · 2019-01-12 11:10:27 +08:00 · 2505 次点击
    这是一个创建于 2153 天前的主题,其中的信息可能已经有所发展或是发生改变。

    error: kernel launch from device or global functions requires separate compilation mode

    百度后发现大家的解决方案:在 windows+VS 中配置-rdc = true

    但我的编译环境是 ubuntu+nsight,所有的配置选项中找了一遍,没有找到可以配置 relocatable-device-code 选项的,查看 makefile 文件,默认设置是 -relocatable-device-code=false

    尝试把 false 更改为 true,但系统会自动更改回 true

    求助 nsight 中怎么配置-relocatable-device-code 选项为 true

    使用的环境是 cuda8.0+cuda toolkit8.0,nvidia gtx 1050 的卡,计算力 6.1 arch=compute_60,code=sm_60 满足动态并行的基本条件。

    4 条回复    2019-01-12 14:11:35 +08:00
    zhouzhou113
        1
    zhouzhou113  
    OP
       2019-01-12 11:29:54 +08:00
    ubuntu14.04 cuda8.0 自带的 nsight
    madeye
        2
    madeye  
       2019-01-12 12:44:03 +08:00 via Android   ❤️ 1
    直接用 Makefile 试试,但不建议用 DP,性能会差很多。

    如果有很多小 kernel,可以试试 CUDA 10 的 graph launch。
    pwrliang
        3
    pwrliang  
       2019-01-12 12:58:46 +08:00 via Android
    nsight 在 project 右键设置,可以开 separate compilation
    zhouzhou113
        4
    zhouzhou113  
    OP
       2019-01-12 14:11:35 +08:00
    @pwrliang 恩恩,编译通过了,谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1024 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:08 · PVG 05:08 · LAX 13:08 · JFK 16:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.