V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
layumi
V2EX  ›  分享发现

NVIDIA 与悉尼科技大学提出:生成图像加入训练,助力行人重识别

  •  2
     
  •   layumi · 2019-05-09 09:42:16 +08:00 · 2460 次点击
    这是一个创建于 2030 天前的主题,其中的信息可能已经有所发展或是发生改变。

    小弟的一个工作,欢迎点视频 Demo 来看。 代码肯定会开源,但是需要和公司商量一下,可能 2-3 个月。 [ CVPR19 Oral ] Joint Discriminative and Generative Learning for Person Re-identification, Zhedong Zheng, Xiaodong Yang, Zhiding Yu, Liang Zheng, Yi Yang, Jan Kautz

    Paper: https://arxiv.org/abs/1904.07223

    <iframe allowfullscreen="true" border="0" frameborder="no" framespacing="0" scrolling="no" src="//player.bilibili.com/player.html?aid=51439240&cid=90036752&page=1"> </iframe>

    B 站视频备份: https://www.bilibili.com/video/av51439240/ 腾讯视频备份: https://v.qq.com/x/page/t0867x53ady.html

    12 条回复    2019-07-01 13:34:58 +08:00
    rayhy
        1
    rayhy  
       2019-05-09 09:58:29 +08:00   ❤️ 1
    我也是做行人图片合成的,前两天看到您的论文震惊了好久...

    我目前任务是给人换姿势,PG2 那系列的。不知道楼主觉得您做的东西可能往这个方向发展吗?比如继续从结构特征分离出姿势来?或者训练时模仿你的做法,也交换 ID 生成同 Pose 图片?

    另外 CPVR Oral 级别的论文应该不怎么需要推广就一堆人 follow 的吧。
    dinghow
        2
    dinghow  
       2019-05-09 10:07:39 +08:00   ❤️ 1
    惊,CVPR Oral 也需要推广了(lol ),前排支持一下
    tycallen
        3
    tycallen  
       2019-05-09 10:33:20 +08:00   ❤️ 1
    关注
    xiangchen2011
        4
    xiangchen2011  
       2019-05-09 11:22:55 +08:00   ❤️ 1
    厉害了,膜拜下
    SeaRecluse
        5
    SeaRecluse  
       2019-05-09 11:33:26 +08:00
    当初学习入门 NLP 的时候知道的大佬,现在专心 CV 了吗
    Showfom
        6
    Showfom  
       2019-05-09 12:49:07 +08:00 via iPhone
    额 除了一个老外都是中国人啊 牛逼
    sunxia
        7
    sunxia  
       2019-05-10 11:00:30 +08:00   ❤️ 1
    支持支持支持
    layumi
        8
    layumi  
    OP
       2019-05-10 13:36:34 +08:00
    @SeaRecluse 之前想尝试 nlp。。。其实我也就一篇 nlp 相关的文章,,
    layumi
        9
    layumi  
    OP
       2019-05-10 13:36:58 +08:00
    @Showfom 那个是 nvidia research 的大老板。。德国人。。
    layumi
        10
    layumi  
    OP
       2019-05-10 13:40:59 +08:00
    @rayhy 我觉得 human parsing 可能比纯 structure 更靠谱。其实我这里的边缘处理还是有颜色不连续。 另外你仔细看原始的 jpg 训练数据,也有边缘的问题。如果从 jpg 转到 png 会好一点(扯得有点远了)。所以用 dense 的 parsing 可能会好。 题外话,我今年签证被卡了,也不知道能不能去成。。当时 cyclegan 也是 Efros 老板站台宣传的,感觉宣传还是有必要的。
    dalieba
        11
    dalieba  
       2019-05-10 18:43:03 +08:00 via Android
    那就看将来的大客户是谁了
    layumi
        12
    layumi  
    OP
       2019-07-01 13:34:58 +08:00
    代码开源了。Github 地址是 https://github.com/NVlabs/DG-Net
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1045 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 21:44 · PVG 05:44 · LAX 13:44 · JFK 16:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.