V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
leedstyh
V2EX  ›  问与答

有对 casperjs 熟悉的吗,请教个问题(或者对页面抓取/爬虫比较熟悉的)

  •  
  •   leedstyh · 2014-10-16 21:58:08 +08:00 · 2827 次点击
    这是一个创建于 3701 天前的主题,其中的信息可能已经有所发展或是发生改变。

    这个页面:https://www.briefing.com/login/PlatinumLogin.aspx

    我用casperjs获取的时候,得不到正确的页面,请问是他是通过什么判断是程序来访问的。我也设置了UA,之前一直都可以获取的,就今天不行了!

    3 条回复    2014-10-18 07:57:29 +08:00
    xiaozi
        1
    xiaozi  
       2014-10-17 00:26:55 +08:00
    https的问题,你会发现实际截图的页面地址变成了about:blank,你截图github的时候也会这样
    leedstyh
        2
    leedstyh  
    OP
       2014-10-17 01:23:42 +08:00   ❤️ 1
    @xiaozi 但是,我写的脚本之前一直可以正常工作的,就今天突然就不好使了

    返回的是`<html><head></head><body></body></html>`
    xiaozi
        3
    xiaozi  
       2014-10-18 07:57:29 +08:00
    @leedstyh 是这样的,你可以升级一下openssl库,我本来也这样,现在好了

    http://tool.lu/site/
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3528 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:05 · PVG 19:05 · LAX 03:05 · JFK 06:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.