V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tikazyq
V2EX  ›  程序员

爬虫管理平台 Crawlab v0.4.8 发布(环境安装 + Git 高级应用)

  •  1
     
  •   tikazyq ·
    tikazyq · 2020-03-11 18:34:45 +08:00 · 1131 次点击
    这是一个创建于 1735 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前言

    本次更新包括几个部分:

    1. 支持界面安装(预装) Python 以外的多种语言环境
    2. 更好的安装界面,可以看到多个节点的安装情况
    3. 优化 RPC,基于 Redis 延迟队列作为 RPC
    4. 更多功能配置

    更新日志

    功能 / 优化

    • 支持更多编程语言安装. 现在用户可以安装或预装更多的编程语言,包括 Java、.Net Core、PHP.
    • 安装 UI 优化. 用户能够更好的查看和管理节点列表页的安装.
    • 更多 Git 支持. 允许用户查看 Git Commits 记录,并 Checkout 到相应 Commit.
    • 支持用 Hostname 作为节点注册类型. 用户可以将 hostname 作为节点的唯一识别号.
    • RPC 支持. 加入 RPC 支持来更好的管理节点通信.
    • 是否在主节点运行开关. 用户可以决定是否在主节点运行,如果为否,则所有任务将在工作节点上运行.
    • 默认禁用教程.
    • 加入相关文档侧边栏.
    • 加载页面优化.

    Bug 修复

    • 重复节点. #391
    • 重复上传爬虫. #603
    • 节点第三方模块安装失败导致 节点安装第三方部分无法使用. #609
    • 离线节点也会创建任务. #622

    产品规划

    • 结果展示
      • 支持其他数据库
    • 可配置爬虫
      • 可配置爬虫支持 Splash
      • 可配置爬虫支持 CrawlSpider
      • 可配置爬虫支持正则表达式字段
      • 可配置爬虫支持转化为自定义爬虫
    • 任务
      • 任务重试机制
    • 定时任务
      • 日历展示
    • 全局
      • 支持版本更新日志展示
    • 服务器
      • 支持终端操作 Docker 镜像
    • SDK
      • 更多命令支持
    • 插件系统

    参考

    社区

    如果您觉得 Crawlab 对您的日常开发或公司有帮助,请加作者微信 tikazyq1 并注明 "Crawlab",作者会将你拉入群。欢迎在 Github 上进行 star,以及,如果遇到任何问题,请随时在 Github 上提 issue。另外,欢迎您对 Crawlab 做开发贡献。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4934 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:03 · PVG 16:03 · LAX 00:03 · JFK 03:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.