V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Sixzeroo
V2EX  ›  程序员

有没有 Win 下好用的 OCR 工具推荐?

  •  
  •   Sixzeroo · 2018-02-08 22:27:35 +08:00 · 12408 次点击
    这是一个创建于 2485 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在看一些扫描版本的电子书,有时候想要摘录一些内容要用到 OCR,目前网上找到的是要不就是有数量限制要不就是排队时间巨长,前些天自己用百度的 OCR 写了一个小东西( http://server.liuin.cn:8080 ),但是还是要将截图保存然后选择图片,这样花的时间有点长。

    目前知道 macOS 上有一个比较好的工具: https://github.com/oott123/alfred-clipboard-ocr

    所以想请教一下各位有没有 Win 下类似的好的工具推荐,就是那种能直接从粘贴板复制提交然后获得结果的

    第 1 条附言  ·  2018-02-09 11:08:01 +08:00

    目前找到两个方法:

    谢谢大家!

    第 2 条附言  ·  2018-02-09 20:57:52 +08:00
    把之前写东西加了个粘贴上传的功能(粘贴截图即可获得结果),用的是百度的 OCR,大家需要的可以参考:

    https://github.com/Sixzeroo/WebOCR
    34 条回复    2019-08-31 22:57:02 +08:00
    laqow
        1
    laqow  
       2018-02-08 22:41:40 +08:00 via Android
    不介意的话 acrobat
    choury
        2
    choury  
       2018-02-08 22:42:12 +08:00
    OneNote 啊
    LosLord
        3
    LosLord  
       2018-02-08 22:45:12 +08:00 via Android
    Windows10 带 ocr 的 api 的,好像直接调用就行。
    官方还有个 demo 呢,可以直接用 vs 运行
    huclengyue
        4
    huclengyue  
       2018-02-08 23:01:24 +08:00 via Android
    感觉百度的还不错。
    huclengyue
        5
    huclengyue  
       2018-02-08 23:01:55 +08:00 via Android
    嗯,要自己调接口
    Sixzeroo
        6
    Sixzeroo  
    OP
       2018-02-08 23:11:40 +08:00
    @choury 刚才试了试,发现识别率还是没有百度的高
    Sixzeroo
        7
    Sixzeroo  
    OP
       2018-02-08 23:12:36 +08:00
    @LosLord 有相关的资料吗?
    Sixzeroo
        8
    Sixzeroo  
    OP
       2018-02-08 23:13:58 +08:00
    @huclengyue 百度识别率还行,我用的这几天中文基本上很少有错
    huiyadanli
        9
    huiyadanli  
       2018-02-08 23:15:37 +08:00
    ABBYY
    LosLord
        10
    LosLord  
       2018-02-08 23:41:16 +08:00 via Android
    @Sixzeroo 不知道你需求什么样的,win10 带的是 ocr api 就是 c#的 uwp 应用好像。
    https://github.com/Microsoft/Windows-universal-samples/tree/master/Samples/OCR
    applehater
        11
    applehater  
       2018-02-08 23:52:00 +08:00 via iPhone
    @Sixzeroo 看我发过的帖子就可以了。
    zhaoxiting1997
        12
    zhaoxiting1997  
       2018-02-08 23:54:59 +08:00   ❤️ 1
    abbyy finereader 绝对是最好的,就是比较大
    applehater
        13
    applehater  
       2018-02-08 23:56:38 +08:00 via iPhone
    @LosLord 只要🈶️运行时都可以调用的,我把他做成了命令行工具识别答题题目效果可以。
    @Sixzeroo 里面有 MS 官方文档说明和示例。
    /t/427237
    LosLord
        14
    LosLord  
       2018-02-09 00:00:55 +08:00 via Android
    @applehater 这个我当时也有需求要写,可是我不会 c#😂
    applehater
        15
    applehater  
       2018-02-09 00:03:14 +08:00 via iPhone
    @LosLord 我也不会,UWP 支持四种编程语言,C# C++ VB.NET Javascript😀但是我还是懒得写了。
    masir
        16
    masir  
       2018-02-09 00:12:50 +08:00 via Android   ❤️ 1
    Abbyy
    g00001
        17
    g00001  
       2018-02-09 01:29:16 +08:00   ❤️ 1
    可以用 aardio 写一个,
    不需要运行时,生成软件几百 KB,开发工具 5.6MB ,简单方便。

    几句代码可以解决问题:

    import console
    import win.clip;
    import gdip.bitmap;
    import baidu.client;

    //创建百度 OCR 客户端
    var http = baidu.client();
    http.setAuth("http://update.aau.cn/v10/test/test-baidu.aardio")

    //读取剪贴板图像
    var hbmp = win.clip.readBitmap();
    var bmp = gdip.bitmap(hbmp);

    //调用 OCR 识别接口
    var ocr = http.api("https://aip.baidubce.com/rest/2.0/ocr/v1/");
    var result = ocr.general_basic(
    image = bmp.saveToBuffer("*.jpg");
    )

    //输出结果
    console.dumpJson(result);
    console.pause(true);

    参考源码:
    http://bbs.aardio.com/forum.php?mod=viewthread&tid=22093

    调用 google 的 tesseract-ocr 也可以
    http://bbs.aardio.com/forum.php?mod=viewthread&tid=12601
    qianyi0129
        18
    qianyi0129  
       2018-02-09 08:21:56 +08:00   ❤️ 1
    abbyy
    newbieo0O
        19
    newbieo0O  
       2018-02-09 08:56:22 +08:00
    python 写个吧,调百度接口
    qsnow6
        20
    qsnow6  
       2018-02-09 09:48:28 +08:00
    也别调百度接口了,直接用 win 10 系统自带
    qsnow6
        21
    qsnow6  
       2018-02-09 10:03:25 +08:00
    jsnjfz
        22
    jsnjfz  
       2018-02-09 10:09:55 +08:00
    百度,阿里上的汉王云
    ss0xt
        23
    ss0xt  
       2018-02-09 11:13:51 +08:00
    可以试试 知网 CAJViewer
    nogoodren
        24
    nogoodren  
       2018-02-09 11:44:41 +08:00
    OneNote
    nicevar
        25
    nicevar  
       2018-02-09 12:04:37 +08:00
    最近做的一个项目在 win 下用的 tesseract
    lancn
        26
    lancn  
       2018-02-09 14:30:55 +08:00
    bfhh126
        27
    bfhh126  
       2018-02-09 14:51:17 +08:00   ❤️ 1
    Abbyy +1
    zhishidahao
        28
    zhishidahao  
       2018-02-09 16:27:43 +08:00 via iPhone   ❤️ 1
    abbyy finereader 绝对是最好的,就是比较贵
    Marilyn
        29
    Marilyn  
       2018-02-09 16:58:18 +08:00
    这个好像免费的极少,期待。。。。
    Izual_Yang
        30
    Izual_Yang  
       2018-02-09 17:04:52 +08:00
    CAJViewer
    或者 unicornviewer+MODI
    Izual_Yang
        31
    Izual_Yang  
       2018-02-09 17:09:43 +08:00

    识别率还是可以的
    Sixzeroo
        32
    Sixzeroo  
    OP
       2018-02-09 20:57:33 +08:00
    把之前写东西加了个粘贴上传的功能(粘贴截图即可获得结果),用的是百度的 OCR,大家需要的可以参考: https://github.com/Sixzeroo/WebOCR
    acupnocup
        33
    acupnocup  
       2018-03-21 13:25:54 +08:00
    @zhaoxiting1997 这个好贵啊 试用版有限制极多 在犹豫是否要购买。
    iutopia
        34
    iutopia  
       2019-08-31 22:57:02 +08:00
    不知道有没有类似 fooview 的那种功能的软件。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1685 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:49 · PVG 00:49 · LAX 08:49 · JFK 11:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.