Skip to content

miaomiaosoft/PandaOCR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PandaOCR - 多功能OCR图文识别+翻译+朗读+弹窗+公式+表格+图床+搜图+二维码

<VER:2.72>

2022-03-16 更新

专业版本:

  • 🥇目前全新重构的PandaOCR.Pro专业版已发布,它更快速稳定、接口更丰富、操作更简单,推荐您使用! 查看PandaOCR.Pro专业版
  • 针对当前普通版的说明:
  • 会继续维护普通版,保留所有接口但不再增加新功能,专业版的版本号之所以从5.x开始,正是考虑到普通版以后还会有更新所以保留了一段版本号。
  • 您可以继续像以往那样免费使用普通版,不用担心推出专业版后导致普通版停用,如果有更高需求可以尝试专业版。
  • 对于捐助的朋友我表示非常感谢,没有你们的支持PandaOCR坚持不了现在,感谢!

特别声明:

  • 本工具一直只在Github发布和更新,目前并没有所谓PandaOCR官网或熊猫OCR官网,从其他网站下载的PandaOCR请自行验证安全性!
  • 目前发现这个免费软件居然被有些可能生活困难的朋友拿到某宝上出售,导致买去用的人反而跑来找我当售后(这不厚道),这太难了,建议买的人找店主解决!

功能介绍:

  • 支持识别引擎:搜狗OCR/API+腾讯OCR/API+百度OCR/API+有道OCR/API+阿里OCR/API+京东OCR+华为OCR+网易OCR+讯飞OCR+金山OCR+灵云OCR+飞桨OCR+合合OCR+网校OCR+易道OCR+薪火OCR+必应OCR+SpaceOCR+YandexOCR

  • 支持公式识别:微软公式+百度公式API+腾讯公式API+Mathpix公式API+网校公式+阿里公式

  • 支持表格识别:有道表格+百度表格API+腾讯表格API+阿里表格/API

  • 支持翻译引擎:搜狗翻译/API+腾讯翻译/API+百度翻译/API+有道翻译/API+谷歌翻译+词霸翻译+必应翻译+沪江翻译+奇虎翻译+海词翻译+小牛翻译+彩云翻译+福昕翻译+欧米翻译+微软翻译+阿里翻译+云译翻译+欧路翻译+灵云翻译+Deepl翻译API+PaPaGo翻译

  • 支持朗读引擎:搜狗朗读x4+腾讯朗读x5+百度朗读x6+京东朗读x2+有道朗读x2+知声朗读x7+讯飞朗读+谷歌朗读+必应朗读

  • 支持快捷键和屏幕边角触发截图识别功能,方便快速

  • 支持截取识别固定区域,适合日语类游戏机翻或生肉字幕机翻

  • 支持右侧小弹窗预览文本信息,快速查看识别/翻译内容

  • 支持智能合并修正文本,让排版更合理,并提高翻译质量

  • 支持设置最多十条固定截图规则,每条规则都能有自己的快捷键

  • 支持监听图像和文本复制操作,快速识别图像文本或翻译复制文本

  • 支持简单的窗口汉化功能,帮助翻译纯英文类软件界面文字

  • 还有一些奇怪的没有列在程序界面上的功能,可以编辑程序目录下的CONFIG.INI配置文件试试


使用技巧:

  • 将鼠标移到各功能组件或按钮上会显示简单的悬停提示帮助你理解程序操作。

  • 配置文件内已添加各功能注释说明,如果想要实现某种功能但在程序界面上没找到相关设置,可以先翻一翻配置文件或许它已经在那里等着你(程序目录下CONFIG.ini即是配置文件)。

  • 如果你有两块屏幕,请勾选“高级截图方式”以解决无法截取第二块屏的问题。

  • 如果你是高分屏或修改了系统DPI缩放,可能出现截图不全或弹窗位置偏移的问题,此时你需要在此程序文件的属性中取消系统DPI设置。

  • 程序界面上存在的设置多数是可以实时生效的不需要频繁点击保存按钮,比如设置语言、更换引擎此类。

  • 有时手工更改了配置文件又不想重启软件可以试试右键点击界面左上角图标重载配置,不要点左键。

  • 从演示版引擎临时更改为API版引擎可以右键点击引擎选择组合框。

  • 鼠标党如果觉得按快捷键识别麻烦可以把鼠标移到屏幕左上角来触发识别,默认配置已启用,也可以编辑配置文件关闭或改为其他位置(配置项:边角触发截图)。

  • 在截图时按住CTRL键可以临时取消识别,只截图并复制至剪贴板。

  • 在截图时按住ALT键可以临时取消修正文本,当识别图像的文本中不包含任何标点符号时建议这样使用。

  • 在文本区输入文本后按CTRL+回车键会直接翻译,不需要再用鼠标点翻译按钮。

  • 在文本区输入文本后按ALT+回车键会直接朗读。

  • 将图片直接拖入至程序界面上会自动开始识别。

  • 在识别或是朗读进行中如果想中止任务可以双击界面右上方“线程”字样处,或按住空格键的同时点击托盘图标。

  • 如果觉得文本区域过小,可以双击文本区使用大窗口浏览或简单编辑。

  • 有些不太用的上的功能建议关闭以减少识别等待时间,比如朗读文本。

  • 在启用了监听复制功能时临时不想执行识别或翻译可以在复制的同时按住空格键。


使用教程:


API版接口申请(默认使用免费的演示版 | 演示版和API版区别):

搜狗:
腾讯:
百度:
有道:
阿里:
讯飞:
网校(学而思/好未来):
Deepl:
Mathpix:
SpaceOCR:

隐私安全:

程序:
  • 程序本身不包含任何恶意代码,如有杀软误报请自行加入白名单(曾提交火绒人工检测为安全)
  • 程序调用了一个51.la的统计,单纯用来统计使用人数,除此之外不会上传您的任何隐私数据
  • 因功能需要,请使用管理员权限运行,程序会调用键鼠钩子,如“划词复制功能”需要鼠标钩子,为避免某些游戏屏蔽热键导致无法截图而使用了键盘钩子
  • 程序的开发与发布均在ESET NOD32杀软保护的环境中完成,如果使用过程中,您系统中某种“安全”软件称「发现木马」,那么此种情形将考验您的判断力
引擎:
  • 本程序不带离线引擎,所调用的识别/翻译/朗读等全部为在线引擎
  • 理论上用户上传到各个引擎的数据都只是缓存数据,通常会在一定时间内清除
  • 但服务器毕竟为各引擎所在公司控制和所有,我无法保证上传数据的绝对安全
  • 所以如果您要处理的数据属于商业或机密数据,请换用其他自己可控的本地私有化产品
  • 如因此发生的任何损失,本人表示概不负责

特别说明:

  • 已知在高分辨率/高分屏下截图功能异常 [尝试解决方法]
  • 如需使用自己申请的ID和KEY,用文本编辑器打开程序目录下的CONFIG.ini文件,在[数据配置]项,将各版本后面数值设为1(0为演示版),并修改下面相应的ID和KEY
  • 如需反馈API版引擎存在的问题,请主动提供相应的ID和KEY给我测试

程序下载:


问题反馈:


程序截图:

默认界面

暗色界面

About

PandaOCR - 多功能OCR图文识别+翻译+朗读+弹窗+公式+表格+图床+搜图+二维码

Resources

Stars

Watchers

Forks

Packages

No packages published