音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 28352|回复: 0
收起左侧

[转载] macOS 翻译工具 Bob 大更新:支持更多翻译服务,增强 OCR 功能

[复制链接]

342

积分

3

听众

162

音贝

音频应用

Rank: 1

积分
342
发表于 2020-10-11 07:02:34 | 显示全部楼层 |阅读模式
& k. l1 u3 n. P5 a
macOS 翻译工具 Bob 大更新:支持更多翻译服务,增强 OCR 功能 - Y3 N1 j' t& f, B! k) B
, W' j2 W2 f" X: ~
少数派此前推荐过 Bob 这款 macOS 上的翻译小工具,我自己也一直用到现在。Bob 还真算是个性鲜明,不仅名字完全看不出其功能属性,连 logo 也是如此另类,有人觉得很 Q 很萌,也有人会觉得很出戏。
) L) @# x3 a: d7 [& V" v4 q1 R) x" T
在使用 Bob 测试版本半个多月之后,开发者在国庆假期中也正式释放了 。& j, D* q  k$ _9 M% p& L

( x' }& l; h  k& E: r2 X aad94977a4f0497591e35b89cbc9d4de.jpg ( {' ~- O) Z) y4 ~
  n$ |6 h; P$ _/ l4 M
关于 LOGO 的问题
4 z) @2 s! |, c( Y) U8 M% i" C
; b' z9 t3 W" b* z3 Q; G! `7 F之前有一些用户向开发者反馈希望能更换 Bob 的图标,新的版本(0.5.1)中开发者 Ripper 依然没有更换 logo,还是那个大头娃娃,可能他的名字就叫 Bob。
( d8 D# @6 ^5 V3 B8 g6 h& W
/ Q* N( _& o0 ?
" m: y3 S$ ^5 v) V 2c6b907216f141f48a5526767a3e45e7.jpg
+ p% p% ~! ~6 }不过隐约中我感觉 Ripper 已经在为新的 logo 做准备了,菜单栏展示的图标已经可以更改,预置的三个图标除了「大头娃娃」之外,其它两个都比较正常了,而且还支持自定义。: ~# B/ g; j. F/ s7 ^
% J+ Z9 T0 k. s6 {
唯一砍掉了的功能,就是菜单栏图标不再支持隐藏了……) |3 i- S' ^/ v# b! A0 U
8 T2 G$ Z0 A, o! c* g
支持更多翻译 API,需申请个人密钥7 \) @, o: P- B, \3 z

! q1 m3 Y: Z2 F0 q2 f. y4 l2 @; k好了,言归正传。新版本还是做了比较多的改动,除了刚提到的菜单栏图标等细节问题上,最核心的还是丰富了翻译功能,接入了更多的翻译 API 支持,同时还支持多家 OCR 识别和语音合成。0 D( H+ e" B$ O* Z
a4b29f15dc604ab686fed6ab8ba3cc94.jpg ( Z0 I1 O# B; `$ Y: L

+ X3 n6 T+ s' W2 H5 b/ m/ W. [0 N8 p3 C
这里还是需要提醒一下,直接从现在的 0.4.0 版本切换到新的版本,可能会有些不大习惯。Bob 0.5.1 删除了原有的翻译功能,更改为自定义添加翻译 API,总共支持多达六种主流的翻译服务,默认只保留百度免费翻译,你可以阅读 Bob 新版本版说明文档 了解详细信息。
$ w$ e8 u  }& G& o2 N/ @' U! x9 l
建议在更新之前先看下 Ripper 给出的介绍文档,再决定是否要升级。目前还无法确定,新版本推出之后旧版本是否可以一直使用下去。( p% k8 E- E! e9 Y! j
da9bc2baf06a41aea7d9277cca214bbd.jpg
. k# r; F( c9 R5 j. Q  G/ E. e% R1 }3 U/ O7 ^( G
- k! h4 J$ w% w/ b; p$ ?  p
虽然免费的百度翻译可用性还不错,但我还是建议添加多几种翻译 API,日常使用多作比较,能够达到更好的翻译理解效果。Bob已经支持多达六种翻译服务,除了有道翻译和搜狗翻译没有免费额度之外,其它都有最低 50 万字符/月的翻译额度,对于个人使用来说绰绰有余。0 F$ s; \6 T& p0 j. C+ V) `

$ R7 {+ [# c# W( J" J& r服务免费额度超出免费额度并发请求数申请教程百度翻译完全免费,无限使用 👍 1次/秒 有道翻译无48元/100万字符无相关说明 腾讯翻译君每月500万字符 👍58元/100万字符5次/秒 搜狗翻译无40元/100万字符50次/秒 彩云小译每月100万字符 👍20元/100万字符无相关说明 谷歌翻译每月50万字符20美元/100万字符无相关说明
+ z+ r! L( L9 E% f! K. \
/ v/ n0 G' d' O, }" e6 [我曾使用多家翻译服务,在部分场景下腾讯翻译君个人觉得翻译更精准,由此我曾向 Ripper 建议添加支持,竟然在新版本以这种方式实现了。申请各家翻译 API 密钥也并不麻烦,添加一次便可永久保留使用。1 \% `4 J6 I3 `3 q/ [$ }: I1 z( [, K
9e30820abe50424a9cfad476a62b76aa.jpg
) S8 u4 r/ }, R: v8 M6 W/ W( L' u
& d) |4 l4 V0 j; p% U; M
, A& z( ~$ S) v% i以我自己的使用,除了保留原有的百度翻译之外,还自行添加了腾讯翻译君、彩云小译、谷歌翻译这三种个人觉得不错的服务。其中唯独申请谷歌翻译 API 密钥比较麻烦,一个是因为在外网,另一个是必须绑定支持外币支付的信用卡。好在 Bob 0.5.1 支持添加谷歌翻译插件,来补充谷歌翻译功能,并且和 0.4.0 版本一样,支持选择国内和国际两种接口。
, [  @, `9 ~9 Y; s1 j/ \2 l: ^. f2 B0 v4 O; M- j, E
5 `4 H& D4 M2 Q- \
655fe733bdb84e2db4b4b80d5a742023.jpg 1 H1 ^, S9 D+ V5 ~6 h* V
a14301539e664c3f862c503f5f848be7.jpg / O6 |: j, z' q; |0 s: V$ E, D# h$ p
7 c. ]# i. S/ f" q  K# ~; p
从划词到翻译,快捷键操作下,整个过程还是那么行云流水。不同翻译服务的结果并列展开,更加直观,不需要再像之前一样只能单一选择。不过这带来的弊端就是,如果翻译的对象比较长,那么全部展开的话整个窗口就会比较长,过于占用空间。
  R; n1 e; E* |4 e
" l0 y3 d6 R: A2 L$ e/ lRipper 想必也是考虑到了这一点,因此你可以在设置中对窗口宽度高度进行调节限制,能够适应每个人的使用需求。
4 _* N: o- \* y1 `+ h3 E# E! Y" h' f) f. h% z5 Q
所有的窗口都支持折叠/展开,默认是全部展开的,内容复制和朗读和之前版本一样得到了保留。这一点会在后面的 OCR 和语音合成功能再提及。
" @/ E& u& h1 k* H1 _9 v6 V1 m' j
此外,如果对于翻译服务有一定的优先级排序,可以在设置中拖动调整翻译服务的顺序,这个顺序即对应的是翻译结果窗口的排序。
* b& h, [* Z: e$ R# e& C  h  X
, k9 M; y" h8 X3 z4 S" A% I截图翻译:OCR 文字识别利器
7 K+ }6 V9 `; y; N& K8 T7 e7 o: I" T" [5 p$ G* L
上一次 介绍 Bob 的时候我就强烈推荐过,由于 Bob 支持截图翻译,也因此能够作为不错的 OCR 文字识别工具使用。在新版本中,Bob 也将文字识别功能单独拿出来进行了扩展,同样支持添加多种 OCR 识别服务。
5 H6 |. d8 x4 [! q5 C- L# X2 A* v
: U. R) }% c4 a4 l$ [, x1 U7 m  N$ ^$ v
5 h# v& I. q+ s; f
Bob 默认预置一种百度智能云通用 OCR 识别服务,这是截图翻译所必须的。使用起来精准度也非常高,如果没有特殊需求其实也不用再添加其它的 OCR 服务。4 `8 G2 ^( G9 f2 F' x

& |8 V: F  o" L. n; H2 l7 a和翻译 API 一样,部分 OCR 服务都是有一定免费额度的,默认的百度智能云通用 OCR 免费额度高达 50000 次/天。如果 Bob 用户量大起来,可能会出现服务异常,建议大家可以申请私人 API 添加,包括腾讯云的几种 OCR 识别,个人使用的话免费额度也是绰绰有余。
. I8 L3 {4 T% O3 Y
! A0 R8 r) ?9 Q+ \. f5 v( n" Q) \服务免费额度超出免费额度并发请求数申请教程百度智能云通用OCR每天50000次 👍0.0050元/次2次/秒 腾讯云通用OCR每月1000次 👍0.15元/次无相关说明 腾讯云图片翻译每月10000次 👍0.045元/次1次/秒 腾讯优图通用OCR每天1000次 👍禁止使用10次/秒 有道智云通用OCR无0.01元/次无相关说明 搜狗深智OCR无0.006元/次无相关说明
+ _7 H8 e3 L( J# P) K
% W% V  m% J  L' j$ a不过假如你已经添加过一些翻译的 API 密钥的话,也可以同时复制到 OCR 识别功能中。以腾讯云为例,你可以同时为一个用户授权多个权限,这样同一份密钥可以同时具备翻译、OCR 以及语音合成多个功能。8 W/ Q" a0 y2 R7 l

  r$ ~" _0 t7 ~# q出于安全考虑,建议每个人保管好自己的密钥,防止泄露后被滥用导致扣费。
' U/ T/ q, B3 w% q9 N: H5 }% I7 R/ D  Y; t
从 OCR 识别的准确度上来说,百度、腾讯这些大厂都还是比较厉害的,毕竟目前而言文字识别这种需要大规模数据来机器学习训练的已经不是什么高深技术了。实测中英混合识别率也比较高,但一些特殊符号会出现错误。8 F/ j0 }8 }3 Y- ^. t. v: l1 i
c41ac9a4e3974a41a10da5151a85ce0f.jpg   Q" w& ]- Y& }0 ]9 V/ l9 {" w* |# t
8 C+ U6 u+ G9 V! |
+ b2 {9 t7 q4 V0 g
不过也存在一些比较糟糕的情况,如果截图区域存在大量代码类,可能会被识别为其它语种,导致 OCR 识别结果几乎完全错乱,我曾咨询过开发者 Ripper,他表示目前语种识别还存在一些 bug,可能与这个有关。
2 u% u$ p, f# U" l0 r
$ d  ?  k9 j# n( T) b e5522cf90538446886ead912b7b298b7.jpg
+ g& O4 u& F$ p6 b
0 F7 z: d) M/ j: H, _语音合成似乎不是我想的那样
( U. Q& v2 }; [
: T" E$ a* n. `9 y6 d* ^# ^最初看到 Bob 新版本中将语音合成也独立出来了,我天真地以为可以将文本识别成语音导出音频文件,原来只是用于朗读功能。
& x, |% n9 d9 d 1b805268c02447cb9e76fdac46c69341.jpg 6 c% C& q8 ^* @7 z8 E6 {
/ F. I6 C" m8 }! j2 B/ T! i

  N- r" V9 M/ ]8 H6 ?+ ], q划词/截图翻译的文本和翻译结果都支持朗读,显然这功能更适合用于单词翻译中,比较方便听取单词标准读音。
5 P, d; o* `/ ?0 T6 h/ r0 e( D
5 Q( s+ Q! w# ~/ y7 G 7a8b3fe883c647efb2b64c8efc0139c3.jpg % {: \# K, b' [; G. P+ Z

3 ]& ~5 Z  Q. W; O语音合成功能预置 Apple 语音合成,使用系统自带的语音合成器,可以离线使用。声音效果大概就是经常在某音视频听到的那种吧。第三方也只能添加腾讯云语音合成,因此我建议大家可以申请一个腾讯云的 API 密钥,这样可以同时授权使用翻译、OCR 识别和语音合成了。% m/ n2 {( H5 q' i# b" I

! Z1 x4 ?5 g- T0 G腾讯云语音合成每月免费额度有 100 万字符,应当是够用的。作为本土服务,腾讯云的语音合成对中文显然更加友好,不会像 Apple 语音合成的中文机器人既视感。
1 h/ {1 n, a( N& h* Q4 k
+ a; p+ W% P( X3 `$ x3 h  S服务免费额度超出免费额度并发请求数申请教程腾讯云语音合成每月100万字符 👍0.2元/万字符无相关说明 点此跳转 插件及拓展功能
4 R% p5 W: b# ~7 M1 _0 T: y0 Y7 J& |* z/ b' s
前面也提及到谷歌翻译的插件,这是 Bob 在新版本中提供的拓展需求,可以让用户自定义 API,同时在 Bob 中可以直接检查插件更新版本,但需要插件开发者去适配。目前还只看到一个公开的插件,就是谷歌翻译,如果未来有更多第三方开发者共享自己的插件,或许能带来更多便利和惊喜。
; B1 p$ V8 T# H- ?+ M3 N, S7 t) n# [5 @9 ]" y: K# u) ^
0edec9bcae5a48d89ba87b67636c59c7.jpg 5 W: E. t5 X$ Q, l& j& j4 _
$ v+ H/ O& Q3 u* Q' j# s& y
在额外调用方式上,此前的版本就已经加入了对 PopClip 的支持,新版本添加了 Apple 调用方式。
0 m- |6 s+ o3 K2 L# p% q2 C d6932a2ac71e4d5ab23e20fa0c3261fd.jpg
5 x5 p' t" Q7 q9 {, f* d
( j+ c, E4 c5 J& O
$ B% t% I5 r* O& S& u9 ^, WBob 的未来:OCR 文字识别可独立使用: B. W9 L1 r& F; z  ?% Y+ M
: m- j" ?7 w3 o( u2 I8 S. R
如果刚升级到新版本,不少 Bob 老用户可能会有点不大容易接受,最核心的原因是多数服务都需要自己配置 API 密钥了。但这个问题其实是相对的,各家翻译、文字识别、语音合成提供的免费额度都是有数量限制或者并发次数限制,当 Bob 用户量越大出现不稳定的几率会增大,而同样的免费额度对于个人使用却是绰绰有余,手动配置好可以持续使用,稳定性上也能够有保障。
( m* M. Y8 f$ G; L/ Z+ V+ y$ q* S2 n! {7 ?9 ?. {7 T
鉴于此,我也向开发者 Ripper 提议后续加入配置信息导出备份的功能,如遇到意外重装,能够快速恢复原有的配置。
  E( q4 {5 m. z3 N' o9 e
( J$ s$ ^! \3 Z1 p整体来说,新版本的 Bob 保持了原有的使用习惯,增加了更多服务 API 支持,在提升翻译功能体验的同时,也将 OCR 文字识别和语音合成单独拿出来,Ripper 透露后续会将 OCR 识别功能独立,具有独立使用的快捷键,这样 Bob 不再是单纯的翻译工具了。8 H+ ~/ t6 }- Q6 F8 J
bddae751112243c1911294bb8513ae30.jpg
+ B; |3 U+ h6 u你可以在 下载 Bob。- c$ R1 k! a3 j* @* f7 z5 `0 z
& I  `* I4 Z0 f6 V' q9 D
> 下载少数派 、关注 ,发现更多实用 App 📱
+ O$ n) h1 M: ~+ q& p
/ i4 e' q* g) z* U> 实用、好用的 ,少数派为你呈现 🚀
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-6-10 16:53 , Processed in 0.031544 second(s), 8 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表