sami 发表于 2023-1-21 07:52:30

如何试用 Live Captions 测试版以增强 Apple 设备上的音频转文本功能


如何试用 Live Captions 测试版以增强 Apple 设备上的音频转文本功能

辅助功能的核心是针对特定残障人士改进界面,但它们通常可以改善所有用户的体验。目前正在某些设备和国家/地区进行 Beta 测试的新实时字幕功能就是一个很好的例子。Apple 旨在将你的设备产生的所有音频转换为准确转录的清晰文本,就像 Live Text 可以从位图图像中提取文本一样。

Apple 的新辅助功能可以帮助所有用户。

要启用该功能,您必须拥有安装了 iOS 16 的 iPhone 11 或更高版本、运行 iPadOS 16 的相对较新的 iPad(请参阅此列表)或安装了 macOS Ventura 的 Apple 芯片(M1 或 M2)Mac。对于 iPhone 和 iPad,Apple 表示只有当设备语言设置为英语(美国)或英语(加拿大)时,实时字幕才有效。macOS 的描述更广泛地说,测试版“并非在所有语言、国家或地区都可用”。

如果您可以使用实时字幕(或想检查是否可以),请转至设置(iOS/iPadOS)/系统设置(Ventura) >辅助功能。如果您看到实时字幕(测试版)项,则可以使用它。点击或单击实时字幕以启用。然后,您可以点击iOS/iPadOS 中的外观或使用 macOS 中的顶级菜单项来修改字幕的显示方式。您可以单独启用或禁用 FaceTime 中的实时字幕,以使字幕显示在该应用程序中。

实时字幕显示为一个覆盖层,显示其对系统产生的任何声音的英语音频的解释。实时音频波形与实时字幕“听到”的声音相匹配。在 iOS 和 iPadOS 中,您可以点击叠加层并访问其他控件:最小化、暂停、麦克风和全屏;在 macOS 中,暂停和麦克风按钮可用。如果您点击或单击麦克风按钮,您可以说话并让您所说的内容出现在屏幕上。如果您想向某人展示您所说内容的文本,这可能会很方便。


Live Captions 可以覆盖您系统上生成的任何音频。
Live Captions 中生成的文本是短暂的:您无法复制或粘贴它。它还可以抵抗移动屏幕捕获:叠加层显然是以 iOS 和 iPadOS 无法捕获的方式生成的。

Live Captions 展示了很多前景——在改进和扩展时需要密切关注。我用播客、YouTube 和 Instagram 音频测试了实时字幕。它不如我见过的一些基于人工智能的转录好,比如在视频会议中,但它做出了勇敢的努力,而且它比没有字幕要好。


macOS 版本的表现略有不同。
Apple 可以将 Live Captions 绑定到其内置的翻译功能中,你可以用它用你自己的语言说话,并用他们的语言向某人展示翻译版本,或者实时转录视频流、播客和其他内容使用您所说的语言以外的其他语言的音频。
页: [1]
查看完整版本: 如何试用 Live Captions 测试版以增强 Apple 设备上的音频转文本功能