文本转语音市场中帮助克服语言障碍的 5 大公司和软件

*发表于 2022-11-3 13:16:08* · 发表于 2022-11-3 13:16:08

文本转语音已成为阅读困难学生中最受欢迎的辅助技术之一。文本到语音 (TTS) 系统通过利用计算机系统将普通语言文本转换为语音。合成语音是通过将存储在存储平台中的预先录制的语音片段链接在一起来创建的。文本转语音系统通常由两个组件组成——前端和后端。前端将原始文本转换为数字和缩写等符号——这称为文本规范化或标记化。后端，技术上称为合成器 - 将数字等符号转换为语音。

第一个基于计算机的语音合成系统是在 1950 年代后期开发的。从那时起，对机械语音合成器和电子语音合成器的研究一直在继续。可理解的文本转语音程序和平台使有阅读障碍和视力障碍的人能够聆听家用电脑上写的文字。文字转语音功能提供了一种将屏幕上的文字转换为语音的无缝且简单的方法——无论其最终目的是什么，例如娱乐、可访问性，或者在某些情况下两者兼而有之。TTS 可以朗读的基于文本的通信示例包括电子邮件、新闻、Web、博客、即时消息和短消息服务 (SMS) 等。

当前 TTS 技术的进步导致了听起来合理的语音的发展，这些语音已经开始听起来很人性化。随着对文本到语音功能的需求和使用的增加，语音质量、名称和实体的发音、表达表达以及机器翻译和语音到文本转换的无缝集成都得到了显着改善。预计 2028 年全球文本转语音市场规模将达到 70.6 亿美元，预测期内的收入复合年增长率为 14.7%。

语音识别和语音生产领域自 1990 年代初获得突出地位以来取得了巨大的进步，许多先进的技术和产品在全球范围内都可以买到。文本到语音系统在教育领域也变得越来越重要，因为它们可以帮助儿童和年轻学生有效地学习、记忆和理解单词和整体文本。在 COVID-19 大流行期间，文本转语音工具已越来越多地在全球医疗领域得到采用和部署，以促进有学习和身体残疾、识字困难和语言障碍的人们对健康相关信息和服务的理解。市场上的顶级公司正专注于开发先进的技术，这些技术甚至可以从图像和快照中实现文本到语音的转换。

文本转语音市场收入排名前 5 的公司

亚马逊 – 收入 [3860.6 亿美元]
美国电子商务巨头 Amazon.com, Inc. 提供涵盖云计算、人工智能、数字流媒体和在线市场的广泛服务。近年来，该公司已成为全球最有价值的品牌，也是收入最高的互联网公司。亚马逊已经在成熟的行业掀起了一股颠覆浪潮，并已成为最大的人工智能辅助提供商、电子商务渠道以及直播和云计算平台。亚马逊提供 Amazon Polly——这是一项基于云的服务，可将文本转换为类人语音，使用户能够创建可以说话的应用程序。Polly 的文本转语音 (TTS) 服务利用先进的深度学习技术来合成类人语音。它支持广泛的语言，这使得构建可以在不同国家/地区启动的支持语音的应用程序变得更加容易。2019 年，Polly 推出了神经文本转语音 (NTTS) 语音，通过机器学习 (ML) 方法提供改进的语音质量。组织还可以使用 Amazon Polly Brand Voice 来创建自定义 NTTS 语音，供组织使用。

2021 年 5 月，《华盛顿邮报》宣布已合并 Amazon Polly，让用户和读者能够在各种平台上收听报纸上发布的科技新闻。2021 年 8 月，亚马逊将新西兰英语语音添加到 Amazon Polly NTTS 服务产品中。

微软公司 – 收入 [1430 亿美元]
Microsoft Corporation总部位于美国华盛顿，是一家跨国科技公司，以其 Windows 系列操作系统、Microsoft Office Suite 和 Web 浏览器而闻名。2020年微软排名第21就收入而言，在美国最大公司的财富 500 强排名中。Microsoft Azure 提供文本转语音服务，允许用户构建可以自然说话的应用程序和服务，可以从 250 多种语音和 70 种语言和方言中进行选择。自然的文本转语音还可以匹配人类声音的模式和语调，并且文本转语音功能可以部署在云端、本地或边缘。Microsoft 的文本转语音是语音合成，支持基于 Microsoft Speech API 或 Microsoft Speech Server 平台构建的应用程序。Microsoft Eva 是一种隐藏的文本转语音语音，已集成在 Windows 10 中，并且这些语音已升级为听起来比以前的版本更自然。

2021 年 2 月，微软宣布限制访问其自定义神经语音，这是该公司的神经文本到语音人工智能，可帮助用户创建自定义合成语音。自定义神经语音是 Azure 认知服务中语音的 TTS 功能，已帮助 AT&T、Progressive、Duolingo 和 Swisscom 等知名客户为其客户群开发品牌语音解决方案。

谷歌有限责任公司——收入 [1816.9 亿美元]
搜索引擎巨头Google LLC是领先的互联网相关服务提供商之一，也是美国 IT 行业的五巨头之一。谷歌还提供了在云上运行的文本到语音功能。Google Cloud Text-to-Speech API 使开发人员能够包含听起来自然的合成人类语音。Text-to-Speech API 将文本或语音合成标记语言 (SSML) 转换为可在应用程序中播放的音频数据。

IBM 公司 – 收入 [778.7 亿美元]
International Business Machines (IBM) Corporation是一家总部位于纽约的技术公司，提供强大的云平台和广泛的认知解决方案组合。IBM Watson Text-to-Speech 是一种基于云的 API 服务，它使用户和开发人员能够将书面文本转换为嵌入在 Watson Assistant 中的各种语言和声音的自然声音音频文件。文本转语音功能利用了 IBM Watson 的高级神经语音合成技术。Watson Text-to-Speech 提供准确率高达 95% 的实时语音合成。开发人员可以通过语音合成标记语言 (SSML) 轻松调整发音、音调、音量、速度和其他功能。可以通过选择特定的说话风格来控制语气，例如 GoodNews、Uncertainty 和 Apology。

Nuance Communications, Inc. – 收入 [19.4 亿美元]
细微差别通信是一家总部位于美国的计算机软件技术公司，提供语音识别和人工智能软件。该公司是促进日常工作和生活的对话式人工智能解决方案的先驱和领导者。Apple 著名的语音助手 Siri 的语音识别引擎由 Nuance Communications 提供，该引擎于 2010 年作为 iOS 应用程序发布。后来，Apple 于 2011 年在 iPhone 4S 中正式推出了 Siri，并从那时起成为广泛应用中不可或缺的一部分。苹果产品系列。Nuances 的文本转语音 (TTS) 技术建立在神经网络技术之上，使其能够提供类似人类的、引人入胜的个性化用户体验。Nuance Vocalizer 使用经过对话、用例和语言训练的栩栩如生的声音。

2021 年 4 月，微软以 190 亿美元收购了 Nuance Communications，因为这家科技巨头希望在各个垂直行业的新兴语音技术市场扩大其足迹。

2021 年 5 大文本转语音软件

随着有声读物的日益普及和对多任务处理的需求不断增长，文本转语音软件越来越受欢迎。语音命令已成为日常生活不可或缺的一部分，Alexa、Siri 和 Google Assistant 等助手也提供语音到文本的功能。文字转语音软件在商业用途中也发挥着重要作用，因为人们正在利用它来提高生产力，同时处理不同的任务。最好的文本转语音应用程序和软件使用户在处理其他杂务或任务时更轻松、更方便地大声朗读文档和电子书，而不会失去注意力。

穆尔夫
Murf AI开发的 Murf 文本转语音平台是提供强大功能以创建视频、电子学习和演示文稿的画外音的最佳工具之一。Murf 是一个基于文本的画外音制作器，可以将脚本或预先录制的声音转录成超逼真的 AI 声音。Murf 提供 19 种语言的 100 多种逼真的声音，并且可以使用语法助手轻松检查脚本是否有错误，添加免费背景乐谱，并相应地修剪音乐和视频等。它还能够有效地将画外音的时间与视觉效果同步，以避免滞后。

自然阅读器
Natural Reader是一款功能强大的文本转语音工具，提供了卓越的功能，例如内置光学字符识别 (OCR)、浏览器和阅读障碍友好字体。NautralReader 是一款可下载的文本转语音软件，可用于个人目的，并配备自然的声音，可以轻松阅读任何文本，例如电子邮件、网页、PDF 文件和 Microsoft Word 文件。用户可以从 Google Drive、OneDrive 或 Dropbox 等云存储上传文档。该工具支持 9 种语言和超过 56 种自然声音。NaturalReader 文字转语音工具有三种不同的格式——在线、商业和软件。

Linguatec 语音阅读器
Linguatec Voice Reader软件可以轻松地将文本（例如 Word 文件、电子邮件、ePub 和 PDF）转换为音频文件。该软件支持近 45 种语言，例如法语、意大利语、土耳其语和西班牙语等，用户可以从超过 67 种不同的声音和口音中进行选择。该软件旨在提高生产力并有效扫描不正确的构词或遗漏的单词，并且界面易于使用。用户还可以轻松调整音频文件的语音、音调、音高或音量。它提供女性和男性声音之间的动态变化和高数据吞吐量，以实现快速响应时间。

Capti 语音
Capti Voice是专为教育和生产力而设计的文本转语音，可帮助人们收听文档、电子书和网页。该工具为有阅读障碍、视力障碍或其他阅读或学习障碍的人提供辅助属性。它被全球范围广泛的学校、学院和专业人士使用。该应用程序支持 20 多种语言，可用于增强词汇量并随时随地阅读冗长的作业。

语音梦想阅读器
Voice Dream Reader是适用于移动设备的最佳文本转语音应用程序之一，可以轻松地将文档、网络文章和电子书转换为听起来自然的语音。该应用程序配备超过 185 种语音，涵盖 30 种语言和方言，可与 Dropbox、Google Drive、Instapaper、iCloud Drive、Evernote 和 Pocket 等云解决方案结合使用。除了文本到语音，该应用程序还提供其他功能，例如文本突出显示、字典查找、创建和固定笔记以及全屏阅读模式。

文本转语音市场中帮助克服语言障碍的 5 大公司和软件

相关帖子