参考文档 | 包 (NuGet) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 C# 的语音 SDK。
适用于 C# 的语音 SDK 与 Windows、Linux 和 macOS 兼容。
适用于 C# 的语音 SDK 仅支持 x64、ARM32 和 ARM64 体系结构上的以下分发:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 分发版的最新 LTS 版本。 例如,如果使用 Ubuntu 20.04 LTS,请使用最新版本的 Ubuntu 20.04.X。
语音 SDK 依赖于以下 Linux 系统库:
- GNU C 库的共享库(包括 POSIX 线程编程库
libpthreads
)。
- OpenSSL 库版本 1.x (
libssl1
) 或 3.x (libssl3
),以及证书 (ca-certificates
)。
- ALSA 应用程序的共享库 (
libasound2
)。
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
适用于 C# 的语音 SDK 以 NuGet 包的形式提供并实现了 .NET Standard 2.0。 有关详细信息,请参阅 Microsoft.CognitiveServices.Speech。
可以使用以下 dotnet add
命令从 .NET Core CLI 安装适用于 C# 的语音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
可以使用以下 Install-Package
命令安装适用于 C# 的语音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
参考文档 | 包 (NuGet) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 C++ 的语音 SDK。
适用于 C++ 的语音 SDK 与 Windows、Linux 和 macOS 兼容。
适用于 C++ 的语音 SDK 仅支持 x64、ARM32 和 ARM64 体系结构上的以下分发:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 分发版的最新 LTS 版本。 例如,如果使用 Ubuntu 20.04 LTS,请使用最新版本的 Ubuntu 20.04.X。
语音 SDK 依赖于以下 Linux 系统库:
- GNU C 库的共享库(包括 POSIX 线程编程库
libpthreads
)。
- OpenSSL 库版本 1.x (
libssl1
) 或 3.x (libssl3
),以及证书 (ca-certificates
)。
- ALSA 应用程序的共享库 (
libasound2
)。
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
适用于 C++ 的语音 SDK 以 NuGet 包的形式提供。 有关详细信息,请参阅 Microsoft.CognitiveServices.Speech。
可以使用以下 dotnet add
命令从 .NET Core CLI 安装适用于 C++ 的语音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
可以使用以下 Install-Package
命令安装适用于 C++ 的语音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
可以按照这些指南获取更多选项。
本指南介绍如何安装用于 Linux 的语音 SDK。
使用以下过程下载并安装 SDK。 这些步骤包括以 .tar 文件格式下载所需的库和头文件。
为语音 SDK 文件选择目录。 将 SPEECHSDK_ROOT
环境变量设置为指向该目录。 使用此变量,在将来的命令中可以轻松引用目录。
若要使用主目录中的 speechsdk 目录,请运行以下命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
创建目录(如果不存在):
mkdir -p "$SPEECHSDK_ROOT"
下载并提取包含语音 SDK 二进制文件的 .tar.gz 存档:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
验证所提取的程序包的顶级目录的内容:
ls -l "$SPEECHSDK_ROOT"
目录列表应包含合作伙伴通知和许可证文件。 该列表还应包含容纳头文件 (.h) 的 include 目录和容纳 arm32、arm64、x64 和 x86 库的 lib 目录。
路径 |
说明 |
license.md |
许可 |
ThirdPartyNotices.md |
合作伙伴通知 |
REDIST.txt |
再分发声明 |
include |
C++ 必需的头文件 |
lib/arm32 |
ARM32 必需的用来链接应用程序的本机库 |
lib/arm64 |
ARM64 必需的用来链接应用程序的本机库 |
lib/x64 |
x64 必需的用来链接应用程序的本机库 |
lib/x86 |
需要 x86 本地库来链接您的应用程序 |
本指南介绍如何安装用于 macOS 10.14 或更高版本上的 C++ 的语音 SDK。 这些步骤包括以 .zip 文件格式下载所需的库和头文件。
为语音 SDK 文件选择目录。 将 SPEECHSDK_ROOT
环境变量设置为指向该目录。 使用此变量,在将来的命令中可以轻松引用目录。
若要使用主目录中的 speechsdk 目录,请运行以下命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
创建目录(如果不存在):
mkdir -p "$SPEECHSDK_ROOT"
下载并提取包含语音 SDK XCFramework 的 .zip 存档:
wget -O SpeechSDK-macOS.zip https://aka.ms/csspeech/macosbinary
unzip SpeechSDK-macOS.zip -d "$SPEECHSDK_ROOT"
验证所提取的程序包的顶级目录的内容:
ls -l "$SPEECHSDK_ROOT"
目录列表应包含合作伙伴通知、许可证文件以及 MicrosoftCognitiveServicesSpeech.xcframework 目录。
本指南介绍如何安装适用于 Windows 桌面操作系统上的 C++ 的语音 SDK。
此安装指南需要:
在 Visual Studio 上创建项目并安装语音 SDK
若要为 C++ 桌面开发创建 Visual Studio 项目,需执行以下操作:
- 设置 Visual Studio 开发选项。
- 创建项目。
- 选择目标体系结构。
- 安装语音 SDK。
若要开始,请确保已在 Visual Studio 中正确设置以用于 C++ 桌面开发:
打开 Visual Studio 2019 以显示“开始”窗口。
选择“继续但无需代码” ,转到 Visual Studio IDE。
在 Visual Studio 菜单栏中,选择“工具”>“获取工具和功能”以打开 Visual Studio 安装程序并查看“修改”对话框。
在“工作负载”选项卡的“Windows”下,找到“使用 C++ 的桌面开发”工作负载。 如果尚未选定该工作负载,请将其选定。
在“单个组件”选项卡中,找到“NuGet 包管理器”。 如果尚未选定,请将其选定。
选择“关闭”或“修改”。 按钮名称会有所不同,具体取决于你是否选择了任何功能以进行安装。
如果选择“修改”,将开始安装。 此过程可能需要一些时间。
关闭 Visual Studio 安装程序。
接下来,创建项目并选择目标体系结构:
在 Visual Studio 菜单栏中,选择“文件”>“新建”>“项目”以显示“创建新项目”窗口。
找到“控制台应用”并将其选中 。 确保选择此项目类型的 C++ 版本,而不是 C# 或 Visual Basic。
选择下一步。
在“配置新项目”对话框的“项目名称”中,输入 helloworld。
在“位置”中,转到并选择或创建要用于保存项目的文件夹,然后选择“创建”。
选择目标平台体系结构。 在 Visual Studio 工具栏中,找到“解决方案平台”下拉框。 如果未看到,请选择“查看”“工具栏”“标准”以显示包含“解决方案平台”的工具栏。
如果运行的是 64 位 Windows,请在下拉框中选择“x64”。 64 位 Windows 也可以运行 32 位应用程序,因此可以根据自己的偏好选择“x86” 。
使用 Visual Studio 安装语音 SDK
最后,安装语音 SDK NuGet 包,并在项目中引用语音 SDK:
在“解决方案资源管理器”中,右键单击你的解决方案,然后选择“管理解决方案的 NuGet 包”以转到“NuGet - 解决方案”窗口。
选择“浏览”。
在“包源”中,选择“nuget.org”。
在“搜索”框中,输入 Microsoft.CognitiveServices.Speech。 在该包显示在搜索结果中之后选择该包。
在搜索结果旁的“包状态”窗格中,选择“helloworld” 项目。
选择“安装” 。
在“预览更改”对话框中,选择“确定”。
在“接受许可证”对话框中,查看许可证,然后选择“我接受”。 包安装随即开始。 安装完成后,“输出”窗格会显示类似于以下文本的消息:。
参考文档 | 包 (Go) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 Go 的语音 SDK。
适用于 Go 的语音 SDK 支持 x64 体系结构上的以下分发:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
重要
使用 Linux 分发版的最新 LTS 版本。 例如,如果使用 Ubuntu 20.04 LTS,请使用最新版本的 Ubuntu 20.04.X。
语音 SDK 依赖于以下 Linux 系统库:
- GNU C 库的共享库(包括 POSIX 线程编程库
libpthreads
)。
- OpenSSL 库版本 1.x (
libssl1
) 或 3.x (libssl3
),以及证书 (ca-certificates
)。
- ALSA 应用程序的共享库 (
libasound2
)。
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
安装 Go 二进制版本 1.13 或更高版本。
使用以下过程下载并安装 SDK。 这些步骤包括以 .tar 文件格式下载所需的库和头文件。
为语音 SDK 文件选择目录。 将 SPEECHSDK_ROOT
环境变量设置为指向该目录。 使用此变量,在将来的命令中可以轻松引用目录。
若要使用主目录中的 speechsdk 目录,请运行以下命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
创建目录(如果不存在):
mkdir -p "$SPEECHSDK_ROOT"
下载并提取包含语音 SDK 二进制文件的 .tar.gz 存档:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
验证所提取的程序包的顶级目录的内容:
ls -l "$SPEECHSDK_ROOT"
目录列表应包含合作伙伴通知和许可证文件。 该列表还应包含容纳头文件 (.h) 的 include 目录和容纳 arm32、arm64、x64 和 x86 库的 lib 目录。
路径 |
说明 |
license.md |
许可 |
ThirdPartyNotices.md |
合作伙伴通知 |
REDIST.txt |
再分发声明 |
include |
C++ 必需的头文件 |
lib/arm32 |
ARM32 必需的用来链接应用程序的本机库 |
lib/arm64 |
ARM64 必需的用来链接应用程序的本机库 |
lib/x64 |
x64 必需的用来链接应用程序的本机库 |
lib/x86 |
需要 x86 本地库来链接您的应用程序 |
通过以下步骤可使 Go 环境能够查找语音 SDK。
由于绑定依赖于 cgo
,因此需要设置环境变量,以便 Go 可以找到 SDK。
export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
重要
将 <architecture>
替换为 CPU 的处理器体系结构:x64
、arm32
或 arm64
。
若要运行应用程序和 SDK,需要告知操作系统可在何处可以找到库。
export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
重要
将 <architecture>
替换为 CPU 的处理器体系结构:x64
、arm32
或 arm64
。
参考文档 | GitHub 上的其他示例
在本快速入门中,我们安装适用于 Java 的语音 SDK。
选择目标环境:
适用于 Java 的语音 SDK 与 Windows、Linux 和 macOS 兼容。
适用于 Java 的语音 SDK 仅支持 x64、ARM32 和 ARM64 体系结构上的以下分发:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 分发版的最新 LTS 版本。 例如,如果使用 Ubuntu 20.04 LTS,请使用最新版本的 Ubuntu 20.04.X。
语音 SDK 依赖于以下 Linux 系统库:
- GNU C 库的共享库(包括 POSIX 线程编程库
libpthreads
)。
- OpenSSL 库版本 1.x (
libssl1
) 或 3.x (libssl3
),以及证书 (ca-certificates
)。
- ALSA 应用程序的共享库 (
libasound2
)。
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
语音 SDK 与具有 32/64 位 ARM 处理器和 Intel x86/x64 兼容处理器的 Android 设备兼容。
安装 Java 开发工具包,例如 Azul Zulu OpenJDK。 Microsoft Build of OpenJDK 或你喜欢的 JDK 应该也能正常工作。
某些说明使用特定的 SDK 版本,例如 1.42.0
。 若要查看最新版本,请搜索我们的 GitHub 存储库。
选择目标环境:
本指南介绍如何在 Java 运行时上安装用于 Java 的语音 SDK。
用于 Java 包的语音 SDK 适用于以下操作系统:
按照以下步骤使用 Apache Maven 安装适用于 Java 的语音 SDK:
安装 Apache Maven。
在需要新项目的位置打开命令提示符,并创建一个新的 pom.xml 文件。
将以下 XML 内容复制到 pom.xml 中:
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
<artifactId>quickstart-eclipse</artifactId>
<version>1.0.0-SNAPSHOT</version>
<build>
<sourceDirectory>src</sourceDirectory>
<plugins>
<plugin>
<artifactId>maven-compiler-plugin</artifactId>
<version>3.7.0</version>
<configuration>
<source>1.8</source>
<target>1.8</target>
</configuration>
</plugin>
</plugins>
</build>
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.42.0</version>
</dependency>
</dependencies>
</project>
若要安装语音 SDK 和依赖项,请运行以下 Maven 命令。
mvn clean dependency:copy-dependencies
安装 Eclipse Java IDE。 此 IDE 需要已安装 Java。
启动 Eclipse。
在 Eclipse Launcher 中,在“工作区”框中输入某个新工作区目录的名称。 然后选择“启动”。
片刻之后,Eclipse IDE 的主窗口将会显示。 关闭欢迎屏幕(如果存在)。
从 Eclipse 菜单中,选择“文件”>“新建”>“项目”。
将显示“新建项目”对话框。 选择“Java 项目”,然后选择“下一步”。
此时将启动“新建 Java 项目”向导。 在“项目名称”字段中,输入“快速入门”。 选择“JavaSE-1.8”作为执行环境。 选择“完成”。
如果出现了“打开关联的透视图?”窗口,请选择“打开透视图”。
在“包资源管理器”中,右键单击 "quickstart" 项目。 从上下文菜单中选择“配置”>“转换为 Maven 项目”。
此时将显示“新建 POM”窗口。 在“组 ID”字段中,输入“com.microsoft.cognitiveservices.speech.samples”。 在“Artifact Id”字段中,输入“quickstart”。 然后选择“完成”。
打开 pom.xml 文件并对其进行编辑:
- 在文件末尾,在结束标记
dependencies
前面添加一个 </project>
元素,并将语音 SDK 作为依赖项:
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.42.0</version>
</dependency>
</dependencies>
- 保存更改。
Gradle 配置需要显式引用 .jar 依赖项扩展:
// build.gradle
dependencies {
implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.42.0", ext: "jar"
}
本指南介绍如何安装用于 Java on Android 的语音 SDK。
将适用于 Android 的语音 SDK 打包为 Android 存档 (AAR) 文件,其中包含必要的库以及所需的 Android 权限。
使用 Android Studio 安装语音 SDK
在 Android Studio 中创建新项目,并将适用于 Java 的语音 SDK 添加为库依赖项。 该安装基于语音 SDK Maven 包和 Android Studio Chipmunk 2021.2.1。
打开 Android Studio,然后选择“新建项目”。
在出现的新建项目窗口中,选择电话和平板>空活动,然后选择下一步。
在名称文本框中输入SpeechQuickstart。
在“包名称”文本框中输入 samples.speech.cognitiveservices.microsoft.com。
在“保存位置”选择框中选择项目目录。
在“语言”选择框中选择 “Java”。
在“最低 API 级别”选择框中选择 “API 23:Android 6.0 (Marshmallow)”。
选择“完成”。
Android Studio 需要一些时间来准备你的新项目。 首次使用 Android Studio 时,设置首选项、接受许可证并完成向导可能需要几分钟时间。
在 Android 上安装适用于 Java 的语音 SDK
将语音 SDK 添加为项目中的依赖项。
选择“文件”“项目结构”>“依赖项”“应用”。
选择加号 (+),在“声明的依赖项”下添加依赖项。 然后从下拉菜单中选择“库依赖项”。
在显示的“添加库依赖项”窗口中,输入适用于 Java 的语音 SDK 名称和版本:com.microsoft.cognitiveservices.speech:client-sdk:1.42.0。 然后选择“搜索”。
确保所选的“组 ID” 为 com.microsoft.cognitiveservices.speech,然后选择“确定”。
选择“确定”,关闭“项目结构”窗口并应用对项目所做的更改。
参考文档 | 包 (npm) | GitHub 上的其他示例 | 库源代码
在本快速入门中,我们安装适用于 JavaScript 的语音 SDK。
适用于 JavaScript 的语音 SDK 以 npm 包的形式提供。 请参阅 microsoft-cognitiveservices-speech-sdk 及其配套的 GitHub 存储库 cognitive-services-speech-sdk-js。
了解 Node.js 和客户端 Web 浏览器之间的各种体系结构影响。 例如,文档对象模型 (DOM) 不适用于服务器端应用程序。 Node.js 文件系统不适用于客户端应用程序。
请根据目标环境使用以下指南之一:
本指南介绍如何安装可以在 Node.js 中使用的 JavaScript 版语音 SDK。
安装 Node.js。
创建一个新目录,运行 npm init
并浏览其提示。
若要安装适用于 JavaScript 的语音 SDK,请运行以下 npm install
命令:
npm install microsoft-cognitiveservices-speech-sdk
有关详细信息,请参阅 Node.js 示例。
本指南介绍如何安装可以在网页中使用的适用于 JavaScript 的语音 SDK。
新建空文件夹。 如果要在 Web 服务器上托管示例,请确保 Web 服务器可访问文件夹。
将语音 SDK 作为 .zip 包下载,并将其解压缩到新建文件夹。 已解压缩这些文件:
- microsoft.cognitiveservices.speech.sdk.bundle.js:语音 SDK 的人工可读版本。
- microsoft.cognitiveservices.speech.sdk.bundle.js.map:用于调试 SDK 代码的映射文件。
- microsoft.cognitiveservices.speech.sdk.bundle.d.ts:用于 TypeScript 的对象定义。
- microsoft.cognitiveservices.speech.sdk.bundle-min.js:语音 SDK 的缩小版本。
- speech-processor.js:用于提高某些浏览器性能的代码。
在文件夹中创建名为 index.html 的新文件,使用文本编辑器打开此文件。
从适用于 JavaScript 的语音 SDK 中下载并提取 microsoft.cognitiveservices.speech.sdk.bundle.js 文件。 将其置于可供 HTML 文件访问的文件夹中。
<script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>;
提示
如果以 Web 浏览器为目标并使用 <script>
标记,则不需 sdk
前缀。 sdk
前缀是一个别名,用于为 require
模块命名。
或者,可以直接在 HTML <script>
元素中包含一个 <head>
标记,该标记依赖于 JSDelivr。
<script src="https://cdn.jsdelivr.net/npm/microsoft-cognitiveservices-speech-sdk@latest/distrib/browser/microsoft.cognitiveservices.speech.sdk.bundle-min.js">
</script>
有关详细信息,请参阅基于浏览器的示例。
有关 import
的详细信息,请参阅 JavaScript 网站上的导出和导入。
或者,可以使用 require 语句:
const sdk = require("microsoft-cognitiveservices-speech-sdk");
参考文档 | 包(下载) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 Objective-C 的语音 SDK。
安装适用于 Objective-C 的语音 SDK
适用于 Objective-C 的语音 SDK 以 CocoaPod 包的形式本机提供,适用于 Mac x64 和基于 ARM 的芯片。
Mac 的系统需求:
macOS CocoaPod 包可供下载并在 Xcode 9.4.1(或更高版本)集成开发环境 (IDE) 中使用。
转到 .xcodeproj 项目文件所在的 Xcode 目录。
运行 pod init
以创建一个名为 Podfile 的 Pod 文件。
将 Podfile 文件的内容替换为以下内容。 将 target
名称从 AppName
更新为应用的名称。 根据需要更新平台或 Pod 版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
运行 pod install
以安装语音 SDK。
或者,下载二进制 CocoaPod 并提取其内容。 在 Xcode 项目中,添加对提取的 MicrosoftCognitiveServicesSpeech.xcframework 文件夹及其内容的引用。
用于 Objective-C 的语音 SDK 以 CocoaPod 包的形式本地提供。
iOS 的系统需求:
- macOS 版本 10.14 或更高版本
- 目标 iOS 9.3 或更高版本
macOS CocoaPod 包可供下载并在 Xcode 9.4.1(或更高版本)集成开发环境 (IDE) 中使用。
转到 .xcodeproj 项目文件所在的 Xcode 目录。
运行 pod init
以创建一个名为 Podfile 的 Pod 文件。
将 Podfile 文件的内容替换为以下内容。 将 target
名称从 AppName
更新为应用的名称。 根据需要更新平台或 Pod 版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
运行 pod install
以安装语音 SDK。
或者,下载二进制 CocoaPod 并提取其内容。 在 Xcode 项目中,添加对提取的 MicrosoftCognitiveServicesSpeech.xcframework 文件夹及其内容的引用。
参考文档 | 包(下载) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 Swift 的语音 SDK。
用于 Swift 的语音 SDK 作为 CocoaPod 包原生提供,支持 Mac x64 和 ARM 架构的系统。
Mac 的系统需求:
macOS CocoaPod 包可供下载并在 Xcode 9.4.1(或更高版本)集成开发环境 (IDE) 中使用。
转到 .xcodeproj 项目文件所在的 Xcode 目录。
运行 pod init
以创建一个名为 Podfile 的 Pod 文件。
将 Podfile 文件的内容替换为以下内容。 将 target
名称从 AppName
更新为应用的名称。 根据需要更新平台或 Pod 版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
运行 pod install
以安装语音 SDK。
或者,下载二进制 CocoaPod 并提取其内容。 在 Xcode 项目中,添加对提取的 MicrosoftCognitiveServicesSpeech.xcframework 文件夹及其内容的引用。
适用于 Swift 的语音 SDK 以 CocoaPod 包的形式本机提供。
iOS 的系统需求:
- macOS 版本 10.14 或更高版本
- 目标 iOS 9.3 或更高版本
macOS CocoaPod 包可供下载并在 Xcode 9.4.1(或更高版本)集成开发环境 (IDE) 中使用。
转到 .xcodeproj 项目文件所在的 Xcode 目录。
运行 pod init
以创建一个名为 Podfile 的 Pod 文件。
将 Podfile 文件的内容替换为以下内容。 将 target
名称从 AppName
更新为应用的名称。 根据需要更新平台或 Pod 版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
运行 pod install
以安装语音 SDK。
或者,下载CocoaPod 的二进制文件并提取其内容。 在 Xcode 项目中,添加对提取的 MicrosoftCognitiveServicesSpeech.xcframework 文件夹及其内容的引用。
参考文档 | 包 (PyPi) | GitHub 上的其他示例
在本快速入门中,我们安装适用于 Python 的语音 SDK。
适用于 Python 的语音 SDK 与 Windows、Linux 和 macOS 兼容。
适用于 Python 的语音 SDK 支持 x64 和 ARM64 体系结构上的以下分发:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 分发版的最新 LTS 版本。 例如,如果使用 Ubuntu 20.04 LTS,请使用最新版本的 Ubuntu 20.04.X。
语音 SDK 依赖于以下 Linux 系统库:
- GNU C 库的共享库(包括 POSIX 线程编程库
libpthreads
)。
- OpenSSL 库版本 1.x (
libssl1
) 或 3.x (libssl3
),以及证书 (ca-certificates
)。
- ALSA 应用程序的共享库 (
libasound2
)。
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
运行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
安装 Python 3.8 或更高版本。
若要检查安装情况,请打开终端并运行命令 python --version
。 如果 Python 安装正确,则会收到类似 Python 3.8.10
的响应。
如果你使用的是 macOS 或 Linux,可能需要改为运行命令 python3 --version
。
若要启用 python
而不是 python3
,请运行 alias python='python3'
以设置别名。 语音 SDK 快速入门示例指定了 python
用法。
安装适用于 Python 的语音 SDK 之前,请确保满足平台先决条件。
若要安装适用于 Python 的语音 SDK,请在控制台窗口中运行以下命令:
pip install azure-cognitiveservices-speech
若要升级到最新的语音 SDK,请在控制台窗口中运行以下命令:
pip install --upgrade azure-cognitiveservices-speech
可以通过查看 azure.cognitiveservices.speech.__version__
变量来检查当前安装的适用于 Python 的语音 SDK 版本。 例如,在控制台窗口中运行以下命令:
pip list
使用 Visual Studio Code 安装语音 SDK
若要安装适用于 Python 的语音 SDK,请执行以下操作:
下载并安装 Visual Studio Code。
运行 Visual Studio Code 并安装 Python 扩展:
- 选择文件>首选项>扩展。
- 搜索“Python”,查找由 Microsoft 发布的“适用于 Visual Studio Code 的 Python 扩展”,然后选择“安装”。
选择“终端”“新建终端”,以在 Visual Studio Code 中打开终端。
在终端提示符下,运行以下命令以安装适用于 Python 的语音 SDK 包。
python -m pip install azure-cognitiveservices-speech
有关 Visual Studio Code 和 Python 的详细信息,请参阅 Visual Studio Code 和 VS Code 中的 Python 入门。
添加以下 import 语句以在 Python 项目中使用语音 SDK:
import azure.cognitiveservices.speech as speechsdk
GitHub 上的 Azure-Samples/cognitive-services-speech-sdk 存储库中提供了深入示例。 C# (包括 UWP 和 Unity)、C++、Java、JavaScript(包括浏览器和 Node.js)、Objective-C、Python 和 Swift 都有示例。 GitHub 上的 Microsoft/cognitive-services-speech-sdk-go 存储库中提供了 Go 代码示例。