媒体服务词汇表

媒体服务徽标 v3


警告

Azure 媒体服务将于 2024 年 6 月 30 日停用。 有关详细信息,请参阅 AMS 停用指南

通过本文了解媒体服务使用的概念。

注意

本文正在编写中。 欢迎读者补充定义。

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

A

媒体服务帐户 - 媒体服务帐户是一种 Azure 资源,可以通过它来使用媒体服务产品。

自适应比特率流式处理 - 自适应比特率流式处理是可供媒体播放器用于在编码的文件之间进行切换的方法,当 CPU 和带宽等可用资源发生变化时,这些文件采用不同的比特率。

高级音频编码 (AAC) - 用于实现有损数字音频压缩的音频编码标准。

高级视频编码 (AVC) - 基于块导向的运动补偿编码的视频压缩标准。 也称为 H.264。

联盟视频编解码器版本 1 (AV1) - 由开放媒体联盟 (AOM) 开发的免版税视频压缩格式。

纵横比 - 视频的高度和宽度之比。

资产 - 媒体服务资产是 Azure 存储块 Blob 容器。 它包含与某个媒体片段相关的所有文件(例如 MP4 文件)以及清单、字幕和其他数据。 可以使用它来存储点播视频、编码输入和输出、实时传送视频流输出等的文件。

资产筛选器 - 应用动态清单筛选器以从 HLS 或 DASH 清单中删除或者限制视频或音频轨道。 筛选器可以按比特率、编解码器、分辨率、语言、时间范围等条件选择轨道。 筛选器在创建后可以应用到与该筛选器关联的资产,其持续时间与资产的生存期相同。

身份验证令牌 - 访问令牌使客户端可以安全地调用受保护的 Web API,并可由 Web API 用来执行身份验证和授权。 根据 OAuth 规范,访问令牌是没有固定格式的不透明字符串 - 某些标识提供者 (IDP) 使用 GUID,另一些标识提供者使用加密的 blob。 有关令牌的详细信息,请参阅 Microsoft 标识平台访问令牌

B

比特率 - 编码视频中内容的每秒比特数。

缓冲 - 当没有足够的带宽用来以选定比特率流式处理内容时,将发生缓冲。 这种情况可能是由本地 ISP 问题或广域网问题造成的。

C

缓存 - 缓存是存储数据的一种方式,这样,只要访问了数据一次,以后就可以更快地访问它。

隐藏式字幕 (CC) - 显示视频中音频的原有或经过编辑的听录内容的过程。 它用于增强面向听障人士的视频内容辅助功能。

剪裁 - 从较大视频中提取一小段内容并从其创建新视频的做法。

通用媒体应用程序格式 (CMAF) - 运动图像专家组 (MPEG) 建立的视频打包标准,用于降低发布视频媒体的复杂性。 与 HLS 或 DASH 清单搭配使用时,此格式将使用分段 MP4 容器来存储和传送较小的音频、视频和文本区块。 此外,该规范还提供了有关如何加密内容,以及如何打包隐藏式字幕、对白字幕和其他高级功能以实现 HLS 与 DASH 流生态系统播放器之间的兼容性的详细信息。

编解码器 - 编解码器用于压缩或解压缩音频或视频等媒体。 编解码器可能由两个部分组成:用于压缩媒体文件(编码)的编码器,和用于解压缩文件(解码)的解码器。 有些编解码器包括这两个部分,而有他编解码器则只包括其中的一个部分。

通用加密 (CENC) - 也称为 MPEG CENC,是用于加密及传送 DASH 与 HLS 视频和音频的标准。

恒定比特率 - 对视频进行编码,以尽量减小比特率与目标所需比特率的差异。

内容感知编码 - 添加逻辑,使编码器能够根据给定的分辨率寻找最佳比特率值,且无需进行广泛的计算分析。

内容解密模块 (CDM) - 嵌入在 Web 浏览器中的软件,用于解密已加密的数字版权管理 (DRM) 内容。 可用的 DRM 系统类型根据浏览器和操作系统而异。

内容密钥策略 - 用于配置如何将内容密钥传送到媒体客户端。

跨源资源共享 (CORS) - 默认会禁止跨域(源)的内容请求。 CORS 定义了两个域如何通过必须由源域批准的 HTTP 请求共享内容。

凭据 - 一个证书或其他身份验证过程,用于确认用户或应用程序对数据的访问权限。

裁剪 - 裁剪是指在视频帧内选择一个矩形窗口并且只编码该窗口内的像素的过程。

客户管理的密钥 - 也称为“创建自己的密钥”(BYOK)。 客户管理的密钥是由客户提供的加密密钥,而不是 Azure 自动创建的密钥。

D

基于 HTTP 的动态自适应流式处理 - MPEG 创建的基于 XML 的清单和自适应流式处理比特率流式处理技术。

解码 - 将压缩的视频数据转换回未压缩的数据(视频帧)。

解码时间戳 (DTS) - 解码器应解码视频帧的时间。

解复用 - 从 MP4 容器等流中提取信号(视频、音频、文本、元数据)。

描述性音频 - 视频中的一个附加音频轨道,用于描述视频中发生的视觉事件。 它增强了面向视障人士的辅助功能。

数字版权管理 (DRM) - 一种保护内容的方式,除非满足特定的条件,否则禁止播放该内容(例如允许在某段时间播放,或者只能由特定的设备播放)。 DRM 技术包括 Apple FairPlay 和 Microsoft PlayReady。

数字版权管理 (DRM) 许可证 - 在媒体播放器客户端可以播放由数字版权管理的内容之前,必须先检索一个许可证。 该许可证传达了数字版权管理对内容施加的限制。

Dolby Digital/AC-3 - Dolby Laboratories 开发的音频编解码器。 也称为 AC-3。

Dolby Digital Plus/eAC-3 - Dolby Laboratories 开发的音频编解码器,是 Dolby Digital/AC-3 的后继版本。 它提供更好的质量和更低的比特率。 也称为 eAC-3。

动态加密 - 媒体服务使用内容密钥通过高级加密标准 (AES-128) 或两个主要数字版权管理 (DRM) 系统(Microsoft PlayReady 和 Apple FairPlay)中的任何一个系统来动态加密内容。 MPEG 的通用加密标准中描述了加密方法和方案。

动态打包 - 在媒体服务中,流式处理终结点(源)表示动态(即时)打包和源服务,该服务可直接将实时和按需内容发送到客户端播放器。 它使用常用的流媒体协议之一:HLS、DASH 或平滑流式处理。

动态清单 - 作为动态打包的一部分,流式处理客户端清单(例如 HLS Master 播放列表、DASH 媒体呈现描述 (MPD) 和平滑流式处理)将会根据 URL 中的格式选择器动态生成。 还可以使用资产级别或全局筛选器调整清单,以删除特定轨道并为观看者提供更有针对性的清单。

E

编码器 - 一个应用程序,它提取原始视频帧并应用编解码器来创建新的基本流,然后将该流放入文件容器或转换为 RTMP 等流格式。

编码 - 将包含数字视频和/或音频的文件从一种标准格式转换为另一种标准格式的过程,其目的是 (a) 减小文件大小,和/或 (b) 生成与各种设备和应用兼容的格式。

编码梯度 - 自适应流式处理的建议分辨率和比特率表。

加密媒体扩展 (EME) - W3C HTML5 标准,其中允许播放 DRM 保护内容的 API 嵌入在浏览器中。

实体 - 属于 API 的一部分的任何对象,具有自身的方法和属性。 在 Azure 资源管理 API 中也称为“资源”。

F

FFMPEG - 一个多媒体框架,可以解码、编码、转码、复用、解复用、流式处理、筛选和播放媒体内容。

筛选器 - 允许执行多种操作(例如,仅播放视频的某个区段、仅传送指定的再现内容或语言轨道,或调整呈现窗口)的服务器端规则。 筛选器可应用于媒体服务帐户或资产。

G

H

H.264 - 也称为“高级视频编码”(AVC),是基于块导向的运动补偿编码的视频压缩标准。

H.265/高效视频编码 - 也称为“高效视频编码”(HEVC),是 H.264 的后继视频压缩标准,其数据压缩效果比 H.264 (AVC) 高出 25% 到 50%。

H.266 - 也称为“通用视频编码”(VVC),是 H.265 的后继视频压缩标准,可以提高压缩性能并支持其他应用程序。

高可用性 - 系统实施故障转移和其他方法来确保应用程序始终为其最终用户保持正常工作。

高带宽数字内容保护 (HDCP) - 一种数字内容保护技术,对不允许流式传输内容的设备的连接强制实施限制。

高动态范围 (HDR) - 一种视频格式,可以捕获各种亮度值,包括 Dolby Vision、HDR10、HDR10+ 和 HLG。

HTML5 - 一种语义 XML 架构,它描述页面元素,并将这些元素与由 CSS 处理的呈现内容相区分。 对于视频,有一个不存在于 HTML4 中的 <video> 元素。

HTTP Live Streaming (HLS) - 一种流式处理自适应比特率媒体的方法,由 Apple 开发。

采用 AES128 的 HTTP Live Streaming (HLS) - 一种使用加密流式处理自适应比特率媒体的方法,由 Apple 开发。

I

Internet 媒体对白字幕和隐藏式字幕 (IMSC) - 一种 w3c 标准文件格式,它使用 XML 来描述对白字幕和隐藏式字幕内容、计时、布局和样式。

引入 - 将媒体内容提交到编码或存储服务时, 编码或存储服务将引入传入的媒体。

输入资产 - 用于存放要编码的媒体的媒体服务资产(Azure 存储容器)。 将媒体编码后,它将保存到输出资产。

J

作业 - 针对媒体服务的请求,目的是将转换应用到给定的输入视频或音频内容。 创建转换后,可以使用媒体服务 API 或任何已发布的 SDK 来提交作业。 作业指定输入视频位置和输出位置等信息。 可以使用以下各项指定输入视频的位置:HTTPS URL、SAS URL 或资产。

K

密钥 - 密钥用于解密已加密的计算资源。 有多种类型的密钥可用于保护 Azure 资源。 媒体服务使用帐户加密密钥、存储加密密钥、API 密钥和内容密钥。

密钥传送服务 - 媒体服务提供密钥传送服务,用于为客户端播放器生成内容密钥和 DRM 许可证来解密 HLS 或 DASH 流媒体内容。

L

延迟 - 将媒体内容从源服务器传输到播放器客户端所花费的时间。 它也称为“视角到视角”延迟,用于度量某个视频帧从相机(视角 #1)在网络中通过编码器传播到云服务进行处理,然后通过传送网络输出到客户端播放器或设备(视角 #2 是监视器或设备屏幕)所花费的时间。

实时编码器 - 能够实时处理视频源并将其发送到引入 URL 的硬件或软件编码器。 此类实时编码器的示例包括 OBS Studio 和 Telestream Wirecast。

实时输出 - 一种录制功能,该功能在要在直播活动结束后保存直播活动时创建。 录制的视频将写入到输出资产。

实时事件 - 引入、(可选)编码和存档实时视频源。 实时事件可以设置为基本或标准直通(本地实时编码器发送多比特率流)或实时编码(本地实时编码器发送单比特率流,云服务提供编码)。

实时传送流 - 在生成实时视频和/或音频内容后,近实时地向受众传送该内容。

实时流式传输到点播视频 (VOD) - 当本地编码器将实时视频和音频传输到媒体服务时,将从实时输出流式传输编码的内容。 当实时事件停止时,将删除实时输出,但编码的文件会保留在资产中,使观看者稍后可以观看内容(点播)。

听录 - 语音识别,可听录直播活动期间所说的内容。 听录以 VTT 和 IMSC1 轨道的形式提供,以便交付。

低延迟 - 将媒体内容从源服务器传输到播放器客户端所需的时间小于 8 秒。

M

M3u8 - 与 Apple HTTP Streaming (HLS) 结合使用的多媒体播放列表文件格式。

媒体源扩展 (MSE) - W3C 浏览器扩展规范,为视频播放提供标准化 API。

托管标识 - 托管标识为应用程序提供一个标识,可以在连接到支持 Azure Active Directory (Azure AD) 身份验证的资源时使用。 托管标识分为两种类型:

  • 系统分配。 一些 Azure 服务允许直接在服务实例上启用托管标识。 启用系统分配的托管标识后,系统会在 Azure AD 中创建一个标识。 此标识与该服务实例的生命周期相关联。 当资源被删除时,Azure 会自动为你删除标识。 按照设计,只有该 Azure 资源可以使用此标识从 Azure AD 请求令牌。
  • 用户分配。 也可以将托管标识创建为独立的 Azure 资源。 你可以创建用户分配的托管标识,并将其分配给一个或多个 Azure 服务实例。 对于用户分配的托管标识,标识与使用它的资源分开管理。

清单 - 一个文本文件,其中列出了自适应比特率流式处理包的文件。 HLS、DASH 和平滑流式处理等自适应流式处理协议依赖于清单文件来描述播放器可用的视频、音频轨道和文本内容。 清单还可以包含“再现内容”,用于描述相同内容的各种编码,以便为客户端播放器提供选择。

夹层文件 - 来自相机、编辑系统或其他原始视频和音频数据源的源视频的轻度压缩再现内容。 通常,这是由媒体服务引入的要编码的高质量副本或主要源视频。

中间插播、前期插播、后期插播 - 在播放主要内容期间插入的媒体。 广告是最常见的插播媒体。

动画专家组 (MPEG) - 创建、研究和定义视频与音频编码、打包和传送全球行业标准的组织。

MPEG DASH - MPEG DASH(基于 HTTP 的动态自适应流式处理)使用基于 XML 的文件来描述要为流传送的 fMP4 文件片段。

MP4 - 一种容器格式,可将视频、音频、对白字幕和图像数据存储在单独的轨道中。 也称为 ISO 基础媒体文件格式,已在 ISO 14496 第 12 部分规范中定义。

复用 - 一种将多个基本流(例如视频、音频和隐藏式字幕流)组合成容器格式(例如 MP4 或 TS 段)的方法。

N

O

OData - 用于查询 REST API 调用的开放协议。 媒体服务 API 使用 HTTP 谓词 GET、POST、PUT、PATCH 和 DELETE,将查询结果作为 JSON 有效负载返回。

Opus - 由 Xiph.Org 基金会创建的低延迟视频编解码器,它是与 VP9 或 AVI编解码器结合使用的开源编解码器。

源 - 传送媒体内容的服务器。 源存储了要引入到媒体服务的文件。 此外,源处理动态打包、加密和筛选。

输出资产 - 将媒体编码后用于存放该媒体的媒体服务资产(Azure 存储容器)。

叠加层 - 叠加在主视频之上的图形或附加视频。 叠加层包括中间插播广告或徽标。

P

直通 - 使用直通实时事件(基本或标准)时,本地实时编码器将生成多比特率视频流,并将其作为贡献源发送到实时事件(使用 RTMP 或分段 MP4 输入协议)。 实时事件随后会将传入视频流传递给动态打包器(流式处理终结点),而无需经过进一步的转码。 直通实时事件已针对长时间运行的实时事件或 24x365 线性实时传送视频流进行优化。

呈现时间戳 (PTS) - 在屏幕上呈现媒体帧的时间。

播放器客户端 - 播放视频和音频流的应用程序。 示例包括 Azure Media Player、Apple AvPlayer 框架、Shaka 和 Video.js。

预设 - 针对媒体执行的编码作业或其他转换的一组配置设置。 出于便利,媒体服务为不想要定义自定义预设的客户提供了预设。

专用终结点 - 使用虚拟网络中的专用 IP 地址的网络接口。

专用链接 - 使用 Azure 专用链接,可以通过虚拟网络中的专用终结点访问 Azure PaaS 服务(例如,Azure 存储和 SQL 数据库)和 Azure 托管的客户拥有的服务/合作伙伴服务。

Q

R

红绿蓝 (RGB) 颜色模型 - 一种表示颜色的数字方式,其中红色、绿色和蓝色的值是以加色(光线)混合架构指定的。 其中每种颜色的光线值或大或小,它们决定了最终的颜色。

重新缓冲 - 视频播放器必须暂停以加载其他视频。

再现内容 - 作为自适应比特率流式处理集的一部分的视频或音频版本。

分辨率 - 视频的宽度和高度,以像素或行为单位,例如 720p。

实时消息传递协议 (RTMP) - 一种用于流式传输音频和视频的通信协议,最初是由 Adobe 定义的,用于传送到 Flash 客户端,而现在已被各种社交媒体和实时传送视频流服务广泛采用。

编修 - 对可能需要保护的信息(例如面部、牌照等)进行模糊处理的一种方式。

S

SAS URL - 在客户端生成的字符串,该字符串随后与需要访问 Azure 资源的客户端应用程序共享。

切片 - 在 AVC 或 HEVC 编码视频中,切片是指帧中要处理的区域。

拼接 - 也称为“接合”,是指拍摄两段或更多视频并将它们联接在一起以创建一个新视频。

流 - 流可以指构成要流式传输到视频播放器的包的文件,也可以指媒体内容的实际传输。

流式传输 - 最好是将流式处理与下载内容相比较来理解此术语。 下载内容时,会将整个文件传送给最终用户,并将文件保存在本地。 但是,在流式传输时,媒体内容区块将以数据包的形式持续传送到客户端播放器。 内容不会保留在用户的计算机上。

流式处理终结点 - 流式处理终结点是动态(即时)打包和源服务,该服务使用一个常见流式处理媒体协议(HLS 或 DASH)直接将实时和按需内容发送到客户端播放器应用。 它还为 DRM 提供动态(即时)加密。

流式处理定位符 - 为客户端播放器生成流式处理 URL,以便从资产中流式传输媒体。 它们可与筛选器、流式处理策略和内容密钥策略相关联。

流式处理策略 - 为流式处理定位符定义流式处理协议和加密选项。

子剪辑 - 指定仅剪裁一部分视频,或将其另存为独立视频。 也称为拼合与编辑。

对白字幕 - 显示视频中音频的原有或经过编辑的听录内容的过程。 它最常用于以多种语言提供文本,以及增强视频的辅助功能。

T

缩略图 - 一个静止图像,它是从视频中提取的帧,或者是视频未播放或处于停止状态时使用的不同图像。

缩略图子画面 - 一个 JPEG 文件,其中的列和行包含拼接成单个(较大)图像的多个小分辨率缩略图;以及一个 VTT 文件,用于定义要在 HTML5 网页中提取或显示的每个帧的 CSS 偏移量和分辨率。 通常用于流视频播放器中胶片控件的转筒,以增强快进和快退体验。

时移 - 视频播放器能够回放流内容的时间长短。 也称为“DVR 窗口”。

转换 - 用于配置对视频进行编码或分析的常见任务。 每个转换描述了用于处理视频或音频文件的脚本或任务工作流。 单个转换可以应用多个规则。

转码 - 对存储在一个编解码器中的视频或音频流进行解码,然后使用具有不同设置的同一编解码器或使用另一个编解码器重新编码。 从技术上讲,Azure 媒体服务中的大多数文件和实时编码实际上是“转码”而不是“编码”,但我们将大多数与编解码器相关的操作称为“编码”。

受信任存储 - 使用防火墙保护存储帐户。

U

V

可变比特率(VBR) - 一种对视频进行编码的方式,它可以区分包含大量动作的帧和动作很少的帧,以便可以根据需要更改比特率。

通用视频编码 (VVC) - 一种新的编解码器,旨在改进 2020 年作为标准发布的 H.265 或高效编码。 它尚未得到广泛部署,并且目前不受媒体服务的支持。

点播视频 (VoD) - 可以随时观看而不是只能在预定时间观看的视频。

Vorbis - 由 Xiph.Org 基金会创建的开源音频编解码器。 另请参阅“Opus”。

VP8 - 由 Google 开发的视频编解码器。

VP9 - 由 Google 开发的视频编解码器。

VTT/ WebVTT - 一个文本文件,其中包含视频的对白字幕、隐藏式字幕、描述以及篇章和元数据,采用 WebVTT 格式。

W

Webhook - 一种通过 URL 将计算事件从一个应用程序传递到另一个应用程序的方式。

WebM - 一种容器格式,用于将编码的内容存储为 VP8、VP9 或 AV1 编解码器,以及 Opus 和 Vorbis 编解码器。

Web 实时通信 (WebRTC) - 由 W3C 和 IETF 组织发布,用于标准化对等实时通信 API。

X

Y

Z