实体元数据
实体元数据对象捕获有关检测到的实体的可选附加信息,为数字实体和时态实体提供专用解析。 仅当有补充数据可用时,才会填充此属性,从而增强检测到的实体的全面性。 元数据组件包含为数字实体和时态实体设计的解析。 处理元数据属性可能为空或不存在的情况非常重要,因为不能保证每个实体都存在元数据属性。
目前,元数据组件处理实体的标准格式的解析。 可以用各种格式表示实体,解析为常见的可量化类型提供标准可预测格式。 例如,“八十”和“80”都应解析为整数 80
。
可以使用 NER 解析来实现操作或检索详细信息。 例如,服务可以提取日期/时间实体,以提取要提供给会议安排系统的日期和时间。
注意
仅从 api-version=2023-04-15-preview 开始支持实体元数据。 对于较旧的 API 版本,可以查看实体解析一文。
本文记录了为元数据对象下的每个实体类别或子类别返回的解析对象。
数字实体
Age
示例:“10 岁”、“23 个月大”、“六十岁”
"metadata": {
"unit": "Year",
"value": 10
}
“unit”的可能值:
- 年龄
- Month
- Week
- 日期
货币
示例:“30 埃及镑”、“77 美元”
"metadata": {
"unit": "Egyptian pound",
"ISO4217": "EGP",
"value": 30
}
“unit”和“ISO4217”的可能值:
日期/时间/时态实体
Datetime 包括多个不同的子类型,这些子类型返回不同的响应对象。
日期
特定日期。
示例:“1995 年 1 月 1 日”、“4 月 12 日”、“2022 年 10 月 7 日”、“明天”
"metadata": {
"dateValues": [
{
"timex": "1995-01-01",
"value": "1995-01-01"
}
]
}
每当提供歧义的日期时,系统都会提供不同的解析选项。 例如“4 月 12 日”可以指任何年份的日期。 解析提供本年和下一年作为选项。 timex
值 XXXX
表示未在查询中指定年份。
"metadata": {
"dateValues": [
{
"timex": "XXXX-04-12",
"value": "2022-04-12"
},
{
"timex": "XXXX-04-12",
"value": "2023-04-12"
}
]
}
即使是一周中的星期几也可能产生歧义。 例如,“星期一”可能指上星期一,也可能指本周的星期一。 同样,timex
值表示未指定年份或月份,它使用星期标识符 (W) 来表示一周的第一天。
"metadata" :{
"dateValues": [
{
"timex": "XXXX-WXX-1",
"value": "2022-10-03"
},
{
"timex": "XXXX-WXX-1",
"value": "2022-10-10"
}
]
}
时间
特定时间。
示例:“9:39:33 AM”、“上午七点”、“20:03”
"metadata": {
"timex": "T09:39:33",
"value": "09:39:33"
}
datetime
特定的日期和时间组合。
示例:“明天下午 6 点”、“1 月 3 日晚上 8 点”、“11 月 1 日 19:30”
"metadata": {
"timex": "2022-10-07T18",
"value": "2022-10-07 18:00:00"
}
与日期类似,可能会出现歧义的日期/时间实体。 例如“5 月 3 日中午”可以指任何年份的日期/时间。 解析提供本年和下一年作为选项。 timex
值 XXXX 表示未指定年份。
"metadata": {
"dateValues": [
{
"timex": "XXXX-05-03T12",
"value": "2022-05-03 12:00:00"
},
{
"timex": "XXXX-05-03T12",
"value": "2023-05-03 12:00:00"
}
]
}
日期/时间范围
日期/时间范围是具有开始和结束日期、时间或日期/时间的时段。
示例:“从 2022 年 1 月 3 日上午 6 点至 4 月 25 日晚上 8 点”、“星期一至星期四”、“六月”、“周末”
“duration”参数表示已经过的时间,单位为秒 (S)、分钟 (M)、小时 (H) 或天 (D)。 仅当查询中包含显式的开始和结束日期/时间时,才返回此参数。 指定“下周”只会返回该周的“begin”和“end”参数。
"metadata": {
"duration": "PT2702H",
"begin": "2022-01-03 06:00:00",
"end": "2022-04-25 20:00:00"
}
设置
集是重复的日期/时间段。 集不会解析为确切的值,因为它们不表示确切的日期/时间。
示例:“每星期一下午 6 点”、“每星期四”、“每个周末”
对于“每周一下午 6 点”,timex
值表示未指定从 XXXX 开始的年份,“每星期一”通过 WXX-1 确定每周的第一天,最后 T18 表示下午 6 点。
"metadata": {
"timex": "XXXX-WXX-1T18",
"value": "not resolved"
}
维度
示例:“24 公里/小时”、“44 平方米”、“六十六千字节”
"metadata": {
"unit": "KilometersPerHour",
"value": 24
}
“单位”字段值的可能值:
对于测量:
- SquareKilometer
- SquareHectometer
- SquareDecameter
- SquareMeter
- SquareDecimeter
- SquareCentimeter
- SquareMillimeter
- SquareInch
- SquareFoot
- SquareMile
- SquareYard
- 阿克里州
对于信息:
- bit
- Kilobit
- Megabit
- 千兆位
- Terabit
- Petabit
- Byte
- Kilobyte
- Megabyte
- GB
- Terabyte
- Petabyte
对于长度、宽度、高度:
- Kilometer
- Hectometer
- Decameter
- 计量
- Decimeter
- 厘米
- 毫米
- Micrometer
- Nanometer
- Picometer
- Mile
- Yard
- Inch
- Foot
- Light year
- Pt
对于速度:
- MetersPerSecond
- KilometersPerHour
- KilometersPerMinute
- KilometersPerSecond
- MilesPerHour
- Knot
- FootPerSecond
- FootPerMinute
- YardsPerMinute
- YardsPerSecond
- MetersPerMillisecond
- CentimetersPerMillisecond
- KilometersPerMillisecond
对于体积:
- CubicMeter
- CubicCentimeter
- CubicMillimiter
- Hectoliter
- Decaliter
- Liter
- Deciliter
- Centiliter
- Milliliter
- CubicYard
- CubicInch
- CubicFoot
- CubicMile
- FluidOunce
- Teaspoon
- Tablespoon
- Pint
- Quart
- Cup
- Gill
- 捏放
- FluidDram
- 笔筒
- Minim
- Cord
- Peck
- Bushel
- Hogshead
对于重量:
- 千克
- 克
- 毫克
- 微克
- Gallon
- MetricTon
- Ton
- Pound
- Ounce
- Grain
- Pennyweight
- LongTonBritish
- ShortTonUS
- ShortHundredweightUS
- Stone
- Dram
Ordinal
示例:“第 3 个”、“第一个”、“最后一个”
"metadata": {
"offset": "3",
"relativeTo": "Start",
"value": "3"
}
“relativeTo”的可能值:
- 开始
- 结束
温度
示例:“88 华氏度”、“二十三摄氏度”
"metadata": {
"unit": "Fahrenheit",
"value": 88
}
“unit”的可能值:
- 摄氏温度
- Fahrenheit
- Kelvin
- Rankine