林业碳汇计量监测术语(六)
2.5.9
置信区间 confidence interval
指某一数量的真实数值所位于的可信范围。可信程度可以通过概率来表达,其数值与区间的大小相关。它也是一种可以表达不确定性的方式。
实际上,置信区间可被定义为概率值,如 95%,平均值 x 两端的信度限制。在这种情况下,信度限制 L1 和 L2 可以从概率密度函数计算得到,这意味着利用 x 估算某一数量的真实值有 95%机会位于 L1 和 L2 之间。通常 L1 和 L2 分别为 2.5%和 97.5%。
【统计定义】
2.5.10
误差 error
在统计领域里,是指一个量的观测值或计算值与其真实值(但通常未知)之差;特指统计误差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量,它的产生是不可避免的。
【统计定义】
2.5.11
估算 estimation
指计算温室气体排放量的过程。
【清单定义】
是通过量化的观测值确定并依据估算公式或估计量而对变量数值或其不确定性的评估。其结果可以表达为:(1)一种点估算,估算的数值,可以用于对某一参数的近似(例如,根据抽样标准方差估算总体标准方差),或者(2)一种区间估算,它是指估算值在某个区间的可信程度。
【统计定义】
2.5.12
估计量 estimator
是利用抽样数据确定如何计算某一总体参数抽样估计值的公式。例如,排放因子经常估计为一组测量的平均值。对某一总体参数可以有一种以上的估计量,每一个估计量通常有其自己的抽样特性,除其它以外包括一致性和无偏差性。
点估计量的例子包括算术平均值 x,它对期望值(平均值)是通用的估计量,以及抽样方差(s2),它对方差是通用的估计量。
【统计定义】
2.5.13
极值 extreme value
指一次抽样调查中样本的最大和最小数值。极值统计理论是有关对大量采样值来估计这
些极值分布的。
【统计定义】
2.5.14
可能性 likelihood
某个特定结果的发生几率,可采用概率估算。清单报告中是用一套标准术语予以表述:对于不确定性事件发生/产生特定结果的概率或概率区间,如果是>99%,则表述为‘几乎确定’;如果是>90%,则为‘很可能’;如果是>66%,则为‘可能’;如果是 33%至 66%,则为‘或许可能’;如果是<33%,则为‘不可能’;如果是<10%,则为‘很不可能’;如果是<1% ,则为‘几乎不可能’。
2.5.15
均值 mean
指通过抽样方法对总体平均数的估计,其数学期望值是概率分布抽样数值趋向的值。样本均值或算术平均是作为对总体均值的估计量。它是一个无偏的和内在一致的总体均值(期望值)估计量,还是一个有其自身方差值的随机变量。样本均值是所有样本数值之和除以样本单元数。
2.5.16
中值 median
中值或总体中值是一个数值,它将概率密度函数(PDF)积分分成两个部分。对于对称概率密度函数,它相当于均值。中值是第 50 个总体百分点。
样本中值是总体中值的估计值。它是将有序抽样分成两个等量部分的数值。如果有2n + 1 个观测值,中值取为有序抽样第 n + 1 个样的特征值。如果有 2n 个观测值,中值取为第n个样品和第 n + 1 个样品两者的平均值。
2.5.17
元数据 metadata
关于数据的信息;即说明哪些参数和变量存储在数据库中:它们的位置、记录时间、可存取性、代表性、所有者等。
2.5.18
模型 model
统计定义:模型是对某些自然规律特征进行抽象量化,它可以简化或忽略某些特征,以更好地集中在较为重要的要素上。可以通过数学方式把相关影响因子建立一定的关系式,即称之为模型,如生长模型、生长量扩展关系模型等。
2.5.19
变异系数 coefficient of variation
变异系数(νx)是抽样统计估计中,标准方差 σx 与平均值 μx 的比值,即 νx=σx/μx。它还常指样本的变异系数,它是样本标准方差与样本平均值的比值。
【统计定义】
2.5.20
变异性 variability
指由于总体中真实异质性或多样性导致的观测差异。由于试验条件与试验误差的影响,使各次测定或观察值有所不同,测定值的此种性质,称为变异性。变异性可以从内在的随机过程或性质和结果有未知的重大影响的过程中推导得到。变异性通常不能通过进一步测量或研究而减少,但可以通过样本方差等数量来描述其特征。
【统计定义】
2.5.21
精度 precision
根据规定条件对同一对象的某特征值重复观测或对某参数的重复估计彼此之间的接近程度,与不确定性是相反意义,即更精确的事情,则不确定性也较小。
【清单定义】
2.5.22
概率 probability
就某一随机事件而言,是介于 0 和 1 之间的真实数值。有两种方式解释。一种解释是把概率当作相对频率的特征(如占相应某事件所有结果的比例),另一种解释是把概率当作可信程度的指标。
【统计定义】
2.5.23
不确定性 uncertainty
是描述一个与测定结果相关的数值,它描述数值离差的特征,此数值可合理地归因于所测定的量(如样本方差或变异系数)。
【统计定义】
一个普通但不精确的术语,它指因没有确认的源和汇或没有透明性等因素导致不确定性(清单分量)。
【清单定义】
2.5.24
不确定性分析 uncertainty analysis
是对拟合建立的模型的一种精度分析,分析旨在对由模型自身或输入参数的不确定性导致的模型输出值的不确定性提供量化的指标,同时分析各因子的相对重要性。
【统计定义】
2.5.25
敏感性 sensitivity
敏感性是一数量如何响应另一相关数量变化的指标。数量 Y 的敏感性受另一数量 X 变化的影响,可以定义为 Y 的变化除以 X 的变化。
【统计定义】
2.5.26
敏感性分析 sensitivity analysis
指从定量分析的角度研究有关因素发生某种变化对某一个或一组关键指标影响程度的一种不确定分析技术。其实质是通过逐一改变相关变量数值的方法来解释关键指标受这些因素变动影响大小的规律。
【统计定义】
2.5.27
验证 validation
是一种统计学上将数据样本切割成子集的实用方法。在给定的建模样本中,拿出大部分样本子集进行建模型,留小部分样本子集用刚建立的模型进行预报,并求这小部分样本的预报误差。
【统计定义】
验证是建立合理方法和基础的过程。对排放清单而言,验证包括检查以确保清单得以按照报告指导意见和指南完整地汇编。它检查清单内在一致性。合法的使用验证是对某项法案或产品给予官方确认或批准。
【清单定义】
2.5.28
总体 population
指报告、调查等对象的总和。
【统计定义】
2.5.29
样本 sample
指从总体中照一定方法抽取的一组有限观测值的单元。
【统计定义】
2.5.30
简单随机抽样 simple random sample
从某一总体中选择的 n 项样本,这种方法使每一可能的样本都具有被选中的相同概率。 【统计定义】
2.5.31
方差 variance
方差或总体方差是概率密度函数(PDF)的一个参数,它表达总体的变异性。它是随机变量的第二阶中心矩。样本方差可以定义为对离差的变量,等于观测值与观测平均值之差的平方总和除以被观测次数与 1 的差。
【统计定义】
2.5.32
样本均值方差 variance of sample mean
取自总体的抽样均值本身是一个有其特征行为和方差的随机变量。对这些抽样均值,方差的适合估计不是抽样方差,抽样方差估计与单一简单数值相关的变率,但是低值且等于抽样方差被抽样总量去除。
【统计定义】
2.5.33
概率密度函数 probability density function
概率密度函数(PDF)是描述总体概率行为特征的数学函数。它是一个函数 f(x),定义某一连续随机变量 X 选取 x 附近数值时的相对可能性,且定义当 X 取 x 和 x+dx 间数值被dx 去除的概率,其中dx 是一个无限小数。
【统计定义】
2.5.34
概率分布 probability distribution
给出概率的函数,其随机变量取自给定数值,或者属于一组给定的数值。对随机变量所有数值而言,概率等于 1。
【统计定义】
2.5.35
自助重抽法技术 bootstrap technique
是一种需要大量计算的统计方法,一般采用从一套数据中反复重新取样,以评估参数估计的变异性。
2.5.36
自下而上建模 bottom-up modelling
一种建模方法,该方法从详细的小尺度(即样地/林分/生态系统尺度)过程着手,估计较大尺度(区域/国家/洲/全球)的结果。
2.5.37
自上而下建模 top-down modelling
一种建模方法,旨在根据大尺度(区域/国家/洲/全球)的测量值推断较小尺度的过程和参数。
2.5.38
蒙特卡洛方法 monte carol method
蒙特卡洛分析的原则是利用电子计算机反复进行清单计算,每次运算时用不确定的排放因子或模型参数以及用户在初规定的不确定性分布中随机选取的活动数据。排放因子和/或活动数据的不确定性经常很大,并且可能不是正态分布,在此种情况下,用以组合不确定性的传统统计规则变得非常近似。蒙特卡洛分析可以通过产生清单估计的不确定性分布来处理这一情形,它同排放因子、模型参数和活动数据的输入不确定性分布是一致的。
【清单定义】
2.5.39
不确定性传递 propagation of uncertainties
不确定性传递规则确定如何从代数角度将与输入数值相关的不确定性量化同用于清单编制过程中的数学公式结合起来,以便获取输出数值对应的不确定性量化值。
【统计定义】
2.5.40
统计量 statistic
是一个样本随机变量的函数。
【统计定义】
2.5.41
随机误差 random error
随机误差(又称偶然误差)是指测量结果与同一待测量的大量重复测量的平均结果之差。是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差,其产生的原因是分析过程中种种不稳定随机因素的影响。随机误差的大小和正负都不固定,但多次测量就会发现,绝对值相同的正负随机误差出现的概率大致相等,因此它们之间常能互相抵消,所以可以通过增加平行测定的次数取平均值的办法减小随机误差。
2.5.42
随机变量 random variable
在不同的条件下由于偶然因素影响,其可能取各种不同的值,具有不确定性和随机性,但这些取值落在某个范围的概率是一定的,此种变量称为随机变量。随机变量可以是离散型的,也可以是连续型的。
【统计定义】
2.5.43
系统性误差 systematic error
系统误差是通常一个未知量的真值与通过一组无限观测样本均值估计得到的平均观测值的差值。系统误差是分析过程中某些固定的原因引起的一类误差,它具有重复性、单向性、可测性。即在相同的条件下,重复测定时会重复出现,使测定结果系统偏高或系统偏低,其数值大小也有一定的规律。
2.5.44
相对误差 relative error
最大容许误差,它是估计变量数值的一部分。
2.5.45
标准差 standard deviation
总体标准差是方差的正平方根。它由样本标准差所估计,这一标准差即为样本方差的正平方根。
【统计定义】
2.5.46
质量保证 quality assurance
质量保证活动包括一套规划好的评审规则系统,由没有直接涉足清单编制/制定过程的人员进行评审,以 此确保数据质量目标得以实现,它还保证清单代表在目前科学知识水平和数据获取情况下排放和汇的最佳估算,而且支持质量控制(QC)活动的有效性。
【清单定义】
2.5.47
质量控制 quality control
质量控制是一个常规技术活动系统,它在清单编制时测量和控制其质量。质量控制系统主要包括:
(1)提供定期和一致检验来确保数据的内在一致性、正确性和完整性;
(2)确认和解决误差和疏忽问题;
(3)将清单材料保留并存档,同时记录所有质量控制活动。
质量控制活动包括一般方法如对数据采集和计算进行准确性检验,对排放计算、测量、估算不确定性、信息存档和报告使用业已批准的标准化规则。较高级别质量控制活动包括对源类别、活动和排放因子数据及方法的技术评审。
【清单定义】
2.5.48
时间序列 time series
受随机过程影响且在连续时间点(通常是等距的)观测的数值序列。
【统计定义】
