主观概率和先验分布(doc 4页)
主观概率和先验分布内容提要:
(一) 基本属性:
O:系统的固有的客观性质,在相同条件下重复试验时频经的极限
S:概率是观察者而非系统的性质,是观察者对对系统处于某状态的信任程度
(二)抛硬币:正面向上概率为1/2
O:只要硬币均匀,抛法类似,次数足够多,正面向上的概率就是1/2,这是简单的
定义。
S:这确是定义,DMer认为硬币是均匀的,正、反面出现的可能性(似然率)相同,1
/2是个主观的量。
(三)下次抛硬币出现正面的概率是1/2
O:这种说法不对,不重复试验就谈不上概率
S:对DMer来说,下次出现正、反是等可能的。但是他不是说硬币本身是公正的,它可能会有偏差,就他现有知识而言,没有理由预言一面出现的可能会大于另一面,但多次抛掷的观察结果可以改变他的信念。
O、S:下次抛硬币出现正面还是反面不能确定,但知道:
要么是正面,要么是反面。
§2-2 先验分布(Prior distribution)及其设定
在决策分析中,尚未通过试验收集状态信息时所具有的信息叫先验信息,由先验信息所确定的概率分布叫先验分布。
设定先验分布是Bayesean分析的需要.
一、设定先验分布时的几点假设
1.连通性(Connectivity),又称可比性
即事件A和B发生的似然性likelihood是可以比较的:
A>L B或A L B或B>L A 必有一种也仅有一种成立.
** A>L B读作 A 发生的似然性大于B 发生的似然性,
A L B 读作 A 发生的似然性与B 发生的似然性相当。
3.区间对分法
•适用范围:可以是开区间
•步骤:①求中位
②确定上、下四分位点(quartile fractile)
③由于误差积累,最多确定八分位点(Eighth fractile)
例:产品销售量(预计明年)
•缺点:精度差
4.与给定形式的分布函数相匹配
这是最常用,且常常被滥用的方法
•步骤:①选择一个与先验信息匹配得最好的函数
如正态,泊松,β,e-Cauchy分布等
例:a)在单位时间以恒常的平均比率入出现,则在T单位长度时间内该事件出现的次数服从Poisson分布
2-4
b)若影响某一随机变量的因素很多而每一因素的作用均不显著,则该变量服从正态分布。例如,测量误差,弹落点,人的生理特征的度量,农作物产量等均服从正态分布。
c)事件A出现的概率为P,n次独立试验出现r次A的概率b(p,r,n)= . 即服从二项分布。
②参数估计:
A.矩法:N(μ,σ) Be(α,β)
•缺点:尾部估计不准,但对矩的影响却很大
B.分位数:利用几个分位点和现成的概率密度
函数分位数表,估计参数并检验。
5. 概率盘法(dart)
用园盘中的扇形区表示抽奖事件, 透用于西方管理人员
•注意:状态的概率或概率分布不是也不应富由决策分析人员来设定,而应当由决策人和有关问题专家提供基本信息。
理由:
§2-3 无信息先验分布
一、为什么要研究无信息先验
•Bayesean法需要有先验分布,贝叶斯法的简明性使人在无信息时也想用它。
二、如何设定无信息先验分布
1.位置参数
随机变量X的概率密度函数形如f(x-θ)时θ∈ 称为位置参数
其无信息先验 π(θ)必为一常数
2.标度参数
X的密度函数为1/σf(x/σ)σ>称为标度密度σ称为标度参数
其无信息先验π(σ)=1/σ
§2.4 利用过去的数据设定先验分布
一、有θ的统计数据
为能获得θ的观察值θi i=1,…,n的数据,则可:
①通过直方图勾划出先验分布
②选取可能的函数形式作为先验分布,再定参数
③求频率(离散RV)
二、状态θ不能直接观察时
若直接观察的只是与 有关的 (通常都是如此)则要从 中获取 的先验信息很困难: 的分布是随边缘分布m(.)而定的:
m(x)= 或m(x)=
X、Θ的联合密度是h(x,θ)=f(x|θ)μ(θ)
由 估计m(x)不难,但即使f(x|θ)已知,由此估计μ(θ)就难得多。
..............................