给定一个离散随机变量怎么得到先验概率分布

苹果/安卓/wp
积分 17328, 距离下一级还需 972 积分
权限: 自定义头衔, 签名中使用图片, 隐身, 设置帖子权限, 设置回复可见, 签名中使用代码
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡, 千斤顶, 变色卡下一级可获得
道具: 置顶卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
TA的文库&&
苦逼签到天数: 8 天连续签到: 1 天[LV.3]偶尔看看II
先验概率Prior probability
在贝叶斯统计中,先验概率分布,即关于某个变量 p 的概率分布,是在获得某些信息或者依据前,对 p 的不确定性进行猜测。例如, p 可以是抢火车票开始时,抢到某一车次的概率。这是对不确定性(而不是随机性)赋予一个量化的数值的表征,这个量化数值可以是一个参数,或者是一个潜在的变量。
先验概率仅仅依赖于主观上的经验估计,也就是事先根据已有的知识的推断,
在应用贝叶斯理论时,通常将先验概率乘以似然函数(likelihoodfunction)再归一化后,得到后验概率分布,后验概率分布即在已知给定的数据后,对不确定性的条件分布。
似然函数(likelihood function),也称作似然,是一个关于统计模型参数的函数。也就是这个函数中自变量是统计模型的参数。对于结果 x ,在参数集合 θ 上的似然,就是在给定这些参数值的基础上,观察到的结果的概率 L(θ|x)=P(x|θ) 。也就是说,似然是关于参数的函数,在参数给定的条件下,对于观察到的 x 的值的条件分布。
似然函数在统计推测中发挥重要的作用,因为它是关于统计参数的函数,所以可以用来评估一组统计的参数,也就是说在一组统计方案的参数中,可以用似然函数做筛选。在非正式的语境下,“似然”会和“概率”混着用;但是严格区分的话,在统计上,二者是有不同。
不同就在于,观察值 x 与参数 θ 的不同的角色。概率是用于描述一个函数,这个函数是在给定参数值的情况下的关于观察值的函数。例如,已知一个硬币是均匀的(在抛落中,正反面的概率相等),那连续10次正面朝上的概率是多少?这是个概率。
而似然是用于在给定一个观察值时,关于用于描述参数的情况。例如,如果一个硬币在10次抛落中正面均朝上,那硬币是均匀的(在抛落中,正反面的概率相等)概率是多少?这里用了概率这个词,但是实质上是“可能性”,也就是似然了。
后验概率Posterior probability
后验概率是关于随机事件或者不确定性断言的条件概率,是在相关证据或者背景给定并纳入考虑之后的条件概率。后验概率分布就是未知量作为随机变量的概率分布,并且是在基于实验或者调查所获得的信息上的条件分布。“后验”在这里意思是,考虑相关事件已经被检视并且能够得到一些信息。
后验概率是关于参数 θ 在给定的证据信息 X 下的概率: p(θ|x) 。
若对比后验概率和似然函数,似然函数是在给定参数下的证据信息 X 的概率分布: p(x|θ) 。
二者有如下关系:
我们用 p(θ) 表示概率分布函数,用 p(x|θ) 表示观测值 x 的似然函数。后验概率定义如下:p(θ|x)=p(x|θ)p(θ)p(x)
鉴于分母不变,可以表达成如下正比关系:Posteriorprobability∝Likelihood×Prior probability
来先举一个例子:如果有一所学校,有60%是男生和40%是女生。女生穿裤子与裙子的数量相同;所有男生穿裤子。一个观察者,随机从远处看到一名学生,观察者只能看到该学生穿裤子。那么该学生是女生的概率是多少?这里题目中观察者比如近似眼看直接不清性别,或者从装扮上看不出。答案可以用贝叶斯定理来算。用事件 G 表示观察到的学生是女生,用事件 T 表示观察到的学生穿裤子。于是,现在要计算 P(G|T) ,我们需要知道:P(G) ,表示一个学生是女生的概率,这是在没有任何其他信息下的概率。这也就是我们说的先验概率。由于观察者随机看到一名学生,意味着所有的学生都可能被看到,女生在全体学生中的占比是 40 ,所以概率是 0.4 。P(B) ,是学生不是女生的概率,也就是学生是男生的概率,也就是在没有其他任何信息的情况下,学生是男生的先验概率。 B 事件是 G 事件的互补的事件,这个比例是 60 ,也即 0.6 。P(T|G) 是在女生中穿裤子的概率,根据题目描述,是相同的 0.5 。这也是 T 事件的概率,given G 事件。P(T|B) 是在男生中穿裤子的概率,这个值是1。P(T) 是学生穿裤子的概率,即任意选一个学生,在没有其他信息的情况下,TA穿裤子的概率。如果要计算的话,那可以计算出所有穿裤子的学生的数量,除以总数,总数可以假设为常数 C ,但是最后会被约去。或者根据全概率公式 P(T)=P(T|G)P(G)+P(T|B)P(B) 计算得到 P(T)=0.5×0.4+1×0.6=0.8 。基于以上所有信息,如果观察到一个穿裤子的学生,并且是女生的概率是P(G|T)=P(T|G)P(G)P(T)=0.5×0.40.8=0.25.
这就是贝叶斯公式的一个示例,如果是两个相关的属性,我们只知道其中一些的概率分布情况,就可以根据贝叶斯公式来计算其他的一些后验概率的情况。
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
本帖被以下文库推荐
& |主题: 150, 订阅: 170
楼主说的很详细 我现在刚接触贝叶斯估计 大概了解一些 不过在实证操作中遇到一些问题 想请教一下:我在一篇文献中看到“前向滤波后向抽样”的Gibbs方法,使用卡尔曼滤波得到Gibbs抽样的先验信息,我使用Eviews进行卡尔曼滤波后,这个先验信息是如何确定(或者说怎么得到)的呢?
还望不吝赐教 万分感谢!
谢谢分享!!!!!!
纠正一下:p(θ|x)=p(x|θ)p(θ)/p(x)
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师我的理解:
先验概率:对某个随机变量y的概率的预先估计,如果是离散型随机变量就是预先估计的它的概率分布,若是连续型随机变量则是预先估计的它的概率密度函数。
常见的离散型随机变量概率分布有:伯努利分布,多项式分布。
常见的连续型随机变量概率密度函数有:正态分布函数,泊松分布函数,伽马分布函数。
后验概率:当我们观察到了数据x之后,然后得到的随机变量y的概率的估计。
举个例子:
抛掷一枚硬币,用随机变量y=1表示其正面朝上,y=0表示其反面朝上。
然后我们通过多次抛掷硬币的实验来估计y的概率分布。
在抛掷硬币之前,我们可以对y的概率分布做一个估计
那么这就是随机变量y的先验分布。
100次抛掷硬币的实验中,结果出现了80次正面朝上,20次反面朝上(可能由于银币不均匀导致正面朝上机率大)。
设抛掷实验产生的数据为x,
那么基于数据x,我们有新的关于随机变量y的概率分布估计:
这就是随机变量y的后验分布。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:13585次
排名:千里之外
原创:76篇
转载:28篇
(1)(4)(12)(20)(13)(19)(14)(2)(3)(1)(4)(1)(1)(2)(1)(3)(1)(3)(3)(1)第二章离散信源及其信息测度(1)_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
第二章离散信源及其信息测度(1)
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩24页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢}

我要回帖

更多关于 先验概率分布 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信