原文链接:
原文出处:拓端数据部落公众号
指数分布是泊松过程中事件之间时间的概率分布,因此它用于预测到下一个事件的等待时间,例如,您需要在公共汽车站等待的时间,直到下一班车到了 。
在本文中,我们将使用指数分布,假设它的参数 λ ,即事件之间的平均时间,在某个时间点 k 发生了变化,即:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q93131Q-0.png)
文章插图
我们的主要目标是使用 Gibbs 采样器在给定来自该分布的 n 个观测样本的情况下估计参数 λ、α 和 k 。
吉布斯Gibbs 采样器
Gibbs 采样器是 Metropolis-Hastings 采样器的一个特例,通常在目标是多元分布时使用 。使用这种方法,链是通过从目标分布的边缘分布中采样生成的,因此每个候选点都被接受 。
Gibbs 采样器生成马尔可夫链如下:
让 是 Rd 中的随机向量,在时间 t=0 初始化 X(0) 。
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q931BS-1.png)
文章插图
对于每次迭代 t=1,2,3,...重复:
设置 x1=X1(t-1) 。
对于每个 j=1,...,d:
生成 X?j(t) 从 ,其中 是给定 X(-j) 的 Xj的单变量条件密度 。
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9312C9-2.png)
文章插图
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9314R8-3.png)
文章插图
更新 .
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q93135F-4.png)
文章插图
当每个候选点都被接受时,设置 .
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q93162B-5.png)
文章插图
增加 t 。
贝叶斯公式
变点问题的一个简单公式假设 f和 g 已知密度:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9311421-6.png)
文章插图
其中 k 未知且 k=1,2,...,n 。让 Yi为公交车到达公交车站之间经过的时间(以分钟为单位) 。假设变化点发生在第 k分钟,即:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9313940-7.png)
文章插图
当 Y=(Y1,Y2,...,Yn) 时,似然 L(Y|k)由下式给出:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q931H14-8.png)
文章插图
假设具有独立先验的贝叶斯模型由下式给出:
【R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程】
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9316452-9.png)
文章插图
数据和参数的联合分布为:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q931H41-10.png)
文章插图
其中,
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q931DO-11.png)
文章插图
正如我之前提到的,Gibbs 采样器的实现需要从目标分布的边缘分布中采样,因此我们需要找到 λ、α 和 k 的完整条件分布 。你怎么能这样做?简单来说,您必须从上面介绍的连接分布中选择仅依赖于感兴趣参数的项并忽略其余项 。
λ 的完整条件分布由下式给出:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9315445-12.png)
文章插图
α 的完整条件分布由下式给出:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q931BE-13.png)
文章插图
k 的完整条件分布由下式给出:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q93152I-14.png)
文章插图
计算方法
在这里,您将学习如何使用使用 R 的 Gibbs 采样器来估计参数 λ、α 和 k 。
数据
首先,我们从具有变化点的下一个指数分布生成数据:
![R语言贝叶斯Metropolis-Hastings Gibbs采样器估计变点指数分布分析泊松过程](http://img.liaoninglong.com/220805/0Q9315H9-15.png)
文章插图
set.seed(98712)
y - c(rexp(25, rate = 2), rexp(35, rate = 10))
以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!
「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助:- 两家免税店将于秋季在俄罗斯开业,服务对象仅限于外交官及其家属
- 特斯拉“酒驾”车祸 车主称坐副驾车子自己开的:官方公布结果
- 俄罗斯奥运梦碎?唯一参赛的王牌项目领跑预选赛 国际奥委会没辙
- 俄乌动态:俄称共摧毁6套“海马斯”;加拿大宣布扩大对俄制裁;美国“拱火”不停,俄专家称美方明显想让局势升级
- 普罗米修斯的故事?
- 全球首穿高定、戴百万珠宝,曾经土气的她终于飞升了 | 郑尔摩斯周报
- 亚特兰蒂斯的秘密,是什么?
- 泽连斯基硬的不行来软的:呼吁顿涅茨克民众撤离
- 俄罗斯美女排行
- 内部人士:勒布朗·詹姆斯将想与儿子在同一支球队打球