如何在ruby和python哪个强大中实现这五类强大的概率分布

点击联系发帖人 时间：2016-10-01 10:12

python强大之处

matplotlib+概率分布_壮志凌云
matplotlib+概率分布
matplotlib+概率分布&相关问答
有正整数1~10，出现的概率分布给定，如何利用MATLAB按照各数字出现的概率输出一个数字？
@Falccm已经给出了MATLAB的几种解决方案，这里再给出类似的Python实现。从最简单的构造样本出发，给出一个具有特定概率分布的样本，然后从中随机抽样。Python的numpy模块具有构造重复数组元素的函数repeat，与Matlab中的repelem函数对应。具体实现如下：importnumpyasnpimportmatplotlib.pyplotaspltsample_list=np.repeat(range(1,11),[25,20,15,15,10,5,3,3,2,2])sample_result=sample_list[np.random.randint(0,100,int(1e6))]#------------&&&以下为可视化部分，可以忽略&&&-------------plt.style.use("ggplot")ax=plt.subplot(111)ax.hist(sample_result,bins=10,normed=True,color='r',alpha=.75)ax.set_title("Thehistogramofsamplingresultswithaspecifiedprobabilitydistribution",fontname='Arial',fontweight='bold',fontsize=16)ax.set_xticklabels(ax.get_xticks(),fontname='Arial',fontsize=12)ax.set_yticklabels(ax.get_yticks(),fontname='Arial',fontsize=12)plt.show()对应于Matlab的randsrc按照指定概率抽样也是可以实现的，numpy（1.7.0版本以后）中的choice函数实现类似的功能：sample_list=np.arange(1,11)prob=0.01*np.array([25,20,15,15,10,5,3,3,2,2])sample_result=np.random.choice(sample_list,int(1e6),p=prob)
正态分布可以生成均匀分布吗?
怒答一记。这个题目非常有趣，如果你有一定的概率和编程背景其实非常容易。也潜在的考察了面试者对一些基本数值技巧的积累。一个更常见的问题是，如果你有一个均匀分布的随机数生成器，如何产生正态（@王芊你的答案出卖了你，这不是正太分布。。）分布的变量？通常来说我们一般的程序都能更直接地生成均匀分布的随机变量，而不是想本题所述。一种业界广泛使用的做法叫Box-Muller-Wiener算法。首先生成一对[0,1]上的均匀分布的，独立的随机变量A和B。然后用A*2pi作为角度，sqrt(-2*log(B))作为半径，得到极坐标下的一个点。这个点的两个坐标（X,Y）就是一个二维的标准正态分布。那么回到本题，如何利用正态分布的两个变量X,Y生成均匀分布的随机变量？现有的答案们提到了其中一种做法，即计算点（X,Y）在二维平面内与x轴（或任意其他固定方向）的夹角——这样我们就得到了前述过程中的随机变量A*2pi。其实另一种方式是计算exp(-0.5*(X^2+Y^2))——这样我们就得到了前述过程中的随机变量B。某种意义上来说，后者更为稳定，因为不涉及除法运算（例如arctan(Y/X)），可以以很大概率避免overflow等等问题。值得注意的是，点(X,Y)到原点距离的平方X^2+Y^2是服从卡方分布的随机变量。当变量数为2的时候，这是一个参数为2的指数分布。对于指数分布的随机变量来说，其累积密度函数有解析的表达式，可以直接通过均匀分布来生成。同样的办法对一维正态分布则只能近似数值处理。
如何系统地学习Python中matplotlib,numpy,scipy,pandas？
1、Python做数据挖掘很强大，最近几年很火的机器学习以及较为前沿的自然语言处理也会选用Python作为基础工具。下面是我之前写的一点Python数分挖掘的简单案例，代码均有，可以看下：你用Python做过什么有趣的数据挖掘/分析项目？-据数的回答写的简单且乱，轻拍！2、楼主提到Python作图，提到了matplotlib库。其实楼主可以试一下seaborn，简单易上手而且结果美观：SeabornMatplotlib是Python主要的绘图库。但是，我不建议你直接使用它，原因与开始不推荐你使用NumPy是一样的。虽然Matplotlib很强大，它本身就很复杂，你的图经过大量的调整才能变精致。因此，作为替代，我推荐你一开始使用Seaborn。Seaborn本质上使用Matplotlib作为核心库（就像Pandas对NumPy一样）。我将简短地描述下seaborn的优点。具体来说，它可以：默认情况下就能创建赏心悦目的图表。（只有一点，默认不是jetcolormap）创建具有统计意义的图能理解pandas的DataFrame类型，所以它们一起可以很好地工作。上述引用来源：Python和数据科学的起步指南一两行代码就可以做出类似下面的图：详细学习资料可查看：Seaborn:statisticaldatavisualizationhttps://pypi.python.org/pypi/seaborn/3、本科能否从事数据挖掘这个就难说了。如果楼主聪明好学，数学+统计基础不错，而且有一定编程能力，再加上上学期间找一些相关的数据挖掘实习练习一些项目，这样很大概率是可以的！或者楼主虽是本科，但是有较好的学校专业背景，那也是可以的！其它情况不敢保证！以上！仅供参考！
正态分布变量的累加和为什么通常都能呈现出明显的趋势性特征，随机漫步理论是否真的有道理？
随便答的东西，赞多了就要严格修正一些东西：1.所谓的“华尔街的随机漫步”（就是指代金融数学，勉强算黑猫的专业了），其实是面向卖方的，目的是提高议价权和研究如何少承担，甚至不承担风险的。跟投资，策略这些没有太大的关系。2.我并非完全否定广义的趋势，我其实只是否定单纯一阶价信息的趋势（毛躁，无序，鞅性强）。高阶信息自带鲁棒性但是那个不能算一种“趋势”，同时一些看上去量价实际上不是量价懂东西比如动量也不能算趋势，那种算投资行为的行为金融研究。他讲的不是涨就一直涨，而是“人们认为一段时间表现的比别人好的，一段时间内会一直比别人好”。这个是动量在行为金融里本来的定义，重点不在趋势，而是在我标黑的两个地方。3.大家对fama的有效市场假说都有一定程度的误解。都说fama提出有效市场假说，严格上他的工作不仅是提出“市场是有效的”，而是发现无效并修正至有效的方法,也就是检验anomly。这些anomly可以是量价上的，可以是基本面的，也可以是行为金融的。只要一个anomly被发现，就可以说市场无效，如果这个anomly被解释了，对于接受并验证解释的人，市场就“重新变回”有效。所以可以说，有效不有效这事，不同人之间是绝对存在断层的。所以，对于有效二字正确的逻辑是：我们找到验证无效的方法，让他在我们眼里变得有效。BTW，anomly研究里除了fama还有一个boss级人物就是俄亥俄大学的张橹教授，他对anomly的研究为他在fed定价委员会里获得了一席之地，有说13年的fama5中投资效应因子的证实也有张橹的功劳。4.为什么坚持不提“趋势“”预测“这些东西，是因为传统意义上这俩直接挂钩的都是直接价格信息。而我们寻找的东西，多半不在价格本身上寻找的（虽然会借助价格，但是找的面目全非）。比如，fama找的叫”差异性“，统计派找的叫“高阶鲁棒信息（不会因为一两个参数的变化而改变太大的信息）”，有些机器学习流派找的叫“模式”，市场风险管理找的叫“动态波动率”。他们多半与价格已经相去甚远，甚至有些信息已经极其难以解释（比如一些ML方法出的信号）。当然，解释性是另一个弊端，@郭小贤在他的回答里讲了很多，我这个外行就不予复述。5.关于传统“技术分析”的出路，这里指的是狭义对价格序列的唯现象论。在过去信息简单，人们有固有交易习惯地时候，早期现象可能具有科学解释（比如单据积压形成所谓“阻力位”，资金滞后于信息形成所谓“背离”）。从归纳现象上升到逻辑演绎需要一些系统科学的做法，研究人行为的东西也形成了一些可证伪的体系，比较有名的有两个：行为金融学和微观市场结构。这两个学科都是从投资者行为出发而研究现象的，与之相比剥离了基层信息而仅在价格上大做文章，唯现象的传统“技术分析”说是玄学不为过分。原文：恭喜你几乎彻底摆脱深渊了，但是还没有完全摆脱。先贴个答案你看看吧股票价格真的能预测吗？-黑猫Q形态的回答首先，你模拟的是标准的正太增量随机过程（有公式的：，cumsum都不用），也就是布朗运动。而布朗运动因为具有鞅性（可以简单理解为期望不变性），所以你“看起来”的“反弹”图像几乎必然出来的（任意区间均值不变）。然后正态2以上quantile概率就非常小了，所以你“看起来”图非常连续，因为抽中断崖的几率本身就不高。同时，布朗运动的马尔可夫性保证了他的下一步的概率只跟上一步的概率有关，所以“看着”很连贯。越到后面越难回来的原因就像上面子元说的，渐近性。然后模拟“反弹”的过程显然用OU过程显然比布朗运动更好。你如果跑的是布朗，那么大家的“运气”其实都一样，所以你才“看着像”。上面都是布朗运动的数学性质，让你“看起来”这样的。其次，布朗运动二阶矩以上的信息几乎是“平凡”的，啥意思，就是这个分布十分的“工整“，他的高维信息没有任何”特殊”的地方。而实际上，非布朗运动对高阶矩的测量可以发现更多特殊的信息。（比如偏度和肥尾），对比起来一阶信息（甚至还是不带差分那种）可以说是最没有用的。而高阶矩你是绝对“看”不出来的，因此没有什么“趋势”这一说。更别说万一高阶信息本身也是随机的（分布一直在变，导致矩母函数都在变，而不是分布的某个参数在变），根本不可能被你“看”出来了。别扯什么“规律”啊”反弹“啊”趋势“啊这些玄学了，如果你不想追求量价信息以外的东西，就赶紧转战统计学派远离技术分析吧。挑有利的游戏比“预测”本身要重要的多，我也言尽于此了。
把格子纸里的格子随机染黑白两色，平均每片色斑有多少格子？
有很多人说看不懂，还有人说题目也看不懂，这让我很受挫啊。。。。我再来把题目说一下。在一个无限大的格子纸上对格子染色。每个格子有的概率被染成黑色。那么问当时，被染色块（cluster）的平均大小是多少。就上图来说，取这个无限大格子纸的一部分，一共有5个cluster，分别是大小为8的1块大小为6的1块大小为3的1块大小为1的2块那么求平均的结果是。当然，因为只是取一小块，所以会有涨落（偶然成分）。这个问题很简单，在码农遍地的知乎，随便写个程序模拟一下这个过程，得到平均大小在是7.6左右是很容易的事情。但问题是，为什么可以做模拟，为什么题目中说无穷大的格子纸，我们拿有限的大小的去模拟是可以得到结果的。这点在其他很多问题上是显然，比如用求和去算积分。但这个上，答案是否定的，题目是运气非常好的说黑白是等概率的。如果有2/3的概率染黑，问黑块的大小。再这样做模拟根本是不对的。因为这时候，最大的那个黑块已经可以和整个空间相比拟（如下图中深蓝色的基团）。这是我们从无限大的格子纸中取的一块，这一块是这个样子了，那个这一块旁边的情况估计和这一块差不多，也会有一个超大的基团。而这两个超大的黑块显然是相连的，实际上是一个更大的黑块。所以这时候最大的那个黑块的大小趋向无穷，而黑块平均的大小也趋向无穷。这时你用一个有限大小的格子纸是模拟不出无穷大情况的。==========原答案==========这个问题是一个经典的统计模型，叫做逾渗（/en/Percolation）模型几乎就是题主描述的（题主好聪明啊）。区别是只讨论一种颜色，比如每个格点有的概率放黑色。当然，这是经典模型，所以现在肯定是被讨论的比较充分了，背景空间，也就是格子纸，不一定是格子纸，也可能格子“块”，三角格子纸等等。这个模型关注的是，随着的变化，什么时候出现一块“超大”的黑色块（更准确的说是出现超大黑色块的概率）。这块连通的黑色有多大呢，无穷大。这个值记为，以及在附近系统的行为。出现超大黑色块的概率随着的变化而变化这个过程实际上是一种二级相变。逾渗模型是一种典型的几何相变（这里没有什么热力学量）。那么针对题主的问题，这里的（/en/Percolation_threshold）当过了这个临界点，就出现连通全空间的超大黑块，这时候平均连通块的大小就会变成无穷（因为空间也是无穷大的）。但比较好，题主的例子里，还没有到达这个临界值。这就说明每一个黑块的大小都是有限的，所以你取多大的格子纸来算这个meanclustersize问题都不大。结果大概是7.6左右。再上一张图，让我们更好的理解这个过程。这里的表示的是一个的格子纸，横轴是格点染黑的概率，纵轴是平均黑块大小（meanclustersize）。怎么看这张图呢，当时，meanclustersize与是没有关系的。但当过了这个临界值，会出现覆盖全空间的黑块，这时候覆盖全空间黑块的尺寸显然和有关了，当时，meanclustersize也趋于无穷。这个问题一般人就不要试图去寻找解析解了，因为即使是用重整化群算，也是不准确的。要是做出了meanclustersize的解析表达式，基本也是一个大新闻了。========7.30更新=========一觉起来这么多赞（请原谅我没见过世面2333），就再来说两句。对于一个系统,最显然的理解就是一些对象之间存在某种联系,把这些对象放在一起作为一个更大的对象进行考虑。而逾渗模型就是对这个过程最直接的一种抽象。相互依赖系统的结构相变、鲁棒性、社团结构划分等等实际问题也与之紧密相连。再说一下计算。程序中用到了一步取余。这是为了去掉边界效应对模拟的影响，简单的理解就是没有边界了，或者说有一个周期性边界。如下图所示（这里每次添的是边，而不是点，不过这两个模型基本是一样的。）注意这个方法并不是用有限来模拟无限，因为整个系统还是有限的。举个极端的情况，如果系统本来的大小是，也可以用这样的方法卷起来，但显然是模拟不出7.6这个结果的。所以@杜昊的回答中说可以通过周期性来模拟无限大系统是不太准确的。另外对于题主的问题，meanclustersize的量级在10，所以一般随便给个尺度，比如就足够了。但当接近，上面说meanclustersize会趋于无穷，但图中的曲线显然是连续的。这个当然是好理解的，格子纸是有限的，当然不会出现无穷。这被称为有限尺寸效应。为什么说这个呢，因为很多附近的相变行为就可以研究不同尺寸下物理的不同表现来研究。很简单的理解就是这里的超大黑块的尺寸能和空间尺寸相比拟，就可以研究超大黑块关于的行为来知道系统的一些行为。这种方法叫做有限尺寸标度。importitertoolsimportrandomimportnumpyasnpimportmatplotlib.pylabaspltdefsimulate(l=100,p=0.5):nodes={}fori,jinitertools.product(range(l),range(l)):nodes[(i,j)]=[(i,j),0]deffind_father(node):ifnotnodes[node][0]==node:nodes[node]=find_father(nodes[node][0])returnnodes[node]defadd_to(set_a,set_b):f_set_a=find_father(set_a)f_set_b=find_father(set_b)ifnotf_set_a==f_set_b:f_set_a[1]+=f_set_b[1]f_set_b[0]=f_set_a[0]fori,jinitertools.product(range(l),range(l)):ifrandom.random()&=p:nodes[(i,j)][1]=1fordi,djin[(0,1),(0,-1),(1,0),(-1,0)]:ifnodes[((i+di)%l,(j+dj)%l)][1]&0:add_to(((i+di)%l,(j+dj)%l),(i,j))returnnp.mean([v[1]forn,vinnodes.items()ifn==v[0]andv[1]&0])#print(simulate())forl,timesin[(10,1000),(20,400),(100,30)]:print(l)p_all=np.arange(0.4,0.8,0.01)mean_size=[]forpinp_all:print(p)mean_size.append(np.mean([simulate(l,p)for_inrange(times)]))plt.plot(p_all,mean_size,label='n=%d'%l)plt.xlabel('p')plt.ylabel('meanclustersize')plt.legend()plt.show()
炉石竞技场均七胜，求胜率（这是个严肃的数学问题）？
本人数学差的，会码点代码，用python模拟了下概率分布图。假设+要素：1，每盘取胜概率一样2，当输连续三盘，游戏结束3，当玩完12盘，游戏结束4，模拟100000次游戏5，以下为，玩家单盘胜率，从0.1，0.2，0.3到1，的10000次游戏胜盘分布图6，以下横轴为胜盘数，纵轴为100000次游戏中，获得该胜盘数的次数7，最后一张图为95%概率，一次游戏中获胜盘不低于该y轴盘数。要获得“永动机成就”，既不低于7盘的概率，对应x轴玩家胜率大约要高于82%8，talkischeap,showmethecode,代码在最后面9，程序无优化，无仔细验证过，可能存在逻辑错误。玩家胜率为0.1，平均数为0.36975盘玩家胜率为0.2，平均数为0.94437盘玩家胜率为0.3，平均数为1.782盘玩家胜率为0.4，平均数为2.94847盘玩家胜率为0.5，平均数为4.4116盘玩家胜率为0.6，平均数为6.04975盘玩家胜率为0.7，平均数为7.77181盘玩家胜率为0.8，平均数为9.35842盘玩家胜率为0.9，平均数为10.75879盘玩家胜率为1，平均数自己瞧纵轴为胜盘数，横轴为玩家胜率。当要保证95%的概率，每次玩12盘游戏可以获得7盘胜，既’炉石永动机‘，大概要保证胜率在82%。代码：importrandomimportpandasaspdimportmatplotlib.pyplotaspltimportstatisticsdefone_game(p):w,f,g=0,0,0whileTrue:win_fail_p=random.uniform(0,1)ifwin_fail_p&p:#wing=g+1w=w+1f=0ifwin_fail_p&p:#failg=g+1f=f+1ifg==12orf==3:breakreturnwdeflot_game(p,number):a=[]forxinrange(0,number):a.append(one_game(p))c=statistics.mean(a)b=[]b.append(a.count(0))b.append(a.count(1))b.append(a.count(2))b.append(a.count(3))b.append(a.count(4))b.append(a.count(5))b.append(a.count(6))b.append(a.count(7))b.append(a.count(8))b.append(a.count(9))b.append(a.count(10))b.append(a.count(11))b.append(a.count(12))#计算0.05值处p_5_value=0p_5_value_amount=0forxinrange(0,12):p_5_value=p_5_value+b[x]ifp_5_value&number*0.05:p_5_value_amount=xbreakreturnb,c,p_5_value_amount#计算概率分布b=lot_game(1,]plt.style.use('ggplot')ind=np.arange(len(b))plt.bar(ind,b)plt.show()#计算5%概率处n=[]forxinrange(1,100):print(x)n.append(lot_game(x/100,])m=pd.DataFrame(columns=['value','p'])m['value']=nm['p']=range(1,100)m['p']=m['p']/100plt.style.use('ggplot')ind=m.pplt.bar(ind,m['value'])plt.show()
如果一个女生说，她集齐了十二个星座的前男友，我们应该如何估计她前男友的数量？
更新：这问题是我今天百无聊赖的时候胡乱翻到的一个朋友的提问所以就随手胡乱写了个答案没想到一下子这么多人来回答。。。我之前的计算是错误的，正确计算P(集齐十二星座男友|x)有点麻烦，更好的办法见wikipedia（Couponcollector'sproblem）。哎哎哎一下子就暴露学渣本质了。。。。大家权当我抛砖引玉吧见到没人来回答，我来暖个场。。用Bayesian，总体上大约是个求最大似然值的问题吧P(x|集齐十二星座男友)=P(集齐十二星座男友|x)P(x)/P(集齐十二星座男友)其中P(集齐十二星座男友|x)＝1-(C(1,12)*11^x-C(2,12)*10^x+……+C(11,12)*1^x)/12^x（感谢@冯白羽）而P(x)是个priorprobability，即总体上来说对于女生来说前男友数量的概率分布是什么样的。因为手头并没有这个分布，我只能拍脑门的觉得或许用为3的Poissondistribution比较合理因为很多人都自称有过3段感情经历（？），于是于是有P(x|集齐十二星座男友)～懒得算了。。。数值模拟吧最大似然估计得到最大概率在（精确的不太好酸，就按照别人说的是30多吧）所以一个自称“十二星座男友都齐了”的女生，估计着有30几个前男友。。。我真是蛋疼。。。
股票、期货、外汇交易赚钱的根本路径是什么？
搞股票期货外汇交易是有必胜绝学的，而且不是非常难，只要肯努力，圣杯人手一个不是梦，在家躺着就赚好多钱，迎娶白富美走上人生巅峰，请跟着念：我也行师父我好想学，教我~~！别急，学费不是699，不是599，只要0元，只要0元马上下拉订购吧！心意不够，再来点不容易，拉这么久。为师感动了，念你一片至诚，就将交易绝学传授与你。先去开个外汇账户汇点钱开搞，oanda一块钱就能炒了，ib得一万美元自己掂量，警告不要去其他家开账户骗子多傻子更多你就别参合了。为什么炒外汇不炒股票期货？因为股票期货赔不赚钱没外汇快呀傻孩子！开始手工交易，然后...没错，你爆仓了，你把钱亏光了。如果没亏光请继续交易，相信我你一定会亏光的。亏不光你打我进下一步，开始学习，学啥？别学什么线什么图什么盘什么分析，这个技术圈完全就是骗子天堂，低级的骗自己高级的骗别人。先上数学：概率是核心，统计，线代，高数微积分最优化啥的都满上，学习资源自己找去啥，你学不会？你高小毕业？你不是学不会，你是怀疑为师的水平，你是觉得花如此大代价和精力去学这个不值得。学会一门给一百万，学的会不？高小？幼儿园大班毕业都包你搞定信不。师父我都学会了，然后呢，上编程，python,基础语法，numpy,pandas,matplotlib,scipy还有其他统计、科学计算和机器学习类包都满上，分类聚类等算法，数据挖掘理论和实操，就是干学不会的处理方法同上。师父我都学会了，然后呢？下载过去十五年的外汇历史分钟数据，用脑子思考交易系统，用数学建模，用编程实现。各种回测，各种调整，把那些传统交易高手十几年积累的经验，几分钟跑完，从家乡去首都，低手用走的，高手用飞的，你用星际穿越的这不一穿十五年么，哪里亏损改哪里，soeasy!妈妈再也不用担心我的系统不稳健啦。苦练内功，猛干系统回测，不行就改，改了再测，测了又改改了又测。以超越光速的速度进步，几天达到别人十几年的功力，直到系统在历史回测中能稳定赚钱为止。再把外汇账户的api研究下，交易系统写成程序，一月70块买个阿里云美国云服务器，放上去自动交易。钱以喷射状哗哗涌进你的账户，上加压包扎都堵不住，你人么，提前退休，吃点好的，有什么未了的心愿去了了，想干点啥就干点啥吧。你自由了！哈哈哈哈师父，到这步俺老孙的交易绝学是不是就练成了？还没，还差一步。最后一步，也是最关键的一步：你又把钱亏光了！想靠着高科技、数学和编程在交易中赚钱，你想的美！想靠着一切你能想象出来的一切方式和方法交易赚钱，白日做梦！！领悟了上面这一条，才是你交易生涯的开始，同时也是结束。哎你不要传授我交易绝学吗，这怎么就结束了，我曰。别急，交易生涯结束了，为师教你的人生绝学才刚刚开始呀。你不学编程了么，上网翻翻招聘信息，针对互联网公司需求加深下技术，找份前端后端数据分析和挖掘的工作轻松的，别以为在公司上班的程序员水平有多高，一般码农就是混饭吃的，你金融量化数据分析的经历绝对加分，数学方面更是完爆他们，什么，居然还是物理达人？老板已经跪下了好吗？北上广深月薪一万五到三万，一年二三十万不算少了，安生过你的日子吧。学门手艺，学门搏击，进可发达，退可自保，白富美和人生巅峰都在你的脚下徐徐展开啥，心有所系？虽然一年稳定赚2、30万，还是放不下交易？？她是你的最爱？？？想她了，就拿几百块玩玩吧，可千万别投大钱了，毕竟之前的爆仓就是为了让你懂得这个人生至理啊。年青人，闷声发大财才是坠吼的，识得唔识得啊？完#######后记，如果真的把文章前述数学和编程知识都学了的话，高质量的生活下去肯定是没问题的，如果你还嫌不足，觉得上班“泯然众人”，有更高的精神追求，那咱们继续。继续学习：上物理，统计力学，复杂性科学，非线性系统论控制论协同论突变论耗散结构熵分形混沌与有序龙卷风的形成规律等等等等。啥？你说太高级？超出正常人类理解能力了？我还没说你要学经济学、社会学、组织行为学、人类学、哲学、归纳和演绎的逻辑学咧！才上点物理就不行了？师父我都学会了，然后咧？都学会了？要真都学会了，想必此时的你已经看破红尘大彻大悟心如止水终极悟道了，对宇宙万物的运行和规律了若指掌，世界于你如浮云，达到了人的至高境界。请容在下叫你一声师父。再然后就就不要再学了，知行合一，，出去走走，去一去比较大的城市，和国家，和各种路过的人聊一聊，交几个志同道合的朋友，一起做点想做的事情。行了，你的人生圆满了。如此生活？够高级了吧。####################下面是之前的废话没什么用别看了#############有人看再说两句，交易的本质是套利，套利的本质是发现价值落差，套利就是靠发现落差，然后入场填平落差来盈利，套利是交易稳定盈利的唯一方法。除套利外，并没有其他哪怕第二种稳赚的交易方式。线上交易的成本低，导致参与人数过多，竞争白热化，价值落差非常小，全球顶级的脑子和资源都在这了，完全轮不到你去发现套利机会。套利空间最大的地方，永远在线下五块钱进的货十块钱卖，线下是常态，线上交易你试试。通过学习一门技术站在高能级区域，你能的别人不能，以后可以一直享受落差的利益。线上交易就是一场梦，人首先要醒过来，才谈得上真正的发展。不要觉得线下套利成本高还麻烦，线上是虚的，线下才实在。有钱人多了，都是做生意干事业发财的，你见过听过几个靠炒股交易发财的做人最重要的是认识自己，认识世界，面对现实。不要用交易来欺骗自己，你其实就是不想上班不想干活就想躺床上挣钱，所以就用交易来假装自己没闲着也在做事。别再骗自己了。如果你在线上交易挣了五百万，你会每天上网打游戏看b片犒劳自己吗？不会，你会去现实世界各种享受各种干事。那干嘛不现在就开始你的线下交易套利之旅呢。不要把线下工作：上班、做生意当成负担，当成被迫。把她当成自己的选择，当成你已经成功之后的享受别坐着了，离开电脑和手机，站起来，穿衣服出门，去做点真正的事业吧如何在Python中实现这五类强大的概率分布_百度知道如何在Python中实现这五类强大的概率分布 - Python - 伯乐在线
& 如何在Python中实现这五类强大的概率分布
R编程语言已经成为统计分析中的事实标准。但在这篇文章中，我将告诉你在Python中实现统计学概念会是如此容易。我要使用Python实现一些离散和连续的概率分布。虽然我不会讨论这些分布的数学细节，但我会以链接的方式给你一些学习这些统计学概念的好资料。在讨论这些概率分布之前，我想简单说说什么是。随机变量是对一次试验结果的量化。
举个例子，一个表示抛硬币结果的随机变量可以表示成
X = {1 如果正面朝上,
2 如果反面朝上}
X = {1 如果正面朝上,&&&& 2 如果反面朝上}
随机变量是一个变量，它取值于一组可能的值（离散或连续的），并服从某种随机性。随机变量的每个可能取值的都与一个概率相关联。随机变量的所有可能取值和与之相关联的概率就被称为。
我鼓励大家仔细研究一下模块。
概率分布有两种类型：离散（discrete）概率分布和连续（continuous）概率分布。
离散概率分布也称为。离散概率分布的例子有伯努利分布（Bernoulli distribution）、二项分布（binomial distribution）、泊松分布（Poisson distribution）和几何分布（geometric distribution）等。
连续概率分布也称为，它们是具有连续取值（例如一条实线上的值）的函数。正态分布（normal distribution）、指数分布（exponential distribution）和β分布（beta distribution）等都属于连续概率分布。
若想了解更多关于离散和连续随机变量的知识，你可以观看可汗学院关于概率分布的。
二项分布（Binomial Distribution）
服从二项分布的随机变量X表示在n个独立的是/非试验中成功的次数，其中每次试验的成功概率为p。
E(X) = np, Var(X) = np(1-p)
如果你想知道每个函数的原理，你可以在IPython笔记本中使用help file命令。 E(X)表示分布的期望或平均值。
键入stats.binom?了解二项分布函数binom的更多信息。
二项分布的例子：抛掷10次硬币，恰好两次正面朝上的概率是多少？
假设在该试验中正面朝上的概率为0.3，这意味着平均来说，我们可以期待有3次是硬币正面朝上的。我定义掷硬币的所有可能结果为：你可能观测到0次正面朝上、1次正面朝上，一直到10次正面朝上。我使用计算每次观测的概率质量函数。它返回一个含有11个元素的列表（list），这些元素表示与每个观测相关联的概率值。
您可以使用.rvs函数模拟一个二项随机变量，其中参数size指定你要进行模拟的次数。我让Python返回10000个参数为n和p的二项式随机变量。我将输出这些随机变量的平均值和标准差，然后画出所有的随机变量的直方图。
泊松分布（Poisson Distribution）
一个服从的随机变量X，表示在具有比率参数（rate parameter）λ的一段固定时间间隔内，事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。
E(X) = λ, Var(X) = λ
泊松分布的例子：已知某路口发生事故的比率是每天2次，那么在此处一天内发生4次事故的概率是多少？
让我们考虑这个平均每天发生2起事故的例子。泊松分布的实现和二项分布有些类似，在泊松分布中我们需要指定比率参数。泊松分布的输出是一个数列，包含了发生0次、1次、2次，直到10次事故的概率。我用结果生成了以下图片。
你可以看到，事故次数的峰值在均值附近。平均来说，你可以预计事件发生的次数为λ。尝试不同的λ和n的值，然后看看分布的形状是怎么变化的。
现在我来模拟1000个服从泊松分布的随机变量。
正态分布（Normal Distribution）
是一种连续分布，其函数可以在实线上的任何地方取值。正态分布由两个参数描述：分布的平均值μ和方差σ2 。
E(X) = μ, Var(X) = σ2
正态分布的取值可以从负无穷到正无穷。你可以注意到，我用stats.norm.pdf得到正态分布的概率密度函数。
β分布（Beta Distribution）
β分布是一个取值在 [0, 1] 之间的连续分布，它由两个形态参数α和β的取值所刻画。
β分布的形状取决于α和β的值。贝叶斯分析中大量使用了β分布。
当你将参数α和β都设置为1时，该分布又被称为均匀分布（uniform distribution）。尝试不同的α和β取值，看看分布的形状是如何变化的。
指数分布（Exponential Distribution）
指数分布是一种连续概率分布，用于表示独立随机事件发生的时间间隔。比如旅客进入机场的时间间隔、打进客服中心电话的时间间隔、中文维基百科新条目出现的时间间隔等等。
我将参数λ设置为0.5，并将x的取值范围设置为 $[0, 15]$ 。
接着，我在指数分布下模拟1000个随机变量。scale参数表示λ的倒数。函数np.std中，参数ddof等于标准偏差除以 $n-1$ 的值。
结语（Conclusion）
概率分布就像盖房子的蓝图，而随机变量是对试验事件的总结。我建议你去看看的讲座，Joe Blitzstein教授给了一份摘要，包含了你所需要了解的关于统计模型和分布的全部。
关于作者：
可能感兴趣的话题
关于 Python 频道
Python频道分享 Python 开发技术、相关的行业动态。
新浪微博：
推荐微信号
（加好友请注明来意）
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页，交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2016 伯乐在线}

51无线网