我想知道一个qq能用手机号登录吗过全部qq号查询qq号码

天津大学博士学位论文第二章多变量时间序列模式表示;DFT表示方法的缺点在于可能会平滑掉原始序列中局;2.离散小波变换(DiscreteWavelet;离散小波变换【161是时间和频率的局部变换,是为;与DFT表示方法类似,DWT表示方法支持各种R树;近年来许多学者将DWT方法与其它技术结合,取得了;天津大学博士学位论文第二章多变量时间序列模式表示;3.分段线
天津大学博士学位论文第二章多变量时间序列模式表示和相似度量能量函数与频域能量谱函数是等价的。因为频域空间的大部分能量集中前几个系数上,因此可以不考虑离散傅立叶变换得到的其它系数,具有较强的数据压缩能力,而且能够较好地保持时间序列的主要形态。DFT支持R树等各种高维索引方法,能够保持欧氏距离不变性,保证了查询的完备性。离散傅立叶变换DFT的时间复杂性是O(厅,Dg刀)。
DFT表示方法的缺点在于可能会平滑掉原始序列中局部极大值和局部极小值,导致了许多重要信息的丢失,这是因为离散傅立叶变换对时间序列的平稳性具有比较高要求,对非平稳序列并不适用。近年来,许多学者提出了DFT的许多改进和扩展方法【68】【691,但其核心思想并没有发生变化。
2.离散小波变换(DiscreteWaveletTransform,DWT)
离散小波变换【161是时间和频率的局部变换,是为改进DFT局部特征丢失而提出的,能更加有效地提取和分析局部信号。DWT方法不仅包含频率信息,同时还包含了时间信息;而DFT表示方法是对信号的整体变换,只考虑了频率信息。离散小波变换用前几个系数代表信号的一个粗糙的全局近似,其它系数对该信号的细节进一步描绘,这一特性在对数据作多分辨率解析时非常有用,是一种较好的有损压缩。对于给定的时间序列,如果DWT和DFT保留相同数目的系数,DWT能保留更精确的近似局部细节。DWT在很多场合的应用中要比DFT更加有效。
与DFT表示方法类似,DWT表示方法支持各种R树等高维索引,具有欧氏距离不变性,能保证查询时的完备性。但其主要缺陷是只适用于长度为2的整数次方的时间序列,无法处理任意长度的序列,而且不支持带有权重的距离度量。
近年来许多学者将DWT方法与其它技术结合,取得了一定的效果。王国仁等【70】设计了二分频率变换和相应的距离函数,使得系统较之频率变换和小波变换具有更高的过滤能力,同时解决了处理任意长度查询的问题;文献【71】利用正弦小波变换结合动态弯曲距离(DTw),在医学应用中取得了比较好的效果。
天津大学博士学位论文第二章多变量时间序列模式表示和相似度量
3.分段线性表示法(PiecewiseLinearRepresentation,PLR)
早在l974年Pavlidis和Horowitz【721就曾经提出利用线段近似表示时间序列的思想,他们指出分段线性是一种很好的数据压缩和消除噪声的方法,而且具有时间多解析性等特点。Keogh等人【6】将输入为时间序列,输出为PLR表示的算法统称为线性分段算法(LinearSegmentationAlgorithms)。线性分段算法的主要问题在于如何选择合适的线段数目?如何选择合适的分段点?根据对这两个问题的不同解决方法,一般可以通过限制分段数或者限制分段误差等方法解决。
分段误差控制主要有两种方式:一是每个分段的最大误差不超过用户指定的阈值maxerror;二是所有分段误差之和不超过指定的阈值total―error。
Keo曲等‘731后来提出了适应性分段常数近似分段方法。其基本思想是:根据时间序列变化自动确定是否分段,每个子段用该子段上各点的平均值来表示。从时间序列的第一个点开始分段,若某点与当前段起始点的误差超过给定的阈值,则在此点分割,开始下一个分段,直到结束。
近年来,国内外学者对分段线性表示法进行了深入的研究,吸收其它方法和技术的优势,提出了许多新的分段表示方法,文献【741j【76】对这些方法进行了总结和评价。李爱国等【271提出了分段多项式表示法(PPR),与离散傅立叶变换(DFT)和离散小波变换(DWT)相比,效率提高比较明显,Cai和Ng【771提出了切比雪夫多项式表示法,Ge和Smyth【78】等提出了一种基于隐马尔科夫模型的表示方法。Lkhagva等【79】将分段线性表示法与界标模型结合,提出了基于极值点的分段方法,性能有了比较大的提高。
4.符号表示法(SymboIicApproximation,SA)
符号表示法的基本思想是通过离散化方法将时间序列的实数值或波形映射到有限的符号表上,将时间序列表示为有限符号的有序集合,即字符串,然后利用字符串匹配和索引技术实现查询。Agrawal等人【191将时间序列的波形符号化,在此基础上引入了多种
天津大学博士学位论文第二章多变量时间序列模式表示和相似度量符号算子,实现了基于形状的查询;Andre等‘203将序列转换为符号,利用文本索引和查询方法对时间序列查询;Megal00ikonomou等【801提出了一种MVQ(MuItiresolutionVectorQuantized)近似表示方法,利用向量化方法找出关键子序列,进行符号化,比较两个序列的关键子序列,查询准确率比欧式距离、DTW和PAA提高20%;蒋嵘和李德毅等【211用符号表示时间序列各段的变化趋势和形态,提出了云模型的时间序列形态概念树;曾海泉【22】则在分段符号化后,采用互关联后继树建立索引。
由于字符串匹配和索引方面的研究工作已经比较成熟,符号表示法可以利用现有的研究成果,设计查询算法。这类方法的缺点在于字符串之间是精确匹配,而时间序列的相似性查询要求近似匹配,因此定义字符之间的相似度有一定难度;同时其表示方法比较粗糙,难以反映时间序列变化的细节。
5.界标模型法(Landmark)
界标模型(Landmark)是由Perng等[251最先提出的,用于时间序列的分割。Perng等人将时间序列中一些转折点定义为界标,使用界标来表示原始序列。在不同的应用场合,界标的定义也可以不同,界标可以是简单属性,如局部极大值、极小值和拐点等,也可以是复杂结构。界标模型是一种很直观的方法,保留了数据的局部极大值和局部极小值,避免了DFT等方法中平滑所导致的重要信息遗失,拓展了相似性的定义。但这种方法算法比较复杂,其降维效果不如DFT、DWT和PAA。
6.主成分分析法(PrincipalComponentAnalysis,PCA)
在数据处理中,经常会遇到高维数据组。多变量时间序列数据中就存在多个变量,每个变量都会提供一定的信息,并且彼此之间存在着一定的相关性,因而使得这些变量所提供的信息将在一定程度上有所重叠,因此,人们希望用为数较少的、互不相关的新变量来反映原来多个变量所提供的大部分信息,通过对新变量的分析达到分析和解决问题的目的。这就需要有一种简化数据的方法,使高维数据降维,来
天津大学博士学位论文第二章多变量时间序列模式表示和相似度量获得数据的主要信息,而且在低维空间将信息分解为互不相关的部分以获得更有意义的解释。主成分分析就是这样一种处理高维数据的方法,它的基本思想是构造原始变量的适当线性组合,以产生一系列互不相关的新变量,从中选出少量几个新交量并使他们含有足够多的原始变量带有的信息,从而使得这几个新变量代替原始变量分析问题和解决问题成为可能。
这种方法又称为奇异值分解法(sVD),是由Korn等人提出的一种时间序列变换方法【17】,同时也是一种基于统计概率分布的投影方法。该方法通过搜索c个最能代表数据的后维正交向量(c冬』i}),使原来的数据被投影到较小空间,实现数据压缩。在图2.2【811中原始变量墨和置相关性很强,点分布在椭圆内,在平面上作一个坐标变换,即逆时针旋转一个角度口,根据变换公式,新老坐标之间有关系:
IZj=cos口置+sin矽墨
1Z21:“n戋+cos矗‘◆1
图2―2主成分分析的几何意义@。2’●-
Zl,Z2是原始变量五和五的特殊线性组合,从图2―2可以看出二维平面上聊个点的波动大部分可以归结为在ZI方向的波动,而在Z2方向上的波动很小,可以忽略,这样可以将二维问题降为一维处理,达到降维的目的。
天津大学博士学位论文第二章多变量时间序列模式表示和相似度量
同其它方法相比,PCA的主要特点是其变换是全局的,能够生成几个最有可能代表原始序列的特征向量,其它变换方法大多数是局部的。在对一系列数据进行PCA分析之后,如果希望重建这些数据,PCA能够将重建误差控制在最小。
PCA变换的全局性既是其优点,同时也是其主要缺陷。PCA变换经典算法的时间和空间复杂性分别为O(挖所2)和(刀m),其中行是时间序列数据库的大小,柳为时间序列的平均长度;而且每一次数据库更新都需要对整个索引进行重新计算,时间复杂性和空间复杂性都比较高,导致其适用场合有限。
2.3相似度量
在许多信息检索和数据挖掘系统中需要频繁地比较两个对象是否相似,例如发现具有相似起伏的股票、确定具有相似销售模式的产品、分类具有相似形状的恒星光谱曲线等。在实际应用中,由于时间序列数据复杂的内在特点,两条完全相同的时间序列是不存在的,因此必须研究时间序列的相似问题。
相似性度量常常与距离联系在一起。距离表示两个对象之间的相似性的程度,是衡量两个对象相似性的标准,是相似性查找的基础。一般情况下,可以采用距离度量作为相似性度量。两个对象之间的距离越小,其相似度越大,两个对象之间的距离越大,其相似度越小。相似性度量的选择是时间序列相似性查询中的关键问题。一方面,相似性度量影响到查询的完备性;另一方面,相似性度量的选择决定了相似性查询能否支持时间序列的各种变形;同时,相似性度量的选择还影响到时间序列的索引方法。
一相似性度量通常应满足的条件如下:
。(1)非负性:D(X,Ⅵ≥O;当且仅当X=Y时,D()(,Ⅵ=O;
(2)对称性:D(X,Ⅵ=D(Y,X);(3)三角不等式:D(X,的≤D(X'Z)+D(Z,Ⅵ。
三亿文库包含各类专业文献、幼儿教育、小学教育、高等教育、生活休闲娱乐、外语学习资料、各类资格考试、中学教育、多变量时间序列的聚类、相似查询与异常检测_图文41等内容。 
 基于时间序列的异常检测研究_数学_自然科学_专业资料...基于深度方法,基于聚类方法,基于距离的方法和基于 ...因为历史数据和未来数据的特性是彼此相似 的,历史数据...  基于聚类分析和时间序列分析的期货预测_天文/地理_自然科学_专业资料。龙源期刊网 .cn 基于聚类分析和时间序列分析的期货预测 作者:李亚杰 ...  讨论一般时间序列相似的度量方式 1、概念: 时间序列的相似性度量是衡量两个时间序列的相似程度的方法。它是时间序 列分类、聚类、异常发现等诸多数据挖掘问题的基础...  提出了基于二维小波变换的煤矿瓦斯监测数据的多变量时间序列相似搜索算法。 将瓦斯...是时间序列的查询、分类、预 测的基础,广泛应用于时间序列的聚类、分类和分割等...  联分析、序列分析、分类分析、聚类分析和异常检测等...2.相似性查找 相似性查找是时间序列挖掘领域的一个...关注的是单变量时间序列, 对多变量时间序列挖 掘的...  基于 Hadoop 的异常传感数据时间序列检测 17……网络...基于复杂网络的时间序列双变量相关性波动研究 33……...基于聚类分析和神经网络的时间序列预测方法 86……...  的时间序列异常点检测方法,算法将软测量建模过程 与 DBSCAN 算法相结合,采用软测量建模训练误差 和测试误差来调整 Eps 和 MinPts 的选择, 同时避免了 聚类过程中...  分析过程中, 如果选取的聚类量纲不同会导致错误的...2、聚类分析 优点: 聚类分析是先将最相似的两个...要检查各变量的量纲是否一致,不一致则需进行 转换。...  R语言,异常值处理,箱线图法,聚类法,时间序列数据,稳健马氏距离法 ...(x)#绘制箱线图 多变量异常值检测: x&-rnorm(100) y&-rnorm(100) df&-...一种基于序列相似性的蚁群聚类算法SeqAntCluster--《广西科学院学报》2009年04期
一种基于序列相似性的蚁群聚类算法SeqAntCluster
【摘要】:将序列数据的相似度度量方法S3M引入蚁群聚类算法中,提出一种基于序列相似性的蚁群聚类算法。该算法既继承了蚁群聚类算法原有的优点,又能有效地对序列数据聚类,更适合处理序列数据。
【作者单位】:
【关键词】:
【分类号】:TP311.13【正文快照】:
聚类就是将数据对象分组成为多个类,在同一个类中的对象之间具有较高的相似度,而不同类中的对象差别较大[1]。聚类在数据挖掘、统计学、机器学习、计算生物学以及商业智能等领域具有广泛的应用。目前主要的聚类算法可以分为:划分的方法、层次的方法、基于密度的方法、基于网
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【二级参考文献】
中国期刊全文数据库
修宇;王士同;吴锡生;胡德文;;[J];计算机研究与发展;2006年08期
【相似文献】
中国期刊全文数据库
刘晓云;[J];中国计算机用户;1995年12期
王景璋,刘惠英;[J];现代情报;1996年05期
木子;[J];中国计算机用户;1996年22期
肖利,金远平,徐宏炳,王能斌;[J];东南大学学报(自然科学版);1997年06期
涂杰,俞桂平,张哲毅;[J];计算机工程;1997年S1期
王轶彤,许学标,施伯乐;[J];计算机工程;1997年S1期
程继华,施鹏飞;[J];计算机工程;1997年S1期
宋韬,张琦,陈丽秋;[J];计算机工程;1997年S1期
;[J];通信世界;1997年12期
林鸿;[J];微型电脑应用;1997年04期
中国重要会议论文全文数据库
李永敏;朱善君;吉吟东;陈湘晖;;[A];1998中国控制与决策学术年会论文集[C];1998年
董伯儒;林少培;王永文;;[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年
宋德昌;姚莉;;[A];Systems Engineering, Systems Science and Complexity Research--Proceeding of 11th Annual Conference of Systems Engineering Society of China[C];2000年
刘耀;;[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
赵奕;施鹏飞;朱莉莉;;[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
赵奕;施鹏飞;;[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
王建华;王菲;黄国建;;[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
李小平;焦李成;;[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
李爱平;陈剑锋;张曙;;[A];第一届国际机械工程学术会议论文集[C];2000年
沈江;;[A];第一届国际机械工程学术会议论文集[C];2000年
中国重要报纸全文数据库
孙志永;[N];中国计算机报;2000年
朴华;[N];中国计算机报;2000年
北京北大融通科技发展有限公司
博士;[N];中国计算机报;2000年
李君君;[N];信息时报;2000年
;[N];中国高新技术产业导报;2001年
李华;[N];经济日报;2001年
;[N];中国计算机报;2001年
国能科诺赛仕企业数据挖掘实验室
赵纪元;[N];中国计算机报;2001年
李磊;[N];计算机世界;2001年
蔡莲红;[N];计算机世界;2001年
中国博士学位论文全文数据库
曹蓟光;[D];浙江大学;2001年
高飞;[D];西安电子科技大学;2001年
冯红伟;[D];西北工业大学;2002年
张保稳;[D];西北工业大学;2002年
刘业政;[D];合肥工业大学;2002年
郭斯羽;[D];浙江大学;2002年
韩斌;[D];浙江大学;2002年
皮德常;[D];南京航空航天大学;2002年
张国江;[D];浙江大学;2002年
杜一平;[D];湖南大学;2002年
中国硕士学位论文全文数据库
蔡刚坤;[D];西安理工大学;2000年
谷宏伟;[D];河北工业大学;2000年
俞珏民;[D];郑州大学;2000年
陈子阳;[D];燕山大学;2000年
路燕;[D];燕山大学;2000年
康松林;[D];大连海事大学;2000年
李晓;[D];河海大学;2001年
安磊;[D];河海大学;2001年
陈庆强;[D];暨南大学;2001年
陈小宁;[D];暨南大学;2001年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号序列相似性网络聚类与蛋白质家族划分--《食品与生物技术学报》2014年01期
序列相似性网络聚类与蛋白质家族划分
【摘要】:图聚类法是利用蛋白质序列信息推断其家族分类的有力手段。对于蛋白质数据集中家族内外存在着如同许多超家族一样的复杂关系,图聚类法达到较好表现必须两因素,1)输入的相似性图需要包含有足够的用于分类的信息;2)需要稳健的算法以识别被隐藏在相似性图中的模糊集团。作者测试模块度最优算法Contraction-Dilation(CD)算法,采用来自于Pfam中的具有高度序列差异的烯醇酶宗族作为测试数据集。结果表明使用CD算法在相关参数与相似性图比较恰当的情况下,得到聚类结果与Pfam中高度一致。该算法能在一般情况下,使用最佳参数附近较宽范围仍能表现出较好性能。
【作者单位】:
【关键词】:
【分类号】:Q51【正文快照】:
随着近年测序技术发展,蛋白质序列数据爆炸式增长。到目前为止,收录信息资源最广的蛋白质数据库Uniprot(http://www.uniprot.org)中储存了超过3 600万条蛋白质序列。这些序列已知的蛋白质绝大部分的功能是未经实验鉴定的,必须借助计算方法确定,而聚类方法尤其是近年引起关注
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【共引文献】
中国期刊全文数据库
SUN JWANG LWU SWANG XXIAO JCHI SLIU CREN LZHAO YLIU TYU J;[J];Acta Oceanologica S2014年02期
【相似文献】
中国期刊全文数据库
柳忠玉;黄亚东;庄楚雄;;[J];细胞生物学杂志;2006年03期
吕波;刘心声;;[J];南京大学学报(数学半年刊);2011年01期
刘东升,王金凤;[J];生物化学与生物物理进展;2001年06期
卢智勇;谭小丹;邓亲恺;;[J];中国医学物理学杂志;2006年02期
张斐;;[J];计算机技术与发展;2011年10期
徐建华,朱家勇;[J];医学分子生物学杂志;2005年03期
黄京飞,刘次全;[J];动物学研究;1998年02期
李明,伍一军,冷欣夫;[J];生命的化学;2001年03期
谭小丹,卢智勇,苏永春,董爱荣,邓亲恺;[J];第一军医大学学报;2005年06期
梅娟;王正祥;石贵阳;李炜疆;;[J];食品与生物技术学报;2008年05期
中国重要会议论文全文数据库
郑家顺;吴加金;孙之荣;;[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
王志新;;[A];生命科学与生物技术:中国科协第三届青年学术年会论文集[C];1998年
胡轶红;郭建林;封青川;Calman R徐存拴;;[A];中国细胞生物学学会医学细胞生物学、免疫细胞生物学和发育生物学专业委员会学术研讨会论文摘要汇编[C];2002年
中国重要报纸全文数据库
本报驻美国记者
毛黎;[N];科技日报;2010年
中国博士学位论文全文数据库
梅娟;[D];江南大学;2010年
李力;[D];华南理工大学;2013年
中国硕士学位论文全文数据库
吕波;[D];南京航空航天大学;2009年
张怀远;[D];山东师范大学;2013年
刘敏;[D];四川大学;2003年
魏强;[D];浙江大学;2013年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号}

我要回帖

更多关于 手机号登录qq 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信