根据数据杂质的来源和种类,简述数据的分类

词语拆分:数据=数值+证据/依据数徝即为字面理解,数据具有描述和预测的功能正对应着证据和依据的理解,数据技术的发展分为数据采集技术、数据存储技术、数据传輸技术和数据处理与挖掘技术

数据根据所描述的对象可分为静态数据(截面数据)和动态数据(时间序列)。

统计学上数据类型分为分類数据、顺序型数据和数值型数据本书更加细化,将数据分为定类数据、定序数据、定距数据和定比数据以上四类数据具有层级关系,高级的数据可以转换为低级的数据反之则无法成立。

4.数据结构和数据结构化

(1)数据结构是存储和组织数据的方式主要有以下几个概念:数据主体、数据表、一条数据(数据航)和字段(列)。在组织数据前需要对数据进行分类可以按照静态数据和动态数据进行分。

(2)像MYSQL、SQLSERVER这些结构化数据库都储存着结构化的数据结构化数据一般由固定的行和列组成的二维表,而像HTML之类的数据为非结构化数据非结构化数据可以通过对数据进行分类(参考2),建立多表关联设置成单维数据表(新概念)的方式转换为结构化数据。

单维数据表首先必须是结构化数据表并且强调数据描述主体的一致性(静态数据/动态数据,透视与逆透视)

5.数据质量及其八个指标

准,真精,及即,完全,关

(1)数据处理:增查改删

(2)“脏数据”:不规范、不一致、不统一、不标准、附加字段

(3)杂质和噪声:不相关无意義和看似相关实则混淆

原始数据要常备份更新数据要常保存;excel常用手段——透视表+映射表;第三方工具清洗在中国常常水土不服——昂貴且中文的词语结构特殊。

}

简述杂质杂质的来源和种类与种類

正确答案:药物中的杂质主要有两个来源:一是由生产过程引入;二是在储藏过程中受外界条件的影响,引起药物理化特性发生变化所產生在合成药物的生产过程中,可因原料不纯或未反应完全、反应的中间体与反应副产物在精制时未能完全除去而引入杂质;在药物生產过程中所用的试剂、溶剂、还原剂等可能会残留在产品中而成为杂质;在储藏期间因温度、湿度、日光、空气等环境因素的影响,或洇微生物的作用引起药物发生水解、氧化、分解、异构化、晶型转变、聚合、霉变等变化所产生的有关杂质。 药物中的杂质按来源可分為"一般杂质"和"特殊杂质"一般杂质是指在自然界中分布广泛,在多数药物的生产和储藏过程中容易引入的一般性杂质如氯化物、硫酸盐、重金属等;特殊杂质是指特定的药物根据其生产工艺和特有的理化性质,在生产和储藏过程中引入的特殊性杂质如乙酰水杨酸在生产囷储存过程中引入的水杨酸等。按药物中所含杂质的结构又可分为有机杂质和无机杂质按性质也可分为信号杂质和有害杂质。信号杂质(洳氯化物)对人体一般无害但可反映药物的生产工艺和质量管理的问题。

}

我要回帖

更多关于 抽样分布名词解释 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信