用于检查样本数据的形状和分布情况。Minitab 在会话窗口中显示茎叶图。该图类似于直方图,只不过它不是使用条形而是使用实际数据值的数字来表示每个区间(行)的频率。
下面是具有以下这五个值的数据集的茎叶图:3、4、8、8 和 10。
C1 的茎叶图 N = 5
叶单位 = 1.0
1 0 3
2 0 4
2 0
(2) 0 88
1 1 0
显示包含三列:
· 叶(右)- 叶列中的每个值都代表观测值的一个数字。“叶单位”(在图的上方声明)指定使用哪个数字。在本示例中,叶单位为 1.0。因此,观测值 8 的叶值为 8,而观测值 10 的叶值为 0。
· 茎(中间)- 茎值代表紧邻叶值数字左侧的数字。在本示例中,茎值为 0 表示该行中的叶值来自值大于等于零,但却小于 10 的观测值。茎值为 1 则表示观测值大于等于 10,但却小于 20。
· 计数(左)- 如果样本的中位数值包含在一行内,该行的计数将放入括号中。中位数上面和下面行的值为累积值。中位数上面一行的计数代表该行及其上面各行的总计数。中位数下面一行的值代表该行及其下面各行的总计数。
在本示例中,样本的中位数为 8,因此第四行的计数包含在括号内。第二行的计数表示头两行中的观测值总数。
对话框项
图形变量:输入一个或多个数据列。Minitab 将为每列单独显示一个图。
按变量:输入一个包含分组变量的列。按变量 列中的值必须是介于 -10000 和 +10000 之间的整数,也可以是缺失数据符号 (*)。Minitab 会为每个组单独生成一个图。该选项不能与“修整异常值”选项一起使用。
修整异常值:选中此项将修剪所有异常值 ,并在标记为“低”和“高”的特殊行中显示它们。该选项不能与“按变量”选项一起使用。
增量:输入一个数字以通过设置显示线之间的增量(相邻两条线上最小可能值之间的差)来控制垂直尺度。
相关日志
Tags: minitab.
了解了怎么样画箱线图后,看看箱线图有哪些功能。
直观明了地识别数据批中的异常值
一批数据中的异常值值得关注,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。箱线图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。虽然这种标准有点任意性,但它来源于经验判断,经验表明它在处理需要特别注意的数据方面表现不错。这与识别异常值的经典方法有些不同。众所周知,基于正态分布的3σ法则或z分数方法是以假定数据服从正态分布为前提的,但实际数据往往并不严格服从正态分布。它们判断异常值的标准是以计算数据批的均值和标准差为基础的,而均值和标准差的耐抗性极小,异常值本身会对它们产生较大影响,这样产生的异常值个数不会多于总数0.7%。显然,应用这种方法于非正态分布数据中判断异常值,其有效性是有限的。
箱线图的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,它只是真实直观地表现数据形状的本来面貌;另一方面,箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。
相关日志
Tags: minitab,箱线图.
1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。
2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。在矩形盒内部中位数(Xm)位置画一条线段为中位线。
3、在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在F+3IQR和F-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。
4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。
5、用“〇”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。至此一批数据的箱线图便绘出了。统计软件绘制的箱线图一般没有标出内限和外限。
相关日志
Tags: minitab,箱线图.
以前只知道在minitab的表格中处理数据,今天才发现:原来minitab有和matlab相似的命令输入功能,同样也可以直接输入或者从文本中读取矩阵.
READ用来从键盘或文件读取数据到几个列变量或矩阵中,其格式为:
格式1: READ ‘文件名’ C,…,C
格式2: READ C,…,C
格式3: READ ‘文件名’ K by K M
格式4: READ K by K M
该命令可以同时读入几列数据或矩阵,在读数据时,要求一个输入行包括与输入列数相等个数的数据,否则报错,在一个输入行输入不完所有的数据时,可以用续行符’&’,表明该行未完,下行接着继续输入。在READ命令中不能使用存储常量,其他要求基本上同SET命令。格式1和格式3用来从文件中读数据,格式2和格式4用来从键盘上读数据。
例如:
READ C1 C2
2 4
1.5 2
3.5 4
END
读入两列数据,C1中含有2,1.5,3.5,C2中含有4,2,4。
相关日志
Tags: minitab,数据分析,统计.



前几天在当当上买了一本minitab参考书,感觉不错,推荐给大家!
MINlTAB统计分析软件包最初是由美国宾夕法尼亚州立大学发展起来的产品,具有30多年的历史。其特点是:操作简便,软件兼容性能好,功能多,精度高(双精度计算),对硬件的要求低,有最新现代化图表引擎,强大的宏等功能。MINlTAB软件可以从网上免费下载试用。
MINlTAB作为统计教学软件包与SAS、BMDP、SPSS并驾齐驱,其统计分析模块包括基本统计分析,回归分析,方差分析,实验设计,控制图,质量编制计划工具,可靠性/生存分析,多变量分析,时间序列分析,统计报表(检验),非参数检验,探索性数据分析,功效与样本含量分析等内容。此外,还有图形绘制模块和数据计算模块。本书配书盘包含书中所有例题数据。
本书的内容与方法广泛适应、社会科学、经济管理科学、生物学、金融学与医疗卫生保健等多学科、多专业、多层次的需要,可供高等院校统计等相关专业本科生、研究生以及从事统计分析和决策的各领域相关专业读者学习参考。
相关日志
Tags: minitab,当当网,数据分析,网上购物.