2010级硕士研究生课程
试验设计与数据处理
Design of Experiment and Data Processing
刘书成2011年2月
广
东
海
洋
大
学
PDF created with pdfFactory Pro trial version www.pdffactory.comn
科研工作的必要手段——试验
实验和试验实验已知某个结论去验证已知方法的操作验证性PDF created with pdfFactory Pro trial version www.pdffactory.com试验未知某个结论去探索未知方法的探索探索性n
新产品开发、新工艺及其他科研成果产生流程
多次反复试验试验数据分析规律研究PDF created with pdfFactory Pro trial version www.pdffactory.com提高产量提高产品性能降低成本能耗第一章绪论
第二章试验设计的基础知识第三章统计假设检验(误差分析)第四章方差分析第五章回归分析
第六章正交试验设计与数据处理第七章回归试验设计与数据处理第八章均匀设计与数据处理
PDF created with pdfFactory Pro trial version www.pdffactory.com第一章绪论
一、DE&DP的性质、任务和作用二、DE&DP的发展三、学习DE&DP的意义四、DE&DP的内容五、课程学习的基本要求六、参考书籍
PDF created with pdfFactory Pro trial version www.pdffactory.com一、DE&DP的性质、任务和作用
1 性质:专门研究合理的制定试验方案和科学的分析试验结果的方法的一门应用工具学科。
2 任务:以概率论与数理统计为理论依据,结合专业知识和实践经验,经济的、科学的、合理的安排试验,有效的控制试验的干扰,充分地利用和科学地分析所获取的试验信息,从而达到尽快获得最优试验方案的目的。
多、快、好、省
PDF created with pdfFactory Pro trial version www.pdffactory.com3 作用:
(1)通过试验设计可以分清各个试验因素对试验指标影响的大小顺序,找出主要因素,抓住主要矛盾;(2)通过试验设计可以了解因素与试验指标间的规律性,即每个因素的水平改变时,指标是怎么样变化的;(3)通过试验设计可以了解各因素之间的相互影响情况,即因素之间的交互作用情况;
PDF created with pdfFactory Pro trial version www.pdffactory.com(4)通过试验设计可迅速找出最优的生产条件或工艺条件,确定最优的方案,并能预测在最优的生产条件下的试验指标值及波动范围;
(5)通过试验设计的方差分析,可以了解试验误差的大小,从而提高试验的精度。
(6)通过对试验结果的分析,可以明确为寻找最优生产或工艺条件而进一步试验的研究方向。
PDF created with pdfFactory Pro trial version www.pdffactory.com因素对指标影响大小
B因素对指标影响规律
因素间是否相互影响
A试验设计效果
EC优选最佳条件,估计指标值
D估计和控制
试验误差
PDF created with pdfFactory Pro trial version www.pdffactory.com二、DE&DP的发展1980s1920s1980s 美国引进田口方法1920s Fisher将随机化、拉丁方等用于田间试验,发明方差分析Statistical Experiment Design1920s Tippett将SED用于棉纺194919351935 “Design of Experiments”试验设计成为应用技术科学1930~40s 英、美、苏用于工业
1940s末美国Deming传播SED至日本1949 日本GenichiTaguechi(田口玄一)以SED为基础建立“正交试验设计”法1952 应用L27(313)于日本东海电报公司1952~1962 应用100万项,1/3成效明显1955~1970 日本借此推行全面质量管理
PDF created with pdfFactory Pro trial version www.pdffactory.com我国试验设计方法发展
1948
范福仁《田间试验之统计与分析》
1970
1970.4 华罗庚推广优选法、统筹法1978 优选法用于五粮液获成功
方开泰1940~王元1930~华罗庚1910~19851978
方开泰、王元
创建均匀设计法
PDF created with pdfFactory Pro trial version www.pdffactory.comPDF created with pdfFactory Pro trial version www.pdffactory.com三、学习DE&DP的意义
采用统计学方法,发现不确定现象背后隐藏的规律。
变异(variation)是社会和自然科学中的普遍现象。
变异使得实验或观察的结果具有不确定性。
25
20
15
10
5
607590105120135150165180195210225240255270y(产量,克/行)
PDF created with pdfFactory Pro trial version www.pdffactory.com三、学习DE&DP的意义
用统计学思维方式考虑有关自然科学研究中的问题。
1
条件1条件2
42.543.61
条件1条件2
0.060.03
241.344.220.080.05
343.743.330.090.08
44144.940.120.07
平均值
41.84442.384250.130.05
456
43.83
5
6
P>0.05P<0.05
平均值0.150.1050.06
0.056
PDF created with pdfFactory Pro trial version www.pdffactory.com三、学习DE&DP的意义
n
保证你的研究论文能通过统计学审查
§
对不同杂志发表论文的调查结果显示,有统计错误的论文所占比例高达72%,最低也有20%。
§
国内外权威杂志对来稿都有统计学要求或统计学指导。
获得科学证据的主要手段
n
PDF created with pdfFactory Pro trial version www.pdffactory.com培养
独立从事试验研究工作的能力严谨治学、理论联系实际的科学态度独立获取知识和综合运用知识的能力
分析问题和解决问题的能力
PDF created with pdfFactory Pro trial version www.pdffactory.com四、DE&DP的内容
DE&DP是统计数学的一个重要分支,内容丰富。主要有以下内容:
对比试验;单因素试验;双因素试验;全面试验设计;正交试验设计;均匀试验设计;拉丁方试验设计;裂区试验设计;回归正交试验设计;回归旋转试验设计;饱和D-最优试验设计;混料试验设计;三次试验设计等。
T-检验;极差分析;方差分析;回归分析;神经网络分析等等。
PDF created with pdfFactory Pro trial version www.pdffactory.com统计软件
n
SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全。对于非统计工作者是很好的选择。
SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。目前已开发了JMP傻瓜型统计软件。
n
n
STATA: 这是众多统计软件的后起之秀;它操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点。占用计算机系统资源少,绘图漂亮,对有简单编程基础者来讲十分容易上手,有专门出版的专业刊物。
以上三种软件并称为新的国际三大权威统计软件
PDF created with pdfFactory Pro trial version www.pdffactory.com统计软件
n
Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。
PDF created with pdfFactory Pro trial version www.pdffactory.com统计软件
n
S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。
R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断加入的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。
n
PDF created with pdfFactory Pro trial version www.pdffactory.com统计软件
n
n
nn
Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。
Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍。
Eviews:这是一个主要处理回归和时间序列的软件。
GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。
FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。
MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。
n
n
PDF created with pdfFactory Pro trial version www.pdffactory.com数据处理的结果表示
列表
作图
PDF created with pdfFactory Pro trial version www.pdffactory.com10080效率η(%)604020005101520253035流量qv(L/s)3025压头H(m)2015ηH105012提取率(%)1086420湿浸法碱提法醇提法提取方法超声波法PDF created with pdfFactory Pro trial version www.pdffactory.com超声波法醇提法植物2植物1碱提法湿浸法02468101214161820提取率(%)PDF created with pdfFactory Pro trial version www.pdffactory.comPDF created with pdfFactory Pro trial version www.pdffactory.com本课程的学习内容
1 试验设计的基础知识6 正交试验设计2 统计基础3 方差分析4 回归分析5 神经网络分析
7 均匀设计8 回归正交设计9 回归旋转设计
PDF created with pdfFactory Pro trial version www.pdffactory.com五、课程学习的基本要求
了
解基本原理;
熟练掌握介绍的几种生物统计方法,能独立
进行试验结果的统计分析;
熟练掌握介绍的几种试验设计方法,能独立
进行试验设计;
熟练掌握Excel、SAS等数据处理软件处理数据。
PDF created with pdfFactory Pro trial version www.pdffactory.com学习方法
1、对于基本公式,要理解公式的含义和应用条件,
不必深究其数学推导。
2、加强实践加深对公式及统计步骤理解和记忆,达
到能熟练地应用统计方法。
3、注意培养科学的统计思维方法,从不确定性和概
率的角度来思考问题和分析科学试验的结果。4、平时要留意书籍和杂志中的表格、数据及其分析
和解释,以熟悉表达方式及应用,但要注意是否正确。
PDF created with pdfFactory Pro trial version www.pdffactory.com参考书籍
PDF created with pdfFactory Pro trial version www.pdffactory.com参考教材
PDF created with pdfFactory Pro trial version www.pdffactory.com第二章试验设计的基本知识
试验过程就是方案的实施过程,依靠合理的试验设计得出正确的判断和结论。
试验目的是为了获得条件与结果之间的规律性认识。一个良好的试验设计可以最大限度的节约成本,缩短试验周期,同时又能迅速获得确切的科学结论。
PDF created with pdfFactory Pro trial version www.pdffactory.com试验设计的广义理解是指整个试验过程的课题设计。应当包括三个组成部分:
(1)确定试验处理方案;(2)观察资料的搜集与整理;(3)统计分析方法。
进行试验设计,首先要明确几点:试验目的,考核和评价的指标,考察的因素。然后根据试验的目的来合理设计试验方案,组织试验的具体实施,最后对试验结果进行统计分析。
PDF created with pdfFactory Pro trial version www.pdffactory.com试验设计是为试验服务的,试验者必须有实事求是的科学精神。为了达到不同的试验目的,应该采用不同的试验设计方法,根据试验要求灵活掌握,不能生搬硬套。
PDF created with pdfFactory Pro trial version www.pdffactory.com本章的主要内容
第一节试验设计的基本概念第二节试验数据结构与试验误差第三节试验设计的基本原理第四节试验设计的基本要求第五节试验设计的基本程序
PDF created with pdfFactory Pro trial version www.pdffactory.com第一节试验设计的基本概念
一、试验指标
在试验设计中,根据试验目的而选定的用来衡量试验效果的特征值,称为试验指标。
在一项试验中,试验指标是根据试验目的而选定的,不同的试验目的选用不同的试验指标。例如,在考察不同的多糖提取工艺对多糖提取率的影响时,多糖提取率是试验指标;在考察不同提汁工艺条件对果汁褐变的影响时,果汁色泽就是试验指标。
PDF created with pdfFactory Pro trial version www.pdffactory.com试验指标可分为两类:定量指标和定性指标。定量指标:能用数量表示的指标,如食品的糖度、酸度、pH、提取率,吸光度、合格率等,食品的理化指标及由理化指标计算得到的特征值一般为定量指标。
定性指标:不能用数量表示的指标,如色泽、风味、口感、手感等。食品的感官指标多为定性指标。
PDF created with pdfFactory Pro trial version www.pdffactory.com通常为了便于试验分析结果,常把定性指标进行量化,转化为定量指标。例如,食品的感官指标可用评分(10分制或者百分制)的方法分成不同的等级,代替很好、较好、较差、很差等定性描述方式。
试验设计中,根据试验目的的不同,可以选择一个试验指标,也可以同时选择多个试验指标,前者称为单指标试验,后者称为多指标试验。
PDF created with pdfFactory Pro trial version www.pdffactory.com二、试验因素
在试验设计中,可能对试验指标产生影响的条件称为试验因素。
在酶解制备水解动物蛋白的试验中,酶的种类、温度、pH、时间、底物浓度等都对水解度有很大的影响,这些就是影响水解度的因素。
试验因素又可分为数量因素和非数量因素。数量因素——依据数量化分水平的因素,如温度、pH、时间等。非数量因素——不是依据数量化分水平,如酶的种类等。
PDF created with pdfFactory Pro trial version www.pdffactory.com三、试验水平
在试验设计中,为考察试验因素对试验指标的影响情况,要使试验因素处于不同的状态,把试验因素所处的各种状态称为试验水平。
试验设计中,一个因素选择了几个水平,就称该因素为几水平。例如在酶解制备水解动物蛋白的试验中,温度分别设为30℃、40 ℃、50 ℃,就称温度为三水平。
PDF created with pdfFactory Pro trial version www.pdffactory.com因素的水平,有的可以取具体的数值,有的无法用具体的数值表示,如添加剂的种类,酶的种类,设备的不同型号,原料的不同品种,工艺的不同操作方法等。
PDF created with pdfFactory Pro trial version www.pdffactory.com四、试验处理
试验处理是指各试验因素的不同水平之间的联合搭配,因此,试验处理也叫因素的水平组合或组合处理。
在单因素试验中,水平和处理是一致的,一个水平就是一个处理。在多因素试验中,由于因素和水平较多,可以形成若干个水平组合。
处理的多少等于参加试验各因素水平的乘积。如三因素三水平全面试验共有3×3×3=27个处理。
PDF created with pdfFactory Pro trial version www.pdffactory.com五、全面试验
对全部组合处理进行试验,叫全面试验。全面试验的组合处理等于各试验因素水平的乘积。
优点:能够掌握每个因素及其每一个水平对试验结果的影响,无一遗漏。
缺点:但是当试验的因素和水平较多时,试验处理的数目会急剧增加,如果还要重复,工作量就会更大,在实际中难以实施。因此,全面试验是有局限性的,只适用于因素和水平都不太多的情况。
PDF created with pdfFactory Pro trial version www.pdffactory.com六、部分实施
部分实施就是从全部组合处理种选取部分有代表性的处理进行实施。如正交试验设计和均匀试验设计等都属于部分实施。部分实施可使试验规模大大减少。
如三因素三水平试验,按照全面试验有27个处理,按照正交试验设计只有9个处理,仅为全面试验的三分之一。
因此,在试验因素和水平较多时,常采用部分实施的方法。
PDF created with pdfFactory Pro trial version www.pdffactory.com第二节试验数据结构与试验误差
一、试验数据结构
在试验研究中,所获得的试验结构(数据)总是有差异的,即使在同一条件下进行试验,所得的试验数据也不完全一样,引起试验数据产生差异的因素很多,这些因素对试验数据的影响也是不同的,有主有次,有大有小。
PDF created with pdfFactory Pro trial version www.pdffactory.com对影响因素,抓住主要的因素加以控制,使这些因素固定在希望的水平上,从理论上讲,它们对试验结果的影响也是固定的,用m表示;次要的因素不加以控制,它们对试验结果的影响也可概括为一项,称为误差项,用ε表示。
因此,任何试验结果(数据)都可以表示为两部分之和,即
Χ=m + ε
m: 被控制因素对试验指标的影响之和,是在某一工艺下试验指标应有的理论值。ε:从下料、配料、加工直到测试整个过程中许多未加控制的因素对试验指标的影响之和,称为试验误差。
该式为试验数据的结构式,是对试验数据进行分析的依据,m 和ε在性质上是两类完全不同的量,m是常量,ε是随机变量,因此,试验数据Χ也是一个随机变量。
PDF created with pdfFactory Pro trial version www.pdffactory.com误差(error):试验中获得的试验值与它的客
观真实值在数值上的不一致。
真值:在某一时刻和某一状态下,某量的客观值或
实际值。
真值一般是未知的。相对的意义上来说,真值又是已知的。例如平面三角形三内角之和恒为180°;国家标准样品的标称值;国际上公认的计量值;高精度仪器所测之值;多次试验值的平均值。
PDF created with pdfFactory Pro trial version www.pdffactory.com试验结果都具有误差,误差自始至终存在于一切科学试验过程中。
误差分析(error analysis):对原始数据
的可靠性进行客观的评定。
PDF created with pdfFactory Pro trial version www.pdffactory.com二、试验误差(一)试验误差来源1、试验材料
试验中,所用的试验材料在质量、纯度上不可能完全一致,就是同一厂家生产的同批号的同一包装内的产品,有时也存在某种程度的不均匀性。试验材料的差异在一定范围内是普遍存在的,这种差异会对试验结果带来影响,产生试验误差。
PDF created with pdfFactory Pro trial version www.pdffactory.com2、试验仪器和设备(1)仪器精度有限;(2)仪器的磨损;
(3)仪器可能不在最佳状态;
(4)测量工具可能没有校正,即使校正,也不可能绝对准确,也会有误差;
(5)有时试验中,需要同时使用多台仪器,即使是同一型号也会存在一定的差异,同一台仪器不同时间的测定也有差异。
PDF created with pdfFactory Pro trial version www.pdffactory.com3、试验环境条件
环境因素主要包括温度、湿度、气压、振动、光线、电磁场、海拔高度和气流等。
试验在完全相同的环境条件下进行,才能得到可靠的结果。但是由于环境条件的复杂性,且难以控制,因此环境条件对试验结果的影响不可避免,特别是试验周期较长的试验。环境的变化可能会使原料的组成、性质和结构等发生变化,同时也可能影响仪器的稳定性,从而引起误差。
PDF created with pdfFactory Pro trial version www.pdffactory.com
相关推荐: