北京中农博思科技发展有限公司
2021/1/12 17:00:03前段时间,有用户咨询过配合力试验数据缺区怎么处理的问题,在此简单梳理一下思路,备忘。
上图中是一个NCⅡ配合力试验,父本5个,母本4个,区组3个,每区组1个观测值。A1B1组合在区组3的观测值缺失1个。
缺区估计法、平均值填入法,都是“补齐”数据的策略,由于对后续数据分析有影响,因此不建议采用。
线性混合模型用于配合力缺区分析,本质上跟本文给出的方法是一样的,但是,由于矩阵求逆等计算的中间误差或者迭代误差,计算结果准确性会略差,甚至方程组无解。往白里说就是,一些平均数可以直接计算得出,而不是非要去解线性方程组,结果可能反而算不出来了。
下面是针对方差分析缺区情况博思公司给出的应对参考建议,对配合力试验缺区情况同样适用(配合力试验也需要进行方差分析)。
博思公司提出的方差分析缺区情况应对参考建议
1、缺区,并没有影响试验材料的客观试验表现,需要进行相应的平方和和自由度计算调整。
2、缺几个自由度就减几个,平方和采用累加的思路,缺了就不加,跟未缺区的时候一样分析,试验分析参数进行对应调整。
3、如果缺区导致试验中某效应的平均数无法计算,那就不能进行方差分析,这可以作为缺区情况下是否能够进行方差分析的一个判断依据。
4、F分布要求遵循正态分布,个别数据缺失,可以理解为对分布没有影响。如果数据缺失严重,就不要进行方差分析,F测验了,直接进行品种平均数大小排序即可。
5、如果考虑采用缺区估计方式填值处理,应在试验数据缺区未影响到效应的平均数计算的情况下进行,否则不宜采用估计方式。
6、后续进行的多重比较,采用试验中真实获得的品种平均数。
数据具体分析:
缺失的数据,对如下平均数的计算有影响。
所以在计算这5个平均数的时候进行调整即可。就是分母多减去1.
线性混合模型构建计算矩阵,采用0和1来标注是否有观测值。所以其对缺区的处理道理是一样的。
图中给出的计算结果,
A1B1的平均数是30=(31+29)÷2
A1B2的平均数是26=(27+25+26)÷3
专业的育种信息化研发团队,提供给客户的不仅是产品,更有强大而专业的技术服务保障。如你在育种数据分析、育种标签打印方面有困惑,或有育种数据管理、育种标签需求,欢迎联系我们。