配合力试验缺区数据分析思路-化工仪器网-手机版

前段时间，有用户咨询过配合力试验数据缺区怎么处理的问题，在此简单梳理一下思路，备忘。

上图中是一个NCⅡ配合力试验，父本5个，母本4个，区组3个，每区组1个观测值。A1B1组合在区组3的观测值缺失1个。

缺区估计法、平均值填入法，都是“补齐”数据的策略，由于对后续数据分析有影响，因此不建议采用。

线性混合模型用于配合力缺区分析，本质上跟本文给出的方法是一样的，但是，由于矩阵求逆等计算的中间误差或者迭代误差，计算结果准确性会略差，甚至方程组无解。往白里说就是，一些平均数可以直接计算得出，而不是非要去解线性方程组，结果可能反而算不出来了。

下面是针对方差分析缺区情况博思公司给出的应对参考建议，对配合力试验缺区情况同样适用（配合力试验也需要进行方差分析）。

博思公司提出的方差分析缺区情况应对参考建议

1、缺区，并没有影响试验材料的客观试验表现，需要进行相应的平方和和自由度计算调整。

2、缺几个自由度就减几个，平方和采用累加的思路，缺了就不加，跟未缺区的时候一样分析，试验分析参数进行对应调整。

3、如果缺区导致试验中某效应的平均数无法计算，那就不能进行方差分析，这可以作为缺区情况下是否能够进行方差分析的一个判断依据。

4、F分布要求遵循正态分布，个别数据缺失，可以理解为对分布没有影响。如果数据缺失严重，就不要进行方差分析，F测验了，直接进行品种平均数大小排序即可。

5、如果考虑采用缺区估计方式填值处理，应在试验数据缺区未影响到效应的平均数计算的情况下进行，否则不宜采用估计方式。

6、后续进行的多重比较，采用试验中真实获得的品种平均数。

数据具体分析：

缺失的数据，对如下平均数的计算有影响。

所以在计算这5个平均数的时候进行调整即可。就是分母多减去1.

线性混合模型构建计算矩阵，采用0和1来标注是否有观测值。所以其对缺区的处理道理是一样的。

图中给出的计算结果，

A1B1的平均数是30=（31+29）÷2

A1B2的平均数是26=（27+25+26）÷3

专业的育种信息化研发团队，提供给客户的不仅是产品，更有强大而专业的技术服务保障。如你在育种数据分析、育种标签打印方面有困惑，或有育种数据管理、育种标签需求，欢迎联系我们。

技术文章