中国生态农业学报  2019, Vol. 27 Issue (3): 462-473  DOI: 10.13930/j.cnki.cjea.181012
0

引用本文 

田效琴, 李卓, 李浩杰, 柴靓, 张锦芳, 陈红琳, 刘永红. 基于投影寻踪模型的甘蓝型油菜产量因素评价[J]. 中国生态农业学报, 2019, 27(3): 462-473. DOI: 10.13930/j.cnki.cjea.181012
TIAN X Q, LI Z, LI H J, CHAI J, ZHANG J F, CHEN H L, LIU Y H. Evaluation of factors affecting rape (swede type) yield using the projection pursuit model[J]. Chinese Journal of Eco-Agriculture, 2019, 27(3): 462-473. DOI: 10.13930/j.cnki.cjea.181012

基金项目

四川省财政创新能力提升工程(2016GYSH-007)、甘蓝型油菜种质资源创新和突破性新品种培育(2016zypz-013)、公益性科研(农业)专项(20150312701)、国家科技支撑计划项目(2014BAD11B03)和现代农业产业技术体系建设专项资金(CARS-13)资助

通讯作者

李卓, 主要研究方向为作物高效用水与农业资源环境E-mail:lizhuo_2000@sina.com

作者简介

田效琴, 主要研究方向为作物栽培和农业资源环境。E-mail:865257025@qq.com

文章历史

收稿日期:2018-11-22
接受日期:2018-12-22
基于投影寻踪模型的甘蓝型油菜产量因素评价*
田效琴1,2, 李卓1,2, 李浩杰1, 柴靓1, 张锦芳1, 陈红琳2,3, 刘永红1,2     
1. 四川省农业科学院作物研究所 成都 610066;
2. 南方丘区节水农业研究四川省重点实验室 成都 610066;
3. 四川省农业科学院土壤肥料研究所 成都 610066
摘要:明确油菜产量因素对产量的贡献对于有目的地选择油菜优良组合具有重要意义,而常用的评价油菜产量因素贡献大小的分析方法限制较多。为此,本研究以正常生长的12份早熟和38份晚熟甘蓝型油菜组合为材料,利用基于加速遗传算法的投影寻踪模型分别定量评价了早、晚熟油菜组合产量因素对产量的贡献,并将其与灰色关联度分析、主成分分析结果进行了对比分析,讨论了各分析方法对产量因素贡献评价的准确性。结果表明,早熟组合产量贡献最大的3项指标依次为主序有效角果数>有效分枝部位>二次有效分枝数,贡献率分别达到36.79%、24.02%和11.33%;晚熟组合产量贡献最大的3项指标依次为每角粒数>千粒重>有效分枝部位,贡献率分别达到29.81%、17.52%和14.75%。有效分枝部位对不同熟期组合产量均有较大贡献;除此之外,早熟组合产量的形成还较多依赖于生育前期的有效分枝数与有效角果数,晚熟组合产量的形成则较多依赖于生育后期的每角粒数与千粒重。基于投影寻踪模型的油菜产量因素评价能较准确地判断油菜实际产量,并在利用各种分析方法评价油菜产量因素对产量的贡献中发现,灰色关联度分析和主成分分析比投影寻踪模型评价准确性低。从油菜产量因素评价及产量预测综合考虑,基于投影寻踪模型的油菜产量因素评价及产量预测具有最高的准确性,可以优先作为甘蓝型油菜良种选育及产量预测的一种分析方法。
关键词:投影寻踪    油菜产量预测    产量因素    高维数据    
Evaluation of factors affecting rape (swede type) yield using the projection pursuit model*
TIAN Xiaoqin1,2, LI Zhuo1,2, LI Haojie1, CHAI Jing1, ZHANG Jinfang1, CHEN Honglin2,3, LIU Yonghong1,2     
1. Crop Research Institute, Sichuan Academy of Agricultural Sciences, Chengdu 610066, China;
2. Provincial Key Laboratory of Water-Saving Agriculture in Hill Areas of South China, Chengdu 610066, China;
3. Soil Fertilizer Research Institute, Sichuan Academy of Agricultural Sciences, Chengdu 610066, China
*This study was supported by the Financial Innovation Capacity Improvement Project of Sichuan Province (2016GYSH-007), the Germplasm Resources Innovation and Breakthrough New Varieties Cultivation of Brassica napus of China (2016zypz-013), the Special Fund for Agro-scientific Research in the Public Interest of China (20150312701), the National Key Technologies R & D Program of China (2014BAD11B03) and the Special Fund for Construction of Modern Agricultural Industrial Technology System of China (CARS-13)
** Corresponding author, LI Zhuo, E-mail: lizhuo_2000@sina.com
Received Nov. 22, 2018; accepted Dec. 22, 2018
Abstract: The relative contributions of factors that affect rapeseed production were determined. A field experiment was conducted in Jianyang, Sichuan using 12 early-maturing and 38 late-maturing newly recombinant rapeseed varieties. Contributions were evaluated using the projection pursuit model based on real code deaccelerating genetic algorithm. The evaluation was compared with gray correlation analysis and principal component analysis. Effective pods in main inflorescence, effective branching position, and second effective branch number were the major contributors for early-maturing varieties, accounting for 36.79%, 24.02%, and 11.33% of the yield variation, respectively. For late-maturing varieties, seeds per silique, 1000-grain weight, and effective branching position were the most influential factors, accounting for 29.81%, 17.52%, and 14.75% of the yield variation, respectively. Interestingly, effective branching position was a significant contributor for both early- and late-maturing varieties. In addition, yield appeared to be influenced mostly by the number of effective branches and the number of effective pods, both formed during early growing stages, for early-maturing rape plants, and by seeds per silique and 1000-grain weight, formed during late growing stages, for late-maturing varieties. Predicted yields by the projection pursuit model were consistent with observed yields. Rapeseed yield was affected mostly by branching and pod formation for early-maturing varieties and by seed development for late-maturing varieties, and the yield potential was accurately predicted by the projection pursuit model.
Keywords: Projection pursuit     Rapeseed yield prediction     Rapeseed yield factors     High dimensional data    

油菜(Brassica napus L.)是十字花科(Cruciferae)芸薹属(Brassica)植物, 是重要的油料作物之一, 也是重要的蛋白质作物、能源作物[1]。培育高产新品种一直是油菜育种的重要目标。有研究指出, 油菜群体产量的形成与单株产量有密切关系[2], 而单株产量又是多个产量因素共同作用的结果, 各因素对产量的影响大小各不相同[3]。因此, 在多个性状中找出其对产量影响的主次关系, 在一定的栽培条件下, 利于有目的地选育适合当地生产的优良组合。

目前, 已有研究证明每角粒数、千粒重、有效角果数、主序有效角果数、有效分枝部位、株高、有效分枝数对油菜产量有较大影响, 但将以上诸多因素影响程度大小进行排序时, 研究结果却存在较大差异, 甚至同种研究方法对相同因素分析的结果都有差异。形成这种情况的原因有很多, 其中分析方法是原因之一。目前, 常用的分析方法有相关分析[3]、灰色关联度分析[4]、主成分分析[5]和通径分析等[6]。黄益国等[7]利用相关分析和通径分析研究不同熟期油菜品种农艺性状与产量的关系, 结果表明, 早熟品种产量与主花序长、主花序角果数、单株有效角果数、千粒质量显著相关, 对早熟油菜品种产量直接影响最大的是千粒重, 对中熟油菜品种产量直接影响最大的是株高。靳力争等[8]利用灰色系统理论中的关联度分析法对构成白菜型油菜单株产量的5个主要性状进行分析, 结果表明, 产量与相关性状的关联序为最大叶柄宽 > 茎基部直径 > 腰部直径 > 最大叶长 > 叶片数。倪正斌等[9]对12个甘蓝型油菜品种的11个农艺性状进行了相关分析和主成分分析。结果表明油菜产量与一次分枝数、二次分枝数、全株角果数均呈显著正相关, 第1主成分主要与角果数有关, 第2、3主成分主要与角果性状有关。从前人研究可以看出, 相关分析只能分析两两关系; 灰色关联度分析需要事先对各项指标的最优值进行现行确定; 主成分分析和通径分析前提都要求数据结构属于线性关系。本文尝试应用投影寻踪模型方法对油菜产量因素进行定量评价, 以期得到更加切合实际的结果。

投影寻踪模型方法是直接由样本数据驱动的探索性数据分析方法, 它是对一个P维随机向量X, 寻找一个K(K < p)(1~3维)维投影矩阵A, 使定义在某个K维分布函数集合Fk上的实值函数Q(投影指标), 满足Q(Ax1, Ax2, …, Axk)=Q(Ax)=Max, 即能反映原高维数据结构或特征, 然后根据该投影值分析高维数据的结构特征。从原理上可以看出利用此模型定量评价无需对样本数据作正态假定或其他模型假定, 能充分利用高维数据的所有信息, 使低维数据结构完全反映原始高维数据结构, 也无需人为假定各因子之间的相互关系, 是对非线性多指标因素进行定量评价的一种方法, 所得结果准确、稳健[10-11]。该模型最早由Kruskal在20世纪70年代初提出并进行试验[12-13], 已在环境[14]、农业[15-20]、大气[21]、地球物理[22]、水利[23]等复杂工程系统的优化、预测及评价过程中得到了成功应用, 而在作物农艺性状与产量关系或产量预测方面还鲜见报道。

本文用基于加速遗传算法的投影寻踪模型评价早、晚熟油菜组合产量因素, 并对其综合表现效果进行实例验证, 以期克服传统方法的条件限制, 弥补传统方法对复杂系统分析精确度较低、难以定量分析等的不足, 能够更切合实际、定量、准确地分析各产量因素对油菜产量形成的影响, 既是油菜产量因素分析的论述, 也是该领域分析评价新方法的尝试与补充。本研究可为作物良种选育提供新的思路和方法, 对栽培措施优化和产量预测亦具有应用价值。

1 材料与方法 1.1 试验概况

供试材料为油菜新组合(由两个不同油菜品系或品种配制的第1代杂交种), 其中早熟组合12份(全生育期200 d)、晚熟组合38份(全生育期215 d)。试验于2015年10月—2016年5在四川省农业科学院简阳基地(四川省简阳市玉成乡)进行。试验地前作夏玉米(Zea mays L.), 肥力中等, 土壤类型为紫色土, 土壤的有机质含量为16.1 g·kg-1, 碱解氮为25.42 mg·kg-1, 速效磷为6.76 mg·kg-1, 速效钾为86.63 mg·kg-1

1.2 试验设计

以不同组合为处理因素, 各组合间采用随机区组设计, 3次重复, 小区面积3 m×6 m, 9行区, 密度111 000株·hm-2。大田播种, 试验地周围设4行保护行, 于10月初进行人工点播。其他管理措施同常规。

1.3 测定指标与方法 1.3.1 测定指标

测定株高、有效分枝部位、主序长、有效分枝数(一次、二次)、有效角果数(主序、一次、二次)、每果粒数、千粒重和单株产量, 油菜成熟时, 每小区随机取10株进行室内考种。其中, 株高为子叶节至全株最高部分长度; 有效分枝部位为子叶节至第一个有1个以上有效角果的分枝数长度; 主序长为最后一个有1个以上有效角果的分枝至最后一个含有1粒以上饱满或欠饱满种子的角果长度; 有效分枝数为有1个以上有效角果的分枝数; 有效角果数为含有1粒以上饱满或欠饱满种子的角果数; 每果粒数为主序随意摘取10个正常荚角, 一次和二次分枝数上随意摘取10个正常荚角, 计算平均每角饱满或欠饱满的种子粒数; 千粒重为晒干(含水量不高于10%)、纯净的种子内, 用对角线、四分法或分样器等方法取样3份, 分别称量1 000粒种子的重量, 取3个样本的平均值; 单株产量为实称单株产量。

1.3.2 投影寻踪原理及方法

投影寻踪技术原理:将高维数据通过某种组合, 投影到低维(1~3维)子空间上, 通过优化投影函数, 寻找出能反映原高维数据结构或特征的投影向量, 在低维空间上对数据结构进行分析, 以达到研究和分析高维数据的目的[24]。评价模型的实现方法如下[25-27]:

1.3.2.1 样本指标值归一化处理

设第i个样本的第j个指标为x(i, j)*{x(i, j)*|i=1, 2, …, n; j=1, 2, …, m}, 其中nm分别为样本个数(样本容量)和指标个数。为消除各指标量纲和统一各指标值的变化范围, 可采用下式进行极值归一化处理:

$ 正向指标:{x_{(i, j)}} = [x_{(i, j)}^* - {x_{j\min }}]/[{x_{j\max }} - {x_{j\min }}] $ (1)
$ 逆向指标:{x_{(i, j)}} = 1 - [{x_{j\max }} - x_{(i, j)}^*]/[{x_{j\max }} - {x_{j\min }}] $ (2)

式中: xjmaxxjmin为第j个指标值的最大值和最小值, x(i, j)为规范化后的值。

1.3.2.2 构造投影指标函数Q(a)

投影寻踪方法就是把m维数据{x(i, j)|j=1, 2, …, m}综合成以a={a1, a2, a3, …, am}为投影方向的一维投影值Zi

$ {Z_i} = \sum\nolimits_{j = 1}^m {{a_j}} \times {x_{(i, j)}}\;\;\;\;(i = 1, 2, \cdots , n) $ (3)

式中: ai为单位长度向量。确定投影特征值Zi的关键是找到反映高维数据特征结构的最佳投影方向a。为了构造投影指标函数, 要求投影值Zi的散布特征应为:局部(样本内)投影点尽可能密集, 最好凝聚成若干个点团, 而在整体(样本间)上投影点团之间尽可能散开。因此, 投影指标函数可以表达成:

$ {Q_a} = {S_a} \times {D_a} $ (4)

式中: Sa为投影值Zi的标准差, Da为投影值Zi的局部密度, 即:

$ {S_a} = \sqrt {\frac{{\sum\nolimits_{i = 1}^n {{{({Z_i} - {E_z})}^2}} }}{{n - 1}}} $ (5)
$ {D_a} = \sum\nolimits_{i = 1}^n {\sum\nolimits_{j = 1}^n {\left[ {R - {r_{(i, j)}}} \right] \times f\left[ {R - {r_{(i, j)}}} \right]} } $ (6)

式中: EznZi的平均值; R为局部密度的窗口半径; r(i, j)表示样本之间的距离, r(i, j)=|Zi-Zj|; f(t)为一单位阶跃函数, 当t≥0时, 其值为1, 反之则为0。

1.3.2.3 优化投影指标函数

Sa越大样本越分散, Da越大分类越显著。因此构造一个投影指标函数Qa, 作为优选投影方向的依据, 当指标函数达到极值时, 即可获得最优投影方向。

最大化目标函数:

$ {\rm{Max}}:{Q_a} = {S_a} \times {D_a} $ (7)

约束条件:

$ \sum\nolimits_{j = 1}^p {a_j^2 = 1} $ (8)

这是一个以{aj|j=1, 2, …, m}为优化变量的复杂非线性优化问题, 运用模拟生物优胜劣汰规则的加速遗传算法[28]来进行优化求解。

把由1.3.2.3中求得的最佳投影方向a*代入式(3)中计算各样本的投影值z*。本文中以12份早熟和38份晚熟油菜组合为样本点, 计算出的投影值可作为农艺性状综合表现指数, 对农艺性状综合表现指数与实际产量进行比较评价模型的优良。

1.4 数据统计

数据处理和灰色关联度分析在Mcirosoft Excel中进行, 方差分析和主成分分析在SPSS 17.0软件中进行, 基于加速遗传算法的投影寻踪模型在Matlab 7.1中进行。

2 结果与分析

对12份早熟和38份晚熟油菜组合产量和产量因素分别进行数据整理和方差分析。如表 1所示, 大部分油菜组合产量因素和产量差异显著。从总体上看, 不同油菜组合之间都存在单个或多个产量因素差异显著。

表 1 供试早熟(早)和晚熟(晚)油菜组合材料的单株产量及其产量因素 Table 1 Yield per plant and yield factors of the tested early-maturing (E) and later-maturing (L) materials of rape
2.1 基于投影寻踪模型的油菜产量因素分析 2.1.1 产量因素优化排序

表 1中前10个常见产量因素指标值按照式(1)和式(2)进行归一化处理, 结果如表 2所示, 其中除有效分枝部位为逆向指标外, 其余均为正向指标。

表 2 供试早熟(早)和晚熟(晚)油菜组合材料的产量因素归一化处理结果 Table 2 Normalized results of yield factors for the tested early-maturing (E) and later-maturing (L) materials of rape

采用加速遗传算法分别求解12份早熟和38份晚熟油菜组合最优投影方向矢量a, 首先根据式(4)-(6)计算zi的标准差Sazi的局部密度Da和投影指标函数Qa, 对数据建立投影寻踪模型。采用Matlab 7.1语言编程实现。优化投影寻踪模型时参数设置如下:选定种群数为400, 交叉概率Pc=0.8, 变异率Pm=0.1, P=0.05, 迭代3次, 加速循环10次。

投影指标用式(7)计算, 在满足目标函数max Qa和约束条件下, 经过寻优运算, 12份早熟油菜组合最大指标函数值为1.630 8, 10个产量指标的输出最佳的投影方向向量为: a*=(0.082 0, 0.508 3, 0.022 1, 0.202 4, 0.239 9, 0.778 6, 0.017 3, 0.033 0, 0.092 8, 0.140 1)。38份晚熟油菜组合最大指标函数值为15.503 5, 10个产量指标的输出最佳的投影方向向量为: a*=(0.037 3, 0.359 0, 0.179 1, 0.160 1, 0.232 7, 0.204 6, 0.078 9, 0.030 6, 0.725 8, 0.426 6), 反映了各指标在影响油菜产量上所占的比重(图 1)。

图 1 早熟(A, B)和晚熟(C, D)油菜组合材料产量影响指标的最优投影方向(A, C)和影响百分比(B, D) Fig. 1 Optimal projection direction (A, C) and influence percentage (B, D) of yield impact indexes of early-maturing (A, B) and late-maturing (C, D) rape materials x1x2x3x4x5x6x7x8x9x10分别表示株高、有效分枝部位、主序长、一次有效分枝数、二次有效分枝数、主序有效角果数、一次枝有效角果数、二次枝有效角果数、每角粒数和千粒重。 x1, x2, x3, x4, x5, x6, x7, x8, x9 and x10 respectively represent plant height, effective branching position, main sequence length, primary effective branching number, secondary effective branching number, effective pods number of the main sequence, primary effective pods number, secondary effective pods number, seed number per horn, and 1000-grain weight. x1, x2, x3, x4, x5, x6, x7, x8, x9 and x10 respectively represent plant height, effective branching position, main sequence length, primary effective branching number, secondary effective branching number, effective pods number of the main sequence, primary effective pods number, secondary effective pods number, seed number per horn, and 1000-grain weight.

投影寻踪模型中, 最佳投影方向各分量的大小实质上反映了各评价指标对油菜产量的影响程度, 值越大则对应的评价指标对油菜产量的影响程度越大。从图 1中可以看出, 早熟组合产量贡献最大的3项指标依次为主序有效角果数 > 有效分枝部位 > 二次有效分枝数, 贡献率分别为36.79%、24.02%和11.33%;晚熟组合产量贡献最大的3项指标依次为每角粒数 > 千粒重 > 有效分枝部位, 贡献率分别为29.81%、17.52%和14.75%。说明有效分枝部位对早、晚熟油菜产量均有较大贡献, 且早熟组合的产量形成还体现在生育前期决定的有效分枝数与有效角果数上, 晚熟组合的产量形成则体现在生育后期决定的每角粒数与千粒重上。可能原因是早熟组合营养生长天数和生殖生长天数均较晚熟组合短, 早熟组合只有在营养生长期间先形成足够的有效分枝数和有效角果数才能在后期生殖生长阶段提供充足的库, 以保证籽粒变大、变多, 而晚熟组合在营养生长期间已形成了一定量有效分枝数和有效角果数, 有足够的库供给生殖生长的籽粒变大、变多, 则后期籽粒的数量和质量成了影响产量的重要因子。

2.1.2 模型评价结果分析

将最优投影方向a*代入式(3), 得到12份早熟和38份晚熟油菜组合的投影值z*=(1.337 7, 0.777 8, 1.293 1, 0.967 7, 0.810 4, 0.924 6, 1.140 9, 0.655 2, 1.037 3, 1.119 4, 1.018 0, 0.818 1)和(1.155 6, 0.712 8, 0.907 8, 0.841 1, 0.881 0, 0.708 3, 1.072 5, 0.958 6, 1.175 5, 1.168 6, 1.121 5, 1.423 6, 1.041 0, 0.824 4, 1.147 8, 1.213 5, 1.428 9, 1.359 9, 0.800 6, 1.020 8, 1.197 2, 0.976 7, 0.978 8, 0.725 6, 1.328 1, 0.573 0, 0.954 1, 1.391 3, 0.866 4, 0.880 0, 1.163 5, 1.077 7, 1.241 0, 1.257 9, 0.672 4, 1.043 7, 1.493 1, 1.332 3)。投影寻踪方法计算出来的50份油菜组合投影值是基于最优目标函数状况下得出的结果, 可作为50份油菜组合产量表现指数。从图 2可以看出, 应用遗传算法的投影寻踪模型评价油菜农艺性状对产量的表现效果结论比较可靠。

图 2 早熟(a)和晚熟(b)油菜材料投影值及实际单株产量的比较 Fig. 2 Comparison of projection values and actual yields per plant of early-maturing (a) and late-maturing (b) rape materials
2.2 投影寻踪模型分析结果与灰色关联度分析结果比较

将基于投影寻踪模型计算出的各产量因素投影方向值与灰色关联度[29]计算数据进行了比较。从产量因素影响值来看(表 3), 基于投影寻踪模型对早、晚熟产量影响最大的因素分别为主序有效角果数、有效分枝部位、二次有效分枝数和每角粒数、千粒重、有效分枝部位; 灰色关联度分析得出对早、晚熟产量影响最大的因素分别为千粒重、一次有效角果数、一次有效分枝数和主序长、主序角果数、每角粒数。两种分析方法计算结果差别较大。从表 1表 3中可以看出, 投影寻踪计算出的产量影响因素影响值较灰色关联度能更好地评价油菜产量大小, 如早熟品种1和10的单株产量分别为35.44 g和28.63 g, 而对早1和早10产量影响较大的因素中, 早10千粒重、一次有效角果数和一次有效分枝数均大于早1, 投影寻踪模型中对早熟产量影响较大的二次有效分枝数虽早1较早10小(4.6个和5.6个), 但早1的主序角果数和有效分枝部位弥补了二次有效分枝数的不足; 晚熟品种31和33的单株产量分别为28.60 g和28.89 g, 在主序长和每角粒数相近的情况下, 主序角果数(100.8个和85.2个)相差甚大, 而投影寻踪模型中对晚熟产量影响较大的每角粒数相近, 千粒重晚31较晚33小, 但晚31有效分枝部位较晚33大。

表 3 早晚熟油菜产量因素分析方法比较 Table 3 Comparison of yield factors analysis methods of early-maturing and late-maturing rape materials
2.3 投影寻踪模型分析结果与主成分分析结果比较

在主成分分析[30]获得的4个主成分中(表 3), 早熟品种第1主成分主要与有效分枝数和二次有效角果数有关, 第2主成分主要与株高、主序长和千粒重有关, 第3主成分主要与有效分枝部位、二次有效分枝数和每角粒数有关, 第4主成分主要与角果数和每角粒数有关; 晚熟品种第1主成分主要与有效分枝数和二次有效角果数有关, 第2主成分主要与株高、有效分枝部位和主序角果有关, 第3主成分主要与主序长、主序角果和一次有效角果数有关, 第4主成分主要与主序长和每角粒数有关。可以看出早、晚熟产量影响因素对产量影响均较大。利用主成分分析计算出早晚熟综合得分Y值分别为Y=(1.18, -0.56, -0.03, 0.12, -1.10, -0.14, 0.50, -1.21, 0.66, 1.68, -0.55, -0.55)和Y=(1.08, 0.42, -0.74, 0.86, -0.35, 0.36, -0.13, 0.54, 0.63, 0.50, -1.51, 0.40, 0.01, -0.40, 0.14, 0.52, 0.89, 1.07, 0.33, 0.03, 0.19, -0.09, 0.48, 0.01, 0.69, 0.02, -0.33, -0.88, -1.55, -0.39, 0.51, -0.10, -0.52, -0.15, -0.87, -0.81, -0.34, -0.55), 这与基于投影寻踪模型计算出的各产量因素投影方向值和投影值有差异(图 2表 3)。将主成分分析得出的Y值与表 1中油菜产量进行比较可以发现, 通过Y值可以粗略地评价油菜产量大小, 但准确性较基于投影寻踪模型计算出的投影值低, 如早熟品种3和4的单株产量分别为29.22 g和26.32 g, 而主成分分析中Y3Y4分别为-0.03和0.12, 投影寻踪模型中分别为1.293 1和0.967 7;晚熟品种中19和37的单株产量分别为23.23 g和33.41 g, 而Y19Y37分别为0.30和-0.34, 投影寻踪模型中分别为0.800 6和1.493 1。

3 讨论 3.1 产量因素对产量的影响程度分析

目前的报道中, 多数研究表明千粒重、每角粒数、主序有效角果数和有效分枝部位等产量因素是影响油菜产量的主要因子。钟丽[4]发现千粒重、一次有效分枝数和有效分枝部位与油菜单株产量关联度最大; 宋稀等[31]的研究表明常规密度下对产量直接作用最大的3项指标为株高、主序有效角果数和每角粒数; 黄益国等[7]认为早熟组合主要受千粒重、主序有效角果数和每果粒数的影响, 而中熟组合主要受每果粒数、千粒重和株高的影响。本研究中投影寻踪模型结果表明, 早熟油菜组合各性状对产量影响最大的3项因子依次为主序有效角果数、有效分枝部位和二次有效分枝数, 而晚熟油菜组合各性状对产量影响最大的3项因子依次为每角粒数、千粒重和有效分枝部位; 灰色关联度分析结果表明早、晚熟产量影响因素较大的为每角粒数、二次有效角果数和一次有效分枝数; 主成分分析结果表明产量影响因素对早、晚熟产量均有较大影响。以上研究结果不仅与前人研究有较大差异, 且本研究中同数据不同方法结果也差异较大。造成差异的可能原因:一是本文所用油菜组合与黄益国等[7]较为一致, 是不同熟期油菜组合试验数据(区别在于本文是早、晚熟数据, 而黄益国等用的是早、中熟数据), 而钟丽[4]和宋稀等[31]用的是熟期相差不大的品系油菜数据。二是分析方法不同, 不同的分析方法可能导致结果有所差别。前人在利用相同的方法(灰色关联度或主成分分析)进行产量因素评价时结果也有所差异, 如白桂萍等[32]、王毅等[33]、钟丽[4]、邓伟等[34]均利用灰色关联度法分析了每角粒数、单株有效角果数、主序有效角果数、有效分枝部位、千粒重、株高、一次有效分枝数、主序长等农艺性状对油菜产量的影响, 但所得结论有差异。白桂萍等[32]认为一次有效分枝数、主序长、单株有效角果数与产量关系最为密切, 王毅等[33]则表示单株有效角果数、每角粒数、千粒重对产量影响更大。还有研究者证明对产量影响最大的因素是每角粒数、单株有效角果数、有效分枝部位[4, 34]。原因可能是主成分分析是在数据满足线性关系的条件下展开的, 而产量因素数据结构非常丰富, 很难满足单一的线性结构, 因此在使用主成分分析产量因素影响大小时会与实际情况有偏差; 灰色关联度分析需要人为确定最优值, 主观性太强, 对于客观存在事物的评价具有局限性, 从而在产量因素评价过程中造成较大差异。而本文采用投影寻踪模型方法论证了影响早熟油菜高产的主要因子为主序有效角果数、二次有效分枝数和有效分枝部位, 影响晚熟油菜组合高产的主要因子为有效分枝部位、每角粒数和千粒重, 此方法直接以原始数据为基础, 通过计算机分析模拟数据, 将高维数据投影到低维(1~3维)子空间上, 然后设计软件程序检验, 寻找出能反映原高维数据的结构或特征的投影, 以达到研究和分析高维数据的目的, 既不需要模型假定, 也不需要满足正态分布, 可以准确、稳健、定量地解决多指标非线性问题, 而油菜产量正是由多种因素影响, 各因素之间又有着错综复杂的关系, 利用此模型进行评价可以真正找到数据的内在规律。毛鸿才等[35]在研究皮棉(Gossypium spp.)产量因素试验中也证明了这一点, 他将投影寻踪和通径分析的结果进行比较发现, 投影寻踪模型得出的结果更接近实际。

3.2 投影寻踪模型评价油菜产量结果分析

由于在利用投影寻踪模型进行油菜产量因素综合评价时, 投影值是直接由产量各因素原始数据直接驱动形成的, 并未涉及油菜产量数据, 这与一般由因变量和自变量构造函数模型, 再利用其余数据加以验证模型准确性不同, 故此文中现有的产量因素数据足以证明模型的准确性, 另取其他样本数据加以验证模型的准确性也是重复性工作, 故此文不再赘述, 仅通过2016年收获的50份油菜实际单产数据评价投影寻踪模型的准确性。从图 2可以看出本研究中投影寻踪模型得出的投影值与收获的50份油菜实际单产数据能较好的吻合, 其中早、晚熟油菜组合中仍有少量投影值大小与实际油菜单产大小有差异, 如早3和早7、早4和早6、晚17和晚28、晚12和18等, 从表 1可以看出, 这些组合之间本身实际产量差异不显著, 测产过程中难免存在一些不可避免误差(人、仪器、环境因素等), 导致实际产量大小发生变化, 但这些变化是细微的, 是在允许范围内的, 不会影响利用投影值评判产量的效果。如早4和早6投影值、单株产量分别为0.9677、26.32 g和0.9246、26.33 g, 若按投影值的大小来评估产量, 则早4产量应高于早6, 而实际上早4产量比早6低0.01 g, 原因就在于两组合实际产量仅差0.01 g, 差异不显著, 实际测产中不可避免因素会造成两组产量大小在允许范围内波动而影响其值大小, 但这两组产量相近的组合本身可视为同一产量水平, 故不会影响利用投影值评判产量的效果。而在前文结果部分的叙述中可以发现使用主成分分析评价油菜产量时会与实际值存在差异, 这归根于油菜产量因素数据结构很难满足简单的线性关系。同时, 灰色关联度分析不能定量评价油菜产量大小。

4 结论

投影寻踪模型结果表明对早、晚熟油菜组合产量影响最大的3项指标依次为主序有效角果数、有效分枝部位、二次有效分枝数和每角粒数、千粒重、有效分枝部位。主序有效角果数和每角粒数分别是早、晚熟油菜组合最大的产量影响因素, 贡献率分别为36.79%和29.81%。同时, 将基于投影寻踪模型油菜产量因素综合评价结果与主成分分析和灰色关联度分析进行比较, 验证了利用投影寻踪模型评估油菜产量大小准确性较高, 具有较好的应用及推广价值。

参考文献
[1]
刘芳, 刘睿洋, 官春云. BnFAD2BnFAD3BnFATB基因的共干扰对油菜种子脂肪酸组分的影响[J]. 植物遗传资源学报, 2017, 18(2): 290-297.
LIU F, LIU R Y, GUAN C Y. Effect of silencing of BnFAD2, BnFAD3, BnFATB genes on fatty acid component in rapeseed (Brassica napus)[J]. Journal of Plant Genetic Resources, 2017, 18(2): 290-297.
[2]
易斌, 陈伟, 马朝芝, 等. 甘蓝型油菜产量及相关性状的QTL分析[J]. 作物学报, 2006, 32(5): 676-682.
YI B, CHEN W, MA C Z, et al. Mapping of quantitative trait loci for yield and yield components in Brassica napus L.[J]. Acta Agronomica Sinica, 2006, 32(5): 676-682. DOI:10.3321/j.issn:0496-3490.2006.05.009
[3]
卢坤, 申鸽子, 梁颖, 等. 适合不同产量的环境下油菜高收获指数的产量构成因素分析[J]. 作物学报, 2017, 43(1): 82-96.
LU K, SHEN G Z, LIANG Y, et al. Analysis of yield components with high harvest index in Brassica napus under environments fitting different yield levels[J]. Acta Agronomica Sinica, 2017, 43(1): 82-96.
[4]
钟丽. 油菜产量与主要性状的灰色关联度分析[J]. 南方农业学报, 2012, 43(4): 421-424.
ZHONG L. Gray relational grade analysis between the rapeseed yield and related traits[J]. Journal of Southern Agriculture, 2012, 43(4): 421-424. DOI:10.3969/j:issn.2095-1191.2012.04.421
[5]
白鹏, 冉春燕, 谢小玉. 干旱胁迫对油菜蕾薹期生理特性及农艺性状的影响[J]. 中国农业科学, 2014, 47(18): 3566-3576.
BAI P, RAN C Y, XIE X Y. Influence of drought stress on physiological characteristics and agronomic traits at bud stage of rapeseed (Brassica napus L.)[J]. Scientia Agricultura Sinica, 2014, 47(18): 3566-3576. DOI:10.3864/j.issn.0578-1752.2014.18.005
[6]
郑本川, 张锦芳, 李浩杰, 等. 甘蓝型油菜生育期天数与产量构成性状的相关分析[J]. 中国油料作物学报, 2013, 35(3): 240-245.
ZHENG B C, ZHANG J F, LI H J, et al. Correlation between duration of growth periods and yield components of Brassica napus L.[J]. Chinese Journal of Oil Crop Sciences, 2013, 35(3): 240-245.
[7]
黄益国, 张学昆, 张毅, 等. 不同熟期油菜品种农艺性状与产量的相关分析[J]. 作物研究, 2017, 31(3): 260-264.
HUANG Y G, ZHANG X K, ZHANG Y, et al. Correlation analysis about agronomic traits and yield of rape varieties with different maturity stages[J]. Crop Research, 2017, 31(3): 260-264.
[8]
靳力争, 马洪英. 白菜型油菜单株产量与相关性状的灰色关联度分析[J]. 长江蔬菜, 2018(8): 50-52.
JIN L Z, MA H Y. Gray relational degree analysis between per-plant yield and relative characters of turnip type rape[J]. Journal of Changjiang Vegetables, 2018(8): 50-52.
[9]
倪正斌, 王陈燕, 孙雪辉, 等. 甘蓝型油菜主要农艺性状相关性及主成分分析[J]. 江西农业学报, 2018, 30(3): 7-10.
NI Z B, WANG C Y, SUN X H, et al. Correlation and principal component analyses of main agronomic traits in Brassica napus[J]. Acta Agriculturae Jiangxi, 2018, 30(3): 7-10.
[10]
王柏, 张忠学, 李芳花, 等. 基于改进双链量子遗传算法的投影寻踪调亏灌溉综合评价[J]. 农业工程学报, 2012, 28(2): 84-89.
WANG B, ZHANG Z X, LI F H, et al. Comprehensive evaluation of regulated deficit irrigation using projection pursuit model based on improved double chains quantum genetic algorithm[J]. Transactions of the CSAE, 2012, 28(2): 84-89. DOI:10.3969/j.issn.1002-6819.2012.02.016
[11]
姜秋香, 付强, 王子龙. 基于粒子群优化投影寻踪模型的区域土地资源承载力综合评价[J]. 农业工程学报, 2011, 27(11): 319-324.
JIANG Q X, FU Q, WANG Z L. Comprehensive evaluation of regional land resources carrying capacity based on projection pursuit model optimized by particle swarm optimization[J]. Transactions of the CSAE, 2011, 27(11): 319-324. DOI:10.3969/j.issn.1002-6819.2011.11.060
[12]
KRUSKAL J B. Toward a practical method which helps uncover the structure of a set of multivariate observations by finding the linear transformation which optimizes a new index of condensation[M]//MILTONR C, NELDERJ A. Statistical Computation. New York: Academia Press, 1969
[13]
KRUSKAL J B. Linear transformation of multivariate data to reveal clustering[M]//SHEPARDR N. Multidimensional Scaling: Theory and Applications in the Behavioral Science. NewYork and London: Semimar Press, 1972
[14]
汪嘉杨, 宋培争, 张碧, 等. 社会-经济-自然复合生态系统生态位评价模型——以四川省为例[J]. 生态学报, 2016, 36(20): 6628-6635.
WANG J Y, SONG P Z, ZHANG B, et al. An ecological niche evaluation model of social, economic, and natural complex ecosystems:a case study in Sichuan Province[J]. Acta Ecologica Sinica, 2016, 36(20): 6628-6635.
[15]
何汝艳, 蒋金豹, 郭海强, 等. 用投影寻踪降维方法估测冬小麦叶绿素密度[J]. 麦类作物学报, 2014, 34(10): 1447-1452.
HE R Y, JIANG J B, GUO H Q, et al. Using projection pursuit dimension reduction to estimate canopy chlorophyll density of winter wheat[J]. Journal of Triticeae Crops, 2014, 34(10): 1447-1452.
[16]
原君静, 李洪文. 基于投影寻踪技术的保护性耕作效益评价[J]. 农业工程学报, 2010, 26(4): 175-179.
YUAN J J, LI H W. Benefit evaluation of conservation tillage based on projection pursuit[J]. Transactions of the CSAE, 2010, 26(4): 175-179. DOI:10.3969/j.issn.1002-6819.2010.04.029
[17]
封志明, 郑海霞, 刘宝勤. 基于遗传投影寻踪模型的农业水资源利用效率综合评价[J]. 农业工程学报, 2005, 21(3): 66-70.
FENG Z M, ZHENG H X, LIU B Q. Comprehensive evaluation of agricultural water use efficiency based on genetic projection pursuit model[J]. Transactions of the CSAE, 2005, 21(3): 66-70. DOI:10.3321/j.issn:1002-6819.2005.03.015
[18]
赵小勇, 付强, 刑贞相, 等. 投影寻踪模型的改进及其在生态农业建设综合评价中的应用[J]. 农业工程学报, 2006, 22(5): 222-225.
ZHAO X Y, FU Q, XING Z X, et al. Improvement of projection pursuit model and its application in integrated evaluation of eco-agricultural construction[J]. Transactions of the CSAE, 2006, 22(5): 222-225. DOI:10.3321/j.issn:1002-6819.2006.05.051
[19]
王斌, 张展羽, 魏永霞, 等. 基于投影寻踪的农业基本旱情评估[J]. 农业工程学报, 2009, 25(4): 157-162.
WANG B, ZHANG Z Y, WEI Y X, et al. Assessment of agricultural basic drought based on projection pursuit[J]. Transactions of the CSAE, 2009, 25(4): 157-162.
[20]
徐淑琴, 付强, 董淑喜, 等. 基于RAGA的PPC模型评价水分胁迫对寒区水稻生长和产量的影响[J]. 农业工程学报, 2009, 25(S2): 29-33.
XU S Q, FU Q, DONG S X, et al. Evaluation of effects of water stress on growing and yield of paddy based on RAGA-PPC model in cold area[J]. Transactions of the CSAE, 2009, 25(S2): 29-33.
[21]
李祚泳, 徐源蔚, 汪嘉杨, 等. 基于投影寻踪回归的规范指标的气象灾情评估[J]. 应用气象学报, 2016, 27(4): 480-487.
LI Z Y, XU Y W, WANG J Y, et al. Evaluation model of meteorological disaster loss with normalized indices based on projection pursuit regression[J]. Journal of Applied Meteorological Science, 2016, 27(4): 480-487.
[22]
杜欣, 黄晓霞, 李红旮, 等. 基于投影寻踪学习网络算法的植物群落高分遥感分类研究[J]. 地球信息科学学报, 2016, 18(1): 124-132.
DU X, HUANG X X, LI H G, et al. Research on classification of plant community using projection pursuit learning network algorithm on high resolution remote sensing images[J]. Journal of Geo-information Science, 2016, 18(1): 124-132.
[23]
饶均辉. GSA-PP模型在区域水资源承载力评价中的应用[J]. 水资源与水工程学报, 2016, 27(6): 95-100.
RAO J H. Application of GSA-PP model in water resources carrying capacity evaluation[J]. Journal of Water Resources and Water Engineering, 2016, 27(6): 95-100.
[24]
付强, 赵小勇. 投影寻踪模型原理及其应用[M]. 北京: 科学出版社, 2006: 46-51.
FU Q, ZHAO X Y. Principle and Application of Projection Pursuit Model[M]. Beijing: Science Press, 2006: 46-51.
[25]
王顺久, 杨志峰. 区域农业生态环境质量综合评价投影寻踪模型研究[J]. 中国生态农业学报, 2006, 14(1): 173-175.
WANG S J, YANG Z F. A projection pursuit model for comprehensive assessment on eco-environmental quality of regional agriculture[J]. Chinese Journal of Eco-Agriculture, 2006, 14(1): 173-175.
[26]
赵西宁, 王玉宝, 马学明. 基于遗传投影寻踪模型的黑河中游地区农业节水潜力综合评价[J]. 中国生态农业学报, 2014, 22(1): 104-110.
ZHAO X N, WANG Y B, MA X M. Comprehensive evaluation of agricultural water-saving potential in the middle reaches of Hei River using genetic projection pursuit model[J]. Chinese Journal of Eco-Agriculture, 2014, 22(1): 104-110.
[27]
郭倩, 汪嘉杨, 张碧. 基于DPSIRM框架的区域水资源承载力综合评价[J]. 自然资源学报, 2017, 32(3): 484-493.
GUO Q, WANG J Y, ZHANG B. Comprehensive evaluation of the water resource carrying capacity based on DPSIRM[J]. Journal of Natural Resources, 2017, 32(3): 484-493.
[28]
金菊良, 丁晶. 遗传算法及其在水科学中的应用[M]. 成都: 四川大学出版社, 2000.
JIN J L, DING J. Genetic Algorithm and its Applications to Water Science[M]. Chengdu: Sichuan University Press, 2000.
[29]
刘冰洋, 张小全, 张鋆鋆, 等. 气象因子对高香气烤烟品种主要香味前体物含量的影响[J]. 中国生态农业学报, 2016, 24(9): 1214-1222.
LIU B Y, ZHANG X Q, ZHANG Y Y, et al. Effects of meteorological factors onaroma precursors contents of high aroma flue-cured tobacco[J]. Chinese Journal of Eco-Agriculture, 2016, 24(9): 1214-1222.
[30]
熊黑钢, 付金花, 王凯龙. 基于熵权法的新疆奇台绿洲水资源承载力评价研究[J]. 中国生态农业学报, 2012, 20(10): 1382-1387.
XIONG H G, FU J H, WANG K L. Evaluation of water resource carrying capacity of Qitai Oasis in Xinjiang by entropy method[J]. Chinese Journal of Eco-Agriculture, 2012, 20(10): 1382-1387.
[31]
宋稀, 刘凤兰, 郑普英, 等. 高密度种植专用油菜重要农艺性状与产量的关系分析[J]. 中国农业科学, 2010, 43(9): 1800-1806.
SONG X, LIU F L, ZHENG P Y, et al. Correlation analysis between agronomic traits and yield of rapeseed (Brassica napus L.) for high-density planting[J]. Scientia Agricultura Sinica, 2010, 43(9): 1800-1806. DOI:10.3864/j.issn.0578-1752.2010.09.005
[32]
白桂萍, 刘克钊, 谭永强, 等. 油菜高产群体各农艺性状对产量的影响[J]. 作物杂志, 2015(6): 33-38.
BAI G P, LIU K Z, TAN Y Q, et al. Effect of agronomic traits on seed yield in high-yielding rapeseed populations[J]. Crops, 2015(6): 33-38.
[33]
王毅, 庞进平, 董云, 等. 油菜产量与主要农艺性状的灰色关联度分析[J]. 种子, 2011, 30(7): 99-101.
WANG Y, PANG J P, DONG Y, et al. Gray relation analysis on yield and main agronomic traits of rape[J]. Seed, 2011, 30(7): 99-101. DOI:10.3969/j.issn.1001-4705.2011.07.030
[34]
邓伟, 肖华贵. 杂交油菜产量与相关农艺性状的灰色关联度分析[J]. 安徽农业科学, 2009, 37(5): 1961-1962.
DENG W, XIAO H G. Grey correlation analysis on the yield of hybrid rape and its related agronomic characters[J]. Journal of Anhui Agricultural Sciences, 2009, 37(5): 1961-1962. DOI:10.3969/j.issn.0517-6611.2009.05.044
[35]
毛鸿才, 杨力行. 黄准棉区皮棉产量组分的投影寻踪回归(PPR)分析及与通径分析的比较[J]. 新疆农业大学学报, 2001, 24(3): 44-49.
MAO H C, YANG L X. Comparison between projection pursuit regression (PPR) analysis and path analysis of yield components in cotton yield in Huangzhun cotton area[J]. Journal of Xinjiang Agricultural University, 2001, 24(3): 44-49. DOI:10.3969/j.issn.1007-8614.2001.03.010