作者简介:王春生(1965-),男,教授,博士生导师.研究方向:焊接过程控制.E-mail:wangchunsheng@cccar.com.cn
针对经典粗糙集只能处理连续型数据的不足,引入邻域粗糙集理论对铝合金焊接接头疲劳寿命影响因素进行分析,建立既能处理符号型又能处理数值型属性变量的统一邻域粗糙集模型。运用前向贪心和后向剪枝相结合的算法进行属性约简,获取影响接头疲劳寿命的核心因素集,并定量计算各影响因素的权重。实验结果表明:所建立的邻域粗糙集模型不需要先验知识,可从疲劳样本数据本身出发得到铝合金焊接接头疲劳寿命各影响因素的客观评定,能够选择少量的特征。
To sole the problem that classical rough set theory can only deal with continuous data, neighborhood rough set theory is employed to analyze the factors that influence the fatigue life of the welded joints. A unified neighborhood rough set model is proposed, which can handle both symbolic and numeric attributes. Attribute reduction algorithm combining forward greedy algorithm and backward pruning algorithm is used to obtain the key factors and to quantitatively calculate the weights of the factors influencing the fatigue life of the welded joints. Experiment results of aluminum alloy welded joints show that the proposed neighborhood rough set model can choose a small number of features and obtain an objective evaluation of various influence factors from the sample data of the aluminum alloy welded joints without any priori knowledge.
由于铝合金材料具有加工性能好、刚度高、焊接性能好、抗应力腐蚀性能高等特性[1], 其焊接结构目前已经被广泛应用于航天、航空、交通运输等行业中, 有利于高速列车、地铁、轻轨轻量化发展。这些构件的灾难性的疲劳失效往往是引发重大安全事故的主要原因[2]。因此, 研究铝合金焊接接头疲劳分析方法对结构可靠性和安全性具有重大意义。
工程实际中, 焊接接头疲劳寿命的评定通常受材料类型、焊接方法、板厚、应力比、接头类型等多种因素共同影响, 而在现有常规焊接接头疲劳分析方法中尚缺乏对多种不同影响因素的综合分析。孟广伟等[3]将影响结构疲劳断裂的不确定因素视为随机变量, 用随机有限元和可靠性设计理论, 从概率论和数理统计的角度对含裂纹的平面结构进行了可靠性分析。闫楚良等[4]针对传统材料疲劳寿命计算方法(概率统计法)误差较大的问题, 在对材料疲劳寿命数据进行分类的基础上, 采用基于遗传算法优化的BP神经网络方法, 建立了应力集中系数、应力均值、应力幅值与材料的中值寿命之间的关系模型。笔者曾采用经典粗糙集理论对铝合金和钛合金焊接接头疲劳试验数据进行分析, 分别构建了基于变精度粗糙集的铝合金焊接接头疲劳寿命预测模型[5]和基于混合智能技术的钛合金焊接接头疲劳寿命预测模型[6], 对焊接接头疲劳寿命多种不同影响因素的综合分析进行了尝试性研究。但是, 由于经典粗糙集理论只能处理离散型数据, 对于取值连续的属性数据, 都要先进行离散化处理, 而离散化处理过程中会引入量化误差、改变数值数据的本质结构, 难免会造成重要信息的丢失, 而且不同的离散化算法往往导致不同的属性约简结果, 从而影响焊接接头疲劳寿命预测的准确度。
针对这一问题, 本文基于邻域粗糙集理论, 分析了影响焊接接头疲劳寿命的因素, 构建了混合数据邻域粗糙集焊接接头疲劳影响因素分析智能模型, 并基于铝合金焊接接头疲劳实验数据对所构建的模型进行试验, 验证了模型的有效性。
粗糙集理论自从1982年由Pawlark教授[7]提出之后, 得到了广泛的应用和发展[8, 9]。粗糙集模型主要包括:经典粗糙集模型、模糊粗糙集模型[10]、基于容差关系粗糙集模型[11]和邻域粗糙集模型[12]。经典粗糙集模型和模糊粗糙集模型只能处理离散型数据, 对于取值连续型的数据, 首先需要进行离散化。然而, 连续数据在离散化处理的过程中难免会丢失重要信息, 而且, 不同的离散化策略往往导致不同的属性约简结果。容差关系粗糙集模型能够直接对连续数据属性进行约简, 但是需要属性值的概率分布情况等相关领域知识, 而邻域粗糙集模型不需要相关领域知识, 可以直接对取值连续的数值属性进行属性约简和特征提取[13]。下面首先给出邻域粗糙集中δ -邻域、上近似和下近似、依赖度、属性重要度、约简和核等几个基本概念的定义。
一般地, 信息系统IS=(U, A, V, f), 其中, U为有限非空对象集合{x1, x2, x3, …, xn}, 称为论域; A为非空属性集合{a1, a2, …, am}, 可以进一步划分为条件属性C和决策属性D, 即A=C∪ D, 此时的信息系统称为决策信息系统, 记为DS=(U, C, D, V, f); V=
定义1 (δ -邻域)给定决策系统DS=(U, C, D, V, f), 对于xi∈ U, 定义其δ -邻域为:
式中:δ ≥ 0, Δ 为一个距离函数, 对于∀ x1, x2, x3∈ U, Δ 满足:
①Δ (x1, x2)≥ 0, Δ (x1, x2)=0当且仅当x1=x2
②Δ (x1, x2)=Δ (x2, x1)
③Δ (x1, x3)≤ Δ (x1, x2)+Δ (x2, x3)
定义2 (上近似和下近似)给定决策系统DS=(U, C, D, V, f), X∈ U, 定义其上近似和下近似集分别为:
X的边界定义为:
定义3 (属性依赖度)给定决策系统DS=(U, C, D, V, f), B⊆C, 定义D对B的依赖度为:
定义4 (属性重要度)给定决策系统DS=(U, C, D, V, f), B⊆C, ∀ a∈ C-B, 定义a相对于B的重要度为:
定义5 (约简)给定决策系统DS=(U, C, D, V, f), B⊆C, 如果有γ B(D)=γ C(D)且∀ b∈ B, γ B(D)> γ B-b(D)成立, 则称B是C的一个约简。
定义6 (核)给定决策系统DS=(U, C, D, V, f), C为条件属性集合, B1, B2, …, Bn是C的所有约简, 则核定义为:core=
邻域粗糙集模型中属性约简算法采用的是前向贪心和后向剪枝相结合的算法, 算法的详细流程如图1所示。
图1中, ε 为属性重要度阈值, 其取值为略大于0的小正数; λ 为邻域半径计算参数。考虑到不同属性数据的取值变化范围的波动大小不同, 当属性数据的标准差较小时, 表明该属性数据波动比较小, 需要设定一个较小的邻域值; 当属性数据标准差较大时, 表明该属性数据波动比较大, 需要设定较大的邻域值。因而, 在算法设计过程中, 邻域半径大小的设定与属性标准差的取值成正比例关系, 属性ai的邻域半径计算公式为:
式中:λ 的取值范围为2~4。
通过查阅相关文献[14, 15, 16, 17], 搜集整理得到铝合金焊接接头疲劳数据库, 数据库中样本的个数为64, 并以此为基础来进行接头疲劳寿命影响因素邻域粗糙模型分析建模实验。在建立的疲劳数据库中, 取值为离散型的属性有:材料类型、焊接方法、载荷类型和接头类型。其中, 焊接方法包含4种:MIG焊、GMAW焊、TIG焊和Manual Arc焊; 材料类型包括5种:5083H11、AlMg4MnCr、AlMgSi1(6082)、NP5/6和HP30; 载荷类型包括两种:4B和T; 接头类型包括4种:TJ:p、LJ_SS:p、LJ_DS:p和SJ_DS:p。取值为连续型的属性有:板厚、应力比(σ min/σ max)、应力集中系数、名义应力、等效结构应力和疲劳寿命。限于篇幅, 仅列出疲劳数据库中具有代表性的部分数据, 如表1所示。其他的疲劳数据, 除具有不同的应力和疲劳寿命外, 其材料、焊接方法、板厚、应力比、载荷与接头类型、应力集中系数等均在表中有相应的代表数据行。
以名义应力作为应力值属性, 令C1={材料类型(a1), 焊接方法(a2), 板厚(a3), 应力比(a4), 载荷类型(a5), 接头类型(a6), 应力集中系数(a7), 名义应力(a8)}, D={lg(N)}构建焊接接头疲劳分析决策系统(一), 如表2所示。其中, N为疲劳寿命; D为接头疲劳寿命的对数值, 其取值的大小对应于焊接接头疲劳寿命的区间范围。
在Matlab中编写程序, 对图1中邻域粗糙集属性约简算法进行实现, 对建立的铝合金焊接决策信息系统(一)进行属性约简, 获取铝合金焊接接头疲劳寿命核心影响因集素, 并定量计算各核心影响因素的权重值。
试验中设置λ =2, ε =0.001, 得到接头疲劳寿命影响因素的约简结果为:{材料类型(a1), 应力比(a4), 名义应力(a8)}, 计算得到各属性a1~a8的权重向量为{0.1429, 0, 0, 0.4285, 0, 0, 0, 0.4285}。
为了进行对比试验分析, 以等效结构应力属性替换决策信息系统(一)(见表2)中的名义应力属性值得到铝合金焊接接头疲劳分析决策系统(二)(见表3)。
试验中仍然设置λ =2, ε =0.001, 对建立的铝合金焊接接头疲劳分析决策信息系统进行属性约简, 获取铝合金焊接接头疲劳寿命核心影响因素集, 并定量计算各核心影响因素的权重值。得到接头疲劳寿命影响因素的约简结果为:{材料类型(a1), 应力比(a4), 等效结构应力(a'8)}, 计算得到各属性a1~a8的权重向量分别为{0.2307, 0, 0, 0.2307, 0, 0, 0, 0.5385 }。
试验过程中, 得到铝合金焊接接头疲劳影响因素的约简结果分别为{材料类型, 应力比, 名义应力}和{材料类型, 应力比, 等效结构应力}。
约简结果表明, 相对于其他属性, 材料类型、应力比和应力是铝合金焊接接头疲劳寿命影响的关键因素, 且应力属性是其中权重最大的属性, 它对铝合金焊接接头疲劳寿命的影响最大。
通过定量计算, 分别得到了基于名义应力和等效结构应力的铝合金焊接接头疲劳寿命决策信息系统各影响因素的权重向量值, 其对比结果如图2所示。可以看出, 在基于名义应力的铝合金焊接接头疲劳寿命决策信息系统(一)中, 名义应力和应力比的权重值相等, 都是0.4285, 表明在用名义应力法进行焊缝疲劳寿命评估时, 应力比因素的影响不容忽视, 必须予以考虑。而在基于等效结构应力的铝合金焊接接头疲劳寿命决策信息系统(二)中, 等效结构应力影响因素的权重值为0.5385, 是所有影响因素中权重值最大的属性, 表明在采用等效结构应力法进行焊缝疲劳寿命评估时, 应力比因素的影响有所降低, 其权重值降为0.2307, 因而使用等效结构应力法能更准确地预测焊缝疲劳寿命。
(1)建立了既能处理符号型属性变量又能处理数值型属性变量的统一邻域粗糙集模型, 避免了在离散化过程中引入的量化误差和重要信息丢失等问题。
(2)属性约简结果表明, 在影响铝合金焊接接头疲劳寿命的诸多因素中, 除了应力之外, 材料类型和应力比也是关键因素。
(3)对铝合金焊接接头疲劳寿命各影响因素的权重进行了定量计算, 得到的权重值可以作为后续铝合金焊接接头疲劳寿命预测的依据。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|