粗糙集-神经网络在大气污染判别分析中的应用
2021-03-22
来源:榕意旅游网
维普资讯 http://www.cqvip.com 第7卷第17期2007年9月 科学技术与工程 Vo1.7 No.17 Sep.2007 1671—1819(2007)17—4545—03 Science Technology and Engineering @2007 Sci.Tech.Engng. 环境科学 粗糙集.神经网络在大气污染判别 分析中的应用 仝凌云潘佳 刁 鑫 (河北工业大学管理学院,天津300401) 摘要 针对大气污染判别问题的复杂性,提出了一种基于粗糙集的BP神经网络模型。该模型利用粗糙集理论约简气象影 响因素,提取关键因素作为网络的输入,简化了网络结构。实例验证,粗糙神经网络模型为大气污染判别研究提供了一种有 效可行的算法。 关键词 大气污染 属性约简 BP神经网络 中图法分类号X820.6; 文献标识码A 目前针对大气污染判别的研究广泛采用了基 表示 中每个对象的属性值。 于统计方法的预测模型。由于所观测的气象数据 定义1对于属性子集尺 A,尺的不可分辨 组织分散,且存在非线性及相关性,因此传统的方 关系(等价关系)为: 法具有一定的适用性。BP神经网络可以逼近任意 ind(尺)={( ,Y)∈ :V 0∈B√^( ,0)= 非线性函数,算法简单且效率高,可用于复杂系统 ,(Y,口)},包含尺的等价类为:U/R。 动态建模。粗糙集理论是一种刻画不完整性和不 定义2对于每个对象子集 和不可分辨 确定性的数学工具,能有效地分析和处理不精确、 关系尺, 的下近似集为:R =LJ 不完整的各种不完备信息,并从中发现潜在的规 {E J E ∈ J ind(R)^E ∈X}。设尺和 是属性 律;二者的集成运用为有效地进行大气污染判别分 集A的子集,属性 相对于属性尺的正域为: 析提供了方法。 POS (C)=∑B一(X)。 定义3对于属性0∈C的重要性为: 。(0) 1粗糙集理论的相关定义 =(J Pos。(D)J—J POS{。一。}(D)J)/J J,其中 设S=( ,A, 为一信息系统,其中 为有 表示II集合中元素的个数。 限非空的个体全集,A=C LJ D,C n D= ,表示 定义4设JR为一簇等价关系,尺 A、0∈R, 有限属性集,c和D分别为条件属性集与决策属性 如果ind(R)=ind(R一{0}),则称0为尺中可以 集。 为属性的值域,,:U X尺一 为一个信息函数, 决简的。对于Q R,若Q独立且ind(Q)= ind(R),则称Q为尺 的一个决简记为red(R)。 2007年5月9日收到 第一作者简介:仝凌云(1971一),女,河北省石家庄,博士,副教 2粗糙BP神经网络的建模方法 授,研究方向:运筹学与数学建模。 通信作者简介:潘佳(1981一),男,天津人,硕士,研究方向: 步骤1:连续型数据离散化处理系统的输入输 运筹学与数学建模的。 出数据可能是连续的或是离散的,在进行粗糙集数 维普资讯 http://www.cqvip.com 4546 科学技术与工程 7卷 据分析之前首先应将连续的数据量化处理。数据 果由表2所示。 表2离散化的大气污染数据 离散可根据实际情况,选择等分法、频分法、聚类离 散法等进行; 步骤2:属性约简,本文选用基于属性重要性的 约简算法进行约简; 步骤3:把经过简约后的数据信息表输入到BP 神经网络中训练,通过属性约简,原始数据样本的 冗余信息已被过滤掉,可有效地提高网络的训练 速度。 3粗糙BP神经网络在大气污染判别中的 应用 本次实证分析采用的是滨海新区化学加工区 具有代表性的15个大气取样点的数据资料,1 2 3 4 5 6 7 8 9 m ¨ 本文将 前1 1个样本数据作为原始数据样本,后4个样本数 3 1 2 1 1 3 3 2 2 2 据为测试样本。其中,氯(A1)、硫化氢(A2)、二氧化 硫(A3)、碳四(A4)、环氧氯丙烷(A5)、环乙烷(A6)2 1 1 3 3 1 2 2 3 2 为条件屙陛;大气污染分类(D)为决策属性,原始数 据如表1所示。 1 3 3 2 2 1 1 2 2 1 表1大气污染数据 ;2 2 3 3 3 2 1 1 2 2 3 3 1 1 3 2 1 3 2 3 3 2 2 1 2 1 2 2 2 2 1 3.1连续属性的离散化处理 本文采用模糊聚类 的方法对各个属性进行 离散化处理,具体算法由Matlab软件实现,离散结 3.2属性约简 1 依定义1与定义3可知: U/D={{1,2,3,5,10,11},{4,6,7,8,9}}; 1 U/C={{2,11}1,3,4,5,6,7,8,9,10}; (C—A1)={{2,11}{1,10},3,4,5,6,7,8, 3 1 9}则属性A1的重要性为y (A1)= ,同理可求 1 1 出y (A2)= ,y (A3)=y (A4)=y (A5)= 2 1 0,y (A6)= 。显然A3、A4、A5是可约简的,属 11 1 性集的相对约简为{A1,A2,A6}。 1 3.3仿真预测 将约简后的属性氯(A1)、硫化氢(A2)、环乙烷 (A6)作为BP神经网络的输入,采用试凑法确定隐 含层神经元数目,经多次仿真实验确定网络的结构 为3—8—1,训练误差设定为10~,采用附加动量BP 算法 作为网络各参数的学习算法,神经网络的实 现由Matlab实现,通过仿真实验,该网络需迭代328 步就达到了训练误差,而传统的BP神经网络在相 同的学习算法下需要迭代514步才能达到要求,图 1为粗糙BP神经网络的仿真训练图。 利用上述已训练好的网络对另外的三个数据 样本进行预测,预测结果如表3所示。 维普资讯 http://www.cqvip.com l7期 仝凌云,等:粗糙集一神经网络在大气污染判别分析中的应用 4547 测模型,充分利用粗糙集的数据分析处理能力,对 神经网络训练数据进行预处理,约简影响因素,简 化网络输人变量,确定输人变量及个数;提炼学习 样本,提高样本质量,并用粗糙集方法约简隐含层 神经元,从而优化了神经网络结构,改善了学习效 率。其基本思想也可以应用于其他神经网络方法, 预测模型也适用于其他领域的多因素预测问题。 328 Epochs 参考文献 图1粗糙BP网络的仿真训练 1徐泽柱,王林.基于粗糙集理论和BP神经网络的数据挖掘算法. 表3预测结果 计算机工程与应用,2004;31(4):169—175 2周勇.属性约简的依赖度算法研究.计算机工程与应用,2004,4 (2):78—_79 3张文修.粗糙集理论与方法.北京:科学出版社,2001 4李国勇.智能控制及其MATLAB实现.北京:电子工业出版 社,2005 5张涛,赵登福.基于RBF神经网络和专家系统的短期负荷预测 方法.西安交通大学学报,2001;35(4):331—334 6 Pawlak Z.Rough set theory and its applications to data analysis.Cy— 从预测结果可看出粗糙BP神经网络对大气污染的 bernetics and Systems,1998;29(11):661__688 预测准确率将近100%。 7 Pawlak Z.Rough sets.International Journal of Information and Com— puter Science,1982;11(5):341q56 4结论 8黎明.基于粗糙集的神经网络建模方法研究.自动化学报,2002, 28(1):27—33 本文提出了一种基于粗糙集的BP神经网络预 Application of Rough Neural Network in Discrimination of Air PoJlution TONG Ling—yun,PAN Jia,DIO Xin (College of Management,Hebei University of Technology,Tianjin 300401,P.R.China) [Abstract] For a complicated discrimination of air pollution,a new model of BP Networks is proposed based on Rough Set.This model was applied to.reduce factors of weather,withdraw essential ingredient as the input of the network,and simplify network structure.The application example showed that the rough neural network is an effi— eient and feasible algorithm to discrimination of air pollution. 『Key words] air pollution factor reduce BP neural network