公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)挖掘理論下的電氣工程應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)挖掘理論下的電氣工程應(yīng)用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

大數(shù)據(jù)挖掘理論下的電氣工程應(yīng)用

摘要:論文提出了一種基于大數(shù)據(jù)挖掘理論電氣工程故障分析方法。在該研究中,將全局信息引入電力系統(tǒng)中,主要采用大數(shù)據(jù)挖掘理論中的聚類分析技術(shù),快速準(zhǔn)確地檢測(cè)出故障分量和故障區(qū)段,最終完成故障分析。將全局信息引入電氣工程中,為電氣工程故障分析開辟了新的應(yīng)用領(lǐng)域。運(yùn)用大數(shù)據(jù)挖掘從大型數(shù)據(jù)庫(kù)信息中自動(dòng)提取有效的、新穎的、潛在有用的信息,且大數(shù)據(jù)挖掘理論可為電機(jī)工程的研究做出重要貢獻(xiàn)。

關(guān)鍵詞:故障分析;大數(shù)據(jù)挖掘;數(shù)據(jù)分類;電氣工程;聚類分析

1引言

大數(shù)據(jù)挖掘是從大量數(shù)據(jù)中有效地發(fā)現(xiàn)有價(jià)值的、不明顯的信息,這種涉及從數(shù)據(jù)中提取信息的過(guò)程也是一種探索性數(shù)據(jù)分析[1]。大數(shù)據(jù)挖掘是從存儲(chǔ)在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或其他信息庫(kù)中的大量數(shù)據(jù)中發(fā)現(xiàn)有趣的信息,如模式、關(guān)聯(lián)、變化、異常和重要結(jié)構(gòu)的過(guò)程[2]。大數(shù)據(jù)挖掘通常用于非常大的數(shù)據(jù)庫(kù),由于數(shù)據(jù)庫(kù)的復(fù)雜性和容量龐大,使得它通常是不能被解讀或分析。大數(shù)據(jù)挖掘的目的是從這些大型數(shù)據(jù)庫(kù)中發(fā)現(xiàn)有用的信息,這種過(guò)程被稱為數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabases,KDD)[3]。大數(shù)據(jù)挖掘涉及數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、高性能計(jì)算、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息檢索等多學(xué)科的技術(shù)集成[4~5]。大數(shù)據(jù)挖掘中的一個(gè)常見問(wèn)題是查找數(shù)據(jù)屬性之間的關(guān)聯(lián)。大數(shù)據(jù)挖掘任務(wù)有以下類別[6~8]:分類描述;關(guān)聯(lián)分析;聚類分析;孤立點(diǎn)分析;進(jìn)化分析。故障是指與觀察到的變量或與設(shè)備相關(guān)聯(lián)的計(jì)算參數(shù)在可接受范圍內(nèi)發(fā)生了偏離,即故障是一個(gè)過(guò)程異?;虬Y狀??偟膩?lái)說(shuō),故障與設(shè)備或儀表的正常行為相背離。它們可能出現(xiàn)在基本設(shè)備或其控制儀器中,并代表著性能惡化、部分故障或全部故障。故障分析的目的是通過(guò)行為異常識(shí)別系統(tǒng)來(lái)保證操作成功。由于適當(dāng)?shù)倪^(guò)程監(jiān)控,使停機(jī)時(shí)間最小化,改善了操作的安全性,降低了制造成本。一般來(lái)說(shuō),故障分析的過(guò)程可分為三個(gè)主要步驟[9]:報(bào)警、識(shí)別、評(píng)估。電力系統(tǒng)是一個(gè)最復(fù)雜的人工系統(tǒng),其安全、穩(wěn)定、經(jīng)濟(jì)可靠運(yùn)行,在社會(huì)經(jīng)濟(jì)的發(fā)展中起著非常重要的作用。為了解決電力系統(tǒng)故障分析這一難題,必須對(duì)電力系統(tǒng)本身及其復(fù)雜性不斷提高分析、運(yùn)行和控制水平。當(dāng)電力系統(tǒng)從正常運(yùn)行狀態(tài)到異常運(yùn)行故障時(shí),其電量可能發(fā)生顯著變化。繼電保護(hù)器就是利用電力的突然變化來(lái)判別電力系統(tǒng)是否發(fā)生故障或運(yùn)行異常。通過(guò)對(duì)電力測(cè)量與正常系統(tǒng)參數(shù)的對(duì)比,可以檢測(cè)出故障類型和故障位置。此外,還可以實(shí)現(xiàn)選擇性故障排除。在本研究中,全局信息將被引入后備保護(hù)系統(tǒng)中。在某些故障后,利用電源管理單元(PhasorMeasurementUnit,PMU)進(jìn)行實(shí)時(shí)測(cè)量,并對(duì)電量變化的特征進(jìn)行查找。然后對(duì)故障分量和故障區(qū)段進(jìn)行快速準(zhǔn)確的分析,最終完成故障隔離?;诮y(tǒng)計(jì)理論,還將對(duì)非線性復(fù)雜系統(tǒng)進(jìn)行大量的基礎(chǔ)研究,采用大數(shù)據(jù)挖掘中的聚類分析技術(shù)解決電氣工程中的故障檢測(cè)問(wèn)題。

2電路原理

考慮一個(gè)帶有電阻器(R)、電感器(L)和電容器(C)的電路。每一個(gè)元件在回路中連接電路,包含一個(gè)元件的電路部分稱為支路。支路連接的點(diǎn)稱為節(jié)點(diǎn)。在這個(gè)最簡(jiǎn)單的測(cè)試中,有三個(gè)分支和節(jié)點(diǎn).令iR,iL和iC分別代表經(jīng)過(guò)對(duì)應(yīng)電阻R,電感器L和電容器C的電流,同樣地,vR,vL和vC分別代表電路的三個(gè)支路上的電壓。如果認(rèn)為水是通過(guò)管道流動(dòng)的,那么電流就像水的流量一樣,電壓就像水的壓力一樣?;鶢柣舴螂娏鞫芍赋觯魅胍粋€(gè)節(jié)點(diǎn)的總電流必須等于從該節(jié)點(diǎn)流出的電流。這意味著在討論的電路中電流關(guān)系為|iR|=|iL|=|iC|。按圖1所示的方向定位分支,則i=iR=iL=iC(1)基爾霍夫電壓定律指出,所有回路電壓降之和為零。則vR+vL+vC=0(2)對(duì)于電路元件的性質(zhì)和決定變量的規(guī)律研究中,電阻器是由電流iR和電壓vR之間的關(guān)系確定。因此只考慮一個(gè)線性電阻,根據(jù)歐姆定律,可得vR=R×iR(3)其中,R>0為常數(shù),vR和iR互為非線性函數(shù)關(guān)系。電感器的特點(diǎn)是電流對(duì)時(shí)間的導(dǎo)數(shù)diL/dt,對(duì)于電感器的電壓vL,根據(jù)法拉第定律,可得LdiRdt=vL(4)其中,常數(shù)L>0被稱為電感。電感器是通過(guò)一個(gè)線圈制作構(gòu)成,線圈中電流變化引起的磁場(chǎng)在線圈上產(chǎn)生電壓降。電容器的特點(diǎn)是電壓對(duì)時(shí)間的導(dǎo)數(shù)dvC/dt,對(duì)于電容器的電流iC為CdvCdt=iC(5)其中,常數(shù)C>0被稱為電容。

3數(shù)據(jù)挖掘中的分類

分類是大數(shù)據(jù)挖掘領(lǐng)域的經(jīng)典課題之一[10]。聚類是將數(shù)據(jù)對(duì)象分類成一組不相交類的過(guò)程,稱為簇,因此類中的對(duì)象之間具有高度的相似性[11]。聚類是無(wú)監(jiān)督分類的一個(gè)分支。“分類”是指將數(shù)據(jù)對(duì)象分配給一組類的過(guò)程。“無(wú)監(jiān)督”意味著集群不依賴于預(yù)定義的類,而對(duì)數(shù)據(jù)對(duì)象進(jìn)行分類[12]。聚類分析的應(yīng)用包括以下三個(gè)方面[13]:1)識(shí)別原始數(shù)據(jù)中的簇;2)確定原始數(shù)據(jù)中簇的個(gè)數(shù);3)驗(yàn)證原始數(shù)據(jù)中發(fā)現(xiàn)的簇。聚類分析具有很強(qiáng)的數(shù)據(jù)分析能力,已成功應(yīng)用于各個(gè)領(lǐng)域的研究。假設(shè)有n個(gè)樣本,每個(gè)樣本有m個(gè)指標(biāo),觀測(cè)數(shù)據(jù)可以表示為αij(i=1nj=1m)。最常用的描述關(guān)系程度的測(cè)量是距離dij通常表示樣本ξ(i)和η(j)之間的距離。常用的距離定義包括:1)Minkovski距離:dij(q)=éëêùûåút=1mα||it-αjtq1q(6)2)Lance距離[14]:dij(L)=1måt=1mα||it-αjt(αit+αjt)(7)3)馬氏距離:dij(M)=(ξ(i)-η(j))'S-1(ξ(i)-η(j))(8)其中,S-1是樣本協(xié)方差矩陣的逆矩陣。4)斜空間距離[15]:為了克服相對(duì)論的影響,我們可以定義斜空間的距離:dij=éëêùûú1måk=1mål=1m(αik-αjk)(αil-αjl)ρkl12(9)其中,ρkl是ξ(k)與η(l)的相關(guān)系數(shù)。

4基于數(shù)據(jù)挖掘的故障分析

考慮IEEE-9總線系統(tǒng),在電力網(wǎng)的結(jié)構(gòu)中,總線1出現(xiàn)單相接地故障。通過(guò)BPA程序,相應(yīng)變量的向量值只在每個(gè)周期中輸出一次。相應(yīng)變量使用實(shí)際測(cè)量的數(shù)據(jù),可以進(jìn)行故障和非故障的元件分析(故障和非故障段)。4.1基于節(jié)點(diǎn)相電壓的故障診斷在計(jì)算IEEE-9總線系統(tǒng)后,可以得到五個(gè)時(shí)刻T-1、T0(故障)、T1、T2和T3的節(jié)點(diǎn)相電壓.整個(gè)聚類分析過(guò)程遵循從高到低(從近到遠(yuǎn))的相似性原則,順序是:步驟1:總線C與總線B結(jié)合并形成新的總線B;步驟2:總線3與總線2結(jié)合并形成新的總線2;步驟3:總線A與總線2結(jié)合并形成新的總線2;步驟4:總線2與支路1結(jié)合并形成新的支路1;步驟5:支路3與支路2結(jié)合并形成新的支路2;步驟6:支路2與支路1結(jié)合并形成新的支路1;步驟7:總線B與總線1結(jié)合并形成新的總線1;步驟8:總線1與支路1結(jié)合并形成新的支路1。總線1與其他總線有著顯著的不同,其故障特征是明顯的。這些結(jié)果與預(yù)先設(shè)定的故障位置完全相同,因此我們可以通過(guò)基于節(jié)點(diǎn)相電壓的聚類分析來(lái)確定故障位置。4.2基于節(jié)點(diǎn)負(fù)序電壓的故障診斷通過(guò)BPA程序,可以得到五個(gè)時(shí)刻T-1、T0(故障)、T1、T2和T3的節(jié)點(diǎn)負(fù)序電壓.整個(gè)聚類分析過(guò)程仍然按照相似性原則進(jìn)行,從高到低(從近到遠(yuǎn))的相似原則,順序是:步驟1:總線A與總線2結(jié)合并形成新的總線2;步驟2:總線3與總線2結(jié)合并形成新的總線2;步驟3:總線C與總線B結(jié)合并形成新的總線B;步驟4:總線2與支路1結(jié)合并形成新的支路1;步驟5:支路3與支路2結(jié)合并形成新的支路2;步驟6:支路2與支路1結(jié)合并形成新的支路1;步驟7:總線B與總線1結(jié)合并形成新的總線1;步驟8:總線1與支路1結(jié)合并形成新的支路1。從整個(gè)聚類過(guò)程分析中,總線1與其他節(jié)點(diǎn)的相似性最低(與其他節(jié)點(diǎn)的距離最遠(yuǎn))??偩€1和其他總線的差異更明顯。因此,利用基于節(jié)點(diǎn)負(fù)序電壓的聚類分析也能有效地識(shí)別出故障點(diǎn)。這些實(shí)例充分證明了大數(shù)據(jù)挖掘理論可以對(duì)故障部分進(jìn)行分析。

5結(jié)語(yǔ)

在電力系統(tǒng)的控制中,特別是在電力系統(tǒng)的廣域后備保護(hù)中,保護(hù)裝置的準(zhǔn)確、快速、可靠性能的前提是相應(yīng)的故障類型和故障位置可以快速識(shí)別并準(zhǔn)確定義。在本研究中,全局信息已經(jīng)被引入到后備保護(hù)系統(tǒng)中?;诖髷?shù)據(jù)挖掘理論,主要利用聚類分析技術(shù)來(lái)尋找電量的顯著變化特征。然后,對(duì)故障部件和故障部分進(jìn)行快速準(zhǔn)確的識(shí)別,最后完成故障分析。本文的主要技術(shù)貢獻(xiàn)和創(chuàng)新在于將全局信息引入到電氣工程中,為電氣工程的故障分析開發(fā)新的應(yīng)用。大數(shù)據(jù)挖掘被定義為從大型數(shù)據(jù)庫(kù)中自動(dòng)提取有效、新穎、潛在有用且全面的信息挖掘過(guò)程。它在學(xué)術(shù)和應(yīng)用科學(xué)研究中得到了廣泛的應(yīng)用,在這些研究中,數(shù)據(jù)集是通過(guò)實(shí)驗(yàn)產(chǎn)生的。大數(shù)據(jù)挖掘理論的最重要特征是其跨學(xué)科性和普遍性。大數(shù)據(jù)挖掘在很大程度上與機(jī)器學(xué)習(xí)有關(guān),在機(jī)器學(xué)習(xí)中,科學(xué)家開發(fā)算法和技術(shù)來(lái)發(fā)現(xiàn)和描述數(shù)據(jù)中的潛在規(guī)律。因此,大數(shù)據(jù)挖掘?yàn)樾畔⑻幚?、模式識(shí)別和人工智能等許多領(lǐng)域提供了有用的技術(shù)。

參考文獻(xiàn)

[1]王元卓,賈巖濤,劉大偉,等.基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘[J].計(jì)算機(jī)研究與發(fā)展,2015,52(02):456-474.

[2]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015,1(04):57-80.

[3]趙建華.半監(jiān)督學(xué)習(xí)在網(wǎng)絡(luò)入侵分類中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用研究,2014,31(06):1874-1876.

[4]馬昱欣,曹震東,陳為.可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘方法綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2016,28(01):1-8.

[5]梁吉業(yè),錢宇華,李德玉,等.大數(shù)據(jù)挖掘的粒計(jì)算理論與方法[J].中國(guó)科學(xué):信息科學(xué),2015,45(11):1355-1369.

[6]吉根林,趙斌.面向大數(shù)據(jù)的時(shí)空數(shù)據(jù)挖掘綜述[J].南京師大學(xué)報(bào)(自然科學(xué)版),2014,37(01):1-7.

[7]何清,莊福振,曾立,等,譚慶.PDMiner:基于云計(jì)算的并行分布式數(shù)據(jù)挖掘工具平臺(tái)[J].中國(guó)科學(xué):信息科學(xué),2014,44(07):871-885.

[8]賀瑤,王文慶,薛飛.基于云計(jì)算的海量數(shù)據(jù)挖掘研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(02):69-72.

[9]許侃,范春菊.不同電壓等級(jí)部分耦合線路的單回線故障分析[J].電力系統(tǒng)自動(dòng)化,2015,39(12):81-87.

[10]陳新.數(shù)據(jù)挖掘分類方法中的決策樹算法探究[J].電腦知識(shí)與技術(shù),2013,9(35):7904-7905,7910.

[11]鄧曦輝.軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法[J].電子技術(shù)與軟件工程,2016(24):188.

[12]王競(jìng)哲.基于聚類分析的數(shù)據(jù)挖掘算法研究[J].信息化建設(shè),2016(06):36.

[13]李昀昊,王建學(xué),王秀麗.基于混合聚類分析的電力系統(tǒng)網(wǎng)損評(píng)估方法[J].電力系統(tǒng)自動(dòng)化,2016,40(01):60-65.

[14]LiJunguo,ZengYanan,Wang,Jianqiang.SimulationofFlowFieldofOxygenLanceGasJetUtilizedfor50tCon⁃verter[J].JournalofIronandSteelResearch(Interna⁃tional),2011,18(04):11-18.

[15]GenChao,LiuJie,XiKai,etal.MonteCarloevaluationofspatialmultiple-bitupsetsensitivitytoobliqueinci⁃dence[J].ChinesePhysicsB,2013,22(05):661-668.

作者:吳嶸 單位:南京理工大學(xué)