公務(wù)員期刊網(wǎng) 論文中心 正文

石油勘探應(yīng)用軟件資源需求分析

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了石油勘探應(yīng)用軟件資源需求分析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

石油勘探應(yīng)用軟件資源需求分析

摘要:采集石油勘探應(yīng)用軟件模塊運(yùn)行時(shí)的資源消耗信息,包括不同模塊對(duì)服務(wù)器資源占用情況的數(shù)據(jù)。根據(jù)需求采集相關(guān)數(shù)據(jù),包括CPU、內(nèi)存、網(wǎng)絡(luò)、臨時(shí)盤(pán)等。在勘探開(kāi)發(fā)云平臺(tái)運(yùn)行應(yīng)用軟件資源需求已知模塊的作業(yè),采集資源消耗數(shù)據(jù)。根據(jù)所采集數(shù)據(jù)的模塊資源需求特點(diǎn),對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,使用極限梯度提升(extremegradientboosting,XGBoost)算法,建立模型并訓(xùn)練。采集資源需求未知模塊作業(yè)運(yùn)行時(shí)的資源消耗數(shù)據(jù),根據(jù)之前建立的模型確定此模塊的資源需求類(lèi)型。使用資源調(diào)度算法,以將資源需求互補(bǔ)的虛擬機(jī)部署到相同的物理節(jié)點(diǎn)為目標(biāo),計(jì)算虛擬機(jī)部署位置,通過(guò)虛擬機(jī)遷移實(shí)現(xiàn)計(jì)算資源優(yōu)化分配。

關(guān)鍵詞:機(jī)器學(xué)習(xí);XGBoost算法;石油勘探應(yīng)用軟件;資源需求

0引言

在云計(jì)算高速發(fā)展的大背景下,硬件資源高度集中,結(jié)合軟件形成了龐大的應(yīng)用系統(tǒng),在石油勘探行業(yè)這種趨勢(shì)更為顯著。硬件資源的分配情況將直接影響應(yīng)用系統(tǒng)的運(yùn)行效率。通過(guò)互聯(lián)網(wǎng)調(diào)查公司發(fā)布的數(shù)據(jù)顯示,在軟件運(yùn)維過(guò)程中,CPU、內(nèi)存、網(wǎng)絡(luò)、臨時(shí)盤(pán)空間這些因素,對(duì)應(yīng)用系統(tǒng)運(yùn)行效率會(huì)產(chǎn)生比較重要的影響,這些資源的不足往往會(huì)造成應(yīng)用系統(tǒng)速度變慢,運(yùn)行效率降低,影響用戶(hù)的體驗(yàn)。因此,通過(guò)對(duì)應(yīng)用軟件模塊資源應(yīng)用分析研究,開(kāi)展一定時(shí)間的數(shù)據(jù)采集和挖掘,并對(duì)已知的資源需求進(jìn)行標(biāo)定,通過(guò)機(jī)器學(xué)習(xí)、人工智能手段深入的發(fā)掘資源消耗的規(guī)律性因素,建立一種監(jiān)控指標(biāo)與應(yīng)用軟件運(yùn)行資源需求預(yù)測(cè)模型,采用神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)技術(shù),對(duì)資源需求進(jìn)行預(yù)測(cè),主動(dòng)進(jìn)行主機(jī)資源運(yùn)行優(yōu)化,減少資源分配問(wèn)題對(duì)用戶(hù)工作效率的影響,能有效提高系統(tǒng)管理工作的信息化水平。隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,數(shù)據(jù)的豐富度和覆蓋面遠(yuǎn)超出了人工可以觀察和總結(jié)的范疇。結(jié)合了統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)科學(xué)和計(jì)算機(jī)科學(xué)的機(jī)器學(xué)習(xí)已成為人工智能和數(shù)據(jù)科學(xué)發(fā)展的主流方向之一。分類(lèi)問(wèn)題作為機(jī)器學(xué)習(xí)的一部分,成了研究的重點(diǎn)[1]。以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)是當(dāng)前最接近人類(lèi)大腦的智能學(xué)習(xí)方法和認(rèn)知過(guò)程,充分借鑒了人腦的多分層結(jié)構(gòu)、神經(jīng)元的連接交互、分布式稀疏存儲(chǔ)和表征、信息的逐層分析處理機(jī)制,自適應(yīng)、自學(xué)習(xí)的強(qiáng)大并行信息處理能力,在語(yǔ)音、圖像識(shí)別等方面取得了突破性進(jìn)展,在諸多應(yīng)用領(lǐng)域取得巨大商業(yè)成功[2]。鄔春明等[3]結(jié)合極限梯度提升算法和實(shí)體嵌入網(wǎng)絡(luò),提出了一種基于XGBoost-EE的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法。徐偉等[4]為了降低網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)的虛警率,提出一種混合式網(wǎng)絡(luò)入侵檢測(cè)方法,將人工蜂群算法用于特征提取,XGBoost算法用于特征分類(lèi)和評(píng)價(jià)。張穎等[5]針對(duì)惡意的第三方廠(chǎng)商在電路設(shè)計(jì)階段中植入硬件木馬的問(wèn)題,提出一種基于XGBoost的混合模式門(mén)級(jí)硬件木馬檢測(cè)方法。孫朝云等[6]為了科學(xué)有效地評(píng)估高速公路服務(wù)區(qū)交通通行服務(wù)能力和進(jìn)行基礎(chǔ)設(shè)施優(yōu)化配置,提出一種基于改進(jìn)粒子群算法和XGBoost融合的高速公路服務(wù)區(qū)交通量預(yù)測(cè)模型。趙力等[7]針對(duì)采用遙感技術(shù)監(jiān)測(cè)氮、磷研究中反演模型精度不夠高、小尺度水體研究受限于數(shù)據(jù)源分辨率的問(wèn)題,提出了一種結(jié)合高分一號(hào)影像和XGBoost模型的水體總氮、總磷濃度反演技術(shù)。陳莊等[8]為了進(jìn)一步提升水務(wù)企業(yè)工作效率,解決抄表數(shù)據(jù)審核工作量大、保證數(shù)據(jù)準(zhǔn)確性等問(wèn)題,在傳統(tǒng)的XGBoost預(yù)測(cè)算法基礎(chǔ)上提出一種基于MIC-XGBoost的混合預(yù)測(cè)模型。

1總體架構(gòu)

通過(guò)采集模塊對(duì)軟件模塊的運(yùn)行數(shù)據(jù)進(jìn)行采集,并對(duì)這些數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)定,基于機(jī)器學(xué)習(xí)技術(shù),對(duì)不同的模塊來(lái)進(jìn)行資源的特征畫(huà)像,系統(tǒng)根據(jù)不同類(lèi)型軟件模塊對(duì)資源的需求情況,設(shè)置不同的調(diào)度策略,從而實(shí)現(xiàn)主機(jī)智能部署調(diào)度、智能控制。系統(tǒng)總體架構(gòu)如圖1所示。

2獲取計(jì)算機(jī)運(yùn)行數(shù)據(jù)

在計(jì)算機(jī)安裝運(yùn)行數(shù)據(jù)采集插件。進(jìn)程采集模塊基于Go語(yǔ)言開(kāi)發(fā),使用了go-cmp、text、fakescraper、go-seq、process-exporter、client_golang、common、procfs、sys、xer-rors、protobuf、check、yaml模塊,采集計(jì)算機(jī)CPU利用率、內(nèi)存占用、磁盤(pán)讀寫(xiě)、網(wǎng)絡(luò)帶寬等相關(guān)數(shù)據(jù),并將采集的監(jiān)控?cái)?shù)據(jù)按照時(shí)間保存到MySQL數(shù)據(jù)庫(kù)中。采用多線(xiàn)程輪詢(xún)的模式向采集代理程序拉取指標(biāo)數(shù)據(jù),并將采集的數(shù)據(jù)保存到時(shí)序數(shù)據(jù)庫(kù)中。

3軟件模塊與進(jìn)程關(guān)系分析

分析石油勘探專(zhuān)業(yè)軟件運(yùn)行機(jī)制。以O(shè)mega軟件為例,Omega在提交作業(yè)后一般產(chǎn)生單個(gè)主進(jìn)程,主進(jìn)程在進(jìn)行作業(yè)調(diào)用模塊時(shí),通過(guò)調(diào)用動(dòng)態(tài)鏈接庫(kù)的模式來(lái)工作,不再產(chǎn)生新的進(jìn)程,傳統(tǒng)通過(guò)進(jìn)程來(lái)獲取模塊信息的方式已經(jīng)不能滿(mǎn)足需求。經(jīng)研究Omega的運(yùn)行方式、進(jìn)行特點(diǎn)和軟件目錄架構(gòu)發(fā)現(xiàn),這些模塊的動(dòng)態(tài)鏈接庫(kù)都保存在Omega的安裝目錄的lib下,通過(guò)[lsof]獲取這些模塊鏈接庫(kù)的調(diào)用棧,并與當(dāng)前運(yùn)行環(huán)境的進(jìn)程列表進(jìn)行匹配,就能夠獲取Omega作業(yè)當(dāng)前所運(yùn)行的模塊情況。Omega進(jìn)程采集原理如圖2所示。采集過(guò)程包含了多個(gè)步驟。讀取配置文件,加載MySQL數(shù)據(jù)庫(kù)連接參數(shù),接口參數(shù),定時(shí)任務(wù)參數(shù);創(chuàng)建數(shù)據(jù)庫(kù)連接對(duì)象,讀取module_type(模塊總表),檢驗(yàn)?zāi)K對(duì)應(yīng)指標(biāo)表是否已創(chuàng)建,如未創(chuàng)建,則根據(jù)module_indicators(模塊樣本參數(shù)模版表),創(chuàng)建對(duì)應(yīng)模塊的樣本數(shù)據(jù)表;根據(jù)接收的命令參數(shù),執(zhí)行一次性的數(shù)據(jù)生成過(guò)程或定時(shí)過(guò)程;一次性數(shù)據(jù)的生成過(guò)程需要指定一個(gè)起始時(shí)間,從起始時(shí)間開(kāi)始,每10min的某模塊的采集數(shù)據(jù)作為一個(gè)樣本存入對(duì)應(yīng)模塊的樣本數(shù)據(jù)表;定時(shí)過(guò)程是從程序運(yùn)行時(shí)開(kāi)始,每10min進(jìn)行一次樣本數(shù)據(jù)的匯總?cè)霂?kù)操作;總樣本數(shù)據(jù)操作,按照查詢(xún)模版的配置查詢(xún)監(jiān)控采集服務(wù)器,并將多個(gè)指標(biāo)在10min區(qū)間的數(shù)據(jù)整合成一個(gè)樣本數(shù)據(jù),入庫(kù)MySQL對(duì)應(yīng)模塊的樣本數(shù)據(jù)表。通過(guò)對(duì)石油勘探生產(chǎn)環(huán)境下的Omega運(yùn)行目錄和當(dāng)前運(yùn)行作業(yè)流程文件進(jìn)行對(duì)比,發(fā)現(xiàn)Omega的模塊以動(dòng)態(tài)鏈接庫(kù).so的方式來(lái)加載和調(diào)用,當(dāng)作業(yè)流程需要調(diào)用某一個(gè)模塊的時(shí)候,Omega主進(jìn)程會(huì)將對(duì)應(yīng)的模塊鏈接庫(kù)動(dòng)態(tài)的加載到內(nèi)存中。

4機(jī)器學(xué)習(xí)

4.1樣本數(shù)據(jù)預(yù)處理

采集的集群節(jié)點(diǎn)運(yùn)行指標(biāo)數(shù)據(jù),為保證效率,首先保存在時(shí)序數(shù)據(jù)庫(kù)中,實(shí)時(shí)數(shù)據(jù)保存180天,訓(xùn)練樣本數(shù)據(jù)長(zhǎng)期保存,并通過(guò)轉(zhuǎn)儲(chǔ)工具,將處理后的實(shí)時(shí)數(shù)據(jù)保存到MySQL數(shù)據(jù)庫(kù)中作為樣本數(shù)據(jù),再以API的方式來(lái)為機(jī)器學(xué)習(xí)提供訓(xùn)練數(shù)據(jù)集。將時(shí)間序列數(shù)據(jù)提取最大值,均值,方差等轉(zhuǎn)換成特征數(shù)據(jù)。并對(duì)數(shù)據(jù)做歸一化、缺失值處理,對(duì)處理后的數(shù)據(jù)集進(jìn)行特征選擇,選取與標(biāo)簽相關(guān)性最好的若干個(gè)特征作為模型訓(xùn)練的特征,再進(jìn)行必要的數(shù)據(jù)分組或者分割。

4.2機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)軟件采用Python語(yǔ)言進(jìn)行開(kāi)發(fā),使用了xg-boost、numpy、pandas、random、os等模塊,對(duì)采集到的數(shù)據(jù)做特征工程,對(duì)數(shù)據(jù)進(jìn)行升維,為多維度特征挖掘提供數(shù)據(jù)基礎(chǔ)。去除空值:data.dropna()提取各列特征數(shù)據(jù)的最大值:data_mk_max=data.groupby(['sample_id'],sort=False,as_index=False).max()提取各列特征數(shù)據(jù)的平均值:data_mk_mean=data.groupby(['sample_id'],sort=False,as_index=False).mean()提取各列特征數(shù)據(jù)的方差:data_mk_var=data.groupby(['sample_id'],sort=False,as_index=False).var()將標(biāo)注的訓(xùn)練數(shù)據(jù)集作為XGBoost算法的輸入樣本,進(jìn)行訓(xùn)練,獲得模型,輸出模塊類(lèi)型。然后利用驗(yàn)證數(shù)據(jù)集對(duì)訓(xùn)練后的模型進(jìn)行驗(yàn)證,若滿(mǎn)足精度要求,則獲得訓(xùn)練好的模型,利用訓(xùn)練好的模型,對(duì)作業(yè)模塊類(lèi)型進(jìn)行預(yù)測(cè),給出預(yù)測(cè)的模塊類(lèi)型。根據(jù)已知軟件模塊的需求,來(lái)預(yù)測(cè)其它軟件模塊的資源需求類(lèi)型,按照目前給定的資源需求類(lèi)型可以分為4類(lèi):CPU密集型、內(nèi)存密集型、臨時(shí)盤(pán)密集型、以上均不是,因此,在指標(biāo)的選擇上也主要圍繞以上幾類(lèi)資源類(lèi)型來(lái)進(jìn)行選擇,通過(guò)對(duì)采集的監(jiān)控指標(biāo)進(jìn)行分析,明確用于模塊資源預(yù)測(cè)所需要的指標(biāo)數(shù)據(jù)包含:內(nèi)存總量、模塊CPU占用率、模塊內(nèi)存占用率、模塊磁盤(pán)占用率、當(dāng)前節(jié)點(diǎn)CPU占用率、當(dāng)前節(jié)點(diǎn)內(nèi)存占用率、當(dāng)前節(jié)點(diǎn)磁盤(pán)占用率、時(shí)間戳,共計(jì)8個(gè)指標(biāo)。通過(guò)對(duì)比決策樹(shù)算法、隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、XGBoost等算法,根據(jù)實(shí)際采集數(shù)據(jù)情況,采用XGBoost算法來(lái)進(jìn)行預(yù)測(cè)。極限梯度提升樹(shù)算法是Boosting集成算法的一種,通常以決策樹(shù)為基學(xué)習(xí)器,新生成的樹(shù)不斷學(xué)習(xí)當(dāng)前樹(shù)預(yù)測(cè)值與真實(shí)值之間的殘差,最終將多棵樹(shù)的學(xué)習(xí)結(jié)果累加作為預(yù)測(cè)結(jié)果。由于XGBoost算法是基于樹(shù)模型的,當(dāng)決策樹(shù)的數(shù)量過(guò)多時(shí),則會(huì)出現(xiàn)過(guò)擬合。除了調(diào)整決策樹(shù)個(gè)數(shù)、迭代速率和樹(shù)模型最大深度等參數(shù)控制復(fù)雜度外,XGBoost算法在求解最優(yōu)樹(shù)結(jié)構(gòu)過(guò)程中引入正則化策略來(lái)控制模型整體過(guò)擬合程度,XGBoost算法在最小化目標(biāo)函數(shù)過(guò)程中不斷調(diào)整生成新的樹(shù)結(jié)構(gòu),最終目標(biāo)函數(shù)與樹(shù)結(jié)構(gòu)(包括每棵樹(shù)的深度、葉子節(jié)點(diǎn)數(shù)量、葉子節(jié)點(diǎn)位置等)緊密相關(guān),因此,利用該算法本身不斷減小偏差、限制方差、生成最優(yōu)樹(shù)結(jié)構(gòu)的特性可創(chuàng)造大量新特征集[9]。XGBoost算法實(shí)現(xiàn)的關(guān)鍵參數(shù)樣例:n_estimators=200#弱決策樹(shù)數(shù)量max_depth=5#樹(shù)的最大深度learning_rate=0.1#學(xué)習(xí)速率gamma=0#最小損失函數(shù)下降值subsample=0.8#樣本隨機(jī)采樣比train_percentage=0.8#樣本分割比例,訓(xùn)練樣本占比self.min_child_weight=6#最小樣本權(quán)重的和reg_lambda=1#L2正則化項(xiàng)參數(shù)reg_alpha=0#權(quán)重L1正則化項(xiàng)seed=0#復(fù)現(xiàn)隨機(jī)數(shù)據(jù)結(jié)果col_sample_by_tree=0.8#特征隨機(jī)采樣比將預(yù)處理完成的數(shù)據(jù)導(dǎo)入模型,進(jìn)行模型訓(xùn)練,通過(guò)對(duì)模型準(zhǔn)確度反饋,以及對(duì)參數(shù)重要性指標(biāo)的分析,不斷調(diào)節(jié)參數(shù),找到最合適的參數(shù)。模型訓(xùn)練流程如圖3所示。按照訓(xùn)練模型數(shù)據(jù)預(yù)處理流程,將實(shí)時(shí)數(shù)據(jù)做處理,導(dǎo)入已有模型,根據(jù)模塊的實(shí)時(shí)數(shù)據(jù)進(jìn)行模塊分類(lèi)。模型預(yù)測(cè)流程如圖4所示。通過(guò)業(yè)務(wù)人員對(duì)分類(lèi)結(jié)果進(jìn)行確認(rèn),填充樣本庫(kù),用新的樣本庫(kù)重新訓(xùn)練模型,不斷優(yōu)化模型。模型優(yōu)化流程如圖5所示。

5云主機(jī)調(diào)度

通過(guò)模塊資源需求類(lèi)型與主機(jī)總體資源情況相結(jié)合,建立云主機(jī)調(diào)度策略,將不存在資源競(jìng)爭(zhēng)的虛擬機(jī)調(diào)度到同一臺(tái)物理機(jī)服務(wù)器上,在減少資源競(jìng)爭(zhēng)的同時(shí),盡可能地發(fā)揮主機(jī)的最大利用率。周平等[10]提出基于馬爾科夫預(yù)測(cè)模型的云資源調(diào)度算法,實(shí)現(xiàn)節(jié)點(diǎn)負(fù)載判斷、待遷移任務(wù)和節(jié)點(diǎn)選擇、遷移路由的決策,以解決云服務(wù)節(jié)點(diǎn)失效情況下的任務(wù)調(diào)度和負(fù)載均衡問(wèn)題,實(shí)現(xiàn)快速的云服務(wù)故障恢復(fù),提高云服務(wù)的可靠性。宋維佳等[11]提出作為云計(jì)算的重要支撐技術(shù),虛擬化提供了熱遷移、負(fù)載轉(zhuǎn)移等技術(shù)豐富了云計(jì)算資源調(diào)度手段。利用這些技術(shù),資源調(diào)度要解決如何將計(jì)算資源合理分配給服務(wù),一方面保證在負(fù)載動(dòng)態(tài)變化的情況下服務(wù)質(zhì)量不受影響,另一方面減少數(shù)據(jù)中心的能源消耗。調(diào)度原理如圖6所示?;谀K類(lèi)別和占用資源的情況,根據(jù)當(dāng)前服務(wù)器正在運(yùn)行的模塊分類(lèi),將要運(yùn)行的模塊進(jìn)行分配調(diào)度,以保證發(fā)揮服務(wù)器的最大能力,即在有限的計(jì)算能力下運(yùn)行更多的模塊,這是典型的最優(yōu)化問(wèn)題。對(duì)比爬山法、遺傳算法、動(dòng)態(tài)規(guī)劃等算法,動(dòng)態(tài)規(guī)劃算法(dynamicprogramming,DP)是由美國(guó)數(shù)學(xué)家R.E.Bellma求解多決策問(wèn)題時(shí)提出的一種優(yōu)化算法,特點(diǎn)在于搜索效率髙,結(jié)果穩(wěn)定可靠,從而受到廣泛的關(guān)注[12]。針對(duì)要解決問(wèn)題的特點(diǎn),采用動(dòng)態(tài)規(guī)劃算法來(lái)進(jìn)行主機(jī)調(diào)度模型的建立。利用預(yù)測(cè)好的模塊類(lèi)型,分析作業(yè)的資源占用情況,以目前各個(gè)節(jié)點(diǎn)的作業(yè)類(lèi)型為基礎(chǔ),計(jì)算新發(fā)布的作業(yè)所在的節(jié)點(diǎn)的資源占用是否超過(guò)物理機(jī)上限,若存在物理機(jī)超上限,則運(yùn)用動(dòng)態(tài)規(guī)劃算法,根據(jù)當(dāng)前物理機(jī)、虛擬機(jī)節(jié)點(diǎn)的CPU計(jì)算核心數(shù)量、CPU負(fù)載、內(nèi)存、緩存、IO時(shí)延等指標(biāo)數(shù)據(jù),對(duì)虛擬機(jī)進(jìn)行遷移,使得遷移后的節(jié)點(diǎn)資源占用都在物理機(jī)的接收范圍內(nèi),對(duì)云主機(jī)資源合理分配。6軟件主要功能實(shí)現(xiàn)了應(yīng)用軟件模塊資源占用監(jiān)控,針對(duì)已知資源需求的應(yīng)用模塊資源占用建模,使用機(jī)器學(xué)習(xí)算法訓(xùn)練模型,通過(guò)機(jī)器學(xué)習(xí)確定勘探開(kāi)發(fā)應(yīng)用其它功能模塊的資源需求。通過(guò)虛擬機(jī)運(yùn)行作業(yè)的資源占用,將資源互補(bǔ)的虛擬機(jī)遷移到同一物理機(jī)。主要功能包括:模塊資源監(jiān)控、訓(xùn)練集管理、模型訓(xùn)練、方案管理、遷移查詢(xún)、作業(yè)查詢(xún)等。通過(guò)采集專(zhuān)業(yè)軟件如Omega的作業(yè)模塊數(shù)據(jù),并保存到數(shù)據(jù)庫(kù)中,通過(guò)多維度的查詢(xún)條件,反映一段時(shí)間內(nèi)模塊占用的CPU、內(nèi)存、磁盤(pán)、網(wǎng)絡(luò)的情況,方便用戶(hù)對(duì)一段時(shí)間主機(jī)運(yùn)行軟件模塊資源占用情況進(jìn)行掌握。模塊資源監(jiān)控:主菜單中“資源調(diào)度”→“模塊資源監(jiān)控”;點(diǎn)選“函數(shù)”“時(shí)間”“指標(biāo)”“模塊”等查詢(xún)條件,點(diǎn)擊查詢(xún)。查看各個(gè)維度采集數(shù)據(jù)曲線(xiàn)。訓(xùn)練集管理:主菜單中“資源調(diào)度”→“訓(xùn)練集管理”;點(diǎn)選“新增”,進(jìn)入節(jié)點(diǎn)運(yùn)行監(jiān)控,點(diǎn)擊新增訓(xùn)練集,填寫(xiě)信息,點(diǎn)擊保存,在訓(xùn)練集列表中可查看到新增的模塊信息。點(diǎn)擊訓(xùn)練模型后的修改,填寫(xiě)信息,點(diǎn)擊保存,在訓(xùn)練集列表中可查看到已修改的模塊信息。在訓(xùn)練集管理中配置好訓(xùn)練集之后,即可進(jìn)行機(jī)器學(xué)習(xí)的模型訓(xùn)練,預(yù)測(cè)需要預(yù)測(cè)的模塊的信息,且可以配置訓(xùn)練算法的參數(shù)值,以方便更好地進(jìn)行模型訓(xùn)練。包含模型訓(xùn)練、模型預(yù)測(cè)、虛擬機(jī)實(shí)時(shí)數(shù)據(jù)和調(diào)度方案四個(gè)接口。模型訓(xùn)練:主菜單中“資源調(diào)度”→“模型訓(xùn)練”;點(diǎn)選“模型訓(xùn)練”,選擇“繼續(xù)執(zhí)行”或“查看上次結(jié)果”,查看模型訓(xùn)練的執(zhí)行結(jié)果。同理,點(diǎn)選“模型預(yù)測(cè)”“獲取虛擬機(jī)實(shí)時(shí)數(shù)據(jù)”“模型調(diào)度”,查看各個(gè)流程的執(zhí)行結(jié)果或上次執(zhí)行結(jié)果。方案管理:主菜單中“資源調(diào)度”→“方案管理”;點(diǎn)選“起始時(shí)間”,點(diǎn)擊“查詢(xún)”,查看虛擬機(jī)調(diào)度方案的執(zhí)行結(jié)果,點(diǎn)擊“查看”按鈕。進(jìn)入詳情頁(yè)面,查看方案具體信息。點(diǎn)擊“方案運(yùn)行”按鈕,運(yùn)行該方案的虛擬機(jī)調(diào)度。模型調(diào)度:查看虛擬機(jī)調(diào)度方案的執(zhí)行結(jié)果。進(jìn)入詳情頁(yè)面,查看方案具體信息。點(diǎn)擊“方案運(yùn)行”按鈕,調(diào)用虛擬機(jī)熱部署命令,運(yùn)行該方案的虛擬機(jī)調(diào)度。遷移查詢(xún):主菜單中“資源調(diào)度”→“遷移查詢(xún)”;設(shè)置時(shí)間段,物理機(jī)或虛擬機(jī)名稱(chēng),點(diǎn)查詢(xún)。可以查看一段時(shí)間內(nèi)物理機(jī)上曾經(jīng)有過(guò)哪些虛擬機(jī)??梢圆榭匆欢螘r(shí)間內(nèi)某個(gè)虛擬機(jī)在哪些物理機(jī)上運(yùn)行過(guò)。點(diǎn)擊查看詳情,查詢(xún)虛擬機(jī)遷移的歷史記錄。包含時(shí)間、虛擬機(jī)、物理機(jī)的查詢(xún),查詢(xún)結(jié)果為這段時(shí)間內(nèi)虛擬機(jī)由源物理機(jī)遷移到目標(biāo)物理機(jī)的開(kāi)始、結(jié)束時(shí)間。作業(yè)查詢(xún):主菜單中“資源調(diào)度”→“作業(yè)查詢(xún)”;設(shè)置時(shí)間段,點(diǎn)查詢(xún)??刹樵?xún)虛擬機(jī)上運(yùn)行過(guò)的作業(yè)。點(diǎn)擊查看詳情,可查詢(xún)相關(guān)作業(yè)運(yùn)行過(guò)程中虛擬機(jī)遷移歷史。

作者:董濤 段淼 車(chē)曉萍 孫友凱 單位:勝利油田物探研究院