程序利用windows提供的接口(windowsapi)實現(xiàn)程序的功能。通過一個可執(zhí)行程序引用的動態(tài)鏈接庫(dll)和應(yīng)用程序接口(api)可以粗略的預(yù)測該程序的功能和行為。統(tǒng)計所有樣本的導(dǎo)入節(jié)中引用的dll和api的頻率,留下引用頻率**高的60個dll和500個api。提取特征時,每個樣本的導(dǎo)入節(jié)里存在選擇出的dll或api,該特征以1表示,不存在則以0表示,提取的560個dll和api特征作為***個特征視圖。提取格式信息特征視圖pe是portableexecutable的縮寫,初衷是希望能開發(fā)一個在所有windows平臺上和所有cpu上都可執(zhí)行的通用文件格式。pe格式文件是封裝windows操作系統(tǒng)加載程序所需的信息和管理可執(zhí)行代碼的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)**是大量的字節(jié)碼和數(shù)據(jù)結(jié)構(gòu)的有機融合。pe文件格式被**為一個線性的數(shù)據(jù)流,由pe文件頭、節(jié)表和節(jié)實體組成。惡意軟件或被惡意軟件***的可執(zhí)行文件,它本身也遵循格式要求的約束,但可能存在以下特定格式異常:(1)代碼從**后一節(jié)開始執(zhí)行;(2)節(jié)頭部可疑的屬性;(3)pe可選頭部有效尺寸的值不正確;(4)節(jié)之間的“間縫”;(5)可疑的代碼重定向;(6)可疑的代碼節(jié)名稱;(7)可疑的頭部***;(8)來自;(9)導(dǎo)入地址表被修改;(10)多個pe頭部;(11)可疑的重定位信息;。深圳艾策信息科技:可持續(xù)發(fā)展的 IT 解決方案。嵌入式軟件產(chǎn)品退稅第三方評測
后端融合模型的10折交叉驗證的準確率是%,對數(shù)損失是,混淆矩陣如圖13所示,規(guī)范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為。(6)中間融合中間融合的架構(gòu)如圖16所示,中間融合方式用深度神經(jīng)網(wǎng)絡(luò)從三種模態(tài)的特征分別抽取高等特征表示,然后合并學習得到的特征表示,再作為下一個深度神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練模型,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進行正則化,防止過擬合,優(yōu)化器(optimizer)采用的是adagrad,batch_size是40。圖16中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個隱含層,其***個隱含層的神經(jīng)元個數(shù)是128,第二個隱含層的神經(jīng)元個數(shù)是64,第三個隱含層的神經(jīng)元個數(shù)是32,且3個隱含層中間間隔設(shè)置有dropout層。用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個隱含層,其***個隱含層的神經(jīng)元個數(shù)是64,其第二個隱含層的神經(jīng)元個數(shù)是32,且2個隱含層中間設(shè)置有dropout層。用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個隱含層,其***個隱含層的神經(jīng)元個數(shù)是512,第二個隱含層的神經(jīng)元個數(shù)是384,第三個隱含層的神經(jīng)元個數(shù)是256,第四個隱含層的神經(jīng)元個數(shù)是125。長春軟件評測機構(gòu)壓力測試表明系統(tǒng)在5000并發(fā)用戶時響應(yīng)延遲激增300%。
先將訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖分別輸入至一個深度神經(jīng)網(wǎng)絡(luò)中抽取高等特征表示,然后合并抽取的高等特征表示并將其作為下一個深度神經(jīng)網(wǎng)絡(luò)的輸入進行模型訓(xùn)練,得到多模態(tài)深度集成模型。進一步的,所述多模態(tài)深度集成模型的隱藏層的***函數(shù)采用relu,輸出層的***函數(shù)采用sigmoid,中間使用dropout層進行正則化,優(yōu)化器采用adagrad。進一步的,所述訓(xùn)練得到的多模態(tài)深度集成模型中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個隱含層,且3個隱含層中間間隔設(shè)置有dropout層;用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個隱含層,且2個隱含層中間設(shè)置有dropout層;用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個隱含層,且4個隱含層中間間隔設(shè)置有dropout層;用于輸入合并抽取的高等特征表示的深度神經(jīng)網(wǎng)絡(luò)包含2個隱含層,且2個隱含層中間設(shè)置有dropout層;所述dropout層的dropout率均等于。本發(fā)明實施例的有益效果是,提出了一種基于多模態(tài)深度學習的惡意軟件檢測方法,應(yīng)用了多模態(tài)深度學習方法來融合dll和api、格式結(jié)構(gòu)信息、字節(jié)碼n-grams特征。
在不知道多長的子序列能更好的表示可執(zhí)行文件的情況下,只能以固定窗口大小在字節(jié)碼序列中滑動,產(chǎn)生大量的短序列,由機器學習方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,產(chǎn)生短序列的方法叫n-grams?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產(chǎn)生連續(xù)部分重疊的短序列,將得到“080074”、“0074ff”、“74ff13”、“ff13b2”四個短序列。每個短序列特征的權(quán)重表示有多種方法。**簡單的方法是如果該短序列在具體樣本中出現(xiàn),就表示為1;如果沒有出現(xiàn),就表示為0,也可以用。本實施例采用3-grams方法提取特征,3-grams產(chǎn)生的短序列非常龐大,將產(chǎn)生224=(16,777,216)個特征,如此龐大的特征集在計算機內(nèi)存中存儲和算法效率上都是問題。如果短序列特征的tf較小,對機器學習可能沒有意義,選取了tf**高的5000個短序列特征,計算每個短序列特征的,每個短序列特征的權(quán)重是判斷其所在軟件樣本是否為惡意軟件的依據(jù),也是區(qū)分每個軟件樣本的依據(jù)。(4)前端融合前端融合的架構(gòu)如圖4所示,前端融合方式將三種模態(tài)的特征合并,然后輸入深度神經(jīng)網(wǎng)絡(luò),隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進行正則化,防止過擬合,優(yōu)化器。代碼簽名驗證確認所有組件均經(jīng)過可信機構(gòu)認證。
測試人員素質(zhì)要求1、責任心2、學習能力3、懷疑精神4、溝通能力5、專注力6、洞察力7、團隊精神8、注重積累軟件測試技術(shù)測試目的編輯軟件測試的目的是為了保證軟件產(chǎn)品的**終質(zhì)量,在軟件開發(fā)的過程中,對軟件產(chǎn)品進行質(zhì)量控制。一般來說軟件測試應(yīng)由**的產(chǎn)品評測中心負責,嚴格按照軟件測試流程,制定測試計劃、測試方案、測試規(guī)范,實施測試,對測試記錄進行分析,并根據(jù)回歸測試情況撰寫測試報告。測試是為了證明程序有錯,而不能保證程序沒有錯誤。軟件測試技術(shù)常見測試編輯回歸測試功能測試壓力測試負載測試性能測試易用性測試安裝與反安裝測試**測試安全性測試兼容性測試內(nèi)存泄漏測試比較測試Alpha測試Beta測試測試信息流1、軟件配置2、測試配置3、測試工具軟件測試技術(shù)-軟件測試的分類1、從是否需要執(zhí)行被測試軟件的角度分類(靜態(tài)測試和動態(tài)測試)。2、從測試是否針對軟件結(jié)構(gòu)與算法的角度分類(白盒測試和黑盒測試)。3、從測試的不同階段分類(單元測試、集成測試、系統(tǒng)測試、驗收測試)。2025 年 IT 趨勢展望:深圳艾策的五大技術(shù)突破。CMA CNAS軟件測評多少錢
無障礙測評認定視覺障礙用戶支持功能缺失4項。嵌入式軟件產(chǎn)品退稅第三方評測
k為短序列特征總數(shù),1≤i≤k??蓤?zhí)行文件長短大小不一,為了防止該特征統(tǒng)計有偏,使用∑knk,j進行歸一化處理。逆向文件頻率(inversedocumentfrequency,idf)是一個短序列特征普遍重要性的度量。某一短序列特征的idf,可以由總樣本實施例件數(shù)目除以包含該短序列特征之樣本實施例件的數(shù)目,再將得到的商取對數(shù)得到:其中,|d|指軟件樣本j的總數(shù),|{j:i∈j}|指包含短序列特征i的軟件樣本j的數(shù)目。idf的主要思想是:如果包含短序列特征i的軟件練樣本越少,也就是|{j:i∈j}|越小,idf越大,則說明短序列特征i具有很好的類別區(qū)分能力。:如果某一特征在某樣本中以較高的頻率出現(xiàn),而包含該特征的樣本數(shù)目較小,可以產(chǎn)生出高權(quán)重的,該特征的。因此,,保留重要的特征。此處選取可能區(qū)分惡意軟件和良性軟件的短序列特征,是因為字節(jié)碼n-grams提取的特征很多,很多都是無效特征,或者效果非常一般的特征,保持這些特征會影響檢測方法的性能和效率,所以要選出有效的特征即可能區(qū)分惡意軟件和良性軟件的短序列特征。步驟s2、將軟件樣本中的類別已知的軟件樣本作為訓(xùn)練樣本,然后分別采用前端融合方法、后端融合方法和中間融合方法設(shè)計三種不同方案的多模態(tài)數(shù)據(jù)融合方法。嵌入式軟件產(chǎn)品退稅第三方評測