国产无玛黄色大片|99最新极品蜜臀精品久久|久久精品成人av|精品久久久久久中文幕人妻日本|99热资源站人妻多P无码|韩日黄色的男女免费大全|av在线尤物精品国产|无码av免费精品一区二区三区影院|东京热一区二区三区|久久久久久国产成人a亚洲精品无码

首頁 > 期刊 > 深圳大學(xué)學(xué)報(bào)·人文社會(huì)科學(xué)版 > 基于分層抽樣的不均衡數(shù)據(jù)集成分類 【正文】

基于分層抽樣的不均衡數(shù)據(jù)集成分類

作者:王馨月; 景麗萍 北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院; 北京100044

摘要:不均衡數(shù)據(jù)分類是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)難點(diǎn)問題,對(duì)多數(shù)類樣本進(jìn)行降采樣可簡單且有效地解決不均衡數(shù)據(jù)處理面臨的兩大核心問題,即如何從數(shù)類占絕對(duì)優(yōu)勢的數(shù)據(jù)集合中最大程度地挖掘少數(shù)類信息;如何確保在不過度損失多數(shù)類信息的前提下構(gòu)建學(xué)習(xí)器.但現(xiàn)有的降采樣方法往往會(huì)破壞原始數(shù)據(jù)結(jié)構(gòu)特性或造成嚴(yán)重的信息損失.本研究提出一種基于分層抽樣的不均衡數(shù)據(jù)集成分類方法(簡記為EC-SS),通過充分挖掘多數(shù)類樣本的結(jié)構(gòu)信息,對(duì)其進(jìn)行聚類劃分;再在數(shù)據(jù)塊上進(jìn)行分層抽樣來構(gòu)建集成學(xué)習(xí)數(shù)據(jù)成員,以確保單個(gè)學(xué)習(xí)器的輸入數(shù)據(jù)均衡且保留原始數(shù)據(jù)的結(jié)構(gòu)信息,提升后續(xù)集成分類性能.在不均衡數(shù)據(jù)集Musk1、Ecoli3、Glass2和Yeast6上,對(duì)比EC-SS方法與基于隨機(jī)抽樣的不均衡數(shù)據(jù)集成分類方法、自適應(yīng)采樣學(xué)習(xí)方法、基于密度估計(jì)的過采樣方法和代價(jià)敏感的大間隔分類器方法的分類性能,結(jié)果表明,EC-SS方法能有效提升分類性能.

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。

深圳大學(xué)學(xué)報(bào)·人文社會(huì)科學(xué)版雜志

深圳大學(xué)學(xué)報(bào)·人文社會(huì)科學(xué)版雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:文明對(duì)話與文化比較、創(chuàng)意經(jīng)濟(jì)與文化產(chǎn)業(yè)、經(jīng)濟(jì)增長與金融創(chuàng)新、政治空間與法治社會(huì)、城鄉(xiāng)建設(shè)與社會(huì)治理、人文天地與中國精神等。于1984年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。

  • CSSCI南大期刊
  • 北大期刊
  • 1-3個(gè)月審核

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因?yàn)閷W⑺詫I(yè)。

保障正刊 雙刊號(hào)

推薦期刊保障正刊,評(píng)職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。