摘要:【目的】通過多視圖協(xié)同可視化的方式對時(shí)序文本挖掘過程進(jìn)行可視化,以實(shí)現(xiàn)多角度多層面洞察文本數(shù)據(jù)背后隱藏的規(guī)律和信息。【方法】基于文本詞向量矩陣,對多政策主體的政策時(shí)序文本,通過數(shù)據(jù)清洗、計(jì)算TF-IDF值、構(gòu)建向量空間模型、奇異值分解等文本挖掘技術(shù)進(jìn)行信息提取和可交互的可視化探索分析?!窘Y(jié)果】選取2016年1月–2017年8月北京市中關(guān)村示范區(qū)下屬子園區(qū)的相關(guān)委內(nèi)信息文本為樣本,采用文本挖掘技術(shù)和多視圖協(xié)同可視化方法,探索政策文本背后的規(guī)律,驗(yàn)證了本文方法和框架的有效性?!揪窒蕖酷槍Υ笠?guī)模文本具體細(xì)節(jié)單數(shù)據(jù)點(diǎn)的展示效果不佳,文本挖掘技術(shù)有待進(jìn)一步提升,模型數(shù)據(jù)吞吐量有待基于大數(shù)據(jù)架構(gòu)進(jìn)一步增強(qiáng)。【結(jié)論】本文方法和框架能夠?qū)r(shí)序文本類數(shù)據(jù)做到充分的挖掘展示,更好地把握數(shù)據(jù)背后的信息,增強(qiáng)政策主體的決策依據(jù)。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:數(shù)學(xué)圖書館 、知識(shí)組織與知識(shí)管理、情報(bào)分析與研究 、應(yīng)用實(shí)踐 、動(dòng)態(tài)、特邀專欄、金融證券管理、企業(yè)信息管理技術(shù)等。于1980年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。