首頁 > 期刊 > 地理與地理信息科學(xué) > 基于條件隨機場的非規(guī)范化中文地址解析方法【正文】

基于條件隨機場的非規(guī)范化中文地址解析方法

作者：許也; 申柏希; 徐翔; 李軍中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院; 廣東省城市化與地理環(huán)境空間模擬重點實驗室; 廣東廣州510275; 電子科技大學(xué)中山學(xué)院; 廣東中山528402

摘要：地址解析是地理編碼的核心任務(wù)之一,而混亂的地址標準、隨意的中文地址表達給地址解析帶來了極大困難。該文提出一種基于條件隨機場的非規(guī)范化中文地址解析方法。一方面,綜合分析各種非規(guī)范化地址要素的類型特征,在現(xiàn)有標注體系基礎(chǔ)上設(shè)計出一套優(yōu)化的地址要素分類標注體系,并制定特征模板,然后采用自訓(xùn)練半監(jiān)督學(xué)習(xí)與人工標注互補融合的策略,獲取大量高質(zhì)量的已標注語料供模型訓(xùn)練;另一方面,挑選已標注語料訓(xùn)練條件隨機場模型,實現(xiàn)對地址要素的自動解析。選取廣東省博羅縣30 000條地址進行算法驗證和解析性能評測。實驗表明,與其他語料標注方法相比,該方法在獲取有效地址解析的同時,顯著降低了標注成本。結(jié)果表明,該方法適用于地理編碼領(lǐng)域中大規(guī)模非規(guī)范化中文地址的自動解析。

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

期刊咨詢免費咨詢雜志訂閱

地理與地理信息科學(xué)

北大期刊下單

國際刊號：1672-0504

國內(nèi)刊號：13-1330/P

雜志詳情

相關(guān)熱門期刊

湖北民族大學(xué)學(xué)報·哲學(xué)社會科學(xué)版

北大期刊下單

國際刊號：2096-7586

國內(nèi)刊號：42-1907/C
電腦迷

北大期刊下單

國際刊號：1672-528X

國內(nèi)刊號：50-1163/TP
馬克思主義與中華文化研究

北大期刊下單
讀寫算

北大期刊下單

國際刊號：1002-7661

國內(nèi)刊號：42-1078/G4