孕妇一区二区在线|青青草久久五月丁香综合|国产精品制服高跟|琪琪女色999999|偷拍美女视频在线|成人性交无码视频|天堂社区中文字幕|亚洲成人精品A片|五月婷婷香蕉色国产人成福利导航|久久人妻系列中文

<center id="dsvse"><tr id="dsvse"></tr></center><span id="dsvse"></span>
    1. <label id="dsvse"></label>
      <span id="dsvse"></span>
      <label id="dsvse"></label>
      1. <rt id="dsvse"><tr id="dsvse"></tr></rt>
        1. <i id="dsvse"></i><rt id="dsvse"><tr id="dsvse"></tr></rt>
        2. <rt id="dsvse"><tr id="dsvse"></tr></rt>
          <rt id="dsvse"></rt>
        3. 返回

          非結(jié)構(gòu)化數(shù)據(jù)一站式搜索解決方案

          一、項(xiàng)目背景

          國家電網(wǎng)公司通過多年信息化建設(shè),已經(jīng)建立九大業(yè)務(wù)體系,四大數(shù)據(jù)集中管理平臺(tái),其中非結(jié)構(gòu)化數(shù)據(jù)平臺(tái)數(shù)據(jù)總條數(shù)達(dá)到5.4億,存儲(chǔ)總量410T,數(shù)據(jù)存儲(chǔ)增長7.9T/月。非結(jié)構(gòu)化數(shù)據(jù)平臺(tái)中的數(shù)據(jù)仍然按業(yè)務(wù)條線進(jìn)行存儲(chǔ)、管理和利用,導(dǎo)致跨業(yè)務(wù)、跨系統(tǒng)的數(shù)據(jù)難以獲取。非結(jié)構(gòu)化數(shù)據(jù)一站式搜索旨在以業(yè)務(wù)需求及用戶體驗(yàn)為驅(qū)動(dòng),提供跨業(yè)務(wù)、跨系統(tǒng)、強(qiáng)關(guān)聯(lián)的各類非結(jié)構(gòu)化數(shù)據(jù)一站式搜索公共服務(wù)。

          二、問題與挑戰(zhàn)

          1.搜索深度不同,項(xiàng)目管理系統(tǒng)無搜索功能;知識管理系統(tǒng)僅提供標(biāo)題搜索;協(xié)同辦公系統(tǒng)支持全文搜索,但無法實(shí)現(xiàn)關(guān)聯(lián)檢索。

          2.技術(shù)不同,現(xiàn)有系統(tǒng)搜索功能采用技術(shù)路線不統(tǒng)一,有Domino、Autonomy等商業(yè)軟件,也有自主研發(fā)的檢索功能,不能實(shí)現(xiàn)統(tǒng)一的集成與檢索。

          3.無跨系統(tǒng)檢索,目前信息化系統(tǒng)產(chǎn)生的數(shù)據(jù)分散于多個(gè)系統(tǒng)中,如果查找資料需到每個(gè)系統(tǒng)分別檢索。

          4.業(yè)界差距較大,谷歌、百度等互聯(lián)網(wǎng)搜索引擎提供了自動(dòng)推薦、智能檢索等智能化應(yīng)用,而企業(yè)內(nèi)部的搜索,沒有實(shí)現(xiàn)智能化,用戶體驗(yàn)不佳。

          三、解決方案

          1.采用分布式搜索引擎技術(shù)對全業(yè)務(wù)系統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建索引,實(shí)現(xiàn)對數(shù)據(jù)的全文檢索。

          1539078936128446.jpg


          2.采用自然語言技術(shù)對文檔相似度、文檔特征、關(guān)聯(lián)詞進(jìn)行分析,實(shí)現(xiàn)同義近義檢索、關(guān)聯(lián)檢索、檢索詞聯(lián)想等功能。

          1539079354877257.jpg


          3.采用用戶畫像、文檔畫像、推薦技術(shù)等,對用戶瀏覽歷史等進(jìn)行分析,實(shí)現(xiàn)基于文檔相似度的推薦、基于用戶興趣度的推薦、基于協(xié)同過濾的推薦,為用戶主動(dòng)推送可能關(guān)注的文檔資料。

          1539079611776678.jpg


          四、應(yīng)用創(chuàng)新

          1.構(gòu)建專業(yè)詞庫,該詞庫從非結(jié)構(gòu)化平臺(tái)中的文檔提取,對于特定業(yè)務(wù)文檔的分析建模起到關(guān)鍵作用。

          2.采用詞向量構(gòu)建電力關(guān)聯(lián)詞庫,為擴(kuò)展搜索結(jié)果和個(gè)性化推薦提供依據(jù)。

          3.采用興趣模型對用戶進(jìn)行畫像,并根據(jù)興趣模型提供個(gè)性化推薦。

          4.在搜索展示結(jié)果上引入業(yè)務(wù)關(guān)系圖譜和時(shí)間脈絡(luò)圖譜,提供更適用于業(yè)務(wù)需求的展示方式。

          五、相關(guān)案例

          國家電網(wǎng)非結(jié)構(gòu)化數(shù)據(jù)一站式搜索系統(tǒng)