智能爬蟲能力:支持多線程、分布式智能爬蟲??啥x增量、全量模式,自由選擇爬取頻率,粒度支持分鐘級,支持按周,月遍歷一次全量網(wǎng)站等。
智能分析能力:主要對抓取的分析數(shù)據(jù)進行內(nèi)容識別,支持文字、圖片、音視頻、OCR、APP識別與分析??筛鶕?jù)需要靈活配置智能分析引擎。
不良內(nèi)容庫:基于現(xiàn)有不良內(nèi)容庫與第三方信息庫,可以不斷識別與更新不良,不良APP,不良信息庫。
架構(gòu)方便部署:可以靈活地將數(shù)據(jù)采集與智能爬蟲深度結(jié)合,模塊化設(shè)計,本地引擎與網(wǎng)絡(luò)引擎相結(jié)合。
應(yīng)用靈活擴展:系統(tǒng)采用分布式設(shè)計,所有服務(wù)程序均可部署在不同主機上,在系統(tǒng)擴容或升級時,可利用新增服務(wù)器部署應(yīng)用服務(wù)程序,可以獨立管控或者與其他現(xiàn)有系統(tǒng)聯(lián)動管控。
產(chǎn)品概述
上海欣方網(wǎng)絡(luò)內(nèi)容與管控解決方案采用高性能采集設(shè)備和機器學(xué)習(xí)模型,能夠針對海量數(shù)據(jù)和文件進行業(yè)務(wù)建模和數(shù)據(jù)挖掘,采用分布式爬蟲采集數(shù)據(jù),完成數(shù)據(jù)采集功能,實現(xiàn)網(wǎng)絡(luò)內(nèi)容識別、分析、管理與管控。
產(chǎn)品功能
產(chǎn)品特點
產(chǎn)品架構(gòu)