債務信息智能檢測解決方案

Intelligent Debt Information Detection Solution

高級網絡爬蟲技術

支持https、ajax動态網頁内容的爬取;支持對高安全認證頁面的内容抓取。
 

網頁内容智能分(fēn)析提取

自建風險資(zī)産數據字典,實現自動識别,對網頁内容進行結構化提取,并完成自動化數據清洗及格式轉換。

NLP+機器學習

基于NLP(自然語言處理技術)的機器學習算法,自動篩選、提取判決書(shū)、轉讓公告等文書(shū)内的風險資(zī)産相關信息。

OCR識别技術

公司運用先進的OCR(光學字符識别)技術對爬取回來的圖片主動掃描識别文字,并進行深度分(fēn)析和挖掘。
 

ES智能搜索引擎

高性能的ElasticSearch搜索引擎,支持中(zhōng)文分(fēn)詞、相關性排序等功能,與公司的SaaS産品相适配,能夠達到實時搜索、穩定、可靠。
 

分(fēn)布式雲計算

公司技術團隊多名員(yuán)工(gōng)曾任職于騰訊、360等企業,具備豐富的分(fēn)布式雲計算系統設計與開(kāi)發經驗,曾設計開(kāi)發每秒億級訪問量的多個系統。