詞條
詞條說明
近年來,隨著Internet?的迅猛發展以及人們利用信息技術生產和搜集數據能力的大幅度提高,大規模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本大數據挖掘成為人們研究的焦點。 數據挖掘(KD)是從數據中自動抽取模型。數據挖掘包括許多步驟:從大規模數據庫中(或從其他來源)**數據;選擇合適的特征屬性;挑選合適的樣本策略;剔除數據中不正常的數據并補足不夠
隨著互聯網技術的快速發展和普及,人們可以在網絡上獲得各種信息,怎樣防止青少年接觸到不健康內容是一個嚴肅的社會問題。要防止不健康、無用內容的蔓延,除了從法律角度采取措施外,從技術角度考慮的網絡過濾技術是一種有效的手段。 目前網絡的信息過濾技術主要有三種,它們是基于URL過濾方式、基于文本的過濾方式和基于圖像內容的過濾方式。這幾種過濾技術各有優劣,有的實現比較簡單,有的具有較廣泛的適應性,有的效率高
在大數據時代背景下,隨著海量數據的出現以及多數據源融合交叉應用,傳統的數據管理模式以及查詢方式受到一定的制約。近年來,知識圖譜(Knowledge Graph)作為一種新的知識表示方法和數據管理模式,在自然語言處理、問題回答、信息檢索等領域有著重要的應用。知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系;其基本組成單位是“實體-關系-實體”三元組,以及實體及其相關屬性
自然語言處理是一門研究能實現人與計算機之間用自然語言處理進行有效的通信與方法的一門學科,它是計算機科學領域與人工智能領域中的一個重要方向。普遍認為它主要是應用計算機技術,通過可計算的方法對自然語言處理的各級語言單位(字,詞,語句,篇章等)進行轉換,傳輸,存儲,分析等加工處理的學科,是一門融合了語言學,計算機學,數學等學科于一體的交叉性學科。 人類自然語言通常以詞為基本構成單位,進而構成句子,再由
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: