TWI854521B - 關注名單整理分析方法及系統 - Google Patents
關注名單整理分析方法及系統 Download PDFInfo
- Publication number
- TWI854521B TWI854521B TW112108568A TW112108568A TWI854521B TW I854521 B TWI854521 B TW I854521B TW 112108568 A TW112108568 A TW 112108568A TW 112108568 A TW112108568 A TW 112108568A TW I854521 B TWI854521 B TW I854521B
- Authority
- TW
- Taiwan
- Prior art keywords
- subject
- news
- comparison
- information
- module
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000010354 integration Effects 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims description 32
- 238000010801 machine learning Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000004900 laundering Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 5
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 2
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 2
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 2
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本發明提供一種關注名單整理分析方法,用於分析及比對至少一新聞媒體資訊源的新聞文章以產生關注人員名單,包含以下步驟:新聞收集模組搜集至少一新聞媒體資訊源的新聞文章;關注主體比對模組針對新聞文章辨識是否具有關注主體及關注議題,並且將具有關注主體及關注議題之新聞文章擷取至少一關鍵字;重複資訊比對模組將接收到具有關注主體以及關注議題之新聞文章及對應的至少一關鍵字,分別比對目的檔案,且根據每一新聞文章與目的檔案的比對結果更新目的檔案;以及統整模組根據目的檔案產出關注人員名單及其相關資訊。
Description
本發明係關於一種資訊分析方法及系統,尤其是一種針對新聞媒體資訊源中出現的人物進行分析的關注名單整理分析方法及系統。
隨著經濟全球化以及資訊技術的迅速發展,洗錢及詐欺等金融犯罪相關案件逐年增加,並且逐漸走向組織化以及專業化,各銀行為了因應洗錢防制計畫以降低洗錢及詐欺件數,開始加強認識你的客戶/客戶盡職審查(Know Your Customer/Customer Due Diligence,KYC/CDD)的流程。KYC/CDD是銀行認識每位客戶的流程,泛指客戶最初至金融相關機構開戶或進行商務協議簽署前,銀行透過收集關於客戶的文件及網路資料庫搜尋,以了解客戶的身份、背景、收入資金來源、財政狀況以及是否有被制裁與相關負面新聞等等。換言之,KYC/CDD主要功能在於金融相關機構針對客戶提交的文件上得到的資訊而作出的風險評估,並可依據風險評估結果來判斷是否該通過客戶的開戶申請或是商務協議。當客戶被歸納為高風險類別,可拒絕其開戶、駁回其商務協議、或進行加強審查。若經審查後,金融相關機構通過客戶的開戶申請或是商務協議,但仍屬可疑交易高風險者,則可能將會限制其日後的金融交易行為並且定期追蹤其金融
交易業務往來以及搜尋與其相關之負面新聞。
上述針對客戶追蹤其相關新聞的方法,一般為直接在網際網路上搜尋,特別是在提供大量新聞的新聞網站上較可能會有前述可疑交易高風險客戶的新聞。然而,由於現今網路上的資訊量非常龐大,在網路平台輸入關鍵字以搜尋與前述可疑交易高風險客戶相關之負面新聞時,經常得到過於龐雜的資料,而不容易從其中快速精準地取得重要且符合搜尋需求的資訊,且搜尋結果通常伴隨與欲查詢資訊相關性極低的廣告文宣資訊。
上述輸入關鍵字搜尋出的新聞結果,目前係透過人工進行比對、篩選,以及剔除重複來得到所需要的資訊。上述的比對、篩選以及剔除重複的流程,包含:(一)當相同事件存在多筆新聞文章以及媒體資料時,欲關注之新聞文章內容的重複性高,但每一筆資料內容具些微差異,因此需要進行資料比對以篩選出與同一新聞事件相關之名單,並剔除重複資料;(二)新聞媒體報導、新聞文章以及資料中出現的人名並非皆符合與搜尋目標有關之新聞人士,因此需要檢視後剔除;(三)新一期名單與前期名單交錯重疊,相同人名可能反覆出現,因此必須判讀每一筆資料是否屬於同一新聞事件;(四)同一新聞事件隨時間發展,相同人名的狀態、身份可能發生變化,例如:原先僅為嫌疑人,後來經起訴、判刑或是定罪而成為罪犯,因此需額外經蒐集訴訟資訊,標記符合預設條件之特定負面新聞人士;(五)當涉及負面新聞之主體為非自然人時,該非自然人的狀態是否仍然有效存續,是否已經解散、重整,需額外經查證相關的公開資訊管道平台。上述的流程相當繁雜,僅仰賴人工進行判讀與反覆比對,極可能會有較高的出錯率且耗費較多時間。
因此,有必要研發一種能夠從網路搜尋結果快速取得有用且所需之新聞媒體資料的資訊分析系統,以解決先前技術之問題。
有鑑於此,本發明提供一種關注名單整理分析方法及系統,藉以解決以上所述的習知問題。
根據本發明之一具體實施例,關注名單整理分析方法係用於分析及比對至少一新聞媒體資訊源的複數個新聞文章以產生關注人員名單及其相關資訊,其包含以下步驟:新聞收集模組搜集至少一新聞媒體資訊源的新聞文章;關注主體比對模組運用自然語言技術分別針對新聞文章辨識是否具有關注主體,再分別針對具有關注主體之新聞文章辨識其內容是否符合關注議題,並且將具有關注主體且符合關注議題之新聞文章擷取至少一關鍵字;重複資訊比對模組自關注主體比對模組接收具有關注主體且符合關注議題之每一新聞文章及對應的至少一關鍵字,並將接收到的新聞文章分別比對目的檔案,且根據各新聞文章與目的檔案的比對結果更新目的檔案;以及,統整模組根據目的檔案產出關注人員名單及其相關資訊。
其中,關注名單整理分析方法進一步包含以下步驟:自動派送模組將目的檔案產出之關注人員名單及其相關資訊以一訊息通知方式向外發送。
其中,使用者藉由使用者介面輸入關注主體並設定關注議題。
其中,關注主體比對模組透過主體比對模型將新聞文章與交叉比對資訊源進行關注主體比對,主體比對模型係透過機器學習演算法產
生;其中交叉比對資訊源進一步包含商業資料庫、加值資訊資料庫以及查詢數位足跡之網站。
其中,重複資訊比對模組根據各新聞文章與目的檔案的比對結果,進一步包含以下步驟:當新聞文章中之第一新聞文章與目的檔案的比對結果為關注主體重複且並沒有資訊差異時,重複資訊比對模組刪除第一新聞文章;當第一新聞文章與目的檔案的比對結果為關注主體重複且並有一資訊變化時,重複資訊比對模組將資訊變化加入目的檔案;當第一新聞文章與目的檔案的比對結果為關注主體不重複時,重複資訊比對模組將第一新聞文章加入目的檔案。
其中,關注名單整理分析方法進一步包含以下步驟:重複資訊比對模組透過資訊比對模型接收到的新聞文章分別比對目的檔案,其中資訊比對模型係透過監督式機器學習演算法產生。
本發明之另一範疇在於提供一種關注名單整理分析系統。根據另一具體實施例,關注名單整理分析系統係用以分析至少一新聞媒體資訊源的複數個新聞文章以產生關注人員名單及其相關資訊,其包含新聞收集模組、關注主體比對模組、重複資訊比對模組以及統整模組。新聞收集模組用以連接至少一新聞媒體資訊源以搜集至少一新聞媒體資訊源的新聞文章。關注主體比對模組耦接新聞收集模組以接收新聞文章。關注主體比對模組係用以透過自然語言技術分別針對新聞文章辨識是否具有一關注主體,再分別針對具有關注主體之新聞文章辨識其內容是否符合關注議題,並且將具有關注主體且符合關注議題之新聞文章擷取至少一關鍵字。重複資訊比對模組耦接關注主體比對模組。重複資訊比對模組係用以自關注主
體比對模組接收具有關注主體且符合關注議題之每一新聞文章及對應的至少一關鍵字,並將接收到的新聞文章分別比對一目的檔案,且根據各新聞文章與目的檔案的比對結果更新目的檔案。統整模組耦接重複資訊比對模組。統整模組係用以根據目的檔案產出關注人員名單及其相關資訊。
其中,關注名單整理分析系統進一步包含自動派送模組。自動派送模組耦接統整模組,用以將目的檔案產出之關注人員名單及其相關資訊,以訊息通知方式向外發送。
其中,關注主體比對模組耦接交叉比對資訊源。關注主體比對模組將新聞文章與交叉比對資訊源進行關注主體比對。交叉比對資訊源進一步包含商業資料庫、加值資訊資料庫以及查詢數位足跡之網站。
其中,關注主體比對模組包含主體比對模型。重複資訊比對模組包含資訊比對模型。其中主體比對模型以及資訊比對模型係透過監督式機器學習演算法產生。主體比對模型用以將新聞文章與交叉比對資訊源進行關注主體比對,且資訊比對模型用以將接收到的新聞文章分別比對目的檔案。
綜上所述,本發明提供一種關注名單整理分析方法及系統,藉由關注主體比對模組針對關注主體以及關注議題篩選出符合使用者所關注的新聞文章,再藉由重複資訊比對模組將篩選出的新聞文章,與目的檔案做比對,並根據比對結果將目的檔案做更新。本發明透過關注名單整理分析方法及系統可以快速從網路搜尋結果取得有用且所需之新聞媒體資料的資訊。此外,藉由導入人工智慧方法,透過監督式機器學習以降低關注人員名單的錯判率、重複率及排除無效資訊,使降低人為出錯率以及減少
人工判讀所耗費的時間,進而提高效率並降低時間及人力成本。此外,使用者透過自動派送模組,以及時或定期收到最新之關注人員名單及其相關資訊資訊,使用者不需額外花費時間重新進行搜尋,進而達到減少人力及時間成本,並提高整體搜尋檢索的效率。
圖1係繪示根據本發明之一具體實施例之關注名單整理分析系統的功能方塊圖。
圖2係繪示根據本發明之一具體實施例之關注名單整理分析方法的步驟流程圖。
圖3係繪示根據本發明之另一具體實施例之關注名單整理分析方法的步驟流程圖。
圖4係繪示根據本發明之又一具體實施例之關注名單整理分析方法的步驟流程圖。
為了讓本發明的優點,精神與特徵可以更容易且明確地了解,後續將以具體實施例並參照所附圖式進行詳述與討論。值得注意的是,這些具體實施例僅為本發明代表性的具體實施例,其中所舉例的特定方法、裝置、條件、材質等並非用以限定本發明或對應的具體實施例。又,圖中各裝置僅係用於表達其相對位置且未按其實際比例繪述,合先敘明。
請參閱圖1。圖1係繪示根據本發明之一具體實施例之關注名單整理分析系統1的功能方塊圖。本具體實施例提供一種關注名單整理分析
方法以及系統,用於分析及比對新聞媒體資訊源的新聞文章以產生關注人員名單及其相關資訊。如圖1所示,在本具體實施例中,關注名單整理分析系統1包含新聞收集模組11、關注主體比對模組12、重複資訊比對模組13以及統整模組14。新聞收集模組11用以耦接外部的至少一新聞媒體資訊源21。關注主體比對模組12耦接新聞收集模組11,重複資訊比對模組13耦接該關注主體比對模組12,統整模組14耦接該重複資訊比對模組13。此外,本具體實施例中的關注主體比對模組12,進一步耦接外部的交叉比對資訊源22。關注主體比對模組12包含主體比對模型121;重複資訊比對模組13包含資訊比對模型131。透過關注名單整理分析系統1,可從新聞媒體資訊源21蒐集新聞文章並進行分析,以從該些新聞文章中取得想要關注的人員或客戶的相關資訊,以作為監控高風險客戶的依據,甚至可以達到洗錢或詐欺防制的效果。以下將配合關注名單整理分析方法說明本具體實施例之關注名單整理分析系統1之中各模組的功能。於實務中,關注名單整理分析系統1的新聞收集模組可為電腦系統中的網路模組,以連接外部的新聞媒體資訊源;關注主體比對模組、重複資訊比對模組及統整模組等可整合於電腦系統或雲端系統的中央處理單元,或整合於整合式晶片中。
請一併參閱圖1及圖2。圖2係繪示根據本發明之一具體實施例之關注名單整理分析方法的步驟流程圖。請注意,圖2的關注名單整理分析方法的步驟可以透過圖1的關注名單整理分析系統1來達成,因此,以下藉由圖1之關注名單整理分析系統1的架構,說明圖2的具體實施例中的關注名單整理分析方法的各個步驟。如圖2所示,於本具體實施例中,關注名單整理分析方法包含步驟S1:新聞收集模組11搜集新聞媒體資訊源21的新聞
文章;步驟S2:關注主體比對模組12運用自然語言技術分別針對新聞文章辨識是否具有關注主體,再分別針對具有關注主體之新聞文章辨識其內容是否符合關注議題,並且將具有關注主體且符合關注議題之新聞文章擷取關鍵字;步驟S3:重複資訊比對模組13自關注主體比對模組12接收具有關注主體且符合關注議題之每一新聞文章及對應的關鍵字,並將接收到的新聞文章分別比對目的檔案,且根據各新聞文章與目的檔案的比對結果更新目的檔案;以及,步驟S4:統整模組14根據目的檔案產出關注人員名單及其相關資訊。
於實務中,關注名單整理分析系統1的新聞收集模組11可連接一個或多個新聞媒體資訊源21,或者也可以藉由網路爬蟲程式自動化的收集網路上的各新聞媒體資訊源的新聞文章、資料,其中若出現影音、影像檔等非文字的資料,則可以適時的將相關資料進行文字化以取得文字內容,並且藉由收集到的新聞文章及相關資料進一步產生新聞文章列表。另外,當關注主體比對模組12針對收集到的新聞文章及相關資料進行辨識分析時,若新聞文章內容中未出現關注主體,則進行新聞文章列表中下一篇新聞文章的辨識分析;若是有出現關注主體,則針對此篇新聞文章內容是否符合關注議題進行辨識分析,以篩選出同時具有關鍵主體並符合關鍵議題的新聞文章。此外,於實務中,新聞收集模組11連接之新聞媒體資訊源21的種類可以為新聞文字內容以及新聞網站網址,例如,網路新聞媒體平台以及線上報章雜誌平台;相關資料格式可以為文字檔、語音檔、影音檔以及相片檔;資料出處以及搜尋範圍可以為國內媒體以及全球媒體。新聞收集模組11所連接新聞媒體資訊源21的數量可為一個,如圖1所示,或者可
連接多個新聞媒體資訊源21以同時取得該些新聞媒體資訊源21中的新聞文章,其數量可依使用者需求進行調整。此外,統整模組14針對具有關注主體且符合關注議題之新聞文章的目的檔案,進一步經彙整後產生使用者所關注的關注人員名單及其相關資訊。
請一併參閱圖1以及圖3。圖3係繪示根據本發明之另一具體實施例之關注名單整理分析方法的步驟流程圖。同樣地,本具體實施例中,圖3之方法的各步驟可以透過圖1的系統架構來達成,故以下藉由圖1中的系統架構說明圖3的步驟。如圖3所示,本具體實施例與前述具體實施例不同處,在於本具體實施例之關注名單整理分析方法進一步包含步驟S5接續於步驟S4後執行:自動派送模組15將統整模組14所產出的目的檔案產出之關注人員名單及其相關資訊以訊息通知方式向外發送。請注意,本具體實施例之關注名單整理分析方法中的其他步驟,係與前述具體實施例中對應的步驟大致相同,故於此不再贅述。
於實務中,自動派送模組15可以透過電子郵件、手機訊息以及社群平台將目的檔案產出之關注人員名單及其相關資訊進行訊息通知及傳送。此外,使用者可依照需求自行設置定期或及時的訊息通知及傳送,以及時或定期收到最新及經更新之關注人員名單及其相關資訊資訊,不需額外花費時間重新進行搜尋,進而達到減少人力及時間成本,並提高整體效率。
再者,如圖3所示,本具體實施例中,關注名單整理分析方法進一步包含步驟S11於步驟S2前執行:使用者藉由使用者介面輸入關注主體並設定關注議題。詳言之,藉由關注名單整理分析系統中的使用者介面
(未顯示),使用者可事先輸入欲關注之關注主體以及關注議題,以利關注主題比對模組12可針對新聞文章內容進行辨識及分析出關注主體以及關注議題。其中,關注主體可為人物、組織、公司行號以及財團法人;關注議題可為洗錢、詐欺、貪汙以及其他違法之行為。舉例來說,若使用者欲調查某位人物是否具有洗錢、詐欺以及貪汙等前科,則可輸入該人物之姓名為關注主體,並設定關注議題為洗錢、詐欺以及貪汙。於實務中,使用者欲關注之關注主體以及關注議題的類型不限與此,且關注主體以及關注議題的數量可依使用者需求進行設定。
請一併參閱圖1以及圖4。圖4係繪示根據本發明之另一具體實施例之關注名單整理分析方法的步驟流程圖。同樣地,本具體實施例中,圖4之方法的各步驟可以透過圖1的系統架構來達成,故以下藉由圖1中的系統架構說明圖4的步驟。如圖4所示,本具體實施例與前述具體實施例不同處,在於本具體實施例之關注名單整理分析方法進一步包含步驟S2’接續於步驟S1後執行:關注主體比對模組12透過主體比對模型121將新聞文章與交叉比對資訊源22進行關注主體比對,再分別針對具有關注主體之新聞文章辨識其內容是否符合關注議題,並且將具有關注主體且符合關注議題之新聞文章擷取關鍵字。其中,主體比對模型121係透過機器學習演算法產生,並且交叉比對資訊源22進一步包含商業資料庫、加值資訊資料庫以及查詢數位足跡之網站。請注意,本具體實施例之關注名單整理分析方法中的其他步驟,係與前述具體實施例中對應的步驟大致相同,故於此不再贅述。
於本具體實施例中,主體比對模型121透過機器學習演算法學習藉由大量文章中取得具有人物、地點、時間、組織、職稱、以及行為
動作取向的關聯詞,以建立資訊內容描述情事與關注主體之間關聯度的智能模型。於實務中,用來與新聞文章進行關注主體比對的交叉比對資訊源22的種類不限與此,並且所選用的交叉比對資訊源22的數量可依照使用者需求進行調整。
於另一具體實施例中,交叉比對資訊源22可以為經授權之全球商業資料庫、工商登記查詢平台以及其他公開管道平台。針對資訊不明確者藉由交叉比對資訊源22以提供補充資料來源,例如,新聞文章中的關注主體人物之判決結果以及關注主體公司商行的法人狀態是否經解散、重整。但於實務中。交叉比對資訊源22的種類不限於此,並且交叉比對資訊源的種類以及數量可依使用者需求進行調整。
此外,本具體實施例與上述具體實施例另一不同之處在於,本具體實施例之關注名單整理分析方法進一步包含步驟S31:重複資訊比對模組13自關注主體比對模組12接收具有關注主體且符合關注議題之每一新聞文章及對應的關鍵字,並將接收到的新聞文章分別比對目的檔案,當新聞文章中之第一新聞文章與目的檔案的比對結果為關注主體重複且沒有資訊差異,重複資訊比對模組13刪除第一新聞文章;步驟S32:重複資訊比對模組13自關注主體比對模組12接收具有關注主體且符合關注議題之每一新聞文章及對應的關鍵字,並將接收到的新聞文章分別比對目的檔案,當新聞文章中之第一新聞文章與目的檔案的比對結果為關注主體重複且有資訊變化,重複資訊比對模組13將資訊變化加入目的檔案;以及步驟S33:重複資訊比對模組13自關注主體比對模組12接收具有關注主體且符合關注議題之每一新聞文章及對應的關鍵字,並將接收到的新聞文章分別比對目的檔
案,當新聞文章中之第一新聞文章與目的檔案的比對結果為關注主體不重複,重複資訊比對模組13將第一新聞文章加入目的檔案。藉由步驟S31~S33,重複資訊比對模組13可將比對後的結果更新目的檔案。
於本具體實施例中,重複資訊比對模組13可以進一步包含資訊比對模型131進行前述的比對流程。其中,資訊比對模型131係透過監督式機器學習演算法產生。於實務中,監督式機器學習時會使用訓練資料集進行機器學習,並產生監督式機器學習演算法。其中,訓練資料集包含標籤和特徵。標籤是預測目標,而特徵是模型用於預測標籤的輸入資料。於本實施例中,監督式機器學習的訓練資料集係利用人物、組織、名稱、地點、職稱、時間等特徵,並將其分類為重複或有效/無效等標籤,而訓練資料集內容可能包含新聞文章、新聞文章標籤、新聞文章分類以及新聞文章分析等。但於實際應用中,不限於此。
如前所述,關注主體比對模組12中的主體比對模型121以及重複資訊比對模組13中的資訊比對模型131皆可透過監督式機器學習演算法產生。主體比對模型121用以將新聞文章與交叉比對資訊源22進行關注主體比對,且資訊比對模型131用以將接收到的新聞文章分別比對目的檔案。其中,主體比對模型121以及資訊比對模型131中的監督式學習演算法為結合深度神經網路(Deep neural network,DNN)與長短期記憶(Long short-term memory,LSTM)兩種不同的演算法而形成的DNN-LSTM模型。換言之,本具體施實例中的主體比對模型121”以及資訊比對模型131”藉由結合LSTM的長期記憶能力與DNN的深度學習能力以進行新聞文章的辨識比對分析。但於實際應用中,關注名單整理分析系統中使用的監
督式學習演算法不限於此。藉此,本發明的關注名單整理分析系統藉由導入人工智慧,透過監督式學習演算法簡化反覆比對的過程以及減少名單錯判率以及重複率
綜上所述,本發明提供一種關注名單整理分析方法及系統,藉由關注主體比對模組針對關注主體以及關注議題篩選出符合使用者所關注的新聞文章,再藉由重複資訊比對模組將篩選出的新聞文章,與目的檔案做比對,並根據比對結果將目的檔案做更新。本發明透過關注名單整理分析方法及系統可以快速從網路搜尋結果取得有用且所需之新聞媒體資料的資訊。此外,藉由導入人工智慧方法,透過監督式機器學習以降低關注人員名單的錯判率、重複率及排除無效資訊,使降低人為出錯率以及減少人工判讀所耗費的時間,進而提高效率並降低時間及人力成本。此外,使用者透過自動派送模組,以及時或定期收到最新之關注人員名單及其相關資訊資訊,使用者不需額外花費時間重新進行搜尋,進而達到減少人力及時間成本,並提高整體搜尋檢索的效率。
藉由以上較佳具體實施例之詳述,係希望能更加清楚描述本發明之特徵與精神,而並非以上述所揭露的較佳具體實施例來對本發明之範疇加以限制。相反地,其目的是希望能涵蓋各種改變及具相等性的安排於本發明所欲申請之專利範圍的範疇內。因此,本發明所申請之專利範圍的範疇應該根據上述的說明作最寬廣的解釋,以致使其涵蓋所有可能的改變以及具相等性的安排。
S1~S4:步驟
Claims (10)
- 一種關注名單整理分析方法,用於分析及比對至少一新聞媒體資訊源的複數個新聞文章以產生一關注人員名單及其相關資訊,該關注名單整理分析方法包含以下步驟:一新聞收集模組搜集該至少一新聞媒體資訊源的該等新聞文章;一關注主體比對模組運用一自然語言技術分別針對該等新聞文章辨識是否具有一關注主體,再分別針對具有該關注主體之該等新聞文章辨識其內容是否符合一關注議題,並且將具有該關注主體且符合該關注議題之該等新聞文章擷取至少一關鍵字;一重複資訊比對模組自該關注主體比對模組接收具有該關注主體且符合該關注議題之每一該等新聞文章及對應的該至少一關鍵字,並將接收到的該等新聞文章分別比對一目的檔案;當該等新聞文章中之一第一新聞文章與該目的檔案的比對結果為該關注主體重複且並沒有資訊差異時,該重複資訊比對模組刪除該第一新聞文章;當該第一新聞文章與該目的檔案的比對結果為該關注主體不重複時,該重複資訊比對模組將該第一新聞文章加入該目的檔案以更新該目的檔案;以及一統整模組根據該目的檔案產出該關注人員名單及其相關資訊。
- 如申請專利範圍第1項所述之關注名單整理分析方法,進一步包含以下步驟:一自動派送模組將該目的檔案產出之該關注人員名單及其相關資 訊以一訊息通知方式向外發送。
- 如申請專利範圍第1項所述之關注名單整理分析方法,其中一使用者藉由一使用者介面輸入該關注主體並設定該關注議題。
- 如申請專利範圍第1項所述之關注名單整理分析方法,其中該關注主體比對模組透過一主體比對模型將該等新聞文章與一交叉比對資訊源進行該關注主體比對,該主體比對模型係透過一機器學習演算法產生;其中該交叉比對資訊源進一步包含商業資料庫、加值資訊資料庫以及查詢數位足跡之網站。
- 如申請專利範圍第1項所述之關注名單整理分析方法,進一步包含以下步驟:當該第一新聞文章與該目的檔案的比對結果為該關注主體重複且並有一資訊變化時,該重複資訊比對模組將該資訊變化加入該目的檔案以更新該目的檔案。
- 如申請專利範圍第1項所述之關注名單整理分析方法,進一步包含以下步驟:該重複資訊比對模組透過一資訊比對模型接收到的該等新聞文章分別比對該目的檔案,其中該資訊比對模型係透過一監督式機器學習演算法產生。
- 一種關注名單整理分析系統,用以分析至少一新聞媒體資訊源的複數個新聞文章以產生一關注人員名單及其相關資訊,該關注名單整理分析系統包含:一新聞收集模組,用以連接該至少一新聞媒體資訊源以搜集該至少 一新聞媒體資訊源的該等新聞文章;一關注主體比對模組,耦接該新聞收集模組以接收該等新聞文章,該關注主體比對模組係用以透過一自然語言技術分別針對該等新聞文章辨識是否具有一關注主體,再分別針對具有該關注主體之該等新聞文章辨識其內容是否符合一關注議題,並且將具有該關注主體且符合該關注議題之該等新聞文章擷取至少一關鍵字;一重複資訊比對模組,耦接該關注主體比對模組,該重複資訊比對模組係用以自該關注主體比對模組接收具有該關注主體且符合該關注議題之每一該等新聞文章及對應的該至少一關鍵字,並將接收到的該等新聞文章分別比對一目的檔案,且根據各該等新聞文章與該目的檔案的比對結果更新該目的檔案,其中當該等新聞文章中之一第一新聞文章與該目的檔案的比對結果為該關注主體重複且並沒有資訊差異時,該重複資訊比對模組刪除該第一新聞文章,並且當該第一新聞文章與該目的檔案的比對結果為該關注主體不重複時,該重複資訊比對模組將該第一新聞文章加入該目的檔案以更新該目的檔案;以及一統整模組,耦接該重複資訊比對模組,統整模組係用以根據該目的檔案產出該關注人員名單及其相關資訊。
- 如申請專利範圍第7項所述之關注名單整理分析系統,進一步包含一自動派送模組耦接該統整模組,用以將該目的檔案產出之該關注人員名單及其相關資訊,以一訊息通知方式向外發送。
- 如申請專利範圍第7項所述之關注名單整理分析系統,其中該關注主體比對模組耦接一交叉比對資訊源,該關注主體比對模組將該等新聞文章 與該交叉比對資訊源進行該關注主體比對,該交叉比對資訊源進一步包含商業資料庫、加值資訊資料庫以及查詢數位足跡之網站。
- 如申請專利範圍第7項所述之關注名單整理分析系統,其中該關注主體比對模組包含一主體比對模型,且該重複資訊比對模組包含一資訊比對模型,其中該主體比對模型以及該資訊比對模型係透過一監督式機器學習演算法產生,該主體比對模型用以將該等新聞文章與一交叉比對資訊源進行該關注主體比對,且該資訊比對模型用以將接收到的該等新聞文章分別比對該目的檔案。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW112108568A TWI854521B (zh) | 2023-03-08 | 2023-03-08 | 關注名單整理分析方法及系統 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW112108568A TWI854521B (zh) | 2023-03-08 | 2023-03-08 | 關注名單整理分析方法及系統 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TWI854521B true TWI854521B (zh) | 2024-09-01 |
| TW202437135A TW202437135A (zh) | 2024-09-16 |
Family
ID=93609472
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW112108568A TWI854521B (zh) | 2023-03-08 | 2023-03-08 | 關注名單整理分析方法及系統 |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TWI854521B (zh) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180216946A1 (en) * | 2016-09-30 | 2018-08-02 | Mamadou Mande Gueye | Method and system for facilitating provisioning of social activity data to a mobile device based on user preferences |
| CN112711705A (zh) * | 2020-11-30 | 2021-04-27 | 泰康保险集团股份有限公司 | 舆情数据处理方法、设备及存储介质 |
| TWI749901B (zh) * | 2020-11-25 | 2021-12-11 | 重量科技股份有限公司 | 形成關鍵資訊的方法與電腦系統 |
| CN114461920A (zh) * | 2022-02-21 | 2022-05-10 | 富途网络科技(深圳)有限公司 | 榜单信息推荐的数据处理方法、装置、介质及设备 |
-
2023
- 2023-03-08 TW TW112108568A patent/TWI854521B/zh active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180216946A1 (en) * | 2016-09-30 | 2018-08-02 | Mamadou Mande Gueye | Method and system for facilitating provisioning of social activity data to a mobile device based on user preferences |
| TWI749901B (zh) * | 2020-11-25 | 2021-12-11 | 重量科技股份有限公司 | 形成關鍵資訊的方法與電腦系統 |
| CN112711705A (zh) * | 2020-11-30 | 2021-04-27 | 泰康保险集团股份有限公司 | 舆情数据处理方法、设备及存储介质 |
| CN114461920A (zh) * | 2022-02-21 | 2022-05-10 | 富途网络科技(深圳)有限公司 | 榜单信息推荐的数据处理方法、装置、介质及设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| TW202437135A (zh) | 2024-09-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Girgis et al. | Deep learning algorithms for detecting fake news in online text | |
| CN112182246A (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
| CN104809108A (zh) | 信息监测分析系统 | |
| CN113204644B (zh) | 一种基于知识图谱的政务百科构建方法 | |
| CN113792195B (zh) | 跨系统的数据获取方法、装置、计算机设备和存储介质 | |
| TWI807172B (zh) | 基於智慧互動的主動風控方法和系統 | |
| CN116151967A (zh) | 一种基于交易知识图谱的欺诈团伙识别系统 | |
| CN111198969A (zh) | 一种基于网络大数据的经济信息咨询系统和方法 | |
| CN108363748A (zh) | 基于知乎的话题画像系统及话题画像方法 | |
| CN118708676A (zh) | 信息处理方法、装置、设备、存储介质及程序产品 | |
| Putera et al. | How indonesia uses big data “indonesian one data” for the future of policy making | |
| CN116896539A (zh) | 启用和管理主动协作的系统和方法 | |
| CN109408808B (zh) | 一种文艺作品的评估方法及评估系统 | |
| TWI854521B (zh) | 關注名單整理分析方法及系統 | |
| CN118798335A (zh) | 知识图谱构建方法、装置、设备及可读存储介质 | |
| Garz | Macroeconomic news: A literature survey and methodological guidelines | |
| Zhu et al. | Analysis of public big data management under text analysis | |
| KR102180329B1 (ko) | 가짜 뉴스 판단 시스템 | |
| Ghawi et al. | Analysis of country mentions in the debates of the un security council | |
| Ranjan et al. | A brief survey on text analytics methods and applications | |
| CN116991873B (zh) | 基于知识图谱的目标报送数据处理方法、装置和服务器 | |
| Babau et al. | A comprehensive survey of big data analytics and techniques | |
| Barbosa et al. | AuFa-automatic detection and classification of fake news using neural networks | |
| CN113240556B (zh) | 基于智能决策的侵权处理方法、装置、设备及介质 | |
| Lakshmikanth | Identification of fake reviews using supervised machine learning |