JP2014038650A - ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム - Google Patents
ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム Download PDFInfo
- Publication number
- JP2014038650A JP2014038650A JP2013212163A JP2013212163A JP2014038650A JP 2014038650 A JP2014038650 A JP 2014038650A JP 2013212163 A JP2013212163 A JP 2013212163A JP 2013212163 A JP2013212163 A JP 2013212163A JP 2014038650 A JP2014038650 A JP 2014038650A
- Authority
- JP
- Japan
- Prior art keywords
- web document
- history information
- document
- web
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】ウェブ文書の生成時間の操作に対応することができる本発明の一実施形態に係るウェブ文書原本判別方法は、ウェブ文書の生成または変更に関する履歴情報を受信するステップと、履歴情報を用いてウェブ文書をフィルタリングするステップと、履歴情報を基準としてフィルタリングされたウェブ文書の原本を判別するステップとを含む。
【選択図】図1
Description
200:ウェブ文書履歴情報提供システム
220:ピング受信部
240:履歴情報生成部
260:履歴情報提供部
300:ウェブ文書原本判別システム
320:履歴情報受信部
340:収集部
360:判別部
Claims (7)
- ウェブ文書の生成または変更に関するピングを受信するステップと、
前記ピングを受信した時点の時間情報を用いて、前記ウェブ文書の生成または変更に関する履歴情報を生成するステップと、
前記生成されたウェブ文書の履歴情報を原本文書判別システムに提供するステップと、
を含むことを特徴とする含むことを特徴とするウェブ文書履歴情報提供方法。 - 前記ピングは、前記ウェブ文書が生成または変更されるたびに受信することを特徴とする請求項1に記載のウェブ文書履歴情報提供方法。
- 前記履歴情報は、前記ウェブ文書のURL別に生成されることを特徴とする請求項1に記載のウェブ文書履歴情報提供方法。
- 前記履歴情報を生成するステップは、
前記ピングに該当するウェブ文書の題目およびテキストに関する情報のうちの少なくとも1つを収集するステップ、
をさらに含み、
前記履歴情報は、前記題目およびテキストに関する情報のうちの少なくとも1つを含むことを特徴とする請求項1に記載のウェブ文書履歴情報提供方法。 - ウェブ文書の生成または変更に関するピングを受信するピング受信部と、
前記ピングを受信した時点の時間情報を用いて、前記ウェブ文書の生成または変更に関する履歴情報を生成する履歴情報生成部と、
前記生成されたウェブ文書の履歴情報を原本文書判別システムに提供する履歴情報提供部と、
を備えることを特徴とする含むことを特徴とするウェブ文書履歴情報提供システム。 - 前記ピングは、前記ウェブ文書が生成または変更されるたびに受信することを特徴とする請求項5に記載のウェブ文書履歴情報提供システム。
- 履歴情報生成部は、
前記受信したピングに該当するウェブ文書の題目およびテキストに関する情報のうちの少なくとも1つを収集し、前記履歴情報に前記題目およびテキストに関する情報のうちの少なくとも1つを含ませることを特徴とする請求項5に記載のウェブ文書履歴情報提供システム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2008-0097145 | 2008-10-02 | ||
| KR1020080097145A KR101086530B1 (ko) | 2008-10-02 | 2008-10-02 | 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009212958A Division JP5417100B2 (ja) | 2008-10-02 | 2009-09-15 | ウェブ文書原本判別方法およびウェブ文書原本判別システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2014038650A true JP2014038650A (ja) | 2014-02-27 |
| JP5739500B2 JP5739500B2 (ja) | 2015-06-24 |
Family
ID=42076765
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009212958A Active JP5417100B2 (ja) | 2008-10-02 | 2009-09-15 | ウェブ文書原本判別方法およびウェブ文書原本判別システム |
| JP2013212163A Active JP5739500B2 (ja) | 2008-10-02 | 2013-10-09 | ウェブ文書履歴情報提供方法およびシステム |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009212958A Active JP5417100B2 (ja) | 2008-10-02 | 2009-09-15 | ウェブ文書原本判別方法およびウェブ文書原本判別システム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9477769B2 (ja) |
| JP (2) | JP5417100B2 (ja) |
| KR (1) | KR101086530B1 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101499098B (zh) * | 2009-03-04 | 2012-07-11 | 阿里巴巴集团控股有限公司 | 一种网页评估值的确定及运用的方法、系统 |
| US9489350B2 (en) * | 2010-04-30 | 2016-11-08 | Orbis Technologies, Inc. | Systems and methods for semantic search, content correlation and visualization |
| JP6084087B2 (ja) * | 2013-03-25 | 2017-02-22 | キヤノン株式会社 | オリジナル性検証装置、システム、オリジナル性検証方法及びプログラム |
| CN103399957A (zh) * | 2013-08-21 | 2013-11-20 | 百度在线网络技术(北京)有限公司 | 搜索方法、系统、搜索引擎和客户端 |
| WO2022249259A1 (ja) * | 2021-05-24 | 2022-12-01 | 富士通株式会社 | 検索方法、検索プログラム、および情報処理装置 |
| CN114265917B (zh) * | 2021-11-19 | 2025-07-11 | 中国联合网络通信集团有限公司 | 工单类别识别方法、模型训练方法、装置和设备 |
Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001503537A (ja) * | 1995-10-27 | 2001-03-13 | エイ・ティ・アンド・ティ・コーポレーション | オンラインデータリポジトリの変更データの識別 |
| US6424966B1 (en) * | 1998-06-30 | 2002-07-23 | Microsoft Corporation | Synchronizing crawler with notification source |
| US6547829B1 (en) * | 1999-06-30 | 2003-04-15 | Microsoft Corporation | Method and system for detecting duplicate documents in web crawls |
| JP2003316914A (ja) * | 2002-04-23 | 2003-11-07 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム |
| US20060136511A1 (en) * | 2004-12-21 | 2006-06-22 | Nextpage, Inc. | Storage-and transport-independent collaborative document-management system |
| JP2006227965A (ja) * | 2005-02-18 | 2006-08-31 | Dainippon Printing Co Ltd | トレンド予測装置およびトレンド予測方法 |
| JP2007207202A (ja) * | 2006-02-01 | 2007-08-16 | Balanco:Kk | ウェブログを利用した情報提供システム |
| JP2008176640A (ja) * | 2007-01-19 | 2008-07-31 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム及び情報処理システム |
| JP2008181350A (ja) * | 2007-01-25 | 2008-08-07 | Fuji Xerox Co Ltd | 情報処理システム、情報処理装置及びプログラム |
| JP2008537264A (ja) * | 2005-04-18 | 2008-09-11 | コラージュ・アナリティクス・エルエルシー | 非常に大きいダイナミック文書スペース中のコンテンツを効率的に追跡および年代決定するためのシステムおよび方法 |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20010064736A (ko) | 1999-12-18 | 2001-07-11 | 이계철 | 인터넷 웹페이지 갱신정보 제공 시스템 및 그 방법 |
| US7568151B2 (en) * | 2002-06-27 | 2009-07-28 | Microsoft Corporation | Notification of activity around documents |
| JP2004062479A (ja) * | 2002-07-29 | 2004-02-26 | Fujitsu Ltd | 情報収集装置、方法及びプログラム |
| KR100459379B1 (ko) | 2002-07-30 | 2004-12-03 | 주식회사 모비젠 | 유사 전자문서 판단을 위한 기초데이터 생성방법 및 그시스템 |
| JP4828091B2 (ja) | 2003-03-05 | 2011-11-30 | ヒューレット・パッカード・カンパニー | クラスタリング方法プログラム及び装置 |
| US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
| US20060064394A1 (en) * | 2004-09-17 | 2006-03-23 | International Business Machines Corporation | Method for handling changing and disappearing online references to research information |
| US20080097972A1 (en) * | 2005-04-18 | 2008-04-24 | Collage Analytics Llc, | System and method for efficiently tracking and dating content in very large dynamic document spaces |
| KR100788256B1 (ko) | 2007-05-29 | 2007-12-27 | 주식회사 비전파워 | 네트워크를 이용한 웹서버 위변조 모니터링 시스템 및모니터링 방법 |
| US8886660B2 (en) * | 2008-02-07 | 2014-11-11 | Siemens Enterprise Communications Gmbh & Co. Kg | Method and apparatus for tracking a change in a collection of web documents |
| US7860971B2 (en) * | 2008-02-21 | 2010-12-28 | Microsoft Corporation | Anti-spam tool for browser |
| US8332359B2 (en) * | 2008-07-28 | 2012-12-11 | International Business Machines Corporation | Extended system for accessing electronic documents with revision history in non-compatible repositories |
-
2008
- 2008-10-02 KR KR1020080097145A patent/KR101086530B1/ko active Active
-
2009
- 2009-09-15 JP JP2009212958A patent/JP5417100B2/ja active Active
- 2009-10-01 US US12/572,150 patent/US9477769B2/en active Active
-
2013
- 2013-10-09 JP JP2013212163A patent/JP5739500B2/ja active Active
Patent Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001503537A (ja) * | 1995-10-27 | 2001-03-13 | エイ・ティ・アンド・ティ・コーポレーション | オンラインデータリポジトリの変更データの識別 |
| US6424966B1 (en) * | 1998-06-30 | 2002-07-23 | Microsoft Corporation | Synchronizing crawler with notification source |
| US6547829B1 (en) * | 1999-06-30 | 2003-04-15 | Microsoft Corporation | Method and system for detecting duplicate documents in web crawls |
| JP2003316914A (ja) * | 2002-04-23 | 2003-11-07 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム |
| US20060136511A1 (en) * | 2004-12-21 | 2006-06-22 | Nextpage, Inc. | Storage-and transport-independent collaborative document-management system |
| JP2006227965A (ja) * | 2005-02-18 | 2006-08-31 | Dainippon Printing Co Ltd | トレンド予測装置およびトレンド予測方法 |
| JP2008537264A (ja) * | 2005-04-18 | 2008-09-11 | コラージュ・アナリティクス・エルエルシー | 非常に大きいダイナミック文書スペース中のコンテンツを効率的に追跡および年代決定するためのシステムおよび方法 |
| JP2007207202A (ja) * | 2006-02-01 | 2007-08-16 | Balanco:Kk | ウェブログを利用した情報提供システム |
| JP2008176640A (ja) * | 2007-01-19 | 2008-07-31 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム及び情報処理システム |
| JP2008181350A (ja) * | 2007-01-25 | 2008-08-07 | Fuji Xerox Co Ltd | 情報処理システム、情報処理装置及びプログラム |
Non-Patent Citations (2)
| Title |
|---|
| CSNG200200121006; 西澤秀和、外2名: '文書の更新履歴管理による原本性保証システム' コンピュータセキュリティシンポジウム2000 第2000巻,第12号, 20001026, p.31-36, 社団法人情報処理学会 * |
| JPN6013028290; 西澤秀和、外2名: '文書の更新履歴管理による原本性保証システム' コンピュータセキュリティシンポジウム2000 第2000巻,第12号, 20001026, p.31-36, 社団法人情報処理学会 * |
Also Published As
| Publication number | Publication date |
|---|---|
| US20100088589A1 (en) | 2010-04-08 |
| JP5739500B2 (ja) | 2015-06-24 |
| US9477769B2 (en) | 2016-10-25 |
| KR20100037836A (ko) | 2010-04-12 |
| JP2010086531A (ja) | 2010-04-15 |
| KR101086530B1 (ko) | 2011-11-23 |
| JP5417100B2 (ja) | 2014-02-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5739500B2 (ja) | ウェブ文書履歴情報提供方法およびシステム | |
| CN101782919B (zh) | 一种网页表单数据输出方法、装置及表单处理系统 | |
| CN100483407C (zh) | 文档信息管理系统和文档信息管理方法 | |
| US20180176313A1 (en) | System and method for monitoring network traffic | |
| KR101315554B1 (ko) | 웹 페이지에 키워드를 할당하기 위한 방법 및 장치 | |
| US20080208858A1 (en) | Method of managing websites registered in search engine and a system thereof | |
| CN101499098A (zh) | 一种网页评估值的确定及运用的方法、系统 | |
| US8099430B2 (en) | Computer method and apparatus of information management and navigation | |
| KR100892842B1 (ko) | 사용자 중심 정보탐색 방법 및 시스템 | |
| CN103530365A (zh) | 获取资源的下载链接的方法及系统 | |
| CN107087001A (zh) | 一种分布式的互联网重要地址空间检索系统 | |
| CN102402589A (zh) | 一种提供与搜索请求相关的参考搜索信息的方法与设备 | |
| US20110208715A1 (en) | Automatically mining intents of a group of queries | |
| CN103186600A (zh) | 互联网舆情的专题分析方法和装置 | |
| WO2004111877A1 (ja) | 情報処理方法及びその装置、及びそのプログラム | |
| US20080256435A1 (en) | Interconnection of Document Preparation, Document Viewing, and Alert Processing in Structured Documents | |
| US20090006354A1 (en) | System and method for knowledge based search system | |
| JP4350001B2 (ja) | ページ情報収集プログラム、ページ情報収集方法、及びページ情報収集装置 | |
| JP2007287154A (ja) | オンライン上で提供されるニュース記事に加重値を付与する方法及びそのシステム | |
| US20060080288A1 (en) | Interaction of static and dynamic data sets | |
| EP1645978A1 (en) | Organization of static and dynamic data sets | |
| JP5613536B2 (ja) | 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体 | |
| KR101409103B1 (ko) | 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템 | |
| Li et al. | Discovering associations between news and contents in social network sites with the D-Miner service framework | |
| KR101074587B1 (ko) | 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140916 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141216 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20141219 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150109 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150407 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150423 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5739500 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |