[go: up one dir, main page]

WO1999008207A1 - Structured document preparation apparatus and structured document preparation method - Google Patents

Structured document preparation apparatus and structured document preparation method Download PDF

Info

Publication number
WO1999008207A1
WO1999008207A1 PCT/JP1998/001413 JP9801413W WO9908207A1 WO 1999008207 A1 WO1999008207 A1 WO 1999008207A1 JP 9801413 W JP9801413 W JP 9801413W WO 9908207 A1 WO9908207 A1 WO 9908207A1
Authority
WO
WIPO (PCT)
Prior art keywords
symbol
document
unit
voice
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP1998/001413
Other languages
English (en)
French (fr)
Inventor
Tatsuo Bando
Shitashi Katou
Hiroshi Okutomi
Kiyoshi Toyoda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to US09/269,172 priority Critical patent/US6332039B1/en
Priority to DE69832585T priority patent/DE69832585T2/de
Priority to EP98911074A priority patent/EP0939376B1/en
Priority to CA002266630A priority patent/CA2266630C/en
Publication of WO1999008207A1 publication Critical patent/WO1999008207A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia

Definitions

  • the present invention relates to a structured document creation device and a structured document creation method for creating a structured document in order to treat a document as paper information as an electronic document.
  • the present invention relates to a voice information-added document creation device and a voice information-added document creation method for creating a document with audio information attached.
  • FIG. 1 is a flowchart showing the flow of a conventional procedure for creating a document with audio information.
  • a document to which voice information is to be added is created by inputting using a keyboard or the like, or the document is read by a reading device such as a scanner and displayed on a screen (S101).
  • the screen display is switched to a voice symbol table, and a voice symbol linked to the voice information is selected by a mouse click operation or the like (S102).
  • the voice information to be used can be the one registered in advance in the system, or can be the one that is newly input by a microphone or the like.
  • the screen display is switched to the target image again, and the displayed voice symbol is pasted to the document on the screen by dragging the icon of the voice symbol with a mouse or the like (S103).
  • the present invention has been made in view of the above circumstances, and a first object of the present invention is to simply structure a manuscript as image data.
  • a second object of the present invention is to easily create a document with voice information in a short time even when there are many voice symbols.
  • the present invention provides an input unit for inputting image data obtained by reading a document including a symbol, a symbol recognition unit for recognizing a symbol included in the image data, and a table in which specific data is associated with the symbol. And a document creation unit that creates a structured document described in a structure description language in which the symbols are related to the specific data based on the table. To provide a structured document creation device that performs
  • the table creation unit associates, for a plurality of documents, a symbol included in an image of a document with image data of another document including a symbol having common elements. Can be.
  • the structured document creation device may include: a symbol deletion unit that deletes and outputs a symbol included in image data; and a printing unit that prints an output of the symbol deletion unit. good.
  • the structured document creation device may include a symbol replacement unit for replacing the symbol recognized by the symbol recognition unit with another symbol registered in advance corresponding to the symbol.
  • the document creation unit associates the process relating to the specific meaning with a symbol having a specific meaning, and performs the process when the symbol is activated.
  • a structured document that accesses specific data associated with the symbol later may be created.
  • the symbol recognition unit may recognize the symbol in a predetermined area of the image file.
  • the symbol recognizing unit recognizes the symbol from the image read from the document including the symbol.
  • the table creation unit creates a table in which symbols are associated with specific data.
  • the document creation unit creates a structured document in which a symbol is described in a structure description language in which the symbols are related to the specific data using a table. In a structured document, clicking on the symbol allows you to access the specific data associated with it.
  • the specific data includes, for example, image data of a manuscript. In this case, you can access (jump) and display the image of another document by clicking the symbol of one document. This makes it possible to easily convert an existing manuscript into which a symbol is formed with a stamp or the like into a structured document.
  • an input unit into which image data obtained by reading a document is input, a symbol addition unit that adds a symbol to the image data, and a table that associates specific data with the symbol is created
  • a structuring unit comprising: a table creating unit; and a document creating unit that creates a structured document described in a structural description language in which the symbol is related to the specific data based on the table.
  • a document creation device is provided.
  • the symbol adding section adds a symbol to the image data read from the original.
  • the table creation unit creates a table in which symbols are associated with specific data.
  • the document creation unit creates a structured document in which the symbol is described in a structure description language relating the specific data to the specific data based on the table.
  • the structured document creation device may include a display unit for displaying the input image data.
  • the display unit It is possible to add a symbol while confirming the contents of.
  • the present invention provides an input unit into which an image data obtained by reading a document including a symbol is input, a symbol recognition unit that recognizes a symbol included in the image data, and a specific data associated with the symbol.
  • a table creator for creating a structured table
  • a document creator for creating a structured document in which the symbols are described in a structure description language relating the specific data based on the table
  • a transmitting unit for transmitting.
  • the present invention provides an input unit into which image data obtained by reading a document is input, a symbol adding unit that adds a symbol to the image data, and a table that creates a table in which a specific data is associated with the symbol.
  • a creating unit a document creating unit that creates a structured document in which the symbols are associated with the specific data in a structured description language based on the table, and a transmitting unit that sends the structured document.
  • a communication device characterized by comprising:
  • the present invention includes a step of recognizing a symbol included in image data obtained by reading a document including the symbol, a step of creating a table in which a specific data is associated with the symbol, Creating a structured document in which the symbols are described in a structured description language in which the symbols are associated with the specific data based on the structured document.
  • the present invention provides an input unit to which image data obtained by reading a document with a voice symbol is input, a recognition unit that recognizes the voice symbol from the image data, a voice storage unit that stores voice information,
  • a document creation device with speech information comprising: a table creation unit for creating a table in which the recognized speech symbol is associated with the stored speech information.
  • a document with audio information is created from a document with an audio symbol Therefore, even if there are many voice symbols, all the voice symbols can be easily attached in a short time.
  • the table creating unit may associate different audio symbols with each type of audio information.
  • the user can visually identify the type of audio information based on the shape of the audio symbol.
  • the present invention provides a step of reading a document with a voice symbol, a step of recognizing a voice symbol from the read document, associating the recognized voice symbol with voice information, and selecting a voice symbol on the screen, a voice is generated.
  • a method for creating a document with audio information characterized by creating a document with audio information to be reproduced.
  • FIG. 1 is a flowchart showing the flow of a conventional process for creating a document with audio information
  • FIG. 2 is a block diagram of an apparatus common to Embodiments 1 to 3
  • FIGS. 3A to 3E are A diagram showing a sample of a document common to the first to third embodiments
  • FIG. 4 is a flowchart showing the operation of creating a symportable table and a link table according to the first embodiment.
  • FIG. 5 is a flow diagram following Figure 4,
  • FIG. 6 is a diagram showing a symbol table for recognizing the shape of a symbol in the first embodiment.
  • FIG. 7 is a diagram showing a symbol table for recognizing the colors of the symbols according to the first embodiment.
  • FIGS. 8A to 8E are diagrams showing link tables corresponding to each page of the manuscript according to the first embodiment.
  • FIG. 9 shows the relationship between pages linked by symbols according to the first embodiment.
  • FIG. 10 is a flowchart showing the operation of the HTML language creation process according to the first embodiment.
  • FIG. 11 is a flow diagram following FIG. 10,
  • FIG. 12 is a diagram showing a file configured for one page of a document according to the first embodiment
  • FIGS. 13A to 13C are diagrams showing files configured for the second page of the manuscript according to the first embodiment.
  • FIGS. 148 to 14C are diagrams showing files configured for the third page of the manuscript according to the first embodiment.
  • FIGS. 158 to 15C are diagrams showing files configured for the fourth page of the manuscript according to the first embodiment.
  • FIGS. 168 to 16C are diagrams showing files configured for the fifth page of the manuscript according to the first embodiment.
  • FIG. 17 is a diagram showing a method of representing a symbol by a stamp in the first embodiment
  • FIG. 18 is a diagram illustrating a method of representing symbols by colors according to the first embodiment.
  • FIG. 19 is a diagram illustrating a method of replacing symbols according to the first embodiment.
  • FIG. 20 is a screen according to the first embodiment.
  • Fig. 21 shows a method of attaching a symbol
  • Fig. 21 shows a symbol with a special meaning in the first embodiment
  • Fig. 22 defines a specific area of the symbol in the first embodiment. Diagram showing the case,
  • FIG. 23 is a flowchart showing an operation of the entire structured document creation device according to the second embodiment of the present invention.
  • FIG. 24 is a flowchart showing a procedure of a symbol recognition step in the second embodiment.
  • FIG. 25 is a schematic diagram showing a manuscript in a symbol recognition process according to Embodiment 2.
  • FIG. 26 is an enlarged view showing a part of FIG. 25,
  • FIGS. 27A to 27D are diagrams respectively showing a management table for each page of the document according to the second embodiment
  • FIGS. 28 to 30 are flowcharts of the HTML file generation process in the second embodiment.
  • FIGS. 31 and 32 are diagrams respectively showing HTML files generated in the second embodiment
  • FIG. 33 is a schematic diagram showing the hierarchical structure of the HTML file created in the second embodiment.
  • FIG. 34 is a flowchart showing the operation of the structured document creation device when symbols are not printed according to the third embodiment of the present invention.
  • FIG. 35 is a flowchart showing an operation of reliably detecting a symbol by taking a difference between an image data added with a symbol and an image data not added in the same page in Embodiment 4 of the present invention.
  • FIG. 36 is a block diagram illustrating a configuration of a document creating apparatus with audio information according to Embodiment 5 of the present invention.
  • FIG. 37 is a diagram showing the symbol table in the symbol table storage unit of the fifth embodiment.
  • FIG. 38 is a diagram showing a link table in the link table storage unit according to the fifth embodiment.
  • FIG. 39 is a diagram showing a document with a voice symbol according to the fifth embodiment
  • FIG. 40 is a front view showing a flow of a process of creating a document with voice information according to the fifth embodiment.
  • FIG. 2 is a block diagram of the structured document creation device according to the first to fourth embodiments of the present invention.
  • the control unit 1 controls the whole.
  • the control unit 1 recognizes symbols, creates a link table, and creates a structured document, which will be described later.
  • the communication control unit 2 is connected to a telephone line or the like, and controls facsimile communication and communication with a computer network such as the Internet.
  • the operation panel 3 has a touch key and a display panel, and displays input, input data, output data, and the like.
  • the scanner unit 4 reads a document and outputs image data. This image data is input to the control unit 1 and processing such as symbol recognition is performed.
  • the pudding unit 5 prints the received data and the data read by the scanner unit 4.
  • the symbol symbol storage unit 7 stores the received facsimile data and the symbol displayed in the data input from the scanner unit 4.
  • the link table storage unit 8 stores a table that describes the symbols displayed on each page of the image of the document, the positions thereof, and the pages related to the symbols.
  • FIGS. 3A to 3E show sample originals used in the first to third embodiments. It consists of a five-page manuscript.
  • the first page is used as a table of contents, and each item of “Table of Contents” “Instruction J” “Usage” and “Catalog” is marked with a symbol ⁇ , a reference, and a woman.
  • Page 3 is the title of "How to use” and its symbol. And instructions on how to use it.
  • Page 4 has almost the same format as page 3.
  • Page 5 contains the title of the “Intranet” shown on page 2, its symbols ⁇ and an explanatory note. Thus, the same symbol is attached to the title page and the title page.
  • FIGS. 4 and 5 are flowcharts showing the operation of creating a symbol table and a link table.
  • the 5-page original shown in FIGS. 3A to 3E is read by the scanner unit 4 (S1), and these image data are stored in the image storage unit 6 in the GIF file format (S1). 2).
  • the GIFF file format is a small image file format convenient for communication.
  • Figure 6 shows the symbol table.
  • the symbol table is stored in the symbol symbol storage unit 7.
  • the elements of a symbol include, for example, a wide range of shapes, colors, sizes, line types, fill types, shades or brightness.
  • FIG. 7 shows a case where a color which is another element of the symbol is recognized.
  • the symbol is recognized by color, it is represented by the color of the symbol, the number of dots, and the size as shown in FIG. Both the color and shape of the symbol may be recognized and the combination of color and shape may be relevant.
  • the position of the symbol is recognized.
  • the symbol is represented by the center coordinates of the symbol and a radius when a circle having a size in which the symbol fits is drawn around the center coordinates.
  • the recognized symbol position is entered in the link table.
  • the link table is a table showing the data of this symbol and the pages linked by the symbol.
  • Figures 8A to 8E show each page of the manuscript and the link table corresponding to this page. 8A to 8E show pages 1 to 5 in order.
  • FIG. 8A in FIG. 8A indicates the image data of the first page of the document stored in the file IMAGE0.0.GIF.
  • the image data of the manuscript is stored in one file for each page.
  • the file names are IMAGE 00. GIF to IMAGE 04. GIF in order from page 1 to page 5.
  • a link table 82 is created corresponding to the image data of each page 81 and stored in the link table storage unit 8.
  • the link table 82 has columns for page, symbol, address, area, and link destination. If there is a symbol that first appears on the page, counting from the first page, enter the page on which the symbol appears.
  • the address column shows the center coordinates of the symbol
  • the area column shows the radius of a circle drawn around the symbol with the center coordinates of the symbol as the center.
  • the link table on the second page the symbol ⁇ that appeared for the first time on the second page is entered.
  • Sympol II data is also entered.
  • Symbol II is a symbol added to pages 2-5 to return to the first page, as described later, and the link destination is the file name of the first page.
  • pages 3-5 there is no symbol that appears for the first time, so only the return symbol is used, and all data is the same. In this way, the link table on the first page is filled with data excluding the link destination.
  • the link table stored in the link table storage section 8 is stored. It is determined whether the bull 82 has a symbol. For the first page, there is no page before, so there is no symbol in link table 82, so go to S13.
  • the file name of the image data of pages 3 and 4 in the link destination column is I MAGE 02. GIF, I MAGE 02. GIF
  • a return symbol “ ⁇ J” is added to a predetermined position of the image data.
  • the return symbol“ ⁇ J ” is returned to its own link table 82, and In other words, return Enter the center coordinate of the symbol ⁇ in the address box and enter the radius data in the area.
  • the link ⁇ should have the one-page file name I MAGE 00.
  • the GIF is filled in. The process of adding the symbol ⁇ ⁇ to the image data is performed in the HIML language creation process described later, thus completing the creation of the symbol table and the link table.
  • FIG. 9 is a diagram illustrating a relationship between pages linked by the symbol. 1 ⁇ —Simpol displayed on di 91 ⁇ 92a, qin 92b, by woman 92c, 2 ⁇ Pages 4 93 to 95 are linked to page 1 91, and page 5 96 is linked to page 2 93 by the symbol order 92d displayed on page 2. On pages 2-5, 93-96, there is a return symbol 97, which returns to page 91.
  • the symbol ⁇ 92a, Hata 92b, ⁇ 92c on page 91 displayed on the browser the user can access the files on pages 2 to 4 93 to 96 corresponding to each symbol.
  • "access” means jumping to a link destination.
  • Link destination broadly includes data such as program files, document files, text files, image files, and video files associated with the symbol. “Activate” means to download a link, display its contents, or execute a program, for example, by pointing and clicking a symbol on a browser.
  • FIGS. 10 and 11 are flowcharts showing the operation of the HTML language creation process shown in FIG.
  • the HTML language has a program called the Critical Map, which sets up linkable areas in various parts of an image so that multiple files can be accessed from a single image.
  • the display looks like this:
  • a HREF "map file name. MAP" ⁇
  • FIGS 9 and 10 are flowcharts for creating a HOMEN. HTM file for each page.
  • N is a value representing the number 00 to 04 assigned to each file for each page.
  • N 0 is set and the creation of HOME00. HTM on the first page is started (S20).
  • Step S21 shows the standard of the HOME. HTM file.
  • the HOME. HTM file for each page is completed by substituting the title name and the value of N of F I LEN. MAP, I MAGEN. G I F for each page.
  • the standard structured document shown in step S21 is a simple program that expresses the title name and expression (1) in HTML language. In other words, sandwich both ends between HTML> and ZHTML>, write HEAD) to indicate the title, and sandwich the title name between TITLE) and (ZTITLE).
  • (1) is sandwiched between ⁇ B ⁇ DY> and ZB ⁇ DY>.
  • OCR recognizes the image data obtained by scanning the first page of the manuscript as the title. In this case, it is set to "In evening net fax" (S22). N of the FI LEN. MAP and IMAGEN. MAP is set to 00 (S23). The completed file is saved with the file name HOME 00. HTM (S24). HOME 00. HTM shown in Fig. 12A is the file created in this way. In Figure 11, for each symbol on one page, the display shown in step S25 is the coordinates and radius of each symbol and the HOME page of the page linked to this symbol. Indicates the location of the HTM file.
  • X and Y are the coordinates of the symbol
  • Z is the radius of the circle surrounding the symbol
  • HTTP is the abbreviation of the hypertext transfer protocol, indicating that the file following this is a file for the WWW server.
  • SITE-NAME indicates the site name of the WWW server that transfers the completed file described later, and indicates that the HOME.
  • HTM file is stored in that site.
  • MAP shown in FIG. 12B is a file created in this way.
  • GIF shown in FIG. 12C is an image of one page read by the scanner unit 4. With the completion of the three files shown in Figs. 12A to 12C, the structured document on the first page is completed.
  • FIG. 13B shows FI LE01. MAP.
  • the structured document on the second page is completed.
  • N 02 (S281), and the same processing is performed up to the last five pages.
  • 14A to 14C show the third page
  • FIGS. 15A to 15C show the fourth page
  • FIGS. 16A to 16C show the fifth page of the structured document.
  • Each page created in this way has three files The file, HOMEN. HTM, FI LEN. MAP, and I MAGEN. GIF are paired and transferred to the WWW server (S283).
  • FIG. 17 shows a case where the symbol 102 is pressed on each page of the document 101 with the stamp 103.
  • a stamp ink that disappears after a certain period of time because it does not stain the original.
  • a sticker representing a symbol may be attached instead of the stamp 103. Then, peel off the sticker after reading at the scanner.
  • FIG. 18 shows a case where color is used as a symbol. Although the figure also shows the shape of the stamp, when the symbol is identified by color as described in Fig. 7, only the color, the number of dots, and the size are targeted. In this case as well, it is good to use an ink that disappears after a lapse of time.
  • FIG. 19 shows a case where the symbol 102 pressed on the original 101 by the stamp 103 is replaced with another symbol 104 built in the apparatus.
  • the replacement symbol 104 it is preferable to use a familiar one such as an animal, a plant, a star, and a heart symbol, which is well known to the user. This is because the operation is user-friendly and errors are reduced.
  • FIG. 20 shows a case where an original is read as image data without adding a symbol, displayed on the display device 111, and the symbol 113 is added on the screen 112. FIG. In this way, it is not necessary to attach the symbol 113 to the original document, so that the original is not dirty.
  • FIG. 21 shows a case where a special symbol having a previously registered meaning is recognized.
  • the secret 122 is stamped with a stamp 122 on a secret page 122, which represents a secret such as a so-called "maru secret”.
  • a password request process is associated with the symbol 123 to create a structured document.
  • PC P 8 0 PC P 8 0
  • FIG. 22 shows a case in which a region (symbol setting area) 133 in which the symbol 13 is formed in the document 13 is previously determined. That is, the symbol is stamped in the symbol setting area 133 with the stamp 13 4.
  • the control unit 1 it is sufficient for the control unit 1 to extract and recognize the symbols 13 from a specific area of the original. As a result, the accuracy and speed of symbol recognition are improved as compared with the case where the symbols 13 2 are extracted from the entire surface of the document 13 1.
  • FIG. 23 is a flowchart showing an operation of the entire structured document creating apparatus according to the second embodiment.
  • the operator first gives an instruction to create a homepage in HTML language using the operation panel 3 shown in FIG.
  • the operator enters the title of the home page.
  • control unit 1 shown in FIG. 2 saves the read original in a JPEG format. Specifically, the title input in S2302 is used for the file name. That is, the current page number is added to the title, the extension jpg is added, and this is saved as a file name.
  • S2305 it is determined whether there is a next page. If there is a next page, the number n of pages is incremented in S2306, the process returns to S103, and the next page is read. If there is no next page, go to S2307.
  • the control unit 1 recognizes a symbol included in the JPEG file. Recognition of the symbol is performed on the center coordinates, radius, and color information of the symbol for each page. These recognition results are stored in a table in page units.
  • control unit 1 sorts the table created in S2307. Here, based on the color information from the table, an isolated symbol with no corresponding color information is deleted from the table. If there are three or more identical symbols, an error is displayed.
  • control unit 1 performs an HTML file generation process.
  • a file for creating a homepage is automatically generated in HTML language.
  • the generated HTML file is saved. Specifically, the page number is added to the title input in S2303, and the file is saved with the extension htm added. That is, the file name is title + page number.
  • S2311 it is determined whether or not there is a next page. If there is a next page, m is incremented in S2312 and the HTML generation processing is performed again. If there is no next page, transfer the HTML file generated to the server in S2313.
  • the color of the reference point is recognized.
  • the reference point is determined by sampling several points 202 at the upper left corner of the document 201 and averaging the sampling results to determine the color of the reference point. A color different from the reference color is detected based on the color of the reference point.
  • the image data to be handled is JPEG data, which is decomposed into the YCbCr color space and compressed. If the color space of YCbCr is used, the conversion process can be omitted, and the efficiency is improved. The processing can be performed in an efficient manner. In addition, recognition that is more similar to humans than RGB can be performed.
  • a predetermined width is scanned. As shown in FIG. 4, scanning is performed for a predetermined width W for one line (L). In S2404, it is detected whether a different color is detected in the scanned line L or not. If there is no different color, go to S2405, lower by 1 cm, and scan the width W again.
  • the colors in the dark parts that is, the parts from black to white
  • the parts in the subsequent colors that is, the light parts
  • step S2406 the coordinates of the color boundaries 204 and 205 shown in FIG. 26 are calculated.
  • step S2407 the coordinates of the intermediate point 206 of the coordinates of the two points are calculated.
  • the coordinates of the center O of the circular symbol 203 are calculated based on the coordinates. Specifically, fix the X coordinate and search for the coordinate that changes color with the Y coordinate. The center coordinates are calculated based on the coordinates.
  • the radius R is calculated based on the center coordinates calculated in S2408.
  • FIGS. 28 to 30 are flowcharts of the HTML file generation processing of S2309 shown in FIG.
  • steps S2801 to S2803, up to the third line of the HTML file shown in FIG. 31 are sequentially generated.
  • step S2804 a title name is output using the title input at the time of reading the document and the number of pages.
  • step S2805 ⁇ ZT I ⁇ LE> is output after the title name.
  • step S2809 the file name of the JPG file saved when reading the document is output.
  • step S2810 the remainder of the sixth line is output, and in 32811, the title of the 111th page is output.
  • a tag for setting a range to be clicked on the homepage is output on the eighth line.
  • the center coordinates and the radius, which are the position information of the symbol are output as the arguments X, Y, and R of the tag.
  • step S2819 the link destination is searched using a table to output the link destination. Here, which page table has the same color information Search for.
  • step S2820 the title corresponding to the searched page is output with the extension of htm added.
  • step S2821 the eight lines are closed to generate a link destination.
  • Figure 32 shows the contents of the HTML file for a page without a link.
  • the difference from the HTML file shown in Fig. 31 is the first line. 11
  • the first line is provided to return to the first page.
  • the document is hierarchically structured as shown in FIG. That is, the first symbol 332 and the second symbol 333 included in the first page 331 have different colors from each other, and are linked to the second page 334 and the fourth page 335, respectively. Therefore, when the first symbol 332 on the first page 331 is clicked, the second page 334 is accessed and displayed. Similarly, clicking on the second symbol 33 will access the fourth page 335.
  • the third symbol 336 included in the second page 334 is linked to the third page 337. Thus, clicking on the third symbol 336 on the second page 334 accesses and displays the third page 337.
  • an existing document described in a paper manuscript can be easily converted to HTML by using symbols of different colors. Can be converted to documents.
  • the third embodiment is a case where image data with a symbol stored in the image storage unit 6 shown in FIG. 2 is printed, and where the symbols are removed and printed.
  • the image data stored in the image storage unit 6 is data read by the scanner unit 4 or data received by facsimile communication by the communication control unit 2.
  • FIG. 34 is a flowchart showing the operation in the third embodiment.
  • the first page of the image data to be printed is read out by the image storage unit 6 (S40), then the coordinate points of the symbol are fetched (S41), and the symbol existing area is deleted overnight. (S42). After the deletion, the page is printed (S43). Check whether there is a next page (S44). If there is, repeat the operations of steps S40 to S43 until the end of the page. As a result, printing of a document without a symbol is obtained.
  • Embodiment 4 shows a method for reliably discriminating even when the symbol overlaps with the original text or picture part and it is difficult to discriminate.
  • the image data is stored in the image storage unit 6 in a state where no symbol is added, and the image data is displayed on the screen as described in FIG. After that, the recognition and the position of the symbol are confirmed, and the procedure for creating a structured document is started.
  • FIG. 35 is a flowchart showing the operation of the fourth embodiment.
  • Input the image data (S50).
  • the image data is obtained by reading from the scanner unit 4 and receiving facsimile data.
  • the input data is stored in the image storage unit 6 (S51).
  • the stored image data is read out and attached with the symbol by the above-described method.
  • the image data to which no symbol is added is read out from the image storage unit 6 and converted into a bitmap (S55). Only the symbols are reliably extracted by extracting the difference between the bitmap data and the image data with and without the symbol added (S56).
  • the extracted symbols and their coordinates are recognized (S57), and the procedure for creating a structured document shown in FIGS. 4 and 5 of the first embodiment is started (S58).
  • a symbol can be recognized with high accuracy even when the symbol and the original character or picture overlap.
  • Embodiment 5 relates to a document creation device and a method for creating a document with a speech code.
  • FIG. 36 is a block diagram showing a configuration of a document creating apparatus with audio information according to one embodiment of the present invention.
  • the document preparation device with audio information includes a CPU (Central Control Processing Unit) unit 401 for controlling each circuit, and an input unit 402 such as a keyboard and a mouse for inputting various instructions by a user.
  • a scanner unit 403 that reads a document or the like as image information
  • an OCR unit 404 that recognizes characters from the read image information
  • an image information storage unit 405 in which the image information read by the scanner unit 403 is stored.
  • a document with audio symbols can be imported in advance, and a document with audio information can be created based on this.
  • the voice information-added document creation device includes a voice input unit 406 for inputting voice information, And a voice information storage unit 407 for storing voice information input from the voice input unit 406.
  • the voice information attached to the image can be taken in and stored in the voice information storage unit 407.
  • the voice information can be input using a microphone or from an attached telephone device.
  • the audio information is stored in a file format. If the extension of the file name of the audio information is set to “WAV” or the like in advance, later processing and management become easier.
  • the document creating apparatus with voice information has a symbol table storage unit 408 for storing voice symbols, and can store voice symbols corresponding to voice information in a symbol table.
  • FIG. 37 is a diagram showing a symbol table in the symbol table storage unit 408.
  • the shape of each audio symbol and the file name of the audio information to be linked are registered in the symbol table.
  • the audio symbol can be represented by a color or the like in addition to the shape.
  • the created speech symbol is registered in the symbol table storage section 408 together with the file name of the corresponding speech information.
  • the file name of the voice information of the instrument is MU SIC :, the file name of the voice information of the singing voice is SONG, the file name of the voice information of the narration is V ⁇ ICE, etc.
  • the document creating apparatus with voice information includes a voice symbol recognition unit 409 for recognizing voice symbols displayed on each page of the document, and a link text linking the voice symbol with the position and voice information of each page of the document.
  • Link table creation unit 410 for creating a table, and a link table storage unit for storing the created link table 4 11 1 can link the input image information and audio information to create a document with audio information.
  • FIG. 38 is a diagram showing a link table in the link table storage unit 411.
  • the link template in the link template, the shape of each audio symbol, the file name of the linked image information, the position of the audio symbol in the image information, and the file name of the linked audio information are registered correspondingly.
  • the position of the voice symbol is represented by the center coordinates of the symbol and the radius of a circle large enough to accommodate the symbol with the center coordinates as the center, but may be represented by other parameters.
  • the document creating apparatus with audio information includes display means 4 12 for displaying an image on a screen, a communication control section 4 13 for connecting to a line and controlling network communication such as facsimile communication and the Internet, and reception information. And a print unit 414 for printing image information read by the scanner unit 402 and an audio information output unit 415 for reproducing audio information. It can perform various processes such as transmission / reception with other information devices, output, and playback. In addition, corresponding audio information can be reproduced by clicking a mouse or the like on each audio symbol on the screen to provide an auditory service in addition to a visual service, thereby improving operability.
  • the attached audio information and link table are transmitted as an attached file together with the image information. As a result, audio information can be reproduced at the transmission destination.
  • FIG. 39 is a view showing an example of a document with a voice symbol according to the fifth embodiment.
  • stamps 4 4 1 and 4 4 By using 2, it is possible to easily attach the same number of voice symbols to the manuscripts 4 4 3 and 4 4 4.
  • the shape of the voice symbol is changed for each type of voice information to be registered, such as musical instruments, singing voices, and narrations.
  • a method of attaching a voice symbol to a manuscript there is a method of attaching a sticker in addition to a method of using a stamp.
  • FIG. 40 is a flowchart showing a flow of a process of creating a document with audio information according to the fifth embodiment.
  • an original with a voice symbol is read from the scanner unit 3 (S501).
  • the read originals are sequentially stored in the image information storage unit 405 as image information (S502).
  • the read image information is separated into regions, and the document in the document is subjected to character recognition in the OCR section 404, and the image is captured as an image.
  • the voice symbol recognition unit 409 recognizes whether or not a voice symbol having the same shape as the voice symbol registered in the symbol table storage unit 408 exists in the stored image information. (S503). If the voice symbol is not recognized, the read image information is determined to be normal image information without voice information, and the processing ends.
  • the voice symbol When the voice symbol is recognized, the voice symbol is written in the link table together with the position of each page of the document and the name of the voice information file to be linked by the link table creation unit 410 (S504).
  • a document with audio information can be created.
  • the user pastes the voice symbol into the original document and reads it, no further operation is required.
  • the voice information of the corresponding instrument, singing voice, narration, etc. will be reproduced. Be born.
  • the created document with audio information is sent to the communication control unit 413, printer unit 414, and audio information output unit 415 for various processing such as transmission and reception with other information devices, output, and playback. Is done.
  • a facsimile apparatus having a document creation function has been described as an example.
  • the present invention is not limited to this, and can be applied to a personal computer connected to an external scanner, an Internet terminal, and the like.
  • the structured document creation device is useful for a facsimile machine, and is particularly suitable for converting an existing document into a structured document.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Computer And Data Communications (AREA)

Description

明 細 書 構造化文書作成装置及び構造化文書作成方法 技術分野
本発明は、 紙情報である原稿を電子化文書として扱うために構造化文書を作 成する構造化文書作成装置及び構造化文書作成方法に関する。また、本発明は、 音声情報を添付した文書を作成する音声情報付文書作成装置及び音声情報付文 書作成方法に関する。 背景技術
近年、 インターネットを代表とするネットワークの進歩により、 ネットヮー クから容易に情報を取り出すことが可能となっている。 特にインターネッ卜で 用いられている H TM L (Hyper Tex t Markup Language)記述による情報の構造 化によって、 操作性において非常に優れたブラウザ (情報検索用のアプリケー シヨンソフトウェア) が普及している。 このためパーソナルコンピュータにて 文書情報にとどまらず、 音声や動画などを入力装置を構造化して格納する様々 な方式が利用されている。 ここで構造化とはリンク構造又は階層構造などにす ることを意味する。
しかし、 イメージデータのように構造化しにくい情報も存在する。 このよう な情報は 1つの固まりのフアイル単位として扱われることが多い。 ィメ一ジ内 部を構造化するためには膨大な手間ひまがかかる。
従来、 紙に記載されている既存の文書を構造化する場合、 例えば、 光学式文 字認識 (O C R ) 装置を用いてキャラクタに変換するか、 キーボードより入力 する必要がある。 このため、 作業に人手がかかる。 また、 スキャナで既存の文 書をイメージ化することも可能であるが、 イメージをいくつかに分割し、 構造 化することは困難である。
また近年、 パーソナルコンピュータ等の情報端末機器の中に、 文書に音声情 報をリンクさせる音声情報を添付した文書 (以下、 音声情報付文書という) を 作成する機能を有するものが普及してきている。
従来の音声情報付文書の作成手順の流れについて、 図 1を用いて説明する。 図 1は、 従来の音声情報付文書の作成手順の流れを示すフロー図である。 まず、 音声情報を付す対象となる文書をキーボード操作等の入力により作成 し、又は、スキャナ等の読取装置にて文書を読み取り、画面上に表示させる(S 1 0 1 ) 。
次に、 画面表示を音声シンポルテーブルに切替え、 マウスのクリック動作等 により、 音声情報にリンクする音声シンポルを選択する (S 1 0 2 ) 。
使用する音声情報は、 システムに予め登録されたものを使用することも可能 であり、 新たにマイク等により入力したものを使用することも可能である。 次に、 画面表示を再び対象画像に切替え、 表示させた音声シンポルのアイコ ンをマウスのドラッグ操作等により、 画面上の文書に音声シンポルを貼り付け る (S 1 0 3 ) 。
もし、 他に付すべき音声シンポルが存在すれば、 S 1 0 2から S 1 0 3の操 作を繰り返す (S 1 0 4 ) 。
すべての音声シンポルを対象画像に貼り付けれ終わると、 音声情報付文書は 完成し、 作成作業は終了する。
しかし、 上記従来の音声情報付文書作成装置では、 ユーザは、 付すべき音声 シンポルの数だけ S 1 0 2から S 1 0 3の作業を必要とし、 音声シンボルが多 数ある場合、 音声情報付文書を完成するまで相当の手間がかかる。 発明の開示
本発明は以上のような実情に鑑みてなされたもであり、 本発明の第 1の目的 は、 原稿をイメージデータとして簡単に構造化することである。
また、本発明の第 2の目的は、 音声シンボルが多数ある場合でも、短時間で、 容易に音声情報付文書を作成することである。
本発明は、 シンボルを含む原稿を読み取ったイメージデータが入力される入 力部と、前記イメージデ一夕に含まれるシンポルを認識するシンポル認識部と、 前記シンボルに特定のデータを対応付けしたテーブルを作成するテーブル作成 部と、 前記テーブルに基づいて前記シンボルを前記特定のデータに関係付けし た構造記述言語で記載した構造化文書を作成する文書作成部と、 を具備するこ とを特徴とする構造化文書作成装置を提供する。
本発明において、 テーブル作成部は、 複数の原稿について、 ある原稿のィメ —ジデ一夕に含まれるシンポルとこれと共通の要素を有するシンポルを含む他 の原稿のイメージデータとを対応付けすることができる。
また、 本発明にかかる構造化文書作成装置は、 イメージデータに含まれるシ ンボルを削除して出力するシンボル削除部と、 前記シンボル削除部の出力を印 刷する印刷部と、 を具備しても良い。
また、 本発明にかかる構造化文書作成装置は、 シンボル認識部で認識したシ ンポルを、 このシンボルと対応して予め登録してある他のシンポルに置換する シンボル置換部を具備しても良い。
また、 本発明にかかる構造化文書作成装置において、 文書作成部は、 特定の 意味を持つシンポルに前記特定の意味に関する処理を関連付けし、 前記シンポ ルが活性化された場合に前記処理を行った後に前記シンポルに関係付けした特 定のデータにアクセスする構造化文書を作成するものであっても良い。 また、 本発明において、 シンポル認識部は、 イメージファイルの所定の領域 内についてシンポルの認識を行っても良い。
上記発明により、 シンボル認識部は、 シンポルを含む原稿を読み取ったィメ —ジデ一夕からシンボルを認識する。 テーブル作成部は、 シンボルに特定のデ —夕を対応付けしたテーブルを作成する。 文書作成部は、 テーブルを用いてシ ンポルを前記特定のデータに関係付けした構造記述言語で記載した構造化文書 を作成する。 構造化文書において、 シンポルをクリックすると関連付けした特 定のデ一夕にアクセスできる。 特定のデータには、 例えば、 原稿のイメージデ 一夕が含まれる。 この場合、 ある原稿のシンポルをクリックすると、 他の原稿 のイメージデ一夕にアクセス (ジャンプ) し、 表示することができる。 これに より、 既存の原稿にスタンプ等でシンポルを形成したものを、 容易に構造化文 書に変換することができる。
また、 本発明は、 原稿を読み取ったイメージデータが入力される入力部と、 前記ィメ一ジデー夕にシンポルを付加するシンポル付加部と、 前記シンポルに 特定のデータを対応付けしたテーブルを作成するテーブル作成部と、 前記テ一 ブルに基づいて前記シンポルを前記特定のデータに関係付けした構造記述言語 で記載した構造化文書を作成する文書作成部と、 を具備することを特徴とする 構造化文書作成装置を提供する。
上記発明により、 シンボル付加部は、 原稿を読み取ったイメージデ一夕にシ ンボルを付加する。 テーブル作成部は、 シンボルに特定のデータを対応付けし たテーブルを作成する。 文書作成部は、 テーブルに基づいて前記シンポルを前 記特定のデータに関係付けした構造記述言語で記載した構造化文書を作成する。 これにより、 既存の原稿を、 容易に構造化文書に変換することができる。
本発明にかかる構造化文書作成装置において、 入力されたイメージデータを 表示する表示部を具備しても良い。 この構成により、 表示部でイメージデ一夕 の内容を確認しながらシンボルを付加することが可能である。
また、 本発明は、 シンポルを含む原稿を読み取ったイメージデ一夕が入力さ れる入力部と、 前記イメージデータに含まれるシンボルを認識するシンポル認 識部と、 前記シンボルに特定のデータを対応付けしたテーブルを作成するテー ブル作成部と、 前記テーブルに基づいて前記シンポルを前記特定のデータに関 係付けした構造記述言語で記載した構造化文書を作成する文書作成部と、 前記 構造化文書を送信する送信部と、 を具備することを特徴とする通信装置を提供 する。
また、 本発明は、 原稿を読み取ったイメージデータが入力される入力部と、 前記イメージデータにシンボルを付加するシンボル付加部と、 前記シンボルに 特定のデ一夕を対応付けしたテーブルを作成するテーブル作成部と、 前記テー ブルに基づいて前記シンボルを前記特定のデータに関係付けした構造記述言語 で記載した構造化文書を作成する文書作成部と、 前記構造化文書を送信する送 信部と、 を具備することを特徴とする通信装置を提供する。
また、 本発明は、 シンポルを含む原稿を読み取ったイメージデータに含まれ るシンポルを認識する工程と、 前記シンボルに特定のデ一夕を対応付けしたテ 一ブルを作成する工程と、 前記テーブルに基づいて前記シンボルを前記特定の データに関係付けした構造記述言語で記載した構造化文書を作成する工程と、 を具備することを特徴とする構造化文書作成方法を提供する。
また、 本発明は、 音声シンボルを付した原稿を読み取ったイメージデータが 入力される入力部と、 前記イメージデータから前記音声シンボルを認識する認 識部と、 音声情報を格納する音声格納部と、 認識した前記音声シンポルと格納 した前記音声情報を対応付けたテーブルを作成するテーブル作成部とを具備す ることを特徴とする音声情報付文書作成装置を提供する。
上記発明により、 予め音声シンポルを付した原稿から音声情報付文書を作成 できるので、 音声シンボルが多数ある場合でも、 そのすベての音声シンボルを 短時間で、 容易に付すことができる。
本発明において、 テーブル作成部は、 音声情報の種類ごとに、 異なる音声シ ンポルを対応付けしても良い。 この構成により、 ユーザは、 音声シンボルの形 状により、 視覚的に音声情報の種類を識別できる。
また、 本発明は、 音声シンボルを付した原稿を読み取る工程と、 読み取った 原稿から音声シンボルを認識する工程と、 認識した音声シンボルと音声情報を 関連付けし、 画面上の音声シンボルを選択すると音声が再生される音声情報付 文書を作成することを特徴とする音声情報付文書作成方法を提供する。 図面の簡単な説明
図 1は、 従来の音声情報付文書の作成処理の流れを示すフロー図、 図 2は、 本発明の実施の形態 1〜 3に共通する装置のブロック図、 図 3 A〜図 3 Eは、 実施の形態 1〜3に共通する文書のサンプルをそれぞれ 示す図、
図 4は、 実施の形態 1におけるシンポルテ一ブル及びリンクテーブル作成の 動作を示すフロー図、
図 5は、 図 4に続くフロー図、
図 6は、 実施の形態 1におけるシンボルの形状を認識する場合のシンポルテ 一ブルを示す図、
図 7は、 実施の形態 1におけるシンポルの色を認識する場合のシンボルテー ブルを示す図、
図 8 A〜図 8 Eは、 実施の形態 1における原稿の各ページと対応するリンク テーブルを示す図、
図 9は、 実施の形態 1におけるシンボルによりリンクされた各ページの関係 を示す図、
図 1 0は、 実施の形態 1における H TM L言語作成処理の動作を示すフロ一 図、
図 1 1は、 図 1 0に続くフロー図、
図 1 2は、 実施の形態 1における原稿の 1ページに対して構成されるフアイ ルを示す図、
図 1 3 A〜図 1 3 Cは、 実施の形態 1における原稿の 2ページ目に対して構 成されるファイルを示す図、
図 1 4八〜図1 4 Cは、 実施の形態 1における原稿の 3ページ目に対して構 成されるファイルを示す図、
図 1 5八〜図1 5 Cは、 実施の形態 1における原稿の 4ページ目に対して構 成されるファイルを示す図、
図 1 6八〜図1 6 Cは、 実施の形態 1における原稿の 5ページ目に対して構 成されるファイルを示す図、
図 1 7は、 実施の形態 1におけるスタンプによりシンポルを表す方法を示す 図、
図 1 8は、 実施の形態 1における色によってシンポルを表す方法を示す図、 図 1 9は、 実施の形態 1におけるシンボルを置換する方法を示す図、 図 2 0は、 実施の形態 1における画面上でシンポルを付する方法を示す図、 図 2 1は、 実施の形態 1における特別な意味付けをしたシンボルを示す図、 図 2 2は、 実施の形態 1におけるシンポルの特定エリアを定めておく場合を 示す図、
図 2 3は、 本発明の実施の形態 2における構造化文書作成装置全体の動作を 示すフロー図、
図 2 4は、 実施の形態 2におけるシンボル認識工程の手順を示すフロー図 図 2 5は、 実施の形態 2におけるシンボル認識工程における原稿を示す模式 図、
図 2 6は、 図 2 5の一部を示す拡大図、
図 2 7 A〜図 2 7 Dは、 実施の形態 2における原稿の各ページについての管 理テーブルをそれぞれ示す図、
図 2 8〜図 3 0は、 実施の形態 2における H TM Lファイル生成処理のフロ 一図、
図 3 1及び図 3 2は、 実施の形態 2で生成される H TM Lファイルをそれぞ れ示す図、
図 3 3は、 実施の形態 2で作成した H TM Lファイルの階層構造を示す模式 図、
図 3 4は、 本発明の実施の形態 3におけるシンボルを印刷しない場合の構造 化文書作成装置の動作を示すフロー図、
図 3 5は、 本発明の実施の形態 4における同一ページでシンボルを付加した ィメージデ一夕と付加しないィメージデー夕の差分をとりシンボルを確実に検 出する動作を示すフロー図、
図 3 6は、 本発明の実施の形態 5における音声情報付文書作成装置の構成を 示すブロック図、
図 3 7は、 実施の形態 5のシンポルテーブル格納部におけるシンポルテープ ルを示す図、
図 3 8は、 実施の形態 5におけるリンクテーブル格納部におけるリンクテ一 ブルを示す図、
図 3 9は、実施の形態 5における音声シンボルを付した原稿を示す図、及び、 図 4 0は、 実施の形態 5における音声情報付文書の作成処理の流れを示すフ 口一図である。 発明を実施するための最良の形態
以下、 本発明の実施の形態について図面を参照して具体的に説明する。 図 2は本発明の実施の形態 1〜 4にかかる構造化文書作成装置のプロック図 である。 制御部 1は全体を制御する。 制御部 1は、 後述するシンボルの認識、 リンクテーブルの作成及び構造化文書の作成を行う。
通信制御部 2は電話回線等と接続し、 ファクシミリ通信、 インターネット等 のコンピュータネッ卜ワークとの通信を制御する。 操作パネル 3はタツチキー と表示パネルを有し、 入力及び入力したデータや出力するデ一夕などの表示を 行う。
スキャナ部 4は、 原稿を読み込みイメージデータを出力する。 このイメージ データは、 制御部 1に対して入力され、 シンボルの認識等の処理が行われる。 プリン夕部 5は受信したデ一夕やスキャナ部 4で読み込んだデ一夕などの印 刷を行う。
シンボルシンポル格納部 7は受信したファクシミリデ一夕やスキャナ部 4か ら入力されたデ一夕に表示されたシンポルを格納する。
リンクテーブル格納部 8は原稿のイメージデ一夕の各ページに表示されたシ ンポルとその位置及びそのシンボルに関連するページとを記載するテーブルを 格納する。
図 3 A〜図 3 Eは、 実施の形態 1〜 3で使用する原稿のサンプルを示す。 5 ページの原稿よりなり 1ページ目は目次として用いられ、 目次の 「イン夕ネッ ト J 「使い方」 「カタログ」 の各項目ごとにシンポル (マーク) ◎, 參, 女が 付されている。 2ぺ一ジは 「イン夕ネット」 の題目とシンボル◎及びインタネ ットの説明文が記載され、 さらにその中に 「イントラネット」 の表示とそのシ ンポル♦が記載されている。 3ページは 「使い方」 の題目とそのシンポル ·及 び使い方の説明文が記載されている。 4ページは 3ページとほぼ同様の形式と なっている。 5ページは 2ページに表れた 「イントラネット」 の題目とそのシ ンポル♦及び説明文が記載されている。 このように同一のシンポルが題目を表 すべ一ジとその題目の内容を表すべ一ジにそれぞれ付されている。
本発明の実施の形態 1について説明する。 図 4、 図 5はシンボルテーブル及 びリンクテーブル作成の動作フロ一図である。 図 3 A〜図 3 Eで示した 5ぺ一 ジの原稿をスキャナ部 4で読み取り (S 1 ) 、 これらのイメージデ一夕をィメ ージ格納部 6に G I Fファイル形式で格納する (S 2 ) 。 なお、 G I Fフアイ ル形式は、 通信に便利なサイズの小さいイメージファイル用フォーマツトであ る。
次に、 S 2 8において、 シンポルの要素のうち形状を認識する。 図 6にシン ポルテーブルを示す。 シンポルテーブルは、 シンボルシンポル格納部 7に格納 されている。
シンポルの要素は、 例えば、 形状、 色、 サイズ、 線種、 塗り潰しの種類、 濃 淡又は明度を広く含む。
図 7はシンポルの他の要素である色を認識する場合を示す。 シンポルを色で 認識する場合は図 7に示すようにシンポルの色とドット数及び大きさで表す。 シンポルの色及び形状の両方を認識し、 色及び形状の組み合わせに関連性を持 たせても良い。
S 4において、 認識したシンポルが、 シンポルテーブルに登録されているか 否か判断する。 登録されていない場合には、 S 5においてシンボルの登録を行 う。 登録されている場合には、 図 5に示す S 8に進む。
S 6において、シンポルの位置を認識する。シンボルの位置の表示方法は色々 あるが、 実施の形態 1ではシンポルの中心座標と、 その中心座標を中心として シンポルが入る大きさの円を描いた場合の半径で表す。 S 7において、 認識したシンボル位置をリンクテ一ブルに記入する。 リンク テーブルとは、 このシンポルとシンポルによってリンクされたページのデータ を示すテーブルをいう。 図 8 A〜図 8 Eに原稿の各ページとこのページに対応 したリンクテーブルを示す。 図 8 A〜図 8 Eは順に 1〜 5ページを示す。
図 8 Aの 8 1はファイル I MA G E 0 0 . G I Fに格納された原稿の 1ぺ一 ジ目のイメージデータを示す。 原稿のイメージデータは各ページごとに 1つの ファイルに格納される。 ファイル名は 1ページより 5ページまで順に I MA G E 0 0 . G I F〜 I MA G E 0 4 . G I Fとしてある。 各ページのイメージデ —夕 8 1に対応してリンクテ一ブル 8 2が作成されリンクテーブル格納部 8に 格納される。 リンクテーブル 8 2には、 ページ、 シンボル、 アドレス、 領域及 びリンク先の欄がある。 ページの欄には 1ページから順に数えて、 そのページ で始めて表れたシンポルがある場合、そのシンポルの表れたページを記入する。
1ページ目では 3つのシンポルが始めて表れているので、 ページの欄に 1ぺ一 ジを記入し、 シンポルの欄に 3つのシンボルを記入する。 アドレスの欄はシン ポルの中心座標を表し、 領域の欄はシンポルの中心座標を中心にシンポルを包 んで描いた円の半径を示す。 リンク先の欄は同じシンポルが表れたページのフ アイル名を記入する。
2ページ目のリンクテーブルでは 2ページ目に初めて表れたシンポル♦のデ 一夕が記入されている。 さらにシンポル〇のデータも記入されている。 シンポ ル〇は後述するように 1ページ目に戻るために 2ページ〜 5ページのイメージ デー夕に付加したシンボルでリンク先は 1ページ目のフアイル名が記入されて いる。 3〜 5ページ目はいずれも始めて表れるシンボルはないので戻りのシン ポルだけであり、 全て同じデータとなっている。 このようにして 1ページ目の リンクテ一ブルにはリンク先を除いたデ一夕が記入される。
図 5に示す S 8において、 リンクテーブル格納部 8に格納されたリンクテー ブル 82にシンポルが有るか否か判断する。 1ページ目については、 前にべ一 ジはなく、 従ってリンクテ一ブル 82にシンポルはないので、 S 13に進む。
2ページについては、 シンポル◎は、 図 8 Aに示す 1ページのリンクテープ ル 82に有るので、 S 9において、 リンク先欄に 2ページのイメージデータの ファイル名 I MAGE 01. G I Fを記入する。
3、 4ページについては、 シンポル秦、 ★は、 図 8 Aに示す 1ページのリン クテーブル 82に有るので、 S 9において、 リンク先欄に 3、 4ページのィメ ージデータのファイル名 I MAGE 02. G I F、 I MAGE 02. G I Fを それぞれ記入する。
5ページについては、 シンボル♦は、 図 8 Bに示す 1ページのリンクテープ ル 82に有るので、 S 9において、 リンク先欄に 5ページのイメージデ一夕の ファイル名 I MAGE 05. G I Fを記入する。
S 10において、 2ページ目以降で 1ページに戻るために、 戻りシンボル 「〇J をイメージデータの所定の位置に付加する。 次に、 S 1 1において、 自 己のリンクテーブル 82に戻りシンボル〇の情報を記入する。 すなわち、 戻り シンボル〇の中心座標をアドレス欄に、半径のデータを領域に記入する。また、 S 12において、 リンク先の撊には、 1ページのファイル名 I MAGE 00. G I Fを記入する。なお、イメージデータに戻りシンボル〇を付加する処理は、 後述する H I M L言語作成処理で行う。 以上によりシンポルテーブルとリンク テーブルの作成が終了する。
S 13において、 次ページが有るか否か判断し、 有る場合には S 1に戻る。 次ページがない場合には、 S14において、作成したデータを用いて HTML言 語で原稿の各ページとリンクする構造化文書を作成する。
図 9は、 シンポルによりリンクされた各ページの関係を示す図である。 1ぺ —ジ 91に表示されたシンポル ©92 a、 秦 92 b、 女92 cによって、 2〜 4ページ 93〜95が 1ページ 91にリンクされ、 2ページ 92に表示された シンボル令92 dによって 5ページ 96が 2ページ 93にリンクされている。 また 2〜 5ページ 93〜96には 1ページ 91に戻る、 戻りシンポル〇 97が 設けられている。 これにより、 ブラウザに表示された 1ページ 91のシンボル ◎ 92 a、 秦 92 b、 ★ 92 cを活性化することにより、 各シンポルに対応し た 2〜4ページ 93〜96のファイルにアクセスする。 ここで、 「アクセスす る」 とは、 リンク先にジャンプすることをいう。 「リンク先」 とは、 シンボル に関連付けしたプログラムファイル、 文書ファイル、 テキストファイル、 ィメ ージファイル、 動画ファイルなどのデータを広く含む。 また、 「活性化する」 とは、 ブラウザ上でシンポルを例えば指示しクリックすることにより、 リンク 先をダウンロードして、 その内容を表示したり、 プログラムを実行することを いう。
同じく、 2ページ 93のシンボル♦ 92 dをクリックすることにより 5ぺ一 ジ 96のファイルにアクセスする。 また 2〜 5ページ 93〜96の戻りシンポ ル〇97をクリックすることにより、 1ページ 91に戻る動作をする。
構造化文書を HTML言語で作成する方法を以下に説明する。
図 10、 図 1 1は、 図 5に示した HTML言語作成処理の動作を示すフロー 図である。 HTML言語にはクリツ力ブルマップというプログラムがあり、 こ れはイメージのいろいろな部分にリンク可能領域を設定して、 1つのイメージ から複数のファイルにアクセスできるものである。この表示は次のようになる。 く A HREF= "マップファイル名. MAP" 〉
< I MG SRC= "イメージファイル名. G I F I SMAP" ) ··· ( 1) ここでイメージファイル. G I Fは図 8 A〜図 8 Eで示したように原稿をス キヤナ部 4で読み込んだ際に各ページごとに作成されている。 しかしまだ戻り シンボル〇は付加されていない。 マップファイル. 1^八?は図8八〜図8£に P
14 示した各ぺージのリンクテーブルに記載されたシンポルの位置とそのシンボル の対応するページの HTMLファイル、 つまり (1) 式で示す構造化文書を表 すファイルで、 · HTM (又は. HTML) という拡張子がつく。 本実施の形 態ではマップファイル. MAPを F I LE00. MAP〜F I LE04. MA P、 HTMLファイルを HOME 00. HTM〜H〇ME〇4. HTMとする。 なお、 イメージファイル名. G I Fは I MAGE00. G I F〜 I MAGE0 4. G I Fとして既に作成されている。
図 9、 10は各ページごとに HOMEN. HTMファイルを作成するフロー 図である。 Nは各ぺ一ジごとに各ファイル付する番号 00〜04を代表して表 した値である。 まず N=0として 1ページ目の HOME00. HTMの作成に 入る (S 20) 。 ステップ S 21は HOME. HTMファイルの標準を示し、 各ページごとにタイトル名と F I LEN. MAP, I MAGEN. G I FのN の値を代入すれば各ページごとの HOME. HTMファイルが完成する。 ステ ップ S 21に示した標準の構造化文書はタイトル名と (1) 式を HTML言語 で表した単純なプログラムである。 つまり両端を く HTML〉 と く ZHTML〉 で挟み、 タイトルを表すため く HEAD) を記載し、 タイトル名を く T I TL E) と (ZT I TLE) で挟む。 次に (1) 式を 〈B〇DY〉 と く ZB〇DY〉 で挟んだものである。
原稿の 1ページ目を読み取ったイメージデータを OCR認識してタイトル名 にする。 この場合 「イン夕ネット FAX」 とする (S 22) 。 F I LEN. M APと IMAGEN. MAPの Nを 00とする (S 23) 。 これにより完成し たファイルをファイル名 HOME 00. HTMで保存する (S 24) 。 図 12 Aに示す HOME 00. HTMは、 このようにして作成したファイルである。 図 1 1において、 1ページの各シンボルについてステップ S 25で示す表示 は各シンポルの座標と半径及びこのシンボルとリンクするページの HOME. HTMファイルの存在場所を示す。 すなわち X, Yはシンポルの座標、 Zはシ ンポルを囲む円の半径、 HTTPはハイパーテキスト転送プロトコルの略でこ れに続くファイルは WWWサーバ用のファイルであることを示している。 S I TE-NAMEは後述する完成したフアイルを転送する WWWサーバのサイト 名を表し、 そのサイトに HOME. HTMファイルが格納されていることを示 す。 各シンボルの X, Υ, Zと N=00を代入し (S 26) 、 これを 1ぺ一ジ の 3つのシンボルについて全て行う (S 27)。 図 12 Bに示す F I LE 00. MAPはこのようにして作成されたファイルである。 図 12 Cに示す I MAG E 00. G I Fは 1ページをスキャナ部 4で読み取ったイメージデ一夕である。 図 12 A〜図 12 Cに示す 3つのファイルの完成により 1ページ目の構造化文 書は完成する。
2ページ〜 5ページの場合は 1ページに戻る、 戻りシンポル 「〇」 を各べ一 ジの I MAGEM. G I Fファイルに格納されたイメージデ一夕に付加する(S 28) 。 図 13 Cに示す I MAGE 01. G I Fは戻りシンポル 「〇」 を付加 した状態である。 戻りシンポル〇の中心座標を (a 5, b 5) で示し、 戻りシ ンボル〇を囲む半径 C 1の円を破線で示す。 なおイントラネットのシンポル♦ とその中心座標 (a 4, b 4) , 半径 C 1も示している。 この戻りシンポル〇 が表す戻るべきファイル名 HOME 00. HTMを示す。 ステップ S 29の表 示を付加する。 これにより 2ページの場合 F I LE 01. MAPが完成し、 そ の名称でファイルを保存する (S 280) 。 図 13Bは F I LE01. MAP を示す。 図 13八〜図13 Cの 3つのファイルの完成により 2ページ目の構造 化文書が完成する。 2ページ目が終了すれば N=02として 3ページ目に移り (S 281 ) 、 最後の 5ページまで同様の処理をする。 図 14 A〜図 14 Cは 3ページ目の、 図 15 A〜図 1 5 Cは 4ページ目の、 図 16A〜図 16Cは 5 ページ目の構造化文書を示す。 このようにして作成された各ページ 3つのファ ィル、 HOMEN. HTM, F I LEN. MAP, I MAGEN. G I Fを対 にして WWWサーバに転送する (S 283) 。
次にシンボルの付加方法について説明する。
図 1 7は、 原稿 101の各ページにシンボル 1 02を、 スタンプ 103で押 す場合を示す。 この場合、 スタンプインキとして一定時間が経過すると消える インキを用いれば原稿を汚さないので便利である。 なお、 スタンプ 103の替 わりに、 シンポルを表したシールを貼り付けるようにしても良い。 そしてスキ ャナ部で読み取り後にシールを剥がすようにする。
図 1 8はシンポルとして色を用いた場合を示す。 図ではスタンプの形状も示 しているが、 図 7で説明したように色でシンポルを識別する場合は、 色とドッ ト数と大きさのみを対象としている。 この場合も時間が経過すると消えるイン キを用いると良い。
図 1 9は、 スタンプ 103で原稿 10 1に押したシンボル 102を、 装置に 内蔵した別のシンボル 104に置換する場合を示す。 置換するシンポル 104 は、 動物、 植物、 星型、 ハートシンボル等の親しみやすく、 ユーザに良く知ら れたものを用いる方が良い。 ユーザが操作しゃすくかつ誤りが少なくなるから である。
図 20は、 原稿にシンボルを付けないでイメージデータとして読み込み、 表 示装置 1 1 1で表示して画面 1 1 2上でシンポル 1 1 3を付加する場合を示す。 このようにすると元の原稿にシンポル 1 1 3を付ける必要がないので原稿が汚 れない。
図 2 1は、 予め登録した意味を有する特別なシンボルを認識するようにする 場合を示す。 例えば秘密扱いのページ 122に、 いわゆる"まる秘"のような秘 密を表すシンポル 123をスタンプ 122で押印する。このシンボル 123に、 パスワード要求の処理を関連付けし、 構造化文書を作成する。 これにより、 ュ PC P 8 0
17 一ザが前のページ 1 2 1のシンポル 1 2 3をクリックした場合に、 まずパスヮ ードが要求される。 ユーザが入力したパスワードが、 登録したパスワードと合 致した場合のみ、 まる秘シンポル 1 2 3を含むページにアクセスできる。
図 2 2は、 予め原稿 1 3 1にシンポル 1 3 2を形成する領域 (シンポル設定 エリア) 1 3 3を定めておく場合を示す。 すなわち、 スタンプ 1 3 4でシンポ ル設定エリア 1 3 3内にシンポルを押印する。 これにより、 制御部 1により原 稿の特定の領域からシンポル 1 3 2を抽出し、 認識すれば足りる。 この結果、 原稿 1 3 1の全面からシンボル 1 3 2を抽出する場合に比べて、 シンポル認識 の精度及び速度が向上する。
(実施の形態 2 )
本発明の実施の形態 2では、 シンボルを色で認識する場合についてより詳細 に説明する。
図 2 3は、 実施の形態 2における構造化文書作成装置全体の動作を示すフロ 一図である。
S 2 3 0 1では、 まず H TM L言語によるホームページ作成を行う指示を、 図 2に示す操作パネル 3を用いて操作者が行う。 S 2 3 0 1では、 操作者はホ —ムページのタイトルを入力する。
S 2 3 0 3では、 原稿を図 2に示すスキャナ部 4により読み取る。
S 2 3 0 4では、 図 2に示す制御部 1は、 読み取つた原稿を J P E G形式で 保存する。 具体的には、 S 2 3 0 2で入力したタイトルをファイル名に利用す る。 すなわち、 現行のページ数をタイトルに付加し、 さらに拡張子 j p gを付 加して、 これをファイル名として保存する。
S 2 3 0 5では、次ページがあるか否かを判断する。次ページがあるならば、 S 2 3 0 6でページ数 nをインクリメントし、 S 1 0 3に戻り、 次ページを読 み取る。 次ページがなければ S 2 3 0 7に進む。 S 2307では、 制御部 1は、 J PEGファイルに含まれるシンボルの認識 を行う。 シンポルの認識は、 各ページごとにシンボルの中心座標、 半径、 色情 報について行う。 これらの認識結果は、ページ単位でテーブル化して保存する。
S 2308では、制御部 1は、 S 2307で作成したテーブルの整理を行う。 ここでは、 テーブルから色情報に基づいて、 対応する色情報がない孤立してい るシンポルをテ一ブルから削除する。 また、 同じシンボルが 3つ以上あるもの は、 エラー表示を行なう。
S 2309では、 制御部 1は、 HTMLファイル生成処理を行なう。 ここで は、 HTML言語によりホームページ作成のだめのファイルを自動生成する。
S 2310では、 生成した HTMLファイルを保存する。 具体的には、 S 2 303で入力したタイトルにページ数を付加し、 さらに拡張子 h tmを付加し て保存する。 すなわち、 ファイル名は、 タイトル +ページ数. h tmという形 式 Cあ 。
S 231 1では、 次ページがあるか否かを判別し、 次ページがあれば、 S 2 312で mをインクリメントし、 再度 HTML生成処理を行う。 次ページがな ければ、 S 2313でサーバに生成した HTMLのファイルを転送する。
次に、 図 23に示す S 2307のシンボル認識工程を図 24〜図 26を参照 して詳細に説明する。
まず、 S 2401で、 シンポル認識フローを開始する。
S 2402では、 基準点の色を認識する。 基準点は例えば、 図 25に示すよ うに、 原稿 201の左上端の数点 202をサンプリングし、 サンプリング結果 の平均をとることにより、基準点の色を決定する。 この基準点の色に基づいて、 この基準色と異なる色を検出するようにする。 なお、 ここでは、 扱う画像デ一 夕が J PEGデ一夕であり、 YCbC rの色空間に分解されて圧縮されている。 YCbC rの色空間を用いると、 その変換処理を省くことができるため、 効率 的に処理を行なうことができる。 さらに一般的に R G Bなどより人間に似てい る認識を行なうことができる。
S 2 4 0 3では、 所定幅をスキャンする。 図 4に示すように所定幅 Wだけ、 1ライン (L ) 分走査する。 S 2 4 0 4では、 走査したライン Lに異なった色 を検知するか、 否かを検知する。 異なった色がない場合、 S 2 4 0 5に進み、 1センチ下方に下げて、 再度所定幅 Wをスキャンする。
ここで、 色を識別するために、 暗部分の色、 すなわち黒から白の部分につい ては同一色と認識し、 それ以降の色の部分、 すなわち、 明部分で階調に応じて 認識するようにする。 これにより、人間と同じような認識をすることができる。
S 2 4 0 4において、 異なる色を検知した場合、 言い換えればシンボル 2 0 3上をスキャンした場合、 S 2 4 0 6に進む。 S 2 4 0 6では、 図 2 6に示す 色の境目 2 0 4、 2 0 5の座標を算出する。 S 2 4 0 7で 2点の座標の中間点 2 0 6の座標を算出する。
S 2 4 0 8では、 この座標に基づいて、 円形のシンボル 2 0 3の中心 Oの座 標を算出する。具体的には X座標を固定して、 Y座標で色が変わる座標を探す。 この座標に基づいて中心座標を算出する。
S 2 4 0 9では、 S 2 4 0 8で算出した中心座標に基づいて半径 Rを算出す る。
S 2 4 1 0では、 シンポル 2 0 3内の数箇所をサンプリングする。 ここでは、 Y C r C bからなる色情報を取り込み、 その配分の差をそれぞれの点で見る。 S 2 4 1 1では、 色情報の平均を算出する。 S 2 4 1 2では、 平均値に基づい て色情報を決定する。
S 2 4 1 3では、 シンボルの座標、 半径、 色情報を図 2 7 A〜図 2 7 Dに示 すように、 各ページごとにテーブル化して登録する。
ここまでが 1ページの処理である。 S 2 4 1 4では、 次ページの有無を判定 する。次ページがある場合には、 S 2403に戻る。次ページがない場合には、 操作を終了する。 この結果、 原稿の全ページにわたってシンポルの認識が行わ れ、 各ページの管理テーブルが作成される。
図 28〜図 30は、 図 23に示す S 2309の HTMLファイル生成処理の フロ一図である。
S 2801〜S 2803では、 図 31に示す HTMLファイルの 3行目まで を順次生成する。
S 2804では、 原稿読み取り時に入力されたタイトルとそのページ数を利 用してタイトル名を出力する。 S 2805では、 タイトル名の後に <ZT I Τ LE〉を出力する。
S 2806〜S 2808では、 図 31に示す HTMLファイルの 4行目〜 6 行目までを生成する。
S 2809では、 原稿読み取り時に保存した J PGファイルのファイル名を 出力する。 S 2810では、 6行目の残りを出力し、 3281 1では、 111ぺ一 ジのタイトルを出力する。
図 29に示す S 2812〜S 2813では、 6行目、 7行目を生成する。 S 2814では、 7行目のタイトルに対応するタイトルを出力する。 実際は mぺ —ジのタイトルを出力する。 S 2815では、 7行目の残りを出力する。
S 2816では、 ホームページ上でクリックされるべき範囲を設定するため のタグを 8行目に出力する。 S 2817では、 図 27 A〜図 27 Dに示すテ一 ブルに基づいて、 シンポルの位置情報である中心座標、 半径を上記タグの引数 X, Y, Rとして出力する。
S 2818では、 前記引数に続いて、 タグ 「HREF=」 を出力する。 S 2 819では、 リンク先を出力するために、 テーブルを用いてリンク先を検索す る。 ここでは、 同じ色情報を有するテーブルがどのページのテーブルにあるか を検索する。 S 2820では、 検索したページに対応するタイトルを h tmの 拡張子を付加した、 出力する。 S 2821では、 8行を閉めて、 リンク先を生 成する。
S 2822では、 対象としているページ、 すなわち mページのテーブルに、 他にシンボルがあるか否かを判断する。 他にシンボルがある場合、 S 2816 に戻り、 S 2816〜S 821までの処理を繰り返す。
図 30に示す S 2823〜S 2825では、 図 31に示す HTMLファイル の 9行目〜 1 1行目を出力生成する。 S 2826では、 次ページのリンク先を 示す情報を出力する。 S 2827では、 次ページを表す情報を出力する。 S 2 828、 S 2829で 12行目、 13行目を出力生成する。 以上のように、 H TMLファイルを生成する。
図 32は、 リンク先がないページの HTMLファイルの内容を示す。 図 31 に示す HTMLファイルとの相違点は 1 1行目である。 1 1行目は、 最初のぺ ―ジに戻るために設けられている。
上述のように生成された HTMLファイルにより、 図 33に示すように原稿 が階層構造化される。 すなわち、 第 1ページ 331に含まれる第 1シンポル 3 32及び第 2シンボル 333は、 互いに異なる色を有し、 第 2ページ 334及 び第 4ページ 335にそれぞれリンクしている。 従って、 第 1ページ 331の 第 1シンポル 332をクリックすると、 第 2ページ 334にアクセスし、 表示 する。 同様に、 第 2シンポル 33をクリックすると第 4ページ 335にァクセ スする。 また、 第 2ぺ一ジ 334に含まれる第 3シンポル 336は、 第 3ぺ一 ジ 337にリンクしている。 従って、 第 2ページ 334の第 3シンボル 336 をクリックすると、 第 3ページ 337にアクセスし、 表示する。
以上説明したように、 実施の形態 2における構造化文書作成方法によれば、 色が異なるシンボルを用いて紙原稿に記載された既存の文書を容易に HTML 文書に変換できる。
(実施の形態 3 )
次に実施の形態 3について説明する。 実施の形態 3は、 図 2に示すイメージ 格納部 6に格納されたシンボルが付されたイメージデータを印刷する場合、 シ ンポルを除去して印刷する場合である。 イメージ格納部 6に格納されたィメ一 ジデータは、 スキャナ部 4で読み取ったデータ、 又は通信制御部 2でファクシ ミリ通信により受信したデータなどである。
図 3 4は、 実施の形態 3における動作を示すフロー図を示す。 イメージ格納 部 6により印刷しょうとするイメージデータの 1ページ目を読出し(S 4 0 ) 、 次にシンポルの座標点を取り出し (S 4 1 ) 、 そのシンボルの存在部領域のデ 一夕削除を行う (S 4 2 ) 。 このように削除した後、 そのページの印刷を行う ( S 4 3 ) 。 次のページがあるか調べ (S 4 4 ) 、 あればステップ S 4 0〜S 4 3の動作を繰り返し、 ぺ一ジ終了まで行う。 これによりシンボルを付加して ない原稿の印刷が得られる。
(実施の形態 4 )
次に実施の形態 4について説明する。 実施の形態 4はシンポルが原文の文字 や絵の部分と重なり判別が困難な場合にも確実に判別する方法を示すものであ る。 実施の形態 3では、 イメージデータはシンボルを付加されていない状態で イメージ格納部 6に格納されており、 このイメージデ一夕に、 例えば図 2 0で 説明したように画面表示してシンポルを付加した後、 シンポルの認識や位置の 確認をし、 構造化文書作成手順に入る。
図 3 5は実施の形態 4の動作を示すフロー図である。 イメージデータを入力 する (S 5 0 ) 。 イメージデ一夕はスキャナ部 4からの読み込みゃファクシミ リ受信により得られる。 入力したデータはイメージ格納部 6に格納される (S 5 1 ) 。 この格納したイメージデ一夕を読み出して上述の方法でシンポルを付 加し (S 52) 、 再度そのイメージデ一夕を入力して (S 53) 、 ビットマツ プ化する (S 54) 。 一方イメージ格納部 6よりシンボルの付加されていない イメージデータを読出しビットマップ化する (S 55) 。 シンボルを付加した イメージデ一夕と付加しないイメージデ一夕のビッ卜マップ化デ一夕の差分を 抽出することによりシンボルのみを確実に抽出する (S 56) 。 抽出されたシ ンボルとその座標の認識を行い (S 57) 、 第 1実施の形態の図 4、 図 5で示 す構造化文書作成の手順に入る (S 58) 。 本実施の形態によりシンボルと原 文の文字や絵とが重なっても精度良くシンボルを認識することができる。
以上の実施の形態 1〜 4ではィメ一ジデ一夕をシンポルにより連結する場合 について説明したが、 シンボルとこれに対応する見出し原稿に含まれる文書を OCR認識し、 シンポルを介して関連するページをテーブル化して対応付け、 HTML言語で記載して構造化文書を作成することもできる。
(実施の形態 5)
次に、 本発明の実施の形態 5について説明する。 実施の形態 5は、 音声符号 付文書を作成する文書作成装置及びその方法に関する。
図 36は、 本発明の一実施の形態における音声情報付文書作成装置の構成を 示すブロック図である。
図 36に示すように、 音声情報付文書作成装置は、 各回路の制御を行う CP U (中央制御処理装置部) 部 401と、 キーボードやマウス等のユーザが各種 指示を入力する入力部 402と、 文書等を画像情報として読み込むスキャナ部 403と、 読み込んだ画像情報から文字を認識する OCR部 404と、 スキヤ ナ部 403で読み込んだ画像情報が格納される画像情報格納部 405とを有し、 予め音声シンボル付した原稿を取り込み、 これを基に音声情報付文書を作成で きる。
また、音声情報付文書作成装置は、音声情報を入力する音声入力部 406と、 音声入力部 4 0 6から入力された音声情報を格納する音声情報格納部 4 0 7と を有し、 画像に付す音声情報を取り入れ、 音声情報格納部 4 0 7に保存するこ とができる。
音声情報の入力方法は、 マイクによる入力方法や、 付属の電話装置から入力 する方法等がある。 なお、 音声情報は、 ファイル形式で保存される。 音声情報 のファイル名の拡張子を 「WAV」 とする等と、 予め決めておくと、 後の処理 や管理が容易となる。
また、 音声情報付文書作成装置は、 音声シンボルを格納するシンボルテープ ル格納部 4 0 8を有し、 音声情報と対応した音声シンポルをシンボルテーブル に保存できる。
図 3 7は、 シンポルテーブル格納部 4 0 8におけるシンポルテーブルを示す 図である。 図 3 7に示すように、 シンボルテーブルには、 各音声シンポルの形 状と、 リンクする音声情報のファイル名が対応して登録される。 なお、 音声シ ンポルは、 形状で表す場合の他、 色等で表すことも可能である。 新たな音声シ ンボルをシンポルテーブルに登録する場合は、 作成した音声シンボルを対応す る音声情報のファイル名とともに、シンボルテーブル格納部 4 0 8に登録する。 楽器の音声情報のファイル名を MU S I C:、 歌声の音声情報のファイル名を S O N G, ナレーションの音声情報のファイル名を V〇 I C Eとする等、 登録 される音声情報の種類ごとに異なるファイル名で登録し、 音声情報の種類ごと に形状の異なる音声シンポルを対応させれば、 画面上の音声シンポルにより、 対応する音声情報の種類を認識できる。
また、 音声情報付文書作成装置は、 原稿の各ページに表示された音声シンポ ルを認識する音声シンボル認識部 4 0 9と、 音声シンボルと原稿の各ページに 対する位置及び音声情報を連結したリンクテ一ブルを作成するリンクテーブル 作成部 4 1 0と、 作成されたリンクテーブルを記憶するリンクテーブル格納部 4 1 1とを有し、 入力した画像情報と音声情報をリンクさせて、 音声情報付文 書を作成できる。
図 3 8は、 リンクテーブル格納部 4 1 1におけるリンクテーブルを示す図で ある。 図 3 8に示すように、 リンクテ一プルには、 各音声シンポルの形状と、 リンクする画像情報のファイル名、 画像情報における音声シンポルの位置及び リンクする音声情報のファイル名が対応して登録される。 なお、 本実施の形態 では、 音声シンポルの位置を、 シンボルの中心座標及び中心座標を中心として シンポルが入る大きさの円の半径で表すが、 他のパラメ一夕により表すことも 可能である。
また、 音声情報付文書作成装置は、 画面上に画像を表示する表示手段 4 1 2 と、 回線と接続し、 ファクシミリ通信、 インターネット等のネットワーク通信 を制御する通信制御部 4 1 3と、 受信情報やスキャナ部 4 0 2で読み取った画 像情報等を印刷するプリン夕部 4 1 4と、 音声情報を再生する音声情報出力部 4 1 5とを有し、作成された音声情報付文書に対し、他の情報機器との送受信、 出力、 再生等の様々な処理をできる。 また、 画面上の各音声シンボルをマウス のクリック操作等により、 対応する音声情報を再生して、 視覚的なサービスに 加え聴覚的なサービスを提供でき、 操作性の向上を図ることができる。
なお、 作成された画像情報を送信する場合、 画像情報とともに、 付された音 声情報及びリンクテーブルを添付ファイルとして送信する。 これにより、 送信 先でも音声情報を再現できる。
次に、 実施の形態 5の音声情報付文書作成装置を用いて、 音声情報付文書を 作成する処理について説明する。
まず、 音声情報付文書作成の前提として、 原稿の必要な個所に、 スタンプを 用いて音声シンボルを付す。 図 3 9は、 上記実施の形態 5における音声シンポ ルを付した原稿の例示図である。 図 3 9に示すように、 スタンプ 4 4 1、 4 4 2を用いることにより、 原稿 4 4 3, 4 4 4に同一多数の音声シンボルを容易 に付すことができる。 その時に、 音声シンポルの形状を、 楽器、 歌声及びナレ ーシヨン等、 登録される音声情報の種類ごとに換える。 音声シンボルを原稿に 付す方法として、 スタンプによる方法の他、 シールを貼る方法等がある。
次に、上記実施の形態 5における音声情報付文書の作成処理の流れについて、 図 4 0を用いて説明する。 図 4 0は、 上記実施の形態 5における音声情報付文 書の作成処理の流れを示すフロー図である。
まず、 音声シンポルを付した原稿をスキャナ部 3から読み込む (S 5 0 1 ) 。 読み込まれた原稿は、 画像情報として、 順次、 画像情報格納部 4 0 5に格納 される (S 5 0 2 ) 。 なお、 読み込まれた画像情報は、 領域分離され、 原稿中 の文書は O C R部 4 0 4にて文字認識され、 画像はイメージで取り込まれる。 次に、 音声シンボル認識部 4 0 9にて、 格納された画像情報の中に、 シンポ ルテーブル格納部 4 0 8に登録された音声シンポルと同一形状の音声シンポル が存在するか否か認識される (S 5 0 3 ) 。 音声シンポルが認識されなかった 場合は、 読み取った画像情報は、 音声情報付ではない通常の画像情報と判断さ れ、 処理を終了する。
音声シンポルが認識された場合、 その音声シンボルは、 リンクテーブル作成 部 4 1 0にて、 原稿の各ページに対する位置及びリンクする音声情報ファイル 名とともにリンクテ一ブルに書き込まれる (S 5 0 4 ) 。
音声シンポルが複数認識された場合、 すべての音声シンボルに対し、 リンク テーブルが作成される (S 5 0 5 ) 。
以上の処理により、 音声情報付文書を作成できる。 また、 ユーザは、 予め原 稿に音声シンポルを貼り付け、 これを読み込ませれば、 他に操作を要しない。 作成された音声情報付文書を画面上に表示し、 音声シンポルをマウスにより クリック操作すれば、 対応する楽器、 歌声及びナレーション等の音声情報が再 生される。
なお、 作成された音声情報付文書は、 通信制御部 4 1 3、 プリンタ部 4 1 4 及び音声情報出力部 4 1 5にて、他の情報機器との送受信、出力、再生等の様々 な処理がされる。
以上説明したように、 音声シンボルが多数ある場合でも、 短時間で、 容易に 音声情報付文書を作成する音声情報付文書作成装置及びこれを用いた方法を提 供できる。
以上の実施の形態 1〜 5においては、 文書作成機能を有するファクシミリ装 置を例に挙げて説明した。 し力、しな力 ら、 本発明は、 これに限定されず、 外部 スキャナを接続したパーソナルコンピュータ、 インターネット端末などにも適 用可能である。 産業上の利用可能性
以上のように、 本発明にかかる構造化文書作成装置は、 ファクシミリ装置に 有用であり、 特に既存の文書を構造化文書とするのに適している。

Claims

請 求 の 範 囲
1 . シンポルを含む原稿を読み取ったイメージデータが入力される入力部と、 前記ィメ一ジデ一夕に含まれるシンボルを認識するシンポル認識部と、 前記シ ンボルに特定のデータを対応付けしたテーブルを作成するテーブル作成部と、 前記テーブルに基づいて前記シンボルを前記特定のデータに関係付けした構造 記述言語で記載した構造化文書を作成する文書作成部と、 を具備することを特 徵とする構造化文書作成装置。
2 . テーブル作成部は、 複数の原稿について、 ある原稿のイメージデータに含 まれるシンポルとこれと共通の要素を有するシンボルを含む他の原稿のィメー ジデータとを対応付けすることを特徴とする請求の範囲第 1項記載の装置。
3 . シンポル認識部はシンポルの色を認識することを特徴とする請求の範囲第 1項記載の装置。
4 . シンボル認識部は色空間 Y C b C rを使ってシンポルの色を認識すること を特徴とする請求の範囲第 3項記載の装置。
5 . シンボル認識部は、 原稿の色と異なる色を検出し、 検出した色を認識する ことを特徴とする請求の範囲第 3項又は第 4項記載の装置。
6 . シンボル認識部はシンポルの形状を認識することを特徴とする請求の範囲 第 1項記載の装置。
7 .イメージデ一夕に含まれるシンボルを削除して出力するシンポル削除部と、 前記シンボル削除部の出力を印刷する印刷部と、 を具備することを特徴とする 請求の範囲第 1項記載の装置。
8 . シンポル認識部で認識したシンポルを、 このシンポルと対応して予め登録 してある他のシンポルに置換するシンポル置換部を具備することを特徴とする 請求の範囲第 1項記載の装置。
9 . 文書作成部は、 特定の意味を持つシンポルに前記特定の意味に関する処理 を関連付けし、 前記シンポルが活性化された場合に前記処理を行った後に前記 シンポルに関係付けした特定のデータにアクセスする構造化文書を作成するこ とを特徴とする請求の範囲第 1項記載の装置。
1 0 . シンボル認識部は、 イメージファイルの所定の領域内についてシンボル の認識を行うことを特徴とする請求の範囲第 1項記載の装置。
1 1 . シンポルは原稿にスタンプで押印して形成されていることを特徴とする 請求の範囲第 1項記載の装置。
1 2 . スタンプに時間が経過すると消えるスタンプ液を用いていることを特徴 とする請求の範囲第 1 1項記載の装置。
1 3 . シンボルは原稿にシンボルを表示したシールを貼り付けて形成されてい ることを特徴とする請求の範囲第 1項記載の装置。 .
1 4. 原稿を読み取ったイメージデータが入力される入力部と、 前記イメージ データにシンボルを付加するシンポル付加部と、 前記シンポルに特定のデ一夕 を対応付けしたテーブルを作成するテーブル作成部と、 前記テーブルに基づい て前記シンポルを前記特定のデ一夕に関係付けした構造記述言語で記載した構 造化文書を作成する文書作成部と、 を具備することを特徴とする構造化文書作 成装置。
1 5 . 入力されたイメージデータを表示する表示部を具備することを特徴とす る請求の範囲第 1 4項記載の装置。
1 6 .シンボルを含む原稿を読み取ったイメージデ一夕が入力される入力部と、 前記ィメージデー夕に含まれるシンボルを認識するシンボル認識部と、 前記シ ンポルに特定のデータを対応付けしたテーブルを作成するテーブル作成部と、 前記テーブルに基づいて前記シンポルを前記特定のデータに関係付けした構造 記述言語で記載した構造化文書を作成する文書作成部と、 前記構造化文書を送 信する送信部と、 を具備することを特徴とする通信装置。
1 7 . 原稿を読み取ったイメージデータが入力される入力部と、 前記イメージ データにシンボルを付加するシンボル付加部と、 前記シンポルに特定のデ一夕 を対応付けしたテーブルを作成するテーブル作成部と、 前記テーブルに基づい て前記シンボルを前記特定のデータに関係付けした構造記述言語で記載した構 造化文書を作成する文書作成部と、 前記構造化文書を送信する送信部と、 を具 備することを特徴とする通信装置。
1 8 . シンボルを含む原稿を読み取ったイメージデータに含まれるシンポルを 認識する工程と、 前記シンポルに特定のデータを対応付けしたテーブルを作成 する工程と、 前記テーブルに基づいて前記シンボルを前記特定のデ一夕に関係 付けした構造記述言語で記載した構造化文書を作成する工程と、 を具備するこ とを特徴とする構造化文書作成方法。
1 9 . 複数の原稿を読み取り、 ある原稿に含まれるシンボルと、 これと共通の 要素を有するシンボルを含む他の原稿のイメージデータとを対応付けすること を特徴とする請求の範囲第 1 8項記載の方法。
2 0 . シンポル認識工程において、 シンボルの色を認識することを特徴とする 請求の範囲第 1 8項記載の方法。
2 1 . シンボル認識工程において、 シンポルの形状を認識することを特徴とす る請求の範囲第 1 8項記載の方法。
2 2 . シンボルが特定の意味を持ち、 前記シンポルを前記特定の意味に関する 処理に関連付けすることにより、 前記シンポルが活性化された場合に前記処理 を行った後に前記シンポルに関係付けした特定のデ一夕にアクセスする構造化 文書を作成することを特徴とする請求の範囲第 1 8項記載の方法。
2 3 . シンポルは原稿にスタンプで押印して形成されていることを特徵とする 請求の範囲第 1 8項記載の方法。
2 4 . スタンプに時間が経過すると消えるスタンプ液を用いられていることを 特徴とする請求の範囲第 2 2項記載の方法。
2 5 . シンボルは原稿にシンボルを表示したシールを貼り付けて形成されてい ることを特徴とする請求の範囲第 1 8項記載の方法。
2 6 . 原稿を読み取ったイメージデ一夕にシンボルを付加する工程と、 前記シ ンボルに特定のデータを対応付けしたテーブルを作成する工程と、 前記テープ ルに基づいて前記シンポルを前記特定のデータに関係付けした構造記述言語で 記載した構造化文書を作成する工程と、 を具備することを特徴とする構造化文 書作成方法。
2 7 . 音声シンボルを付した原稿を読み取ったイメージデータが入力される入 力部と、 前記イメージデ一夕から前記音声シンボルを認識する認識部と、 音声 情報を格納する音声格納部と、 認識した前記音声シンポルと格納した前記音声 情報を対応付けたテーブルを作成するテーブル作成部とを具備することを特徴 とする音声情報付文書作成装置。
2 8 . テーブル作成部は、 音声情報の種類ごとに、 異なる音声シンボルを対応 付けすることを特徴とする請求の範囲第 2 7項記載の音声情報付文書作成装置。
2 9 . 音声シンポルを付した原稿を読み取る工程と、 読み取った原稿から音声 シンボルを認識する工程と、 認識した音声シンポルと音声情報を関連付けし、 画面上の音声シンポルを選択すると音声が再生される音声情報付文書を作成す ることを特徴とする音声情報付文書作成方法。
3 0 . 音声シンボルは、 音声シンボル形状のスタンプを用いて原稿に付されて いるこ
Figure imgf000033_0001
PCT/JP1998/001413 1997-08-07 1998-03-27 Structured document preparation apparatus and structured document preparation method Ceased WO1999008207A1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US09/269,172 US6332039B1 (en) 1997-08-07 1998-03-27 Structured document preparation apparatus and structured document preparation method
DE69832585T DE69832585T2 (de) 1997-08-07 1998-03-27 Vorbereitungseinrichtung und vorbereitungsverfahren für strukturierte dokumente
EP98911074A EP0939376B1 (en) 1997-08-07 1998-03-27 Structured document preparation apparatus and structured document preparation method
CA002266630A CA2266630C (en) 1997-08-07 1998-03-27 Structured document preparation apparatus and structured document preparation method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP9227098A JPH1153168A (ja) 1997-08-07 1997-08-07 音声情報付文書作成装置及びこれを用いた方法
JP9/227098 1997-08-07

Publications (1)

Publication Number Publication Date
WO1999008207A1 true WO1999008207A1 (en) 1999-02-18

Family

ID=16855467

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1998/001413 Ceased WO1999008207A1 (en) 1997-08-07 1998-03-27 Structured document preparation apparatus and structured document preparation method

Country Status (8)

Country Link
US (1) US6332039B1 (ja)
EP (1) EP0939376B1 (ja)
JP (1) JPH1153168A (ja)
KR (1) KR100340354B1 (ja)
CN (1) CN1161702C (ja)
CA (1) CA2266630C (ja)
DE (1) DE69832585T2 (ja)
WO (1) WO1999008207A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097608A (ja) * 1996-09-20 1998-04-14 Matsushita Graphic Commun Syst Inc イメージ情報の構造化文書作成装置
US9309552B2 (en) 2004-09-16 2016-04-12 Biomerieux Method for detecting Streptococcus agalactiae using esterase activity

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IE980959A1 (en) * 1998-03-31 1999-10-20 Datapage Ireland Ltd Document Production
US6987506B1 (en) * 1999-05-25 2006-01-17 Silverbrook Research Pty Ltd Method and system for navigating a directory
US6735335B1 (en) * 2000-05-30 2004-05-11 Microsoft Corporation Method and apparatus for discriminating between documents in batch scanned document files
US7397949B2 (en) 2000-06-21 2008-07-08 Microsoft Corporation Serial storage of ink and its properties
US7006711B2 (en) 2000-06-21 2006-02-28 Microsoft Corporation Transform table for ink sizing and compression
US6816615B2 (en) * 2000-11-10 2004-11-09 Microsoft Corporation Implicit page breaks for digitally represented handwriting
US6707473B2 (en) 2001-08-01 2004-03-16 Microsoft Corporation Dynamic rendering of ink strokes with transparency
US7392287B2 (en) 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US7343053B2 (en) 2001-06-27 2008-03-11 Microsoft Corporation Transform table for ink sizing and compression
US7168038B2 (en) 2001-08-01 2007-01-23 Microsoft Corporation System and method for scaling and repositioning drawings
US20030115284A1 (en) * 2001-12-18 2003-06-19 Henry Steven G. Method and apparatus for accessing network data associated with a document
US20050102322A1 (en) * 2003-11-06 2005-05-12 International Business Machines Corporation Creation of knowledge and content for a learning content management system
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8086038B2 (en) 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US7672543B2 (en) * 2005-08-23 2010-03-02 Ricoh Co., Ltd. Triggering applications based on a captured text in a mixed media environment
US7551780B2 (en) 2005-08-23 2009-06-23 Ricoh Co., Ltd. System and method for using individualized mixed document
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7639387B2 (en) * 2005-08-23 2009-12-29 Ricoh Co., Ltd. Authoring tools using a mixed media environment
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8600989B2 (en) * 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US7669148B2 (en) 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US7991778B2 (en) 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8005831B2 (en) 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US8156427B2 (en) 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US9405751B2 (en) * 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US7885955B2 (en) * 2005-08-23 2011-02-08 Ricoh Co. Ltd. Shared document annotation
US7917554B2 (en) 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
US7587412B2 (en) * 2005-08-23 2009-09-08 Ricoh Company, Ltd. Mixed media reality brokerage network and methods of use
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US7769772B2 (en) 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
JP4655824B2 (ja) * 2005-08-24 2011-03-23 富士ゼロックス株式会社 画像認識装置、画像認識方法および画像認識プログラム
JP2007281673A (ja) * 2006-04-04 2007-10-25 Fuji Xerox Co Ltd 情報処理装置および情報処理プログラム
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8073263B2 (en) 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
JP2009005194A (ja) * 2007-06-22 2009-01-08 Canon Inc 画像処理装置、方法及びプログラム
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
KR101373681B1 (ko) * 2012-11-09 2014-04-17 주식회사 꿈네트웍스 질문간 관계 설정 시스템
US20160103913A1 (en) * 2014-10-10 2016-04-14 OnPage.org GmbH Method and system for calculating a degree of linkage for webpages
KR102798069B1 (ko) 2024-08-22 2025-04-22 주식회사 위메이크북 사용자 맞춤형 원고 생성 방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04321183A (ja) * 1991-04-20 1992-11-11 Ricoh Co Ltd ファイリング装置の文書登録方法
JPH07262207A (ja) * 1994-03-25 1995-10-13 Kengo Konishi イメージデータファイリング方法,イメージデータ登録方法,イメージデータ検索方法及びその装置
JPH07271818A (ja) * 1994-03-31 1995-10-20 Toshiba Corp ハイパーメディアシステム
JPH08204947A (ja) * 1995-01-24 1996-08-09 Canon Inc 画像ファイリング装置および画像ファイリング方法
JPH0944383A (ja) * 1995-06-30 1997-02-14 Ricoh Co Ltd ハードコピー文書と電子文書との間の変換方法及び変換装置
JPH0950443A (ja) * 1995-08-09 1997-02-18 Sony Corp 相互検索可能な複数の記録媒体
JPH0991301A (ja) * 1995-09-21 1997-04-04 Ricoh Co Ltd 文書情報管理システムおよび文書情報管理方法
JPH09146719A (ja) * 1995-11-24 1997-06-06 Toshiba Corp 情報印刷装置および情報印刷方法
JPH09163107A (ja) * 1995-12-02 1997-06-20 Ricoh Co Ltd 文書情報管理システムおよび文書情報管理方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162168A (ja) * 1984-09-03 1986-03-31 Nippon Telegr & Teleph Corp <Ntt> 音声入出力手段を有する文書処理装置
US5044802A (en) * 1988-08-31 1991-09-03 Canon Kabushiki Kaisha Printing apparatus having an eraser for erasing a printed character
US5181162A (en) * 1989-12-06 1993-01-19 Eastman Kodak Company Document management and production system
US6076733A (en) * 1993-11-24 2000-06-20 Metrologic Instruments, Inc. Web-based system and method for enabling a viewer to access and display HTML-encoded documents located on the world wide web (WWW) by reading URL-encoded bar code symbols printed on a web-based information resource guide
JP2800603B2 (ja) * 1992-12-01 1998-09-21 三菱電機株式会社 アイコンを用いた情報処理装置
JP2720924B2 (ja) * 1993-09-21 1998-03-04 富士ゼロックス株式会社 画像信号の符号化装置
US5572625A (en) 1993-10-22 1996-11-05 Cornell Research Foundation, Inc. Method for generating audio renderings of digitized works having highly technical content
US5675507A (en) 1995-04-28 1997-10-07 Bobo, Ii; Charles R. Message storage and delivery system
US5838906A (en) * 1994-10-17 1998-11-17 The Regents Of The University Of California Distributed hypermedia method for automatically invoking external application providing interaction and display of embedded objects within a hypermedia document
JP3160177B2 (ja) 1995-03-06 2001-04-23 松下電器産業株式会社 ファクシミリ型電子メール装置
US5870552A (en) * 1995-03-28 1999-02-09 America Online, Inc. Method and apparatus for publishing hypermedia documents over wide area networks
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
KR19990072122A (ko) * 1995-12-12 1999-09-27 바자니 크레이그 에스 실시간 영상 전송 방법 및 장치
US5692073A (en) * 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
US5724595A (en) * 1996-06-19 1998-03-03 Sun Microsystems, Inc. Simple method for creating hypertext links
US5911145A (en) * 1996-07-29 1999-06-08 Rae Technology, Inc. Hierarchical structure editor for web sites
US5757468A (en) * 1996-08-29 1998-05-26 Eastman Kodak Co Method and apparatus for producing photographic prints with sound indicia thereon

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04321183A (ja) * 1991-04-20 1992-11-11 Ricoh Co Ltd ファイリング装置の文書登録方法
JPH07262207A (ja) * 1994-03-25 1995-10-13 Kengo Konishi イメージデータファイリング方法,イメージデータ登録方法,イメージデータ検索方法及びその装置
JPH07271818A (ja) * 1994-03-31 1995-10-20 Toshiba Corp ハイパーメディアシステム
JPH08204947A (ja) * 1995-01-24 1996-08-09 Canon Inc 画像ファイリング装置および画像ファイリング方法
JPH0944383A (ja) * 1995-06-30 1997-02-14 Ricoh Co Ltd ハードコピー文書と電子文書との間の変換方法及び変換装置
JPH0950443A (ja) * 1995-08-09 1997-02-18 Sony Corp 相互検索可能な複数の記録媒体
JPH0991301A (ja) * 1995-09-21 1997-04-04 Ricoh Co Ltd 文書情報管理システムおよび文書情報管理方法
JPH09146719A (ja) * 1995-11-24 1997-06-06 Toshiba Corp 情報印刷装置および情報印刷方法
JPH09163107A (ja) * 1995-12-02 1997-06-20 Ricoh Co Ltd 文書情報管理システムおよび文書情報管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0939376A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097608A (ja) * 1996-09-20 1998-04-14 Matsushita Graphic Commun Syst Inc イメージ情報の構造化文書作成装置
US9309552B2 (en) 2004-09-16 2016-04-12 Biomerieux Method for detecting Streptococcus agalactiae using esterase activity

Also Published As

Publication number Publication date
DE69832585T2 (de) 2006-06-14
KR100340354B1 (ko) 2002-06-12
EP0939376A4 (en) 2001-07-04
EP0939376A1 (en) 1999-09-01
CA2266630A1 (en) 1999-02-18
DE69832585D1 (de) 2006-01-05
CN1236457A (zh) 1999-11-24
US6332039B1 (en) 2001-12-18
EP0939376B1 (en) 2005-11-30
CA2266630C (en) 2003-01-21
KR20000068715A (ko) 2000-11-25
JPH1153168A (ja) 1999-02-26
CN1161702C (zh) 2004-08-11

Similar Documents

Publication Publication Date Title
EP0939376B1 (en) Structured document preparation apparatus and structured document preparation method
US5680223A (en) Method and system for labeling a document for storage, manipulation, and retrieval
JP5147383B2 (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
US7930292B2 (en) Information processing apparatus and control method thereof
JP4338905B2 (ja) Pdf直接印刷機能付きプリンタの印刷指示用プログラムおよび印刷指示方法
JPH10228468A (ja) 文書情報管理システム
JP4940982B2 (ja) 画像形成装置およびWebページ印刷制御方法
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
JP2014174923A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
US5887088A (en) Inputting device and inputting method for information processing system
JP2009271831A (ja) 画像データ処理装置
JP4438656B2 (ja) 画像処理装置、画像処理システムおよびプログラム
KR100508364B1 (ko) 데이터 처리용 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독가능 매체
JP3265198B2 (ja) 構造化文書作成装置、構造化文書作成方法、通信装置、および通信方法
US7483160B2 (en) Communication system, communication terminal, system control program product and terminal control program product
JP4075430B2 (ja) プリント制御装置、プリント制御方法およびプログラム
JP2009140311A (ja) 文書処理装置および文書処理方法
JP2006229874A (ja) 情報処理装置、情報処理方法、情報処理プログラム、コンピュータに読み取り可能な記録媒体及び情報処理システム
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体
JP4347085B2 (ja) アドレス情報再現装置、アドレス情報再現方法、その方法をコンピュータに実行させるプログラム、およびアドレス情報再現可能な情報端末
JP2009064080A (ja) 画像処理装置と画像処理方法とプログラム
JP2025155119A (ja) 文章校正装置、文章校正方法及びプログラム
JP2007110505A (ja) 帳票生成装置及びその制御方法及びコンピュータプログラム及び記憶可読記憶媒体、並びに、帳票システム
JP2025147425A (ja) 情報処理システム、情報処理方法、及びプログラム
JP2002086835A (ja) 印刷装置、印刷システム及び印刷方法、並びに印刷プログラムを記録した記録媒体

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 98801115.8

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): CA CN KR SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): DE FI FR GB IT

WWE Wipo information: entry into national phase

Ref document number: 1998911074

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 09269172

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2266630

Country of ref document: CA

Ref document number: 2266630

Country of ref document: CA

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1019997002958

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1998911074

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1019997002958

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1019997002958

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1998911074

Country of ref document: EP