[go: up one dir, main page]

WO2021095672A1 - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
WO2021095672A1
WO2021095672A1 PCT/JP2020/041676 JP2020041676W WO2021095672A1 WO 2021095672 A1 WO2021095672 A1 WO 2021095672A1 JP 2020041676 W JP2020041676 W JP 2020041676W WO 2021095672 A1 WO2021095672 A1 WO 2021095672A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
captured image
information processing
information
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2020/041676
Other languages
English (en)
French (fr)
Inventor
哲平 栗田
信一郎 五味
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Priority to US17/755,725 priority Critical patent/US12361573B2/en
Priority to CN202080077511.7A priority patent/CN114667431B/zh
Priority to JP2021556079A priority patent/JP7609075B2/ja
Publication of WO2021095672A1 publication Critical patent/WO2021095672A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Measuring devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/107Measuring physical dimensions, e.g. size of the entire body or parts thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/30Measuring arrangements characterised by the use of optical techniques for measuring roughness or irregularity of surfaces
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/27Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Definitions

  • This disclosure relates to an information processing device and an information processing method.
  • Patent Document 1 a technique for analyzing the color and stains on the skin surface by utilizing the difference in the incident angle of the lighting unit is known (for example, Patent Document 1). Further, there is known a technique of reducing out-of-focus and distortion at the time of photographing the skin surface by arranging transparent glass at a predetermined distance from the tip dome of the microscope (for example, Patent Document 2).
  • the quality of the image taken by the microscope can be improved.
  • the conventional technology only improves the quality of a flat image, and it is difficult to obtain a 3D image that reproduces a minute shape (unevenness) of an object.
  • a non-contact 3D measuring device, a 3D scanner, or the like is used as a device for measuring a minute shape of an object, but there is a problem that the cost is relatively high when these are introduced.
  • the cost of the distance measuring device by the ToF (Time of Flight) method is relatively low, the accuracy may not be sufficient.
  • an information processing device and an information processing method capable of improving the accuracy of shape measurement are provided.
  • an information processing device includes a control unit.
  • the control unit acquires an image captured by the sensor of the target.
  • the captured image is an image obtained from reflected light of light radiated to the target from a plurality of light sources arranged at different positions.
  • the control unit extracts a flat region from the captured image based on the brightness value of the captured image.
  • the control unit calculates shape information regarding the shape of the surface of the target based on the information regarding the sensor and the flat region of the captured image.
  • FIG. 32 It is a figure for demonstrating the learning method of the learning apparatus which concerns on 9th Embodiment. It is a figure which shows the structural example of the control part of the information processing apparatus which concerns on 10th Embodiment of this disclosure. It is a block diagram which shows an example of the schematic structure of the body information acquisition system of a patient using a capsule type endoscope to which the technique (the present technique) which concerns on this disclosure can be applied. It is a figure which shows an example of the schematic structure of the endoscopic surgery system to which the technique (the present technique) which concerns on this disclosure can apply. It is a block diagram which shows an example of the functional structure of the camera head and CCU shown in FIG. 32.
  • the surface shape is directly formed from the RGB image.
  • a method of calculating (depth to the surface) is known. However, when the depth is calculated directly from the RGB image by CNN, there is uncertainty and it is difficult to improve the accuracy.
  • FIG. 1 is a diagram for explaining a calculation method for calculating the depth from a captured image. The method described with reference to FIG. 1 is performed, for example, by the information processing apparatus 200.
  • the information processing apparatus 200 first acquires an captured image captured by the microscope (step S1). At this time, the information processing apparatus 200 also acquires information about the microscope, for example.
  • the information processing device 200 calculates a normal (normal information) on the surface of the target based on the captured image (step S2).
  • the information processing device 200 obtains normal information as output data by inputting an captured image into a learning device (model) learned by using, for example, CNN or the like.
  • the information processing device 200 calculates the distance (depth information) to the surface of the target based on the normal information (step S3). If the distance between the microscope sensor, which is one of the information about the microscope, and the target is known, the information processing apparatus 200 can measure the distance to the surface of the target based on the normal information.
  • the distance between the microscope sensor and the target is a known value corresponding to the length of the head mount portion.
  • the information processing apparatus 200 calculates the depth to the target surface based on the normal information by minimizing W in the following equation (1).
  • Each parameter of the equation (1) is as follows.
  • p x direction of the calculated normal
  • q y direction of the calculated normal
  • Z x partial differential of the desired depth in the x direction (x direction of the normal)
  • Z y Partial differential of the desired depth in the y direction (y direction of the normal)
  • Z xx Twice partial differential of the desired depth in the x direction (partial differential of the normal in the x direction in the x direction)
  • Z yy Twice partial differential of the desired depth in the y direction (partial differential of the normal in the y direction in the y direction)
  • Z xy Partial differential of the desired depth in the x and y directions twice
  • x and y indicate the coordinates on the captured image
  • the x direction is, for example, the horizontal direction of the captured image
  • the y direction is the vertical direction of the captured image.
  • the following equation (3) is obtained by expanding the equation (2), and the depth to the target surface is calculated by performing the inverse Fourier transform of the equation (3).
  • the information processing apparatus 200 calculates the distance (depth) to the surface of the target by using the equation conversion of the equations (1) to (3) described above.
  • the depth is calculated on the assumption that the weights ( ⁇ , ⁇ ) of the cost term are small, that is, the sum of the absolute values of the normals is small and the sum of the absolute values of the normal derivatives is small.
  • the assumption that the sum of the absolute values of the normals is small (hereinafter, also referred to as Assumption 1) means that the target surface for which the depth is calculated is flat.
  • the assumption that the sum of the absolute values of the derivatives of the normals is small hereinafter, also referred to as assumption 2) means that the curvature of the target surface for which the depth is calculated is small. That is, in the above-mentioned calculation method, the depth to the target is calculated on the assumption that the rough surface shape of the target for which the depth is calculated is a flat surface.
  • FIG. 2 is a table for explaining the rough shape of the target surface.
  • the actual shape of the target surface is shown by a dotted line
  • the rough shape of the target surface is shown by a straight line.
  • the normal of the target surface is indicated by an arrow.
  • the horizontal direction of the target is the x direction
  • the vertical direction is the z direction (depth).
  • the rough shape of the target surface is the shape of the entire captured image of the target surface, and the rough shape of the target surface is flat means that there is little variation when looking at the shape of the entire captured image of the target surface. .. It should be noted that the change in the local unevenness of the target surface is not included in the rough shape because it is a calculation target. The more the assumption of the cost term of the optimization formula shown in the above equation (1) is satisfied, that is, the closer the surface shape of the entire captured image of the target surface is to a flat surface, the more accurate the information processing apparatus 200 is to the depth to the target surface. Can be calculated.
  • the object shown in (1) of the table in FIG. 2 has a shape in which a straight surface includes fine irregularities. Therefore, since the target shown in (1) satisfies both the above-mentioned assumptions 1 and 2 (indicated by " ⁇ " in the table), the information processing apparatus 200 calculates the depth of the target with high accuracy. Can be done.
  • the object shown in (2) of the table in FIG. 2 has a shape in which a slightly upwardly curved surface includes fine irregularities. Therefore, the object shown in (2) slightly satisfies the above-mentioned assumption 1 (indicated by “ ⁇ ” in the table) and satisfies the assumption 2. Therefore, the information processing apparatus 200 can calculate the depth of the object shown in (2) with higher accuracy than in (1).
  • the object shown in (3) of the table in FIG. 2 has a shape in which the left side is largely curved upward and the surface includes fine irregularities. Therefore, the object shown in (3) does not satisfy both assumptions 1 and 2 described above (indicated by "x" in the table). Therefore, the information processing apparatus 200 cannot accurately calculate the depth of the object shown in (3).
  • the surface of the object shown in (4) of the table in FIG. 2 has a gradual surface.
  • the object shown in (4) since the object shown in (4) has a shape in which the surface having a plurality of straight surfaces having different heights and directions includes fine irregularities, neither of the above assumptions 1 and 2 is satisfied. Therefore, the information processing apparatus 200 cannot accurately calculate the depth of the object shown in (4).
  • the above-mentioned calculation method has a problem that the depth calculation accuracy is lowered if the assumption that the rough shape of the surface of the depth calculation target is flat is not satisfied.
  • the discloser of the present case creates each embodiment of the present disclosure according to the information processing apparatus 200 capable of improving the accuracy of shape measurement by improving the accuracy of calculating the depth. I came to do it. Therefore, the details of each embodiment according to the present disclosure will be sequentially described below.
  • FIG. 3 is a diagram for explaining an outline of the first embodiment of the present disclosure.
  • the information processing apparatus 200A (not shown) according to the first embodiment extracts a region (flat region) satisfying the above assumptions 1 and 2 from the captured image to obtain shape information (depth information) relating to the surface shape of the target. Suppresses deterioration of accuracy and improves the accuracy of shape measurement.
  • the information processing device 200A first acquires the captured image M11 in which the sensor 150 of the microscope 100 captures the target S.
  • the captured image M11 is an image obtained from the reflected light of the light IA and IB emitted from the plurality of light sources 160A and 160B arranged at different positions on the target S.
  • the microscope 100 will be briefly described. As shown in the left figure of FIG. 3, the microscope 100 includes a sensor 150, a head mount portion 10 which is a tubular mechanism installed between the sensor 150 and an imaging target, and a plurality of light sources 160A and 160B. , Have.
  • the sensor 150 may be read as a lens, a camera, or the like.
  • the microscope 100 is an imaging device used by a user holding the microscope 100 in his / her hand and bringing the sensor 150 toward the target S by bringing the head mount portion 10 into contact with the target S.
  • the microscope 100 exposes the reflected light of the light IA and IB simultaneously irradiated to the target S from the light sources 160A and 160B, and images the target S. At this time, for example, when the rough shape of the surface of the target S is not flat, occlusion (a region not exposed to light) occurs on the surface of the target S.
  • the light IA emitted from the light source 160A hits the region SA and the region SAB on the surface of the target S, but does not hit the region SB.
  • the light IB emitted from the light source 160B hits the region SB and the region SAB on the surface of the target S, but does not hit the region SA.
  • the region SAB where the light IA and IB from the plurality of light sources 160A and 160B both hit is a flat region without occlusion.
  • the regions SA and SB where only one of the light sources 160A and 160B hits the light IA and IB are in the region SAB where both the light IA and IB hit.
  • the brightness value is lower than that of the image, resulting in a dark image.
  • the information processing apparatus 200A extracts the flat region SAB from the captured image M11 based on the brightness value of the captured image M11. For example, the information processing apparatus 200A extracts a region SAB in which the brightness value of the captured image M11 is equal to or greater than a threshold value as a flat region.
  • the information processing device 200A calculates shape information (depth information) regarding the surface shape of the target S based on the information regarding the sensor 150 and the flat region SAB of the captured image M11. For example, the information processing apparatus 200A acquires the normal information of the flat region SAB by inputting the flat region SAB of the captured image M11 into the learner learned by using the CNN. The information processing apparatus 200A calculates the depth information to the surface of the target S by performing formula conversion using the above-mentioned formulas (1) to (3) for the acquired normal information.
  • the information processing apparatus 200A can improve the accuracy of shape measurement by extracting the region satisfying the assumptions 1 and 2 of the equation (1) from the captured image M11.
  • FIG. 4 is a block diagram showing a configuration example of the information processing system 1 according to the first embodiment of the present disclosure. As shown in FIG. 4, the information processing system 1 includes a microscope 100 and an information processing device 200A.
  • the microscope 100 is an imaging device that the user holds in his / her hand and is used by pointing the sensor 150 at the imaging target S.
  • the information processing device 200A calculates shape information regarding the surface shape of the imaging target S based on the captured image M11 captured by the microscope 100. Details of the information processing device 200A will be described later with reference to FIG.
  • the microscope 100 and the information processing device 200A are connected using, for example, a cable.
  • the microscope 100 and the information processing device 200A may be directly connected by wireless communication such as Bluetooth (registered trademark) or NFC (Near Field Communication).
  • the microscope 100 and the information processing device 200A may be connected by wire or wirelessly, for example, via a network (not shown).
  • the microscope 100 and the information processing device 200A may exchange captured images via an externally mounted storage medium such as a hard disk, a magnetic disk, a magneto-optical disk, an optical disk, a USB memory, or a memory card. ..
  • the microscope 100 and the information processing device 200A may be integrally configured.
  • the information processing device 200A may be arranged inside the main body of the microscope 100, for example.
  • FIG. 5 is a diagram showing a configuration example of the microscope 100 according to the first embodiment of the present disclosure.
  • the microscope 100 includes a sensor 150 and a head mount portion 10 which is a tubular mechanism installed between the sensor 150 and an image pickup target. Further, the microscope 100 has point light sources 160A and 160B (not shown) arranged at different positions.
  • the head mount portion 10 is a mechanism that is mounted on the tip of the microscope 100.
  • the head mount portion 10 is also referred to as, for example, a tip head or a lens barrel.
  • the inside of the head mount portion 10 may be, for example, a mirror, and the light emitted from the point light sources 160A and 160B may be totally reflected by the side surface of the head mount portion 10.
  • the user brings the head mount portion 10 into contact with the target S to image the target S.
  • the distance between the sensor 150 and the target S is fixed, and it is possible to prevent the focus (focal length) from being deviated during imaging.
  • the microscope 100 has point light sources 160A and 160B inside the head mount portion 10. As a result, the microscope 100 exposes the reflected light of the light IA and IB irradiated to the target S from the point light sources 160A and 160B, and images the target S.
  • the point light source in the present specification ideally means a light source by a point, but in reality, a light source by a point cannot exist, so a light source having an extremely small size (within a few millimeters, etc.) Is included.
  • a point light source is used as an example of a light source, but the light source is not limited to the point light source. Also, the number of light sources is not limited to two. There may be a plurality of light sources, and there may be three or more light sources as long as they are arranged at different positions.
  • FIG. 6 is a block diagram showing a configuration example of the information processing apparatus 200A according to the first embodiment of the present disclosure.
  • the information processing device 200A has a control unit 220 and a storage unit 230.
  • the control unit 220 controls the operation of the information processing device 200A.
  • the control unit 220 includes an acquisition unit 221, an area acquisition unit 225, a normal calculation unit 222, a depth calculation unit 223, and a display control unit 224.
  • Each functional unit of the acquisition unit 221, the area acquisition unit 225, the normal calculation unit 222, the depth calculation unit 223, and the display control unit 224 is stored inside the control unit 220 by, for example, the control unit 220. This is realized by executing the program with RAM or the like as a work area.
  • the internal structure of the control unit 220 is not limited to the configuration shown in FIG. 6, and may be another configuration as long as it is configured to perform information processing described later. Further, the connection relationship of each processing unit included in the control unit 220 is not limited to the connection relationship shown in FIG. 6, and may be another connection relationship.
  • the acquisition unit 221 acquires the captured image M11 captured by the microscope 100 and information about the microscope 100.
  • the information about the microscope 100 includes information about the structure of the microscope 100, such as the focal length f and the length d of the head mount portion 10.
  • the acquisition unit 221 may control, for example, the point light sources 160A and 160B of the microscope 100 and the sensor 150.
  • the acquisition unit 221 controls the point light sources 160A and 160B so that the light IA and IB are simultaneously irradiated from the point light sources 160A and 160B.
  • the acquisition unit 221 controls the sensor 150 so that the sensor 150 images the target S while the light IA and IB are simultaneously irradiated from the point light sources 160A and 160B.
  • the information processing device 200A may control the microscope 100.
  • the acquisition unit 221 may acquire information on imaging conditions in addition to the captured image M11.
  • the information regarding the imaging conditions is, for example, information indicating that the captured image M11 is an image captured while the light sources IA and IB are simultaneously irradiated from the point light sources 160A and 160B.
  • the region acquisition unit 225 which will be described later, extracts the flat region SAB from the captured image M11 according to, for example, the imaging conditions.
  • the region acquisition unit 225 extracts the flat region SAB from the captured image M11.
  • the area acquisition unit 225 compares, for example, the luminance value L (x, y) of each pixel of the captured image M11 with the threshold value th.
  • the area acquisition unit 225 uses a region including pixels having a luminance value L (x, y) of the threshold th or more as a processing region, and pixels having a luminance value L (x, y) of less than the threshold th.
  • the included area is defined as the excluded area.
  • FIG. 7 is a diagram showing an example of the brightness value of the captured image M11. In FIG. 7, the brightness values L (x, ⁇ ) and the pixels (x) when the y-axis value is set to the predetermined value “ ⁇ ”. , ⁇ ) is shown.
  • L (x, y) (R (x, y) + 2G (x, y) + B (x, y)) / 4 It is calculated by.
  • R (x, y) is the R (Red) component of the pixel value in the pixel (x, y)
  • G (x, y) is the G (Green) component of the pixel value in the pixel (x, y)
  • B (x, y) is a B (Blue) component of the pixel value in the pixel (x, y).
  • the region acquisition unit 225 acquires a region determined to be a processing region as an extraction region (flat region SAB) extracted from the captured image M11 by comparing the brightness values L (x, y) and the threshold value th in all the pixels. To do.
  • the area acquisition unit 225 sets the pixel when the brightness value L (x, y) of the pixel is equal to or greater than the threshold value th or more to be white, and the pixel when the brightness value L (x, y) is less than the threshold value th to be black.
  • the mask image M12 shown in 8 is generated. Note that FIG. 8 is a diagram showing an example of the mask image M12 generated by the area acquisition unit 225.
  • the region acquisition unit 225 compares the generated mask image M12 with the captured image M11, and extracts pixels in which the mask image M12 is white at the same coordinates from the captured image M11 to obtain a flat region. Get SAB.
  • FIG. 9 is a diagram for explaining an example of acquiring a flat region SAB by the region acquisition unit 225.
  • the area acquisition unit 255 sets the brightness value of the pixel when the brightness value L (x, y) of the pixel is equal to or more than the threshold value th to be “1”, and sets the brightness value of the pixel when the brightness value L (x, y) is less than the threshold value th.
  • the mask image M12 may be generated.
  • the area acquisition unit 255 acquires the flat area SAB by multiplying the captured image M11 and the mask image M12.
  • the area acquisition unit 255 outputs the acquired flat area SAB to the normal calculation unit 222.
  • the mask image M12 generated by the area acquisition unit 255 may be output to the normal calculation unit 222, and the normal calculation unit 222 may acquire the flat region SAB from the captured image M11 using the mask image M12. ..
  • the normal calculation unit 222 calculates the normal information on the surface of the target S as a normal image based on the flat region SAB of the captured image M11.
  • the normal calculation unit 222 generates a normal image using, for example, CNN.
  • the normal calculation unit 222 generates a normal image using a learner learned in advance using CNN.
  • the number of input channels of the learner 300 (see FIG. 11) is 3 channels corresponding to RGB of the input image (here, the flat region SAB) or 1 channel of the gray scale of the input image. Further, the number of output channels of the learner 300 is set to 3 channels corresponding to RGB of the output image (here, the normal image). Further, the resolution of the output image shall be equal to the resolution of the input image.
  • FIG. 10 is a diagram for explaining an example of normal information.
  • the normal line N shown in FIG. 10 is a normal vector in a predetermined pixel of the captured image M11 in which the target S is captured.
  • the zenith angle of the normal N is ⁇ and the azimuth is ⁇
  • the relationship of the following equation (4) holds. It is assumed that the normal N is a unit vector.
  • the normal information is the normal N (x, y, z) in the above-mentioned Cartesian coordinate system, and is calculated for each pixel of the flat region SAB of the captured image M11, for example.
  • the normal image is an image obtained by replacing the normal information of each pixel with RGB. That is, the normal image is an image obtained by replacing x of the normal N with R (red), y with G (green), and z with B (blue).
  • the normal calculation unit 222 generates a normal image, which is an output image, by inputting the flat region SAB as an input image to the learner 300. It is assumed that the learner 300 is pre-generated by learning the weights in the CNN with the true value of learning as the normal.
  • FIG. 11 is a diagram for explaining the learning device 300 according to the embodiment of the present disclosure.
  • the control unit 220 of the information processing device 200A will be described as generating the learning device 300, but the learning device 300 is generated by, for example, another information processing device (not shown). May be done.
  • the information processing apparatus 200A calculates the similarity between the output image M15 when the input image M14 is input to the learner 300 and the normal image M16 which is the true value (Ground Truth) of learning. To do.
  • the information processing apparatus 200A calculates the least squares error (L2) between the output image M15 and the normal image M16, and performs the learning process with L2 as the loss.
  • the information processing device 200A updates the weight of the learner 300 by, for example, backpropagating the calculated loss. As a result, the information processing apparatus 200A generates a learning device 300 that outputs a normal image when the captured image is input.
  • the learning device 300 is generated using CNN, but the present invention is not limited to this.
  • the learning device 300 may be generated by using various methods such as RNN (Recurrent Neural Network) in addition to CNN.
  • RNN Recurrent Neural Network
  • the weight of the learner 300 is updated by backpropagating the calculated loss, but the present invention is not limited to this.
  • the weight of the learner 300 may be updated by using an arbitrary learning method such as a stochastic gradient descent method.
  • the loss is set to the least squares error, but the error is not limited to this. The loss may be the minimum average error.
  • the normal calculation unit 222 generates a normal image by using the generated learner 300.
  • the normal calculation unit 222 outputs the calculated normal image to the depth calculation unit 223.
  • the above P (length [ ⁇ m] per 1 pixel (1 pixel) of the captured image xy) is a parameter whose value is determined from the configuration of the sensor 150 of the imaging device (microscope 100).
  • FIG. 12 is a diagram for explaining the length of the captured image per pixel.
  • the depth calculation unit 223 calculates the depth of the target S for each pixel of the captured image M11, for example, based on the normal image and the information about the sensor 150.
  • the information about the sensor 150 is, for example, information about the structure of the sensor 150, and specifically, information about the focal length of the sensor 150 and the distance between the sensor 150 and the target S described above.
  • the imaging device is the microscope 100
  • the distance between the sensor 150 and the target S is the length d of the head mount portion 10.
  • the display control unit 224 displays various images on a display unit (not shown) such as a liquid crystal display.
  • FIG. 13 is a diagram showing an example of an image M17 displayed on the display unit by the display control unit 224.
  • the display control unit 224 causes the display unit to display, for example, an image M17 including an captured image M17a, a normal image M17b, a depth image M17c, an image M17d showing a depth graph, and a 3D image M17e of the target S. ..
  • the captured image M17a is, for example, an image obtained by cutting out a flat region SAB from the captured image M11 captured by the microscope 100.
  • the normal image M17b is an image in which the normal information of the captured image M17a is displayed in RGB.
  • the depth image M17c is an image showing the depth of each pixel of the captured image M17a. For example, the lighter the color, the larger the depth (the distance from the sensor 150 to the target S is larger).
  • the image M17d showing the depth graph is an image in which the depths in the straight lines shown in the normal image M17b, the depth image M17c, and the 3D image M17e of the target S are displayed as a graph.
  • the 3D image M17e of the target S is an image in which the target S is three-dimensionally displayed based on the depth image M17c.
  • the display control unit 224 may display a graph showing the depth or a three-dimensional image on the display unit in addition to the captured image, the generated normal image, and the depth image.
  • the storage unit 230 is realized by a ROM (Read Only Memory) that stores programs and arithmetic parameters used for processing of the control unit 220, and a RAM (Random Access Memory) that temporarily stores parameters that change as appropriate.
  • ROM Read Only Memory
  • RAM Random Access Memory
  • FIG. 14 is a flowchart for explaining an example of the depth calculation process according to the first embodiment of the present disclosure.
  • the depth calculation process shown in FIG. 14 is realized by executing a program by the control unit 220 of the information processing apparatus 200A.
  • the depth calculation process shown in FIG. 14 is executed after the microscope 100 has captured the captured image M11.
  • the depth calculation process shown in FIG. 14 may be executed in response to an instruction from the user.
  • control unit 220 acquires the captured image M11 from the microscope 100, for example (step S101).
  • control unit 220 may acquire the captured image M11 from another device, for example, via a network (not shown).
  • Examples of other devices include other information processing devices and cloud servers.
  • the control unit 220 acquires information about the sensor 150 (step S102).
  • the control unit 220 may acquire information about the sensor 150 from the microscope 100.
  • the control unit 220 may acquire the sensor information from the storage unit 230. Further, the control unit 220 may acquire the sensor information by input from the user, for example.
  • the control unit 220 acquires the flat region SAB from the acquired captured image M11 (step S103). Specifically, the control unit 220 extracts a region in which the brightness value of each pixel of the captured image M11 is equal to or higher than the threshold value th as a flat region SAB.
  • the control unit 220 calculates the acquired normal area information of the flat region SAB (step S104). Specifically, the control unit 220 inputs the flat region SAB as an input image to the learner 300 to generate a normal image including normal information as an output image.
  • the control unit 220 calculates the depth information based on the normal information and the information related to the sensor 150 (step S105). Specifically, the control unit 220 calculates the depth information by performing an equation conversion based on the above-mentioned equation (3) or the like on the normal information.
  • the information processing device 200A includes a control unit 220.
  • the control unit 220 acquires the captured image M11 obtained by the sensor 150 capturing the target S.
  • the captured image M11 is an image obtained from the reflected light of the light IA and IB emitted from the plurality of point light sources 160A and 160B arranged at different positions on the target S.
  • the control unit 220 extracts the flat region SAB from the captured image M11 based on the brightness value of the captured image M11.
  • the control unit 220 calculates shape information (depth information) regarding the surface shape of the target S based on the information regarding the sensor 150 and the flat region SAB of the captured image M11.
  • the information processing apparatus 200A acquires the flat region SAB from the captured image M11 obtained from the reflected light of the light IA and IB simultaneously irradiated to the target S from the plurality of point light sources 160A and 160B.
  • the information processing apparatus 200A acquires the flat region SAB, assumptions 1 and 2 can be satisfied in the formula conversion in the depth calculation unit 223, and a decrease in the accuracy of the depth calculation can be suppressed. As a result, the information processing apparatus 200A can improve the accuracy of shape measurement.
  • the information processing apparatus 200A calculates the depth based on the captured image M11 captured by the microscope 100 while the light IA and IB are simultaneously irradiated from the plurality of point light sources 160A and 160B. It was. In addition to the above example, the information processing apparatus 200A may calculate the depth based on the captured image captured by the microscope 100 while the light is emitted from one point light source. Therefore, in the second embodiment, the information processing apparatus 200A is an image captured from the reflected light of the light radiated to the target S from one of the plurality of point light sources 160A and 160B, and each of the point light sources 160A and 160B is captured.
  • FIG. 15 is a diagram for explaining the captured images M21 and M22 acquired by the acquisition unit 221 according to the second embodiment of the present disclosure.
  • the microscope 100 first irradiates light IA from a point light source 160A to image the target S. At this time, for example, if the rough shape of the surface of the target S does not appear flat, occlusion (a region not exposed to light) occurs on the surface of the target S.
  • the acquisition unit 221 acquires the captured image M21 whose region SA2 is darker than that of the region SA1, as shown in FIG. 15, for example.
  • the microscope 100 irradiates the light IB from the point light source 160B to image the target S.
  • an occlusion (a region not exposed to light) is generated on the surface of the target S, as in the case of irradiating the light IA from the point light source 160A.
  • the acquisition unit 221 acquires the captured image M22 in which the region SB2 is darker than the region SB1, as shown in FIG. 15, for example.
  • the acquisition unit 221 acquires the captured images M21 and M22 taken by the microscope 100 by sequentially lighting the two point light sources 160A and 160B.
  • the area acquisition unit 225 acquires the flat area SAB from the captured images M21 and M22 acquired by the acquisition unit 221.
  • the flat region SAB is exposed to the light IA and IB of both the point light sources 160A and 160B.
  • the occlusion region where at least one of the optical IA and IB does not hit is an uneven region.
  • the flat region SAB is exposed to the light IA and IB from the point light sources 160A and 160B, so that the brightness values of the pixels of the flat region SAB in both the captured images M21 and M22 are almost the same. It will be the same value.
  • the area acquisition unit 225 acquires the flat area SAB based on the brightness values of the captured images M21 and M22.
  • the region acquisition unit 225 extracts a region in which there is no change in the luminance value or a small change (within the threshold value th2) in the corresponding pixels of the captured images M21 and M22 as a flat region SAB.
  • FIG. 16 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the second embodiment of the present disclosure.
  • L1 (x, y) is the brightness value of the pixel (x, y) of the captured image M21
  • L2 (x, y) is the brightness value of the pixel (x, y) of the captured image M22.
  • FIG. 16 is a graph showing the relationship between the difference D and x when the y of the pixel is fixed to a predetermined value. As shown in FIG. 15, the horizontal direction of the captured images M21 and M22 is the x direction, and the vertical direction is the y direction.
  • the brightness value of the captured image M21 is high and the brightness value of the captured image M22 is low (see FIG. 15). Therefore, the value of the difference D in the region SB2 becomes a large value in the positive direction.
  • the brightness value of the captured image M21 is low and the brightness value of the captured image M22 is high (see FIG. 15). Therefore, the value of the difference D in the region SA2 becomes a large value in the negative direction.
  • the difference D is close to zero.
  • the area acquisition unit 225 sets the area SB2 in which the difference D is the threshold value th2 or more as an exclusion area in which the depth calculation is not performed. Further, the area acquisition unit 225 sets the area SA2 in which the difference D is equal to or less than the threshold value ⁇ th2 as an exclusion area in which the depth calculation is not performed. On the other hand, the area acquisition unit 225 sets an area in which the difference D is within the threshold value ⁇ th2 as a processing area for calculating the depth. The area acquisition unit 225 acquires an area determined to be a processing area as an extraction area (flat area SAB) to be extracted from the captured images M21 and M22.
  • an extraction area flat area SAB
  • the area acquisition unit 225 determines the absolute value abs (D) of the difference D described above as a threshold value, and the area including the pixels whose absolute value abs (D) of the difference D is the threshold value th2 or more is a black area.
  • the mask image M12 shown in FIG. 8 is generated.
  • the area acquisition unit 225 acquires a flat region SAB by, for example, comparing the mask image M12 and the captured image M21 and extracting pixels in which the mask image M12 is white at the same coordinates from the captured image M21.
  • the region acquisition unit 225 may acquire the flat region SAB by comparing the mask image M12 and the captured image M22.
  • the processing after the mask image M12 is generated is the same as that of the first embodiment.
  • either one of the point light sources 160A and 160B is irradiated to perform imaging.
  • the amount of light that hits the target S can be suppressed to be low as compared with the case of irradiating at the same time as in the first embodiment described above, the overall brightness of the captured images M21 and M22 is suppressed and the contrast is kept high. be able to. Therefore, it is possible to increase the difference between the brightness value of the region where the captured images M21 and M22 are exposed to the light and the brightness value of the occlusion region where the light is not applied. As a result, the region acquisition unit 225 can more easily acquire the flat region SAB from the captured images M21 and M22.
  • the image acquisition time can be suppressed to half the time as compared with the second embodiment.
  • the area acquisition unit 225 may, for example, align the captured images M21 and M22 before acquiring the flat region SAB. It will be necessary to perform the processing of. Therefore, when calculating the depth in real time, it is desirable to calculate the depth using the information processing apparatus 200A according to the first embodiment, which has a short image acquisition time and does not require processing such as alignment.
  • the information processing apparatus 200A captures the captured images M21 and M22 obtained from the reflected light of the light IA and IB irradiated to the target S from one of the plurality of point light sources 160A and 160B. , Obtained for each point light source 160A and 160B.
  • the information processing device 200A extracts a region in which the change in the luminance value (absolute value of the difference D) between the plurality of captured images M21 and M22 acquired for each of the point light sources 160A and 160B is less than the predetermined threshold value th2 as the flat region SAB. ..
  • the information processing apparatus 200A can increase the contrast of the captured images M21 and M22, improve the extraction accuracy of the flat region SAB, and improve the accuracy of shape measurement.
  • the microscope 100 includes two point light sources 160A and 160B has been described here as an example, the number of point light sources is not limited to two.
  • the microscope 100 may include three or more point light sources.
  • the microscope 100 images the target S by sequentially turning on three or more point light sources.
  • the information processing device 200A acquires a plurality of captured images captured by the microscope 100.
  • the information processing apparatus 200A flattens the region where the change in the luminance value is small between the acquired plurality of captured images, in other words, the region where the absolute value of the difference between the luminance values of the corresponding pixels of the plurality of captured images is less than the predetermined threshold value th2. Acquired as region SAB.
  • the microscope 100 may select, for example, the farthest point light source from a plurality of point light sources and turn it on.
  • the information processing apparatus 200A may acquire the flat region SAB after performing smoothing processing on the captured image. Therefore, in the third embodiment, an example in which the information processing apparatus 200A performs the smoothing process before acquiring the flat region SAB from the captured image will be described.
  • the information processing device 200A according to the third embodiment has the same configuration and operation as the information processing device 200A according to the first embodiment except for the operation of the area acquisition unit 225. The explanation of is omitted.
  • FIG. 17 is a diagram for explaining the smoothing process by the area acquisition unit 225 according to the third embodiment of the present disclosure.
  • the captured image M31 acquired by the acquisition unit 221 includes local unevenness and noise of the target S.
  • the local unevenness of the target S is a calculation target of the depth information in the depth calculation unit 223.
  • the area acquisition unit 225 When the area acquisition unit 225 tries to determine the threshold value of the captured image M31 shown in FIG. 17 on a pixel-by-pixel basis, it is affected by the above-mentioned unevenness and noise, and the acquisition accuracy of the flat area SAB is lowered.
  • the region acquisition unit 225 performs smoothing processing on the captured image M31 before acquiring the flat region SAB by performing the threshold value determination, and generates the smoothing image M32 as shown in the lower figure of FIG. Specifically, the region acquisition unit 225 generates a smoothing image M32 by applying a low-pass filter to the captured image M31. The area acquisition unit 225 performs a threshold value determination on the smoothing image M32 and generates the mask image M12 shown in FIG.
  • the area acquisition unit 225 acquires, for example, a flat region SAB in the captured image M31 by comparing the mask image M12 and the captured image M31 and extracting pixels in which the mask image M12 is white at the same coordinates from the captured image M31. To do.
  • the area acquisition unit 225 generates the mask image M12 based on the smoothing image M32, so that the mask image M12 can be generated while reducing the influence of fine irregularities and noise of the captured image M31. Further, when the region acquisition unit 225 acquires the flat region SAB of the captured image M31 using the mask image M12, the flat region SAB including local unevenness can be extracted, and the depth of the target S can be accurately determined. Can be calculated.
  • the information processing apparatus 200A can suppress a decrease in the acquisition accuracy of the flat region SAB, and can improve the accuracy of shape measurement.
  • the region acquisition unit 225 acquires the flat region SAB by determining the brightness value of the pixel as a threshold value is shown.
  • the information processing apparatus 200A may acquire a flat region by dividing the captured image into a plurality of blocks. Therefore, in the fourth embodiment, an example in which the information processing apparatus 200A divides the captured image into a plurality of blocks will be described.
  • the information processing device 200A according to the fourth embodiment has the same configuration and operation as the information processing device 200A according to the first embodiment except for the operation of the area acquisition unit 225. The explanation of is omitted.
  • FIG. 18 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the fourth embodiment of the present disclosure.
  • the area acquisition unit 225 divides the captured image M41 acquired by the acquisition unit 221 into, for example, a plurality of blocks, and acquires one divided block M42 as a flat area.
  • the area acquisition unit 225 determines the size of the block based on the information about the microscope 100, and divides the captured image M41 into blocks of the determined size.
  • FIG. 19 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the fourth embodiment of the present disclosure.
  • the area acquisition unit 225 divides, for example, the captured image M41 into blocks of 5 mm ⁇ 5 mm or less.
  • the actual length P [ ⁇ m] of 1 pixel of the captured image is the focal length f [mm] of the sensor 150, the length d [mm] of the housing (head mount portion 10), and the pixels of the sensor 150. It is calculated based on the pitch p [ ⁇ m].
  • the focal length f 16 [mm] of the sensor 150
  • the length d 100 [mm] of the head mount portion 10
  • the pixel pitch p 5 [ ⁇ m] of the sensor 150
  • the normal calculation unit 222 and the depth calculation unit 223 calculate the normal information and the depth information for all the divided blocks.
  • the depth calculation process is the same as the calculation process shown in FIG. 13, except that the number of blocks (flat areas) to be calculated is different.
  • the information processing apparatus 200A divides the captured image M41 into a plurality of blocks and calculates the depth. As a result, the information processing apparatus 200A can acquire a flat region satisfying the assumptions 1 and 2 in the above-mentioned equations (1) to (3), and can accurately calculate the depth. As described above, the information processing apparatus 200A according to the fourth embodiment can improve the accuracy of shape measurement.
  • the size of the block is set to 5 mm ⁇ 5 mm, but the size is not limited to this.
  • the imaging target of the microscope 100 may be other than human skin. Since the size of the block that can be regarded as flat differs depending on the imaging target, the block size may be different depending on the imaging target.
  • the storage unit 230 stores a table in which the types of the imaging targets and the appropriate block size are associated with each other.
  • the information processing apparatus 200A selects the block size according to the type of the image pickup target.
  • the user may specify the size of the block.
  • the size of the block is not limited to the above-mentioned example, and various sizes can be selected.
  • the area acquisition unit 225 acquires a flat area by dividing the captured image into blocks.
  • the information processing apparatus 200A may acquire a flat region according to the contrast value of the divided blocks. Therefore, in the fifth embodiment, an example in which the information processing apparatus 200A acquires a flat region according to the contrast value of the divided blocks will be described.
  • the information processing device 200A according to the fifth embodiment has the same configuration and operation as the information processing device 200A according to the fourth embodiment except for the operation of the area acquisition unit 225. The explanation of is omitted.
  • FIG. 20 is a diagram for explaining the depth of field of the sensor 150.
  • the sensor 150 (camera) has a depth of field (a range of depths at which the subject can be photographed without blurring) according to the aperture of the lens.
  • the optical system of the camera has a focal length f that enables the subject to be photographed clearly with the highest resolution by focusing.
  • the surface M52 shown in FIG. 20 is an in-focus surface, that is, a surface that is in focus and can clearly photograph a subject with the highest resolution.
  • the range from the surface M53 to the surface M51 is a depth range (depth of field) in which the subject can be photographed without blurring.
  • FIG. 21 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the fifth embodiment of the present disclosure.
  • the depth of field P1 of the microscope 100 since the depth of field P1 of the microscope 100 is shallow, the surface of the object S included in the depth of field P1, that is, the object S whose distance from the sensor 150 is substantially the same in a rough shape. SD1 can be photographed without blurring.
  • the target S not included in the depth of field P1, that is, the surfaces SD2 and SD3 whose distance from the sensor 150 is different from that of the surface SD1 is blurred and imaged.
  • the area acquisition unit 225 acquires the imaging area included in the depth of field P1 as a flat area.
  • the area acquisition unit 225 acquires a flat area by acquiring an imaged area that is in focus and is not blurred from the captured image. This point will be described with reference to FIG.
  • FIG. 22 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the fifth embodiment of the present disclosure.
  • the area acquisition unit 225 divides the captured image M54 acquired by the acquisition unit 221 into a plurality of blocks.
  • the size of the block to be divided here may be the same as or different from the size of the block of the fourth embodiment described above.
  • the contrast value contrast is high in the area that is in focus and imaged without blurring, and the contrast value contrast is low in the area that is out of focus and imaged blurry. Therefore, the area acquisition unit 225 acquires a flat area based on the calculated contrast value contrast. Specifically, the area acquisition unit 225 compares the calculated contrast value contrast with the threshold value th3 for each block. As shown in FIG. 22, the area acquisition unit 225 extracts a block having a contrast value contrast of the threshold value th3 or more as a flat area for calculating the depth.
  • the normal calculation unit 222 and the depth calculation unit 223 calculate the normal information and the depth information of the flat region acquired by the area acquisition unit 225.
  • the calculation method is the same as that of the first embodiment.
  • the normal calculation unit 222 and the depth calculation unit 223 may calculate the normal information and the depth information in block units.
  • the normal calculation unit 222 and the depth calculation unit 223 collect the normal area and the depth information by collecting a plurality of blocks extracted by the area acquisition unit 225 as a flat area, that is, a plurality of blocks having a contrast value contrast of the threshold value th3 or more. It may be calculated.
  • the information processing apparatus 200A divides the captured image M54 into a plurality of blocks.
  • the information processing apparatus 200A acquires a flat region according to the contrast value contrast calculated for each divided block.
  • the information processing apparatus 200A acquires the flat region according to the contrast value contrast of the captured image M54, thereby satisfying the assumptions 1 and 2 in the above equations (1) to (3).
  • the depth can be calculated.
  • the information processing apparatus 200A according to the fifth embodiment can improve the accuracy of shape measurement.
  • the area acquisition unit 225 divides one captured image into a plurality of blocks and acquires a flat area according to the contrast value of each of the divided blocks is shown.
  • the information processing apparatus 200A may divide a plurality of captured images having different depths of field into a plurality of blocks, and acquire a flat region according to the contrast value of each of the divided blocks. Therefore, in the sixth embodiment, an example in which the information processing apparatus 200A acquires a flat region according to the contrast value for each block of the plurality of captured images will be described.
  • the information processing device 200A according to the sixth embodiment has the same configuration and operation as the information processing device 200A according to the fifth embodiment except for the operations of the acquisition unit 221 and the area acquisition unit 225, the same reference numerals are given. However, some explanations will be omitted.
  • FIG. 23 is a diagram for explaining a plurality of captured images acquired by the acquisition unit 221 according to the sixth embodiment of the present disclosure.
  • the acquisition unit 221 acquires a plurality of captured images having different depths of field.
  • the microscope 100 acquires a plurality of captured images having different depths of field (focus planes).
  • the microscope 100 captures three captured images by capturing the target S three times while moving the sensor 150 up and down.
  • the microscope 100 for example, first captures an captured image having a depth of field closest to the sensor 150, and thirdly captures an captured image having a depth of field closest to the sensor 150.
  • the microscope 100 acquires, for example, a captured image in which the depth of field is located between the first and second times for the second time.
  • the depth of field and the number of images taken in FIG. 23 are examples, and are not limited thereto.
  • the microscope 100 may capture two or four or more captured images.
  • the range of the depth of field at the time of each imaging may be continuous or partially overlapped.
  • the acquisition unit 221 controls, for example, the microscope 100 to acquire captured images M61 to M63 having different depths of field.
  • FIG. 24 is a diagram for explaining acquisition of a flat region by the region acquisition unit 225 according to the sixth embodiment of the present disclosure.
  • the acquisition unit 221 controls the microscope 100 to capture captured images having different depths of field as shown in FIG. 23, thereby acquiring captured images M61 to M63 as shown in FIG. 24. To do.
  • the area acquisition unit 225 divides each of the captured images M61 to M63 into blocks.
  • the area acquisition unit 225 calculates the contrast value contrast for each divided block.
  • the area acquisition unit 225 compares the calculated contrast value contrast of the block with the threshold value th3, and extracts a block having the contrast value contrast of the threshold value th3 or more as a flat area.
  • the region acquisition unit 225 extracts the region M61A including the block whose contrast value contrast of the captured image M61 is the threshold value th3 or more from the captured image M61. Similarly, the region acquisition unit 225 extracts the region M62A including the block whose contrast value contrast of the captured image M62 is the threshold value th3 or more from the captured image M62. Further, the region M63A including the block whose contrast value contrast of the captured image M63 is equal to or higher than the threshold value th3 is extracted from the captured image M63.
  • the area acquisition unit 225 synthesizes the extracted areas M61A to M63A to generate an image M64 including a flat area.
  • the area acquisition unit 225 generates the image M64 by synthesizing the areas in which the captured images M61 to M63 are in focus and are not blurred.
  • the information processing apparatus 200A acquires a plurality of captured images having different depths of field.
  • the information processing device 200A divides the acquired plurality of captured images into a plurality of blocks.
  • the information processing apparatus 200A acquires a flat region according to the contrast value contrast for each divided block.
  • the information processing apparatus 200A calculates the depth in the flat region satisfying the assumptions 1 and 2 in the above equations (1) to (3) by acquiring the flat region according to the contrast value contrast. Can be done. Further, the information processing apparatus 200A can expand the flat region according to the contrast value contrast by acquiring the flat region from a plurality of captured images.
  • the area acquisition unit 225 synthesizes the areas M61A to M63A, but the present invention is not limited to this.
  • the normal calculation unit 222 and the depth calculation unit 223 calculate the normal information and the depth information for each of the areas M61A to M63A, for example, when the display control unit 224 displays the result on the display unit, the areas M61A to M63A.
  • the result of synthesizing the above may be displayed.
  • the high frequency component may be extracted from the normal information calculated by the normal calculation unit 222. Therefore, in the seventh embodiment, an example of extracting the high frequency component from the normal information and calculating the depth information will be described.
  • FIG. 25 is a diagram showing a configuration example of the information processing device 200B according to the seventh embodiment of the present disclosure.
  • the information processing device 200B shown in FIG. 25 has the same components as the information processing device 200A shown in FIG. 6, except that the control unit 220B does not include the area acquisition unit 225 and includes the normal frequency separation unit 226B. ..
  • the normal calculation unit 222 calculates the normal information in each pixel of the captured image acquired by the acquisition unit 221.
  • the normal frequency separation unit 226B separates high frequency components (hereinafter, also referred to as normal high frequencies) from the normal information.
  • the depth information to be calculated by the depth calculation unit 223 is information regarding the local uneven shape of the target S.
  • the depth information calculated by the depth calculation unit 223 is a high-frequency component of the surface shape of the target S and does not include a low-frequency component.
  • the normal frequency separation unit 226 removes a low frequency component which is a rough shape normal information from the normal information to generate a normal high frequency. Since the normal high frequency does not include a low frequency component (normal information of a rough shape), it satisfies the assumptions 1 and 2 of the above equations (1) to (3).
  • FIG. 26 is a diagram for explaining frequency separation by the normal frequency separation unit 226B according to the seventh embodiment of the present disclosure.
  • the normal information X as shown in the upper figure of FIG. 26 is input to the normal frequency separation unit 226B.
  • the actual surface of the target S is shown by a dotted line
  • the rough shape of the surface of the target S is shown by a solid line
  • the normal line of the surface of the target S is shown by an arrow.
  • the normal frequency separation unit 226B separates the high frequency component and the low frequency component of the normal information by using, for example, a convolution filter F (X), and extracts the normal high frequency Y shown in the middle figure of FIG.
  • the convolution filter F (X) is a filter designed in advance so as to extract high frequency components when normal information is input.
  • the depth calculation unit 223 converts the normal high frequency separated by the normal frequency separation unit 226B into an equation using the above equations (1) to (3) and the like, thereby satisfying Assumption 1 and Assumption 2.
  • Information Z (see the figure below in FIG. 26) can be calculated.
  • the information processing device 200B extracts high-frequency components from the normal information and calculates depth information based on the extracted high-frequency components.
  • the information processing apparatus 200B can perform formula conversion using the above-mentioned equations (1) to (3) while satisfying assumptions 1 and 2, so that it is possible to suppress a decrease in the calculation accuracy of depth information. it can. Therefore, the information processing apparatus 200B can improve the accuracy of shape measurement as compared with the case where frequency separation is not performed.
  • the depth information is calculated from the high frequency component of the normal information.
  • the depth information may be calculated by using the low frequency component in addition to the high frequency component of the normal information. Therefore, in the eighth embodiment, an example of calculating the depth information by separating the high frequency component and the low frequency component from the normal information will be described.
  • FIG. 27 is a diagram showing a configuration example of the information processing device 200C according to the eighth embodiment of the present disclosure.
  • the information processing device 200C shown in FIG. 27 has the same components as the information processing device 200B shown in FIG. 25, except for the normal frequency separation unit 226C and the depth calculation unit 223C of the control unit 220C.
  • the normal frequency separation unit 226C separates a high frequency component and a low frequency component (hereinafter, also referred to as normal low frequency) from the normal information and outputs each to the depth calculation unit 223C.
  • normal low frequency a low frequency component
  • the local uneven shape of the object S contributes to the high frequency component of the normal information.
  • the rough shape of the object S contributes to the low frequency component of the normal information. This point will be described with reference to FIG. 28.
  • FIG. 28 is a diagram for explaining frequency separation by the normal frequency separation unit 226C according to the eighth embodiment of the present disclosure.
  • the normal information X as shown in FIG. 28A is input to the normal frequency separation unit 226C.
  • the actual surface of the target S is shown by a dotted line
  • the rough shape of the surface of the target S is shown by a solid line
  • the normal line of the surface of the target S is shown by an arrow.
  • the surface shape represented by the normal high frequency YH is a shape in which the rough shape (normal low frequency YL) is removed and the flat surface has local irregularities. It becomes.
  • the convolution filter F (X) is a filter designed in advance so as to extract high frequency components when normal information is input.
  • the depth calculation unit 223C performs equation conversion for each of the normal high frequency YH and the normal low frequency YL, and as shown in FIG. 28 (c), the high frequency component ZH (hereinafter, also referred to as depth high frequency) of the depth information and the depth high frequency.
  • the low frequency component ZL (hereinafter, also referred to as depth low frequency) is calculated.
  • the depth calculation unit 223C can accurately calculate the depth high frequency ZH.
  • the normal low frequency YL is a low frequency component of the normal information X from which the normal high frequency YH has been removed, and is normal information representing a state in which a local uneven shape is removed from the surface shape of the target S. is there. Therefore, the depth calculation unit 223C can accurately calculate the depth low frequency ZL even if the formula conversion of the normal low frequency YL is performed with the assumptions 1 and 2 removed.
  • the depth calculation unit 223C calculates the depth information Z shown in FIG. 28 (d) by synthesizing the calculated depth high frequency ZH and depth low frequency ZL.
  • the information processing device 200C frequency-separates the normal information calculated from the captured image.
  • the information processing device 200C calculates the depth information for each separated frequency, synthesizes the calculated depth information, and calculates the depth information of the target S.
  • the information processing apparatus 200C can calculate the depth of the rough shape in addition to the depth of the local uneven shape. Further, the information processing apparatus 200C can calculate the depth information of the target S more accurately by synthesizing these depths.
  • the depth calculation unit 223C can calculate the depth low frequency ZL with the influence of Assumption 1 and Assumption 2 small, and the values of ⁇ and ⁇ are set so that Assumption 1 and Assumption 2 do not affect the calculation of the depth low frequency ZL. May be a small value.
  • FIG. 29 is a diagram for explaining a learning method of the learning device 300 according to the ninth embodiment. Since the information processing device 200A according to the ninth embodiment has the same configuration and operation as the information processing device 200A according to the first embodiment except for the operation of the normal calculation unit 222, the same reference numerals are given. The description of the part is omitted.
  • the normal calculation unit 222 updates the weight of the learner 300 with the captured image M14 as input data and the normal image M16 as correct answer data (true value) for learning.
  • the captured image M14 is captured by a device that captures an RGB image, such as a microscope 100.
  • the normal image M16 is generated based on the shape information measured by a device that directly measures the surface shape of the target S, such as a non-contact 3D measuring instrument.
  • the output image and the correct answer image obtained by inputting the input image to the learning device 300 may be deviated by several pixels. In this way, if the learning device 300 is trained in a state where the output image and the correct answer image are deviated from each other, the learning device 300 that outputs a blurred output image with respect to the input image is generated.
  • the normal calculation unit 222 shifts the normal image M16 in the x-direction and the y-direction at the time of learning to determine the filter coefficient (weight) of the learner (CNN) 300, and after the shift, The degree of similarity between the normal image M16 and the output image M15 is calculated.
  • the normal calculation unit 222 shifts the normal image M16 in the range of 0 to ⁇ x in the x direction and shifts the normal image M16 in the range of 0 to ⁇ y in the y direction.
  • the normal calculation unit 222 calculates, for example, the least squares error between the shifted normal image M16 and the output image M15 for each shift amount.
  • the normal calculation unit 222 updates the weight of the learner 300 with the minimum value of the calculated least squares errors as the final loss.
  • the minimum average error between the shifted normal image M16 and the output image M15 may be calculated for each shift amount, and the minimum value of the calculated minimum average errors may be used as the final loss. ..
  • the learner 300 is generated by updating the weight according to the degree of similarity between the shift image (normal image after shift) and the output image M15 obtained by shifting the true value image (normal image). More specifically, the learner 300 includes a plurality of shift images (also referred to as a shifted normal image and a correct candidate image) obtained by shifting a true value image (normal image) by a different shift amount (number of pixels). , The weight is updated and generated according to the similarity with the output image M15.
  • the weight of the learning device 300 can be updated with the positions of both images without aligning the output image M15 of the learning device 300 and the normal image M16.
  • the learning accuracy of the learning device 300 can be further improved.
  • the normal information can be calculated more accurately, and the accuracy of the shape measurement of the information processing apparatus 200A is further improved. be able to.
  • FIG. 30 is a diagram showing a configuration example of a control unit 220D of the information processing device 200A according to the tenth embodiment of the present disclosure.
  • control unit 220D of the information processing apparatus 200A includes the area acquisition unit 225D instead of the area acquisition unit 225, and the depth synthesis unit 227. It is the same as the part 220.
  • the area acquisition unit 225D divides the captured image M71 acquired by the acquisition unit 221 into three divided areas M71A to M71C.
  • the number of regions divided by the region acquisition unit 225D is not limited to three, and may be two or four or more.
  • the area acquisition unit 225D acquires the divided flat areas M72A to M72C for each of the divided areas M71A to M71C.
  • the normal calculation unit 222 calculates the normal region images M73A to M73C based on the divided flat regions M72A to M72C, respectively, and the depth calculation unit 223 calculates the depth region images M74A to M74C based on the normal region images M73A to M73C. Is calculated.
  • the depth composition unit 227 synthesizes the depth region images M74A to M74C to generate the depth image M75, and outputs the depth image M75 to the display control unit 224.
  • the depth synthesizing unit 227 may synthesize the divided flat regions M72A to M72C and the normal region images M73A to M73C. Further, the processing in each part may be sequentially performed for each area, or may be performed in parallel for each area.
  • the information processing apparatus 200A divides the captured image into a plurality of divided regions M71A to M71C, and acquires the divided flat regions M72A to M72C for each of the divided regions M71A to M71C. Further, the information processing apparatus 200A calculates the normal information and the depth information for each of the divided flat regions M72A to M72C.
  • the size of the captured image (area) to be processed in each part can be reduced, the processing load can be reduced, and the processing speed can be improved.
  • the head mount portion 10 is a tubular portion mounted on the tip of the microscope 100.
  • the head mount portion 10 does not necessarily have to have a tubular shape as long as it is a structure for keeping the distance between the target S and the sensor 150 of the microscope 100 constant.
  • FIG. 31 is a block diagram showing an example of a schematic configuration of a patient's internal information acquisition system using a capsule endoscope to which the technique according to the present disclosure (the present technique) can be applied.
  • the internal information acquisition system 10001 is composed of a capsule endoscope 10100 and an external control device 10200.
  • the capsule endoscope 10100 is swallowed by the patient at the time of examination.
  • the capsule endoscope 10100 has an imaging function and a wireless communication function, and moves inside an organ such as the stomach or intestine by peristaltic movement or the like until it is naturally excreted from the patient, and inside the organ.
  • Images (hereinafter, also referred to as internal organ images) are sequentially imaged at predetermined intervals, and information about the internal organ images is sequentially wirelessly transmitted to an external control device 10200 outside the body.
  • the external control device 10200 comprehensively controls the operation of the internal information acquisition system 10001. Further, the external control device 10200 receives information about the internal image transmitted from the capsule endoscope 10100, and based on the information about the received internal image, displays the internal image on a display device (not shown). Generate image data for display.
  • the internal information acquisition system 10001 in this way, it is possible to obtain an internal image of the inside of the patient at any time from the time when the capsule endoscope 10100 is swallowed until it is discharged.
  • the capsule endoscope 10100 has a capsule-shaped housing 10101, and the light source unit 10111, the imaging unit 10112, the image processing unit 10113, the wireless communication unit 10114, the power feeding unit 10115, and the power supply unit are contained in the housing 10101.
  • the 10116 and the control unit 10117 are housed.
  • the light source unit 10111 is composed of, for example, a light source such as an LED (Light Emitting Diode), and irradiates the imaging field of view of the imaging unit 10112 with light.
  • a light source such as an LED (Light Emitting Diode)
  • LED Light Emitting Diode
  • the image pickup unit 10112 is composed of an image pickup element and an optical system including a plurality of lenses provided in front of the image pickup element.
  • the reflected light (hereinafter referred to as observation light) of the light applied to the body tissue to be observed is collected by the optical system and incident on the image sensor.
  • the observation light incident on the image sensor is photoelectrically converted, and an image signal corresponding to the observation light is generated.
  • the image signal generated by the image capturing unit 10112 is provided to the image processing unit 10113.
  • the image processing unit 10113 is composed of a processor such as a CPU or GPU (Graphics Processing Unit), and performs various signal processing on the image signal generated by the imaging unit 10112.
  • the image processing unit 10113 provides the signal-processed image signal to the wireless communication unit 10114 as RAW data.
  • the wireless communication unit 10114 performs predetermined processing such as modulation processing on the image signal that has been signal-processed by the image processing unit 10113, and transmits the image signal to the external control device 10200 via the antenna 10114A. Further, the wireless communication unit 10114 receives a control signal related to drive control of the capsule endoscope 10100 from the external control device 10200 via the antenna 10114A. The wireless communication unit 10114 provides the control unit 10117 with a control signal received from the external control device 10200.
  • the power feeding unit 10115 is composed of an antenna coil for receiving power, a power regeneration circuit that regenerates power from the current generated in the antenna coil, a booster circuit, and the like. In the power feeding unit 10115, electric power is generated using the principle of so-called non-contact charging.
  • the power supply unit 10116 is composed of a secondary battery and stores the electric power generated by the power supply unit 10115.
  • FIG. 31 in order to avoid complicating the drawings, illustrations such as arrows indicating the power supply destinations from the power supply unit 10116 are omitted, but the power stored in the power supply unit 10116 is the light source unit 10111. , Image processing unit 10112, image processing unit 10113, wireless communication unit 10114, and control unit 10117, and can be used to drive these.
  • the control unit 10117 is composed of a processor such as a CPU, and is a control signal transmitted from the external control device 10200 to drive the light source unit 10111, the image pickup unit 10112, the image processing unit 10113, the wireless communication unit 10114, and the power supply unit 10115. Control as appropriate according to.
  • the external control device 10200 is composed of a processor such as a CPU and a GPU, or a microcomputer or a control board on which a processor and a storage element such as a memory are mixedly mounted.
  • the external control device 10200 controls the operation of the capsule endoscope 10100 by transmitting a control signal to the control unit 10117 of the capsule endoscope 10100 via the antenna 10200A.
  • a control signal from the external control device 10200 can change the light irradiation conditions for the observation target in the light source unit 10111.
  • the imaging conditions for example, the frame rate in the imaging unit 10112, the exposure value, etc.
  • the content of processing in the image processing unit 10113 and the conditions for the wireless communication unit 10114 to transmit the image signal may be changed by the control signal from the external control device 10200. ..
  • the external control device 10200 performs various image processing on the image signal transmitted from the capsule endoscope 10100, and generates image data for displaying the captured internal image on the display device.
  • the image processing includes, for example, development processing (demosaic processing), high image quality processing (band enhancement processing, super-resolution processing, noise reduction processing, camera shake correction processing, etc.), enlargement processing (electronic zoom processing, etc.), etc., respectively.
  • various signal processing can be performed.
  • the external control device 10200 controls the drive of the display device to display the captured internal image based on the generated image data.
  • the external control device 10200 may have the generated image data recorded in a recording device (not shown) or printed out in a printing device (not shown).
  • the above is an example of an in-vivo information acquisition system to which the technology according to the present disclosure can be applied.
  • the technique according to the present disclosure can be applied to, for example, the external control device 10200 among the configurations described above.
  • the surface shape inside the body can be measured from the body image captured by the capsule endoscope 10100.
  • FIG. 32 is a diagram showing an example of a schematic configuration of an endoscopic surgery system to which the technique according to the present disclosure (the present technique) can be applied.
  • FIG. 32 illustrates how the surgeon (doctor) 11131 is performing surgery on patient 11132 on patient bed 11133 using the endoscopic surgery system 11000.
  • the endoscopic surgery system 11000 includes an endoscope 11100, other surgical tools 11110 such as an abdominal tube 11111 and an energy treatment tool 11112, and a support arm device 11120 that supports the endoscope 11100.
  • a cart 11200 equipped with various devices for endoscopic surgery.
  • the endoscope 11100 is composed of a lens barrel 11101 in which a region having a predetermined length from the tip is inserted into the body cavity of the patient 11132, and a camera head 11102 connected to the base end of the lens barrel 11101.
  • the endoscope 11100 configured as a so-called rigid mirror having a rigid barrel 11101 is illustrated, but the endoscope 11100 may be configured as a so-called flexible mirror having a flexible barrel. Good.
  • An opening in which an objective lens is fitted is provided at the tip of the lens barrel 11101.
  • a light source device 11203 is connected to the endoscope 11100, and the light generated by the light source device 11203 is guided to the tip of the lens barrel by a light guide extending inside the lens barrel 11101 to be an objective. It is irradiated toward the observation target in the body cavity of the patient 11132 through the lens.
  • the endoscope 11100 may be a direct endoscope, a perspective mirror, or a side endoscope.
  • An optical system and an image sensor are provided inside the camera head 11102, and the reflected light (observation light) from the observation target is focused on the image sensor by the optical system.
  • the observation light is photoelectrically converted by the image sensor, and an electric signal corresponding to the observation light, that is, an image signal corresponding to the observation image is generated.
  • the image signal is transmitted to the CCU (camera control unit) 11201 as RAW data.
  • the CCU11201 is composed of a CPU, a GPU, and the like, and comprehensively controls the operations of the endoscope 11100 and the display device 11202. Further, the CCU 11201 receives an image signal from the camera head 11102, and performs various image processing on the image signal for displaying an image based on the image signal, such as development processing (demosaic processing).
  • the display device 11202 displays an image based on the image signal processed by the CCU 11201 under the control of the CCU 11201.
  • the light source device 11203 is composed of, for example, a light source such as an LED (Light Emitting Diode), and supplies irradiation light for photographing an operating part or the like to the endoscope 11100.
  • a light source such as an LED (Light Emitting Diode)
  • LED Light Emitting Diode
  • the input device 11204 is an input interface for the endoscopic surgery system 11000.
  • the user can input various information and input instructions to the endoscopic surgery system 11000 via the input device 11204.
  • the user inputs an instruction to change the imaging conditions (type of irradiation light, magnification, focal length, etc.) by the endoscope 11100.
  • the treatment tool control device 11205 controls the drive of the energy treatment tool 11112 for cauterizing, incising, sealing a blood vessel, or the like of a tissue.
  • the pneumoperitoneum device 11206 uses a gas in the pneumoperitoneum tube 11111 to inflate the body cavity of the patient 11132 for the purpose of securing the field of view by the endoscope 11100 and securing the operator's work space.
  • Recorder 11207 is a device capable of recording various information related to surgery.
  • the printer 11208 is a device capable of printing various information related to surgery in various formats such as text, images, and graphs.
  • the light source device 11203 that supplies the irradiation light to the endoscope 11100 when photographing the surgical site can be composed of, for example, an LED, a laser light source, or a white light source composed of a combination thereof.
  • a white light source is configured by combining RGB laser light sources, the output intensity and output timing of each color (each wavelength) can be controlled with high accuracy. Therefore, the light source device 11203 adjusts the white balance of the captured image. It can be carried out.
  • the laser light from each of the RGB laser light sources is irradiated to the observation target in a time-division manner, and the drive of the image sensor of the camera head 11102 is controlled in synchronization with the irradiation timing to correspond to each of RGB. It is also possible to capture the image in a time-division manner. According to this method, a color image can be obtained without providing a color filter on the image sensor.
  • the drive of the light source device 11203 may be controlled so as to change the intensity of the output light at predetermined time intervals.
  • the drive of the image sensor of the camera head 11102 in synchronization with the timing of the change in the light intensity to acquire images in a time-divided manner and synthesizing the images, so-called high dynamic without blackout and overexposure Range images can be generated.
  • the light source device 11203 may be configured to be able to supply light in a predetermined wavelength band corresponding to special light observation.
  • special light observation for example, by utilizing the wavelength dependence of light absorption in body tissue to irradiate light in a narrow band as compared with the irradiation light (that is, white light) in normal observation, the surface layer of the mucous membrane. So-called narrow band imaging, in which a predetermined tissue such as a blood vessel is photographed with high contrast, is performed.
  • fluorescence observation may be performed in which an image is obtained by fluorescence generated by irradiating with excitation light.
  • the body tissue is irradiated with excitation light to observe the fluorescence from the body tissue (autofluorescence observation), or a reagent such as indocyanine green (ICG) is locally injected into the body tissue and the body tissue is injected. It is possible to obtain a fluorescence image by irradiating excitation light corresponding to the fluorescence wavelength of the reagent.
  • the light source device 11203 may be configured to be capable of supplying narrow band light and / or excitation light corresponding to such special light observation.
  • FIG. 33 is a block diagram showing an example of the functional configuration of the camera head 11102 and CCU11201 shown in FIG. 32.
  • the camera head 11102 includes a lens unit 11401, an imaging unit 11402, a driving unit 11403, a communication unit 11404, and a camera head control unit 11405.
  • CCU11201 includes a communication unit 11411, an image processing unit 11412, and a control unit 11413.
  • the camera head 11102 and CCU11201 are communicatively connected to each other by a transmission cable 11400.
  • the lens unit 11401 is an optical system provided at a connection portion with the lens barrel 11101.
  • the observation light taken in from the tip of the lens barrel 11101 is guided to the camera head 11102 and incident on the lens unit 11401.
  • the lens unit 11401 is configured by combining a plurality of lenses including a zoom lens and a focus lens.
  • the image pickup unit 11402 is composed of an image pickup element.
  • the image sensor constituting the image pickup unit 11402 may be one (so-called single plate type) or a plurality (so-called multi-plate type).
  • each image pickup element may generate an image signal corresponding to each of RGB, and a color image may be obtained by synthesizing them.
  • the image pickup unit 11402 may be configured to have a pair of image pickup elements for acquiring image signals for the right eye and the left eye corresponding to 3D (Dimensional) display, respectively.
  • the 3D display enables the operator 11131 to more accurately grasp the depth of the biological tissue in the surgical site.
  • a plurality of lens units 11401 may be provided corresponding to each image pickup element.
  • the imaging unit 11402 does not necessarily have to be provided on the camera head 11102.
  • the imaging unit 11402 may be provided inside the lens barrel 11101 immediately after the objective lens.
  • the drive unit 11403 is composed of an actuator, and the zoom lens and focus lens of the lens unit 11401 are moved by a predetermined distance along the optical axis under the control of the camera head control unit 11405. As a result, the magnification and focus of the image captured by the imaging unit 11402 can be adjusted as appropriate.
  • the communication unit 11404 is composed of a communication device for transmitting and receiving various information to and from the CCU11201.
  • the communication unit 11404 transmits the image signal obtained from the image pickup unit 11402 as RAW data to the CCU 11201 via the transmission cable 11400.
  • the communication unit 11404 receives a control signal for controlling the drive of the camera head 11102 from the CCU 11201 and supplies the control signal to the camera head control unit 11405.
  • the control signal includes, for example, information to specify the frame rate of the captured image, information to specify the exposure value at the time of imaging, and / or information to specify the magnification and focus of the captured image, and the like. Contains information about the condition.
  • the above-mentioned imaging conditions such as frame rate, exposure value, magnification, and focus may be appropriately specified by the user, or may be automatically set by the control unit 11413 of CCU11201 based on the acquired image signal. Good.
  • the so-called AE (Auto Exposure) function, AF (Auto Focus) function, and AWB (Auto White Balance) function are mounted on the endoscope 11100.
  • the camera head control unit 11405 controls the drive of the camera head 11102 based on the control signal from the CCU 11201 received via the communication unit 11404.
  • the communication unit 11411 is composed of a communication device for transmitting and receiving various information to and from the camera head 11102.
  • the communication unit 11411 receives an image signal transmitted from the camera head 11102 via the transmission cable 11400.
  • the communication unit 11411 transmits a control signal for controlling the drive of the camera head 11102 to the camera head 11102.
  • Image signals and control signals can be transmitted by telecommunications, optical communication, or the like.
  • the image processing unit 11412 performs various image processing on the image signal which is the RAW data transmitted from the camera head 11102.
  • the control unit 11413 performs various controls related to the imaging of the surgical site and the like by the endoscope 11100 and the display of the captured image obtained by the imaging of the surgical site and the like. For example, the control unit 11413 generates a control signal for controlling the drive of the camera head 11102.
  • control unit 11413 causes the display device 11202 to display an image captured by the surgical unit or the like based on the image signal processed by the image processing unit 11412.
  • the control unit 11413 may recognize various objects in the captured image by using various image recognition techniques. For example, the control unit 11413 detects the shape, color, and the like of the edge of an object included in the captured image to remove surgical tools such as forceps, a specific biological part, bleeding, and mist when using the energy treatment tool 11112. Can be recognized.
  • the control unit 11413 may superimpose and display various surgical support information on the image of the surgical unit by using the recognition result. By superimposing and displaying the surgical support information and presenting it to the surgeon 11131, it is possible to reduce the burden on the surgeon 11131 and to allow the surgeon 11131 to proceed with the surgery reliably.
  • the transmission cable 11400 that connects the camera head 11102 and CCU11201 is an electric signal cable that supports electric signal communication, an optical fiber that supports optical communication, or a composite cable thereof.
  • the communication is performed by wire using the transmission cable 11400, but the communication between the camera head 11102 and the CCU11201 may be performed wirelessly.
  • the above is an example of an endoscopic surgery system to which the technology according to the present disclosure can be applied.
  • the technique according to the present disclosure can be applied to, for example, CCU11201 among the configurations described above.
  • the control units 220, 220B, and 220C described above can be applied to the image processing unit 11412.
  • the technique according to the present disclosure to the image processing unit 11412, the surface shape inside the body can be measured from the body image captured by the endoscope 11100.
  • the technique according to the present disclosure may be applied to other, for example, a microscopic surgery system.
  • each component of each device shown in the figure is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in arbitrary units according to various loads and usage conditions. Can be integrated and configured.
  • the following configurations also belong to the technical scope of the present disclosure.
  • the captured image is an image obtained from reflected light of light radiated to the target from a plurality of light sources arranged at different positions.
  • a flat region is extracted from the captured image based on the brightness value of the captured image.
  • a control unit that calculates shape information regarding the shape of the surface of the target based on the information about the sensor and the flat region of the captured image.
  • Information processing device equipped with (2)
  • the control unit The captured image obtained from the reflected light of the light that is simultaneously applied to the target from the plurality of light sources is acquired.
  • the information processing device according to (1).
  • the control unit A region in which the brightness value of the captured image is equal to or higher than a predetermined threshold value is defined as the flat region.
  • the control unit The captured image obtained from the reflected light of the light applied to the target from one of the plurality of light sources is acquired for each light source. A region in which the change in the luminance value between the plurality of captured images acquired for each light source is less than a predetermined threshold value is extracted as the flat region.
  • the control unit A smoothing process is performed on the captured image to generate a smoothing image. Based on the smoothing image, the flat region is extracted from the captured image.
  • the information processing device according to any one of (1) to (4).
  • the control unit The captured image is divided into a plurality of divided regions, and the captured image is divided into a plurality of divided regions.
  • the flat region is extracted for each of the plurality of divided regions, and shape information is calculated.
  • the information processing device according to any one of (1) to (5).
  • the control unit The normal information of the flat region in the captured image is calculated, and the normal information is calculated.
  • the normal information is input to the model generated by machine learning to obtain the shape information.
  • the information processing device according to any one of (1) to (6).
  • the model is It is generated by updating the weight based on the comparison result between multiple correct candidate images and the output data of the model.
  • the plurality of correct answer candidate images are generated by shifting the correct answer images by a different number of pixels.
  • the information processing device according to (7).
  • the model is Calculate the least squares error between the plurality of correct candidate images and the output data, respectively. Generated by updating the weights based on the minimum values of the plurality of least squares errors.
  • the control unit The flat region is extracted based on the contrast value calculated from the brightness value of the captured image.
  • the control unit The captured image is divided into a plurality of divided regions, and the captured image is divided into a plurality of divided regions.
  • the contrast value is calculated for each of the plurality of divided regions, and the contrast value is calculated.
  • the flat region is extracted by determining whether or not the divided region is flat according to the contrast value.
  • the control unit A plurality of captured images having different depths of field planes of the sensor are acquired, and the images are captured.
  • the flat region is extracted from each of the plurality of captured images.
  • the information processing device according to (10) or (11).
  • (13) Acquires the captured image captured by the sensor of the target,
  • the captured image is an image obtained from reflected light of light radiated to the target from a plurality of light sources arranged at different positions.
  • a flat region is extracted from the captured image based on the brightness value of the captured image. Based on the information about the sensor and the flat region of the captured image, shape information about the shape of the surface of the object is calculated. Information processing method.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Dentistry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Image Analysis (AREA)

Abstract

本開示にかかる情報処理装置(200A、200B、200C)は、制御部(220、220B、220C)を備える。制御部(220、220B、220C)は、対象をセンサが撮像した撮像画像を取得する。撮像画像は、それぞれ異なる位置に配置される複数の光源から対象に照射された光の反射光から得られる画像である。制御部(220、220B、220C)は、撮像画像の輝度値に基づき、撮像画像から平坦領域を抽出する。制御部(220、220B、220C)は、センサに関する情報および撮像画像の平坦領域に基づき、対象の表面の形状に関する形状情報を算出する。

Description

情報処理装置および情報処理方法
 本開示は、情報処理装置および情報処理方法に関する。
 物体の微細な状態を観測する装置として、比較的導入コストが低く、また、簡易に計測を行うことができるマイクロスコープが広く利用されている。
 マイクロスコープに関する技術として、照明ユニットの入射角度の相違を利用して、皮膚表面の色や汚れを解析する技術が知られている(例えば、特許文献1)。また、マイクロスコープの先端ドームからの所定距離に透明ガラスを配置することで、肌表面撮影時のピントボケやゆがみを低減させる技術が知られている(例えば、特許文献2)。
特開平10-333057号公報 特開2008-253498号公報
 従来技術によれば、マイクロスコープによって撮影される画像の質を向上させることができる。
 しかしながら、従来技術は、あくまで平面的な画像の質を向上させるものであり、物体の微小な形状(凹凸)を再現した3D画像を得ることは難しい。なお、物体の微小な形状を計測する装置として、非接触3D測定器や3Dスキャナ等が利用されるが、これらを導入する場合、コストが比較的高くなるという問題がある。なお、ToF(Time of Flight)方式による測距装置は、コストが比較的低廉であるものの、精度が充分でない場合がある。
 そこで、本開示では、形状計測の精度を向上させることができる情報処理装置および情報処理方法を提供する。
 本開示によれば、情報処理装置が提供される。情報処理装置は、制御部を備える。制御部は、対象をセンサが撮像した撮像画像を取得する。前記撮像画像は、それぞれ異なる位置に配置される複数の光源から前記対象に照射された光の反射光から得られる画像である。制御部は、前記撮像画像の輝度値に基づき、前記撮像画像から平坦領域を抽出する。制御部は、前記センサに関する情報および前記撮像画像の前記平坦領域に基づき、前記対象の表面の形状に関する形状情報を算出する。
撮像画像から深度を算出する算出方法について説明するための図である。 対象表面の大まかな形状について説明するための表である。 本開示の第1実施形態の概要について説明するための図である。 本開示の第1実施形態に係る情報処理システムの構成例を示すブロック図である。 本開示の第1実施形態に係るマイクロスコープの構成例を示す図である。 本開示の第1実施形態に係る情報処理装置の構成例を示すブロック図である。 撮像画像の輝度値の一例を示す図である。 領域取得部が生成するマスク画像の一例を示す図である。 領域取得部による平坦領域の取得例を説明するための図である。 法線情報の一例について説明するための図である。 本開示の実施形態に係る学習器について説明するための図である。 撮像画像の1pixelあたりの長さについて説明するための図である。 表示制御部が表示部に表示させる画像の一例を示す図である。 本開示の第1実施形態に係る深度算出処理の一例を説明するためのフローチャートである。 本開示の第2実施形態に係る取得部が取得する撮像画像について説明するための図である。 本開示の第2実施形態に係る取得部が取得する撮像画像について説明するための図である。 本開示の第3実施形態に係る領域取得部によるスムージング処理を説明するための図である。 本開示の第4実施形態に係る領域取得部による平坦領域の取得について説明するための図である。 本開示の第4実施形態に係る領域取得部による平坦領域の取得について説明するための図である。 センサの被写界深度を説明するための図である。 本開示の第5実施形態に係る領域取得部による平坦領域の取得について説明するための図である。 本開示の第5実施形態に係る領域取得部による平坦領域の取得について説明するための図である。 本開示の第6実施形態に係る取得部が取得する複数の撮像画像について説明するための図である。 本開示の第6実施形態に係る領域取得部による平坦領域の取得について説明するための図である。 本開示の第7実施形態に係る情報処理装置の構成例を示す図である。 本開示の第7実施形態に係る法線周波数分離部による周波数分離を説明するための図である。 本開示の第8実施形態に係る情報処理装置の構成例を示す図である。 本開示の第8実施形態に係る法線周波数分離部による周波数分離を説明するための図である。 第9実施形態に係る学習器の学習方法について説明するための図である。 本開示の第10実施形態に係る情報処理装置の制御部の構成例を示す図である。 本開示に係る技術(本技術)が適用され得る、カプセル型内視鏡を用いた患者の体内情報取得システムの概略的な構成の一例を示すブロック図である。 本開示に係る技術(本技術)が適用され得る内視鏡手術システムの概略的な構成の一例を示す図である。 図32に示すカメラヘッドおよびCCUの機能構成の一例を示すブロック図である。
 以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
 なお、説明は以下の順序で行うものとする。
  1.背景
   1.1.表面形状の算出方法
   1.2.算出方法の課題
  2.第1実施形態
   2.1.第1実施形態の概要
   2.2.システム構成例
   2.3.マイクロスコープの構成例
   2.4.情報処理装置の構成例
   2.5.深度算出処理
  3.第2実施形態
  4.第3実施形態
  5.第4実施形態
  6.第5実施形態
  7.第6実施形態
  8.第7実施形態
  9.第8実施形態
  10.第9実施形態
  11.第10実施形態
  12.その他の実施形態
  13.適応例
  14.補足
 <1.背景>
 <1.1.表面形状の算出方法>
 まず、本開示の実施形態の詳細を説明する前に、本発明者らが本開示の実施形態を創作するに至った背景について説明する。
 撮像装置によって撮影される撮像画像(RGB画像)から物体の形状(凹凸)を再現した3D画像を得る方法として、例えばCNN(Convolutional Neural Network)等の機械学習を利用してRGB画像から直接表面形状(表面までの深度)を算出する方法が知られている。しかしながら、RGB画像からCNNで深度を直接算出する場合、不確定性があり精度を向上させることが難しかった。
 撮像画像から物体表面までの深度を算出する他の方法として、撮像画像からCNN等の機械学習を利用して物体表面の法線情報を算出し、かかる法線情報を深度に式変換する方法がある。かかる方法について、図1を用いて説明する。図1は、撮像画像から深度を算出する算出方法について説明するための図である。図1を用いて説明する方法は、例えば情報処理装置200によって実行される。
 かかる方法では、情報処理装置200は、まずマイクロスコープが撮像した撮像画像を取得する(ステップS1)。このとき、情報処理装置200は、例えばマイクロスコープに関する情報も取得するものとする。情報処理装置200は、撮像画像に基づいて、対象の表面における法線(法線情報)を算出する(ステップS2)。情報処理装置200は、例えば、CNN等を利用して学習された学習器(モデル)に撮像画像を入力することで、出力データとして法線情報を得る。
 情報処理装置200は、法線情報に基づき、対象の表面までの距離(深度情報)を算出する(ステップS3)。マイクロスコープに関する情報の1つであるマイクロスコープのセンサと対象との距離が既知であれば、情報処理装置200は、法線情報に基づいて対象の表面までの測距を行える。ここで、ユーザがマイクロスコープで対象の撮像を行う場合、マイクロスコープのヘッドマウント部を対象に接触させて撮像する。そのため、マイクロスコープのセンサと対象との距離は、ヘッドマウント部の長さに相当する既知の値となる。
 具体的に、情報処理装置200は、以下の式(1)のWを最小化することで対象表面までの深度を法線情報に基づいて算出する。
Figure JPOXMLDOC01-appb-M000001
 なお、式(1)の各パラメータは以下の通りである。
 p:算出した法線のx方向
 q:算出した法線のy方向
 Z:求める深度のx方向の偏微分(法線のx方向)
 Z:求める深度のy方向の偏微分(法線のy方向)
 Zxx:求める深度のx方向の2回偏微分(法線のx方向のx方向への偏微分)
 Zyy:求める深度のy方向の2回偏微分(法線のy方向のy方向への偏微分)
 Zxy:求める深度のx、y方向の2回偏微分
 なお、x、yは、撮像画像上の座標を示しており、x方向は、例えば撮像画像の横方向、y方向は撮像画像の縦方向とする。
 式(1)のフーリエ変換(周波数変換)を行うと式(2)になる。これを最小化することで、対象表面までの深度が算出される。なお、式(2)のZは求める深度をフーリエ変換したものであり、u、vは、周波数空間での座標を表している。
Figure JPOXMLDOC01-appb-M000002
 式(2)を式展開したものが、以下の式(3)であり、式(3)を逆フーリエ変換することで、対象表面までの深度が算出される。
Figure JPOXMLDOC01-appb-M000003
 上述した式(1)~式(3)の式変換を用いて、情報処理装置200は、対象の表面までの距離(深度)を算出する。
 <1.2.算出方法の課題>
 上述した算出方法において、式(1)の右辺の2段目および3段目は、式(1)におけるcost項であり、2段目が法線の絶対値の総和、3段目が法線の微分の絶対値の総和を表している。
 ここで、上述した算出方法では、cost項の重み(λ、μ)が小さい、すなわち法線の絶対値の総和が少なく、法線の微分の絶対値の総和が少ないという仮定で深度を算出している。法線の絶対値の総和が少ないという仮定(以下、仮定1とも称する)は、深度を算出する対象表面が平らであることを意味する。また、法線の微分の絶対値の総和が少ないという仮定(以下、仮定2とも称する)は、深度を算出する対象表面の曲率が小さいことを意味する。すなわち、上述した算出方法では、深度を算出する対象の大まかな表面形状が平面であるという仮定で、対象までの深度を算出している。
 ここで、図2を用いて、対象表面の大まかな形状について説明する。図2は、対象表面の大まかな形状について説明するための表である。なお、図2では、実際の対象表面の形状を点線で、対象表面の大まかな形状について直線で示している。また、対象表面の法線を矢印で示している。また、図2では、対象の横方向をx方向、縦方向をz方向(深度)としている。
 対象表面の大まかな形状とは、対象表面の撮像画像全体における形状であり、大まかな形状が平面であるとは、対象表面の撮像画像全体における形状を見たときに変動が少ないことを意味する。なお、対象表面の局所的な凹凸の変化は、算出対象であるため大まかな形状には含まれない。上述した式(1)に示す最適化式のcost項の仮定を満たす、すなわち対象表面の撮像画像全体における表面形状が平面に近いほど、情報処理装置200は、対象表面までの深度を高精度に算出することができる。
 例えば、図2の表の(1)に示す対象は、まっすぐな表面に細かな凹凸が含まれる形状となっている。そのため、(1)に示す対象は、上述した仮定1、仮定2の両方を満たす(表では「○」で示している)ため、かかる対象の深度を情報処理装置200は高精度に算出することができる。
 図2の表の(2)に示す対象は、わずかに上向きにカーブした表面に細かな凹凸が含まれる形状となっている。そのため、(2)に示す対象は、上述した仮定1をやや満たし(表では「△」で示している)、仮定2を満たす。そのため、情報処理装置200は、(2)に示す対象の深度を(1)よりは精度が下がるが、精度よく算出することができる。
 図2の表の(3)に示す対象は、左側が大きく上向きにカーブした表面に細かな凹凸が含まれる形状となっている。そのため、(3)に示す対象は、上述した仮定1、2ともに満たさない(表では「×」で示している)。そのため、情報処理装置200は、(3)に示す対象の深度を精度よく算出することができない。
 図2の表の(4)に示す対象は、表面が段々になっている。このように、(4)に示す対象は、高さや方向が異なるまっすぐな面を複数有する表面に細かな凹凸が含まれる形状になっているため、上述した仮定1、2ともに満たさない。そのため、情報処理装置200は、(4)に示す対象の深度を精度よく算出することができない。
 このように、上述した算出方法では、深度の算出対象の表面の大まかな形状が平らであるという仮定を満たさない場合、深度の算出精度が低下するという問題があった。
 そこで、このような状況を鑑みて、本件の開示者は、深度の算出精度を向上させることで、形状計測の精度を向上させることができる情報処理装置200に係る本開示の各実施形態を創作するに至った。そこで、以下に、本開示に係る各実施形態の詳細について順次説明する。
 <2.第1実施形態>
 <2.1.第1実施形態の概要>
 図3は、本開示の第1実施形態の概要について説明するための図である。第1実施形態に係る情報処理装置200A(図示省略)は、上述した仮定1、2を満たす領域(平坦領域)を撮像画像から抽出することで、対象の表面形状に関する形状情報(深度情報)の精度劣化を抑制し、形状計測の精度を向上させる。
 情報処理装置200Aは、まずマイクロスコープ100のセンサ150が対象Sを撮像した撮像画像M11を取得する。撮像画像M11は、それぞれ異なる位置に配置される複数の光源160A、160Bから対象Sに照射された光IA、IBの反射光から得られる画像である。
 ここで、マイクロスコープ100について簡単に説明する。図3の左図に示すように、マイクロスコープ100は、センサ150と、センサ150と撮像対象との間に設置される筒状の機構であるヘッドマウント部10と、複数の光源160A、160Bと、を有する。なお、センサ150は、レンズやカメラ等と読み替えてもよい。マイクロスコープ100は、ユーザが手に持って、対象Sにヘッドマウント部10を接触させることで、対象Sにセンサ150を向けて使用される撮像装置である。
 マイクロスコープ100は、光源160A、160Bから対象Sに同時に照射された光IA、IBの反射光を露光させ、対象Sを撮像する。このとき、例えば対象Sの表面の大まかな形状が平面でない場合、対象Sの表面には、オクルージョン(光が当たらない領域)が発生する。
 例えば、光源160Aから照射された光IAは、対象Sの表面のうち領域SAおよび領域SABには当たるが、領域SBには当たらない。一方、光源160Bから照射された光IBは、対象Sの表面のうち領域SBおよび領域SABには当たるが、領域SAには当たらない。複数の光源160A、160Bからの光IA、IBが両方当たる領域SABは、オクルージョンがない平坦な領域である。
 マイクロスコープ100の撮像画像M11は、図3の右図に示すように、光源160A、160Bの一方の光IA、IBしか当たらない領域SA、SBが、両方の光IA、IBが当たる領域SABに比べて輝度値が低く暗い画像となる。
 そこで、情報処理装置200Aは、撮像画像M11の輝度値に基づき、撮像画像M11から平坦領域SABを抽出する。例えば、情報処理装置200Aは、撮像画像M11の輝度値が閾値以上である領域SABを平坦領域として抽出する。
 情報処理装置200Aは、センサ150に関する情報および撮像画像M11の平坦領域SABに基づき、対象Sの表面の形状に関する形状情報(深度情報)を算出する。例えば、情報処理装置200Aは、CNNを利用して学習された学習器に、撮像画像M11の平坦領域SABを入力することで平坦領域SABの法線情報を取得する。情報処理装置200Aは、取得した法線情報を上述した式(1)~式(3)を用いた式変換を行うことで、対象Sの表面までの深度情報を算出する。
 このように、情報処理装置200Aは、撮像画像M11から式(1)の仮定1、2を満たす領域を抽出することで、形状計測の精度を向上させることができる。
 以下、上述した情報処理装置200Aを有する情報処理システム1の詳細について説明する。
 <2.2.システム構成例>
 図4は、本開示の第1実施形態に係る情報処理システム1の構成例を示すブロック図である。図4に示すように、情報処理システム1は、マイクロスコープ100と、情報処理装置200Aと、を有する。
 マイクロスコープ100は、ユーザが手に持って、撮像対象Sにセンサ150を向けて使用される撮像装置である。
 情報処理装置200Aは、マイクロスコープ100が撮像した撮像画像M11に基づき、撮像対象Sの表面形状に関する形状情報を算出する。情報処理装置200Aの詳細は、図6を用いて後述する。
 マイクロスコープ100と情報処理装置200Aとは例えばケーブルを用いて接続される。あるいは、マイクロスコープ100と情報処理装置200AとがBluetooth(登録商標)やNFC(Near Field Communication)等の無線通信によって直接接続されていてもよい。マイクロスコープ100と情報処理装置200Aとが、例えばネットワーク(図示省略)を介して有線または無線で接続されていてもよい。あるいは、マイクロスコープ100と情報処理装置200Aとが、例えばハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカードなどの外部装着型の記憶媒体を介して撮像画像をやりとりしてもよい。また、マイクロスコープ100と情報処理装置200Aとを一体として構成してもよい。具体的には、情報処理装置200Aが、例えば、マイクロスコープ100の本体内部に配置される構成であってもよい。
 <2.3.マイクロスコープの構成例>
 図5は、本開示の第1実施形態に係るマイクロスコープ100の構成例を示す図である。マイクロスコープ100は、センサ150と、センサ150と撮像対象との間に設置される筒状の機構であるヘッドマウント部10と、を有する。また、マイクロスコープ100は、それぞれ異なる位置に配置される点光源160A、160B(図示省略)を有する。
 ヘッドマウント部10は、マイクロスコープ100の先端にマウントされる機構である。ヘッドマウント部10は、例えば先端ヘッドや鏡筒とも称される。ヘッドマウント部10の内部が、例えば鏡になっており、点光源160A、160Bから照射された光がヘッドマウント部10の側面で全反射するようになっていてもよい。
 ユーザは、ヘッドマウント部10を対象Sに接触させて、対象Sを撮像する。これにより、センサ150と対象Sとの距離が固定され、撮像においてピント(焦点距離)がずれることを防止することができる。
 マイクロスコープ100は、ヘッドマウント部10の内部に点光源160A、160Bを有する。これにより、マイクロスコープ100は、点光源160A、160Bから対象Sに照射された光IA、IBの反射光を露光させ、対象Sを撮像する。なお、本明細書における点光源とは、理想的には点による光源を意味するが、現実的には点による光源は存在しえないため、きわめて微少な大きさ(数ミリメートル以内など)の光源を含むものである。
 なお、本明細書では、光源の一例として点光源を用いた場合について説明するが、光源は点光源に限定されない。また、光源の数も、2つに限定されない。光源は複数あればよく、それぞれことなる位置に配置されていれば光源が3つ以上あってもよい。
 <2.4.情報処理装置の構成例>
 図6は、本開示の第1実施形態に係る情報処理装置200Aの構成例を示すブロック図である。情報処理装置200Aは、制御部220と、記憶部230と、を有する。
 (制御部)
 制御部220は、情報処理装置200Aの動作を制御する。制御部220は、取得部221と、領域取得部225と、法線算出部222と、深度算出部223と、表示制御部224と、を有する。取得部221と、領域取得部225と、法線算出部222と、深度算出部223と、表示制御部224と、の各機能部は、例えば、制御部220によって、制御部220内部に記憶されたプログラムがRAM等を作業領域として実行されることにより実現される。なお、制御部220の内部構造は、図6に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部220が有する各処理部の接続関係は、図6に示した接続関係に限られず、他の接続関係であってもよい。
 (取得部)
 取得部221は、マイクロスコープ100が撮像した撮像画像M11や、マイクロスコープ100に関する情報を取得する。マイクロスコープ100に関する情報には、例えば焦点距離fやヘッドマウント部10の長さdなど、マイクロスコープ100の構造に関する情報が含まれる。
 取得部221が、例えばマイクロスコープ100の点光源160A、160Bやセンサ150を制御するようにしてもよい。この場合、取得部221は、点光源160A、160Bから光IA、IBが同時に照射されるように、点光源160A、160Bを制御する。また、取得部221は、点光源160A、160Bから光IA、IBが同時に照射されている間にセンサ150が対象Sを撮像するように、センサ150を制御する。このように、情報処理装置200Aがマイクロスコープ100を制御するようにしてもよい。
 あるいは、取得部221が、撮像画像M11に加え、撮像条件に関する情報を取得するようにしてもよい。撮像条件に関する情報とは、例えば、撮像画像M11が点光源160A、160Bから光IA、IBが同時に照射された間に撮像された画像であることを示す情報である。この場合、後述する領域取得部225は、例えば撮像条件に応じて撮像画像M11から平坦領域SABを抽出する。
 (領域取得部)
 領域取得部225は、撮像画像M11から平坦領域SABを抽出する。領域取得部225は、例えば、撮像画像M11の各画素の輝度値L(x、y)と閾値thとを比較する。図7に示すように、領域取得部225は、輝度値L(x、y)が閾値th以上の画素を含む領域を処理領域とし、輝度値L(x、y)が閾値th未満の画素を含む領域を除外領域とする。なお、図7は、撮像画像M11の輝度値の一例を示す図であり、図7では、y軸の値を所定値「β」とした場合の輝度値L(x、β)と画素(x、β)との関係を示している。
 なお、撮像画像M11がRGB画像の場合、輝度値L(x、y)は、L(x、y)=(R(x、y)+2G(x、y)+B(x、y))/4で算出される。R(x、y)は画素(x、y)における画素値のR(Red)成分、G(x、y)は画素(x、y)における画素値のG(Green)成分、B(x、y)は画素(x、y)における画素値のB(Blue)成分である。
 領域取得部225は、全ての画素において輝度値L(x、y)と閾値thとを比較することで、処理領域と判定した領域を撮像画像M11から抽出する抽出領域(平坦領域SAB)として取得する。
 領域取得部225は、例えば、画素の輝度値L(x、y)が閾値th以上である場合にかかる画素を白色とし、閾値th未満である場合にかかる画素を黒色とすることで、例えば図8に示すマスク画像M12を生成する。なお、図8は、領域取得部225が生成するマスク画像M12の一例を示す図である。
 領域取得部225は、図9に示すように、生成したマスク画像M12と撮像画像M11とを比較し、同座標においてマスク画像M12が白色である画素を撮像画像M11から抽出することで、平坦領域SABを取得する。なお、図9は、領域取得部225による平坦領域SABの取得例を説明するための図である。
 あるいは、領域取得部255は、画素の輝度値L(x、y)が閾値th以上である場合にかかる画素の輝度値を「1」とし、閾値th未満である場合にかかる画素の輝度値を「0」とすることで、マスク画像M12を生成してもよい。この場合、領域取得部255は、撮像画像M11とマスク画像M12とを乗算することで、平坦領域SABを取得する。
 領域取得部255は、取得した平坦領域SABを法線算出部222に出力する。なお、領域取得部255が生成したマスク画像M12を法線算出部222に出力し、法線算出部222が、マスク画像M12を用いて撮像画像M11から平坦領域SABを取得するようにしてもよい。
 (法線算出部)
 法線算出部222は、撮像画像M11の平坦領域SABに基づいて、対象Sの表面における法線情報を法線画像として算出する。法線算出部222は、例えば、CNNを用いて法線画像を生成する。法線算出部222は、CNNを利用して事前に学習された学習器を用いて法線画像を生成する。学習器300(図11参照)の入力チャネル数は、入力画像(ここでは平坦領域SAB)のRGBに相当する3チャネル、あるいは、入力画像のグレースケールの1チャネルとする。また、学習器300の出力チャネル数は、出力画像(ここでは法線画像)のRGBに相当する3チャネルとする。また、出力画像の解像度は、入力画像の解像度と等しいものとする。
 ここで、法線情報と法線画像のRGBとの関係について、図10を用いて説明する。図10は、法線情報の一例について説明するための図である。図10に示す法線Nは、対象Sを撮像した撮像画像M11の所定画素における法線ベクトルであるとする。この場合、法線Nの天頂角をθ、方位角をφとすると、極座標系における法線N(θ、φ)と直交座標系における法線N(x、y、z)との間には、以下の式(4)の関係が成り立つ。なお、法線Nは、単位ベクトルであるものとする。
Figure JPOXMLDOC01-appb-M000004
 法線情報は、上述した直交座標系における法線N(x、y、z)であり、例えば撮像画像M11の平坦領域SABの画素ごとに算出される。また、法線画像は、各画素の法線情報をRGBに置き換えることで得られる画像である。すなわち、法線画像は、法線NのxをR(レッド)、yをG(グリーン)、zをB(ブルー)の各値として置き換えることで得られる画像である。
 図6に戻る。法線算出部222は、平坦領域SABを入力画像として学習器300に入力することで、出力画像である法線画像を生成する。学習器300は、学習の真値を法線として、CNN中の重みの学習を行うことで事前に生成されているものとする。
 ここで、図11を用いて学習器300の生成方法について説明する。図11は、本開示の実施形態に係る学習器300について説明するための図である。ここでは、説明を簡略化するために、情報処理装置200Aの制御部220が学習器300を生成するものとして説明するが、学習器300は、例えば他の情報処理装置(図示省略)等によって生成されてもよい。
 図11に示す例では、情報処理装置200Aは、入力画像M14を学習器300に入力した場合の出力画像M15と、学習の真値(Ground Truth)である法線画像M16との類似度を算出する。ここでは、情報処理装置200Aは、出力画像M15と法線画像M16との最小二乗誤差(L2)を算出し、L2をロスとして学習処理を行う。情報処理装置200Aは、例えば算出したロスをバックプロパゲーションすることにより、学習器300の重みを更新する。これにより、情報処理装置200Aは、撮像画像を入力すると法線画像を出力する学習器300を生成する。
 なお、ここでは、機械学習の一例としてCNNを利用して学習器300を生成するとしたが、これに限定されない。機械学習としてCNN以外にも例えばRNN(Recurrent Neural Network)等、種々の手法を用いて学習器300を生成してもよい。また、上述した例では、算出したロスをバックプロパゲーションすることにより、学習器300の重みを更新するとしたが、これに限定されない。バックプロパゲーション以外にも例えば確率的勾配降下法等の任意の学習手法を用いて学習器300の重みを更新するようにしてもよい。また、上述した例では、ロスを最小二乗誤差としたがこれに限定されない。ロスを最小平均誤差としてもよい。
 図6に戻る。法線算出部222は、生成した学習器300を利用して法線画像を生成する。法線算出部222は、算出した法線画像を深度算出部223に出力する。
 (深度算出部)
 深度算出部223は、法線画像の各画素値を入力として、上述した式(1)~(3)を用いた式変換を行ってセンサ150から対象Sまでの距離(深度)を算出する。具体的には、深度算出部223は、以下の通り、上述した式(3)を逆フーリエ変換してZ’を算出し、求める深度ZをZ=Z’×Pとして算出する。
Figure JPOXMLDOC01-appb-M000005
 なお、上述した式(3)等の各パラメータは以下の通りである。
 P(u、v):法線のx方向のフーリエ変換
 Q(u、v):法線のy方向のフーリエ変換
 u、v:各画素の周波数空間中での座標
 P:撮像画像xyの1pixel(1画素)あたりの長さ[μm]
 Z:求める深度のフーリエ変換
 Z’:求める1pixelあたりの深度[pixel]
 Z:求める深度[μm]
 上記P(撮像画像xyの1pixel(1画素)あたりの長さ[μm])は、撮像装置(マイクロスコープ100)のセンサ150の構成から値が決まるパラメータである。
 例えば、図12に示すように、センサ150の焦点距離がf[mm]、筐体(ヘッドマウント部10)の長さがd[mm]であるとする。また、センサ150の画素ピッチがp[μm]とすると、撮像画像の1pixelの実長Pは、P:d=p:fからP=(d×p)/f[μm]となる。なお、図12は、撮像画像の1pixelあたりの長さについて説明するための図である。
 深度算出部223は、法線画像とセンサ150に関する情報とに基づき、例えば撮像画像M11の画素ごとに対象Sの深度を算出する。センサ150に関する情報とは、例えばセンサ150の構造に関する情報であり、具体的には、上述したセンサ150の焦点距離やセンサ150と対象Sとの間の距離に関する情報である。撮像装置がマイクロスコープ100の場合、センサ150と対象Sとの間の距離はヘッドマウント部10の長さdとなる。
 (表示制御部)
 表示制御部224は、各種の画像を液晶ディスプレイ等の表示部(図示省略)に表示させる。図13は、表示制御部224が表示部に表示させる画像M17の一例を示す図である。図13に示すように、表示制御部224は、例えば撮像画像M17a、法線画像M17b、深度画像M17c、深度グラフを示す画像M17dおよび対象Sの3D画像M17eを含む画像M17を表示部に表示させる。
 撮像画像M17aは、例えば、マイクロスコープ100で撮像した撮像画像M11から平坦領域SABを切り取った画像である。法線画像M17bは、撮像画像M17aの法線情報をRGBで表示した画像である。深度画像M17cは、撮像画像M17aの各画素における深度を示す画像であり、例えば色が薄いほど深度が大きい(センサ150から対象Sまでの距離が大きい)ことを示している。深度グラフを示す画像M17dは、法線画像M17b、深度画像M17cおよび対象Sの3D画像M17eに示す直線における深度をグラフとして表示した画像である。対象Sの3D画像M17eは、深度画像M17cに基づいて対象Sを3次元表示した画像である。
 このように、表示制御部224が、撮像画像や生成した法線画像および深度画像に加え、深度を示すグラフや3次元画像を表示部に表示させるようにしてもよい。
 (記憶部)
 記憶部230は、制御部220の処理に用いられるプログラムや演算パラメータ等を記憶するROM(Read Only Memory)、および適宜変化するパラメータ等を一時記憶するRAM(Random Access Memory)により実現される。
 <2.5.深度算出処理>
 図14は、本開示の第1実施形態に係る深度算出処理の一例を説明するためのフローチャートである。図14に示す深度算出処理は、情報処理装置200Aの制御部220がプログラムを実行することによって実現される。図14に示す深度算出処理は、マイクロスコープ100が撮像画像M11を撮像した後に実行される。あるいは、図14に示す深度算出処理は、ユーザからの指示に応じて実行されるようにしてもよい。
 図14に示すように、制御部220は、例えば、マイクロスコープ100から撮像画像M11を取得する(ステップS101)。あるいは、制御部220が、例えばネットワーク(図示省略)を介して他の装置から撮像画像M11を取得するようにしてもよい。他の装置として、例えば他の情報処理装置やクラウドサーバ等が挙げられる。
 制御部220は、センサ150に関する情報を取得する(ステップS102)。制御部220は、マイクロスコープ100からセンサ150に関する情報を取得してもよい。あるいは、記憶部230にセンサ150に関するセンサ情報を記憶している場合、制御部220は、記憶部230からセンサ情報を取得してもよい。また、制御部220は、例えばユーザからの入力によってセンサ情報を取得してもよい。
 制御部220は、取得した撮像画像M11から平坦領域SABを取得する(ステップS103)。具体的に、制御部220は、撮像画像M11の各画素の輝度値が閾値th以上である領域を平坦領域SABとして抽出する。
 制御部220は、取得した平坦領域SABの法線情報を算出する(ステップS104)。具体的に、制御部220は、平坦領域SABを入力画像として学習器300に入力することで、出力画像として法線情報を含む法線画像を生成する。
 制御部220は、法線情報およびセンサ150に関する情報に基づき、深度情報を算出する(ステップS105)。具体的に、制御部220は、法線情報に対して、上述した式(3)等に基づく式変換を行うことで深度情報を算出する。
 以上のように、第1実施形態に係る情報処理装置200Aは、制御部220を備える。制御部220は、対象Sをセンサ150が撮像した撮像画像M11を取得する。撮像画像M11は、それぞれ異なる位置に配置される複数の点光源160A、160Bから対象Sに照射された光IA、IBの反射光から得られる画像である。制御部220は、撮像画像M11の輝度値に基づき、撮像画像M11から平坦領域SABを抽出する。制御部220は、センサ150に関する情報および撮像画像M11の平坦領域SABに基づき、対象Sの表面の形状に関する形状情報(深度情報)を算出する。
 特に、第1実施形態に係る情報処理装置200Aは、複数の点光源160A、160Bから同時に対象Sに照射された光IA、IBの反射光から得られる撮像画像M11から平坦領域SABを取得する。
 このように、情報処理装置200Aが平坦領域SABを取得することで、深度算出部223における式変換において仮定1、2を満たすことができ、深度算出の精度低下を抑制することができる。これにより、情報処理装置200Aは、形状計測の精度を向上させることができる。
 <3.第2実施形態>
 上記第1実施形態では、複数の点光源160A、160Bから同時に光IA、IBが照射される間にマイクロスコープ100が撮像した撮像画像M11に基づき、情報処理装置200Aが深度を算出する場合を示した。上記例以外にも、情報処理装置200Aは、1つの点光源から光が照射される間にマイクロスコープ100が撮像した撮像画像に基づいて深度を算出してもよい。そこで、第2実施形態では、情報処理装置200Aが、複数の点光源160A、160Bの1つから対象Sに照射された光の反射光から得られる撮像画像であって、点光源160A、160Bごとに得られる撮像画像に基づき、深度を算出する例について説明する。なお、第2実施形態に係る情報処理装置200Aは、取得部221および領域取得部225の動作を除き、第1実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 図15は、本開示の第2実施形態に係る取得部221が取得する撮像画像M21、M22について説明するための図である。
 図15に示すように、マイクロスコープ100は、まず点光源160Aから光IAを照射して、対象Sを撮像する。このとき、例えば対象Sの表面の大まかな形状が平面出ない場合、対象Sの表面にはオクルージョン(光が当たらない領域)が発生する。
 例えば、光源160Aから照射された光IAは、対象Sの表面のうち領域SA1には当たるが、領域SA2には当たらない。この場合、取得部221は、例えば図15に示すように、領域SA2が領域SA1に比べて暗い撮像画像M21を取得する。
 続いて、マイクロスコープ100は、点光源160Bから光IBを照射して、対象Sを撮像する。このとき、点光源160Aから光IAを照射した場合と同様に、対象Sの表面にはオクルージョン(光が当たらない領域)が発生する。
 例えば、光源160Bから照射された光IBは、対象Sの表面のうち領域SB1には当たるが、領域SB2には当たらない。この場合、取得部221は、例えば図15に示すように、領域SB2が領域SB1に比べて暗い撮像画像M22を取得する。
 このように、取得部221は、マイクロスコープ100が2つの点光源160A、160Bを順次点灯させて撮像した撮像画像M21、M22を取得する。
 領域取得部225は、取得部221が取得した撮像画像M21、M22から平坦領域SABを取得する。上述したように、平坦領域SABには、点光源160A、160Bの両方の光IA、IBが当たる。換言すると、光IA、IBの少なくとも一方が当たらないオクルージョン領域は平坦でない領域となる。このように、撮像画像M21、M22において、平坦領域SABには、点光源160A、160Bからの光IA、IBが当たるため、両方の撮像画像M21、M22において平坦領域SABの画素の輝度値はほぼ同じ値になる。
 そこで、領域取得部225は、撮像画像M21、M22の輝度値に基づき、平坦領域SABを取得する。領域取得部225は、撮像画像M21、M22のそれぞれ対応する画素において輝度値の変化がない、あるいは変化が小さい(閾値th2以内である)領域を平坦領域SABとして抽出する。
 領域取得部225による平坦領域SABの具体的な取得方法について、図16を用いて説明する。図16は、本開示の第2実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。
 領域取得部225は、例えば撮像画像M21、M22の対応する画素(x、y)の輝度値の差分D(x、y)=L1(x、y)-L2(x、y)を算出する。なお、L1(x、y)は、撮像画像M21の画素(x、y)の輝度値であり、L2(x、y)は、撮像画像M22の画素(x、y)の輝度値である。図16は、画素のyを所定の値に固定した場合の、差分Dとxとの関係を示すグラフである。なお、図15に示すように、撮像画像M21、M22の横方向をx方向、縦方向をy方向としている。
 例えば図16に示す領域SB2では、撮像画像M21の輝度値が高く、撮像画像M22の輝度値が低い(図15参照)。そのため、領域SB2における差分Dの値は正方向に大きな値となる。一方、図16に示す領域SA2では、撮像画像M21の輝度値が低く、撮像画像M22の輝度値が高い(図15参照)。そのため、領域SA2における差分Dの値は負方向に大きな値となる。また、領域SB2、SA2を除く領域では、撮像画像M21、M22の両方とも同程度に輝度値が高いため、差分Dはゼロに近い値となる。
 そこで、領域取得部225は、差分Dが閾値th2以上である領域SB2を、深度算出を行わない除外領域とする。また、領域取得部225は、差分Dが閾値-th2以下である領域SA2を、深度算出を行わない除外領域とする。一方、領域取得部225は、差分Dが閾値±th2の範囲内である領域を、深度算出を行う処理領域とする。領域取得部225は、処理領域と判定した領域を撮像画像M21、M22から抽出する抽出領域(平坦領域SAB)として取得する。
 より具体的に、領域取得部225は、上述した差分Dの絶対値abs(D)を閾値判定し、差分Dの絶対値abs(D)が閾値th2以上の画素を含む領域を黒色の領域、閾値th2未満の画素を含む領域を白色の領域とすることで、例えば図8に示すマスク画像M12を生成する。領域取得部225は、例えば、マスク画像M12と撮像画像M21とを比較し、同座標においてマスク画像M12が白色である画素を撮像画像M21から抽出することで、平坦領域SABを取得する。あるいは、領域取得部225が、マスク画像M12と撮像画像M22とを比較して平坦領域SABを取得してもよい。なお、マスク画像M12を生成した後の処理は、第1実施形態と同じである。
 第2実施形態では、点光源160A、160Bのいずれか一方を照射して撮像を行う。この場合、上述した第1実施形態のように同時に照射する場合に比べて、対象Sに当たる光量を低く抑えることができるため、撮像画像M21、M22の全体的な明るさを抑え、コントラストを高く保つことができる。そのため、撮像画像M21、M22の光が当たる領域の輝度値と光が当たらないオクルージョン領域の輝度値の差を大きくすることができる。これにより、領域取得部225は、より容易に撮像画像M21、M22から平坦領域SABを取得することができる。
 一方、第1実施形態に係る情報処理装置200Aは、取得する撮像画像M11の枚数が1枚でよいため、第2実施形態に比べて画像取得時間を半分の時間に抑えることができる。また、撮像画像M21、M22を順次撮像する間に、対象Sまたはセンサ150が動いてしまうと、領域取得部225は、平坦領域SABを取得する前に、例えば撮像画像M21、M22の位置合わせ等の処理を行う必要がでてくる。そのため、リアルタイムで深度算出を行う場合は、画像取得時間が短く位置合わせ等の処理が不要である第1実施形態に係る情報処理装置200Aを用いて深度算出を行うことが望ましい。
 以上のように、第2実施形態に係る情報処理装置200Aは、複数の点光源160A、160Bの1つから対象Sに照射された光IA、IBの反射光から得られる撮像画像M21、M22を、点光源160A、160Bごとに取得する。情報処理装置200Aは、点光源160A、160Bごとに取得した複数の撮像画像M21、M22間における輝度値の変化(差分Dの絶対値)が所定閾値th2未満である領域を平坦領域SABとして抽出する。
 これにより、情報処理装置200Aは、撮像画像M21、M22のコントラストを高くすることができ、平坦領域SABの抽出精度を向上させることができ、形状計測の精度を向上させることができる。
 なお、ここでは、マイクロスコープ100が2つの点光源160A、160Bを備える場合を例に説明したが、点光源の数は2つに限定されない。例えば、マイクロスコープ100が3つ以上の点光源を備えていてもよい。
 この場合、マイクロスコープ100は、3つ以上の点光源を順次点灯させて対象Sを撮像する。情報処理装置200Aは、マイクロスコープ100が撮像した複数の撮像画像を取得する。情報処理装置200Aは、取得した複数の撮像画像間で輝度値の変化が少ない領域、換言すると複数の撮像画像の対応する画素の輝度値の差分の絶対値が所定閾値th2未満である領域を平坦領域SABとして取得する。
 なお、マイクロスコープ100が3つ以上の点光源を有している場合であっても、全ての点光源を順次点灯させて対象Sを撮像する必要はない。例えば、マイクロスコープ100が3つの点光源を有している場合、3つの点光源のうち2つの点光源を順次点灯させて撮像を行ってもよい。この場合、マイクロスコープ100は、例えば複数の点光源のうち最も離れた点光源を選択して点灯させるようにしてもよい。
 <4.第3実施形態>
 上記第1、第2実施形態では、取得部221が取得した撮像画像から平坦領域SABを取得する場合を示した。上記例以外にも、情報処理装置200Aは、撮像画像に対してスムージング処理を行ってから平坦領域SABを取得してもよい。そこで、第3実施形態では、情報処理装置200Aが撮像画像から平坦領域SABを取得する前にスムージング処理を行う例について説明する。なお、第3実施形態に係る情報処理装置200Aは、領域取得部225の動作を除き、第1実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 図17は、本開示の第3実施形態に係る領域取得部225によるスムージング処理を説明するための図である。
 図17に示すように、取得部221が取得した撮像画像M31には、対象Sの局所の凹凸やノイズが含まれる。なお、対象Sの局所の凹凸は、深度算出部223における深度情報の算出対象である。
 領域取得部225が、図17に示す撮像画像M31を画素単位で閾値判定をしようとすると、上述した凹凸やノイズの影響を受けてしまい、平坦領域SABの取得精度が低下してしまう。
 そこで、領域取得部225は、閾値判定を行って平坦領域SABを取得する前に、撮像画像M31に対してスムージング処理を行い、図17の下図に示すようにスムージング画像M32を生成する。具体的に、領域取得部225は、撮像画像M31にローパスフィルターを適用することで、スムージング画像M32を生成する。領域取得部225は、スムージング画像M32に対して閾値判定を行って図8に示すマスク画像M12を生成する。
 領域取得部225は、例えば、マスク画像M12と撮像画像M31とを比較し、同座標においてマスク画像M12が白色である画素を撮像画像M31から抽出することで、撮像画像M31における平坦領域SABを取得する。
 このように、領域取得部225が、スムージング画像M32に基づき、マスク画像M12を生成することで、撮像画像M31の細かな凹凸やノイズの影響を低減しつつマスク画像M12を生成することができる。また、領域取得部225がマスク画像M12を用いて、撮像画像M31の平坦領域SABを取得することで、局所の凹凸を含んだ平坦領域SABを抽出することができ、対象Sの深度を精度よく算出することができる。
 なお、第2実施形態で説明したように、取得部221が複数の撮像画像を取得する場合、領域取得部225は、取得した全ての撮像画像に対してスムージング処理を行う。これにより、情報処理装置200Aは、平坦領域SABの取得精度低下を抑制することができ、形状計測の精度を向上させることができる。
 <5.第4実施形態>
 上記第1、第2実施形態では、領域取得部225が画素の輝度値を閾値判定することで平坦領域SABを取得する場合を示した。上記例以外にも、情報処理装置200Aは、撮像画像を複数のブロックに分割することで平坦領域を取得してもよい。そこで、第4実施形態では、情報処理装置200Aが、撮像画像を複数のブロックに分割する例について説明する。なお、第4実施形態に係る情報処理装置200Aは、領域取得部225の動作を除き、第1実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 図18は、本開示の第4実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。
 図18に示すように、領域取得部225は、取得部221が取得した撮像画像M41を、例えば複数のブロックに分割し、分割した1つのブロックM42を平坦領域として取得する。なお、領域取得部225は、マイクロスコープ100に関する情報に基づき、ブロックの大きさを決定し、決定した大きさのブロックで撮像画像M41を分割する。
 図19に示すように、対象Sの形状の変動が撮像画像M41全体では大きかったとしても、局所領域SCでは、概ね平面とみなすことができる。なお、図19は、本開示の第4実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。
 例えば、対象Sが人間の皮膚である場合、経験的に5mm×5mm以下の面積ならば、上述した仮定1、仮定2を満たす平面としてよい。そこで、領域取得部225は、例えば撮像画像M41を5mm×5mm以下のブロックで分割する。撮像画像の1pixelの実長P[μm]は、上述したように、センサ150の焦点距離f[mm]、筐体(ヘッドマウント部10)の長さd[mm]、および、センサ150の画素ピッチp[μm]に基づいて算出される。
 例えば上述したように、撮像画像M41を5mm×5mm以下のブロックで分割する場合、ブロックの幅w[pixel]は、w=5000/P=5000f/(d×p)となる。具体的に、センサ150の焦点距離f=16[mm]、ヘッドマウント部10の長さd=100[mm]、および、センサ150の画素ピッチp=5[μm]とすると、1pixelあたりの長さPはP=31.25[μm]となる。よって、撮像画像M41を5mm×5mm以下のブロックで分割する場合、ブロックサイズは、160×160[pixel]となる。
 なお、法線算出部222および深度算出部223は、分割したブロック全てに対して法線情報および深度情報を算出する。算出対象とするブロック(平坦領域)の数が異なる点を除き、深度算出処理は図13に示す算出処理と同じである。
 このように、第4実施形態では、情報処理装置200Aが、撮像画像M41を複数のブロックに分割して深度を算出する。これにより、情報処理装置200Aは、上述した式(1)~式(3)における仮定1、仮定2を満たす平坦領域を取得することができ、精度よく深度算出を行うことができる。このように、第4実施形態に係る情報処理装置200Aは、形状計測の精度を向上させることができる。
 なお、ここでは、ブロックのサイズを5mm×5mmとしたが、これに限定されない。例えば、マイクロスコープ100の撮像対象は人間の皮膚以外であってもよい。撮像対象によって平坦とみなせるブロックのサイズは異なるため、ブロックのサイズは、撮像対象に応じて異なるサイズとしてもよい。
 例えば、マイクロスコープ100が複数種類の対象を撮像する場合、記憶部230に撮像対象の種類と適切なブロックのサイズとを対応付けた表を記憶しておくものとする。この場合、情報処理装置200Aは、撮像対象の種類に応じてブロックのサイズを選択する。あるいは、ユーザがブロックのサイズを指定するようにしてもよい。このように、ブロックのサイズは、上述した例に限定されず、種々のサイズが選択可能である。
 <6.第5実施形態>
 上記第4実施形態では、領域取得部225が撮像画像をブロックに分割することで平坦領域を取得する場合を示した。上記例以外にも、情報処理装置200Aは、分割したブロックのコントラスト値に応じて平坦領域を取得してもよい。そこで、第5実施形態では、情報処理装置200Aが、分割したブロックのコントラスト値に応じて平坦領域を取得する例について説明する。なお、第5実施形態に係る情報処理装置200Aは、領域取得部225の動作を除き、第4実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 図20は、センサ150の被写界深度を説明するための図である。センサ150(カメラ)には、レンズの絞りに応じた被写界深度(被写体がぼけずに撮影できる奥行きの範囲)が存在する。カメラの光学系には、合焦することで被写体を最も解像度高く鮮明に撮影することができる焦点距離fが存在する。例えば、図20に示す面M52は、合焦した面、すなわちピントが合っており被写体を最も解像度高く鮮明に撮影することができる面である。また、面M53から面M51の範囲が、被写体がぼけずに撮影できる奥行きの範囲(被写界深度)である。
 マイクロスコープ100のようにヘッドマウント部10を対象Sに接触させて撮像する場合、対象Sまでの距離が短くなるためセンサ150に入射する光量が少なくなってしまう。そのため、センサ150に入射する光量をできるだけ増やすために、マイクロスコープ100では絞り値Fを小さく、すなわち絞りを開放して撮像を行う。そのため、図21に示すように被写界深度P1が浅くなる。なお、図21は、本開示の第5実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。
 図21に示すように、マイクロスコープ100の被写界深度P1が浅いため、被写界深度P1に含まれる対象S、すなわち大まかな形状においてセンサ150からの距離がほぼ同じである対象Sの表面SD1はぼけずに撮影することができる。一方、被写界深度P1に含まれない対象S、すなわちセンサ150からの距離が表面SD1とは異なる表面SD2、SD3はぼやけて撮像されてしまう。
 そこで、領域取得部225は、被写界深度P1に含まれる撮像領域を平坦領域として取得する。領域取得部225は、ピントがあってぼけずに撮像された領域を撮像画像から取得することで、平坦領域を取得する。かかる点について図22を用いて説明する。図22は、本開示の第5実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。
 領域取得部225は、取得部221が取得した撮像画像M54を複数のブロックに分割する。なお、ここで分割するブロックのサイズは、上述した第4実施形態のブロックのサイズと同じであっても異なっていてもよい。
 続いて、領域取得部225は、分割したブロックごとにコントラスト値を算出する。コントラスト値contrastは、contrast=(Lmax-Lmin)/(Lmax+Lmin)で求まる値である。なお、Lmaxは、ブロック内の輝度値Lの最大値であり、Lmax=max(L(x、y))である。また、Lminは、ブロック内の輝度値Lの最小値であり、Lmin=min(L(x、y))である。
 ピントがあってぼけずに撮像された領域はコントラスト値contrastが高く、ピントがあっておらずぼやけて撮像された領域はコントラスト値contrastが低い。そこで、領域取得部225は、算出したコントラスト値contrastに基づいて平坦領域を取得する。具体的に、領域取得部225は、算出したコントラスト値contrastと閾値th3とをブロックごとに比較する。領域取得部225は、図22に示すように、コントラスト値contrastが閾値th3以上であるブロックを、深度算出を行う平坦領域として抽出する。
 法線算出部222および深度算出部223は、領域取得部225が取得した平坦領域の法線情報および深度情報を算出する。算出方法は第1実施形態と同じである。なお、法線算出部222および深度算出部223は、ブロック単位で法線情報および深度情報を算出してもよい。あるいは、法線算出部222および深度算出部223は、領域取得部225が平坦領域として抽出した領域、すなわちコントラスト値contrastが閾値th3以上である複数のブロックをまとめて、法線情報および深度情報を算出してもよい。
 以上のように、第5実施形態では、情報処理装置200Aは、撮像画像M54を複数のブロックに分割する。情報処理装置200Aは、分割したブロックごとに算出したコントラスト値contrastに応じて平坦領域を取得する。
 このように、情報処理装置200Aは、撮像画像M54のコントラスト値contrastに応じて平坦領域を取得することで、上述した式(1)~式(3)における仮定1、仮定2を満たす平坦領域における深度を算出することができる。これにより、第5実施形態に係る情報処理装置200Aは、形状計測の精度を向上させることができる。
 <7.第6実施形態>
 上記第5実施形態では、領域取得部225が1枚の撮像画像を複数のブロックに分割し、分割したブロックごとのコントラスト値に応じて平坦領域を取得する場合を示した。上記例以外にも、情報処理装置200Aは、被写体深度が異なる複数の撮像画像をそれぞれ複数のブロックに分割し、分割したブロックごとのコントラスト値に応じて平坦領域を取得してもよい。そこで、第6実施形態では、情報処理装置200Aが複数の撮像画像それぞれのブロックごとのコントラスト値に応じて平坦領域を取得する例について説明する。なお、第6実施形態に係る情報処理装置200Aは、取得部221および領域取得部225の動作を除き、第5実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 図23は、本開示の第6実施形態に係る取得部221が取得する複数の撮像画像について説明するための図である。取得部221は、被写体深度が異なる複数の撮像画像を取得する。図23に示すように、マイクロスコープ100のセンサ150を動かすことで、マイクロスコープ100は、被写体深度(フォーカス面)がそれぞれ異なる撮像画像を複数取得する。図23の例では、マイクロスコープ100が、センサ150を上下に動かしながら対象Sを3回撮像することで3枚の撮像画像を撮像する。マイクロスコープ100は、例えば、1回目に被写体深度がセンサ150に最も近い撮像画像を撮像し、3回目に被写体深度がセンサ150から最も遠い撮像画像を撮像する。マイクロスコープ100は、例えば2回目に被写体深度が1回目と2回目の中間に位置する撮像画像を取得する。
 なお、図23に示す被写体深度と撮像枚数は一例であり、これに限定されない。例えば、マイクロスコープ100が2枚、あるいは、4枚以上の撮像画像を撮像するようにしてもよい。また、各撮像時の被写体深度の範囲が連続、あるいは、一部重複していてもよい。
 取得部221は、例えばマイクロスコープ100を制御して、被写体深度がそれぞれ異なる撮像画像M61~M63を取得する。
 図24は、本開示の第6実施形態に係る領域取得部225による平坦領域の取得について説明するための図である。ここでは、取得部221が、マイクロスコープ100を制御して、図23に示すように被写体深度が異なる撮像画像を撮像させることで、図24に示すような撮像画像M61~M63を取得するものとする。
 領域取得部225は、撮像画像M61~M63それぞれをブロックに分割する。領域取得部225は、分割したブロックごとにコントラスト値contrastを算出する。領域取得部225は、算出したブロックのコントラスト値contrastと閾値th3とを比較し、コントラスト値contrastが閾値th3以上であるブロックを平坦領域として抽出する。
 例えば、図24では、領域取得部225は、撮像画像M61のコントラスト値contrastが閾値th3以上であるブロックを含む領域M61Aを撮像画像M61から抽出する。同様に、領域取得部225は、撮像画像M62のコントラスト値contrastが閾値th3以上であるブロックを含む領域M62Aを撮像画像M62から抽出する。また、撮像画像M63のコントラスト値contrastが閾値th3以上であるブロックを含む領域M63Aを撮像画像M63から抽出する。
 最後に、領域取得部225は、抽出した領域M61A~M63Aを合成して平坦領域を含む画像M64を生成する。換言すると、領域取得部225は、撮像画像M61~M63のピントが合っており、ぼけていない領域を合成して画像M64を生成する。
 なお、画像M64を平坦領域として、法線算出部222および深度算出部223が実行する処理は第5実施形態と同じである。
 以上のように、第6実施形態に係る情報処理装置200Aは、被写体深度が異なる複数の撮像画像を取得する。情報処理装置200Aは、取得した複数の撮像画像をそれぞれ複数のブロックに分割する。情報処理装置200Aは、分割したブロックごとのコントラスト値contrastに応じて平坦領域を取得する。
 これにより、情報処理装置200Aは、コントラスト値contrastに応じて平坦領域を取得することで、上述した式(1)~式(3)における仮定1、仮定2を満たす平坦領域における深度を算出することができる。また、情報処理装置200Aは、複数の撮像画像から平坦領域を取得することで、コントラスト値contrastに応じた平坦領域を拡大することができる。
 なお、ここでは、領域取得部225が領域M61A~M63Aを合成するとしたが、これに限定されない。例えば、法線算出部222および深度算出部223がそれぞれ領域M61A~M63Aごとに法線情報および深度情報を算出し、例えば表示制御部224が表示部に結果を表示させるときに、領域M61A~M63Aを合成した結果を表示するようにしてもよい。
 <8.第7実施形態>
 上記第1~6実施形態では、領域取得部225が撮像画像から平坦領域を取得する場合を示した。上記例以外にも、法線算出部222が算出した法線情報から高周波成分を抽出するようにしてもよい。そこで、第7実施形態では、法線情報から高周波成分を抽出して深度情報を算出する例について説明する。
 図25は、本開示の第7実施形態に係る情報処理装置200Bの構成例を示す図である。図25に示す情報処理装置200Bは、制御部220Bが領域取得部225を備えておらず、法線周波数分離部226Bを備える点を除き、図6に示す情報処理装置200Aと同じ構成要素を有する。
 法線算出部222は、取得部221が取得した撮像画像の各画素における法線情報を算出する。
 法線周波数分離部226Bは、法線情報から高周波成分(以下、法線高周波ともいう)を分離する。ここで、上述したように、深度算出部223の算出対象である深度情報は、対象Sの局所的な凹凸形状に関する情報である。換言すると、深度算出部223が算出する深度情報は、対象Sの表面の形状の高周波成分であり、低周波成分を含んでいないものである。法線周波数分離部226は、法線情報から大まかな形状の法線情報である低周波成分を除去して法線高周波を生成する。法線高周波は、低周波成分(大まかな形状の法線情報)を含まないため、上述した式(1)~式(3)の仮定1、仮定2を満たすものとなる。
 図26は、本開示の第7実施形態に係る法線周波数分離部226Bによる周波数分離を説明するための図である。
 例えば、図26の上図に示すような法線情報Xが法線周波数分離部226Bに入力されたとする。なお、図26では、実際の対象Sの表面を点線で、対象Sの表面の大まかな形状を実線で、対象Sの表面の法線を矢印で示している。
 この場合、法線周波数分離部226Bは、例えば畳み込みフィルタF(X)を用いて法線情報の高周波成分と低周波成分を分離し、図26の中図に示す法線高周波Yを抽出する。なお、畳み込みフィルタF(X)は、法線情報を入力としたときに高周波成分を抽出するように予め設計されたフィルタである。
 深度算出部223は、法線周波数分離部226Bが分離した法線高周波を上述した式(1)~式(3)等を用いて式変換することで、仮定1、仮定2を満たす状態で深度情報Z(図26の下図参照)を算出することができる。
 このように、情報処理装置200Bは、法線情報から高周波成分を抽出し、抽出した高周波成分に基づいて深度情報を算出する。
 これにより、情報処理装置200Bは、仮定1、仮定2を満たす状態で上述した(1)~式(3)等を用いた式変換を行えるため、深度情報の算出精度の低下を抑制することができる。そのため、情報処理装置200Bは、周波数分離を行わない場合に比べて、形状計測の精度を向上させることができる。
 <9.第8実施形態>
 上記第7実施形態では、法線情報の高周波成分から深度情報を算出する場合を示した。上記例以外にも、法線情報の高周波成分に加え、低周波成分も用いて深度情報を算出するようにしてもよい。そこで、第8実施形態では、法線情報から高周波成分および低周波成分を分離して深度情報を算出する例について説明する。
 図27は、本開示の第8実施形態に係る情報処理装置200Cの構成例を示す図である。図27に示す情報処理装置200Cは、制御部220Cの法線周波数分離部226Cおよび深度算出部223Cを除き、図25に示す情報処理装置200Bと同じ構成要素を有する。
 法線周波数分離部226Cは、法線情報から高周波成分と低周波成分(以下、法線低周波ともいう)を分離して、それぞれ深度算出部223Cに出力する。上述したように、対象Sの局所的な凹凸形状が法線情報の高周波成分に寄与する。また、対象Sの大まかな形状が法線情報の低周波成分に寄与する。かかる点について図28を用いて説明する。
 図28は、本開示の第8実施形態に係る法線周波数分離部226Cによる周波数分離を説明するための図である。
 例えば、図28(a)に示すような法線情報Xが法線周波数分離部226Cに入力されたとする。なお、図28では、実際の対象Sの表面を点線で、対象Sの表面の大まかな形状を実線で、対象Sの表面の法線を矢印で示している。
 この場合、法線周波数分離部226Cは、例えば畳み込みフィルタF(X)を用いて法線情報の高周波成分を抽出し、法線高周波YH=F(X)を抽出する。図28(b)の上図に示すように、法線高周波YHで表される表面形状は、大まかな形状(法線低周波YL)が除去され、平坦な面に局所的な凹凸がある形状となる。なお、畳み込みフィルタF(X)は、法線情報を入力としたときに高周波成分を抽出するように予め設計されたフィルタである。
 また、法線周波数分離部226Cは、法線情報Xから法線高周波YHを減算することで法線低周波YLを抽出する。すなわち、法線周波数分離部226Cは、法線低周波YL=X-YH=X-F(X)を算出することで、法線低周波YLを抽出する。図28(b)の下図に示すように、法線低周波YLで表される表面形状は、局所的な凹凸形状が除去された大まかな形状となる。
 深度算出部223Cは、法線高周波YHおよび法線低周波YLそれぞれに対して式変換を行い、図28(c)に示すように、深度情報の高周波成分ZH(以下、深度高周波ともいう)および低周波成分ZL(以下、深度低周波ともいう)を算出する。
 ここで、法線高周波YHは、上述したように、式変換の仮定1、仮定2を満たす状態であるため、深度算出部223Cは、精度よく深度高周波ZHを算出できる。
 また、深度算出部223Cは、上述した式(1)~式(3)のλおよびμをそれぞれゼロ(λ=0、μ=0)として、法線低周波YLの式変換を行うことで、深度低周波ZLを算出する。このように、cost項の係数をゼロにすることで、仮定1、仮定2を排除した状態で深度低周波ZLを算出することができる。なお、法線低周波YLは、法線高周波YHが除去された法線情報Xの低周波成分であり、対象Sの表面形状のうち局所的な凹凸形状を除去した状態を表す法線情報である。そのため、深度算出部223Cは、仮定1、仮定2を除去した状態で法線低周波YLの式変換を行っても、精度よく深度低周波ZLを算出することができる。
 深度算出部223Cは、算出した深度高周波ZHおよび深度低周波ZLを合成することで、図28(d)に示す深度情報Zを算出する。
 このように、情報処理装置200Cは、撮像画像から算出した法線情報を周波数分離する。情報処理装置200Cは、分離した周波数ごとに深度情報を算出し、算出した深度情報を合成して対象Sの深度情報を算出する。
 これにより、情報処理装置200Cは、局所的な凹凸形状の深度に加え、大まかな形状の深度を算出することができる。また、情報処理装置200Cは、これらの深度を合成することで、対象Sの深度情報をより精度よく算出することができる。
 なお、ここでは、深度算出部223Cが、上述した式(1)~式(3)のλおよびμをそれぞれゼロ(λ=0、μ=0)として、法線低周波YLの式変換を行うとしたが、これに限定されない。深度算出部223Cが仮定1および仮定2の影響が小さい状態で深度低周波ZLを算出できればよく、λおよびμの値を、仮定1および仮定2が深度低周波ZLの算出に影響を与えない程度に小さい値としてもよい。
 <10.第9実施形態>
 上記第1実施形態では、真値である画像M16を用いて学習器300の学習を行う場合を示した。上記例以外にも、情報処理装置200Aは、画像M16をシフトさせた画像を正解データとして学習器300の学習を行ってもよい。そこで、第9実施形態では、情報処理装置200Aが画像M16をシフトさせた画像を正解データとして学習器300の学習を行う例について図29を用いて説明する。図29は、第9実施形態に係る学習器300の学習方法について説明するための図である。なお、第9実施形態に係る情報処理装置200Aは、法線算出部222の動作を除き、第1実施形態に係る情報処理装置200Aと同じ構成および動作であるため、同一符号を付し、一部の説明を省略する。
 上述したように、法線算出部222は、撮像画像M14を入力データとし、法線画像M16を正解データ(真値)として学習器300の重みを更新して学習を行う。ここで、撮像画像M14は、例えばマイクロスコープ100等のRGB画像を撮像するデバイスによって撮像される。一方、法線画像M16は、例えば非接触3D計測器のように直接対象Sの表面形状を計測するデバイスが計測した形状情報に基づいて生成される。
 このように、入力画像を取得するデバイスの光学系と正解画像を取得するデバイスの光学系とが異なっていると、入力画像と正解画像の位置合わせが難しくなってしまう。そのため、入力画像を学習器300に入力することで得られる出力画像および正解画像が数画素ずれてしまうことがある。このように、出力画像と正解画像とがずれた状態で学習器300の学習を行うと、入力画像に対してぼけた出力画像を出力する学習器300が生成されてしまう。
 そこで、図29に示すように、法線算出部222は、学習器(CNN)300のフィルタ係数(重み)を決める学習時に、法線画像M16をx方向およびy方向にシフトさせ、シフト後の法線画像M16と出力画像M15との類似度を算出する。なお、法線算出部222は、法線画像M16をx方向において0から±xの範囲でシフトさせ、y方向において0から±yの範囲でシフトさせるものとする。
 法線算出部222は、例えばシフト後の法線画像M16と出力画像M15との最小二乗誤差をシフト量ごとに算出する。法線算出部222は、算出した最小二乗誤差のうち最小値を最終的なロスとして、学習器300の重みを更新する。なお、最小二乗誤差のかわりに、シフト後の法線画像M16と出力画像M15との最小平均誤差をシフト量ごとに算出し、算出した最小平均誤差のうち最小値を最終的なロスとしてもよい。
 このように、学習器300は、真値画像(法線画像)をシフトしたシフト画像(シフト後の法線画像)と出力画像M15との類似度に応じて重みが更新されて生成される。より具体的には、学習器300は、真値画像(法線画像)を異なるシフト量(画素数)でシフトした複数のシフト画像(シフト後の法線画像、正解候補画像ともいう)それぞれと、出力画像M15との類似度に応じて重みが更新されて生成される。
 これにより、学習器300の出力画像M15と法線画像M16との位置合わせを行わなくても、両方の画像の位置があった状態で学習器300の重みを更新することができる。これにより、学習器300の学習精度をより向上させることができる。また、法線算出部222がかかる学習器300を用いて法線情報を算出することで、より精度よく法線情報を算出することができ、情報処理装置200Aの形状計測の精度をより向上させることができる。
 <11.第10実施形態>
 上記第1実施形態では、撮像画像から平坦領域を取得する場合を示した。上記例以外にも、情報処理装置200Aは、撮像画像を複数の領域に分割し、分割した領域ごとに平坦領域を取得するようにしてもよい。そこで、第10実施形態では、情報処理装置200Aが撮像画像を複数の領域に分割し、分割した領域ごとに平坦領域を取得する例について図30を用いて説明する。図30は、本開示の第10実施形態に係る情報処理装置200Aの制御部220Dの構成例を示す図である。
 図30に示すように、情報処理装置200Aの制御部220Dは、領域取得部225の代わりに領域取得部225Dを備える点、および、深度合成部227をさらに備える点を除き、図6に示す制御部220と同じである。
 図30に示すように、領域取得部225Dは、取得部221が取得した撮像画像M71を3つの分割領域M71A~M71Cに分割する。なお、領域取得部225Dが分割する領域の数は、3つに限定されず、2つであっても4つ以上であってもよい。
 領域取得部225Dは、分割領域M71A~M71Cごとに分割平坦領域M72A~M72Cを取得する。法線算出部222は、分割平坦領域M72A~M72Cそれぞれに基づき、法線領域画像M73A~M73Cを算出し、深度算出部223は、法線領域画像M73A~M73Cに基づき、深度領域画像M74A~M74Cを算出する。
 深度合成部227は、深度領域画像M74A~M74Cを合成して深度画像M75を生成し、表示制御部224に出力する。
 なお、深度合成部227は、深度領域画像M74A~M74のほかにも、分割平坦領域M72A~M72Cの合成や、法線領域画像M73A~M73Cの合成を行うようにしてもよい。また、各部における処理は、領域ごとに順次行われてもよく、領域ごとに並列に行われていてもよい。
 このように、情報処理装置200Aは、撮像画像を複数の分割領域M71A~M71Cに分割し、分割領域M71A~M71Cごとに分割平坦領域M72A~M72Cを取得する。また、情報処理装置200Aは、分割平坦領域M72A~M72Cごとに法線情報および深度情報を算出する。
 これにより、各部の処理対象である撮像画像(領域)のサイズを小さくすることができ、処理負担を軽減したり、処理速度を向上させたりすることができる。
 <12.その他の実施形態>
 上述した各実施形態に係る処理は、上記各実施形態以外にも種々の異なる形態にて実施されてよい。
 上記各実施形態では、ヘッドマウント部10がマイクロスコープ100の先端にマウントされる筒部である例を示した。しかし、ヘッドマウント部10は、対象Sとマイクロスコープ100のセンサ150との距離を一定にするための構造物であれば、必ずしも筒状の形態でなくてもよい。
 <13.適応例>
 図31を用いて、第1~第10実施形態に係る情報処理装置200A~200Cの適用例について説明する。図31は、本開示に係る技術(本技術)が適用され得る、カプセル型内視鏡を用いた患者の体内情報取得システムの概略的な構成の一例を示すブロック図である。
 体内情報取得システム10001は、カプセル型内視鏡10100と、外部制御装置10200とから構成される。
 カプセル型内視鏡10100は、検査時に、患者によって飲み込まれる。カプセル型内視鏡10100は、撮像機能および無線通信機能を有し、患者から自然排出されるまでの間、胃や腸等の臓器の内部を蠕動運動等によって移動しつつ、当該臓器の内部の画像(以下、体内画像ともいう)を所定の間隔で順次撮像し、その体内画像についての情報を体外の外部制御装置10200に順次無線送信する。
 外部制御装置10200は、体内情報取得システム10001の動作を統括的に制御する。また、外部制御装置10200は、カプセル型内視鏡10100から送信されてくる体内画像についての情報を受信し、受信した体内画像についての情報に基づいて、表示装置(図示しない)に当該体内画像を表示するための画像データを生成する。
 体内情報取得システム10001では、このようにして、カプセル型内視鏡10100が飲み込まれてから排出されるまでの間、患者の体内の様子を撮像した体内画像を随時得ることができる。
 カプセル型内視鏡10100と外部制御装置10200の構成および機能についてより詳細に説明する。
 カプセル型内視鏡10100は、カプセル型の筐体10101を有し、その筐体10101内には、光源部10111、撮像部10112、画像処理部10113、無線通信部10114、給電部10115、電源部10116、および制御部10117が収納されている。
 光源部10111は、例えばLED(Light Emitting Diode)等の光源から構成され、撮像部10112の撮像視野に対して光を照射する。
 撮像部10112は、撮像素子、および当該撮像素子の前段に設けられる複数のレンズからなる光学系から構成される。観察対象である体組織に照射された光の反射光(以下、観察光という)は、当該光学系によって集光され、当該撮像素子に入射する。撮像部10112では、撮像素子において、そこに入射した観察光が光電変換され、その観察光に対応する画像信号が生成される。撮像部10112によって生成された画像信号は、画像処理部10113に提供される。
 画像処理部10113は、CPUやGPU(Graphics Processing Unit)等のプロセッサによって構成され、撮像部10112によって生成された画像信号に対して各種の信号処理を行う。画像処理部10113は、信号処理を施した画像信号を、RAWデータとして無線通信部10114に提供する。
 無線通信部10114は、画像処理部10113によって信号処理が施された画像信号に対して変調処理等の所定の処理を行い、その画像信号を、アンテナ10114Aを介して外部制御装置10200に送信する。また、無線通信部10114は、外部制御装置10200から、カプセル型内視鏡10100の駆動制御に関する制御信号を、アンテナ10114Aを介して受信する。無線通信部10114は、外部制御装置10200から受信した制御信号を制御部10117に提供する。
 給電部10115は、受電用のアンテナコイル、当該アンテナコイルに発生した電流から電力を再生する電力再生回路、および昇圧回路等から構成される。給電部10115では、いわゆる非接触充電の原理を用いて電力が生成される。
 電源部10116は、二次電池によって構成され、給電部10115によって生成された電力を蓄電する。図31では、図面が煩雑になることを避けるために、電源部10116からの電力の供給先を示す矢印等の図示を省略しているが、電源部10116に蓄電された電力は、光源部10111、撮像部10112、画像処理部10113、無線通信部10114、および制御部10117に供給され、これらの駆動に用いられ得る。
 制御部10117は、CPU等のプロセッサによって構成され、光源部10111、撮像部10112、画像処理部10113、無線通信部10114、および、給電部10115の駆動を、外部制御装置10200から送信される制御信号に従って適宜制御する。
 外部制御装置10200は、CPU、GPU等のプロセッサ、又はプロセッサとメモリ等の記憶素子が混載されたマイクロコンピュータ若しくは制御基板等で構成される。外部制御装置10200は、カプセル型内視鏡10100の制御部10117に対して制御信号を、アンテナ10200Aを介して送信することにより、カプセル型内視鏡10100の動作を制御する。カプセル型内視鏡10100では、例えば、外部制御装置10200からの制御信号により、光源部10111における観察対象に対する光の照射条件が変更され得る。また、外部制御装置10200からの制御信号により、撮像条件(例えば、撮像部10112におけるフレームレート、露出値等)が変更され得る。また、外部制御装置10200からの制御信号により、画像処理部10113における処理の内容や、無線通信部10114が画像信号を送信する条件(例えば、送信間隔、送信画像数等)が変更されてもよい。
 また、外部制御装置10200は、カプセル型内視鏡10100から送信される画像信号に対して、各種の画像処理を施し、撮像された体内画像を表示装置に表示するための画像データを生成する。当該画像処理としては、例えば現像処理(デモザイク処理)、高画質化処理(帯域強調処理、超解像処理、ノイズリダクション処理、手ブレ補正処理等)、拡大処理(電子ズーム処理)等、それぞれ単独で、あるいは、組み合わせて、各種の信号処理を行うことができる。外部制御装置10200は、表示装置の駆動を制御して、生成した画像データに基づいて撮像された体内画像を表示させる。あるいは、外部制御装置10200は、生成した画像データを記録装置(図示しない)に記録させたり、印刷装置(図示しない)に印刷出力させたりしてもよい。
 以上、本開示に係る技術が適用され得る体内情報取得システムの一例について説明した。本開示に係る技術は、以上説明した構成のうち、例えば、外部制御装置10200に適用され得る。外部制御装置10200に本開示に係る技術を適用することにより、カプセル型内視鏡10100が撮像した体内画像から体内の表面形状を計測することができる。
(内視鏡手術システムへの適用例)
 本開示に係る技術は、さらに、内視鏡手術システムに適用されてもよい。図32は、本開示に係る技術(本技術)が適用され得る内視鏡手術システムの概略的な構成の一例を示す図である。
 図32では、術者(医師)11131が、内視鏡手術システム11000を用いて、患者ベッド11133上の患者11132に手術を行っている様子が図示されている。図示するように、内視鏡手術システム11000は、内視鏡11100と、気腹チューブ11111やエネルギー処置具11112等の、その他の術具11110と、内視鏡11100を支持する支持アーム装置11120と、内視鏡下手術のための各種の装置が搭載されたカート11200と、から構成される。
 内視鏡11100は、先端から所定の長さの領域が患者11132の体腔内に挿入される鏡筒11101と、鏡筒11101の基端に接続されるカメラヘッド11102と、から構成される。図示する例では、硬性の鏡筒11101を有するいわゆる硬性鏡として構成される内視鏡11100を図示しているが、内視鏡11100は、軟性の鏡筒を有するいわゆる軟性鏡として構成されてもよい。
 鏡筒11101の先端には、対物レンズが嵌め込まれた開口部が設けられている。内視鏡11100には光源装置11203が接続されており、当該光源装置11203によって生成された光が、鏡筒11101の内部に延設されるライトガイドによって当該鏡筒の先端まで導光され、対物レンズを介して患者11132の体腔内の観察対象に向かって照射される。なお、内視鏡11100は、直視鏡であってもよいし、斜視鏡又は側視鏡であってもよい。
 カメラヘッド11102の内部には光学系および撮像素子が設けられており、観察対象からの反射光(観察光)は当該光学系によって当該撮像素子に集光される。当該撮像素子によって観察光が光電変換され、観察光に対応する電気信号、すなわち観察像に対応する画像信号が生成される。当該画像信号は、RAWデータとしてCCU(カメラコントロールユニット)11201に送信される。
 CCU11201は、CPUやGPU等によって構成され、内視鏡11100および表示装置11202の動作を統括的に制御する。さらに、CCU11201は、カメラヘッド11102から画像信号を受け取り、その画像信号に対して、例えば現像処理(デモザイク処理)等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。
 表示装置11202は、CCU11201からの制御により、当該CCU11201によって画像処理が施された画像信号に基づく画像を表示する。
 光源装置11203は、例えばLED(Light Emitting Diode)等の光源から構成され、術部等を撮影する際の照射光を内視鏡11100に供給する。
 入力装置11204は、内視鏡手術システム11000に対する入力インタフェースである。ユーザは、入力装置11204を介して、内視鏡手術システム11000に対して各種の情報の入力や指示入力を行うことができる。例えば、ユーザは、内視鏡11100による撮像条件(照射光の種類、倍率および焦点距離等)を変更する旨の指示等を入力する。
 処置具制御装置11205は、組織の焼灼、切開又は血管の封止等のためのエネルギー処置具11112の駆動を制御する。気腹装置11206は、内視鏡11100による視野の確保および術者の作業空間の確保の目的で、患者11132の体腔を膨らめるために、気腹チューブ11111を介して当該体腔内にガスを送り込む。レコーダ11207は、手術に関する各種の情報を記録可能な装置である。プリンタ11208は、手術に関する各種の情報を、テキスト、画像又はグラフ等各種の形式で印刷可能な装置である。
 なお、内視鏡11100に術部を撮影する際の照射光を供給する光源装置11203は、例えばLED、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成することができる。RGBレーザ光源の組み合わせにより白色光源が構成される場合には、各色(各波長)の出力強度および出力タイミングを高精度に制御することができるため、光源装置11203において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、RGBレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド11102の撮像素子の駆動を制御することにより、RGBそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。
 また、光源装置11203は、出力する光の強度を所定の時間ごとに変更するようにその駆動が制御されてもよい。その光の強度の変更のタイミングに同期してカメラヘッド11102の撮像素子の駆動を制御して時分割で画像を取得し、その画像を合成することにより、いわゆる黒つぶれおよび白とびのない高ダイナミックレンジの画像を生成することができる。
 また、光源装置11203は、特殊光観察に対応した所定の波長帯域の光を供給可能に構成されてもよい。特殊光観察では、例えば、体組織における光の吸収の波長依存性を利用して、通常の観察時における照射光(すなわち、白色光)に比べて狭帯域の光を照射することにより、粘膜表層の血管等の所定の組織を高コントラストで撮影する、いわゆる狭帯域光観察(Narrow Band Imaging)が行われる。あるいは、特殊光観察では、励起光を照射することにより発生する蛍光により画像を得る蛍光観察が行われてもよい。蛍光観察では、体組織に励起光を照射し当該体組織からの蛍光を観察すること(自家蛍光観察)、又はインドシアニングリーン(ICG)等の試薬を体組織に局注するとともに当該体組織にその試薬の蛍光波長に対応した励起光を照射し蛍光像を得ること等を行うことができる。光源装置11203は、このような特殊光観察に対応した狭帯域光および/又は励起光を供給可能に構成され得る。
 図33は、図32に示すカメラヘッド11102およびCCU11201の機能構成の一例を示すブロック図である。
 カメラヘッド11102は、レンズユニット11401と、撮像部11402と、駆動部11403と、通信部11404と、カメラヘッド制御部11405と、を有する。CCU11201は、通信部11411と、画像処理部11412と、制御部11413と、を有する。カメラヘッド11102とCCU11201とは、伝送ケーブル11400によって互いに通信可能に接続されている。
 レンズユニット11401は、鏡筒11101との接続部に設けられる光学系である。鏡筒11101の先端から取り込まれた観察光は、カメラヘッド11102まで導光され、当該レンズユニット11401に入射する。レンズユニット11401は、ズームレンズおよびフォーカスレンズを含む複数のレンズが組み合わされて構成される。
 撮像部11402は、撮像素子で構成される。撮像部11402を構成する撮像素子は、1つ(いわゆる単板式)であってもよいし、複数(いわゆる多板式)であってもよい。撮像部11402が多板式で構成される場合には、例えば各撮像素子によってRGBそれぞれに対応する画像信号が生成され、それらが合成されることによりカラー画像が得られてもよい。あるいは、撮像部11402は、3D(Dimensional)表示に対応する右目用および左目用の画像信号をそれぞれ取得するための1対の撮像素子を有するように構成されてもよい。3D表示が行われることにより、術者11131は術部における生体組織の奥行きをより正確に把握することが可能になる。なお、撮像部11402が多板式で構成される場合には、各撮像素子に対応して、レンズユニット11401も複数系統設けられ得る。
 また、撮像部11402は、必ずしもカメラヘッド11102に設けられなくてもよい。例えば、撮像部11402は、鏡筒11101の内部に、対物レンズの直後に設けられてもよい。
 駆動部11403は、アクチュエータによって構成され、カメラヘッド制御部11405からの制御により、レンズユニット11401のズームレンズおよびフォーカスレンズを光軸に沿って所定の距離だけ移動させる。これにより、撮像部11402による撮像画像の倍率および焦点が適宜調整され得る。
 通信部11404は、CCU11201との間で各種の情報を送受信するための通信装置によって構成される。通信部11404は、撮像部11402から得た画像信号をRAWデータとして伝送ケーブル11400を介してCCU11201に送信する。
 また、通信部11404は、CCU11201から、カメラヘッド11102の駆動を制御するための制御信号を受信し、カメラヘッド制御部11405に供給する。当該制御信号には、例えば、撮像画像のフレームレートを指定する旨の情報、撮像時の露出値を指定する旨の情報、並びに/又は撮像画像の倍率および焦点を指定する旨の情報等、撮像条件に関する情報が含まれる。
 なお、上記のフレームレートや露出値、倍率、焦点等の撮像条件は、ユーザによって適宜指定されてもよいし、取得された画像信号に基づいてCCU11201の制御部11413によって自動的に設定されてもよい。後者の場合には、いわゆるAE(Auto Exposure)機能、AF(Auto Focus)機能およびAWB(Auto White Balance)機能が内視鏡11100に搭載されていることになる。
 カメラヘッド制御部11405は、通信部11404を介して受信したCCU11201からの制御信号に基づいて、カメラヘッド11102の駆動を制御する。
 通信部11411は、カメラヘッド11102との間で各種の情報を送受信するための通信装置によって構成される。通信部11411は、カメラヘッド11102から、伝送ケーブル11400を介して送信される画像信号を受信する。
 また、通信部11411は、カメラヘッド11102に対して、カメラヘッド11102の駆動を制御するための制御信号を送信する。画像信号や制御信号は、電気通信や光通信等によって送信することができる。
 画像処理部11412は、カメラヘッド11102から送信されたRAWデータである画像信号に対して各種の画像処理を施す。
 制御部11413は、内視鏡11100による術部等の撮像、および、術部等の撮像により得られる撮像画像の表示に関する各種の制御を行う。例えば、制御部11413は、カメラヘッド11102の駆動を制御するための制御信号を生成する。
 また、制御部11413は、画像処理部11412によって画像処理が施された画像信号に基づいて、術部等が映った撮像画像を表示装置11202に表示させる。この際、制御部11413は、各種の画像認識技術を用いて撮像画像内における各種の物体を認識してもよい。例えば、制御部11413は、撮像画像に含まれる物体のエッジの形状や色等を検出することにより、鉗子等の術具、特定の生体部位、出血、エネルギー処置具11112の使用時のミスト等を認識することができる。制御部11413は、表示装置11202に撮像画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を当該術部の画像に重畳表示させてもよい。手術支援情報が重畳表示され、術者11131に提示されることにより、術者11131の負担を軽減することや、術者11131が確実に手術を進めることが可能になる。
 カメラヘッド11102およびCCU11201を接続する伝送ケーブル11400は、電気信号の通信に対応した電気信号ケーブル、光通信に対応した光ファイバ、又はこれらの複合ケーブルである。
 ここで、図33の例では、伝送ケーブル11400を用いて有線で通信が行われていたが、カメラヘッド11102とCCU11201との間の通信は無線で行われてもよい。
 以上、本開示に係る技術が適用され得る内視鏡手術システムの一例について説明した。本開示に係る技術は、以上説明した構成のうち、例えば、CCU11201に適用され得る。具体的には、上述した制御部220、220B、220Cは、画像処理部11412に適用することができる。画像処理部11412に本開示に係る技術を適用することにより、内視鏡11100が撮像した体内画像から体内の表面形状を計測することができる。
 なお、ここでは、一例として内視鏡手術システムについて説明したが、本開示に係る技術は、その他、例えば、顕微鏡手術システム等に適用されてもよい。
 <14.補足>
 以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
 上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
 また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
 また、上述してきた各実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、上記実施形態では、画像処理装置としてマイクロスコープを例に挙げたが、本開示の画像処理は、マイクロスコープ以外の撮影機器にも適用可能である。
 また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示にかかる技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
 なお、以下のような構成も本開示の技術的範囲に属する。
(1)
 対象をセンサが撮像した撮像画像を取得し、
 前記撮像画像は、それぞれ異なる位置に配置される複数の光源から前記対象に照射された光の反射光から得られる画像であり、
 前記撮像画像の輝度値に基づき、前記撮像画像から平坦領域を抽出し、
 前記センサに関する情報および前記撮像画像の前記平坦領域に基づき、前記対象の表面の形状に関する形状情報を算出する制御部、
 を備える情報処理装置。
(2)
 前記制御部は、
 複数の前記光源から同時に前記対象に照射された前記光の前記反射光から得られる前記撮像画像を取得する、
 (1)に記載の情報処理装置。
(3)
 前記制御部は、
 前記撮像画像の輝度値が、所定閾値以上である領域を前記平坦領域とする、
 (1)または(2)に記載の情報処理装置。
(4)
 前記制御部は、
 複数の前記光源の1つから前記対象に照射された前記光の前記反射光から得られる前記撮像画像を、前記光源ごとに取得し、
 前記光源ごとに取得した複数の前記撮像画像間における前記輝度値の変化が所定閾値未満である領域を前記平坦領域として抽出する、
 (1)に記載の情報処理装置。
(5)
 前記制御部は、
 前記撮像画像にスムージング処理を行ってスムージング画像を生成し、
 前記スムージング画像に基づき、前記撮像画像から前記平坦領域を抽出する、
 (1)~(4)のいずれか1つに記載の情報処理装置。
(6)
 前記制御部は、
 前記撮像画像を複数の分割領域に分割し、
 複数の前記分割領域ごとに前記平坦領域を抽出し、形状情報を算出する、
 (1)~(5)のいずれか1つに記載の情報処理装置。
(7)
 前記制御部は、
 前記撮像画像における前記平坦領域の法線情報を算出し、
 前記法線情報を機械学習により生成されたモデルに入力して前記形状情報を得る、
 (1)~(6)のいずれか1つに記載の情報処理装置。
(8)
 前記モデルは、
 複数の正解候補画像と前記モデルの出力データとの比較結果に基づいて重みを更新することで生成され、
 複数の前記正解候補画像は、正解画像をそれぞれ異なる画素数ずつずらして生成される、
 (7)に記載の情報処理装置。
(9)
 前記モデルは、
 複数の正解候補画像と前記出力データとの最小二乗誤差をそれぞれ算出し、
 複数の前記最小二乗誤差の最小値に基づいて前記重みを更新することで生成される、
 (8)に記載の情報処理装置。
(10)
 前記制御部は、
 前記撮像画像の輝度値から算出されるコントラスト値に基づき、前記平坦領域を抽出する、
 (1)に記載の情報処理装置。
(11)
 前記制御部は、
 前記撮像画像を複数の分割領域に分割し、
 複数の前記分割領域ごとに前記コントラスト値を算出し、
 前記コントラスト値に応じて前記分割領域が平坦であるか否かを判定することで、前記平坦領域を抽出する、
 (1)に記載の情報処理装置。
(12)
 前記制御部は、
 前記センサの被写界深度面がそれぞれ異なる複数の前記撮像画像を取得し、
 複数の前記撮像画像からそれぞれ前記平坦領域を抽出する、
 (10)または(11)に記載の情報処理装置。
(13)
 対象をセンサが撮像した撮像画像を取得し、
 前記撮像画像は、それぞれ異なる位置に配置される複数の光源から前記対象に照射された光の反射光から得られる画像であり、
 前記撮像画像の輝度値に基づき、前記撮像画像から平坦領域を抽出し、
 前記センサに関する情報および前記撮像画像の前記平坦領域に基づき、前記対象の表面の形状に関する形状情報を算出する、
 情報処理方法。
10 ヘッドマウント部
100 マイクロスコープ
150 センサ
160 点光源
200 情報処理装置
220 制御部
221 取得部
222 法線算出部
223 深度算出部
224 表示制御部
225 領域取得部
226 法線周波数分離部
227 深度合成部
230 記憶部

Claims (13)

  1.  対象をセンサが撮像した撮像画像を取得し、
     前記撮像画像は、それぞれ異なる位置に配置される複数の光源から前記対象に照射された光の反射光から得られる画像であり、
     前記撮像画像の輝度値に基づき、前記撮像画像から平坦領域を抽出し、
     前記センサに関する情報および前記撮像画像の前記平坦領域に基づき、前記対象の表面の形状に関する形状情報を算出する制御部、
     を備える情報処理装置。
  2.  前記制御部は、
     複数の前記光源から同時に前記対象に照射された前記光の前記反射光から得られる前記撮像画像を取得する、
     請求項1に記載の情報処理装置。
  3.  前記制御部は、
     前記撮像画像の輝度値が、所定閾値以上である領域を前記平坦領域とする、
     請求項2に記載の情報処理装置。
  4.  前記制御部は、
     複数の前記光源の1つから前記対象に照射された前記光の前記反射光から得られる前記撮像画像を、前記光源ごとに取得し、
     前記光源ごとに取得した複数の前記撮像画像間における前記輝度値の変化が所定閾値未満である領域を前記平坦領域として抽出する、
     請求項1に記載の情報処理装置。
  5.  前記制御部は、
     前記撮像画像にスムージング処理を行ってスムージング画像を生成し、
     前記スムージング画像に基づき、前記撮像画像から前記平坦領域を抽出する、
     請求項2に記載の情報処理装置。
  6.  前記制御部は、
     前記撮像画像を複数の分割領域に分割し、
     複数の前記分割領域ごとに前記平坦領域を抽出し、形状情報を算出する、
     請求項5に記載の情報処理装置。
  7.  前記制御部は、
     前記撮像画像における前記平坦領域の法線情報を算出し、
     前記法線情報を機械学習により生成されたモデルに入力して前記形状情報を得る、
     請求項6に記載の情報処理装置。
  8.  前記モデルは、
     複数の正解候補画像と前記モデルの出力データとの比較結果に基づいて重みを更新することで生成され、
     複数の前記正解候補画像は、正解画像をそれぞれ異なる画素数ずつずらして生成される、
     請求項7に記載の情報処理装置。
  9.  前記モデルは、
     複数の正解候補画像と前記出力データとの最小二乗誤差をそれぞれ算出し、
     複数の前記最小二乗誤差の最小値に基づいて前記重みを更新することで生成される、
     請求項8に記載の情報処理装置。
  10.  前記制御部は、
     前記撮像画像の輝度値から算出されるコントラスト値に基づき、前記平坦領域を抽出する、
     請求項1に記載の情報処理装置。
  11.  前記制御部は、
     前記撮像画像を複数の分割領域に分割し、
     複数の前記分割領域ごとに前記コントラスト値を算出し、
     前記コントラスト値に応じて前記分割領域が平坦であるか否かを判定することで、前記平坦領域を抽出する、
     請求項10に記載の情報処理装置。
  12.  前記制御部は、
     前記センサの被写界深度面がそれぞれ異なる複数の前記撮像画像を取得し、
     複数の前記撮像画像からそれぞれ前記平坦領域を抽出する、
     請求項10に記載の情報処理装置。
  13.  対象をセンサが撮像した撮像画像を取得し、
     前記撮像画像は、それぞれ異なる位置に配置される複数の光源から前記対象に照射された光の反射光から得られる画像であり、
     前記撮像画像の輝度値に基づき、前記撮像画像から平坦領域を抽出し、
     前記センサに関する情報および前記撮像画像の前記平坦領域に基づき、前記対象の表面の形状に関する形状情報を算出する、
     情報処理方法。
PCT/JP2020/041676 2019-11-15 2020-11-09 情報処理装置および情報処理方法 Ceased WO2021095672A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/755,725 US12361573B2 (en) 2019-11-15 2020-11-09 Information processing apparatus and information processing method for shape measurement of target
CN202080077511.7A CN114667431B (zh) 2019-11-15 2020-11-09 信息处理装置和信息处理方法
JP2021556079A JP7609075B2 (ja) 2019-11-15 2020-11-09 情報処理装置および情報処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019207103 2019-11-15
JP2019-207103 2019-11-15

Publications (1)

Publication Number Publication Date
WO2021095672A1 true WO2021095672A1 (ja) 2021-05-20

Family

ID=75912071

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/041676 Ceased WO2021095672A1 (ja) 2019-11-15 2020-11-09 情報処理装置および情報処理方法

Country Status (4)

Country Link
US (1) US12361573B2 (ja)
JP (1) JP7609075B2 (ja)
CN (1) CN114667431B (ja)
WO (1) WO2021095672A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022012897A (ja) * 2020-07-02 2022-01-17 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN114359063A (zh) * 2021-12-03 2022-04-15 上海微创医疗机器人(集团)股份有限公司 目标亮度确定方法、光源控制方法和系统、设备和介质
WO2025110014A1 (ja) * 2023-11-22 2025-05-30 株式会社Ihi 生成装置および生成方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7693585B2 (ja) * 2022-03-03 2025-06-17 株式会社日立製作所 撮影装置および認証装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007139067A1 (ja) * 2006-05-29 2007-12-06 Panasonic Corporation 画像高解像度化装置、画像高解像度化方法、画像高解像度化プログラムおよび画像高解像度化システム
WO2018159738A1 (ja) * 2017-03-03 2018-09-07 ソニーセミコンダクタソリューションズ株式会社 固体撮像装置および電子機器
JP2019139694A (ja) * 2018-02-15 2019-08-22 キヤノン株式会社 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10307011A (ja) * 1995-12-05 1998-11-17 New Kurieishiyon:Kk 表面検査方法および表面検査装置
JP3980722B2 (ja) 1997-04-03 2007-09-26 株式会社モリテックス Ccdマイクロスコープ
JP3738291B2 (ja) * 2003-06-09 2006-01-25 住友大阪セメント株式会社 三次元形状測定装置
JP2008253498A (ja) 2007-04-04 2008-10-23 Shiseido Co Ltd マイクロスコープの先端ドーム
JP5152077B2 (ja) * 2009-04-01 2013-02-27 ソニー株式会社 生体像提示装置、生体像提示方法及びプログラム並びに生体像提示システム
JP5908668B2 (ja) * 2010-04-12 2016-04-26 富士フイルム株式会社 可搬型放射線撮影装置
KR101087180B1 (ko) * 2011-06-22 2011-11-28 동국대학교 경주캠퍼스 산학협력단 신뢰성 있는 금속 표면 3차원 형상 추출 기법 및 시스템
KR101087172B1 (ko) * 2011-07-13 2011-11-28 동국대학교 경주캠퍼스 산학협력단 고온 금속 표면 3차원 형상 추출 시스템 및 방법
JP6063315B2 (ja) * 2013-03-26 2017-01-18 富士フイルム株式会社 真贋判定システム,特徴点登録装置およびその動作制御方法,ならびに照合判定装置およびその動作制御方法
US9903710B2 (en) 2015-06-05 2018-02-27 Nippon Steel & Sumitomo Metal Corporation Shape inspection apparatus for metallic body and shape inspection method for metallic body
JP2017146938A (ja) * 2016-02-19 2017-08-24 富士通株式会社 書籍検出装置、書籍検出方法及び書籍検出用コンピュータプログラム
WO2017194276A1 (en) * 2016-05-13 2017-11-16 Basf Se System and method for detecting plant diseases
JPWO2018079255A1 (ja) * 2016-10-24 2019-09-12 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法、および画像処理プログラム
JP6820515B2 (ja) * 2017-03-06 2021-01-27 株式会社東京精密 表面形状測定装置及び表面形状測定方法
WO2019139694A1 (en) 2018-01-11 2019-07-18 Exxonmobil Chemical Patents Inc. Polyethylene compositions and articles manufactured therefrom
JP7163049B2 (ja) * 2018-04-03 2022-10-31 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN109272459B (zh) * 2018-08-20 2020-12-01 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
JP6585793B2 (ja) * 2018-09-18 2019-10-02 株式会社キーエンス 検査装置、検査方法およびプログラム
KR102644946B1 (ko) * 2019-05-02 2024-03-08 삼성전자주식회사 영상 처리 방법 및 장치
US11651505B2 (en) * 2020-01-27 2023-05-16 Cognex Corporation Systems and method for vision inspection with multiple types of light

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007139067A1 (ja) * 2006-05-29 2007-12-06 Panasonic Corporation 画像高解像度化装置、画像高解像度化方法、画像高解像度化プログラムおよび画像高解像度化システム
WO2018159738A1 (ja) * 2017-03-03 2018-09-07 ソニーセミコンダクタソリューションズ株式会社 固体撮像装置および電子機器
JP2019139694A (ja) * 2018-02-15 2019-08-22 キヤノン株式会社 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022012897A (ja) * 2020-07-02 2022-01-17 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP7799375B2 (ja) 2020-07-02 2026-01-15 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN114359063A (zh) * 2021-12-03 2022-04-15 上海微创医疗机器人(集团)股份有限公司 目标亮度确定方法、光源控制方法和系统、设备和介质
WO2025110014A1 (ja) * 2023-11-22 2025-05-30 株式会社Ihi 生成装置および生成方法

Also Published As

Publication number Publication date
JP7609075B2 (ja) 2025-01-07
CN114667431B (zh) 2025-10-28
US12361573B2 (en) 2025-07-15
US20230044097A1 (en) 2023-02-09
CN114667431A (zh) 2022-06-24
JPWO2021095672A1 (ja) 2021-05-20

Similar Documents

Publication Publication Date Title
JP7609075B2 (ja) 情報処理装置および情報処理方法
JP7074065B2 (ja) 医療用画像処理装置、医療用画像処理方法、プログラム
US11503201B2 (en) Focus detection device and method
US20190083180A1 (en) Medical image processing apparatus, medical image processing method, and program
CA2627611A1 (en) Imaging system and method to improve depth perception
WO2018123613A1 (ja) 医療用画像処理装置、医療用画像処理方法、プログラム
CN212326346U (zh) 一种内窥镜成像系统
US11699215B2 (en) Imaging device, method and program for producing images of a scene having an extended depth of field with good contrast
JPWO2018221041A1 (ja) 医療用観察システム及び医療用観察装置
JP2023164610A (ja) 画像処理装置、画像処理方法および画像処理システム
US12364386B2 (en) Medical image generation apparatus, medical image generation method, and medical image generation program
US12182974B2 (en) Endoscopic surgery system, image processing apparatus, and image processing method
WO2022019057A1 (ja) 医療用アーム制御システム、医療用アーム制御方法及びプログラム
US11464393B2 (en) Endoscope apparatus and method of operating endoscope apparatus
JP5422180B2 (ja) 内視鏡装置およびその作動方法
JP7456385B2 (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP2021145859A (ja) 医療用画像処理装置及び医療用観察システム
WO2020116067A1 (ja) 医療システム、情報処理装置及び情報処理方法
JP7063321B2 (ja) 撮像装置、映像信号処理装置および映像信号処理方法
CN106455948B (zh) 摄像系统
WO2022172733A1 (ja) 医療用観察装置、観察装置、観察方法及びアダプタ
JP7140113B2 (ja) 内視鏡
WO2022249572A1 (ja) 画像処理装置、画像処理方法及び記録媒体
JPWO2020050187A1 (ja) 医療システム、情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20887892

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021556079

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20887892

Country of ref document: EP

Kind code of ref document: A1

WWG Wipo information: grant in national office

Ref document number: 17755725

Country of ref document: US

WWG Wipo information: grant in national office

Ref document number: 202080077511.7

Country of ref document: CN