[go: up one dir, main page]

WO2020213366A1 - 画像生成装置および画像生成方法 - Google Patents

画像生成装置および画像生成方法 Download PDF

Info

Publication number
WO2020213366A1
WO2020213366A1 PCT/JP2020/013817 JP2020013817W WO2020213366A1 WO 2020213366 A1 WO2020213366 A1 WO 2020213366A1 JP 2020013817 W JP2020013817 W JP 2020013817W WO 2020213366 A1 WO2020213366 A1 WO 2020213366A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
data
frame buffer
format
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2020/013817
Other languages
English (en)
French (fr)
Inventor
久貴 鈴木
邦明 大江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Priority to EP20790668.6A priority Critical patent/EP3958248B1/en
Priority to CN202080027796.3A priority patent/CN113678192B/zh
Priority to US17/601,329 priority patent/US11749232B2/en
Publication of WO2020213366A1 publication Critical patent/WO2020213366A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory
    • G09G5/395Arrangements specially adapted for transferring the contents of the bit-mapped memory to the screen
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/02Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the way in which colour is displayed
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/52Controlling the output signals based on the game progress involving aspects of the displayed game scene
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • G09G5/005Adapting incoming signals to the display format of the display terminal
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/10Intensity circuits
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/14Display of multiple viewports
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/377Details of the operation on graphic patterns for mixing or overlaying two or more graphic patterns
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/06Adjustment of display parameters
    • G09G2320/0666Adjustment of display parameters for control of colour parameters, e.g. colour temperature
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/06Adjustment of display parameters
    • G09G2320/0673Adjustment of display parameters for control of gamma adjustment, e.g. selecting another gamma curve
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/10Mixing of images, i.e. displayed pixel being the result of an operation, e.g. adding, on the corresponding input pixels
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/12Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/18Use of a frame buffer in a display terminal, inclusive of the display panel
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/02Networking aspects
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/20Details of the management of multiple sources of image data

Definitions

  • the present invention relates to an image generator and an image generation method for generating a display image.
  • HDR High Dynamic Range
  • SDR Standard Dynamic Range
  • the processing required for image display becomes complicated.
  • the combined result may change due to changes in those conditions, and an image different from the original intention may be displayed.
  • the present invention has been made in view of these problems, and an object of the present invention is to provide a technique capable of appropriately controlling a composite result regardless of conditions when a plurality of images are composited and displayed.
  • This image generator has an image data generator that generates display image data, a frame buffer that stores the generated image data, and a frame buffer when the image generator starts alpha composition of a plurality of images. It is characterized by including a format control unit that switches the data format of the pixel value to be stored, and an output unit that reads image data from the frame buffer, converts it into a format corresponding to the display, and outputs the data.
  • This image generation method is a step of switching the data format of the pixel value stored in the frame buffer when the image generator that generates the data of the display image, stores it in the frame buffer, and outputs it starts alpha composition of a plurality of images. It includes a step of generating data of multiple images, alpha-synthesizing them, and storing them in a frame buffer, and a step of reading the image data from the frame buffer, converting it into a format corresponding to the display, and outputting it. It is a feature.
  • the combined result when a plurality of images are combined and displayed, the combined result can be appropriately controlled regardless of the conditions.
  • FIG. 1 It is a figure which shows the configuration example of the image display system in this embodiment. It is a figure which shows typically an example of the image generated by the image generator in this embodiment. It is a figure which shows the internal circuit configuration of the image generator in this embodiment. It is a figure for demonstrating the general flow of processing which concerns on a video signal. It is a figure which shows the flow of the basic processing at the time of synthesizing two images. It is a figure which illustrates the conversion function at the time of quantizing the pixel value of image data in this embodiment. It is a schematic diagram which illustrates the influence on the composite image by the difference of the transformation function used at the time of quantization in this embodiment. It is a figure which shows the structure of the functional block of the image generation apparatus in this embodiment.
  • the present embodiment it is a figure for demonstrating the range of the color value after conversion when the HDR image is converted into the sRGB space. It is a figure which compares the procedure of generating the composite image of the image of SDR and the image of HDR in PQ space and sRGB space in order to display on the display of HDR in this embodiment. It is a flowchart which shows the procedure of the process which the image generator of this embodiment generates a display image and outputs it to a display. It is a figure which illustrates the transition of the image displayed when this embodiment is applied. It is a figure which shows another example of the transition of the image displayed when this embodiment is applied. It is a figure which shows another example of the transition of the image displayed when this embodiment is applied.
  • FIG. 1 shows a configuration example of an image display system according to the present embodiment.
  • the image display system includes an image generation device 10, an input device 14, and a display 16.
  • the image generator 10 may be able to connect to a server or the like that provides various contents via a network 8 such as the Internet.
  • the input device 14 detects general input devices such as a controller, keyboard, mouse, joystick, and touch pad that can be operated by the user, an imaging device that captures the real world such as the user, a microphone that acquires sound, and various physical values. It may be a sensor or a combination of any of them.
  • the display 16 is realized by a liquid crystal display, a plasma display, an organic EL display, or the like that displays an image. Further, a speaker that outputs sound may be provided.
  • the input device 14 and the display 16 may be connected to the image generation device 10 by a wired cable, or may be wirelessly connected by a wireless LAN (Local Area Network) or the like.
  • the external shapes of the input device 14, the display 16, and the image generation device 10 are not limited to those shown in the drawings, and for example, two or more of them may be integrally formed.
  • the image generation device 10 receives a signal related to the user operation from the input device 14, performs processing according to the signal, generates display image data, and outputs the data to the display 16.
  • the image generation device 10 may be any of a game machine, a personal computer, a tablet terminal, a mobile terminal, a mobile phone, and the like.
  • the content of the processing performed by the image generation device 10 may vary depending on the form of the image generation device 10 and the application selected by the user.
  • the image generation device 10 advances an electronic game specified by the user according to a user operation, and generates and outputs data on the game screen at a predetermined frame rate.
  • the moving image data may be acquired from the server via the network 8 and sequentially decoded and output.
  • the purpose of use of the image generator 10 may be various, and the content of the information processing to be performed is also different accordingly. Therefore, detailed description thereof will be omitted.
  • the method of appropriately displaying an image of the content generated as a result of such information processing, an image showing information to be presented, and the like will be described.
  • FIG. 2 schematically shows an example of an image generated by the image generator 10 in the present embodiment.
  • the main image 200a is an image that is mainly displayed, such as a game screen or a moving image.
  • the additional image 200b is, for example, an image that is temporarily displayed as needed, and the illustrated example includes a dialog box that prompts the user to enter an address and password for login.
  • the image generation device 10 superimposes the additional image 200b including the dialog box on the main image 200a originally displayed, and generates and outputs the display image 202.
  • the main image 200a transparent through the additional image 200b in as wide an area as possible, it is possible to suitably fuse necessary information such as games and moving images without interrupting the world view of the main image 200a. it can. Further, by changing the transparency of the additional image 200b with time, it is possible to produce an effect in which the dialog box gradually appears or disappears.
  • the color value C out of each pixel of the display image 202 can be determined by the alpha compositing calculation expressed by the following equation.
  • C out (1- ⁇ ) C 1 + ⁇ C 2 (Equation 1)
  • C 1 and C 2 are the color values of the corresponding pixels in the main image 200a and the additional image 200b, respectively
  • is the general ⁇ value set for the pixel in the additional image 200b, that is, 0 or more indicating the transparency. It is a value of 1.0 or less.
  • the color of the additional image 200b gradually becomes darker from the state where only the main image 200a is displayed, and finally the additional image 200b becomes opaque. It will be displayed. If the ⁇ value is set to an intermediate value larger than 0 and smaller than 1.0, the additional image 200b becomes translucent with a density corresponding to the value, and the main image 200a can be seen through.
  • the color values C 1 and C 2 are set for each of the three channels, but in the present embodiment, they are collectively the color values C 1 and C. Expressed as 2 . Further, since the color values C 1 , C 2 and ⁇ are set for each pixel, strictly speaking, they depend on the two-dimensional position coordinates (x, y) on the image plane, but Equation 1 shows the pixels at the same position. The position coordinates are not shown because it is premised on the calculation related to. The same applies to the following description.
  • FIG. 3 shows the internal circuit configuration of the image generator 10.
  • the image generation device 10 includes a CPU (Central Processing Unit) 22, a GPU (Graphics Processing Unit) 24, and a main memory 26. Each of these parts is connected to each other via a bus 30.
  • the bus 30 further connects to a communication unit 32 consisting of a peripheral device interface such as USB or IEEE 1394, a wired or wireless LAN network interface connected to a network 8 or the like, a storage unit 34 such as a hard disk drive or non-volatile memory, and a display 16.
  • An output unit 36 that outputs a video signal, an input unit 38 that inputs data from an input device 14, and a recording medium driving unit 40 that drives a removable recording medium such as a magnetic disk, an optical disk, or a semiconductor memory are connected.
  • the CPU 22 controls the entire image generation device 10 by executing the operating system stored in the storage unit 34.
  • the CPU 22 also executes various programs read from the removable recording medium, loaded into the main memory 26, or downloaded via the communication unit 32.
  • the communication unit 32 also establishes communication with an external device such as a server via the network 8, acquires data of electronic contents such as moving images, and transmits data generated inside the image generation device 10. May be good.
  • the main memory 26 is composed of a RAM (Random Access Memory) and includes a frame buffer 70 for storing image data to be displayed.
  • the main memory 26 also stores programs and data required for processing.
  • the GPU 24 has a function of a geometry engine and a function of a rendering processor, performs drawing processing according to a drawing instruction from the CPU 22, and stores the data in the frame buffer 70.
  • the output unit 36 reads image data from the frame buffer 70 and outputs it to the display 16 as a video signal at an appropriate timing.
  • FIG. 4 is a diagram for explaining a general flow of processing related to a video signal.
  • the pixel value before quantization of the image drawn by the GPU 24 of the image generator 10 is used as the input value, and the color value to be expressed by the pixel value is used as the output value.
  • the two have a linear relationship.
  • Data having such linear characteristics is quantized by an optical-electro transfer function (OETF) as shown in (b) when stored in the frame buffer 70 of the image generator 10. ..
  • OETF optical-electro transfer function
  • the output unit 36 reads the video signal from the frame buffer 70 and supplies it to the display 16.
  • the display 16 converts a video signal into a luminance value by an electric-optical transfer function (EOTF: Electro-Optical Transfer Function) as shown in (c).
  • EOTF Electro-Optical Transfer Function
  • the image is displayed in each luminance range by further correcting this luminance value according to the luminance characteristics of the display panel and sequentially outputting the luminance value at an appropriate timing.
  • FIG. 5 shows the basic processing flow when synthesizing two images.
  • "luminance range A” and “luminance range B” are, for example, one SDR and the other HDR. Further, the pixel value of each image is generally quantized to a value in the range of 0 to 1.0.
  • (A) shows an environment in which two images to be combined are drawn in the same luminance range "A”, and the display 16 also processes and displays a video signal in the luminance range "A". In this case, by substituting the pixel values of the first image and the second image to be combined into Equation 1 as they are, a composite image defined in the luminance range A is generated. Therefore, if it is output to the display 16. A composite image can be displayed.
  • (B) is a case where the first image is drawn in the corresponding luminance range "A" of the display, and the second image is drawn in a different luminance range "B".
  • the first image and the second image correspond to the main image 200a and the additional image 200b of FIG. 2, the former is displayed in HDR to realize a dynamic image expression, and the SDR image provided by the system. Can be superimposed.
  • the image generator 10 needs to convert the data of the second image into the value in the luminance range A, substitute it into the equation 1, and perform alpha composition with the first image.
  • the conversion of the luminance range can be realized by mapping the luminance range of the SDR to a part of the luminance range of the HDR.
  • the peak brightness (1.0) of SDR is associated with the brightness of about 100 to 300 bits in the brightness range of HDR, and the value of 0 to 1.0 of SDR is mapped by linear interpolation.
  • the purpose is not to limit the conversion of the brightness range to this.
  • FIG. 6 illustrates a conversion function for quantizing the pixel value of image data.
  • sRGB space the space of color values quantized by such a function.
  • (B) is a conversion function called a PQ (Perceptual Quantization) curve used in the HDR color space.
  • PQ space the space of the color values quantized by such a function.
  • the difference in the characteristics affects the weighting of the two terms in Equation 1, and the balance of the image to be combined is balanced. It deviates from the intended one by setting the ⁇ value.
  • FIG. 7 is a schematic diagram illustrating the effect of the difference in the conversion function used during quantization on the composite image.
  • (A) and (b) shown in the figure assume a case where the main image 200a and the additional image 200b shown in FIG. 2 are alpha-composited, and (a) is the same as the main image as shown in (a) of FIG.
  • Both of the additional images are SDR, and the display is also SDR, and all are processed in the sRGB space.
  • the main image is generated in HDR and the additional image is generated in SDR, and in order to display this on the HDR display, the additional image is converted into data in the HDR brightness range. ing.
  • the characteristics for brightness are also converted along with the conversion of the brightness range.
  • an additional image which is an SDR
  • the color value of the composite image can be calculated by the weighted sum in the same space.
  • the transparency of the main image is small in the region where the additional image is dark. This is because the PQ curve increases the rate of increase of the color value in the low luminance region as compared with the sRGB curve, so that the image to be combined has a substantially large weight on the one having the lower luminance.
  • the conversion function is determined depending on the connected display, a composite image in a state not expected by the application or system may be displayed.
  • the impression of the display changes depending on the connected display. Therefore, in the present embodiment, the conversion function is determined independently of the brightness range of the display, and the images can be combined in that space.
  • FIG. 8 shows the configuration of the functional block of the image generation device 10 according to the present embodiment.
  • Each functional block shown in FIG. 8 can be realized by the configuration of the CPU, GPU, various memories, data bus, etc. shown in FIG. 3 in terms of hardware, and loaded into the memory from a recording medium or the like in terms of software. It is realized by a program that exerts various functions such as data input function, data retention function, calculation function, image processing function, and communication function. Therefore, it is understood by those skilled in the art that these functional blocks can be realized in various ways by hardware only, software only, or a combination thereof, and is not limited to any of them.
  • the image generation device 10 includes an input information acquisition unit 50 that acquires input information from the input device 14, an image data generation unit 52 that generates display image data, a frame buffer 56 that stores the generated image data, and a frame buffer 56.
  • a format control unit 54 for switching the data format of the pixel value stored in the display 16 and an output unit 58 for outputting the data of the display image to the display 16 are included.
  • the input information acquisition unit 50 is realized by the input unit 38, the CPU 22 and the like in FIG. 3, and acquires data indicating the contents of the user operation from the input device 14.
  • the user operation may be performed on a general information processing device, a mobile terminal, a game device, etc., such as selection of an application or content to be executed, start / end of processing, command input, and the like.
  • the input information acquisition unit 50 may also acquire data of electronic contents such as moving images from the server via the network 8.
  • the input information acquisition unit 50 appropriately supplies the acquired data to the image data generation unit 52 and the format control unit 54.
  • the image data generation unit 52 is realized by the CPU 22, GPU 24, etc. in FIG. 3, and generates an image to be displayed according to the content of user operation and the like.
  • the image data generation unit 52 includes an image drawing unit 60 and a data conversion unit 62.
  • the image drawing unit 60 generates an image constituting a display image regardless of whether or not a plurality of images are combined.
  • the image drawing unit 60 advances the electronic game according to the user operation and draws the image at a predetermined frame rate.
  • the image drawing unit 60 may decode and decompress the video data specified by the user.
  • the moving image may be acquired from the image pickup device 14 as the input device, may be distributed from the server via the network 8, or may be stored in the connected external storage device.
  • the game image and the moving image generated in this way will be referred to as the first image.
  • the image drawing unit 60 stores in the frame buffer 56 a color value obtained by quantizing the brightness of each pixel of the generated first image.
  • the image drawing unit 60 further generates a second image as needed.
  • the second image may be displayed at any time by being called by the user, or may be displayed at a timing determined according to the progress of the game or moving image. Alternatively, it may be always displayed in one corner of the screen.
  • the second image is an image to be superimposed and displayed on the first image, and the transparency to be displayed is set by an ⁇ value.
  • the ⁇ value may be set for each pixel or region, or may be a fixed value for the entire image. Further, the set value may be changed with time.
  • the image drawing unit 60 first stores the quantized color value of the first image in the frame buffer 56, and the weighted sum of the quantized color value of the second image. And overwrite the data.
  • the data conversion unit 62 converts the brightness range of the image data to be combined as necessary.
  • the data conversion unit 62 also converts the space of the image data to be synthesized, if necessary. That is, the data of the first image and the second image are converted so as to have a value having a common characteristic with respect to the brightness. For example, when synthesizing an SDR image and an HDR image, the SDR image is converted from the sRGB space to the PQ space. Alternatively, the HDR image is converted from the PQ space to the sRGB space.
  • the data conversion unit 62 determines the conversion destination space independently of the space set by the connected display 16 when processing the video signal and, by extension, the EOTF used. For example, even if an HDR display is connected, it is permissible to convert the first image of HDR into the sRGB space. As a result, as shown in FIG. 7A, the composite image can be displayed with a sense of sheerness similar to the case where both sides synthesize the SDR image and display it on the SDR display.
  • the second image of SDR is converted into PQ space without converting the first image of HDR.
  • FIG. 7B even if the composite image has a different impression from the image in FIG. 7A, the influence of the composite on the first image can be suppressed and the HDR image representation can be maintained.
  • the data conversion unit 62 reproducibility of the composite image and reproduction of the original image based on the settings in the application or system displaying the image. The one with the highest priority is determined, and the space corresponding to it is selected as the conversion destination.
  • the format control unit 54 is realized by the CPU 22 of FIG. 3, and switches the data format of the pixel value stored in the frame buffer according to the conversion destination space selected by the data conversion unit 62.
  • the pixel values of the SRD image and the HDR image are gradation-compressed mainly in the high-luminance region by the corresponding conversion functions, and each color is converted so as to fit in a predetermined number of bits.
  • the format control unit 54 switches at least one of the bit depth of each color and whether the decimal point is fixed or floating.
  • the format control unit 54 does not need to switch the format of the frame buffer 56.
  • the frame buffer 56 stores image data generated or synthesized by the image drawing unit 60.
  • the first image is first stored, and the result of calculating the pixel value of the first image and the pixel value of the second image is stored. These are carried out on the same data format under the control of the format control unit 54.
  • the output unit 58 is realized by the GPU 24, the output unit 36, etc. of FIG. 3, reads image data from the frame buffer 56, and sequentially outputs the image data to the display 16. If the data stored in the frame buffer 56 is different from the data format corresponding to the brightness range of the display 16, the output unit 36 further spatially converts the data and outputs it as a video signal in a format suitable for the display 16. ..
  • FIG. 9 is a diagram for explaining a range of color values after conversion when an HDR image is converted into an sRGB space as an example of the present embodiment.
  • the graph in the figure shows the conversion function used in sRGB as in FIG. 6A.
  • the pixel value P shown on the horizontal axis that is, the range of the original luminance is set to the upper limit of the peak luminance Ph of HDR, which is larger than the peak luminance Ps of SDR.
  • the peak brightness Ph of HDR is about 100 times the peak brightness Ps of SDR, but it is schematically shown in the figure for the sake of clarity.
  • the sRGB conversion function converts the brightness of 0 to Ps into a color value of 0 to 1.0.
  • the maximum value Ch is naturally larger than 1.0. Since the PQ curve generally used for HDR images is also converted to a color value of 1 to 1.0, the HDR image is converted by the sRGB function in the frame buffer of the data format set by such general processing. The value that was set cannot be stored. Therefore, the format control unit 54 switches the format of the frame buffer 56 in correspondence with the conversion of the HDR image into the sRGB space.
  • the table below shows typical examples of spatial conversion and data format for the combination of the brightness range of the image to be combined and the brightness range of the display set in the present embodiment.
  • the red, green, and blue color values are 10 bits each, and the ⁇ value is 2 bits, for a total of 32 bits of fixed point.
  • the color value originally represented in the sRGB space is converted into the PQ space.
  • the color value after composition can be obtained in the PQ space by the composition using Equation 1. Further, since the color value of the converted SDR does not exceed 1.0, the color value after composition does not exceed 1.0, and the originally set data format is satisfied. However, in this case, as shown in FIG. 7B, the combined result changes from the result of combining the SDR images.
  • a processing path for synthesizing in the sRGB space is provided.
  • the data format of the third column of the table is used, the values exceeding 1.0 are clamped and all are recorded as 1.0, so that the composite image will change significantly in the end. Therefore, as shown in the fourth column of the table, a floating-point data format of 32 bits in total is prepared, with 11 bits for each of the red-green color values and 10 bits for the blue color values. In the table, it is represented as "R11G11B10Float".
  • the number of bits is preferentially assigned in the order of green, red, and blue based on the high visual sensitivity.
  • the ⁇ value storage area is not provided in this example, when it is necessary to hold the ⁇ plane for each image to be combined, such as when the image is further combined with the composite image written in the frame buffer 56, Allocation is also required for the ⁇ value. Therefore, in addition to the examples shown in the table, the data format is appropriately selected according to various settings at the time of composition and the number of bits that can be prepared for each pixel.
  • the space for alpha composition is mainly the PQ space or the sRGB space, but the curve actually applied is not limited as long as the composition is performed in the same space.
  • the curve actually applied is not limited as long as the composition is performed in the same space.
  • the format control unit 54 switches the data format of the frame buffer 56 so that the value quantized by the data conversion unit 62 can be stored.
  • FIG. 10 compares the procedure for generating a composite image of an SDR image and an HDR image in PQ space and sRGB space in order to display it on an HDR display.
  • (A) is a case of synthesizing in the PQ space, and as described above, the HDR image is not converted (S10). Since the SDR image has been converted into a gamma curve in the sRGB space, the data conversion unit 62 temporarily returns the data to a linear space without a curve (S12). For this, the EOTF shown in FIG. 4 can be used.
  • the data conversion unit 62 converts the value proportional to the original brightness thus obtained into a value in the HDR brightness range by mapping it to a part of the HDR brightness range (S14). This process is actually a process of expanding the color gamut by a matrix operation, and a known calculation method can be used. Then, the data conversion unit 62 converts the data whose luminance range has been converted by the PQ curve into the data in the PQ space (S16). As a result, both of the images to be combined are represented in the PQ space, so alpha composition is performed by Equation 1 and the data is stored in the frame buffer of "R10G10B10A2Unorm".
  • (B) is the case of synthesizing in the sRGB space, and the data conversion unit 62 also converts the HDR image. That is, since the HDR image is subjected to the conversion of the PQ curve, the data of the image is temporarily returned to the linear space without the curve by EOTF (S20). Then, the data conversion unit 62 converts the data with an sRGB curve to obtain data in the sRGB space (S22).
  • the SDR image is once returned to the linear space (S24) and then converted into a value in the HDR brightness range (S26). Then, the data conversion unit 62 converts the data whose luminance range has been converted by the sRGB curve to obtain the data in the sRGB space (S28).
  • alpha composition is performed by Equation 1 and the data is stored in the frame buffer of "R11G11B10Float".
  • FIG. 11 is a flowchart showing a procedure of a process in which the image generation device 10 generates a display image and outputs it to a display.
  • This processing procedure is based on the premise that a main image such as an electronic game is generated by HDR and displayed on the HDR display, but as described above, the present embodiment is not limited to the combination.
  • the image data generation unit 52 when the input information acquisition unit 50 acquires the content of the user operation, the image data generation unit 52 generates an HDR image according to the operation content, and the output unit 58 reads the data from the frame buffer 56 and outputs it to the display. (S40).
  • this display image generation process is not limited to drawing on the spot according to the user operation, and may be such as decoding the moving image data recorded up to that point.
  • the frame buffer 56 since only the HDR image is displayed, uses a data format corresponding to the PQ space.
  • the HDR image generation and output processing is continued (N in S42).
  • the data conversion unit 62 determines whether to prioritize the reproducibility of the composite image or the reproducibility of the HDR image (S44). For example, when a menu image provided by the system is called for the purpose of changing settings during an electronic game, the main image can be in the same composite state regardless of SDR or HDR. Prioritize reproducibility.
  • the data conversion unit 62 detects the situation according to the user operation acquired by the input information acquisition unit 50 and determines the priority order. This process may actually be realized by a logic circuit that determines which priority is higher.
  • the format control unit 54 switches the data format of the frame buffer 56 to one corresponding to the sRGB space so that a color value of 1.0 or more can be stored. (S46). Then, the image data generation unit 52 stores the result of alpha-synthesizing the HDR image and the SDR image converted into the sRGB space in the frame buffer 56 whose format has been switched, and the output unit 58 reads and outputs the result (S48). .. At this time, the output unit 58 converts the composite image represented in the sRGB space into a video signal in the PQ space and outputs it.
  • the reproducibility of the composite image is not prioritized, that is, when the reproducibility of the HDR image is prioritized (N in S44), in the PQ space set in the frame buffer 56 when only the HDR image is displayed. Leave the supported data format. Then, the image data generation unit 52 converts the SDR image data into data in the HDR brightness range, stores the result of alpha compositing with the HDR image in the PQ space in the frame buffer 56, and the output unit 58 stores it. Read and output (S48).
  • the composite image is stored in the frame buffer 56 of the same data format, and the output process is repeated at a predetermined frame rate (S48).
  • the processing is returned to the generation and output of the HDR image in S40 while the display itself continues (N in S52). After that, the processes of S40 to S50 are repeated, and when it becomes necessary to end the display, all the processes are ended (Y in S52).
  • the criteria for switching between the case where the SDR image and the HDR image are combined in the PQ space and the case where they are combined in the sRGB space will be illustrated.
  • the quality of the HDR image is maintained by compositing in the PQ space, and the reproducibility of the composite image can be obtained by compositing in the sRGB space. Therefore, the former is referred to as “image quality-oriented mode” and the latter is referred to as “compositing-oriented”. Called "mode”. In order to switch between these modes, for example, the following criteria are set.
  • the image quality-oriented mode is set, and in other cases, the composition-oriented mode is set. 2. If there are no or few semi-transparent elements in the displayed image, the image quality-oriented mode is set, and if there are many semi-transparent elements, the composite-oriented mode is set. 3. 3. The image-oriented mode and the composition-oriented mode are switched according to the specification in the content that is not under system control.
  • FIG. 12 illustrates the transition of the image displayed when the present embodiment is applied. This example is a situation where the above 1 is applied.
  • the image 100 is a home screen for selecting an application provided by the system, and the compositing-oriented mode is set during the period in which the image having such a configuration is displayed. It is assumed that the application "capture gallery" is selected in the image 100.
  • the "capture gallery” is an application for viewing a captured image showing the state of play taken during the previous game play at a later timing, and an image in the game such as image 102 is displayed. Since it is desired to accurately reproduce the state of the game during the period in which such an image is displayed, the mode is switched to the image quality-oriented mode when the screen configuration is switched, as shown on the left side of the figure. Then, when the user who has finished browsing performs the operation of closing the image 102, the image 104 of the home screen is displayed again. At this time, when switching to the home screen, the mode returns to the composition-oriented mode.
  • FIG. 13 shows another example of the transition of the image displayed when the present embodiment is applied.
  • This example is a situation where the above 2 is applied.
  • the image 106 is a case where there are many translucently represented elements among the component images (elements) constituting the image. In this case, since the appearance impression changes greatly when the composition result changes, a stable display is realized by setting the composition-oriented mode.
  • the image 108 is a case where there are few elements expressed in translucency. In this case, the impression does not change so much even if the composition result changes, so a high-quality image display is maintained as the image quality-oriented mode. Switching between the two is determined by setting a threshold value for, for example, the number of elements represented by translucency, the area of the image represented by translucency, and the like.
  • FIG. 14 shows another example of the transition of the image displayed when the present embodiment is applied.
  • the above 3 is applied, but the transition between the image quality-oriented mode and the composition-oriented mode is not limited.
  • the image 110 is a menu screen provided by the system
  • the image 112 is a game screen generated by the game content being executed.
  • the combined image of the image 110 and the image 112 is the image 114 and the image 116.
  • image 114 is a composite image when the content specifies composition in a linear space.
  • the data conversion unit 62 converts the data of the image 110 and the image 112 into a linear space by EOTF or the like and synthesizes the data.
  • the format control unit 54 sets a data format in the frame buffer 56 that can store linearly quantized values. For example, set a 16-bit floating-point format for each primary color and 16-bit for the ⁇ value.
  • the data format is not limited to this.
  • Image 115 is a composite image when the content specifies composition in a space of gamma 2.2.
  • the data conversion unit 62 sets the final conversion destination in (b) of FIG. 10 to the space of gamma 2.2.
  • the format control unit 54 sets, for example, a fixed-point format of 8 bits for each primary color and 8 bits for the ⁇ value.
  • the data format is not limited to this.
  • the data format of the frame buffer is switched according to the situation.
  • the conversion function used for the quantization of the pixel value can be switched, and even if a value exceeding the generally obtained numerical range is generated, it can be written to the frame buffer as it is.
  • the same expression as when the SDR images are combined can be realized. Further, in a situation where it is desired to prioritize the dynamic representation of the original HDR image over the reproducibility of such a composite image, it is possible to synthesize in the PQ space without switching the data format. In this way, even if the brightness range of the original image or the display changes variously, the mode of the displayed image can be suitably controlled.
  • the present invention can be used for various devices such as display devices, content playback devices, game devices, and systems including them.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Studio Devices (AREA)

Abstract

画像生成装置10において入力情報取得部50は入力装置14からユーザ操作の内容を取得する。画像データ生成部52は、2つの画像を合成する際、状況に応じて画像データの空間を切り替え、当該空間で合成した画像のデータをフレームバッファ56に格納する。フォーマット制御部54は、決定された空間に対応するデータフォーマットをフレームバッファ56に設定する。出力部58は、フレームバッファ56から読み出したデータを、ディスプレイ16に応じた映像信号として出力する。

Description

画像生成装置および画像生成方法
 本発明は、表示画像を生成する画像生成装置および画像生成方法に関する。
 従来、テレビジョン放送や配信動画などの映像表示において画質を向上させるための様々な技術が開発されてきた。近年では解像度や色域を向上させる技術に加え、輝度のレンジを拡大したHDR(High Dynamic Range)の信号を処理する技術が普及しつつある。従来のSDR(Standard Dynamic Range)と比較し、HDRは輝度の許容範囲が100倍程になるため、太陽光の反射光など実世界で眩しいと感じるような対象を、画像上でもよりリアルに表現することができる。テレビジョン放送や配信動画のみならず、ゲーム画像などコンピュータグラフィクスの世界でも、HDRで表現することによって仮想世界により臨場感を与えられる(例えば特許文献1参照)。
特開2016-58848号公報
 元の画像データがどの輝度レンジで定義されているか、接続されているディスプレイがどの輝度レンジに対応しているか、など様々な条件の組み合わせが生じた結果、画像表示に必要な処理が複雑化している。特に複数の画像を合成して表示する場合、それらの条件の変化によって合成結果が変化し、本来の意図と異なる画像が表示されてしまうことがある。
 本発明はこうした課題に鑑みてなされたものであり、その目的は、複数の画像を合成して表示する際、条件によらず合成結果を適切に制御できる技術を提供することにある。
 本発明のある態様は画像生成装置に関する。この画像生成装置は、表示画像のデータを生成する画像データ生成部と、生成された画像のデータを格納するフレームバッファと、画像生成部が複数の画像のアルファ合成を開始するとき、フレームバッファに格納する画素値のデータフォーマットを切り替えるフォーマット制御部と、フレームバッファから画像のデータを読み出し、ディスプレイに対応する形式に変換して出力する出力部と、を備えることを特徴とする。
 本発明の別の態様は画像生成方法に関する。この画像生成方法は、表示画像のデータを生成しフレームバッファに格納して出力する画像生成装置が、複数の画像のアルファ合成を開始するとき、フレームバッファに格納する画素値のデータフォーマットを切り替えるステップと、複数の画像のデータを生成し、アルファ合成してフレームバッファに格納するステップと、フレームバッファから画像のデータを読み出し、ディスプレイに対応する形式に変換して出力するステップと、を含むことを特徴とする。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、コンピュータプログラムを記録した記録媒体などの間で変換したものもまた、本発明の態様として有効である。
 本発明によると、複数の画像を合成して表示する際、条件によらず合成結果を適切に制御できる。
本実施の形態における画像表示システムの構成例を示す図である。 本実施の形態において画像生成装置が生成する画像の一例を模式的に示す図である。 本実施の形態における画像生成装置の内部回路構成を示す図である。 映像信号に係る一般的な処理の流れを説明するための図である。 2つの画像を合成する場合の基本的な処理の流れを示す図である。 本実施の形態において画像データの画素値を量子化する際の変換関数を例示する図である。 本実施の形態において量子化時に用いる変換関数の差による合成画像への影響を例示する模式図である。 本実施の形態における画像生成装置の機能ブロックの構成を示す図である。 本実施の形態の一例として、HDRの画像をsRGB空間に変換した場合の変換後のカラー値の範囲について説明するための図である。 本実施の形態においてHDRのディスプレイに表示させるため、SDRの画像とHDRの画像の合成画像を生成する手順を、PQ空間およびsRGB空間で比較する図である。 本実施の画像生成装置が表示画像を生成しディスプレイに出力する処理の手順を示すフローチャートである。 本実施の形態を適用した場合に表示される画像の変遷を例示する図である。 本実施の形態を適用した場合に表示される画像の変遷の別の例を示す図である。 本実施の形態を適用した場合に表示される画像の変遷の別の例を示す図である。
 図1は、本実施の形態における画像表示システムの構成例を示す。画像表示システムは、画像生成装置10、入力装置14、ディスプレイ16を含む。図示するように画像生成装置10はインターネットなどのネットワーク8を介して各種コンテンツを提供するサーバ等と接続可能としてもよい。入力装置14はコントローラ、キーボード、マウス、ジョイスティック、タッチパッドなどユーザ操作が可能な一般的な入力装置のほか、ユーザなど実世界を撮影する撮像装置、音声を取得するマイク、各種物理値を検出するセンサや、それらのうちいずれかの組み合わせでもよい。
 ディスプレイ16は、画像を表示する液晶ディスプレイ、プラズマディスプレイ、有機ELディスプレイなどで実現する。さらに音声を出力するスピーカを備えていてもよい。入力装置14およびディスプレイ16は、画像生成装置10と有線ケーブルで接続されてよく、また無線LAN(Local Area Network)などにより無線接続されてもよい。また入力装置14、ディスプレイ16、画像生成装置10の外観形状は図示するものに限らず、例えばそれらのうち2つ以上が一体的に形成されていてもよい。
 画像生成装置10は、ユーザ操作に係る信号を入力装置14から受信し、それに応じた処理を実施して表示画像のデータを生成し、ディスプレイ16に出力する。画像生成装置10はゲーム機、パーソナルコンピュータ、タブレット端末、携帯端末、携帯電話などのいずれであってもよい。そのような画像生成装置10の形態や、ユーザが選択したアプリケーションなどに応じて、画像生成装置10が行う処理の内容は様々であってよい。
 例えば画像生成装置10は、ユーザが指定した電子ゲームをユーザ操作に応じて進捗させ、そのゲーム画面のデータを所定のフレームレートで生成し出力する。あるいはネットワーク8を介して動画のデータをサーバから取得し、それを逐次復号して出力してもよい。このように画像生成装置10の使用目的は様々であってよく、それに応じて実施する情報処理の内容も異なるため、詳細な説明は省略する。以後、そのような情報処理の結果として生成されたコンテンツの画像や、提示すべき情報を表した画像などを好適に表示させる手法に主眼を置いて説明する。
 図2は、本実施の形態において画像生成装置10が生成する画像の一例を模式的に示している。この例においてメイン画像200aは例えばゲーム画面や動画など、主として表示される画像である。付加画像200bは例えば、必要に応じて一時的に表示される画像であり、図示する例はユーザにログインのためのアドレスとパスワードを入力させるダイアログボックスを含む。このようなダイアログボックスを表示させる必要が生じると、画像生成装置10は、元から表示させていたメイン画像200aにダイアログボックスを含む付加画像200bを重畳させ、表示画像202を生成して出力する。
 このときなるべく広い領域で、付加画像200bを介してメイン画像200aが透けて見えるようにすることで、ゲームや動画などメイン画像200aの世界観が途切れることなく必要な情報を好適に融合させることができる。さらに付加画像200bの透明度を時間変化させれば、ダイアログボックスが徐々に出現したり消滅したりする演出もできる。
 複数の画像を重ねて表示させるケースは、図示する例以外にも様々に考えられることは当業者には理解されるところである。例えばレースゲームの場合、ドライバの視野を示すメイン画像に、コース全体を俯瞰した付加画像を追加で表示することが考えられる。映画を表示させる場合は、あらすじや出演者などの書誌情報を示す画像や、再生、一時停止、早送りなどの操作パネルを付加的に表示することが考えられる。
 このような表示画像202を生成する場合、次式で表されるアルファ合成の演算により、表示画像202の各画素のカラー値Coutを決定できる。
 Cout=(1-α)C+αC2    (式1)
ここでC、Cはそれぞれ、メイン画像200a、付加画像200bにおける対応する画素のカラー値、αは付加画像200bの当該画素に設定された一般的なα値、すなわち透過度を示す0以上1.0以下の値である。
 例えば画像全体においてα値を0から1.0まで変化させると、メイン画像200aのみが表示されている状態から徐々に付加画像200bの色が濃くなっていき、最終的に付加画像200bが不透明に表示されることになる。α値を0より大きく1.0より小さい中間値とすれば、付加画像200bがその数値に応じた濃さで半透明の状態となり、メイン画像200aが透けて見えることになる。
 なおメイン画像200a、付加画像200bがRGB画像であれば、カラー値C、Cは当該3チャンネルのそれぞれに設定されるが、本実施の形態ではそれらを総称してカラー値C、Cと表す。またカラー値C、Cおよびα値はそれぞれ、画素ごとに設定されるため、厳密には画像平面における2次元の位置座標(x,y)に依存するが、式1は同じ位置の画素に係る計算を前提としているため位置座標は示していない。以下の説明も同様である。
 図3は、画像生成装置10の内部回路構成を示している。画像生成装置10は、CPU(Central Processing Unit)22、GPU(Graphics Processing Unit)24、メインメモリ26を含む。これらの各部は、バス30を介して相互に接続されている。バス30にはさらに、USBやIEEE1394などの周辺機器インターフェースや、ネットワーク8などへ接続する有線または無線LANのネットワークインターフェースからなる通信部32、ハードディスクドライブや不揮発性メモリなどの記憶部34、ディスプレイ16へ映像信号を出力する出力部36、入力装置14からデータを入力する入力部38、磁気ディスク、光ディスクまたは半導体メモリなどのリムーバブル記録媒体を駆動する記録媒体駆動部40が接続される。
 CPU22は、記憶部34に記憶されているオペレーティングシステムを実行することにより画像生成装置10の全体を制御する。CPU22はまた、リムーバブル記録媒体から読み出されてメインメモリ26にロードされた、あるいは通信部32を介してダウンロードされた各種プログラムを実行する。通信部32はまた、ネットワーク8を介してサーバなど外部の装置と通信を確立し、動画像など電子コンテンツのデータを取得したり、画像生成装置10内部で生成されたデータを送信したりしてもよい。
 メインメモリ26はRAM(Random Access Memory)により構成され、表示対象の画像データを格納するフレームバッファ70を含む。ここでフレームバッファの数は限定されない。またメインメモリ26は、処理に必要なプログラムやデータも記憶する。GPU24は、ジオメトリエンジンの機能とレンダリングプロセッサの機能とを有し、CPU22からの描画命令に従って描画処理を行い、フレームバッファ70にそのデータを格納する。出力部36は、フレームバッファ70から画像のデータを読み出し、映像信号として適切なタイミングでディスプレイ16へ出力する。
 図4は、映像信号に係る一般的な処理の流れを説明するための図である。(a)は、画像生成装置10のGPU24などにより描画された画像の量子化前の画素値を入力値、それによって表現されるべきカラー値を出力値としており、両者は当然、線形の関係を有する。そのような線形特性を有するデータは、画像生成装置10のフレームバッファ70に格納される際、(b)に示すような光-電気伝達関数(OETF:Optical-Electro Transfer Function)により量子化される。輝度レンジがSDRで定義されている画像とHDRで定義されている画像で異なる関数を用いることにより、所定の色深度を有するSDRまたはHDRの映像信号が生成される。
 出力部36は当該映像信号をフレームバッファ70から読み出し、ディスプレイ16に供給する。ディスプレイ16は、(c)に示すような電気-光伝達関数(EOTF:Electro-Optical Transfer Function)により映像信号を輝度値に変換する。EOTFを適切に選択することにより、同じ色深度の信号であっても、SDRの画像は0~100nit、HDRの画像は0~10000nitなど異なるレンジの輝度値が画素ごとに得られる。この輝度値を、ディスプレイパネルの輝度特性に応じてさらに補正したうえ、適切なタイミングで順次出力していくことにより、各輝度レンジで画像が表示される。
 図5は、2つの画像を合成する場合の基本的な処理の流れを示している。図において「輝度レンジA」、「輝度レンジB」は、例えば一方がSDR、他方がHDRである。また各画像の画素値は一般的に、0~1.0の範囲内の値に量子化されている。(a)は合成対象の2つの画像が同じ輝度レンジ「A」で描画され、ディスプレイ16も当該輝度レンジ「A」の映像信号を処理して表示する環境を示している。この場合、合成対象の第1画像、第2画像の各画素値を式1にそのまま代入することにより、輝度レンジAで定義される合成画像が生成されるため、それをディスプレイ16に出力すれば合成画像を表示できる。
 (b)は第1画像がディスプレイの対応する輝度レンジ「A」で描画され、第2画像はそれと異なる輝度レンジ「B」で描画されている場合である。例えば第1画像、第2画像を図2のメイン画像200a、付加画像200bにそれぞれ対応させた場合、前者をHDRで表示することでダイナミックな画像表現を実現しつつ、システムが提供するSDRの画像を重畳させるケースが考えられる。
 この場合、画像生成装置10は、第2画像のデータを、輝度レンジAでの値に変換したうえで式1に代入し、第1画像とアルファ合成する必要がある。ここで輝度レンジの変換は、SDRの輝度レンジをHDRの輝度レンジの一部にマッピングすることによって実現できる。例えばSDRのピーク輝度(1.0)を、HDRの輝度レンジのうち100~300nits程度の明るさに対応づけ、SDRの0~1.0の値を線形補間によりマッピングする。ただし輝度レンジの変換をこれに限定する趣旨ではない。
 しかしながら各画像に対し決定された画素値は、上述のOETF(以後、変換関数と呼ぶ)により変換、量子化された値のため、前提とする変換関数によって合成結果にその影響が生じる。図6は、画像データの画素値を量子化する際の変換関数を例示している。(a)はSDR色空間の標準規格であるsRGBで用いられる変換関数であり、元の画素値すなわち表現すべき輝度をP、量子化後のカラー値をCとすると、大部分の範囲においてC=P(1/γ)の形式を有するガンマカーブで構成される。以後、このような関数により量子化されたカラー値の空間を「sRGB空間」と呼ぶ。ただしSDRの画像に適用するカーブを限定する趣旨ではなく、γ=2.2としたガンマ2.2カーブや、γ=2.4としたガンマ2.4カーブなどでも同様である。
 (b)はHDR色空間で用いられるPQ(Perceptual Quantization)カーブと呼ばれる変換関数である。以後、このような関数により量子化されたカラー値の空間を「PQ空間」と呼ぶ。ただしHDRの画像に適用するカーブを限定する趣旨ではない。(a)と(b)のように、量子化後のカラー値の、輝度に対する特性が異なると、式1における2項の重みづけにその特性の差が影響を与え、合成する画像のバランスがα値の設定により意図したものからずれてしまう。
 図7は、量子化時に用いる変換関数の差による合成画像への影響を模式図で例示している。図示する(a)、(b)は、図2で示したメイン画像200aと付加画像200bをアルファ合成する場合を想定しており、(a)は図5の(a)のようにメイン画像と付加画像の双方がSDR、ディスプレイもSDRの場合であり、全てがsRGB空間で処理される。(b)は図5の(b)のように、メイン画像がHDR、付加画像がSDRで生成され、これをHDRのディスプレイで表示させるため、付加画像をHDRの輝度レンジでのデータに変換している。
 この際、一般的には輝度レンジの変換とともに輝度に対する特性も変換する。例えばSDRである付加画像をsRGB空間でのデータからPQ空間でのデータに変換したうえで合成する。これにより式1を用いて、同じ空間での重みづけ和により合成画像のカラー値を算出できる。しかしながら(a)と比較すると(b)の合成画像は、付加画像が暗い領域でメイン画像の透過が少ない。これは、sRGBのカーブと比較しPQカーブが、低い輝度領域でカラー値の増加率を上げているため、合成対象の画像のうち輝度が低い方に実質的に大きな重みがかかることによる。
 このように、接続されるディスプレイに依存させて変換関数を決定すると、アプリケーションやシステムが想定しない状態の合成画像が表示される場合がある。また、同じコンテンツを表示しているにもかかわらず、接続しているディスプレイによって表示の印象が変化してしまうことにもなる。そこで本実施の形態では、ディスプレイの輝度レンジと独立に変換関数を決定し、その空間で画像を合成できるようにする。
 図8は、本実施の形態における画像生成装置10の機能ブロックの構成を示している。図8に示す各機能ブロックは、ハードウェア的には、図3に示したCPU、GPU、各種メモリ、データバスなどの構成で実現でき、ソフトウェア的には、記録媒体などからメモリにロードした、データ入力機能、データ保持機能、演算機能、画像処理機能、通信機能などの諸機能を発揮するプログラムで実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
 画像生成装置10は、入力装置14からの入力情報を取得する入力情報取得部50、表示画像のデータを生成する画像データ生成部52、生成した画像のデータを格納するフレームバッファ56、フレームバッファ56に格納する画素値のデータフォーマットを切り替えるフォーマット制御部54、および、表示画像のデータをディスプレイ16に出力する出力部58を含む。
 入力情報取得部50は図3の入力部38、CPU22などで実現され、ユーザ操作の内容を示すデータを入力装置14から取得する。ここでユーザ操作とは、実行するアプリケーションやコンテンツの選択、処理の開始/終了、コマンド入力など、一般的な情報処理装置や携帯端末、ゲーム装置に対しなされるものでよい。入力情報取得部50はまた、動画など電子コンテンツのデータを、ネットワーク8を介してサーバから取得してもよい。入力情報取得部50は取得したデータを画像データ生成部52やフォーマット制御部54に適宜供給する。
 画像データ生成部52は図3のCPU22、GPU24などで実現され、ユーザ操作の内容などに応じて表示すべき画像を生成する。詳細には画像データ生成部52は画像描画部60とデータ変換部62を含む。画像描画部60は、複数の画像を合成するか否かに関わらず、表示画像を構成する画像を生成する。例えば画像描画部60は、ユーザ操作に応じて電子ゲームを進捗させ、その画像を所定のフレームレートで描画する。あるいは画像描画部60は、ユーザが指定した動画のデータを復号、伸張してもよい。
 動画は入力装置14たる撮像装置から取得されたものでもよいし、ネットワーク8を介してサーバから配信されたものや、接続された外部記憶装置に格納されたものなどでもよい。以後、このようにして生成したゲーム画像や動画像を第1画像とする。画像描画部60は生成した第1画像の画素ごとの輝度を量子化してなるカラー値を、フレームバッファ56に格納する。
 画像描画部60はさらに、必要に応じて第2画像を生成する。第2画像はユーザが呼び出すことにより随時表示されるものでもよいし、ゲームや動画の進捗に応じて決定したタイミングで表示されるものでもよい。または画面の片隅などに常時表示されるものでもよい。いずれにしろ第2画像は、第1画像上に重畳表示させる画像であり、どのような透過度で表示するかをα値で設定しておく。α値は画素ごとや領域ごとに設定してもよいし、画像全体で固定値としてもよい。また当該設定値を時間変化させてもよい。
 第2画像を重畳させる必要がある期間、画像描画部60はまず第1画像の量子化後のカラー値をフレームバッファ56に格納し、それと第2画像の量子化後のカラー値の重みづけ和を計算してデータを上書きする。データ変換部62は、合成対象の画像データの輝度レンジを必要に応じて変換する。データ変換部62はまた、合成対象の画像データの空間を必要に応じて変換する。すなわち第1画像、第2画像のデータが、輝度に対する共通の特性を有する値となるように変換する。例えばSDRの画像とHDRの画像を合成する場合、SDRの画像をsRGB空間からPQ空間に変換する。あるいはHDRの画像をPQ空間からsRGB空間に変換する。
 データ変換部62はこの際、接続されているディスプレイ16が映像信号を処理する際に設定する空間、ひいては用いるEOTFとは独立に、変換先の空間を決定する。例えばHDRのディスプレイが接続されていたとしても、HDRの第1画像をsRGB空間に変換する場合を許容する。これにより図7の(a)に示すように、双方がSDRの画像を合成してSDRのディスプレイに表示した場合と同様の透け感で合成画像を表示できる。
 あるいはHDRの第1画像を変換せずに、SDRの第2画像をPQ空間に変換する。これにより図7の(b)に示すように、(a)の画像とは印象の異なる合成画像となったとしても、合成による第1画像への影響を抑えHDRの画像表現を維持できる。このように、どの空間で画像を合成するかによって合成結果が変化するため、データ変換部62は画像を表示させているアプリケーションやシステムにおける設定に基づき、合成画像の再現性と元の画像の再現性のうち優先度の高い方を決定し、それに対応する空間を変換先として選択する。
 フォーマット制御部54は図3のCPU22で実現され、データ変換部62が選択した変換先の空間に応じて、フレームバッファに格納する画素値のデータフォーマットを切り替える。一般的にSRDの画像、HDRの画像の画素値はそれぞれ、対応する変換関数により主に高輝度領域で階調圧縮され、各色が所定のビット数に収まるように変換される。ここで本来対応している変換関数とは異なる関数を用いることにより、同じデータフォーマットでは変換後の値を格納できない場合が生じる。このようなデータをフレームバッファ56に格納するため、フォーマット制御部54は、各色のビット深度と、小数点を固定とするか浮動とするか、の少なくともいずれかを切り替える。
 画像データ生成部52がアルファ合成をしない場合、あるいはアルファ合成をしても一般的なフォーマットで充足する場合、フォーマット制御部54がフレームバッファ56のフォーマットを切り替える必要はない。フレームバッファ56は、画像描画部60が生成したり合成したりした画像のデータを格納する。第2画像を合成する場合、まず第1画像が格納され、その画素値と第2画像の画素値が演算された結果が格納される。これらはフォーマット制御部54の制御のもと、同じデータフォーマット上で実施される。
 出力部58は図3のGPU24、出力部36などで実現され、フレームバッファ56から画像のデータを読み出し、順次ディスプレイ16に出力する。ここでフレームバッファ56に格納されたデータが、ディスプレイ16の輝度レンジに対応するデータフォーマットと異なる場合、出力部36は当該データをさらに空間変換し、ディスプレイ16に適したフォーマットの映像信号として出力する。
 図9は本実施の形態の一例として、HDRの画像をsRGB空間に変換した場合の変換後のカラー値の範囲について説明するための図である。図のグラフは図6の(a)と同様、sRGBで用いられる変換関数を表している。ただし横軸に示す画素値P、すなわち本来の輝度の範囲は、SDRのピーク輝度Psより大きい、HDRのピーク輝度Phを上限としている。HDRのピーク輝度PhはSDRのピーク輝度Psの100倍程度であるが、図ではわかりやすさのために模式的に示している。
 sRGBの変換関数は、0~Psの輝度を0~1.0のカラー値に変換する。一方、HDRの広域な輝度を同じ関数で変換すると、当然、その最大値Chは1.0より大きくなる。HDRの画像で一般に用いられるPQカーブも1~1.0のカラー値に変換するため、そのような一般的な処理で設定されるデータフォーマットのフレームバッファでは、HDRの画像をsRGBの関数で変換した値が格納しきれない。そのためフォーマット制御部54は、HDRの画像をsRGB空間に変換するのに対応させて、フレームバッファ56のフォーマットを切り替える。
 本実施の形態で設定される、合成対象の画像の輝度レンジとディスプレイの輝度レンジの組み合わせに対する、空間変換とデータフォーマットの代表例を下表に示す。
Figure JPOXMLDOC01-appb-T000001
 SDRの画像をSDRのディスプレイで表す場合、表の2列目に示すように、赤緑青のカラー値にそれぞれ8ビット、α値に8ビットの計32ビットの固定小数点のデータフォーマットを設定する。表ではそれを「R8G8B8A8Unorm」と表している。この環境においてSDRの画像とHDRの画像を合成して表示する場合、SDRの画像は変換せず、マッピングなどによりHDRのカラー値をSDRの輝度レンジでの値に変換する。
 一方、HDRの画像をHDRのディスプレイで表す場合、ある状況においては、表の3列目に示すように、赤緑青のカラー値にそれぞれ10ビット、α値に2ビットの計32ビットの固定小数点のデータフォーマットを設定する。表ではそれを「R10G10B10A2Unorm」と表している。この環境においてSDRの画像とHDRの画像を合成して表示する場合、HDRの画像は変換せず、マッピングなどによりSDRのカラー値をHDRの輝度レンジでの値に変換する。
 このとき、元々sRGB空間で表されていたカラー値を、PQ空間に変換する。これにより式1を用いた合成によって、合成後のカラー値がPQ空間で得られる。また変換後のSDRのカラー値が1.0を超えることはないため、合成後のカラー値も1.0を超えず、元々設定されていたデータフォーマットで充足する。ただしこの場合、図7の(b)で示したように、SDRの画像同士を合成した結果から合成結果が変化する。
 そのため、上述のとおりsRGB空間で合成する処理経路を設ける。このとき表の3列目のデータフォーマットを用いると、1.0を超える値がクランプされ全て1.0となって記録されるため、結局は合成画像が大きく変化してしまう。そこで表の4列目に示すように、赤緑のカラー値にそれぞれ11ビット、青のカラー値に10ビットの計32ビットの浮動小数点のデータフォーマットを準備する。表ではそれを「R11G11B10Float」と表している。
 合計32ビットといった制限下では、視覚的な感度の高さを踏まえ緑、赤、青の順で優先的にビット数を割り当てる。またこの例ではα値の格納領域を設けていないが、フレームバッファ56に書き出した合成画像に、さらに画像を合成する場合など、合成対象の画像ごとにαプレーンを保持する必要がある場合は、α値にも割り当てが必要となる。したがって表に示した例以外に、合成時の各種設定や各画素に準備できるビット数に応じて、データフォーマットを適切に選択する。
 例えばこれまで述べた例では主に、アルファ合成する空間をPQ空間またはsRGB空間としていたが、合成を同じ空間で実施する限り実際に適用するカーブは限定されない。1画素に準備できるビット数によっては線形の空間で合成することも考えられる。また上述したガンマ2.2やガンマ2.4などの空間で合成してもよい。データ変換部62がそれらのいずれかを選択すると、フォーマット制御部54は、それによって量子化された値が格納できるように、フレームバッファ56のデータフォーマットを切り替える。
 いずれにしろデータフォーマットの切り替えにより、HDRの画像の変換後のカラー値が1.0を大きく超える値となっても、フレームバッファへの格納が可能になる。この場合、HDRの画像自体には誤差が生じるが、合成画像の透け感を好適に再現できる。
 図10は、HDRのディスプレイに表示させるため、SDRの画像とHDRの画像の合成画像を生成する手順を、PQ空間およびsRGB空間で比較している。(a)はPQ空間で合成する場合であり、上述のとおりHDRの画像については変換しない(S10)。SDRの画像は、sRGB空間のガンマカーブの変換が施されているため、データ変換部62は当該データを一旦、カーブのない線形空間に戻す(S12)。これには図4で示したEOTFを用いることができる。
 データ変換部62は、そのようにして得られた元の輝度に比例する値を、HDRの一部の輝度レンジにマッピングすることにより、HDRの輝度レンジでの値に変換する(S14)。この処理は実際には、行列演算により色域を拡張する処理であり、公知の演算手法を用いることができる。そしてデータ変換部62は、そのように輝度レンジが変換されたデータに対しPQカーブによる変換を施すことにより、PQ空間でのデータとする(S16)。これにより、合成対象の画像の双方がPQ空間で表されたため、式1によりアルファ合成し、「R10G10B10A2Unorm」のフレームバッファにそのデータを格納する。
 (b)はsRGB空間で合成する場合であり、データ変換部62はHDRの画像も変換する。すなわち、HDRの画像は、PQカーブの変換が施されているため、当該画像のデータを一旦、EOTFによりカーブのない線形空間に戻す(S20)。そしてデータ変換部62は、当該データに対しsRGBのカーブによる変換を施すことにより、sRGB空間でのデータとする(S22)。
 一方、SDRの画像は(a)の場合と同様、一旦、線形空間に戻したあと(S24)、HDRの輝度レンジでの値に変換する(S26)。そのうえでデータ変換部62は、輝度レンジが変換されたデータに対しsRGBのカーブによる変換を施すことにより、sRGB空間でのデータとする(S28)。これにより、合成対象の画像の双方がsRGB空間で表されたため、式1によりアルファ合成し、「R11G11B10Float」のフレームバッファにそのデータを格納する。
 次に、以上の構成によって実現される画像生成装置10の動作について説明する。図11は、画像生成装置10が表示画像を生成しディスプレイに出力する処理の手順を示すフローチャートである。この処理手順は、電子ゲームなど主たる画像をHDRで生成してHDRのディスプレイに表示させることを前提としているが、これまで述べたように本実施の形態をその組み合わせに限定する趣旨ではない。
 まず入力情報取得部50がユーザ操作の内容を取得すると、画像データ生成部52は、当該操作内容に応じてHDRの画像を生成し、出力部58がフレームバッファ56からそのデータを読み出しディスプレイに出力する(S40)。ただしこの表示画像の生成処理は、ユーザ操作に応じてその場で描画するのに限らず、それまでに記録された動画データを復号するなどでもよい。またHDRの画像のみを表示するため、フレームバッファ56はPQ空間に対応するデータフォーマットを使用する。
 当該HDRの画像にSDRの画像を合成する必要がなければ、HDRの画像の生成、出力処理を継続する(S42のN)。SDRの画像を合成する必要が生じたら(S42のY)、データ変換部62は、合成画像の再現性とHDR画像の再現性のどちらを優先するかを決定する(S44)。例えば電子ゲームを実施中、設定を変更するなどの目的でシステムが提供するメニュー画像が呼び出された場合などに、メインの画像がSDRかHDRによらず同様の合成状態とするには合成画像の再現性を優先する。
 一方、電子ゲームのプレイ中の模様を静止画または動画で保存し、後から閲覧したり配信したりする場合などに、メインの画像を常時高品質に見せるにはHDRの画像の再現性を優先する。動画コンテンツを再生する場合も同様である。このように、同じコンテンツでも状況によって優先順位が変化するため、データ変換部62は入力情報取得部50が取得したユーザ操作などに応じて当該状況を検出し、優先順位を決定する。この処理は実際には、どちらの優先度が高いかを判定するロジック回路によって実現してもよい。
 合成画像の再現性を優先する場合(S44のY)、フォーマット制御部54はフレームバッファ56のデータフォーマットを、sRGB空間に対応するものに切り替え、1.0以上のカラー値を格納できるようにする(S46)。そして画像データ生成部52は、フォーマットが切り替えられたフレームバッファ56に、sRGB空間に変換されたHDR画像とSDR画像をアルファ合成した結果を格納し、出力部58がそれを読み出し出力する(S48)。このとき出力部58は、sRGB空間で表現されている合成画像をPQ空間での映像信号に変換して出力する。
 合成画像の再現性を優先しない場合、すなわちHDRの画像の再現性を優先する場合(S44のN)、HDRの画像のみを表示していたときにフレームバッファ56に設定されていた、PQ空間に対応したデータフォーマットのままとする。そして画像データ生成部52は、SDRの画像のデータをHDRの輝度レンジでのデータに変換し、PQ空間でHDRの画像とアルファ合成した結果をフレームバッファ56に格納し、出力部58がそれを読み出し出力する(S48)。
 SDRの合成を継続している期間は(S50のN)、同じデータフォーマットのフレームバッファ56に合成画像を格納し、出力する処理を所定のフレームレートで繰り返す(S48)。合成を終了させる必要が生じたら(S50のY)、表示自体が継続している間は(S52のN)、S40のHDRの画像の生成、出力に処理を戻す。以後、S40~S50の処理を繰り返し、表示を終了させる必要が生じたら全ての処理を終了させる(S52のY)。
 次に、SDRの画像とHDRの画像をPQ空間で合成する場合とsRGB空間で合成する場合の切り替えの判断基準を例示する。上述のとおりPQ空間で合成することによりHDR画像の品質が維持され、sRGB空間で合成することにより合成画像に再現性が得られるため、以下、前者を「画質重視モード」、後者を「合成重視モード」と呼ぶ。それらのモードを切り替えるため、例えば次のような基準を設定する。
1.システムが提供するアプリケーションのうち、HDRの色再現性を損ないたくないアプリケーションを実行している場合は画質重視モード、それ以外の場合は合成重視モードとする。
2.表示画像内に、半透明で表現されている要素がないか、少ない場合は画質重視モードとし、半透明で表現されている要素が多くある場合は合成重視モードとする。
3.システム制御下にないコンテンツ内での指定に応じて、画像重視モードと合成重視モードを切り替える。
 図12は、本実施の形態を適用した場合に表示される画像の変遷を例示している。この例は上記1を適用する状況である。画像100はシステムが提供するアプリケーションを選択するホーム画面であり、このような構成の画像を表示している期間は合成重視モードとする。この画像100において、「キャプチャーギャラリー」なるアプリケーションが選択されたとする。
 「キャプチャーギャラリー」は、以前のゲームプレイ中に撮影された、プレイの様子を表すキャプチャー画像を後のタイミングで閲覧するアプリケーションであり、例えば画像102のようなゲーム中の画像が表示される。このような画像を表示している期間は、ゲームの様子を正確に再現することが望まれるため、図の左側に示すように、画面構成を切り代える際に画質重視モードへ切り替える。そして閲覧し終えたユーザが画像102を閉じる操作を行うと、再びホーム画面の画像104が表示される。この際、ホーム画面への切り替えとともに、合成重視モードへ戻す。
 図13は、本実施の形態を適用した場合に表示される画像の変遷の別の例を示している。この例は上記2を適用する状況である。画像106は、画像を構成する部品画像(要素)のうち半透明で表現されている要素が多くある場合である。この場合、合成結果が変化すると見た目の印象が大きく変わるため、合成重視モードとすることにより安定した表示を実現する。
 これに対し画像108は、半透明で表現される要素が少ない場合である。この場合は合成結果が変化しても印象はそれほど変わらないため、画質重視モードとして高品質な画像表示を維持する。両者の切り替えは、例えば半透明で表現される要素の数、半透明で表現される画像の面積などにしきい値を設けることによって判定する。
 図14は、本実施の形態を適用した場合に表示される画像の変遷の別の例を示している。この例は上記3を適用する状況であるが、画質重視モードと合成重視モードの遷移に限定していない。ここで画像110はシステムが提供するメニュー画面であり、画像112は実行中のゲームコンテンツで生成されるゲーム画面である。画像110と画像112を合成した画像が、画像114、画像116である。
 このうち画像114は、コンテンツが線形空間での合成を指定した場合の合成画像である。これに応じてデータ変換部62は、画像110と画像112のデータを、EOTFなどにより線形空間に変換して合成する。一方、フォーマット制御部54は、線形に量子化された値を格納できるようなデータフォーマットをフレームバッファ56に設定する。例えば各原色に16ビット、α値に16ビットの浮動小数点のフォーマットを設定する。ただしデータフォーマットはこれに限らない。
 画像115は、コンテンツがガンマ2.2の空間での合成を指定した場合の合成画像である。これに応じてデータ変換部62は、図10の(b)における最終的な変換先をガンマ2.2の空間とする。一方、フォーマット制御部54は、例えば各原色に8ビット、α値に8ビットの固定小数点のフォーマットを設定する。ただしデータフォーマットはこれに限らない。このようにコンテンツ内で、合成する空間を指定できるようにすることにより、コンテンツ作成者の意図を常時反映させることができる。そのためシステムにおいて、コンテンツ作成者が空間を指定するためのAPIを提供してもよい。
 以上述べた本実施の形態によれば、表示画像を生成する装置において、フレームバッファのデータフォーマットを状況に応じて切り替える。これにより、画素値の量子化に用いる変換関数を切り替え、一般に得られていた数値範囲を超える値が発生しても、フレームバッファへそのまま書き込むことが可能になる。この構成を利用すると、SDRの画像とsRGBなどのガンマカーブ、あるいはHDRの画像とPQカーブ、といった輝度レンジと変換関数の組み合わせの制限を緩和することができる。
 結果として、HDRの画像をガンマカーブにより変換し、SDRの画像と合成することにより、SDRの画像同士を合成した場合と同様の表現を実現できる。また、そのような合成画像の再現性より元のHDRの画像のダイナミックな表現を優先させたい状況においては、データフォーマットを切り替えずにPQ空間で合成できる。このように、元の画像やディスプレイの輝度レンジが様々に変化しても、表示画像の態様を好適に制御できる。
 以上、本発明を実施の形態をもとに説明した。上記実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 以上のように本発明は、表示装置、コンテンツ再生装置、ゲーム装置など各種装置と、それを含むシステムなどに利用可能である。
 8 ネットワーク、 10 画像生成装置、 14 入力装置、 16 ディスプレイ、 22 CPU、 24 GPU、 26 メインメモリ、 36 出力部、 38 入力部、 50 入力情報取得部、 52 画像データ生成部、 54 フォーマット制御部、 56 フレームバッファ、 58 出力部、 60 画像描画部、 62 データ変換部、 70 フレームバッファ。

Claims (12)

  1.  表示画像のデータを生成する画像データ生成部と、
     生成された画像のデータを格納するフレームバッファと、
     前記画像データ生成部が複数の画像のアルファ合成を開始するとき、前記フレームバッファに格納する画素値のデータフォーマットを切り替えるフォーマット制御部と、
     前記フレームバッファから画像のデータを読み出し、ディスプレイに対応する形式に変換して出力する出力部と、
     を備えることを特徴とする画像生成装置。
  2.  前記画像データ生成部は、接続される表示装置が用いる伝達関数と独立に決定した変換関数により、輝度に対し所定の特性を有する、合成対象の画像の量子化後のデータを取得したうえアルファ合成することを特徴とする請求項1に記載の画像生成装置。
  3.  前記画像データ生成部は、複数の変換関数のいずれかを選択して、前記合成対象の画像の量子化後のデータを取得し、
     前記フォーマット制御部は、選択された前記変換関数に対応する前記データフォーマットに切り替えることを特徴とする請求項2に記載の画像生成装置。
  4.  前記画像データ生成部は、HDRの表示を行うディスプレイに合成画像を表示する際、前記輝度に対する特性として、sRGBのカーブ、ガンマ2.2カーブ、ガンマ2.4カーブ、および線形特性のいずれかを適用することを特徴とする請求項2または3に記載の画像生成装置。
  5.  前記フォーマット制御部は、格納するデータの小数点を固定とするか浮動とするか、および、各色に割り当てるビット数、の少なくともいずれかを変化させることにより、前記データフォーマットを切り替えることを特徴とする請求項1から4のいずれかに記載の画像生成装置。
  6.  前記フォーマット制御部は、合成前の画像の再現性と合成画像の再現性の優先度の高さに応じて、アルファ合成の開始時に前記データフォーマットを切り替えるか否かを決定することを特徴とする請求項1から5のいずれかに記載の画像生成装置。
  7.  前記フォーマット制御部は、合成する画像の構成が切り替わる際、切り替え後の構成に対応づけられた前記データフォーマットに切り替えることを特徴とする請求項1から5のいずれかに記載の画像生成装置。
  8.  前記フォーマット制御部は、表示画像において半透明で合成する要素の数または面積に基づき、前記データフォーマットを切り替えることを特徴とする請求項1から5のいずれかに記載の画像生成装置。
  9.  前記画像データ生成部は、合成対象の画像のデータの輝度に対する特性を、コンテンツを実行するアプリケーションの指定に応じて変換し、
     前記フォーマット制御部は、当該特性に対応する前記データフォーマットに切り替えることを特徴とする請求項1から5のいずれかに記載の画像生成装置。
  10.  前記画像データ生成部は、合成対象の複数の画像がそれぞれ有する輝度に対する特性を線形に変換し、定義する輝度レンジを共通化したうえで、輝度に対し共通の特性を与えることにより、アルファ合成することを特徴とする請求項1から5のいずれかに記載の画像生成装置。
  11.  表示画像のデータを生成しフレームバッファに格納して出力する画像生成装置が、
     複数の画像のアルファ合成を開始するとき、前記フレームバッファに格納する画素値のデータフォーマットを切り替えるステップと、
     前記複数の画像のデータを生成し、アルファ合成して前記フレームバッファに格納するステップと、
     前記フレームバッファから画像のデータを読み出し、ディスプレイに対応する形式に変換して出力するステップと、
     を含むことを特徴とする画像生成装置による画像生成方法。
  12.  表示画像のデータを生成しフレームバッファに格納して出力するコンピュータに、
     複数の画像のアルファ合成を開始するとき、前記フレームバッファに格納する画素値のデータフォーマットを切り替える機能と、
     前記複数の画像のデータを生成し、アルファ合成して前記フレームバッファに格納する機能と、
     前記フレームバッファから画像のデータを読み出し、ディスプレイに対応する形式に変換して出力する機能と、
     を実現させることを特徴とするコンピュータプログラム。
PCT/JP2020/013817 2019-04-16 2020-03-26 画像生成装置および画像生成方法 Ceased WO2020213366A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP20790668.6A EP3958248B1 (en) 2019-04-16 2020-03-26 Image generation device and image generation method
CN202080027796.3A CN113678192B (zh) 2019-04-16 2020-03-26 图像生成装置和图像生成方法
US17/601,329 US11749232B2 (en) 2019-04-16 2020-03-26 Image generation apparatus and image generation method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-077971 2019-04-16
JP2019077971A JP7083319B2 (ja) 2019-04-16 2019-04-16 画像生成装置および画像生成方法

Publications (1)

Publication Number Publication Date
WO2020213366A1 true WO2020213366A1 (ja) 2020-10-22

Family

ID=72837403

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/013817 Ceased WO2020213366A1 (ja) 2019-04-16 2020-03-26 画像生成装置および画像生成方法

Country Status (5)

Country Link
US (1) US11749232B2 (ja)
EP (1) EP3958248B1 (ja)
JP (1) JP7083319B2 (ja)
CN (1) CN113678192B (ja)
WO (1) WO2020213366A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116416344A (zh) * 2021-12-30 2023-07-11 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及可读存储介质
JP2024164693A (ja) * 2023-05-15 2024-11-27 キヤノン株式会社 画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015141333A (ja) * 2014-01-29 2015-08-03 キヤノン株式会社 画像処理装置、画像処理方法、表示装置、表示装置の制御方法、及び、プログラム
US20150245004A1 (en) * 2014-02-24 2015-08-27 Apple Inc. User interface and graphics composition with high dynamic range video
US20150256860A1 (en) * 2014-03-05 2015-09-10 Dolby Laboratories Licensing Corporation Graphics Blending for High Dynamic Range Video
WO2016038950A1 (ja) * 2014-09-11 2016-03-17 ソニー株式会社 画像処理装置及び画像処理方法
JP2016058848A (ja) 2014-09-08 2016-04-21 ソニー株式会社 画像処理装置及び画像処理方法
WO2017110823A1 (ja) * 2015-12-25 2017-06-29 シャープ株式会社 表示装置、表示装置の制御方法、制御プログラム、および記録媒体
WO2017217011A1 (ja) * 2016-06-16 2017-12-21 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置および重畳画像生成方法
WO2018000126A1 (en) * 2016-06-27 2018-01-04 Intel Corporation Method and system of multi-dynamic range multi-layer video blending with alpha channel sideband for video playback
JP2018503283A (ja) * 2014-11-10 2018-02-01 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 符号化のための方法、ビデオプロセッサ、復号のための方法、ビデオ復号器
JP2018025996A (ja) * 2016-08-10 2018-02-15 株式会社ソニー・インタラクティブエンタテインメント 画像合成装置、情報処理装置、および画像合成方法
WO2018066482A1 (ja) * 2016-10-06 2018-04-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7307667B1 (en) * 2003-06-27 2007-12-11 Zoran Corporation Method and apparatus for an integrated high definition television controller
EP3438965A1 (en) * 2017-08-04 2019-02-06 NXP USA, Inc. Method and apparatus for blending layers within a graphics display component
US10573279B2 (en) * 2017-09-08 2020-02-25 Avago Technologies International Sales Pte. Limited Systems and methods for combining video and graphic sources for display

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015141333A (ja) * 2014-01-29 2015-08-03 キヤノン株式会社 画像処理装置、画像処理方法、表示装置、表示装置の制御方法、及び、プログラム
US20150245004A1 (en) * 2014-02-24 2015-08-27 Apple Inc. User interface and graphics composition with high dynamic range video
US20150256860A1 (en) * 2014-03-05 2015-09-10 Dolby Laboratories Licensing Corporation Graphics Blending for High Dynamic Range Video
JP2016058848A (ja) 2014-09-08 2016-04-21 ソニー株式会社 画像処理装置及び画像処理方法
WO2016038950A1 (ja) * 2014-09-11 2016-03-17 ソニー株式会社 画像処理装置及び画像処理方法
JP2018503283A (ja) * 2014-11-10 2018-02-01 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 符号化のための方法、ビデオプロセッサ、復号のための方法、ビデオ復号器
WO2017110823A1 (ja) * 2015-12-25 2017-06-29 シャープ株式会社 表示装置、表示装置の制御方法、制御プログラム、および記録媒体
WO2017217011A1 (ja) * 2016-06-16 2017-12-21 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置および重畳画像生成方法
WO2018000126A1 (en) * 2016-06-27 2018-01-04 Intel Corporation Method and system of multi-dynamic range multi-layer video blending with alpha channel sideband for video playback
JP2018025996A (ja) * 2016-08-10 2018-02-15 株式会社ソニー・インタラクティブエンタテインメント 画像合成装置、情報処理装置、および画像合成方法
WO2018066482A1 (ja) * 2016-10-06 2018-04-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像処理方法

Also Published As

Publication number Publication date
EP3958248A1 (en) 2022-02-23
US20220199054A1 (en) 2022-06-23
CN113678192B (zh) 2024-03-26
CN113678192A (zh) 2021-11-19
US11749232B2 (en) 2023-09-05
JP7083319B2 (ja) 2022-06-10
JP2020177086A (ja) 2020-10-29
EP3958248B1 (en) 2025-06-04
EP3958248A4 (en) 2023-01-18

Similar Documents

Publication Publication Date Title
JP6855205B2 (ja) 情報処理装置および画像処理方法
US8922622B2 (en) Image processing device, image processing method, and program
KR20000069892A (ko) 디지털 버서타일 디스크 비디오 처리 방법 및 장치
JP6527641B2 (ja) 画像処理装置および重畳画像生成方法
JP6723969B2 (ja) 画像処理装置、表示装置、および画像処理方法
JP7083319B2 (ja) 画像生成装置および画像生成方法
JP6821269B2 (ja) 画像処理装置および画像処理方法
JP4144258B2 (ja) 画像出力装置及び画像出力方法
JP2009094902A (ja) 画像合成装置、画像合成方法、プログラムおよび記録媒体
JP6349355B2 (ja) 画像合成装置、情報処理装置、および画像合成方法
KR20190132072A (ko) 전자장치, 그 제어방법 및 기록매체
JP2007296218A (ja) ゲーム画像処理プログラムおよびゲーム画像処理装置
JP7749307B2 (ja) ディスプレイコントローラおよび画像表示方法
CN101599007A (zh) 显示动态影像的系统
JP2001204962A (ja) 画像表示プログラムを記録した記録媒体、画像表示方法及びゲーム装置
JP3910259B2 (ja) 画像処理装置および方法、並びにレンダリング装置および方法
JP4086002B2 (ja) プログラム、画像処理装置及び方法、並びに記録媒体
JP2005208126A (ja) 画像処理装置および画像処理方法
TWI384393B (zh) 顯示動態影像之系統
JP4194605B2 (ja) 画像処理装置および方法、並びにレンダリング装置および方法
JP4563070B2 (ja) ゲーム装置及びゲームプログラム
JP2004117870A (ja) 表示制御装置
JP2012090179A (ja) データ処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20790668

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020790668

Country of ref document: EP

Effective date: 20211116

WWG Wipo information: grant in national office

Ref document number: 2020790668

Country of ref document: EP