[go: up one dir, main page]

WO2017168460A1 - 情報処理システム、情報処理方法および情報処理プログラム - Google Patents

情報処理システム、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
WO2017168460A1
WO2017168460A1 PCT/JP2016/001811 JP2016001811W WO2017168460A1 WO 2017168460 A1 WO2017168460 A1 WO 2017168460A1 JP 2016001811 W JP2016001811 W JP 2016001811W WO 2017168460 A1 WO2017168460 A1 WO 2017168460A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
information processing
prediction model
target
targets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2016/001811
Other languages
English (en)
French (fr)
Inventor
圭介 梅津
寛樹 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to US16/075,238 priority Critical patent/US20190043066A1/en
Priority to PCT/JP2016/001811 priority patent/WO2017168460A1/ja
Priority to JP2018507801A priority patent/JP6573024B2/ja
Publication of WO2017168460A1 publication Critical patent/WO2017168460A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Definitions

  • the present invention relates to an information processing system, an information processing method, and an information processing program for specifying a specific prediction target.
  • POS data for example, there is a method of using a totaling tool having a function like a pivot table of EXCEL (registered trademark).
  • EXCEL registered trademark
  • the number of sales of products can be tabulated from various viewpoints, such as every store, every season, and every product, and sales can be made from a micro perspective to a macro perspective. It is possible to freely analyze the contributing factors.
  • Tableau registered trademark
  • SAS registered trademark
  • SPSS registered trademark
  • Patent Document 1 describes an apparatus for predicting the characteristics of manufactured products.
  • the apparatus described in Patent Literature 1 predicts a characteristic value representing a characteristic of a manufactured product from a stored characteristic amount by using a prediction model, and outputs the predicted characteristic value as a characteristic prediction value.
  • the prediction model is learned and updated so as to reduce the error between the characteristic prediction value and the characteristic value.
  • an object of the present invention is to provide an information processing system, an information processing method, and an information processing program that can identify a specific prediction target from among a plurality of prediction targets.
  • An information processing system includes: a reception unit that receives designation of a plurality of prediction targets in an information processing system in which a prediction target is predicted using a prediction model that includes variables that can affect the prediction target; Among the plurality of prediction targets, an element that configures a corresponding prediction model includes a specifying unit that specifies a prediction target that shows a tendency different from other prediction targets.
  • the information processing method accepts designation of a plurality of prediction targets in an information processing method in which a prediction target is predicted using a prediction model composed of variables that can affect the prediction target, Among the prediction targets, a prediction target that indicates a tendency that the elements constituting the corresponding prediction model are different from other prediction targets is specified.
  • An information processing program is an information processing program applied to a computer in which a prediction target is predicted using a prediction model composed of variables that can affect the prediction target.
  • a reception process that accepts the designation of the target, and a specific process that identifies a prediction target that shows a tendency that the elements of the corresponding prediction model are different from other prediction targets among the plurality of specified prediction targets Features.
  • a unique prediction target can be specified from among a plurality of prediction targets.
  • the inventor of the present application has performed a finer analysis, and has found a new problem of wanting to extract a prediction result whose contributing factor is different from others as a specific prediction target.
  • the inventor uses a large number of prediction models themselves in order to find out-of-competition prediction targets whose factors contributing to sales differ from others for each store, each product, and each period. I got the idea of extracting a unique prediction target. It is considered that the prediction model appropriately learned based on the actual data appropriately reflects the property of the actual data. Therefore, it is possible to analyze factors that can contribute to the prediction target based on such a prediction model.
  • the present inventor has obtained an idea of paying attention not only to the prediction result but also to elements constituting the prediction model.
  • an example of the object of the present invention will be described using a specific example related to sales at a store.
  • apple juice, orange juice, pine juice, grape juice, and peach juice exist as subcategories of fruit juice drinks.
  • sales of orange juice, pine juice, and grape juice differ greatly between weekdays and holidays, while whether peach juice is a weekday or a holiday has little to do with sales.
  • peach juice is out of the range.
  • fruit juice drinks ⁇ subcategory "apple juice”, “orange juice”, “pine juice”, “grape juice”, “peach juice”, etc. ⁇
  • carbonated drinks ⁇ ... ⁇ , coffee ⁇ ... ⁇
  • mineral water ⁇ ... ⁇ exists.
  • one object while analyzing the contribution of each factor to the prediction target, one object is to find an out-of-competition prediction target whose contributing factor is different from the others. Yes.
  • one object of the present invention is to find a prediction target in which the structure of the prediction model (variables constituting the prediction model, coefficients thereof, etc.) shows a tendency different from others.
  • each prediction target is predicted using a prediction model, and the prediction model has been learned in advance from past performance data or the like.
  • One prediction model is associated with one prediction target.
  • the prediction model is information representing the correlation between explanatory variables and objective variables.
  • a prediction model is a component for predicting the result of a prediction object, for example by calculating the target variable based on an explanatory variable.
  • the prediction model is generated by a learning device by using learning data and an arbitrary parameter for which the value of the objective variable has already been obtained.
  • the prediction model may be represented by, for example, a function c that maps the input x to the correct answer y.
  • the prediction model may predict a numerical value to be predicted or may predict a label to be predicted.
  • the prediction model may output a variable describing the probability distribution of the objective variable.
  • the prediction model may be described as “model”, “learning model”, “estimation model”, “prediction formula”, “estimation formula”, or the like.
  • the prediction model is represented by a prediction formula including one or more explanatory variables indicating factors that can contribute to the prediction result of the prediction target.
  • the prediction model represents an objective variable by a linear regression equation including a plurality of explanatory variables, for example.
  • the objective variable corresponds to the correct answer y
  • the explanatory variable corresponds to the input y.
  • the maximum number of explanatory variables included in one prediction model may be limited for the purpose of improving the interpretability of the prediction model or preventing overlearning.
  • the prediction formula used for predicting one prediction target is not limited to one, and the prediction predictor is used as the prediction model when the prediction formula is selected according to the value of the explanatory variable. May be.
  • FIG. FIG. 1 is a block diagram showing a configuration example of a first embodiment of an information processing system according to the present invention.
  • the information processing system 100 includes a receiving unit 10, a specifying unit 20, a storage unit 30, and an output unit 40.
  • the storage unit 30 stores a prediction model for each prediction target.
  • the prediction model is represented by a linear regression equation
  • 2 and 3 are explanatory diagrams illustrating examples of information stored in the storage unit 30.
  • the storage unit 30 may store the prediction target and the classification in association with each other.
  • FIG. 2 shows an example in which the storage unit 30 stores the prediction target and the classification of the prediction target in association with each other.
  • the prediction target is uniquely identified by the prediction target ID, and the classification is hierarchically associated with each prediction target ID.
  • the symbol “>” in the classification information illustrated in FIG. 2 indicates that the classification is in a hierarchical relationship.
  • FIG. 3 is an explanatory diagram illustrating an example of a prediction model stored in the storage unit 30.
  • the vertical direction of the table indicates the prediction target
  • the horizontal direction of the table indicates the weight (ie, coefficient) of the explanatory variable indicating the prediction model of the prediction target.
  • the prediction model includes explanatory variables X 1 “highest temperature”, X 2 “whether it is sunny”, X 3 “whether it is a holiday”, X 4 “presence of TV advertisement”, X 5 “ Suppose that it is expressed using “Discount rate” and X 6 “Price reduction”.
  • the storage unit 30 is realized by, for example, a magnetic disk device.
  • the output unit 40 outputs the identification result obtained by the identifying unit 20. Further, the output unit 40 may accept an input from the user for the output result.
  • the output unit 40 is realized by a display device or a touch panel, for example.
  • the accepting unit 10 accepts designation of a plurality of prediction targets.
  • the accepting unit 10 may accept designation of a plurality of prediction targets individually, or may accept a classification of prediction targets.
  • the reception part 10 of this embodiment also receives designation
  • the reception unit 10 determines “subcategory of fruit juice drinks”. And “highest temperature” may be accepted.
  • the specifying unit 20 specifies the prediction target based on the designation received by the receiving unit 10 and specifies the prediction model of the specified prediction target. Specifically, the specifying unit 20 specifies a prediction model to be predicted from the storage unit 30.
  • FIG. 4 is an explanatory diagram illustrating an example of processing for specifying a prediction target from the information illustrated in FIGS. 2 and 3 based on the accepted designation.
  • the receiving unit 10 receives a designation of “subcategory of fruit juice drink”.
  • specification part 20 specifies the prediction model of prediction object from the table
  • the identifying unit 20 identifies, among the identified prediction models, a prediction target that shows a tendency that the content derived from a specified viewpoint (specifically, an explanatory variable) is different from other prediction targets. That is, the specifying unit 20 specifies a prediction target in which the specified explanatory variable that is one of the elements constituting the corresponding prediction model has a tendency different from other prediction targets among the plurality of specified prediction targets. .
  • the specifying unit 20 specifies a prediction target that shows a tendency that the type of variable constituting the corresponding prediction model or the coefficient of the variable differs from other elements. .
  • the identification method is not limited to the contents described below. Any method can be used as long as it is a method capable of comparing trends between prediction models based on elements constituting the prediction model.
  • the “category type determination criterion” is a determination criterion that uses information indicating whether or not the prediction model includes a specified explanatory variable and, if included, the coefficient of the explanatory variable is positive or negative. This criterion can be said to be a criterion based on the type of variable. For example, if the prediction model does not include the specified explanatory variable, the target prediction model is classified as “0”, and if the explanatory variable is included and the coefficient is positive, it is classified as “1”. If the coefficient is negative, it is classified as “2”.
  • the “numerical type determination criterion” is a determination criterion that uses the absolute value of the coefficient of the specified explanatory variable. This criterion can be said to be a criterion based on a coefficient of a variable. Note that a determination criterion in which “category determination criterion” and “numerical determination criterion” are combined may be used.
  • a prediction model classified as a certain value for example, a prediction model that does not include a specified explanatory variable ⁇ a prediction model classified as “0”
  • a predetermined ratio threshold such as 2% of the whole.
  • specification part 20 specifies the prediction model of the classification
  • the specifying unit 20 specifies one type in which the variable of the maximum temperature is not used and one type having a negative coefficient in the maximum temperature as indicating different tendencies from the other prediction targets. .
  • the specifying unit 20 may calculate the standard deviation of the coefficient of the designated variable. Then, when the coefficient of the specified explanatory variable is evaluated by the standard deviation, the specifying unit 20 specifies that a prediction model that falls below a predetermined threshold or a prediction model that exceeds a predetermined threshold shows a different tendency from other prediction targets. May be.
  • the specifying unit 20 specifies a prediction model having a coefficient of +530000 as indicating a different tendency from other prediction targets.
  • the output unit 40 may output a prediction target that has been identified as having a different tendency from other prediction targets.
  • the output unit 40 may output not only the specified prediction target but also the prediction target received by the receiving unit 10 and then highlight the specified prediction target.
  • the output unit 40 calculates the coefficient of the calculated variable for each prediction model (prediction target).
  • a standard deviation value may be output, or a heat map corresponding to the standard deviation value may be output.
  • the receiving unit 10 and the specifying unit 20 are realized by a CPU of a computer that operates according to a program (information processing program).
  • the program may be stored in the storage unit 30, and the CPU may read the program and operate as the receiving unit 10 and the specifying unit 20 according to the program.
  • the function of the information processing system may be provided in the SaaS (SoftwareSas Service) format.
  • the receiving unit 10 and the specifying unit 20 may be realized by dedicated hardware.
  • a part or all of each component of each device may be realized by a general-purpose or dedicated circuit (circuitry), a processor, or a combination thereof. These may be configured by a single chip or may be configured by a plurality of chips connected via a bus. Part or all of each component of each device may be realized by a combination of the above-described circuit and the like and a program.
  • each device when some or all of the constituent elements of each device are realized by a plurality of information processing devices and circuits, the plurality of information processing devices and circuits may be arranged in a concentrated manner or distributedly arranged. May be.
  • the information processing apparatus, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client and server system and a cloud computing system.
  • FIG. 5 is a flowchart illustrating an operation example of the information processing system 100 according to the first embodiment.
  • the receiving unit 10 receives designation of a plurality of prediction targets (step S11).
  • the reception part 10 receives designation
  • the specifying unit 20 specifies a prediction target that shows a tendency that the elements constituting the corresponding prediction model are different from other prediction targets among the plurality of designated prediction targets (step S13). Specifically, the specifying unit 20 specifies a prediction target in which the designated element shows a tendency different from other prediction targets. And the output part 40 outputs a specific result (step S14).
  • the reception unit 10 receives designation of elements constituting a plurality of prediction targets and prediction models.
  • specification part 20 specifies the prediction object which shows the tendency from which the designated element which comprises a corresponding prediction model differs from other prediction objects among the designated several prediction objects. With such a configuration, a unique prediction target can be identified from among a plurality of prediction targets.
  • an analyst can extract a prediction model that is incorrect and needs to be corrected from a large number of prediction models. Furthermore, by using the present invention, an analyst can extract a prediction target that shows a tendency essentially different from other prediction targets from a large number of prediction targets.
  • a modification of the first embodiment will be described.
  • a group to which a variable that is an element constituting the prediction model exemplified in the first embodiment belongs is defined.
  • a group is predetermined according to the content of the variable.
  • FIG. 6 is an explanatory diagram illustrating an example of a group to which an explanatory variable belongs.
  • the explanatory variable X 11 representing the minimum temperature
  • the explanatory variable X 12 representing the precipitation
  • the explanatory variable X 14 represents explanatory variables X 13 and average wind speed representing the amount of sunlight, but none Group "weather" It belongs to.
  • the content shown in FIG. 6 is an example of a group, and the group may be determined according to the explanatory variable used in the prediction model.
  • the accepting unit 10 of this modification accepts designation of the above-described group (that is, a group in which one or more explanatory variables are grouped) as an element to be analyzed.
  • the specifying unit 20 specifies an explanatory variable belonging to the group from the received group as an element to be analyzed.
  • specification part 20 specifies the prediction object which shows the tendency from which the content derived
  • the accepting unit 10 accepts designation of “weather”, which is a group of explanatory variables, as a viewpoint for analysis from the user.
  • the specifying unit 20 specifies X 11 to X 14 (that is, minimum temperature, precipitation, amount of sunlight, and average wind speed) that are explanatory variables belonging to the “weather” group. Thereafter, the specifying unit 20 performs the processing of the contents described in the first embodiment (that is, the prediction target specifying process showing a tendency different from other prediction targets).
  • the output unit 40 outputs the results exemplified below. “For the lowest temperature, Apple Juice is out of the way.” “Regarding precipitation, (within the subcategory of juice drinks), there was no alienation.” “In terms of the amount of sunshine, pine juice is an exception.” “With respect to average wind speed, there was no disappointment.”
  • the receiving unit 10 receives the specification of a group in which one or more explanatory variables are collected as elements to be analyzed, and the specifying unit 20 belongs to the group from the received group.
  • An explanatory variable is specified as an element to be analyzed.
  • specification part 20 specifies the prediction object which shows the tendency from which the content derived
  • Embodiment 2 a second embodiment of the information processing system according to the present invention will be described.
  • the configuration of the second embodiment is the same as the configuration of the first embodiment.
  • the receiving unit 10 does not receive specification of elements constituting the prediction model (specifically, specification of elements to be analyzed as specific prediction targets).
  • the specifying unit 20 specifies a prediction target that shows a tendency that the elements constituting the corresponding prediction model are different from other prediction targets among the plurality of specified prediction targets.
  • the specifying unit 20 determines that the type of variable constituting the corresponding prediction model or the coefficient of the variable is different from that of the other elements, as in the first embodiment. Identify prediction targets that show different trends.
  • the identification method is not limited to the contents described below.
  • any method can be used as long as it can compare trends between prediction models based on elements constituting the prediction model.
  • a prediction target in which the types of variables constituting the prediction model to which the specifying unit 20 corresponds shows a tendency different from other elements is specified.
  • the prediction model for predicting the sales of orange juice at each store is a 10th order multiple regression equation.
  • the explanatory variable is composed of 10 prediction formulas.
  • each prediction model that predicts the sales of orange juice from store A to store Y is 50% to 70% of the 10 explanatory variables that make up the prediction formula. Occupy.
  • the specifying unit 20 specifies that the prediction model for predicting the sales of orange juice at the Z store shows a tendency different from other prediction targets.
  • the specifying unit 20 may specify a prediction target that shows a tendency that the types of variables constituting the corresponding prediction model are different from those of other elements. Further, the specifying unit 20 may specify a prediction target that shows a tendency that the coefficient of a variable constituting the corresponding prediction model is different from other elements. For example, the specifying unit 20 uses, as a determination criterion for comparing the coefficients, an average value of positive coefficients, an average value of negative coefficients, a coefficient acceptance rate, a positive coefficient acceptance rate, a negative coefficient, and the like. The coefficient acceptance rate may be calculated. These values are calculated as follows, for example.
  • Average value of positive coefficients total value of positive coefficients / number of variables with positive coefficient
  • Average value of negative coefficients total value of negative coefficients / number of variables with negative coefficient
  • Coefficient adoption rate coefficient Number of variables / number of all variables
  • Positive coefficient adoption rate number of variables with positive coefficient / number of all variables
  • Negative coefficient adoption rate number of variables with negative coefficient / number of all variables
  • FIG. 7 is a flowchart illustrating an operation example of the information processing system 100 according to the second embodiment.
  • the receiving unit 10 receives designation of a plurality of prediction targets (step S21).
  • the specifying unit 20 specifies a prediction target that shows a tendency in which elements constituting the corresponding prediction model are different from other prediction targets among the plurality of designated prediction targets (step S22). And the output part 40 outputs a specific result (step S23).
  • the receiving unit 10 receives the designation of a plurality of prediction targets, and the specifying unit 20 includes other elements constituting the corresponding prediction model among the specified plurality of prediction targets.
  • a prediction target showing a tendency different from the prediction target is specified. Even with such a configuration, a unique prediction target can be identified from among a plurality of prediction targets.
  • the specifying unit 20 is unique without depending on the specific elements.
  • the prediction target can be specified.
  • Embodiment 3 a third embodiment of the information processing system according to the present invention will be described.
  • a method for specifying a specific prediction target group when comparing groups into which prediction targets are classified will be described.
  • a specific example of specifying such a prediction target group corresponds to the third purpose example described above.
  • the configuration of this embodiment is the same as that of the first embodiment.
  • the accepting unit 10 accepts designation of a plurality of classifications.
  • the accepting unit 10 may accept designation of a plurality of classifications individually or may accept designation of a higher classification including a plurality of lower classifications.
  • the reception unit 10 may individually receive “fruit juice drink”, “coffee”, “carbonated drink”, and “mineral water” as the classification of the prediction target. , "Beverages" which are these higher classifications may be accepted.
  • the reception unit 10 may also receive designation of an element to be analyzed (a point of view for finding out-of-friends).
  • the specifying unit 20 specifies the classification of the prediction target based on the designation received by the receiving unit 10, and specifies the prediction model of the specified prediction target. For example, it is assumed that the storage unit 30 stores the prediction target illustrated in FIG. 2 and the prediction model illustrated in FIG.
  • the identifying unit 20 identifies, among the designated prediction target classifications, a classification in which elements constituting the prediction model corresponding to the prediction target included in the classification exhibit a tendency different from other classifications.
  • the specification unit 20 aggregates the trends from the designated viewpoint (explanatory variable) for each prediction target group of classification. For the tabulation of the trend, a method similar to the method in which the specifying unit 20 compares the trend between the prediction models in the first embodiment can be used.
  • the specifying unit 20 determines, for each classification, the category ratio (based on the type of the designated variable) for the included prediction target group ( 0, 1 or 2) may be counted. Then, the specifying unit 20 may specify a classification in which the aggregate classification tendency is different from the tendency of other classifications (for example, the ratio is different).
  • the specifying unit 20 adds up the tendencies of the prediction target group included in the classification.
  • the specifying unit 20 may count the ratios of the explanatory variables described in the second embodiment for each classification, and may specify a classification in which the tendency of the collected classification is different from the tendency of other classifications.
  • the specifying unit 20 uses, as a criterion for comparing the coefficients, the average value of the positive coefficients, the average value of the negative coefficients, the coefficient acceptance rate, and the positive coefficient adopted in the prediction formula exemplified in the second embodiment. Rate or negative coefficient adoption rate may be used. Specifically, the specifying unit 20 calculates these values for each prediction model included in the classification, calculates an average value, a standard deviation, and the like in the entire classification, and identifies a classification that is different from other classification tendencies. May be.
  • FIG. 8 is a flowchart illustrating an operation example of the information processing system 100 according to the third embodiment.
  • the receiving unit 10 receives a plurality of classification designations (step S31).
  • the specifying unit 20 specifies a classification in which the elements constituting the prediction model corresponding to the prediction target included in the classification are different from other classifications among the specified prediction target classifications (Ste S32). And the output part 40 outputs a specific result (step S33).
  • the output unit 40 may output a name of a classification different from the tendency of other classifications, or may output a prediction target belonging to the classification.
  • the output unit 40 may output all specified classifications of the prediction target and then highlight the classifications that are different from other classification tendencies.
  • the receiving unit 10 receives designation of a prediction model classification, and the specifying unit 20 performs prediction corresponding to a prediction target included in the classification among the specified prediction target classifications. Identify a category in which the elements that make up the model show a different tendency than other categories. Such a configuration makes it possible to globally grasp unique prediction targets.
  • Embodiment 4 FIG. Next, a fourth embodiment of the information processing system according to the present invention will be described.
  • the configuration of the fourth embodiment is the same as the configuration of the first embodiment.
  • the prediction model is represented by a decision tree.
  • a prediction model represented by a decision tree for example, there is a decision tree for determining whether or not 100 or more products are sold.
  • the accepting unit 10 accepts designation of a plurality of prediction targets as in the first to third embodiments. Moreover, the reception part 10 may also receive designation
  • the specifying unit 20 specifies the prediction target based on the designation received by the receiving unit 10 and specifies the prediction model of the specified prediction target.
  • the specifying unit 20 specifies a prediction target that shows a tendency that the type of variable constituting the corresponding prediction model or the position of the variable in the decision tree is different from other elements.
  • the leaf node of the decision tree represents the predicted value of the target variable according to the value of the variable specified based on the route from the root node.
  • a variable is set in a node (internal contact) other than a leaf node, and each branch indicates a value that the variable can take. Therefore, the specifying unit 20 may specify a prediction model that shows a tendency that the type of variable set for the internal contact differs from other elements, and may specify a prediction target corresponding to the prediction model. Specifically, the specifying unit 20 may specify the prediction target based on the presence or absence of a certain explanatory variable.
  • beverage X is sold at 26 stores ⁇ Store A, Store B, Store C, ... Store Z ⁇ .
  • a decision tree is used to determine whether the number of sales exceeds 100 for each store. For each of the 25 stores from A store to Y store, the explanatory variable “highest temperature” is included in the decision tree, while for Z store, the explanatory variable “highest temperature” is included in the decision tree. Is not included. In such a case, the specifying unit 20 specifies the decision tree of the Z store as out of friend.
  • the specifying unit 20 may specify a prediction target that shows a tendency that the position in the decision tree of the variable constituting the corresponding prediction model is different from other elements. Specifically, the specifying unit 20 may specify a prediction target based on where an explanatory variable is located in the decision tree (which is closer to the root or closer to the leaf). .
  • the explanatory variable “high temperature” is included in the decision tree.
  • the explanatory variable “maximum temperature” is included in the node closer to the root, while for store Z, the explanatory variable “maximum temperature” is extremely close to the leaf node.
  • the specifying unit 20 specifies the decision tree of the Z store as out of the friend.
  • FIG. 9 is a flowchart illustrating an operation example of the information processing system 100 according to the fourth embodiment.
  • the accepting unit 10 accepts designation of a plurality of classifications (step S41).
  • the specifying unit 20 specifies a prediction target that shows a tendency that the type of variable constituting the corresponding prediction model or the position of the variable in the decision tree is different from other elements (step S42). And the output part 40 outputs a specific result (step S43).
  • the specifying unit 20 determines that the type of the variable constituting the corresponding prediction model or the position of the variable in the decision tree is different from other elements. Identify prediction targets that show different trends. Even with such a configuration, a unique prediction target can be identified from among a plurality of prediction targets.
  • FIG. 10 is an explanatory diagram illustrating an example of an output result screen output by the output unit 40.
  • the screen illustrated in FIG. 10 includes three areas.
  • the upper left area of the screen (hereinafter referred to as a first area) is an area that accepts designation of a prediction target.
  • the area on the upper right of the screen (hereinafter referred to as the second area) is an area that accepts designation of a viewpoint for finding out of the group.
  • An area at the bottom of the screen (hereinafter referred to as a third area) is an area for displaying a losing friend.
  • the user designates a prediction target in the first area.
  • a check box for accepting designation for each layer into which the prediction target is classified is displayed.
  • the example illustrated in FIG. 10 indicates that the user has selected “fruit juice drink” that is a higher classification.
  • the reception unit 10 determines that the specification of all prediction targets (apple juice, orange juice, pine juice, grape juice, peach juice) belonging to the lower classification of the upper classification is received. Then, the output unit 40 may automatically display all the prediction targets belonging to the lower classification.
  • the display method of the first area illustrated in FIG. 10 is an example of the display method of the lower classification.
  • the output unit 40 may scroll and display only the portion of the area where the lower classification is displayed, or may display the lower classification by changing to another screen.
  • the user designates a viewpoint for finding out-of-friends in the second area.
  • a check box that accepts designation for each group of viewpoints (explanatory variables) described in the modification of the first embodiment is displayed.
  • a check box (variable type) is displayed in consideration of the case where no element designation is accepted as described in the second embodiment.
  • the example shown in FIG. 10 indicates that the user has selected the group “weather”.
  • the accepting unit 10 determines that all variables belonging to the group (minimum temperature, precipitation, sunshine amount, average wind speed) have been designated, and the output unit 40 belongs to the group.
  • a display for specifying all variables may be automatically performed.
  • the specifying unit 20 predicts the elements that constitute a corresponding prediction model from among the plurality of specified prediction targets that have different tendencies from other prediction targets. Is identified. Then, the output unit 40 displays the identification result in the third area.
  • the output unit 40 displays, for example, an out-of-friends prediction model in the format illustrated in FIG.
  • the prediction target is displayed in the heading on the left side of the table, and the variable is displayed in the heading on the upper side of the table.
  • Each cell of the table displays the coefficient of the prediction model variable corresponding to the prediction target.
  • the output unit 40 when a variable for finding out-of-combination is specified in the second region, emphasizes the specified variable in the upper heading of the table more than other variables. indicate. In addition, the output unit 40 highlights the cell of the extraordinary coefficient displayed in each cell of the table. For example, the output unit 40 highlights a coefficient indicating a tendency different from others for a certain explanatory variable or the fact that the explanatory variable itself has an outlier. Further, for example, as described in the second embodiment, when a variable is not specified, the output unit 40 highlights the inside of the prediction target column of the headline on the left side of the table.
  • the output example of the first embodiment, the modified example, and the second embodiment has been described.
  • the receiving unit 10 includes an input field for receiving designation of a plurality of classifications, and a display field for displaying output results in a decision tree.
  • the output unit 40 can output a screen similar to the screen illustrated in FIG. 10.
  • FIG. 11 is a block diagram showing an outline of an information processing system according to the present invention.
  • the information processing system 80 according to the present invention includes a plurality of predictions in an information processing system 80 (for example, the information processing system 100) in which a prediction target is predicted using a prediction model including variables that can affect the prediction target.
  • a receiving unit 81 (for example, the receiving unit 10) that receives the designation of the target, and a prediction target that indicates a tendency in which the elements constituting the corresponding prediction model are different from the other prediction targets among the plurality of designated prediction targets.
  • a specifying unit 82 (for example, the specifying unit 20) is provided.
  • a unique prediction target can be identified from among a plurality of prediction targets.
  • the receiving unit 81 may receive designation of elements constituting the prediction model.
  • specification part 82 may specify the prediction object which shows the tendency from which the designated element differs from other prediction objects.
  • the prediction model may be represented by a linear regression equation.
  • the specifying unit 82 may specify a prediction target that shows a tendency that the type of the variable constituting the corresponding prediction model or the coefficient of the variable is different from other elements.
  • the information processing system 80 may include an output unit (for example, the output unit 40) that outputs a specific result by the specifying unit 82.
  • specification part 82 may calculate the standard deviation of the coefficient of the variable of a prediction model, and an output part may output the calculated standard deviation for every prediction model with a heat map. According to such a configuration, it is possible for the user to determine at a glance a prediction target that shows a different tendency from other prediction targets.
  • the prediction model may be represented by a decision tree.
  • the specifying unit 82 may specify a prediction target that shows a tendency that the type of variable constituting the corresponding prediction model or the position of the variable in the decision tree is different from other elements.
  • the receiving unit 81 may receive designation of a prediction model classification. Then, the specifying unit 82 may specify a classification in which the elements constituting the prediction model corresponding to the prediction target included in the classification show a tendency different from other classifications among the specified prediction target classifications. Good. According to such a structure, it becomes possible to analyze from a global viewpoint.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)

Abstract

予測対象が、その予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理システム80は、受付部81と、特定部82とを備えている。受付部81は、複数の予測対象の指定を受け付ける。特定部82は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する。

Description

情報処理システム、情報処理方法および情報処理プログラム
 本発明は、特異な予測対象を特定する情報処理システム、情報処理方法および情報処理プログラムに関する。
 大量の実績データに基づいて様々な分析を行う方法が知られている。POS(Point of sale )データは、各店舗の売上実績を表わすデータの一例である。例えば、全国に1000店舗の小売店を展開する企業が、1店舗あたり2000種類の商品の売上数量を月ごとに集計している場合、このPOSデータの数は、1年で、1000(店舗)×12(月/年)×2000(種類/月・店舗)=24,000,000になる。
 このようなPOSデータを分析する方法として、例えば、EXCEL(登録商標)のピボットテーブルのような機能を有する集計ツールを利用する方法が挙げられる。ユーザがこのような集計ツールにPOSデータを読み込ませることで、商品の売上数を、店舗ごと、季節ごと、商品ごとなど、様々な観点で集計でき、ミクロな観点からマクロな観点まで、売上に寄与した要因を自由に分析することが可能になる。
 他にも、このような統計に特化したソフトウェアの例として、Tableau(登録商標)や、SAS(登録商標)、SPSS(登録商標)などが知られている。
 また、特許文献1には、製造品の特性を予測する装置が記載されている。特許文献1に記載された装置は、記憶された特徴量から、製造品の特性を表す特性値を予測モデルを用いて予測し、予測された特性値を特性予測値として出力する。このとき、特性予測値と特性値との誤差を減少させるように、予測モデルが学習され、更新される。
特開2011-071296号公報
 複数の予測対象の中から特異な性質を有する対象を抽出できれば、その特異な予測対象に基づいて将来の様々な戦略や検討を行うことが可能である。しかし、予測結果は入力データに依存して変化することも多いため、単純に予測結果を利用しただけでは、特異な性質を有する予測対象を抽出することは困難である。
 例えば、特許文献1に記載された装置を用いることで、製造品の特性を予測することは可能である。しかし、特許文献1に記載された装置では、どの予測対象が特異な性質を有するか判断することは考慮されていない。
 そこで、本発明は、複数の予測対象の中から特異な予測対象を特定できる情報処理システム、情報処理方法および情報処理プログラムを提供することを目的とする。
 本発明による情報処理システムは、予測対象が、その予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理システムにおいて、複数の予測対象の指定を受け付ける受付部と、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する特定部とを備えたことを特徴とする。
 本発明による情報処理方法は、予測対象が、その予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理方法において、複数の予測対象の指定を受け付け、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定することを特徴とする。
 本発明による情報処理プログラムは、予測対象が、その予測対象に影響し得る変数から構成される予測モデルを用いて予測されるコンピュータに適用される情報処理プログラムであって、コンピュータに、複数の予測対象の指定を受け付ける受付処理、および、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する特定処理を実行させることを特徴とする。
 本発明によれば、複数の予測対象の中から特異な予測対象を特定できる。
本発明による情報処理システムの第1の実施形態の構成例を示すブロック図である。 予測対象と複数の分類とを対応付けて記憶する例を示す説明図である。 予測対象の予測モデルの例を示す説明図である。 予測対象を特定する処理の例を示す説明図である。 第1の実施形態の情報処理システムの動作例を示すフローチャートである。 説明変数が属するグループの例を示す説明図である。 第2の実施形態の情報処理システムの動作例を示すフローチャートである。 第3の実施形態の情報処理システムの動作例を示すフローチャートである。 第4の実施形態の情報処理システムの動作例を示すフローチャートである。 出力結果の画面例を示す説明図である。 本発明による情報処理システムの概要を示すブロック図である。
 例えば、売上の分析には、上述するようなPOSデータを用いることが一般的である。しかし、上述するような大量の実績データに基づいて様々な分析を行う方法では、単に売上そのもの(すなわち、結果)を店舗ごと、商品ごと、期間ごとに分析可能であるに過ぎない。
 本願の発明者は、より細かい分析を行い、寄与する要因が他とは異なる予測結果を特異な予測対象として抽出したいという新規な課題を見出した。例えば、売上の分析において、店舗ごと、商品ごと、期間ごとに、売り上げに寄与する要因が他とは異なるような仲間外れの予測対象を見つけるために、発明者は、大量の予測モデルそのものを用いて、特異な予測対象を抽出するという着想を得た。実績データに基づいて適切に学習された予測モデルは、その実績データの性質を適切に反映していると考えられる。このため、このような予測モデルに基づいて、予測対象に寄与し得る要因の分析を行うことが可能になる。また、仲間外れの予測対象を見つけるために、本発明者は、予測結果のみではなく、予測モデルを構成する要素に着目するという着想を得た。仲間外れの予測対象を発見するには、様々な観点が存在する。以下、店舗の売上に関する具体例を用いて、本願発明の目的の一例を説明する。
 第一の目的例として、仲間外れの店舗を発見することが考えられる。例えば、飲料Xが、神奈川県の5000店舗で販売されていたとする。ここで、5000店舗のうち4999店舗については、飲料Xの売り上げが最高気温に対して正の相関がある一方、残り1店舗だけ、飲料Xの売り上げが最高気温に対して負の相関があるとする。この場合、その店舗を仲間外れと判断できる。
 このような仲間外れを抽出できれば、例えば、仲間外れの1店舗の飲料Xの売り上げを予測する予測式が少し誤っているのではないかと判断するきっかけになる。他にも、例えば、仲間外れの1店舗が、最高気温の低い日に独自で何らかのキャンペーンを行っていたことを、その事実を把握していない分析担当者が気づくきっかけにもなる。
 第二の目的例として、仲間外れの商品を発見することが考えられる。例えば、果汁飲料の下位分類として、アップルジュース、オレンジジュース、パインジュース、グレープジュースおよびピーチジュースが存在するとする。この場合に、オレンジジュース、パインジュースおよびグレープジュースは平日と祝日とで売り上げの傾向が大きく異なる一方、ピーチジュースだけ平日であるか祝日であるかが売り上げにほとんど関係していないとする。この場合、ピーチジュースを仲間外れと判断できる。
 このような仲間外れを抽出できれば、例えば、第一の目的例と同様に、仲間外れのピーチジュースの売り上げを予測する予測式が少し誤っているのではないかと判断するきっかけになる。また、ピーチジュースの売れ方が他の果汁飲料の売れ方とは本質的に異なるか否かを判断するきっかけになる。
 第三の目的例として、仲間外れの商品群を発見することが考えられる。例えば、果汁飲料{下位分類「アップルジュース」、「オレンジジュース」、「パインジュース」、「グレープジュース」、「ピーチジュース」、他}、炭酸飲料{・・・}、コーヒー{・・・}、ミネラルウォーター{・・・}が存在するとする。
 例えば、果汁飲料の分類に含まれる要素(「アップルジュース」、「オレンジジュース」など)の9割について、値下げ額が売上数と非常に強い相関があるとする。また、コーヒーを構成する要素の9割5分について、値下げ額が売上数と非常に強い相関があるとする。さらに、炭酸飲料を構成する要素の9割9分について、値下げ額が売上数と非常に強い相関があるとする。一方、ミネラルウォーターについては、値下げ額が売上数と非常に強い相関があるのが、構成要素のわずか3割であるとする。この場合、ミネラルウォーターの商品群を仲間外れと判断できる。
 このような仲間外れを抽出できれば、例えば、第二の目的例と同様に、仲間外れのミネラルウォーター群の売れ方が他の商品群の売れ方とは本質的に異なるか否かを判断するきっかけになる。
 以上の目的例で説明したように、本願発明では、予測対象に対する各要因の寄与を分析するとともに、その寄与する要因が他とは異なるような仲間外れの予測対象を見つけることを、一つの目的としている。具体的には、本願発明では、予測モデルの構造(予測モデルを構成する変数やその係数など)が、他と異なる傾向を示す予測対象を見つけ出すことを一つの目的としている。
 このような仲間外れの予測モデルを抽出できれば、何かの間違いや修正の必要性に気づくことが可能になる。また、予測モデル自体の誤りではなく、そのような仲間外れの予測モデルにより予測される予測対象が、本質的に他の予測対象とは異なる傾向を有していることに気付くきっかけとすることが可能になる。
 以下、本発明の実施形態を図面を参照して説明する。以下の説明では、予測モデルを用いて各予測対象の予測が行われるものとし、予測モデルは、予め過去の実績データ等により学習済みであるとする。また、1つの予測対象には、1つの予測モデルが対応付けられる。
 予測モデルは、説明変数と目的変数の相関関係を表す情報である。予測モデルは、例えば、説明変数に基づいて目的とする変数を算出することにより予測対象の結果を予測するためのコンポーネントである。予測モデルは、既に目的変数の値が得られている学習用データと任意のパラメータとを入力として、学習器により生成される。予測モデルは、例えば、入力xを正解yに写像する関数cにより表されてもよい。予測モデルは、予測対象の数値を予測するものであってもよいし、予測対象のラベルを予測するものであってもよい。予測モデルは、目的変数の確率分布を記述する変数を出力してもよい。予測モデルは、「モデル」、「学習モデル」、「推定モデル」、「予測式」または「推定式」などと記載されることもある。
 本実施形態において、予測モデルは、予測対象の予測結果に寄与し得る要因を示す1以上の説明変数を含む予測式で表される。予測モデルは、例えば、複数の説明変数を含む線形回帰式で目的変数を表す。前述の例では、目的変数が正解yに相当し、説明変数が入力yに相当する。例えば、予測モデルの解釈性を高めたり過学習を防いだりする目的で、一つの予測モデルに含まれる説明変数の最大個数が制限されているとしてもよい。なお、後述するように、1つの予測対象を予測するために用いられる予測式は1つに限定されず、説明変数の値に応じて予測式が選択される場合分け予測器が予測モデルとして用いられてもよい。
実施形態1.
 図1は、本発明による情報処理システムの第1の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム100は、受付部10と、特定部20と、記憶部30と、出力部40とを備えている。
 記憶部30は、予測対象ごとに予測モデルを記憶する。第1の実施形態では、予測モデルが線形回帰式で表される場合を例に説明する。図2および図3は、記憶部30が記憶する情報の例を示す説明図である。記憶部30は、予測対象と分類とを対応付けて記憶していてもよい。
 図2は、記憶部30が予測対象と予測対象の分類とを対応付けて記憶する例を示している。図2に示す例では、予測対象が予測対象IDで一意に識別され、それぞれの予測対象IDに、階層的に分類が対応付けられていることを示す。例えば、予測対象ID=1で識別される予測対象は、東京都のA店舗で販売されるアップルジュースであり、アップルジュースが飲料のうち果汁飲料に分類されていることを示す。なお、図2に例示する分類情報の記号「>」は、分類が階層関係にあることを示す。
 図3は、記憶部30が記憶する予測モデルの例を示す説明図である。図3に示す例では、表の縦方向が予測対象を示し、表の横方向がその予測対象の予測モデルを表わす説明変数の重み(すなわち、係数)を示す。また、図3に示す例では、予測モデルが説明変数X「最高気温」、X「晴れか否か」、X「祝日か否か」、X「テレビ広告有無」、X「割引率」およびX「値下げ額」を用いて表されるとする。
 例えば、図3に例示する予測対象ID=1で識別される予測対象の予測モデルは、説明変数X「最高気温」、X「祝日か否か」、X「テレビ広告有無」、X「割引率」およびX「値下げ額」を用いて表され、それらの重みがそれぞれa11、a13、a14、a15およびa16であることを示す。例えば、予測モデルが線形回帰式で表現される場合、予測する値をYとすると、この予測モデルは、Y=a11+a13+a14+a15+a16で表される。
 記憶部30は、たとえば、磁気ディスク装置により実現される。出力部40は、特定部20による特定結果を出力する。また、出力部40は、出力結果に対するユーザからの入力を受け付けてもよい。出力部40は、例えば、ディスプレイ装置やタッチパネルにより実現される。
 受付部10は、複数の予測対象の指定を受け付ける。受付部10は、複数の予測対象の指定を個々に受け付けてもよく、予測対象の分類を受け付けてもよい。また、本実施形態の受付部10は、予測モデルを構成する要素のうち、特異な予測対象の分析対象とする要素(仲間外れを見つける観点)の指定を併せて受け付ける。
 例えば、ユーザが、果汁飲料に分類される各予測対象の中から、「最高気温」の観点で特異な予測対象を抽出することを所望する場合、受付部10は、「果汁飲料の下位分類」および「最高気温」という指定を受け付ければよい。
 特定部20は、受付部10が受け付けた指定に基づいて予測対象を特定し、特定された予測対象の予測モデルを特定する。具体的には、特定部20は、記憶部30から予測対象の予測モデルを特定する。
 図4は、受け付けた指定に基づいて、図2および図3に例示する情報から予測対象を特定する処理の例を示す説明図である。受付部10が、「果汁飲料の下位分類」という指定を受け付けたとする。このとき、特定部20は、図2に例示する表から商品の分類に「果汁飲料」を含む予測対象ID=1~5の予測対象を特定する。すなわち、特定部20は、分類が指定された場合、指定された分類に属する全ての下位の分類に含まれる予測対象を特定すればよい。そして、特定部20は、図3に例示する表から、予測対象の予測モデルを特定する。
 次に、特定部20は、特定された予測モデルのうち、指定された観点(具体的には、説明変数)から導出される内容が他の予測対象と異なる傾向を示す予測対象を特定する。すなわち、特定部20は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素の一つである指定された説明変数が他の予測対象と異なる傾向を示す予測対象を特定する。
 例えば、予測モデルが線形回帰式で表されている場合、特定部20は、対応する予測モデルを構成する変数の種類、または、変数の係数が他の要素と異なる傾向を示す予測対象を特定する。
 以下、本実施形態において予測モデルを構成する要素が他の予測対象と異なるか否かを特定する方法の一例を具体的に説明する。ただし、特定方法は以下に記載する内容に限定されない。予測モデルを構成する要素に基づいて予測モデル間の傾向を比較可能な方法であれば、任意の方法を利用可能である。
 ここでは、便宜上、「カテゴリ型判定基準」と「数値型判定基準」という名称を用いて、特定方法の具体例を説明する。「カテゴリ型判定基準」とは、指定された説明変数を予測モデルが含んでいるか否か、含んでいる場合、その説明変数の係数は正か負かを示す情報を用いる判定基準である。この判定基準は、変数の種類に基づく基準と言うことができる。例えば、指定された説明変数を予測モデルが含んでいない場合、対象の予測モデルは“0”に分類され、説明変数が含まれている場合で、その係数が正の場合“1”に分類され、その係数が負の場合“2”に分類される。
 また、「数値型判定基準」とは、指定された説明変数の係数の絶対値を用いる判定基準である。この判定基準は、変数の係数に基づく基準と言うことができる。なお、「カテゴリ型判定基準」と「数値型判定基準」を組み合わせた判定基準が用いられてもよい。
 ここでは、上述するように、果汁飲料の下位分類に{アップルジュース、オレンジジュース、パインジュース、グレープジュース、ピーチジュース、・・・}が存在するとする。また、予測対象であるこれらの飲料には、それぞれ線形回帰式で表される予測モデルが対応付けられているとし、受付部10は分析する観点として「最高気温」の指定を受け付けたとする。
 まず、「カテゴリ型判定基準」を説明する。例えば、ある値に分類された予測モデル(例えば、指定された説明変数を予測モデルが含んでいない→“0”に分類された予測モデル)が、所定の割合閾値(全体の2%など)を下回った場合、特定部20は、その分類の予測モデルを特定する。具体的には、特定部20は、その予測モデルに対応する予測対象が他の予測対象と異なる傾向を示すと特定する。
 また、例えば、果汁飲料の下位分類に100種類の果汁飲料が存在するとする。このうち、98種類は最高気温に正の係数を有しており、1種類は最高気温の変数が用いられておらず、残り1種類は最高気温に負の係数を有しているとする。この場合、特定部20は、最高気温の変数が用いられていない1種類と、最高気温に負の係数を有している1種類とを、それぞれ他の予測対象と異なる傾向を示すと特定する。
 次に、「数値型判定基準」を説明する。特定部20は、例えば、指定された変数の係数の標準偏差を算出してもよい。そして、特定部20は、指定された説明変数の係数を標準偏差により評価した場合に、所定の閾値を下回る予測モデル、または、上回る予測モデルを、他の予測対象と異なる傾向を示すと特定してもよい。
 例えば、果汁飲料の下位分類に100種類の果汁飲料が存在するとする。そして、その100種類のいずれにも最高気温に正の係数を有しているとする。一方、その100種類のうち99種類について+10000から+40000までの範囲内の係数を有する一方、残りの1種類については+530000の係数を有しているとする。この場合、特定部20は、+530000の係数を有する予測モデルを、他の予測対象と異なる傾向を示すと特定する。
 出力部40は、他の予測対象と異なる傾向を示すと特定された予測対象を出力してもよい。また、出力部40は、特定された予測対象だけでなく、受付部10が受け付けた予測対象を出力したうえで、特定された予測対象を強調表示するようにしてもよい。
 また、例えば、特定部20が、予測モデルの変数の係数の標準偏差を算出して予測モデルを評価する場合、出力部40は、予測モデル(予測対象)ごとに、算出された変数の係数の標準偏差の値を出力してもよく、標準偏差の値に応じたヒートマップで出力してもよい。ヒートマップで出力することで、他の予測対象と異なる傾向を示す予測対象を、ユーザが一見して判断することが可能になる。
 受付部10と、特定部20とは、プログラム(情報処理プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、記憶部30に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、受付部10および特定部20として動作してもよい。また、情報処理システムの機能がSaaS(Software as a Service )形式で提供されてもよい。
 また、受付部10と、特定部20と、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
 また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、 集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
 次に、本実施形態の情報処理システムの動作を説明する。図5は、第1の実施形態の情報処理システム100の動作例を示すフローチャートである。まず、受付部10は、複数の予測対象の指定を受け付ける(ステップS11)。また、受付部10は、分析する観点として、予測モデルを構成する要素の指定を受け付ける(ステップS12)。
 次に、特定部20は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する(ステップS13)。具体的には、特定部20は、指定された要素が他の予測対象と異なる傾向を示す予測対象を特定する。そして、出力部40は、特定結果を出力する(ステップS14)。
 以上のように、本実施形態では、受付部10が、複数の予測対象および予測モデルを構成する要素の指定を受け付ける。そして、特定部20が、指定された複数の予測対象のうち、対応する予測モデルを構成する指定された要素が他の予測対象と異なる傾向を示す予測対象を特定する。そのような構成により、複数の予測対象の中から特異な予測対象を特定できる。
 また、分析者が、本発明を利用することで、大量の予測モデルから、何かが間違っていて修正が必要な予測モデルを抽出することが可能になる。さらに、分析者が、本発明を利用することにより、大量の予測対象の中から、他の予測対象とは本質的に異なる傾向を示す予測対象を抽出することも可能になる。
 次に、第1の実施形態の変形例を説明する。本変形例では、第1の実施形態で例示した予測モデルを構成する要素である変数が属するグループを定義する。グループは、変数の内容に応じて予め定められる。
 図6は、説明変数が属するグループの例を示す説明図である。図6に示す例では、最低気温を表わす説明変数X11、降水量を表わす説明変数X12、日照量を表わす説明変数X13および平均風速を表わす説明変数X14、がいずれもグループ「天候」に属していることを示す。なお、図6に示す内容はグループの例示であり、予測モデルに用いられる説明変数に応じてグループが定められればよい。
 本変形例の受付部10は、分析対象とする要素として、上述するグループ(すなわち、1以上の説明変数をまとめたグループ)の指定を受け付ける。次に、特定部20は、受け付けたグループから、そのグループに属する説明変数を、分析対象とする要素として特定する。そして、特定部20は、特定した要素ごとに、その要素から導出される内容が他の予測対象と異なる傾向を示す予測対象を特定する。
 例えば、図6に例示するグループが定義されているとする。ここで、受付部10が、ユーザから、分析する観点として、説明変数のグループである「天候」の指定を受け付ける。特定部20は、「天候」のグループに属する説明変数であるX11~X14(すなわち、最低気温、降水量、日照量および平均風速)を特定する。その後、特定部20は、第1の実施形態で説明した内容の処理(すなわち、他の予測対象と異なる傾向を示す予測対象の特定処理)を実施する。
 出力部40は、例えば、以下に例示する結果を出力する。
 「最低気温については、アップルジュースが仲間外れです。」
 「降水量については、(果汁飲料の下位分類の中では)仲間外れはありませんでした。」
 「日照量については、パインジュースが仲間外れです。」
 「平均風速については、仲間外れはありませんでした。」
 以上のように、本変形例では、受付部10が、分析対象とする要素として、1以上の説明変数をまとめたグループの指定を受け付け、特定部20が、受け付けたグループから、そのグループに属する説明変数を、分析対象とする要素として特定する。そして、特定部20が、特定した要素ごとに、その要素から導出される内容が他の予測対象と異なる傾向を示す予測対象を特定する。そのような構成によっても、複数の予測対象の中から特異な予測対象を特定できる。
実施形態2.
 次に、本発明による情報処理システムの第2の実施形態を説明する。第2の実施形態の構成は、第1の実施形態の構成と同様である。ただし、本実施形態では、受付部10が予測モデルを構成する要素の指定(具体的には、特異な予測対象の分析対象とする要素の指定)を受け付けないものとする。
 この場合、特定部20は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する。
 例えば、予測モデルが線形回帰式で表されている場合、特定部20は、第1の実施形態と同様に、対応する予測モデルを構成する変数の種類、または、変数の係数が他の要素と異なる傾向を示す予測対象を特定する。
 以下、第2の実施形態において予測モデルを構成する要素が他の予測対象と異なるか否かを特定する方法の一例を具体的に説明する。ただし、特定方法は以下に記載する内容に限定されない。第1の実施形態と同様、予測モデルを構成する要素に基づいて予測モデル間の傾向を比較可能な方法であれば、任意の方法を利用可能である。
 ここでは、特定部20が対応する予測モデルを構成する変数の種類が、他の要素と異なる傾向を示す予測対象を特定する具体例を説明する。例えば、オレンジジュースが{A店、B店、C店、…Z店}の26店舗で販売されているものとし、各店舗におけるオレンジジュースの売り上げを予測する予測モデルは、10次の重回帰式(すなわち、説明変数が10個の予測式)により構成されているとする。また、A店からY店までのオレンジジュースの売り上げを予測する各予測モデルが、予測式を構成する10個の説明変数のうちカレンダー系の説明変数または気温系の説明変数で5割~7割を占めているとする。一方、Z店におけるオレンジジュースの売り上げを予測する予測モデルだけ、10個の説明変数のうち、カレンダー系の説明変数または気温系の説明変数が2つのみであったとする。この場合、特定部20は、Z店におけるオレンジジュースの売り上げを予測する予測モデルが、他の予測対象と異なる傾向を示すと特定する。
 このように、特定部20は、対応する予測モデルを構成する変数の種類が他の要素と異なる傾向を示す予測対象を特定してもよい。また、特定部20は、対応する予測モデルを構成する変数の係数が他の要素と異なる傾向を示す予測対象を特定してもよい。特定部20は、係数を比較するための判断基準として、例えば、予測モデルに含まれる予測式の正の係数の平均値、負の係数の平均値、係数採択率、正の係数採択率、負の係数採択率など算出してもよい。これらの値は、例えば、以下のように算出される。
 正の係数の平均値 = 正の係数の合計値/正の係数を有する変数の数
 負の係数の平均値 = 負の係数の合計値/負の係数を有する変数の数
 係数採択率 = 係数を有する変数の数/全変数の数
 正の係数採択率 = 正の係数を有する変数の数/全変数の数
 負の係数採択率 = 負の係数を有する変数の数/全変数の数
 次に、本実施形態の情報処理システムの動作を説明する。図7は、第2の実施形態の情報処理システム100の動作例を示すフローチャートである。まず、受付部10は、複数の予測対象の指定を受け付ける(ステップS21)。
 次に、特定部20は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する(ステップS22)。そして、出力部40は、特定結果を出力する(ステップS23)。
 以上のように、本実施形態では、受付部10が、複数の予測対象の指定を受け付け、特定部20が、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する。そのような構成によっても、複数の予測対象の中から特異な予測対象を特定できる。
 すなわち、本実施形態では、第1の実施形態と比較して、受付部10が、予測モデルを構成する要素の指定を受け付けないため、特定部20が、特定の要素に依存せずに特異な予測対象を特定できる。
実施形態3.
 次に、本発明による情報処理システムの第3の実施形態を説明する。本実施形態では、予測対象が分類されるグループ同士を比較した際に特異な予測対象群を特定する方法を説明する。このような予測対象群を特定する具体例は、上述する第三の目的例に対応する。なお、本実施形態の構成も、第1の実施形態の構成と同様である。
 受付部10は、複数の分類の指定を受け付ける。受付部10は、複数の分類の指定を個々に受け付けてもよく、複数の下位分類を含む上位分類の指定を受け付けてもよい。例えば、図2に例示する予測対象が存在する場合、受付部10は、予測対象の分類として、「果汁飲料」、「コーヒー」、「炭酸飲料」および「ミネラルウォーター」を個々に受け付けてもよく、これらの上位分類である「飲料」を受け付けてもよい。また、受付部10は、第1の実施形態で示すように、分析対象とする要素(仲間外れを見つける観点)の指定を併せて受け付けてもよい。
 特定部20は、受付部10が受け付けた指定に基づいて予測対象の分類を特定し、特定された予測対象の予測モデルを特定する。例えば、記憶部30が図2に例示する予測対象および図3に例示する予測モデルを記憶しているとする。ここで受付部10が、分類「果汁飲料」および「コーヒー」の指定を受け付けた場合、特定部20は、図2に例示する予測対象の中から、分類が「果汁飲料」または「コーヒー」である、予測対象ID=1~10で識別される予測対象を特定する。そして、特定部20は、特定した予測対象ID=1~10に対応する予測モデルを図3に例示する予測モデルの中から特定する。
 一方、受付部10が、分類「飲料」の指定を受け付けた場合、特定部20は、図2に例示する予測対象の中から、分類「飲料」の下位分類である「果汁飲料」、「コーヒー」、「炭酸飲料」および「ミネラルウォーター」を特定し、予測対象ID=1~20で識別される予測対象を特定する。そして、特定部20は、特定した予測対象ID=1~20に対応する予測モデルを図3に例示する予測モデルの中から特定する。
 特定部20は、指定された予測対象の分類のうち、当該分類に含まれる予測対象に対応する予測モデルを構成する要素が、他の分類とは異なる傾向を示す分類を特定する。受付部10が分析対象とする要素の指定を併せて受け付けている場合、特定部20は、分類の予測対象群ごとに、指定された観点(説明変数)での傾向を集計する。傾向の集計は、第1の実施形態で特定部20が予測モデル間の傾向を比較する方法と同様の方法を用いることができる。
 例えば、第1の実施形態で説明した「カテゴリ型判定基準」を用いる場合、特定部20は、分類ごとに、含まれる予測対象群に対して、指定された変数の種類に基づくカテゴリの割合(0、1または2)を集計してもよい。そして、特定部20は、集計された分類の傾向が他の分類の傾向と異なる(例えば、割合が異なる)分類を特定してもよい。
 一方、受付部10が分析対象とする要素の指定を受け付けていない場合、特定部20は、分類に含まれる予測対象群の傾向を集計する。傾向の集計は、第2の実施形態で特定部20が予測モデル間の傾向を比較する方法と同様の方法を用いることができる。特定部20は、例えば、第2の実施形態で説明した説明変数の割合を分類ごとに集計し、集計された分類の傾向が他の分類の傾向と異なる分類を特定してもよい。
 また、特定部20は、係数を比較するための判断基準に、第2の実施形態で例示した予測式の正の係数の平均値、負の係数の平均値、係数採択率、正の係数採択率または負の係数採択率を用いてもよい。具体的には、特定部20は、分類に含まれる予測モデルごとにこれらの値を算出し、分類全体での平均値や標準偏差などを算出して、他の分類の傾向と異なる分類を特定してもよい。
 次に、本実施形態の情報処理システムの動作を説明する。図8は、第3の実施形態の情報処理システム100の動作例を示すフローチャートである。まず、受付部10は、複数の分類の指定を受け付ける(ステップS31)。
 次に、特定部20は、指定された予測対象の分類のうち、その分類に含まれる予測対象に対応する予測モデルを構成する要素が、他の分類とは異なる傾向を示す分類を特定する(ステップS32)。そして、出力部40は、特定結果を出力する(ステップS33)。出力部40は、例えば、他の分類の傾向と異なる分類の名称を出力してもよく、その分類に属する予測対象を出力してもよい。他にも、出力部40は、指定された予測対象の分類を全て出力した上で、他の分類の傾向と異なる分類を強調表示してもよい。
 以上のように、本実施形態では、受付部10が、予測モデルの分類の指定を受け付け、特定部20は、指定された予測対象の分類のうち、その分類に含まれる予測対象に対応する予測モデルを構成する要素が、他の分類とは異なる傾向を示す分類を特定する。そのような構成により、特異な予測対象を大域的に把握することが可能になる。
実施形態4.
 次に、本発明による情報処理システムの第4の実施形態を説明する。第4の実施形態の構成も、第1の実施形態の構成と同様である。ただし、本実施形態では、予測モデルが決定木で表される場合を想定する。決定木で表される予測モデルの例として、例えば、ある商品が100個以上売れるか否かを判定する決定木が挙げられる。
 受付部10は、第1から第3の実施形態と同様、複数の予測対象の指定を受け付ける。また、受付部10は、分析対象とする要素(仲間外れを見つける観点)の指定を併せて受け付けてもよい。
 特定部20は、受付部10が受け付けた指定に基づいて予測対象を特定し、特定された予測対象の予測モデルを特定する。本実施形態では、特定部20は、対応する予測モデルを構成する変数の種類またはその変数の決定木における位置が他の要素と異なる傾向を示す予測対象を特定する。
 決定木の葉ノードは、根ノードからの経路に基づいて特定される変数の値に応じた目的変数の予測値を表わす。また、葉ノード以外のノード(内部接点)に変数が設定され、各枝が、その変数の取り得る値を示す。そこで、特定部20は、内部接点に設定される変数の種類が他の要素と異なる傾向を示す予測モデルを特定し、その予測モデルに対応する予測対象を特定してもよい。具体的には、特定部20は、ある説明変数の有無に基づいて予測対象を特定してもよい。
 例えば、飲料Xが{A店、B店、C店、…Z店}の26店舗で販売されているとする。そして、それぞれの店舗について、売上数が100個を超えるか否かを判定するために決定木が用いられるとする。A店からY店までの25店舗については、いずれも決定木の中に「最高気温」という説明変数が含まれる一方、Z店については、その決定木の中に、「最高気温」という説明変数が含まれていないとする。このような場合、特定部20は、Z店の決定木を仲間外れとして特定する。
 さらに、特定部20は、対応する予測モデルを構成する変数の決定木における位置が他の要素と異なる傾向を示す予測対象を特定してもよい。具体的には、特定部20は、ある説明変数が、決定木の中のどのあたり(根に近い方か葉に近い方か)に位置しているかに基づいて予測対象を特定してもよい。
 例えば、A店からZ店までのすべての店舗については、いずれも決定木の中に「最高気温」という説明変数が含まれるとする。ここで、A店からY店については、「最高気温」という説明変数が根に近い方のノードに含まれる一方、Z店については、「最高気温」という説明変数が極めて葉ノードに近い位置に含まれているとする。根に近いノードに含まれる説明変数ほど、決定木においてより重要な説明変数と考えられる。そこで、このような場合、特定部20は、Z店の決定木を仲間外れとして特定する。
 次に、本実施形態の情報処理システムの動作を説明する。図9は、第4の実施形態の情報処理システム100の動作例を示すフローチャートである。まず、受付部10は、複数の分類の指定を受け付ける(ステップS41)。
 次に、特定部20は、対応する予測モデルを構成する変数の種類、またはその変数の決定木における位置が他の要素と異なる傾向を示す予測対象を特定する(ステップS42)。そして、出力部40は、特定結果を出力する(ステップS43)。
 以上のように、本実施形態では、予測モデルが決定木で表される場合に、特定部20が、対応する予測モデルを構成する変数の種類またはその変数の決定木における位置が他の要素と異なる傾向を示す予測対象を特定する。そのような構成によっても、複数の予測対象の中から特異な予測対象を特定できる。
 次に、出力結果の具体例を説明する。図10は、出力部40が出力する出力結果の画面例を示す説明図である。図10に例示する画面は、3つの領域を含む。画面の左上の領域(以下、第1の領域と記す。)は、予測対象の指定を受け付ける領域である。画面の右上の領域(以下、第2の領域と記す。)は、仲間外れを見つける観点の指定を受け付ける領域である。画面の下の領域(以下、第3の領域と記す。)は、仲間外れを表示する領域である。
 ユーザは、まず、第1の領域で、予測対象を指定する。図10に例示する第1の領域には、予測対象が分類される階層ごとに指定を受け付けるチェックボックスが表示される。図10に示す例では、ユーザが、上位分類である「果汁飲料」を選択したことを示す。なお、ユーザが上位分類を指定した場合、受付部10は、その上位分類の下位分類に属する全ての予測対象(アップルジュース、オレンジジュース、パインジュース、グレープジュース、ピーチジュース)の指定を受け付けたと判断し、出力部40は、下位分類に属する全ての予測対象を指定する表示を自動的に行ってもよい。
 なお、1つの上位分類に属する下位分類の数が多くなることも想定される。そのため、図10に例示する第1の領域の表示方法は、下位分類の表示方法の一例である。出力部40は、例えば、下位分類を表示する領域の部分のみスクロール表示してもよく、別の画面に遷移させて下位分類を表示するようにしてもよい。
 次に、ユーザは、第2の領域で、仲間外れを見つける観点を指定する。図10に例示する第2の領域には、第1の実施形態の変形例で説明した、観点(説明変数)のグループごとに指定を受け付けるチェックボックスが表示される。また、第2の領域には、第2の実施形態で説明したように要素の指定を受け付けない場合を考慮したチェックボックス(変数の種類)が表示される。
 図10に示す例では、ユーザが、グループである「天候」を選択したことを示す。なお、ユーザがグループを指定した場合、受付部10は、グループに属する全ての変数(最低気温、降水量、日照量、平均風速)の指定を受け付けたと判断し、出力部40は、グループに属する全ての変数を指定する表示を自動的に行ってもよい。
 予測対象の指定および仲間外れを見つける観点の指定があると、特定部20は、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する。そして、出力部40は、その特定結果を第3の領域に表示する。
 出力部40は、例えば、図3に例示する形式で仲間外れの予測モデルを表示する。図10に例示する第3の領域には、表の左側の見出しに予測対象が表示され、表の上側の見出しに変数が表示されている。また、表の各セルには、予測対象に対応する予測モデルの変数の係数がそれぞれ表示される。
 例えば、第1の実施形態で説明するように、第2の領域で仲間外れを見つける変数が指定された場合、出力部40は、表の上側の見出しの指定された変数を他の変数よりも強調表示する。また、出力部40は、表の各セルに表示された仲間外れの係数のセルを強調表示する。出力部40は、例えば、ある説明変数について他と異なる傾向を示す係数や、その説明変数を有すること自体を仲間外れとして強調表示する。また、例えば、第2の実施形態で説明するように、変数が指定されない場合、出力部40は、表の左側の見出しの仲間外れの予測対象の欄内を強調表示する。
 図10に示す例では、特に、第1の実施形態及び変形例並びに第2の実施形態の出力例について説明した。図10に例示する画面の構成要素以外にも、受付部10が複数の分類の指定を受け付ける入力欄や、出力結果を決定木で表示する表示欄を設けることで、第3の実施形態および第4の実施形態についても、出力部40は、図10に例示する画面と同様の画面を出力可能である。
 次に、本発明の概要を説明する。図11は、本発明による情報処理システムの概要を示すブロック図である。本発明による情報処理システム80は、予測対象が、その予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理システム80(例えば、情報処理システム100)において、複数の予測対象の指定を受け付ける受付部81(例えば、受付部10)と、指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する特定部82(例えば、特定部20)とを備えている。
 そのような構成により、複数の予測対象の中から特異な予測対象を特定できる。
 また、受付部81は、予測モデルを構成する要素の指定を受け付けてもよい。そして、特定部82は、指定された要素が他の予測対象と異なる傾向を示す予測対象を特定してもよい。
 また、予測モデルは線形回帰式で表されていてもよい。このとき、特定部82は、対応する予測モデルを構成する変数の種類またはその変数の係数が他の要素と異なる傾向を示す予測対象を特定してもよい。
 さらに、情報処理システム80は、特定部82による特定結果を出力する出力部(例えば、出力部40)を備えていてもよい。そして、特定部82は、予測モデルの変数の係数の標準偏差を算出し、出力部は、算出された予測モデルごとの標準偏差をヒートマップで出力してもよい。そのような構成によれば、他の予測対象と異なる傾向を示す予測対象を、ユーザが一見して判断することが可能になる。
 一方、予測モデルは決定木で表されていてもよい。このとき、特定部82は、対応する予測モデルを構成する変数の種類またはその変数の決定木における位置が他の要素と異なる傾向を示す予測対象を特定してもよい。
 また、受付部81は、予測モデルの分類の指定を受け付けてもよい。そして、特定部82は、指定された予測対象の分類のうち、その分類に含まれる予測対象に対応する予測モデルを構成する要素が、他の分類とは異なる傾向を示す分類を特定してもよい。そのような構成によれば、より大域的な観点で分析することが可能になる。
 10 受付部
 20 特定部
 30 記憶部
 40 出力部
 100 情報処理システム

Claims (10)

  1.  予測対象が、当該予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理システムにおいて、
     複数の予測対象の指定を受け付ける受付部と、
     前記指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する特定部とを備えた
     ことを特徴とする情報処理システム。
  2.  受付部は、予測モデルを構成する要素の指定を受け付け、
     特定部は、指定された要素が他の予測対象と異なる傾向を示す予測対象を特定する
     請求項1記載の情報処理システム。
  3.  予測モデルは線形回帰式で表され、
     特定部は、対応する予測モデルを構成する変数の種類または当該変数の係数が他の要素と異なる傾向を示す予測対象を特定する
     請求項1または請求項2記載の情報処理システム。
  4.  特定部による特定結果を出力する出力部を備え、
     特定部は、予測モデルの変数の係数の標準偏差を算出し、
     前記出力部は、算出された予測モデルごとの標準偏差をヒートマップで出力する
     請求項3記載の情報処理システム。
  5.  予測モデルは決定木で表され、
     特定部は、対応する予測モデルを構成する変数の種類または当該変数の前記決定木における位置が他の要素と異なる傾向を示す予測対象を特定する
     請求項1または請求項2記載の情報処理システム。
  6.  受付部は、予測モデルの分類の指定を受け付け、
     特定部は、指定された予測対象の分類のうち、当該分類に含まれる予測対象に対応する予測モデルを構成する要素が、他の分類とは異なる傾向を示す分類を特定する
     請求項1から請求項5のうちのいずれか1項に記載の情報処理システム。
  7.  予測対象が、当該予測対象に影響し得る変数から構成される予測モデルを用いて予測される情報処理方法において、
     複数の予測対象の指定を受け付け、
     前記指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する
     ことを特徴とする情報処理方法。
  8.  予測モデルを構成する要素の指定を受け付け、
     指定された要素が他の予測対象と異なる傾向を示す予測対象を特定する
     請求項7記載の情報処理方法。
  9.  予測対象が、当該予測対象に影響し得る変数から構成される予測モデルを用いて予測されるコンピュータに適用される情報処理プログラムであって、
     前記コンピュータに、
     複数の予測対象の指定を受け付ける受付処理、および、
     前記指定された複数の予測対象のうち、対応する予測モデルを構成する要素が他の予測対象と異なる傾向を示す予測対象を特定する特定処理
     を実行させるための情報処理プログラム。
  10.  コンピュータに、
     受付処理で、予測モデルを構成する要素の指定を受け付けさせ、
     特定処理で、指定された要素が他の予測対象と異なる傾向を示す予測対象を特定させる
     請求項9記載の情報処理プログラム。
PCT/JP2016/001811 2016-03-29 2016-03-29 情報処理システム、情報処理方法および情報処理プログラム Ceased WO2017168460A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/075,238 US20190043066A1 (en) 2016-03-29 2016-03-29 Information processing system, information processing method, and information processing program
PCT/JP2016/001811 WO2017168460A1 (ja) 2016-03-29 2016-03-29 情報処理システム、情報処理方法および情報処理プログラム
JP2018507801A JP6573024B2 (ja) 2016-03-29 2016-03-29 情報処理システム、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/001811 WO2017168460A1 (ja) 2016-03-29 2016-03-29 情報処理システム、情報処理方法および情報処理プログラム

Publications (1)

Publication Number Publication Date
WO2017168460A1 true WO2017168460A1 (ja) 2017-10-05

Family

ID=59963622

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/001811 Ceased WO2017168460A1 (ja) 2016-03-29 2016-03-29 情報処理システム、情報処理方法および情報処理プログラム

Country Status (3)

Country Link
US (1) US20190043066A1 (ja)
JP (1) JP6573024B2 (ja)
WO (1) WO2017168460A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019200625A (ja) * 2018-05-17 2019-11-21 株式会社安藤・間 危険予知活動支援システム、危険予知活動支援方法、及びプログラム
JP2020038520A (ja) * 2018-09-05 2020-03-12 本田技研工業株式会社 商取引情報処理システム
WO2020059136A1 (ja) * 2018-09-21 2020-03-26 日本電気株式会社 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム
WO2022254607A1 (ja) * 2021-06-02 2022-12-08 日本電気株式会社 情報処理装置、差分抽出方法、及び非一時的なコンピュータ可読媒体

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11138912B2 (en) 2019-10-01 2021-10-05 Microsoft Technology Licensing, Llc Dynamic screen modes on a bendable computing device
US20220270046A1 (en) * 2021-02-25 2022-08-25 Portage Insurance Holdings, Inc. Systems And Methods Of Training A Machine Learning Model
US20230032011A1 (en) * 2021-07-29 2023-02-02 Panasonic Intellectual Property Management Co., Ltd. Forecast generating system and method thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011708A (ja) * 2004-06-24 2006-01-12 Toshiba Corp データ分析方法、データ分析プログラム及びデータ分析装置
JP2008192091A (ja) * 2007-02-07 2008-08-21 Intelligent Wave Inc ログ分析プログラム、ログ分析装置及びログ分析方法
JP2009086706A (ja) * 2007-09-27 2009-04-23 Fujitsu Ltd モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011708A (ja) * 2004-06-24 2006-01-12 Toshiba Corp データ分析方法、データ分析プログラム及びデータ分析装置
JP2008192091A (ja) * 2007-02-07 2008-08-21 Intelligent Wave Inc ログ分析プログラム、ログ分析装置及びログ分析方法
JP2009086706A (ja) * 2007-09-27 2009-04-23 Fujitsu Ltd モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019200625A (ja) * 2018-05-17 2019-11-21 株式会社安藤・間 危険予知活動支援システム、危険予知活動支援方法、及びプログラム
JP7274709B2 (ja) 2018-05-17 2023-05-17 株式会社安藤・間 危険予知活動支援システム、危険予知活動支援方法、及びプログラム
JP2020038520A (ja) * 2018-09-05 2020-03-12 本田技研工業株式会社 商取引情報処理システム
WO2020059136A1 (ja) * 2018-09-21 2020-03-26 日本電気株式会社 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム
JPWO2020059136A1 (ja) * 2018-09-21 2021-08-30 日本電気株式会社 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム
JP7136217B2 (ja) 2018-09-21 2022-09-13 日本電気株式会社 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム
WO2022254607A1 (ja) * 2021-06-02 2022-12-08 日本電気株式会社 情報処理装置、差分抽出方法、及び非一時的なコンピュータ可読媒体
JPWO2022254607A1 (ja) * 2021-06-02 2022-12-08

Also Published As

Publication number Publication date
JP6573024B2 (ja) 2019-09-11
US20190043066A1 (en) 2019-02-07
JPWO2017168460A1 (ja) 2018-11-08

Similar Documents

Publication Publication Date Title
JP6573024B2 (ja) 情報処理システム、情報処理方法および情報処理プログラム
JP6604431B2 (ja) 情報処理システム、情報処理方法および情報処理プログラム
JP7120649B2 (ja) 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム
Nenni et al. Demand forecasting in the fashion industry: a review
CN110489457B (zh) 基于图像识别的商品信息分析方法、系统及存储介质
JP2015041121A (ja) 販売予測システム及び販売予測方法
US20210366006A1 (en) Ranking of business object
Nassibi et al. Demand forecasting models for food industry by utilizing machine learning approaches
CN111667337A (zh) 一种商品评价的排序方法和系统
KR102358357B1 (ko) 시장규모추정장치 및 그 동작 방법
Álvarez-Díaz et al. Forecasting US consumer price index: does nonlinearity matter?
WO2017163278A1 (ja) 商品需要予測システム、商品需要予測方法および商品需要予測プログラム
US20170169447A1 (en) System and method for segmenting customers with mixed attribute types using a targeted clustering approach
JP4386973B2 (ja) 階層的予測モデル構築装置及びその方法
CN116029637A (zh) 跨境电商物流渠道智能推荐方法及装置、设备、存储介质
CN105809275A (zh) 一种物品评分预测方法及装置
Hasheminejad et al. ATM management prediction using Artificial Intelligence techniques: A survey
Caudill et al. Estimating class-specific parametric models using finite mixtures: An application to a hedonic model of wine prices
Kim et al. Surviving in the Red Ocean: measuring factors for business excellence among coffee franchises in Korea
CN118396719A (zh) 一种农产品销售线索智能评级与推荐方法及系统
CN111507780B (zh) 提高客单价的方法及装置
Takahashi et al. Forecasting potential sales of bread products at stores by network embedding
Zhang et al. Retail commodity sale forecast model based on data mining
Byun et al. Comparative analysis of the total factor productivity of manufacturing in northeast Asian metropolitan areas
JP2019516143A (ja) 宣伝用ディスプレイ空間のためのスケジュールデータ構造を生成するための方法およびシステム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018507801

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16896682

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 16896682

Country of ref document: EP

Kind code of ref document: A1