CN105409197A - 用于提供持久伙伴装置的设备和方法 - Google Patents
用于提供持久伙伴装置的设备和方法 Download PDFInfo
- Publication number
- CN105409197A CN105409197A CN201480027482.8A CN201480027482A CN105409197A CN 105409197 A CN105409197 A CN 105409197A CN 201480027482 A CN201480027482 A CN 201480027482A CN 105409197 A CN105409197 A CN 105409197A
- Authority
- CN
- China
- Prior art keywords
- pcd
- user
- people
- video
- computer programs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/0003—Home robots, i.e. small robots for domestic use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
- H04N23/661—Transmitting camera control signals through networks, e.g. control via the Internet
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B2217/00—Details of cameras or camera bodies; Accessories therefor
- G03B2217/005—Blur detection
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B2217/00—Details of cameras or camera bodies; Accessories therefor
- G03B2217/007—Details of energy supply or management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Robotics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
Abstract
方法包括:提供使能电信的机器人装置,其适于留存在用户环境中;接收指令以根据时间参数对环境中的一个或多个人拍照;以及根据时间参数对所述一个或多个人拍照,从而产生一个或多个照片。
Description
相关申请的交叉引用
该专利申请要求2013年3月15日提交的美国临时专利申请序列号61/788,732的权益,其由此全部通过引用合并于此。
技术领域
本申请大体涉及持久伙伴装置。特别地,本申请涉及用于提供伙伴装置的装置和方法,该伙伴装置适于持续存在于人的环境中并且与伙伴装置的用户交互来提供对装置的情感投入和/或与关于伙伴装置的用户与伙伴装置的交互的应用、内容、服务或纵向数据收集关联。
背景技术
相关领域描述
尽管例如智能电话和平板计算机等装置具有增加的能力(例如联网特征、高清晰度视频、触摸界面和应用),这样的装置在它们的能力上局限于与人类用户接洽,例如以从与装置交互方面提供伙伴关系和增强情感体验的益处。需要用于提供伙伴关系的改进装置和相关方法和系统。
发明内容
本公开涉及用于提供伙伴装置的方法和系统,该伙伴装置适于持续存在于人的环境中并且与伙伴装置的用户交互来提供对装置的情感投入和/或与关于伙伴装置的用户与伙伴装置的交互的应用、内容、服务或纵向数据收集关联。装置可以是与相关硬件、软件和其他部件交互以对于广泛应用提供富交互的系统的部分,如本文进一步描述的。
根据示范性和非限制性实施例,方法包括提供适于留存在用户环境中的使能电信的机器人装置、接收指令以根据时间参数对环境中的一个或多个人拍照以及根据该时间参数对一个或多个人拍照从而产生一个或多个照片。
根据示范性和非限制性实施例,计算机程序产品驻存在计算机可读介质上,其形成适于留存在用户环境中的使能电信的机器人装置的一部分,该计算机可读介质具有存储在其上的多个指令,这些指令在由处理器执行时促使该处理器执行操作,其包括提供适于留存在用户环境中的使能电信的机器人装置、接收指令以根据时间参数对环境中的一个或多个人拍照以及根据该时间参数对一个或多个人拍照从而产生一个或多个照片。
根据示范性和非限制性实施例,方法包括提供适于留存在用户环境中的远程展示装置以及从该装置收集纵向数据,其包括描述一段时间内装置与用户之间的交互的数据。
根据另一个示范性和非限制性实施例,方法包括:提供有电信能力的远程控制机器人装置,其适于持续留存在人的环境中并且响应于伙伴装置的远程用户的控制而与人交互;以及提供纵向数据收集设施用于收集关于环境中的人和伙伴装置的远程用户中的至少一个与伙伴装置交互的数据。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户的环境中并且与该用户交互,该装置包括动画用户界面;以及利用该装置以经由用户界面从用户收集数据。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中并且经由模拟与用户的动画交互的用户界面而与用户交互;使装置适应于手可携带以帮助使装置与用户一起移动通过用户环境并且用稳定化设施来更改装置以使装置能够稳定地安置在用户环境中的不平坦表面上。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;从装置收集纵向数据,其包括描述装置与用户之间的交互的数据;以及提供机器学习设施,用于至少部分基于收集的数据来提高交互的质量。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;从装置收集纵向数据,其包括描述装置与用户之间的交互的数据;确定装置与用户之间的交互的成功的测量;以及基于应用机器学习设施,更改交互、迭代地确定对成功测量的影响并且改进一段时间内的交互。
根据另一个示范性和非限制性实施例,方法包括提供适于留存在用户环境中的远程展示装置,其中所述装置适于稳定安置在典型用户环境的多个表面上,所述表面包括至少一个不平坦表面,并且其中装置适于手可携带通过用户环境。
根据另一个示范性和非限制性实施例,方法包括提供适于留存在用户环境中的远程展示装置,其中所述装置适于持久感知用户环境的社交线索并且其中装置适于手可携带。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中并且经由提供与用户的社交、动画式交互的用户界面而与用户交互;使装置适应于手可携带以帮助使装置与用户一起移动通过用户环境;用稳定化设施来更改装置以使装置能够稳定地安置在用户环境中的不平坦表面上;以及提供机器人装置的社交数据收集模块,用于从用户环境收集社交线索数据。
根据这样的实施例,社交数据收集模块从由指示用户的社交姿态的传感器数据、指示用户的社交面部表情的传感器数据、指示用户的社交话音的话音识别数据、指示用户环境中其他个体存在的运动数据、指示用户在机器人装置上的社交触摸的触摸数据和指示来自用户环境的远程个体的社交通信的通信数据组成的组选择数据。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;在装置处从用户接收多个言语信号和非言语信号;以及响应于多个接收的言语信号和非言语信号来更改装置的行为。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;在装置处从用户接收多个言语信号和非言语信号;以及响应于多个接收的言语信号和非言语信号来更改装置的行为,其中更改基于更改库并且更改基于确定由来自用户的言语和非言语信号所指示的交互类型而可能从库选择以改善装置与用户的融洽关系,其中更改通过将融洽关系测量馈送给机器学习设施并且在该机器学习设施的控制下更改装置与用户的交互而改进。
根据另一个示范性和非限制性实施例,方法包括提供适于留存在用户环境中的远程展示装置并且经由装置向用户表达截然不同的装置角色。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示机器人装置,其适于留存在用户环境中;实现机器人装置的多个角色模块,每个角色模块实现截然不同的机器人装置特征,其适于对机器人装置提供角色;确定用户的至少一个特质;以及基于确定的特质,选择和更改(其中的至少一个)机器人装置角色,其中角色模块控制机器人装置的讲话音量、机器人装置的讲话模式、机器人装置所使用的社交表达库、机器人装置所使用的姿态库、机器人装置上动画的出现、机器人装置所使用的内容库和机器人装置对用户环境中的社交线索的响应性中的至少一个。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;从装置传送一个或多个社交线索(其包括培育请求);以及响应于一个或多个社交队列从用户接收一个或多个培育响应。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中;以及从装置传送一个或多个线索,其中每个线索招致用户对装置培育行为。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;提供感测设施和数据收集设施中的至少一个,用于收集关于装置的用户、装置的用户与伙伴装置的交互以及装置的用户的环境中的至少一个的信息;以及基于收集的信息预料用户的需求状态。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中;提供感测设施和数据收集设施中的至少一个,用于收集关于装置的用户、装置的用户与伙伴装置的交互以及装置的用户的环境中的至少一个的信息;分析收集的信息来预料和确定用户的需求状态;以及更改机器人装置的行为来解决确定的需求状态。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;识别用户的需求区;以及在该需求区中经由发送基于文本的消息和连接到社交媒体网站这两者中的至少一个提供家庭成员和朋友中的至少一个到用户的连接。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中;识别用户的需求区;提供家庭成员和朋友中至少一个到用户的连接;以及将需求区传达给社交网络环境中的至少一个家庭成员或朋友,通信包括经由机器人装置的电信能力与用户交互的邀请。
根据另一个示范性和非限制性实施例,方法包括:提供远程展示装置,其适于留存在用户环境中;识别用户的需求情感;以及执行至少一个触发器来触发与情感需求关联的锚。
根据另一个示范性和非限制性实施例,方法包括:提供使能电信的机器人装置,其适于留存在用户环境中;使用数据收集设施和传感器中的至少一个来收集指示用户情感状态的数据;分析收集的数据以基于情感状态识别用户的情感需求;以及触发与识别的情感需求关联的机器人装置的锚定行为。
附图说明
在图(其不必按比例绘制)中,类似的数字可始终描述若干视图中的大致相似部件。具有不同字母后缀的类似数字可代表大致相似部件的不同实例。图大体上通过示例而非限制的方式图示在本文献中论述的某些实施例的详细描述。
图1图示根据示范性和非限制性实施例的PCD的许多视图;
图2图示根据示范性和非限制性实施例的PCD的软件架构;
图3图示根据示范性和非限制性实施例的心理-社交交互模块(PSIM)的架构;
图4图示根据示范性和非限制性实施例、示出PCD的问候交互的简化版本的任务网络;
图5图示根据示范性和非限制性实施例的PCD的硬件架构;
图6图示根据示范性和非限制性实施例的PCD的机械架构;
图7图示根据示范性和非限制性实施例、用于提供呼叫应答和消息传递服务的方法的流程图;
图8图示根据示范性和非限制性实施例由PCD中继故事的方法的流程图;
图9图示根据示范性和非限制性实施例、通过使用PCD来指示和/或影响用户情感状态的方法的流程图;
图10图示根据示范性和非限制性实施例由PCD实现故事表演或动画特征的方法的流程图;
图11图示根据示范性和非限制性实施例、用于产生背景故事并且对背景故事编码的方法的流程图;
图12图示根据示范性和非限制性实施例、用于访问交互数据并且使用它来解决用户需求的方法的流程图;以及
图13图示根据示范性和非限制性实施例、用于基于用户输入来调整PCD行为的方法的流程图。
具体实施方式
根据示范性和非限制性实施例,提供并且描述有持久伙伴装置(PCD),用于持续存在于人/用户的环境中并且与伙伴装置的用户交互。如下文更充分描述的,PCD对持久的社交存在提供截然不同的角色,其通过移动、图形、声音、光、气味而富有表现力。在下文进一步引入有对PCD的每个实施例的“数字灵魂”伴随者的概念。如本文使用的,“数字灵魂”指能够采用数字格式存储、充当输入以用于由PCD确定并且执行动作的多个属性。如本文使用的,“环境”指在用户附近(足以允许由PCD的传感器观察用户)的用户的物理环境。
该数字灵魂操作成经由对PCD的交互/界面的社交-情感/人际关系感伴随者在社交交互和融洽关系构建活动中与用户接洽。如下文更充分描述的,PCD100可对它的用户执行很多种功能。根据下文详细描述的示范性和非限制性实施例,PCD可(1)推动并且支持人/用户之间更有意义的参与式、物理嵌入、社交定位的交互以及(2)可参与功利化任务的执行,其中PCD充当助手或提供个人服务的某物,其包括但不限于对用户提供有用信息、帮助调度、提醒、提供特定服务(例如充当摄影师)以帮助家庭创建/保留/共享家庭故事和知识(例如,特殊配方)等,以及(3)娱乐用户(例如,故事、游戏、音乐和其他媒体或内容)并且提供陪同和伙伴关系。
根据示范性和非限制性实施例,PCD的各种功能可经由多个操作模式来完成,这些操作模式包括但不限于:
i.经由拟人化界面,可选地表达不同个性特质的范围,其包括可随时间更改以提供改善伙伴关系的特质。
ii.通过富有表现力的温暖的人性化界面,其可输送信息以及感情。如下文描述的,这样的界面可通过许多线索来表达情感、感情和个性,这些线索包括面部表情(通过动画或移动)、身体移动、图形、声音、话音、颜色、光、气味及类似物。
iii.经由跨多个源(传感器、数据、来自其他装置的信息、互联网、GPS等)获取语境化纵向信息来使PCD日益对它的用户调整、更改和调谐。
iv.经由自适应自我配置/自愈以更好匹配用户的需求/希望。
v.经由考虑特定情形和它的用户的社交和情感细节。
参考图1,图示有根据示范性和非限制性实施例的PCD100的许多视图。如图示的,PCD100包含许多示范性输入/传感器装置,其包括例如电容传感器102。一个或多个电容传感器102可操作成感测物理社交交互(其包括但不限于按抚、拥抱、触摸及类似物)以及潜在地充当用户界面。PCD100可进一步包含触摸屏104作为这样的装置,其配置成从用户接收输入以及对于由PCD100向用户输出数据起到图形显示器的作用。PCD100可进一步包含一个或多个拍摄装置106,用于接收视觉特征(其包括但不限于静态图像和视频)的输入。PCD100可进一步包含一个或多个操纵杆108,用于从用户接收输入。PCD100可进一步包含一个或多个扬声器110,用于发出或用别的方式输出音频数据。PCD100可进一步包含一个或多个麦克风112。
PCD软件架构
参考图2,图示有描绘根据示范性和非限制性实施例的软件架构200的框图。该软件架构200可适应于例如人工智能、机器学习等技术,和关联的软件和硬件系统,其可使PCD100能够为生活提供经验,作为可通过机器人实施例以及通过跨广泛应用的连接装置而与人接洽的情感共鸣角色。
根据示范性和非限制性实施例,与PCD100关联的智能可分成一个或多个类别,其可将人类社交代码编码成机器。在一些实施例中,这些一个或多个类别可以是PCD的认知-情绪架构的基础。一个或多个类别可包括但不限于心理-社交感知、心理-社交学习、心理-社交交互、心理-社交表达及类似物。智能的心理-社交感知类别可包括人类社交线索(例如,视觉、听觉、触觉)的集成机器感知,用于支持PCD100的自然社交界面和远场交互。心理-社交学习类别可包括算法,PCD100可通过其通过直接交互并且经由来自PCD100和装置生态系统所捕获的多模态数据的数据分析来获悉人的身份、活动模式、偏好和兴趣。PCD可记录进入它的近场或远场通信范围的人的语音样本并且利用语音识别系统来获得检测的人的身份和个人数据。此外,PCD可检测在BLE使能装置的探索频道中广播的UUID并且对与装置用户关联的个人数据解码。PCD可使用获得的身份和个人数据以从像Facebook、Twitter、LinkedIn或相似物的社交网站获取额外个人信息。PCD可宣告在它的近场或远场通信范围中检测的人的存在和身份连同建立的人的个人简档的显示。
心理-社交交互类别可使PCD100能够进行预应式决策制定过程以便支持任务和活动,以及构建与人的信任和情感纽带的融洽关系构建技能-全部通过语言和多模态行为。智能的心理-社交表达类别可使PCD100能够编排它的多模态输入以“显得逼真”、活跃内容并且通过话音、移动、图形、声音和灯光的编排来与作为情感上协调的角色的人接洽。架构200可包括这样的模块,其对应于多模态机器感知技术、话音识别、富有表现力的话音合成,以及利用成本有效性的硬件模块(即,移动装置共同的部件)。如在图1中图示的,在PCD100内提供有一个或多个软件子系统并且这些一个或多个子系统将在下文更详细描述。
心理-社交感知
PCD100的心理-社交感知可包括:听觉感知,其可用于操控语音输入;和视觉-空间感知,其可用于评估用户的位点、捕获用户的情感、识别用户的身份和姿态并且维持与用户的交互。PCD100的听觉感知可使用麦克风202阵列、一个或多个信号处理技术(例如204)和自动话音识别模块206来实现。此外,听觉感知可以交互式社交机器人的唯一感觉和处理要求通过利用为移动计算生态系统创建的部件和技术来实现。PCD100可包括硬件和软件用于经由使用麦克风阵列202的话音和使用信号处理模块204a的噪声消除技术以及第三方技术方案来支持多模态远场交互以帮助自动话音识别模块206和听觉场景分析。
PCD100可配置成适应于听到并且理解在嘈杂环境中人们在说什么。为了这样做,声音信号可在将它传递到自动话音识别器(ASR)模块206之前被传递通过信号处理模块204a。声音信号被处理以使话音与静态和动态背景噪声、回声、马达以及甚至谈话的其他人隔离以便提高ASR的成功率。
根据示范性和非限制性实施例,PCD100可配置成在空间配置中使用至少4个MEMS麦克风的阵列。此外,可采用基于声音到达时间的算法(在本文称为波束形成算法)以在特定方向上隔离声音。使用全部六个麦克风信号、方向向量和麦克风的放置,波束形成算法可隔离源自特定空间源的声音。波束形成算法可通过同时允许多个波束而能够提供关于声音的多个源的信息。另外,话音-非话音检测算法可能够识别话音源,并且提供扬声器的空间定位。在一些实施例中,波束形成信息可与PCD100的视觉和感知系统集成以便选择方向以及转变和取向的马达能力。例如,3D传感器可用于在3D空间中检测人头部的位点并且因此可将方向传达给波束形成算法,其可在将源自感测位点的声音传给ASR模块206之前隔离它们。
在操作期间,PCD100可通过讲话或制造噪声来产生声音。信号处理模块204a可配置成防止这些声音被反馈通过麦克风阵列202并且进入ASR模块206。为了去除扬声器噪声,信号处理模块204a可采用可从麦克风所接收的信号扣除馈送给扬声器的信号的算法。为了减少谐波丰富的马达噪声,PCD100可配置成实现机械方法和信号处理技术。
在一些实施例中,PCD100可监视马达的不同口以便解决从马达的这些部件产生的噪声。在示例中,PCD100可配置成将马达安装在弹性材料中,其可吸收可由电枢轴承采用呼呼声的形式产生的高频率。马达可包括刷子,其可产生仅在马达高速旋转时明显的咝咝声。因此,PCD100可以相对低的速度展现动画和移动以便避免咝咝声。另外,PCD100可配置成实现较低齿轮比并且另外通过降低马达速度以便防止咝咝声。典型地,较低质量PWM驱动器(像在业余伺服器中发现的那些)可产生嘎嘎高音。PCD100可配置有质量良好的PWM驱动器以便消除该部分的马达噪声。一般,马达的齿轮可引起较低音调的研磨声,其占据马达噪声的大部分。末端齿轮传动可承担传动系统中的大部分转矩,并且从而是大部分噪声的源。PCD100可配置成用摩擦传动替代末端齿轮传动以便使该噪声源最小化。另外,PCD100可配置成采用信号处理技术以便减少由马达产生的噪声。在实施例中,麦克风可紧挨着每个马达放置使得噪声信号可从主麦克风阵列202中的信号扣除。
PCD100的音频管道的输出可将净化的音频源馈送入ASR模块206,其可将话音转换成文本并且可能转换成富有有意义置信度的备选竞争词假说,例如使用ASR的n-best输出或词阵列。话音(词)的文本表示然后可被解析以理解用户的意图和用户的提供信息并且最终变换成符号表示(语义)。ASR模块206可以正常音量和对应于典型人际通信距离的距离识别来自用户的话音。在示例中,该距离可以接近5-6英尺或更大,其取决于众多环境属性(包括环境噪声和话音质量)。在示例中,话音识别范围应涵盖典型的12英尺×15英尺房间的区域。馈送给ASR模块206的信号将是麦克风阵列波束形成算法的结果并且可源自围绕扬声器大约+/-30度的声学角。相对窄的声学角可允许积极减少背景环境噪声的部分和回响,其是差的话音识别准确性的主要原因。在话音信号太低的情景中,例如由于扬声器太远离麦克风或扬声器的声音很轻,PCD100可预应式地请求扬声器靠近点(例如,如果扬声器的距离如由3D传感器确定的那样可用)或说得更大声,或两者兼而有之。在一些实施例中,PCD100可配置成采用实时嵌入式ASR技术方案,其可以语法和统计语言模型(SLM)支持大的词汇识别。此外,声学ASR模型可使用来自声学装备的数据来训练/调谐以便提高话音识别率。
根据示范性和非限制性实施例,PCD100可配置成包括自然语言处理层,其可夹在ASR模块206与PCD100的交互系统之间。该自然语言处理层可包括自然语言理解(NLU)模块,其可采取由ASR产生的文本并且对该文本赋予意思。在一些实施例中,NLU模块可配置成适应于例如扩充巴科斯范式(BNF)标记、java语言语法格式(JSGF)或话音识别语法格式(SRGF),其可由上文提到的嵌入式话音识别器支持。因为收集越来越多的用户话音,PCD100可逐渐将传统语法变换成统计语法,其可提供更高话音识别和理解性能,并且允许自动数据驱动更改。
根据示范性和非限制性实施例,PCD100可配置成对于每个交互任务使用多模态对话系统用户界面设计原理来设计结构化交互流(基于为PCD100的大脑采用的任务网络表示)。交互流可设计成相继(例如,一次一个输入)或同时(例如,输入可按接收它们的顺序独立处理)接收多模态输入(例如,语音和触摸)并且产生多模态输出(例如,语音提示、PCD的移动、显示图标和文本)。作为示例而非作为限制,PCD100可询问是/否问题,PCD100的眼睛可变成具有可由一个或多个触摸传感器选择的是/否图标的问号形状。在实施例中,PCD100可适于处理可表达意图的自然语言交互(例如,嘿!让我们拍照!)。在实施例中,交互可采用“定向对话”方式跟进。例如,在已经识别拍照的意图后,PCD100可询问定向问题,用于确认刚刚听到什么或请求额外信息(例如你想让我给你拍照吗?)。
视觉-空间感知
根据示范性和非限制性实施例,PCD100可配置成采用一个或多个视觉-空间感知传感器(例如RGB拍摄装置212、深度拍摄装置214和其他传感器)以便接收2D视觉、3D视觉或感测运动或颜色。PCD100可配置成获得周围环境中用户的情感感知。例如,PCD100可检测每个人的表达情感状态。PCD100可包括视觉-空间感知子系统,用于保持跟踪用户和环境的时时物理状体。该子系统可向其他内部软件模块呈现用户的当前状态估计作为动态更新的共享数据结构,叫作局部感知空间(LPS)208。LPS可通过在以PCD100的当前位点为中心的单个3D坐标系中组合多个感觉输入流而构建,而传感器可使用可解释他的移动的运动变换而在3D中配准。在实施例中,LPS208可设计成维持多‘级别’信息,每个进入更高级别的细节并且可需要处理和关键传感器输入。LPS208级别可包括:
人检测:该级别可检测在附近环境中存在的人。例如,PCD100可使用传感器计算附近人的数量。在实施例中,可采用系统中的视觉运动队列来对PCD100定向。此外,热释电红外(PIR)感测和简单麦克风输出可集成以对微控制器实现唤醒使得系统可以处于低功率‘睡眠’状态,但可仍对进入房间的某人作出响应。这可与视觉运动线索和颜色分割模型结合来检测人的存在。检测可与LPS208集成。
人跟踪:PCD100可配置成在3D中定位人并且因此使用例如视觉、深度、运动、声音、颜色、特征&主动移动等传感器来确定人的轨迹。例如,视觉运动检测和3D人检测的结合可用于定位用户(尤其是他们的头部/面部)。此外,LPS208可适于包括时间模型和其他输入来操控闭塞和更加同步的人。除运动和3D线索外,系统可在线从图像获悉(从移动区和3D)颜色分割模型(朴素贝叶斯)以自适应地使用户面部和手与背景分离并且使多个输入的结果与LPS208的空间和时间滤波组合来对系统提供鲁棒的人位点检测。
人识别:PCD100可使用对于人ID的视觉传感器、听觉传感器或触摸输入来识别已知或未知的人。在示例中,一个或多个开源OpenCV库可用于面部识别模块。另外,人跟踪信息和运动检测可组合来识别对于面部检测是候选的图像区的有限集。
位姿/姿态跟踪:PCD100可使用视觉分类(例如,面部、身体位姿、骨架跟踪等)或触摸映射来识别每个人的位姿或姿势。在实施例中,3D数据集可用于使该特征与PCD100的传感器模态合并。在示例中,开源姿态识别工具包可适应于基于视觉和3D视觉特征跟踪来加速自定义姿态识别。
关注焦点:PCD100可配置成确定聚焦区使得PCD100可指向或看着确定的聚焦区。各种传感器可组合成对于关注焦点的位点/方向集。例如,人的估计位点可在LPS208中产生关注焦点位点集。这些可以是对于人的估计的最大可能位点,连同对于指定位点的关注驱动的置信度。焦点和方向集通过置信度来定级并且产生供其他模块使用的LPS208数据的总体概要。PCD100可使用这些焦点和方向来选择注视目标以便直接对用户寻址并且在多个用户之间无缝地‘转移它的视线’。另外,这可允许PCD100机器人查看较低-置信度位点来确认附近用户的存在。
根据示范性和非限制性实施例,PCD100可配置成在系统中包括活动估计或可包含更多的传感器模态,用于通过语音输入以及来自语音韵律的情感状态的估计来跟踪和识别。LPS208可使用对于处理的输入特征的基于网格的粒子滤波模型来组合来自多个输入的数据。当存在必须通过PCD部件上的进一步感测和动作解决的明显的不确定时,粒子滤波可对于用户物理状态的鲁棒在线估计以及多个假说情况的表示提供支持。粒子滤波技术还可自然地允许相关属性和感觉输入的混合物组合成物理可测量用户状态的单个概率模型而不需要联合分布的显式、闭式模型。此外,基于网格的粒子滤波器可有助于在单个坐标系中融合3D(立体)和2D(视觉)感测的输入并且实施空间在任何指定时间可被仅仅一个对象占据这一约束。
根据示范性和非限制性实施例,PCD100可配置成包括启发式建议分布和启发式过渡模型,其可有助于随时间捕获模型用户状态,甚至在PCD100可未直接看着它们时也如此。这可允许PCD100使用言语和非言语线索的自然轮流多方会话并且可容易在粒子滤波框架内适用。因此,这可允许采用有原则的方式使鲁棒的统计估计与以人为中心的启发法组合。此外,LPS208可从重复迭代获悉先验概率分布并且将适应于人可自走廊、门出现并且绕过柜台的空间中的‘热点’,并且可使用该空间信息来自动对准对于用户的最相关位点。低级图像和信号处理代码可被定制并且基于例如OpenCV、集成视觉工具包(IVT)、通用数字处理特征和处理器特定优化库等质量开源工具。
根据示范性和非限制性实施例,PCD100可配置成从视频流识别各种级别的情感,例如喜悦、生气、轻视、厌恶、害怕、悲伤、困惑、受挫和惊讶。在实施例中,PCD100可配置成确定头部位置、性别、年龄以及是否有人戴眼镜、具有面部毛发等。
根据示范性和非限制性实施例,音频输入系统聚焦在用户上。在一些实施例中,PCD100可配置成例如根据机器人移动、关注方向的运动和估计3D聚焦来实时更新音频波束形成功能的方向。这可允许PCD100选择性地倾听特定‘传感器’,其中存在相关和主动音频输入。这可通过与全3D人感测和关注焦点的集成来提高ASR和NLU功能的可靠性。
空间概率获悉
根据示范性和非限制性实施例,可采用空间概率获悉技术以有助于PCD100在用户进入与他同在时更顺利地接洽。随着时间的过去,PCD100可记得用户的到达和联合存在序列并且对于指定房间使这些统计信息累积。这可给予PCD100预测用户在进入房间时的接洽规则,并且由此可使PCD100能够持续指定时段转动扇区并且甚至猜测房间的占有者。例如,该特征可对PCD100提供使用有限预测以在PCD100可充分识别有人进入房间之前支持像“嘿,比尔是你吗?”这样的交互。PCD100可最可能转向空间方向来导致在一天的该时间在相同时间看到有人。
心理-社交交互
根据示范性和非限制性实施例,PCD100可以是全自主的人为形象。PCD100可具有情感、可选择他自己的目标(基于用户输入)并且执行闭环实时控制系统来实现那些目标以使用户保持愉快和健康。心理-社交交互模块(PSIM)是闭环离散时间控制系统的顶层,其可处理传感器的输出并且为输出和表达选择动作。各种支持过程可在CPU上并发进行,并且感觉输入可异步交付给决策制定模块。“滴答(tick)”是决策周期,其中PCD100的累积传感器信息、当前短期记忆/知识和任务驱动的意向状态可组合以选择新的动作和表达。
图3A描绘根据示范性和非限制性实施例的PSIM300的架构。PSIM300的核心是执行程序302,其编排其他元件的操作。执行程序302负责PCD100的大脑的定期更新。PSIM300的每个“滴答”可包括采用下列方式朝向心理-社交表达模块发出新命令移动的处理步骤集。
内部更新:
a.情感更新
b.目标选择
输入操控:
a.对来自心理-社交感知304的异步输入采样并且将其更新为决策模块的黑板306。
b.输入可包括例如人位点、面部ID样本等信息,并且解析的NLU话音形成各种用户。
c.仅仅可需要更新为黑板306的新信息可表现得像高速缓存。
d.另外,可需要捕获与当前任务相关的信息。
查询操控:
a.来自知识查询操作的结果从心理-社交知识库308采样为黑板306。
b.这可收集查询操作的延期处理的结果以供在当前决策中使用。
任务网络310:思考/更新
a.执行程序302可运行任务网络310的“思考”操作并且在每个级做出任何必需的动作和决策。任务网络310中的活动节点集可在该过程期间更新。
b.任务网络310是充当机器人交互的分级控制器的基于状态机的逻辑的灵活形式。
输出操控:
a.加载到特定黑板306框架的输出被传输到心理-社交表达模块312。
根据示范性和非限制性实施例,执行程序302还可提供任务网络310中任务的异步派遣的重要服务。网络310中的任何任务可能够通过请求异步派遣来执行任何计算密集型工作而使计算延期到并发背景线程。该特征可允许任务网络310编排重量级计算和作为动作的事情(像使网络I/O缓慢或甚至阻断网络I/O)而不“阻断”决策周期或改变PCD100的决策过程的反应性。在一些实施例中,执行程序302可派遣规划操作,其产生任务网络310的新段并且它们将动态附连到执行树以在产品智能成熟时通过规划能力来扩展操作。任务网络310可设想为并发分层有限状态机(CHFSM)的形式。然而,行为树设计所使用的方法在允许人类设计师和软件工程师一起工作以在内容管道内创建交互式体验方面取得巨大成功。任务网络设计可采用传统的编程语言实现任务的清晰、有效实现和组成。
图4图示任务网络,其示出PCD100的问候交互的简化版本。任务网络310的架构使各种表达、移动、感测动作和话音能够在引擎内集成,并且由此给予设计师对PCD100的交互动态的完全控制。如图示的,网络的微小部分在操作期间在任何时间是活跃的。作为内容创建的部分,视觉任务网络表示可用于在技术和设计受众两者中通信。在该示例中,PCD100的PIR传感器检测到进入区域的人。PCD100感知PCD100可需要问候某人并且开始“问候用户”序列这一事实。该“问候用户”序列可使跟踪动作线索初始化并且然后说“你好”,而在他们接近时更新对用户的跟踪。PCD100可保持更新数据输入来捕获用户的面部ID。在该情景中,ID表明它是Jane,因此PCD100移动到序列的下一个部分,其中PCD100可形成检查Jane如何在做的话音并且打开他的ASR/NLU处理窗口以为响应做准备。一旦Jane说些什么,知识查询可用于将话音分类为“好”或“坏”并且PCD100可对Jane形成合适的物理和话音反应来完成他的问候。网络可传达智能如何工作的概念。
心理-社交表达
根据示范性和非限制性实施例,PCD100可配置成包括引擎,其可补充PCD100的社交性。例如,引擎可包括标签系统,用于修改语音输出。引擎可允许控制PCD100的语音质量。在示例中,录音可由配音演员完成以便控制PCD100的语音。引擎可包括例如对于嵌入式装置的高质量压缩音频文件和简单定价模型等特征。此外,PCD100可包括:动画引擎,用于对身体关节旋转提供动画;图形、形状、纹理和颜色;LED灯光,或情绪着色;计时;和PCD100的任何其他表达方面。这些动画可以伴有例如音频线索、语音、看(seent)等其他表达输出。动画引擎然后可以不同的速度、转变并且在曲线之间播放动画的全部或部分,同时使它与程序动画实时混合。该引擎可灵活适应不同的PCD模型、几何形状和自由度。
动态对准
根据示范性和非限制性实施例,PCD100可配置成采用算法,其可在程序上使PCD100朝3D空间中的点取向。PCD100的眼睛可似乎固定在单个点上,而PCD100的身体可在播放独立动画,或眼睛可领先,而身体可跟着在特定方向上指示。在实施例中,可使用用于计算PCD的查看目标的闭式几何解算器。该目标位姿然后馈送入多目标混合系统,其可包括对加速约束、加性混合/分层和模拟VOR(前庭眼反射)的支持。
模拟
根据示范性和非限制性实施例,动画引擎可包括模拟器,其可播放动画和程序动画并且事实上使它们混合。模拟器可模拟感觉输入,例如面部检测。在一些实施例中,可构建到虚拟模型的物理模拟,从而考虑机器人的质量、马达的功率和机器人的当前抽运极限(currentdrawlimits)来验证和测试动画。
眼睛
根据示范性和非限制性实施例,人身(例如,PCD100的眼睛)的图形表示可使用接头来构造以允许它使自己变成和成型为不同对象。眼睛图形引擎可使用自定义动画文件来使虹膜变成不同形状、眨眼、改变它的颜色以及改变纹理来允许全方位的表达。
图形
PCDAPI可支持在2D场景图形风格界面中图形、照片、动画、视频和文本的显示。
平台和生态系统
PCD100是基于高度集成、高性能嵌入式Linux系统的平台,其与移动装置“伙伴”应用的生态系统、基于云的后端和具有可购买内容和功能性的在线商店耦合。
PCDSDK
PCDSDK可利用现代web开发社区的Javascript和开放语言以便提供开放且灵活的平台,在其上第三方开发者可以添加低学习曲线能力。由PCDSDK创建的所有PCD应用、内容和服务可用于从PCD应用商店下载。PCD功能(其包括TTS、感觉感知、NLU、动画和其他)中的全部将通过PCDAPI而可用。该API使用NodeJS、在V8顶部建立的JavaScript平台、Chrome的开源JavaScript引擎。NodeJS使用事件驱动模型,其快速且高效并且很好地转化成机器人编程。NodeJS伴随着过多的开箱即用功能性并且可容易扩展为附加物。PCD的API将是NodeJS附加物。因为附加物也容易被去除或修改,开发者能够与PCD交互所采用的方法可受到控制。例如,开发者可创建出站插座,但也限制出站连接的数量。
云架构
根据示范性和非限制性实施例,复杂的基于云的后端平台可用于支持PCD的智能、检索新鲜内容并且使人能够与他们的家庭保持联系。家里的PCD装置可经由Wi-Fi连接到云中的PCD服务器。对PCD云服务器的接入依靠高度安全且加密的web通信协议。可为可支持活跃的PCD用户、照料者和家庭成员的iOS、Android和HTML5开发各种应用。利用这些移动和web应用,PCD100可在众多装置上总是和你在一起,从而提供帮助并且始终获悉如何更好地支持你的偏好、需求和兴趣。参考图2,PCD100可配置成在云中监视可使得PCD100对他的家庭唯一的数据,使得用户可以容易升级到未来PCD机器人版本并且保护它们建立的角色和关系。例如,PCD的服务器可配置成在云存储214中收集数据并且从PCD机器人和其他连接装置计算度量以允许机器学习算法改进用户模型216并且更改PCD角色模型218。此外,在云存储214处收集的数据可用于分析什么PCD特征最能与用户共鸣,并且理解跨PCD生态系统的使用模式,以便持续改进产品供应。
根据示范性和非限制性实施例,基于云的后端平台可包含数据库系统,以用于意在在众多PCS之间共享的数据的存储和分配。基于云的后端平台还可托管服务应用以在识别人(例如语音ID应用)和通过与社交网络的互工作来聚集个人多模态数据方面支持PCD。
基于云的服务器
根据示范性和非限制性实施例,一个或多个PCD100可配置成使用基于RESTful的web服务、使用压缩JSON来与基于云的服务器后端通信。
安全性
根据示范性和非限制性实施例,零配置网络协议连同OAUTH认证模型可用于验证身份。此外,apacheshiro可提供围绕作用和许可的额外安全性协议。所有敏感性数据将通过SSL发送。在服务器侧上,使用严格防火墙配置(采用OAUTH)来获得内容令牌的数据可受到保护。另外,对基于云的服务器的所有调用可需要具有有效的内容令牌。
内容交付
根据示范性和非限制性实施例,使用服务器API,其包括web服务调用来得到对于指定PCD装置的最新内容。该web服务可提供高级调用,其在简洁、紧凑的工作清单中返回所有待审消息、警报、更新列表(例如,购物、提醒、签入及类似物)和其他内容。PCD机器人然后可基于它的当前日程机会性地检索在该清单中表示的待审数据。在一些实施例中,PCD的现实性是在云中,这意指列表、提醒、嵌入和其他应用状态的主记录被存储在PCD服务器上。为了确保机器人可访问最新内容,API可被频繁调用并且机会地收集内容(但采用及时方式)。
工作流程管理
根据示范性和非限制性实施例,可使用卸载给云并且将未实时返回结果的功能性。这可紧密地与上文论述的基于日程的消息排队的概念一致。另外,它可牵涉服务器架构,其可允许在RESTfulweb服务API上进行服务的请求并且给应用服务器派遣工作。AmazonSimpleWorkflow(SWF)或相似的工作流程可用于实现这样的系统连同传统消息排队系统。
更新
根据示范性和非限制性实施例,可需要更新的内容可包括PCD100的操作系统内核、固件、硬件驱动器、V8引擎或伙伴应用。对这些内容的更新可通过返回关于可用更新的类型的信息并且允许特定项请求的web服务而可用。因为PCD通常将需要机会地避免扰乱在机器人可以引用更新时它可以请求更新的用户活动。某些类型的更新的可用性可推送给机器人,而不是依靠PCD机器人定期轮询更新。
记录/度量
根据示范性和非限制性实施例,PCD100可向服务器发送日志信息。服务器可将该数据存储在合适的容器(SQL或NoSQL)中。例如Hadoop(AmazonMapReduce)和Splunk等工具可用于分析数据。度量也可以是可查询的,使得报告可关于人们如何与PCD100交互以及如何使用PCD100来运行。这些分析的结果可用于关于PCD如何学习、交互和表现并且也关于在未来更新中可需要什么特征来调整参数。
机器学习
根据示范性和非限制性实施例,可开发各种训练系统和反馈环以允许PCD机器人和基于云的系统持续改进。PCD机器人可收集可以用于训练机器学习算法的信息。一定量的机器学习可在机器人自身上出现,但在云中,可从许多源聚集数据来训练分类器。基于云的服务器可允许通过向人类编码器发送一定数量的数据在低概率地被正确听见、看到或理解的情况下理清内容而确定地面实况。一旦创建新的分类器,它们可通过上文论述的更新系统发出。分类器/预计器的机器学习和训练可跨越监管、无人监管或强化学习方法与地面实况的更复杂人类编码两者。训练信号可包括PCD机器人完成由用户产生的任务或显式反馈(例如言语、触摸提示、笑脸、姿态等)的知识。使来自拍摄装置的图像(其可包括面部和音频数据)聚集可用于提高云中那些相应系统的质量。
远程展示支持
根据示范性和非限制性实施例,可使用远程展示特征,其包括视频会话选项。此外,启用围绕视频会话的安全性模型来确保用户的安全性。另外,可使用web应用以及同样移动装置应用,其利用作用、许可和安全性基础设施来保护最终用户以免视频会话能力的未经授权使用。
软件基础设施
PCD的软件系统的高级能力建立在鲁棒且能胜任的嵌入式Linux平台上,其用关键库、板支持、驱动器和其他依赖性来定制以对我们的高级软件系统提供整洁、鲁棒、可靠的开发环境。顶级功能模块在我们的嵌入式Linux系统中实现为进程。PCD的模块基础设施专门以采用JavaScript支持灵活的内容脚本、交互和行为为目标,同时基于语言库支持采用C++和C的计算征税操作。它建立在V8JavaScript引擎和成功的Nodejs平台上,其具有封装为C++模块和库的关键扩展和支持。
硬件系统架构
图5A图示PCD100的硬件架构,可被工程化来支持PCD100的一个或多个能力的感觉、马达、连接性、功率和计算需求。在一些实施例中,PCD100的一个或多个硬件元件是核心硬件的专门化和适应,其在高端平板和其他移动装置中使用。然而,形状、运动和传感器的物理实现和设置对于PCD100是唯一的。PCD100的总体物理结构在本文还可指3环Zeta型。PCD100的这样类型的物理结构可对PCD100提供整洁、可控且有吸引力的作用线。在实施例中,结构可从可由形象动画师使用来传达关注和情感的原理得到。PCD100的物理结构可基于三环音量、运动和必需的传感器放置的范围来定义机械和电气结构的边界。
根据示范性和非限制性实施例,PCD100可配置成包括对于移动的三个轴、一个或多个立体视觉拍摄装置504、麦克风阵列506、触摸感测能力508和例如LCD显示器510等显示器。对于移动的三个轴可支持情感表达和指示传感器并且采用自然方式陪伴用户的能力。立体视觉拍摄装置504可配置成支持3D位点和用户跟踪,用于提供视频输入、拍摄装置抓拍及类似物。麦克风阵列506可支持波束形成音频输入来使ASR性能最大化。触摸感测能力508可实现备选交互来使得PCD100像朋友,或作为用户界面的形式。LCD显示器510可支持情感表达以及动态信息显式。还可包括环境LED灯光。
根据示范性和非限制性实施例,硬件架构500可配置成包括电气架构,其可基于来自嵌入式控制和机器人空间的COTS处理器并且与来自移动装置和平板空间的高端应用处理器结合。嵌入式控制器负责运动控制和低级传感器聚集,而大部分软件栈在应用处理器上运行。产品中的电气板通过对于V1设计的功能来分离并且这可提供模态性来匹配机器人的物理结构同时减轻对传播进入较大设计更新的一个板的设计改变的需要。在一些实施例中,电气结构可包括拍摄装置接口板,其可集成两个基于移动-行业的低分辨率MIPI拍摄装置模块,这些拍摄装置模块可支持硬件同步使得捕获图像可在时间上对立体系统配准。立体拍摄装置设计成采用连续方式流播视频。另外,拍摄装置接口板可支持单个RGB应用拍摄装置,用于拍摄高分辨率照片和视频会议视频质量。RGB应用拍摄装置可设计成用于特定照片拍摄、图像抓拍和视频应用。
根据示范性和非限制性实施例,硬件架构可包括麦克风接口板,其可携带麦克风阵列506、音频处理和编解码器支持514并且向主应用处理器516发送音频的数字流。来自我们的编解码器514的音频输出可在扬声器518处于身体的独立部位以用于声音隔离时搜出。
根据示范性和非限制性实施例,硬件架构可包括身体控制板520,其可在身体的中央部分中集成并且对PCD100提供马达控制、低级身体感测、功率管理和系统唤醒功能性。作为示例而非作为限制,身体控制板520可围绕工业标准Cortex-M4F微控制器平台建立。另外,架构500可包括应用处理器板,其可提供核心片上系统(SoC)处理器并且使机器人系统的剩余部分联系在一起。在实施例中,板可使用模块上系统(SoM)来使开发早期原型的时间和花费最小化。在一些实施例中,应用处理器板可为了降低成本和简化生产而包括SoC处理器。应用处理器板的关键接口可包括用于支持MIPI拍摄装置、显示器、无线通信和高性能音频的接口。
根据示范性和非限制性实施例,硬件架构500可配置成包括功率管理板522,其可解决PCD100的功率要求。功率管理板522可包括功率调节器、电池充电器和电池。功率调节器可配置成调节输入功率使得硬件架构500的一个或多个元件或板可收容调节的电力供应。此外,电池充电器可配置成对电池充电一边使PCD100能够持续长时间地操作。在实施例中,PCD100可具有充电座/基座/架夹,其将包含壁式插头和盲插连接器使得PCD100在放置在基座上时应能够对内部电池充电。
机械架构
根据示范性和非限制性实施例,PCD100的各种特征采用单个装置的形式提供给用户。图6A图示PCD100的示范性设计,其可配置成包括需要的软件和硬件架构以便采用友好方式对用户提供各种特征。PCD100的机械架构已经为了安静优雅和表达性而优化,同时针对材料的成本有效计费。通过从许多成熟市场仔细选择最佳元件并且使它们一起处于对于PCD100的唯一组合中,产生唯一装置。如在图6A中图示的,机械架构描绘各种板(例如麦克风板、主板、电池板、身体控制板、拍摄装置板)在PCD100内的示范性位置的放置。另外,在PCD100的设计中提供一个或多个孔中提供以便适当允许空气流动来提供冷却效果。
根据下文描述的各种示范性和非限制性实施例,PCD利用与处理器通信的许多传感器来感测数据。如下文描述的,这些传感器操作成获得感觉输入的所有方式,处理器经由一系列可编程算法对该感觉输入起作用来执行任务。在满足这些任务中,PCD100利用存储在本地存储器(其形成PCD100的一部分)中的数据并且访问远程存储(例如在服务器处或在云中)的数据,例如经由有线或无线通信模式。同样,PCD100利用各种输出装置,例如触屏、扬声器、触觉元件及类似物来向用户输出信息同时参与社交交互。另外,详述数据、传感器和关于伙伴装置的通信模式的操作和互操作性的非限制性公开可在发布的美国申请2009/0055019A1中找到,其的内容通过引用合并于此。
本文描述的实施例呈现这样的伙伴装置可应用的特征和功能性的新颖且不明显的实施例,特别来实现PCD100与用户之间的社交交互。如本领域内技术人员已知的,理解各种形式的传感器数据和技术可用于评估和检测来自物理环境的社交线索。这样的技术包括但不限于语音和话音识别、眼睛移动跟踪、人类姿势、位置、运动及类似物的视觉检测。尽管参考这样的技术描述,该公开广泛地被引向包含由PCD100获取、处理和输出数据来实现本文描述的特征和实施例的任何和所有方法。
根据示范性和非限制性实施例,PCD100可在纯物理环境中表达为虚拟存在,例如当在移动计算装置(像移动电话、PDA、手表等)上执行时,或可表达为混合模式物理/虚拟机器人。在一些实施例中,可得到用于驱动混合模式、物理或虚拟PCD的源信息,好像它是相同实施例一样。例如,如可经由GUI接口输入并且存储在数据库中的源信息可驱动机械PCD以及显示器的动画部件(其形成虚拟PCD的一部分)。在一些实施例中,源信息包括多种源,其包括来自AI系统的输出、来自实时感测的输出;源动画软件模型;运动信息模型及类似物。在一些实施例中,数据可从关于纯粹虚拟形象(在源处)的行为的单个源推动并且然后可以对物理PCD输出物理以及虚拟模式。采用该方式,PCD的实施例可从纯物理到完全虚拟到牵涉两者中的某个的混合模式地跨越整个范围。PCD100拥有并且表达为核心角色,其可存储在云中并且可以允许用户利用物理装置所做的被记住和坚持,使得虚拟角色可以记住物理装置发生了什么并且对其作出反应,并且反之亦然。可以经由云来管理物理和虚拟实例,以便在适当时候从一个传输到另一个、具有双重体验或类似物。
如图示的,PCD100包含一般三段式设计,其包括通过大体圆环分离的三个截然不同的体节。通过使每个体节绕环旋转,例如经由内部马达(未示出),PCD100配置成更改它的形状来实现各种形状因子以及用传感器102、104、106、108、112跟踪用户和其他对象。在各种实施例中,PCD100的属性可静态或动态配置,其包括但不限于触屏102的形状、富有表现力的身体移动、特定的富有表现力的声音和记忆、讲话时的特定韵律质量和音质、数字接口的细节、PCD100的“面部”、全谱LED照明元件及类似物。
根据示范性和非限制性实施例,PCD100可配置成采用多模态用户界面,其中许多输入和输出可同时是有效的。这样类型的并发界面可提供鲁棒的用户体验。在一些实施例中,用户界面输入或输出中的一个或多个可根据导致PCD100的相对次优操作的环境而被累及。同时操作各种模式可有助于自动停止(fail-safe)用户体验和与装置的交互来保证没有通信损失。
根据示范性和非限制性实施例,PCD100可配置成处理一个或多个输入以便向PCD100的用户提供丰富体验。PCD100可配置成识别用户的语音。例如,PCD100从语音识别“唤醒词”和/或其他机制以便减少“假阳性”接洽。在一些实施例中,PCD100可配置成在NxM英尺的近场范围内识别话音,其中N和M可通过PCD的语音的声音质量和检测灵敏度来确定。在其他实施例中,PCD100可配置成在超过N英尺的远程范围(涵盖至少12英尺x15英尺房间大小的区域)内识别话音。在一些实施例中,PCD100可配置成识别除口语语言以外的声音。PCD可采用声音签名数据库,其配置有PCD可以识别并且对其起作用的声音。PCD可经由直接或基于云的通信与其他PCD装置共享该数据库的内容。作为示例而非作为限制,除口语词语以外的声音可包括对应于打碎玻璃、门铃、电话铃响、人跌倒、汽笛、枪击、可闻警报及类似物的声音。此外,PCD100可配置成通过要求用户识别与PCD100的现有分类器不匹配的声音源来“获悉”新的声音。装置可能够对多个语言作出响应。在一些实施例中,PCD100可配置成用唤醒词对在近场范围外部的用户作出响应。可需要用户进入装置的视野。
在一些实施例中,PCD100可在它的表面上具有触敏区域,在由于任何原因而累及语音输入时可使用该触摸区域。使用这些触摸输入,PCD100可询问是/否问题或在屏幕上显示选项并且可考虑用户在屏幕上的触摸作为来自用户的输入。在一些实施例中,PCD100可使用视觉和移动来将一个用户与其他区分开,尤其当两个或以上用户在视野内时。此外,PCD100可能够在近场范围内解释总骨骼姿势和移动,以及一些共同姿态。这些姿态可比装置控制更加朝社交交互取向。在一些实施例中,PCD100可配置成包括拍摄装置以便拍摄照片和电影。在实施例中,当用户在拍摄装置的预定范围内时,拍摄装置可配置成拍摄照片和电影。另外,PCD100可配置成支持视频会议(pop-ins)。此外,PCD100可配置成包括当拍摄装置处于照片模式时消除“红眼”的模式。
在一些实施例中,PCD100可配置成确定它是否被捡起、携带、下降及类似物。另外,PCD100可配置成实现磁力计。在一些实施例中,PCD100可确定环境照明级。另外,PCD100可基于环境光级别将显示器和重点照明亮度级调整到合适的级别。在一些实施例中,PCD100可具有使用GPS来估计装置位点的能力。PCD100可确定住宅内的相对位点。在一些实施例中,PCD100可配置成包括一个或多个无源IR运动检测传感器(PIR)来帮助总或远场运动检测。在一些实施例中,PCD100可包括至少一个热敏电阻来指示环境的环境温度。
根据示范性和非限制性实施例,PCD100可配置成采用智能、自然发声向用户说“一个声音”英语。PCD100可配置成改变所说语音的声调来仿真动画装置情感状态(当PCD100悲伤时听起来是悲伤的,等)在一些实施例中,PCD100可配置成包括至少一个扬声器,其能够播放语音、高保真音乐和音效。在实施例中,PCD100可具有多个扬声器(一个针对语音、一个针对音乐),和/或对于特殊可闻信号和警报的额外扬声器。专用于话音的扬声器可朝用户安置并且对言语频率响应而调谐。专用于音乐的扬声器可对全频响应调谐。PCD100可配置成具有真彩色、全帧速率显示器。在一些实施例中,显示的活动图像在直径上可被(掩蔽)约至少4-1/2’’。在一些实施例中,PCD100可具有最小3个移动自由度,从而允许环境的360度传感器覆盖和似人类姿势和移动的范围(富有表现力的作用线)两者。PCD100可配置成使物理动画与声音、语音、重点照明和显示图形同步。该同步可足够接近以便对于人类感知是无缝的。在一些实施例中,PCD100可具有指定区域,其可对于环境通知和社交交互两者使用重点照明。根据装置形式,重点照明可有助于在PCD100的拍摄装置处于照片或电影捕获模式时照亮照片中的主体。在一些实施例中,PCD100可具有拍摄装置闪光灯,其将在拍摄装置处于照片捕获模式时自动照亮照片中的主体。此外,完成主体的照亮,这对于重点照明可更好。另外,PCD100可具有在拍摄装置处于照片捕获模式时消除“红眼”的模式。
根据示范性和非限制性实施例,PCD100可识别并且跟踪用户。在实施例中,PCD100可能够注意到人何时进入近场范围。例如,近场范围可以是10英尺。在另一个实施例中,PCD100可能够注意到人何时进入远场范围。例如,远场范围可以是10英尺。在一些实施例中,PCD100可以视频(面部识别)、深度拍摄装置(骨架特征匹配)和声音(言语ID)的组合识别多至5个不同用户。在实施例中,“获悉”例程由PCD100使用来获悉PCD100将能够识别的用户。在一些实施例中,PCD100可在近场范围内以视频、深度拍摄装置和听觉场景分析的组合在全360度中定位和跟踪用户。在一些实施例中,PCD100可在10英尺的远场范围内在全360度中定位和跟踪用户。在一些实施例中,每当用户在近场范围内时,PCD100可维持不同用户相对于它自己的位点的内部图。在一些实施例中,在用户离PCD100更远时,PCD100可使功能性水平下降。在实施例中,PCD100的全功能性可在PCD100的近场范围内对用户可用。在一些实施例中,PCD100可配置成跟踪用户心情和响应。在实施例中,PCD100可通过视频分析、骨架跟踪、话音韵律、用户词汇和言语询问(即,装置问“你好吗?”并且解释响应)。
根据示范性和非限制性实施例,PCD100可用人类社交代码来编程以将情感内容混入它的动画。特别地,基于用户表达的感知情感内容,程序化智能应应用于PCD100以采用完全自主方式适当调整输出的情感内容。可对PCD100编程以尝试通过语音、灯光、移动和音效的组合来改善用户的感测心情。此外,PCD社交代码可提供与用户建立融洽关系的能力,即镜像行为、模仿头部位姿等。
根据示范性和非限制性实施例,可对PCD100编程以基于获悉的用户偏好采用社交接洽方法向用户交付预应式定制的互联网内容(其包括体育新闻和游戏、天气预报、新闻剪辑、关于当前事件的信息,等)和/或开发它自己的偏好用于共享该信息和数据,作为拓宽用户潜在兴趣的方式。
PCD装置可编程有调整内容类型和它被传达给它所识别的每个个体用户所采用的方式两者的能力。
PCD装置可编程有基于用户偏好和用户对交付的互联网内容的反应和处理习惯随时间改进和优化对个体用户的内容定制/交付的能力。
可对PCD编程以参与与用户的社交对话来确认交付的信息被用户所理解。
根据示范性和非限制性实施例,PCD100可配置成管理和监视用户的活动。在一些实施例中,通信装置122连同服务可在用户请求时创建并且存储一旦他们前去购物之旅则可以传达给用户的要做事情、杂货或其他列表。在一些实施例中,在请求时,PCD100可将列表推向用户(经由服务)、作为文本(SMS)消息推给移动电话,或由我们的移动或web应用。在一些实施例中,用户可经由PCD100上的语音或经由移动或web应用通过服务来做出这样的请求。PCD100可与用户交互来管理列表(即,去除被购买/完成/不再需要的项,基于用户历史对额外列表项给出建议,等)。PCD100可通过在环境谈话中听见和理解关键短语而推断需要增加列表(即,装置听见“我们的咖啡用完了”并且问用户他们是否想要添加到杂物列表的咖啡)。
根据示范性和非限制性实施例,PCD100可配置成在正确时间提供用户产生的提醒或消息。PCD100可用于设置用于在正确时间交付提醒的条件。在实施例中,对于提醒的条件可包括实时条件,例如“明天早上你第一次见到我”或“下一次我女儿在这里”或甚至“下周二下午你第一次见到我”及类似物。一旦满足条件设置,PCD100可与用户接洽(来自“查看”以及身体语言/表达感知)并且采用合适的语音和字符交付提醒。在一些实施例中,PCD100可分析提供的心情内容并且使用该信息来影响该提醒的动画/灯光/交付。在其他实施例中,PCD100可在PCD100通过问用户他们是否执行提醒动作而交付提醒之后跟进用户。
根据示范性和非限制性实施例,PCD100可在可由用户给出的请求时监视用户的缺乏。例如,用户可告知PCD100他们何时以及为什么逐步远离(例如,“我现在在散步”)以及活动的预期持续时间使得PCD100可确保用户在期望/请求时帧内返回。此外,如果用户在规定窗口内未返回,PCD100可通知如用户由于该不测事件所规定的紧急联络人。PCD100可通过文本消息和/或通过移动应用来通知紧急联络人。PCD100可在用户返回时识别存在并且跟进活动(即,问活动如何,或与活动相关的其他问题)。这样的类型的交互可在PCD100与用户之间实现社交交互,并且还能够为学习数据库收集关于用户的信息。PCD100可向这样的家庭/朋友示出签出/签入时间和当前用户状态,如由用户为了该目的所识别的。这可通过移动应用来实现。PCD100可有更多的深入活动监视/模式化/报告的能力。
根据示范性和非限制性实施例,PCD100可配置成通过一个或多个数据连接而连接到外部网络。在一些实施例中,PCD100可访问鲁棒的高带宽无线数据连接,例如WiFi数据连接。在实施例中,PCD100可在2.4GHZ和5GHZ两个频带中以2x2两个流MIMO配置实现802.1nWiFi规范。在一些实施例中,PCD100可连接到其他蓝牙装置(医学传感器、音频扬声器等)。在实施例中,PCD100可配置成定制它的UUID以包括多模态用户数据并且与其他BLE使能PCD100装置共享多模态用户数据。在一些实施例中,PCD100可具有到3G/4G/LTE或其他蜂窝网络的连接性。
根据示范性和非限制性实施例,众多PCD100装置可使用自组联网技术采用网状网络配置来配置以允许直接数据共享和通信而不需要基于云的服务。备选地,要在多个PCD100之间共享的数据可被上传并且存储在基于云的数据库/数据中心中,其中它可被处理和制备以用于传播到众多PCD100装置。基于云的数据服务可与网状网络设置组合以对处于众多位点中的众多PCD100装置既提供局部和中央数据存储、共享又提供分布。
根据示范性和非限制性实施例,伙伴应用可配置成与PCD100连接。在一些实施例中,伙伴应用在下列平台上可是可用的:iOS、Android和Web。伙伴应用可包括直观且易于使用的用户界面(UI),其可不需要超高三个交互来访问特征或功能。伙伴应用可对用户提供对PCD100的虚拟对等物的访问使得用户可访问该虚拟对等物以与真实PCD100交互。
在一些实施例中,用户可能够通过伙伴应用访问例如PCD100的购物清单、活动日志等信息。此外,伙伴应用可对用户呈现PCD100本地的用户活动的纵向报告。在一些实施例中,伙伴应用可经由视频和音频使用户连接到PCD100。另外,伙伴应用可异步地提醒用户某些条件(例如,本地用户比签入所预期的要晚,存在大的噪声和本地用户无响应等)。
在一些实施例中,允许一系列装置的连接性或对一系列装置的控制的管理/部署应用在web平台上可是可用的。管理应用的UI可对医院/照料者启用管理员或购买者,其需要快速访问详细报告、设置、部署和/或支持能力。此外,团体可能够使用管理应用来访问跨PCD100的管理集存储的信息。管理应用可异步提醒管理员某些条件(例如,本地用户比签入所预期的要晚,存在大的噪声和本地用户无响应等)。另外,管理应用可跨它的管理装置的子集或全部传播消息和提醒。
根据示范性和非限制性实施例,支持控制台可允许PCD100的人员监视/支持/诊断/部署一个或多个装置。支持控制台在web平台上可是可用的。在实施例中,支持控制台可支持所有部署PCD装置的列表视图,其可通过唯一序列号、所有者、机构部署设置、固件和应用版本号或注册异常来识别。在实施例中,支持控制台可支持交互式查询,其中标签包括序列号、所有者、机构部署设置、固件和应用版本号或注册异常。此外,支持控制台可支持装置诊断的调用和报告。
根据示范性和非限制性实施例,支持控制台可帮助部署新的固件和软件版本(推模型)。此外,支持控制台可帮助部署较新的NLU、新应用等。支持控制台可支持客户支持情景、消息到部署装置的子集或全部的传播以传达像规划的服务停机时间等事情。在一些实施例中,支持控制台可需要支持访问多个装置上度量,其包括(但不为以下所独有):与PCD100交互所花的时间、跨所有应用/服务分解的时间、对于音频和视频感知算法的聚集命中/未命中度量、记录动作(用于支持数据挖掘,等)、记录异常、警报阈值(例如,支持控制台应在什么异常水平叫喊你)及其他。
根据示范性和非限制性实施例,PCD100可参与电信会议。在一些实施例中,电信会议可经由更简单的UI(利用触摸PCD100的身体或触摸屏幕104)或经由言语激活(例如可用许多短语、声音及类似物来发起)而开始执行。在一个实施例中,需要有不超过两个PCD100触摸来发起电信会议。在一些实施例中,呼叫也可作为呼叫调度/提示特征的输出而发起。一旦被发起,PCD100可起到电话的作用,其使用麦克风112和扬声器110来接收和输出来自用户的音频数据同时使用wifi连接、蓝牙、电话连接或其一些组合来影响电话功能性。
呼叫可以是标准语音呼叫或包含视频部件。在这样的交互期间,PCD100可对于会话的PCD100末端起到摄影师的作用。在一些实施例中,PCD100可被放置在桌子或具有围绕PCD1000占据房间的多个用户(例如家庭,其全部可在呼叫期间起来、移动和活动)其他社交聚集点中间。在呼叫期间,PCD100可在期望地点指向拍摄装置106。在一个实施例中,PCD100可利用声音定位和面部跟踪来使拍摄装置106保持指向讲话者/用户。在其他实施例中,PCD100可由房间中的人/用户指示(例如,“PCD,看着Ruby”)。在其他实施例中,遥远的人可能够规定经由装置来跟踪目标,并且PCD100将自主看着且跟踪该目标。在任一情景中,如果例如远程参与者在使用智能电话、便携式电脑或能够显示视频的其他装置,拍摄装置106接收的(作为输入)呈现给他们。
装置可能够理解并且以多个语言作出响应。在这样的交互期间,通过接收言语输入、经由处理器转化输入并且输出转化输出,PCD100还可对于链路另一端上的人起到“译员”的作用。如果在具有PCD100的房间中有可用屏幕(例如TV、iPad及类似物),PCD100可发送(例如经由蓝牙或wifi)要在该TV屏幕上显示的参与者的音频和(如可用的话)视频。如果没有其他屏幕可用,PCD100可中继来自远程参与者的音频,但远程视频可不可用。在这样的实例中,PCD100仅中继远程参与者的话。在一些实施例中,PCD100可对用户变生动且起反应,例如如果远程参与者持续确定时间量地暂停则眨眼且俯视或如果PCD100感测到远程参与者非常兴奋时则做一些舞蹈或“摇动”。
在另一个实施例中,PCD100可以是链路的远程端上的人的化身。例如,在触屏104上显示的眼睛或其他区可变成渲染版本(除其他实施例外,基于卡通、图像的或视频流)。可存储渲染并且其对于PCD100可访问。在其他实施例中,PCD100还可检索与远程用户关联并且描述远程用户的数据并且仿效远程用户的运动/非言语线索来增强化身体验。
在一些实施例中,在呼叫期间,远程或本地参与者可以暗示参与者的静态图像、视频和音频剪辑以及PCD100拍摄装置视图或注释(例如,“PCD,记住该数字”)的存储。这些标记项将适当地被元标记并且存储在PCD云中。
根据其他实施例,PCD100还可有助于在请求时模拟远程交互。例如,用户可要求PCD100建议游戏,其将发起连接游戏模式(在下文更充分描述)并且建议游戏直到两个参与者都同意。在另一个实施例中,用户还可就谈论的一些事情来询问PCD100。作为响应,PCD100可访问对准会话参与者的共同兴趣的“知情PCD”数据库,或对于启示它们所谈论的这一事件为参与者开采PCD日程表(例如,“奶奶,告诉Ruby前几天你和你的朋友共进午餐”)。
调度助手
根据示范性和非限制性实施例,PCD100可基于日程表可用性、特殊日子和/或在链路另一端存在的了解(例如,“你的妈妈现在在家,并且这天是她的生日,你想打电话给她吗?”)来建议呼叫。用户可接受建议,在该情况下PCD呼叫应用在PCD100与远程参与者的PCD100、电话、智能装置或Skype账户之间启动。用户还可通过要求PCD100稍后调度呼叫来接受建议,在该情况下调度应用将它添加到用户的日程表。
呼叫应答和消息传递
根据示范性和非限制性实施例,呼叫应答和消息传递功能性可用PCD100实现。该特征应用于放置到PCD100的语音或视频呼叫并且PCD100将未对其他蜂窝连接装置进行呼叫管理服务。参考图7,图示有示范性和非限制性实施例的流程图700。如图示的,在步骤702处,当呼叫放置到PCD100,PCD100可对房间中的人宣告呼叫者。如果房间中没有人,PCD100可检查用户的日程表,并且如果它指示他们不在家,在步骤704处,PCD100可将呼叫直接发送到与PCD100关联的语音邮箱。如果相反它指示他们在家,PCD100将在步骤706处使用较大声音(钟声、铃声、呼喊?)来获得房子中人的注意。
一旦PCD100得到他的用户的注意,在步骤708处,PCD100可宣告呼叫者并且询问他们是否想接电话。在步骤710处,用户可用简单触摸界面或理想地用自然语言界面作出响应。如果答复是肯定的,在步骤712处,PCD100如在同步按需多模态消息传递特征中描述的那样连接通话。如果答复是否定的,在步骤714处,呼叫被发送到PCD100语音邮箱。
如果呼叫者针对语音邮箱,PCD100可问候他们并且要求他们留下消息。在一些实施例中,语音或语音/视频(如果呼叫者在使用Skype或等效物)消息可被记录以用于在以后的日期重放。
一旦用户返回并且PCD100再次在房间中检测到他们,PCD100可在步骤716处将消息通知他们(在言语上利用“你有消息”,或非言语上利用发光机关炮(pompom),等)并且询问他们是否想听它。如果是的话,PCD100可在TV/平板/等上重放音频或播放音频/视频消息,如上文描述的。
用户可具有为以后保存消息的选项。他可以告诉PCD100再次在特定时间或仅仅“稍后”询问,在该情况下PCD100将在预定时间量后再次询问。
如果呼叫者是PCD100未知的,PCD100可将呼叫指引到语音邮箱并且告知用户接收来自某数字的未识别呼叫,并且如果其被记录的话则重放消息。用户然后可指示PCD100有效地阻止来自连接/语音邮箱的数字前进。PCD100也可询问用户是否希望同步或异步地返回呼叫。如果用户接受,则PCD100启动合适的消息传递模式来完成用户请求。在一些实施例中,PCD100还可对家中的其他蜂窝或固定电话装置提供呼叫管理器功能性。在再其他实施例中,PCD100可应答呼叫并且通过会话提示呼叫者留下消息,从而扮演个人助理的角色。
连接故事阅读
根据示范性和非限制性实施例,PCD100可包含链接故事阅读应用以使远程参与者能够“通过”PCD100对房间中具有PCD100的本地参与者阅读故事。阅读者可通过由虚拟PCD110引导的简单的基于web或Android应用的界面、通过挑选故事并且阅读它的过程来交互。阅读器可读取如由虚拟PCD110提示的故事的词。在一些实施例中,阅读者的语音将由物理PCD100对倾听者重放,其中预设滤波器应用于阅读者的语音使得阅读者可以采用难以置信地引人注目的方式给角色“配音”,即使他/她没有固有能力来这样做也如此。声轨和音效也可以插入重放内。阅读者的界面还可示出倾听者的“PCD的眼观”视频馈送,并且PCD100可使用它的“摄影师”能力来使倾听者保持在视频中。
物理PCD100还可在合适时用短动画对故事作出反应,并且PCD100的眼睛(上文描述的)可变成不同形状以支持故事元素。该功能性可包装在PCD呼叫特征内部使得阅读者和倾听者可以利用关于它的会话等来中断故事。应用可识别阅读者停止阅读故事,并且暂停特征,因此阅读者和倾听者可以未经过滤地谈话。备选地,叙述者可以预先记录故事并且调度它以稍后使用下文描述的故事中继应用来重放。
热线
根据示范性和非限制性实施例,用户可利用PCD100以经由“一键通”或“对讲机”型接口与“网络内”成员通信。该特征可经由皮肤上的单触或PCD100上的屏幕图标或经由简单的语音命令“PCD100,和妈妈谈话”来访问。在一些实施例中,该特征仅局限于PCD到PCD回话,并且可仅在两个PCD100在它们的链路端上检测到用户存在时可使用。
故事中继
参考图8,图示有示范性和非限制性实施例的流程图800。如图示的,在步骤802处,用户/故事叙述者可在任何时间为PCD100记录故事以稍后重放。可以采用若干方式记录故事:
通过PCD100:故事叙述者将他们的故事告诉PCD100,其记录它用于重放。
通过虚拟PCD100web界面或Android应用:用户通过虚拟PCD100引导来将他们的故事告诉摄像头。他们还有机会在这些类型的故事中包含更丰富的动画/音效/背景音乐。
一旦故事已被记录,在步骤804处,PCD100可根据叙述者设置的调度偏好来重播故事。倾听者将被给予在调度时间听到故事的选项,并且可以接受、谢绝或重新调度故事。
在实施例中,在故事叙述期间,PCD100可以预定速率拍摄倾听者的静态照片。一旦故事完成,在步骤806处,PCD100可询问倾听者他/她是否想将消息发回故事叙述者。如果用户接受,则在步骤808处,PCD100可进入“异步多模态消息传递”特征并且编译消息并且将消息发送到叙述者的物理PCD100(如果他们有的话)或经由虚拟PCD100web链路。倾听者可有机会在返回消息中包含倾听故事的他自己/她自己的照片。
照片/记忆制造者
根据示范性和非限制性实施例,PCD100可包含照片/记忆制造者特征,由此PCD100由于事件接管摄影师的角色。对此存在两个模式:
PCD捕捉模式
在该模式中,希望处于照片中的用户可站在一起并且说“PCD,给我们拍照”。PCD100确认、然后使用言语线索来使拍摄装置图像中的人/多个人居中(使用像“后退”、“左移”等的线索)。当他们被正确安置时,PCD100告诉他们保持不动,然后使用某种短语来引发笑容(“微笑”,等)。PCD100可使用面部表情识别来告知他们不在笑并且继续尝试引发笑容。当图像中的所有用户在笑时,PCD100可使用自动对焦和闪光灯(如必要的话)来拍摄若干照片。
事件摄影师模式
在该模式中,用户可指示PCD100在特定时间开始(或“现在”,如期望的话)、持续预定时间量地拍摄事件的照片。PCD100使用声音位点和面部识别的组合来环顾房间并且以用户定义速率拍摄房间中的人的猎影照片。产生的所有照片可本地存储在PCD100存储器中。
一旦产生照片,PCD100可将照片已经上传到PCD100云通知用户。在该点处,可以经由PCD100应用或web界面来访问它们,其中虚拟PCD100可引导用户通过删除、编辑、裁剪等照片的过程。它们然后将通过电子邮件发给用户或发帖到Facebook等。在该应用的该“开箱即用”版本中,照片可利用永久存储持续预定时间量地仅保持在PCD100云上,其中归档/元标记作为例如下文描述的“现存遗产(livinglegacy)”的部分按月付费供应。
如本文描述的,PCD100从而可操作成帮助增强人际和社交场合。在一个实施例中,应用或“app”可在PCD100上配置或安装来访问和操作PCD100的一个或多个接口部件来实现社交活动。例如,PCD100可包括工厂安装的应用,其在执行时操作成与用户交互以根据哪个PCD100着手拍摄和存储一个或多个照片来接收一个或多个参数。例如,用户可对PCD100说“请拍摄聚会上的每个独立个体的至少一个照片”。作为响应,PCD100可使来自可访问客人列表的聚会客人列表并且着手拍摄每个客人的照片。在一个实施例中,PCD100可保持静止并且在个体经过时对于他们的身份来询问他们、记录实例并且拍摄个体的照片。在另一个实施例中,PCD100可与客人交互并且要求他们在客人群体前面设置PCD100以便拍摄他们的照片。在一段时间内(例如聚会的持续时间),PCD100根据用户在满足社交/活动(其包括为社交事件编文档)方面的希望获取聚会客人的一个或多个照片。
根据其他示范性实施例,PCD100可读取社交线索并且对其作出反应。例如,PCD100可观察用户、向另一个人指示更轻声说话的需求。作为响应,PCD100可降低它输出言语通信所在的音量。相似地,PCD100可在拥抱或轻抚时发出指示满意度的声音。在其他实施例中,PCD100可发出或用别的方式输出社交线索。例如,PCD100(感测到用户约会去晚了)可在看似紧张状态中前后摆动以便加快用户离开的速率。
交互式日程表
根据示范性和非限制性实施例,PCD100可配置有日程表系统来捕获工作之余用户和家庭的业务。PCD100可能够共享日程表并且如果其他PCD100的用户给出许可则使这些日程表与其他PCD100的那些集成,使得在每个家庭内具有PCD100的整个大家庭将能够具有对于每个人的单个统一日程表。
PCD100日程表中的项可用合适的信息元标记,初始是所约家庭成员的名字、他们对约会/事件的感觉如何、日期或日子特定信息(假日等)及类似物。可进入的事件类型包括但不限于唤醒时间、用餐时间、约会、提醒、打电话、家务/庭院劳动等。注意不是所有的事件都必须设置成特定时间-可以传感器输入为基础来调度事件,例如“提醒我明天早上你第一次看到我带上我的雨伞”。
项到PCD100的日程表的输入可采用许多方式完成。一个实施例利用Android应用或web界面,其中虚拟PCD100引导用户通过过程。情感符或其他界面是在此时可以用于告诉PCD100用户对应用/事件的感觉如何。该模式中日程表的图形描绘可与Outlook相似,从而允许用户看到其他网络成员的事件/约会。PCD100日程表还可具有与Outlook在该方面所做的相似的消除约会冲突的特征。
在一些实施例中,用户还可能够通过自然语言界面向日程表添加项(“PCD,我再周二下午1点约了牙医,提早半个小时提醒我”,或“PCD,今晚晚餐是下午5:30”)。PCD100过后可探询用户感觉(如果未被用户传达的话)(例如,“你对该约会的感觉如何?”),从而允许合适的情感元标记。
如果事件提醒被羁绊,PCD100可采用两个方式中的一个来传递提醒。如果为之设置提醒的用户在PCD100的环境中存在,他将亲自传递提醒、用言语提醒、动画、面部表情等来完成。面部表情的情感内容可从事件的元标记得到,例如通过情感或用户言语输入。他的行为还可以从已知上下文得到(例如,他在醒来时总是感到困倦或在用餐时间总是饿)。通过上下文适合于不同事件的表达通过定期创作内容来使它保持非重复和令人愉悦而刷新。
如果出现提醒所针对的用户未和PCD100物理在一起,PCD100可以呼唤它们。在这样的实例中,如果它们对此是非响应的,PCD100可用提醒使它们的电话发短信。
列表管理器
根据示范性和非限制性实施例,PCD100可配置有列表管理器特征。根据该特征,PCD100可在用户请求时创建要做事情列表或购物列表,一旦它们前往购物之旅则其可以发短信给用户。特征可由用户经由简单触摸界面或理想地通过自然语言界面发起。用户可规定要制作的列表类型(例如,“杂货”、“衣服”、“要做事情”或特定类型的商店或商店名字)。PCD100可询问初始在列表上是什么,并且用户可经由口语词语作出响应以使PCD100向列表添加东西。在任何稍后的时间,用户可要求PCD100向列表添加其他项。
根据一些实施例,PCD100可能够解析每天的会话来确定应向列表添加项。例如,如果房间中有人说“我们没有牛奶了”,PCD100可自动将其添加到杂货列表。
当用户动身前往PCD100维持列表所针对的商店时,用户可请求PCD100将合适列表发短信给它们,使得当他们在商店中购物时该列表对它们可用。另外,如果用户远离PCD100但在商店附近,他们可请求通过Android或web应用来发送列表。
在他们返回时(即,下一次PCD100在他们请求将列表发短信给他们之后看到用户),PCD100可询问出行如何/用户是否在列表上找到一切,如果“是”,PCD100将清除列表并且等待向它添加其他项。如果“否”,PCD100将探询什么未被购买,并且从列表清除其他项。
在要做事情列表的情况下,用户可告诉PCD110“我做了这件事情”,并且该项可从存储的列表去除。
用户还可请求将别人的PCD产生的列表发短信给他们(待审的合适许可)。例如,如果成年人将PCD100给予年长的父母,该成年人可以询问PCD100将由他们父母的PCD100产生的购物列表发送给他们,使得他们可以在为自己购物时替他们的父母买杂货,或他们可以在拜访以确保他们具有任何必需工具等之前就妈妈的“要做事情”列表来询问PCD100。
知情PCD
根据示范性和非限制性实施例,PCD100可配置有“知情”特征。根据该特征,PCD100可使用户了解用户感兴趣的新闻、天气、体育等的最新情况。该特征可在请求时使用简单触摸界面或理想地自然语言界面来访问(例如,“PCD100,告诉我昨晚的棒球成绩”)。
用户可具有在一天的某些时间设置“信息会话”的能力。这可通过web或移动应用界面来完成。使用该特征,PCD100可调度成在一天的某些时间中继某些信息。例如,用户可对它们的PCD100编程以在用户清醒之后供应新闻。如果用户说“是”,PCD100可交付用户在他/她的“早间简报”中请求的信息。这可包括某些团体得分/新闻、天气、专业论文标题回顾等。PCD100可以这些项的概述开始并且在任何点,用户可要求知道更多关于特定项,并且PCD100将阅读整个新闻项。
新闻项可“PCD化”。具体地,PCD100可对PCD100在阅读的新闻提供评论和反应。这样的反应可由于AI产生而在上下文是相关的。
心情、活动、环境监视器
根据示范性和非限制性实施例,PCD100可采用对于PCD应用100的应用的形式配置有心情、活动和环境监视器。该应用可被已经购买PCD100的人购买,例如为年长的父母。在购买时,web界面或Android应用可用于访问监视设置和状态。虚拟PCD100可引导用户通过该过程。可以监视的事情的一些示例包括(1)PCD100所在的房间/房子中的环境温度,(2)活动(人每小时/天行走的时间#、没有感测到人的小时#等),(3)房间中人/多个人的心情:基于来自传感器的反馈(面部表情、大笑频率、使用某些词/短语的频率,等),表达为有限选择集中的一个以及(4)PCD100可通过询问是否服药或明确看到用药来监视对用药方案的依从性。
可已被设置的监视器的状态可以经由应用或web界面来检查,或在超过警报级别的情况下(例如,房间中太冷,在阈值时间量内没有人行走),则文本可以由PCD100发送到监视用户。另外,PCD100可自主提醒用户由监视用户经由应用或web界面设置的某些条件被满足,例如如果太冷则颤抖并且打开暖气。
心情戒指
根据示范性和非限制性实施例,PCD100可配置有心情戒指特征。该心情戒指特征可利用PCD100的传感器来充当指示器并且甚至用户的心情/情感状态的影响者。该特征可维持用户的情感状态的实时日志。该指示器可基于面部表情识别、体温、眼动、活动级和类型、话音韵律、关键词使用和甚至如PCD100询问用户他们感觉如何这样的简单技术。PCD100将尝试用户验证技术(例如询问)来校正他的解释并且随时间做出用户的更好情感模型。这还可牵涉从PCD100云获悉数据(经证实的传感器数据<->来自其他用户的情感状态映射)的“众包(crowdsourcing)”。参考图9,图示有示范性和非限制性实施例的流程图900。在步骤902处,PCD100解释用户身体/面部/语音细节来确定他的情感状态。PCD100能够随时间准确解释用户身体/面部/语音细节来确定情感状态。
一旦PCD100确定用户的情感状态,他在步骤904处将此交回其他。这可以采用许多方式来完成。对于同定位(例如,在医院环境中)的照料者,PCD100可以使用照明/面部图形/姿势的组合来指示他所属的人的心情,使得照料者可以一眼看到照管的人悲伤/快乐/生气等并且相应地干预(或干预)。
对于未同定位的照料者(例如,照顾仍然独自生活的年迈父母),PCD100可以通过从它呈现哪个数据以及针对哪个时段方面可定制的移动/web应用来提供该情感状态。
一旦建立用户心情的该理解,在步骤906处,PCD100尝试并且实行该心情的改变。这可以自主发生,其中PCD100试图通过讲故事/笑话、怜悯、玩游戏、情感镜像等的过程造成用户情感状态的积极改变。备选地,照料者在被PCD100提醒主要用户处于消极情感状态时可以指示PCD100说/尝试/做某些他们可能知道的将减轻该特定情境中的消极情感的事情。
夜灯
根据示范性和非限制性实施例,PCD100可配置有夜灯特征。根据该特征,如果用户在午夜醒来,PCD100可充当动画夜灯。如果满足正确条件(例如,时间是在午夜,环境光很低,持续长时间地存在静止和安静或睡眠噪音,并且然后突然有移动或讲话),PCD100可轻轻地唤醒、采用令人安心的颜色使机关炮发光并且可能探询用户是否OK。在一些实施例中,PCD100可启示可令人安心并且有助于使用户重新入睡的活动或应用。
可爱的随机行动
根据示范性和非限制性实施例,PCD100可配置有可爱的随机行为特征。根据该特征,PCD100可操作成采用设计为令人愉快或发人深省的这一方式在一整天在各种时间说事情/问问题。在一个实施例中,该功能性不牵涉与PCD100的自由形式的自然语言会话,而相反,PCD100说令人感兴趣的、可爱的、有趣的等事情作为思考/会话的素材。
在一些实施例中,PCD100可访问PCD100内部或外部定位的语录、短语、笑话等的数据库,其不时地被创建、维持和刷新。数据可来自例如天气、体育、新闻等、RSS馈送、来自其他PCD100的众包和用户简档。通过对这些位元标记并且将元标签与个体PCD100用户偏好比较的过程,合适的事实或语录可发送给每个个体PCD100。
当PCD100决定交付可爱的随机行动时,PCD100可连接到云、给予用户ID并且请求来自数据仓库的位。如上文描述的,服务器将使事实与用户偏好、日子/日期/时间、用户居住区的天气等匹配来确定要交付给该用户的最佳位。
在一些实施例中,该特征可起到采取简单问题的形式,其中问题特定到足以更容易进行应答的识别,而对这样的问题的应答可用于有助于建立该用户的简档,从而确保在正确时间交付给他/她的PCD100更多的拟合位。在其他实施例中,用户可专门通过简单的触摸界面或通过自然语言界面来请求可爱行动。在一些实施例中,该特征可采用“喜欢/不喜欢”用户反馈征集以便使算法能够在向该特定用户提供感兴趣的位方面变得更好。
DJPCD
根据示范性和非限制性实施例,PCD100可配置有DJ特征。根据该特征,PCD100可操作成以音乐播放、跳舞和来自PCD100的建议为特征。该特征可采用若干模式操作。这样的模式或功能可通过简单触摸界面(从开始到期望动作不超过2个节拍)或在其他实施例中通过自然语言界面来访问和控制。音乐可本地存储或从外部源接收。
当PCD100使用该特征播放歌曲时,PCD100可使用节拍跟踪以使歌曲伴随着舞蹈动画、灯光/颜色表演、面部表情等。PCD100的歌曲选择可取决于选择哪个模式,例如:
点唱机模式
在该模式中,PCD100可播放用户选择的特定歌曲、艺术家或专辑。
心情盒(Moodbox)模式
在该模式中,用户请求某一心情的歌曲。PCD100可使用心情元标签来选择歌曲。用户可以给予关于与Pandora相似的歌曲的反馈,从而允许PCD100调整加权以用于进一步选择。
环境音乐模式
一旦用户选择该模式,PCD100使用来自web的信息(日期、一周的某天、一天里的时间、日程表事件、外面的天气等)以及来自传感器102、104、106、108、112的信息(例如,房间中人的数量/活动级、噪声级等)来选择要播放的歌曲和播放它们所采用的音量,以便在房间中创建背景范围。用户可具有控制音量或跳过歌曲的能力。另外,用户可能够在任何时间请求特定歌曲,而不离开环境音乐模式。可播放请求的歌曲,并且用户选择(如随着音量改变)可在未来选择加权中使用。
PCD喜欢
尽管在一些实施例中用户可直接访问该模式(“你喜欢什么种类的音乐,PCD?”),PCD100还可偶尔将一个或多个选择插入歌曲流内,或尝试在发起点唱机或Moodbox模式时播放选择(在环境音乐模式中,PCD100可不这样做)。PCD的音乐选择可基于定期更新的来自PCD100、公司的列表、由作者或由例如来自其他PCD的众包歌曲选择创建。PCD100喜欢也可从用户网络中的特定PCD100拉出特定歌曲-例如PCD100可宣告“你的女儿现在一直在请求这首歌曲”,并且然后播放女儿的喜爱歌曲。
跳舞PCD
根据示范性和非限制性实施例,在采用任何模式播放歌曲后,PCD100可询问它如何做(并且可根据用户的应答而适当地作出高兴或悲伤的响应),或给予用户关于用户的舞跳得有多好的分数。PCD100还可捕获跳舞用户的照片并且供应以将它们上传到用户的PCD简档、社交媒体网站或通过电子邮件发送它们。各种功能性模式包括:
复制你
在该模式中,PCD100选择要播放的歌曲,并且任何使用声音位点/面部/骨架跟踪以在vis/RGBD拍摄装置视场中获取用户。在用户跟着音乐跳舞时,PCD100可尝试仿效用户的舞蹈。在歌曲结束时,PCD100可询问如何在复制用户动作中执行它,或给予用户关于用户的节拍保持得有多好的分数。PCD100还可捕获跳舞用户的照片并且供应以将它们上传到用户的PCD简档、社交媒体网站或通过电子邮件将它们发送给用户。
复制PCD
在该模式中,PCD100跳舞并且用户尝试仿效舞蹈。如果用户做得不好,音乐的重放再次受到影响。在一些实施例中,独立屏幕示出对于用户和PCD100两者要仿效的人类舞者。用户和PCD100两者随之跳舞并且然后PCD100对它自己和用户两者评级。
随之跳舞
在该模式中,用户播放来自收音机、iPod、唱歌、哼唱等的音乐,并且PCD100尝试随之跳舞,从而在结束时询问它做得有多好。
故事表演/动画
根据示范性和非限制性实施例,PCD100可配置有故事表演/动画特征。根据该特征,PCD100可操作成允许用户购买对于与PCD100的交互式性能的戏剧。参考图10,图示有示范性和非限制性实施例的流程图1000。在步骤1002处,可完全购买戏剧并且将其存储在用户的PCD云简档中,或它们可租用Netflix风格。
戏剧/场景的购买可通过例如Android应用或web界面而出现,其中虚拟PCD100可引导用户通过购买和安装过程。在一些实施例中,在步骤1004处,用户可选择他们希望表演的戏剧/场景。该选择以及在使用它时的特征的控制可经由简单触摸界面(PCD100的眼睛或身体)或经由自然语言界面来实现。一旦用户选择戏剧,在盘1006处,PCD100可询问用户是否希望排练或表演。
不管选择的模式如何,在步骤1008处,PCD100可通过询问用户他们想要成为的形象是否在戏剧中而开始。在该第一时间后,如果再次选择戏剧则PCD100将证实该选择,并且用户可以在任何时间改变。
排练模式
一旦用户进入排练模式,在步骤1010处,PCD100可供应来表演戏剧以便使用户熟悉戏剧。如果他们已经熟悉,用户可跳过此。如给用户确实希望PCD100表演戏剧,在步骤1012处,PCD100可在用户进行通读时突出对于用户角色的台词。
该通读之后,在步骤1014处,PCD100可开始教用户台词。对于每个台词,PCD100可宣告提示和台词,并且然后在用户背诵台词时在触屏104上示出词。PCD100可使用语音识别来确定用户是否正确,并且将保持尝试直到用户正确地复述台词。PCD100然后可向用户供应提示并且让他们复述台词,从而再次尝试直到用户可以朝着提示适当地重复台词。PCD100然后可移到下一个台词。
一旦用户获悉所有台词,在步骤1016处,PCD100将利用所有提示进行通读,从而作为响应来检查正确台词并且如必要的话提示用户。
注意提示可以起初采取图形的形式,其中眼睛变成启示台词的形状。这可以是在提示方面的第一次尝试,并且如果用户仍然无法记得台词,则PCD100可以发展到言语提示。
表演模式
一旦用户记住他们希望扮演的角色的所有台词,在步骤1018处,他们可以进入表演模式。在该模式中,PCD100将进行戏剧的全面表演,从而暂停来让用户说他们的台词并且如果用户结巴或忘记则提示。PCD100将在该表演期间、甚至在用户交付台词期间使用全音效、背景音乐、动画和灯光效果。在一些实施例中,在戏剧表演后,PCD100可产生戏剧的卡通/动画版本,其中在他们的台词期间包括用户的语音音频并且使其与他们所扮演的角色的嘴唇同步(如果可能的话)。该卡通可存储在PCD云上、发帖到社交媒体网站或通过电子邮件发给用户用于共享/形成记忆。在一些实施例中,PCD100还可配置成表演具有多个参与者的戏剧,每个扮演他们自己的角色,并且参与者可是远程的(例如,在通话流的另一端上)。
跳舞PCD-共享
根据示范性和非限制性实施例,PCD100可配置成采用上文描述的跳舞PCD应用的额外特征。在该特征的一些实施例中,用户可为PCD100创建定制舞蹈。这通过移动或web应用来创建,从而允许用户挑选歌曲并且选择舞步以对于PCD100放在一起以随着音乐表演。用户还可让PCD100挑选舞步使得与PCD100协作地创建舞蹈。在一些实施例中,可增加灯光效果/音效(例如,PCD说“下来!”)并且其与舞蹈同步。在其他实施例中,PCD100舞蹈可发送到其他PCD100、展示给虚拟PCD100所扮演的朋友、在线保存等。用户还可演绎由其他PCD100用户所创建的其他PCD100舞蹈。
名人产生的内容
根据示范性和非限制性实施例,该特征允许用户将名人产生的内容下载或流播到他们的PCD100。内容通过web界面或Android应用来选择,其中虚拟PCD100可引导用户通过内容购买过程。内容可以是以下中的任一个:
预先语音
这可包括对电影《神秘科学影院3000》内笑话的导演/演员评论。所有内容可插入影片。音频水印可用于使内容的PCD100的交付与观看的媒体同步。
实时流播
在该模式中,PCD100可流播由名人/评论家在中心位置实时产生的内容。内容创建器还可具有实时“操纵”PCD100来实现动画/灯光/颜色效果来补充口语词语。在这样的实例中,因为内容创建器理论上将与用户并发地观看事件并且实时做出评论。这可包括政治评论家对总统演讲、选举报道等提供评论,或用户喜爱的运动员对体育事件提供评论。
根据示范性和非限制性实施例,持久伙伴装置(PCD)100适于持续或几乎持续地存在于人或多个人的环境内。在一个实施例中,人是识别人的各种参数数据被PCD获取或对PCD可用所针对的人的实例。如下文更充分描述的,除人的ID外,PCD100可进一步识别在行为(调度、例程、习惯等)、偏好、态度、目标、任务等上的模式。
识别参数数据可用于使用例如语音识别、面部识别及类似物、利用上文描述的传感器102、104、106、108、112中的一个或多个来识别人的存在。参数数据可本地存储(例如在PCD100的存储器内)或远程存储在PCD100与之有线或无线通信(例如经由蓝牙、wifi及类似物)的服务器上。这样的参数数据可手动输入PCD100或服务器内或可由PCD100随时间获取或作为初始化过程的部分、
例如,在将另外未初始化的PCD100带入用户环境内时,用户可执行初始化规程,由此PCD100利用其操作/与之交互来获取用户的语音、面部特征或类似物(和其他相关真实信息)的示例。在下文充分描述的家庭中心实施例中,如果用户形成用户(其包括大家庭)的社交网络则可存在多个。该数据可存储在PCD100内并且可同样由PCD100传达以用于外部存储,例如在服务器处。可手动输入其他识别用户数据(例如用户名字、用户生日、用户眼睛颜色、用户头发颜色、用户体重及类似物),例如经由服务器的图形用户界面、话音界面或形成PCD100的一部分。一旦将参数数据的一部分输入或用别的方式被PCD100获取,PCD100可操作成另外获取其他参数数据。例如,在进行初始化(其包括提供样本语音签名,例如通过对PCD100背诵预定文本)时,PCD100可自主操作成识别讲话的用户并且获取面部识别所需要的面部特征。由于PCD100维持在用户环境内的持久存在,PCD100可随时间操作成获取用户的各种参数数据。
在一些实施例中,在初始化期间,PCD100操作成获得关于超出他们的ID的人的相关信息。如上文指出的,PCD100可操作成获取背景信息、人口统计信息、喜好、联系信息(电子邮件、手机等)、兴趣、偏好、个性及类似物。在这样的实例中,PCD100可操作成获取例如在“结识”交互期间的基于文本/GUI/话音输入的信息。另外,PCD100还可操作成获取联系信息和家庭中心(例如,年长的父母、儿童等)的个性化参数信息,其可在PCD100之间共享以及直接输入PCD100内。在下文更充分描述的各种实施例中,PCD100操作成推动家庭与大家庭的连接。如下文进一步描述的,每日信息(其包括但不限于个的调度、事件、心情及类似物)可对PCD100如何交互、向用户推荐、供应活动、供应信息提供重要上下文。
根据示范性和非限制性实施例,PCD100获取的上下文、纵向数据推动自适应系统,其将它的功能和特征配置成日益对于兴趣、偏好和用户的使用案例来调整。例如,如果PCD100获悉用户喜欢音乐,它可以自动从云下载“音乐属性”以能够发现音乐喜好、播放该类音乐以及做出知情音乐推荐。
这样,PCD100获悉用户的生活。PCD100可以在真实世界中感测用户并且它可以从连接到PCD100的其他装置、技术、系统、个人计算装置、个人电子装置的生态聚集数据。PCD100从该纵向数据收集获悉人以及使它能够获悉用户并且使它自己配置成更好地适应和匹配它可以提供的功能的活动模式。重要的是,PCD100获悉你的社交/家庭模式、你的生命中(你的大家庭)重要的人是谁,它获悉并且跟踪你的情感/心情,它获悉重要的行为模式(在你区域做某些事情时),它获悉你的偏好、爱好等,它获悉你想知道什么、什么使你愉悦,等。
如下文更充分描述的,PCD100配置成与用户交互来提供纵向数据收集设施,用于收集关于PCD100的用户与PCD100的交互的数据。
根据示范性和非限制性实施例,PCD100配置成获取纵向数据,其包括与用户的持久交互(经由牵涉视觉、听觉和触觉传感器102、104、106、108、112的交互)的一个或多个属性。在每个实例中,视觉、听觉和触觉感觉可由PCD100从用户感知或用别的方式获取以及由PCD100输送给用户。例如,PCD100可包含拍摄装置传感器106,用于从用户获取视觉信息,其包括与用户的活动、情感状态和身体状况有关的数据。同样,PCD100可包含音频传感器112,用于从用户获取音频信息,其包括从话音识别得到的数据、与应力级有关的数据以及例如用户所利用的娱乐媒体的身份等上下文信息。PCD100可进一步包含触觉传感器102,用于从用户获取触觉信息,其包括与在于PCD100物理接触中用户的触摸或接洽(其包括但不限于抚摸和拥抱PCD100)有关的数据。在其他实施例中,用户还可使用触摸来浏览PCD100的触屏界面。在其他实施例中,PCD100或用户的位点可例如经由用户携带的手机来确定并且用作输入来给出位点上下文-相关信息并且提供服务。
如指出的,视觉、听觉和触觉感觉可由PCD100输送给用户。例如,音频输出装置可用于输出声音、警报、音乐、语音指令及类似物并且参与与用户会话。相似地,图形元件可用于将文本和图像输送给用户以及操作成输送图形数据,其包括PCD100与用户之间的通信交互的一部分。它可以使用环境光和其他线索(它的LED机关炮)。触觉装置102可用于传达PCD100情感状态和各种其他数据(其包括经由例如振动)并且浏览装置的界面/内容。装置可发出适合用户的情形、心情等的不同的气味。
信息可通过连接到PCD100的不同装置来聚集。这可以来自第三方系统(医疗、家庭安全等数据)、移动装置数据(音乐播放列表、照片、搜索历史、日程表、联络人列表、视频灯)、台式计算机数据(尤其通过PCD100门户输入)。
除上文描述的传感器外,与PCD100和用户的交互中牵涉的数据和信息可从各种数据源获取、存储在它们上并且输出到它们。在示范性和非限制性实施例中,交互数据可经由云数据或其他连接性模式(蓝牙,等)而存储在PCD100上并且在PCD100与用户之间传送。在一个实施例中,可由PCD100实现对用户的云存储的数据的访问来实现与PCD100的交互。例如,PCD100可搜索互联网、使用应用/服务或访问来自云的数据-例如来自云存储的用户调度和从其处得到来触发交互的使用信息。作为一个示例,PCD100可注意用户在上午9点在附近餐厅与朋友有早餐约会。如果PCD100通知用户在约会前五分钟在家里,PCD100可通过经由音频装置110讲话来与用户交互以询问用户是否不应准备出发。在示范性实施例中,PCD100可基于当前GPS坐标和餐厅的GPS坐标通过自主进行行驶时间计算来完成该壮举。采用该方式,PCD100可对访问的在线或云数据应用一个或多个算法来触发导致PCD100与用户之间融洽关系构建交互的动作。人们可以经由社交网络、实时或异步方法(例如发送文本、建立实时音频-视觉连接、通过其他应用/服务(facebook、twitter等)连接及类似物)来与PCD100通信。其他示例包括由PCD100访问存储在云中的用户的娱乐和媒体文件,其包括但不限于可用于触发交互的itunes和Netflix数据。
采用相似方式,根据其他示范性实施例,交互数据可存储在用户环境附近或用户环境中,例如在服务器或个人计算机或移动装置上,并且可被用户访问。PCD100可同样将数据存储在云中。在其他实施例中,交互数据可经由PCD100外部的传感器而获取。
根据示范性和非限制性实施例,可产生有活动日志和装置使用日志,例如可存储在PCD100上、服务器上或云中,其可用于推动交互。活动日志可存储用户、PCD100或用户和PCD100两者采用交互式方式参与的信息记录活动。例如,活动日志可记录参与象棋游戏的PCD100和用户的实例。可另外存储有关于在这样的匹配(从其可推断用户的享受水平)期间用户的情感状态的信息。使用该数据,PCD100可将这样的事情确定为用户期望多久下一次象棋、自PCD100和用户上次下象棋过去了多长时间、用户期望参与象棋比赛的可能性及类似物。采用相似方式,装置使用日志可被存储和维持,其指示用户喜欢何时、多久以及如何与PCD100交互。如显而易见的,活动日志和装置使用日志两者都可用于既增加PCD100与用户之间的交互的频率又提高交互质量。
根据示范性和非限制性实施例,交互数据可经由手动输入来获取。这样的数据可由用户经由输入装置102、104、106、108、112(其形成PCD100的一部分)直接输入PCD100或输入计算装置(例如服务器、PDA、个人计算机及类似物)并且传送或用别的方式传达到PCD100,例如经由蓝牙或wifi/云。在其他实施例中,交互数据可由PCD100经由PCD100与用户之间的对话来获取。例如,PCD100可参与与用户的对话,其包括一系列问题,其中用户的应答经由在PCD100上、服务器上或云中的讲话识别软件转换成文本,结果作为交互数据被存储。对于GUI或基于触摸的交互也一样。
根据示范性和非限制性实施例,交互数据可经由配置成识别嗅觉数据的传感器102、104、106、108、112产生。同样,PCD100可配置成发出嗅觉气味。在再其他实施例中,GPS和其他位点确定设备可并入PCD100内来增强交互。例如,儿童用户可在家庭自驾游或度假中带着他的PCD100。在途中,PCD100可确定它的地理位点、访问互联网来确定附近界标并且通过讨论界标来参与与儿童的对话,其与时间和地点相关。
除采用该方式弄清讨论题目外,在一些实施例中,这样的交互的结果可在那时或在稍后的时间传送到远程存储设施,于是存在根据预定义安全设置从多个用户如此获取的累积交互数据。采用该方式,更可取交互模式的集中式数据库可基于用户属性和PCD获取数据(例如,位点)的统计简档而开发。例如,在之前的示例中,PCD100可将它的位点确定为在航空航天博物馆附近的国家广场上并且在自然历史博物馆对面。通过访问集中式数据库并且提供用户的年龄和位点,可确定与用户年龄简档匹配的其他儿童趋于对恐龙感兴趣。因此,PCD100开始参与讨论恐龙同时将用户引导到自然历史博物馆。
根据示范性和非限制性实施例,PCD100可至少部分基于用户的各种生理和物理属性和参数来调制与用户的交互的方面。在一些实施例中,PCD100可采用视线跟踪来确定用户的视线方向。这样的信息可用于例如确定用户的兴趣或计量模棱两可。同样,可获取用户的心率和呼吸率。在再其他实施例中,用户的肤色可从视觉传感器数据确定并且用于弄清用户的物理或情感状态。可经由传感器102、104、106、108、112弄清的用户的其他行为属性包括但不限于声律和选词。在其他示范性实施例中,PCD100可弄清并且解释用户的物理姿态,例如挥动或指示,其可随后用作交互的触发。同样,PCD100可评估和分析用户的姿势来确定用户是否站立、伛偻、斜倚及类似物。
根据各种示范性和非限制性实施例,PCD100与用户之间的交互可至少部分基于确定的用户情感或精神状态或属性。例如,PCD100可确定并且记录用户眨眼的速率、用户是在笑还是咬住他/她的嘴唇、用户发出笑声的存在及类似物来弄清用户是否可能例如紧张、高兴、担忧、愉快等。相似地,当用户在另外沉寂的环境中保持相对不动和沉默,PCD100可观察用户的视线是否盯着空间中的点并且确定用户处于思考或困惑状态。在再其他实施例中,PCD100可解释用户姿态(例如点头或摇头),作为心理一致或不一致的指示。
根据示范性和非限制性实施例,用户交互所经由的界面的一般属性可配置和/或协调成提供拟人或基于非人类的PCD100。在一个实施例中,PCD100配置成显示非人类动物的特性。通过这样做,PCD100与用户之间的交互可通过摹拟和/或放大用户对特定动物的现有情感嗜好而增强。例如,PCD100可在操作成传达兴奋状态时通过吠叫来仿效狗。PCD100可进一步装备有像附器的尾巴,其响应于用户交互可摇摆。同样,PCD100可输出与熟悉的猫科动物“喵喵”相似的声音。除PCD100界面的实时显示外,这样的界面属性可随时间变化以通过调整用户和PCD100动物形象的衰老过程来增强交互。例如,基于狗的PCD100形象可在第一次获取时模仿小狗的动作并且在它的行为和交互上逐渐成熟来提供关于用户部分的用户和PCD形象的关系在演变这一感觉。
如指出的,除基于动物或虚构生物的PCD特性外,PCD100可配置成提供仿照人类的拟人界面。这样的人类或“角色”可被预先配置、用户可定义或两者的某一组合。这可包括饰演,其中PCD100可呈现名人、媒体人物或形象(例如,LarryBird、JonStewart、来自DowtonAbby的形象等)的习性和特性。除驻存在PCD100上、PCD100外部外,PCD100的角色或“数字灵魂”可被存储(例如在云中),并且可因此被下载且安装装置其他PCD100上。这些其他PCD可以是图形的(例如,它的外表出现在用户移动装置上)或进入另一个物理PCD100(例如,新模型)。
PCD100的角色还可以具有合成或技术性质。因此,PCD100起到拟人化技术的作用,其中看到装置PCD100具有它自己的独特角色,而不是尝试仿真已经存在的别的东西,例如人、动物、知名形象及类似物。在一些实施例中,可为PCD100创建专门的角色,其可以随时间更改和修改以更好适合它的用户。例如,因为这样的技术建立密切关系和感情,用户的PCD100的韵律可随时间更改以更紧密地镜像它的用户自己的韵律的韵律。除它的用户买来使PCD100个性化或定制PCD100的任何化妆或虚拟制品外,PCD100还可改变它的图形外观以适应于它的用户的喜好和偏好。
在示范性实施例中,PCD100的数字灵魂定义PCD100的特性和属性以及影响用户与PCD100之间的交互性质的属性。尽管该数字灵魂从PCD100所利用的交互数据和信息分叉以参与与用户的交互,数字灵魂可在与特定用户的响应交互中随时间改变。例如为了分离用户,每个可利用他们自己的PCD100基于例如众所周知的历史人物(例如AlbertEinstein)安装相同的数字灵魂。从在两个独立PCD100装置上安装那刻起,每个PCD100将采用不同方式交互,这取决于由PCD100产生并且对PCD100可访问的用户特定交互。数字灵魂可以从不同物理形式(例如机器人形式)或数字形式(例如,图形化身)地采用许多形式体现。
根据示范性和非限制性实施例,PCD100提供机器学习设施,用于基于收集的数据来提高交互的质量。用于进行机器学习的算法可在PCD100上、在与PCD100通信的计算平台上发生。在示范性实施例中,PCD100可采用关联条件反射以便于用户交互来提供培训和训练。关联或“操作式”条件反射聚焦在使用强化物来增加行为上。通过该过程,在行为和对于该行为的后果之间形成关联。例如,PCD100可在用户快速醒来并且跳下床(如与保持静止相对)时发出愉快的声音。在用户使PCD100明显的愉快状态与这样的动作关联时,PCD100与用户之间的该交互随时间操作成激励用户更快起床。在另一个示例中,在观察到用户在锻炼时,PCD100可发出鼓励的声音或话音。在这样的实例中,PCD100起到对用户期望的动作提供持久正强化的作用。
根据各种示范性实施例,PCD100可在进行机器学习时采用本领域内已知的多种分析类型中的一个,其包括但不限于时间模式建模和识别、用户偏好建模、特征分类、任务/策略建模和强化学习。
根据示范性和非限制性实施例,PCD100可采用视觉、音频、动觉或“VAK”模型,用于识别最适合于与用户交互的交互模式。PCD100可操作成确定用户的主要学习风格。例如,如果PCD100确定用户采用以视觉为主的方式处理信息,PCD100可采用图表或图示,例如在图形显示器104(其形成PCD100的一部分)上,以将信息输送给用户。同样,PCD100可操作成向用户发出问题和其他提示以帮助他们在听觉环境中保持警惕。
同样,如果PCD100确定用户采用以听觉为主的方式处理信息,PCD100可在简短说明什么将要到来的情况下开始新的交互并且可以发生了什么的概要而结束。最后,如果PCD100确定用户采用以动觉为主的方式处理信息,PCD100可操作成经由动觉和触觉交互(其牵涉移动和触摸)来与用户交互。例如,为了在早晨使用户起来并且活跃,PCD100可参与活动,其中PCD100请求来自用户的拥抱。在其他实施例中,为了突出并且强化社交交互的元素,PCD100可发出与交互有关的气味。
使PCD100在房子中四处走动的能力是作为PCD100的重要方面。在操作中,PCD100操作成给予远程人员用于通信的物理体现和物理社交表达方式,其允许人们“呆在他们的生活流中”而不是必须停止并且蜷缩在屏幕前面(现代视频会议)。因此,PCD100对随意交互提供支持,好像用户在他们的房子中拜访某人一样。用户可在进行其他活动(例如洗盘子等),并且因为不管怎样PCD100可以在房间四周跟踪用户而仍然进行对话。在上文描述的示范性实施例中,PCD100设计成跨房间携带它的传感器和输出等。核心技术方面包括
用户可控制PCD100的拍摄装置视图,并且它还可以有助于通过跟踪并且进行逆向运动来使它的拍摄装置保持在目标保持在目标对象上而使此自动化。
PCD100可采用保存重要的非言语线索(像眼神接触)这一方式将你的表示(视频流、图形等)渲染到屏幕。
PCD100可监视远程人员的头部位姿、身体姿势使得人员具有富有表现力的实体存在。PCD100还可产生它自己的富有表现力的身体移动来适应情形,例如姿势镜像和同步来建立融洽关系。
PCD100可进一步触发有趣的动画和声音。因此用户可尝试准确地将你自己传达为你或有趣的形象。这对于连接故事阅读真正有用,其中奶奶可以远程与她的孙子一起阅读故事,同时在故事会话期间呈现不同形象。
PCD100可跟踪谁在讲话以使它的视线/你的拍摄装置视图自动转移到讲话者(来减少必须手动控制PCD100中的认知负荷)。
PCD100可具有滑动自主接口,使得远程用户可以维护对PCD100的或多或少直接控制,并且它可以使用自主性来补充。
PCD100可对用户提供广泛的视场(比其他装置提供/呈现的隧道视觉好得多,因为你必须呆在它的前面)。
通过做所有这些事情,并且能够将PCD100放在房子周围的不同地方,远程人员感觉到现在他们不仅可以通信,而且可以参加活动。为了能够在睡觉时共享故事、在游戏室并且与孙辈一起玩、远程参加感恩节晚餐、在你帮助你的女儿烹饪家庭食谱时坐在工作台面上等。它支持无需动手操作,因此你感觉好像你在别处也具有真实物理社交存在。
根据示范性和非限制性实施例,PCD100可配置成或适于采用稳定或平衡方式安置在用户生活和操作所在的典型环境的多种表面上或周围。例如,PCD100的大体平坦表面可由摩擦垫制造或至少部分包含摩擦垫,其操作成防止PCD100在平滑表面上滑动。在其他实施例中,PCD100可采用部分可拆分或伸缩式附器,其可被手动或自动部署以将PCD100安置在不平坦表面上。在其他实施例中,装置可具有硬件配件,其使它能够在环境中走动或操纵对象。它可配备有激光指示器或投影仪以能够在外部表面或对象上显示。在这样的实例中,PCD100可在附器的末梢上或附近包含摩擦垫以进一步减少打滑。在再其他实施例中,PCD100可在PCD100的外表面或多个表面上包含一个或多个吸杯用于暂时附连到表面。在再其他实施例中,PCD100可包含钩、环及类似物以用于使PCD100就位固定和/或悬挂PCD100。
在其他示范性实施例中,PCD100适于手可携带。具体地,PCD100配置成重量小于10kg并且占据不超过4000cm3的体积。此外,PCD100可包括附连或可拆分带子或把手以供在携带PCD100中使用。
根据示范性和非限制性实施例,PCD100配置成持久感知或能够经由计算确定社交线索的存在或出现并且在社交上存在。如此,PCD100可操作以便避免全停期。在一些实施例中,PCD100可定期进入低功率状态或“睡眠状态”来保留电力。在由的睡眠状态期间,PCD100可操作成可能处理缩减输入集以提醒PCD100社交线索的存在,例如人或用户进入PCD100附近、人嗓音的声音及类似物。当PCD100检测到PCD100能够与之交互的人或用户的存在时,PCD100可过渡到高度警惕模式,其中PCD100传感器输入中的更多或全部用于接收和处理上下文数据。
保持持久感知社交线索的能力减少PCD100永远断电或手动通电的需求。因为关闭和打开的能力是与机器装置关联的属性,PCD100避免处于完全掉电模式的能力起到增加PCD100是生活伙伴这一感知。在一些实施例中,PCD100可通过发出白噪声或摹拟打鼾的声音来增大处于睡眠状态。在这样的实例中,当用户偶遇PCD100时,PCD100感测用户的存在并且通过例如用指示醒来的噪声(例如打哈欠)问候用户而着手过渡到高度警惕或上电模式。这样的动作充当开始PCD100与用户之间的交互的队列。
根据示范性和非限制性实施例,PCD100适于监视、跟踪和表征来自用户的言语和非言语信号和线索。这样的线索的示例包括但不限于姿态、视线方向、选词、声律、身体姿势、面部表情、情感状态、触摸及类似物。所有这样的线索可由PCD100经由传感器装置102、104、106、108、112捕获。PCD100可进一步配置成更改和调整它的行为以有效地摹拟或镜像捕获的线索。通过这样做,PCD100通过似乎反映用户的特性和精神状态来增加PCD100与用户之间的融洽关系。这样的镜像可并入PCD100的人物或数字灵魂用于由PCD100长期展现所述特性或可是暂时的并且例如在一段时间(其包含特定社交交互)内扩展。
例如,如果PCD100检测到用户定期使用特定短语,PCD100可将该短语添加到交互数据的语料库以在将来与用户交互时被PCD100持久使用。相似地,PCD100可实时或近实时地摹拟瞬态言语和非言语姿态。例如,如果PCD100检测到用户嗓音的频率提升外加指示兴奋的词速率增加,PCD100可用增加的词速率在比正常频率更高的频率在言语上与用户交互。
根据示范性和非限制性实施例,PCD100可经由形成PCD100的一部分的各种物理显示(其包括但不限于身体形状因子、物理移动、图形和声音)展现截然不同的角色或数字灵魂。在一个实施例中,PCD100可采用富有表现力的机械。例如,PCD100可包含可移动下巴附器,其可在经由音频信号的输出而讲话时被激活。这样的附器可被授予足以根据情况摹拟微笑或皱眉的许多自由度。相似地,PCD100可配置有一个或多个“眼状”配件,其能够改变视觉曝光程度。因此,PCD100可以响应于受惊吓、惊讶、感兴趣及类似物来显示“睁大眼睛”表情。
根据示范性和非限制性实施例,PCD100可检测它在空间的姿势或位置以在例如屏幕模式与整体模式之间转变。例如,如果PCD100包含用于显示图形信息的屏幕104,PCD100可在用户将屏幕举到用户面部并且到一定位置(用户可以从该位置观看显示器)内时从它所处的无论什么状态转变到向屏幕输出信号的模式。
根据另一个实施例,形成PCD100的一部分的一个或多个压力传感器可检测用户何时采用社交方式触摸PCD100。例如,PCD100可从超过压力传感器在经历压力所采用的模式确定用户在按抚、抚摸或轻拍PCD100。不同的检测社交接触模式可充当对于PCD100的触发器,用于展示鼓励或抑制与用户的社交交互的交互式行为。
根据示范性和非限制性实施例,PCD100可装备有配件,用于增强PCD100的外观和感觉。这样的配件包括但不限于皮肤、服装、外部和内部灯光、面具及类似物。
如上文描述的,PCD100的角色或数字灵魂可从PCD100的物理显示分叉。包括PCD100角色的属性可作为数字数据存储,该字数据可例如经由蓝牙或wifi传输和传达到一个或多个其他计算装置,其包括但不限于服务器和个人计算装置。在这样的上下文中,个人计算装置可以是利用处理器和存储的存储器来执行一系列可编程步骤的任何装置。在一些实施例中,PCD100的数字灵魂可传输到消费者配件,例如手表或移动电话。在这样的实例中,PCD100的角色可有效且临时传输到另一个装置。在一些实施例中,在传输时,PCD100的传输实例可继续感测用户的环境、参与社交交互并且检索和输出交互数据。这样的交互数据可在稍后的时间传输到PCD100或上传到服务器以稍后供PCD100检索。
根据示范性和非限制性实施例,PCD100可展出视觉模式,其响应于社交线索来调整。例如,显示器104可在兴奋时发出红光并且在平静时发出蓝光。同样,显示器104可显示动画纸屑掉落以便传达欢庆,例如在用户成功完成任务时。在一些实施例中,对于显示器的纹理和动画可以是用户可选择的或可直接编程到PCD100内或到与PCD100通信的服务器或外部装置内。在再其他实施例中,PCD100可发出一系列嘟嘟声和哨子声来表达模拟情感。在一些实施例中,嘟嘟声和哨子声可效仿从用户的讲话和其他口头话音得到的模式。在一些实例中,嘟嘟声、哨子声和其他听觉输出可充当对PCD100唯一的听觉签名。在一些实施例中,可在多个PCD100(例如形成模拟家庭的一组“相关”PCD100)上采用相同听觉签名的变化形式,来指示相关性程度。
在一些实施例中,PCD100可参与表达模式之间的变形转变来传达情感。例如,PCD100可操作显示器104以从随机或伪随机模式或其他图形转变成具有微笑或皱眉的嘴部的显示器,作为用于显示人类情感的方法。
在其他示范性实施例中,PCD100可发出气味或信息素来表达情感状态。
根据再另一个示范性实施例,可采用对PCD100可访问的形式提供有背景故事,其可以是与用户交互的基础。这样额数据包括参考过去事件的一个或多个故事(既有真实的,也有虚构的),其形成PCD100之前的历史的一部分。例如,PCD100可提供有故事,其可经由告知PCD100的生活中的过往事情的话音产生而输送给用户。这样的故事可在请求时由用户输出,可由交互数据触发。例如,PCD100可从用户数据辨别今天是用户的生日。作为响应,PCD100可被触发以与用户共享与PCD100的过往生日相关的故事。包括背景故事的数据可集中存储并且在请求时由用户或由PCD100自主下载到PCD100。
背景故事可由PCD100的制造商产生和存储并且在存储时对用户可用。参考图11,图示有示范性和非限制性实施例的流程图1100。在示例中,在步骤1102处,制造商可接收对于PCD100仿照与对体育、特别是棒球和波斯顿红袜队感兴趣的用户关联的狗这一背景故事的请求作为输入。作为响应,在步骤1104处,制造商或第三方背景故事提供者可产生基本背景故事。在示例中,故事可包括增加有更特定故事(其涉及与红袜队有关的细节所添加到的棒球)的相对通用狗故事。
在一些实施例中,在步骤1106处,背景故事可用将允许PCD100的进一步实时定制的变量来编码。例如,背景故事可在例如:“Meandmybrothersandsisters<fori==ltomax_siblings,insertsibling_name[i]>wereraisedin...”等伪代码中编码。采用该方式,在被PCD100阅读时,故事可读为包括其他PCD100(其配置成为与PCD100有关)的名字。
根据示范性和非限制性实施例,PCD100可提供有可执行模块或程序,用于管理PCD100的同养成特征,由此鼓励用户照管伙伴装置。例如,同养成模块可操作成对用户的天生冲动加以利用以经由牵涉与婴儿关联的声音、图形、气温及类似物的行为通过开始与用户的交互来照管小孩。在同养成模块操作成表达负面情感(例如悲伤、孤独和/或沮丧)同时从用户征集减轻负面情感的动作时,PCD100与用户之间的融洽关系可进一步受到鼓励。这样,鼓励用户与PCD100交互来使PCD100高兴起来。
根据示范性和非限制性实施例,PCD100可包括这样的模块,其配置成访问指示用户属性、PCD100的用户与PCD100的交互以及PCD100的用户的环境的交互数据。参考图1200,图示有示范性和非限制性实施例的流程图。在步骤1202处,访问交互数据。一旦被检索和存储,在步骤1206处,交互数据可用于预料用户的需求状态。一旦识别需求状态,在步骤1208处,它可以用于预应式地解决用户需求而不依靠用于执行动作的调度。在一些实施例中,用户的物理外观、姿势及类似物可形成用于识别需求状态的基础。在一些实例中,需求状态的识别可通过调度数据来补充,例如包括交互数据的一部分。例如,调度可指示错过满足用户服用抗生素这一需求的时间。PCD100可部分从面部分析和语音调制分析得到的数据弄清用户的需求状态。
根据示范性和非限制性实施例,PCD100可用作信使,用于将消息从一个人中继到另一个。消息包括但不限于发送者嗓音的音频记录、PCD100用字符中继消息、用于增强消息和歌曲的舞蹈/动画/声音剪辑。
消息可采用多种方式产生。在一个实施例中,PCD100体现为智能装置上的应用。发送者可打开应用,并且选择消息和关联的声音、调度等。应用中PCD100的虚拟实例可使用户在过程中漫游。在另一个实施例中,通过与PCD100的直接交互,发送者/用户可经由简单触摸界面或自然语言界面指示PCD100在某一将来时间告诉另一个人一些事情。例如,用户可说“PCD,今天早上当我的妻子走进厨房时,播放她的某首歌曲并且告诉她我爱她”。发送者还可让PCD100录下他/她的语音以用作消息的部分。在其他实施例中,代替发送者的PCD100交付消息,消息可由另一个位点处的不同PCD100交付。在再另一个实施例中,用户/发送者可以例如将消息推文到特定PCD100标签,并且PCD100将对用户/接收者说该消息。情感符也可插入消息内,从而提示要由PCD100实行的录音动画/声音脚本。一些示范性情感符是:
| PCD 100符(ticon) | 意思 | PCD 100符 | 意思 |
| ’) | 眨眼 | oO | 呵呵呵! |
| o( | 悲伤 | oD | 大声笑!!!!! |
| o) | 愉快 | oX | 不问不说 |
| oB | 兔子会吃了你! | or | 断齿PCD 100 |
| op | 嘘声! | od | 极好! |
| oP | 嘲笑(Capital Raspberries!) | o[ | 吸血鬼/顽皮 |
| o/ | 嗯…不确定…困惑 | o{ | 脾气暴躁/脾气暴躁的老人 |
| o* | 颊吻 | o# | 秘密。不要说!我的嘴巴很严。 |
| os | 讨厌的PCD 100 | {o | 啊?/好奇 |
| ol | 假笑(或漠不关心) | }o | 生气 |
| o+ | 不舒服/吃了坏的/有酸味的东西 | o> | 有人跟我说 |
表1:情感符定义
另外,消息可被调度以稍后、在特定日期和时间和在某组情况(例如,“你在周二第一次看到某人”或“当某人在周三醒来时,将该消息给他们”)下发送。
在其他实施例中,PCD100可用于对没有PCD的用户产生消息。这样的消息可采用web链路的形式产生,并且可包含虚拟PCD100用于交付消息,正如如果接收器具有物理PCD100则物理PCD100将做的一样。
如因此显而易见的,PCD100可配置成从多个人(例如朋友和用户的家庭)接收消息,其中消息触发与消息中规定的情感有关的动作。例如,人可将消息发短信给与用户(代表消息的发送者希望经由PCD100输送的情感或社交动作的情感符嵌入其内)关联的PCD100。例如,如果发送者向PCD100发送显示“十分想念你OX”的消息,PCD100可在接收消息时经由话音合成器输出“来自Robert的进入消息显示‘十分想念你’”同时发出亲吻声音、在显示器上显示起皱的嘴唇或相似动作。这样,消息发送者可注释他们的消息以利用PCD100可与用户交互所通过的表达模态。
本文描述的方法和系统可通过机器部分或整体地部署,该机器执行处理器上的计算机软件、程序代码和/或指令。处理器可以是服务器、客户端、网络基础设施、移动计算平台、固定计算平台或其他计算平台的部分。处理器可以是任何种类的计算或处理装置,其能够执行程序指令、代码、二进制指令及类似物。处理器可以是或包括信号处理器、数字处理器、嵌入式处理器、微处理器或例如协处理器(数学协处理器、图形协处理器、通信协处理器及类似物)等任何变化形式及类似物,其可直接或间接推动存储在其上的程序代码或程序指令的执行。另外,处理器可实现多个程序、线程和代码的执行。线程可被同时执行以增强处理器的性能并且推动应用的同时操作。通过实现,本文描述的方法、程序代码、程序指令及类似物可在一个或多个线程中实现。线程可引起其他线程,可对其分配与它们关联的优先级;处理器可基于优先级或基于在程序代码中提供的指令的任何其他顺序来执行这些线程。处理器可包括存储器,其存储如本文和别处描述的方法、代码、指令和程序。处理器可通过接口来访问存储介质,其可存储如本文和别处描述的方法、代码和指令。与处理器关联的用于存储方法、程序、代码、程序指令或其他类型的指令(能够被计算或处理装置执行)的存储介质可包括但不限于CD-ROM、DVD、存储器、硬盘、闪速驱动器、RAM、ROM、高速缓存及类似物中的一个或多个。
处理器可包括一个或多个核,其可增强多处理器的速度和性能。在实施例中,处理器可以是组合两个或多个独立核(叫做芯片)的双核处理器、四核处理器、其他芯片级多处理器及类似物。
本文描述的方法和系统可通过在服务器、客户端、防火墙、网关、集线器、路由器或其他这样的计算机和/或联网硬件上执行计算机软件的机器部分或整体地部署。软件程序可与服务器关联,其可包括文件服务器、打印服务器、域服务器、互联网服务器、内联网服务器和例如副服务器、主服务器、分布式服务器及类似物等其他变化形式。服务器可包括存储器、处理器、计算机可读介质、存储介质、端口(物理和虚拟的)、通信装置和能够通过有线或无线介质访问其他服务器、客户端、机器和装置的接口及类似物中的一个或多个。如本文和别处描述的方法、程序或代码可由服务器执行。另外,如在该申请中描述的方法的执行所需要的其他装置可以视为与服务器关联的基础设施的一部分。
服务器可提供到其他装置的接口,其无限制地包括客户端、其他服务器、打印机、数据库服务器、打印服务器、文件服务器、通信服务器、分布式服务器及类似物。另外,该耦合和/或连接可推动程序跨网络的远程执行。这些装置中的一些或所有的联网可推动程序或方法在一个或多个位点处并行处理而不偏离范围。另外,通过接口附连到服务器的装置中的任一个可包括能够存储方法、程序、代码和/或指令的至少一个存储介质。中央储存库可提供要在不同装置上执行的程序指令。在该实现中,远程储存库可充当程序代码、指令和程序的存储介质。
软件程序可与客户端关联,其可包括文件客户端、打印客户端、域客户端、互联网客户端、内联网客户端和例如副客户端、主客户端、分布式客户端及类似物等其他变化形式。客户端可包括存储器、处理器、计算机可读介质、存储介质、端口(物理和虚拟的)、通信装置和能够通过有线或无线介质访问其他客户端、服务器、机器和装置的接口及类似物中的一个或多个。如本文和别处描述的方法、程序或代码可由客户端执行。另外,如在该申请中描述的方法的执行所需要的其他装置可视为与客户端关联的基础设施的一部分。
客户端可提供到其他装置的接口,其无限制地包括服务器、其他客户端、打印机、数据库服务器、打印服务器、文件服务器、通信服务器、分布式服务器及类似物。另外,该耦合和/或连接可推动程序跨网络的远程执行。这些装置中的一些或所有的联网可推动程序或方法在一个或多个位置并行处理而不偏离范围。另外,通过接口附连到客户端的装置中的任一个可包括能够存储方法、程序、应用程序、代码和/或指令的至少一个存储介质。中央储存库可提供要在不同装置上执行的程序指令。在该实现中,远程储存库可充当程序代码、指令和程序的存储介质。
本文描述的方法和系统可通过网络基础设施部分或整体部署。网络基础设施可包括例如计算装置、服务器、路由器、集线器、防火墙、客户端、个人计算机、通信装置、路由装置和如本领域内已知的其他有源和无源装置、模块和/或部件等元件。与网络基础设施关联的计算和/或非计算装置除其他部件外可包括例如闪存、缓冲器、堆栈、RAM、ROM及类似物等存储介质。本文和别处描述的进程、方法、程序代码、指令可由网络基础设施元件中的一个或多个执行。
本文和别处描述的方法、程序代码和指令可在具有多个小区的蜂窝网络上实现。蜂窝网络可以是频分多址(FDMA)网络或码分多址(CDMA)网络。蜂窝网络可包括移动装置、小区站点、基站、中继器、天线、塔及类似物。小区网络可以是GSM、GPRS、3G、EVDO、网状网络或其他网络类型。
本文和别处描述的方法、程序代码和指令可在移动装置上或通过其实现。移动装置可包括导航装置、蜂窝电话、移动电话、移动个人数字助理、便携式电脑、掌上型电脑、上网本、寻呼机、电子书阅读器、音乐播放器及类似物。这些装置除其他部件外还可包括例如闪存、缓冲器、RAM、ROM等存储介质和一个或多个计算装置。可使与移动装置关联的计算装置能够执行存储在其上的程序代码、方法和指令。备选地,移动装置可配置成与其他装置合作执行指令。移动装置可与与服务器联接并且配置成执行程序代码的基站通信。移动装置可在对等网络、网状网络或其他通信网络上通信。程序代码可存储在与服务器关联的存储介质上并且由嵌入服务器内的计算装置执行。基站可包括计算装置和存储介质。存储装置可存储由与基站关联的计算装置执行的程序代码和指令。
计算机软件、程序代码和/或指令可存储在机器可读介质上或在其上访问,其可包括:保留用于持续某些时间间隔计算的数字数据的计算机部件、装置和记录介质;称为随机存取存储器(RAM)的半导体存储器;典型地用于更永久存储的大容量存储器,例如光盘,像硬盘、磁带、磁鼓、磁卡和其他类型的磁性存储器的形式;处理器寄存器、高速缓存存储器、易失性存储器、非易失性存储器;例如CD、DVD等光学存储器;例如闪存(例如USB棒或密钥)、软盘、磁带、纸带、穿孔卡片、独立RAM盘、极碟驱动器、可移动大容量存储器、离线及类似物等可移动介质;例如动态存储器、静态存储器、读/写存储器、可变存储器、只读、随机存取、顺序存取、可寻址位置、可寻址文件、可寻址内容、网络附连存储器、存储区网络、条形码、磁性墨水及类似物等其他计算机存储器。
本文描述的方法和系统可将物理和/或无形项目从一个状态变换到另一个。本文描述的方法和系统还可将代表物理和/或无形项目的数据从一个状态变换到另一个。
在整个附图中的流程图和框图中包括的本文描述和描绘的元件隐含元件之间的逻辑界限。然而,根据软件或硬件工程实践,描绘的元件和其功能可通过计算机可执行介质在具有能够执行存储在其上的程序指令的处理器的机器(作为单片软件结构、作为独立软件模块或作为采用外部例程、代码、服务等等,或这些的任意组合的模块)上实现,并且所有这样的实现可在本公开的范围内。这样的机器的示例可包括但可不限于个人数字助理、便携式电脑、个人计算机、移动电话、其他手持计算装置、医疗装置、有线或无线通信装置、换能器、芯片、计算器、卫星、平板PC、电子书、小配件、电子装置、具有人工智能的装置、计算装置、联网设备、服务器、路由器及类似物。此外,在流程图和框图中描绘的元件或任何其他逻辑部件可在能够执行程序指令的机器上实现。从而,尽管前面的图和说明阐述公开的系统的功能方面,用于实现这些功能方面的软件的特定设置不应从这些说明推断,除非从上下文明确规定或另外清楚可见。相似地,可认识到上文识别和描述的各种步骤可改变,并且步骤的顺序可适应于本文公开的技术的特定应用。所有这样的改变和修改意在落入本公开的范围内。如此,各种步骤的顺序的示出和/或说明不应该理解为要求那些步骤的特定执行顺序,除非由特定应用要求,或从上下文明确规定或另外清楚可见。
上文描述的方法和/或进程和其步骤可采用适合于特定应用的硬件、软件或硬件和软件的任何组合实现。硬件可包括通用计算机和/或专用计算装置或特定计算装置或特定计算装置的特定方面或部件。进程可在一个或多个微处理器、微控制器、嵌入式微控制器、可编程数字信号处理器或其他可编程装置连同内部和/或外部存储器中实现。进程可还或代替包含在专用集成电路、可编程门阵列、可编程阵列逻辑或任何其他可配置成处理电子信号的装置或装置的组合中。可进一步认识到进程中的一个或多个可实现为能够在机器可读介质上执行的计算机可执行代码。
计算机可执行代码可使用例如C等结构化编程语言、例如C++等面向对象编程语言或任何其他高级或低级编程语言(包括汇编语言、硬件描述语言和数据库编程语言与技术)创建,该语言可被存储、编译或解释以在上文的装置中的一个上运行,以及在处理器、处理器架构的异构组合或不同硬件和软件的组合或能够执行程序指令的任何其他机器上运行。
从而,在一个方面,上文描述的每个方法和其组合可包含在计算机可执行代码中,该代码当在一个或多个计算装置上执行时执行其的步骤。在另一个方面,方法可包含在执行其步骤的系统中,并且可采用许多方式跨装置分布,或功能性的全部可集成到专用、独立装置或其他硬件内。在另一个方面,用于执行与上文描述的处理关联的步骤的工具可包括上文描述的硬件和/或软件中的任一个。所有这样的排列和组合都意在落入本公开的范围内。
尽管本文描述方法和系统已经连同详细示出和描述的某些优选实施例公开,对其的各种修改和改进将对于本领域内技术人员变得非常明显。因此,本文描述的精神和范围不被前面的示例限制,而要在法律允许的最宽的意义上理解。
参考图13,图示有示范性和非限制性实施例的流程图和相应方法1300。方法包括在步骤1302处提供持久伙伴装置(PCD)。方法进一步包括在步骤1304处输入来自用户的从由姿态、视线方向、选词、声律、身体姿势、面部表情、情感线索和触摸组成的组选择的言语和非言语信号中的至少一个。方法进一步包括在步骤1306处调整PCD的行为来镜像言语和非言语信号中的至少一个。
本文引用的所有文献通过引用合并于此。
Claims (38)
1.一种方法,其包括:
提供使能电信的机器人装置,其适于留存在用户环境中;
接收指令以根据第一参数对所述环境中的一个或多个人拍照;以及
根据所述第一参数对所述一个或多个人拍照,从而产生照片和视频中的至少一个。
2.如权利要求1所述的方法,其中所述第一参数是时间参数。
3.如权利要求2所述的方法,其中所述时间参数从由预定时间量、拍摄照片所处的速率、起始时间和结束时间组成的组选择。
4.如权利要求1所述的方法,其中对所述一个或多个人拍照包括利用至少一个感觉输入来识别要拍照的所述一个或多个人中的每个。
5.如权利要求4所述的方法,其中所述至少一个感觉输入从由听觉输入、视觉输入、触摸输入和远程装置输入组成的组选择。
6.如权利要求1所述的方法,其中对所述一个或多个人拍照包括利用声音位点和面部检测或面部识别中的至少一个来识别要拍照的所述一个或多个人中的每个。
7.如权利要求1所述的方法,其中所述第一参数促使所述机器人装置搜索人来拍照或录像、选择目标人来照相或录像并且在捕获照片或视频时经由移动来跟踪所述目标。
8.如权利要求1所述的方法,其进一步包括将照片和视频中的至少一个上传到所述云。
9.如权利要求8所述的方法,其进一步包括使用户能够对照片和视频中的至少一个执行动作,所述动作从由删除、编辑和裁剪组成的组选择。
10.如权利要求1所述的方法,其进一步包括将照片和视频中的至少一个上传到社交媒体网站。
11.如权利要求1所述的方法,其进一步包括将照片和视频中的至少一个通过电子邮件发给或以其他方式数字发送到社交媒体网站或到另一个装置,或从另一个装置接收图像或视频。
12.如权利要求1所述的方法,其进一步包括:
观察要拍照的人的情感状态;以及
响应于观察的情感状态发出队列来激起人的优选情感状态。
13.如权利要求12所述的方法,其中所述人的优选情感状态是微笑。
14.如权利要求12所述的方法,其中所述队列至少部分从所述云接收的数据得到。
15.如权利要求1所述的方法,其进一步包括:
从用户接收第二参数;以及
根据所述第二参数对所述一个或多个人拍照。
16.如权利要求15所述的方法,其中所述第二参数是拍摄所述一个或多个人中的每个的至少一个照片或视频的要求。
17.如权利要求15所述的方法,其进一步包括将请求传播到要拍照的人,或从人接收输入,来改进图像合成。
18.如权利要求17所述的方法,其中所述请求指示所述一个或多个人中的至少一个保持静止。
19.如权利要求1所述的方法,其进一步包括:传播对于所述一个或多个人中的至少一个的标识符的请求;
从所述一个或多个人中的至少一个接收标识符;以及
使接收的标识符与所述一个或多个人中的至少一个的照片和视频中的至少一个关联。
20.如权利要求1所述的方法,其中所述指令从所述用户接收。
21.一种计算机程序产品,其驻存在计算机可读介质上,所述计算机可读介质形成适于留存在用户环境中的使能电信的机器人装置的一部分,所述计算机可读介质具有存储在其上的多个指令,所述指令在由处理器执行时促使所述处理器执行操作,其包括:
提供适于留存在用户环境中的使能电信的机器人装置;
接收指令以根据第一参数对所述环境中的一个或多个人拍照;以及
根据所述第一参数对所述一个或多个人拍照,从而产生照片和视频中的至少一个。
22.如权利要求21所述的计算机程序,其中所述第一参数是时间参数。
23.如权利要求22所述的计算机程序,其中所述时间参数从由预定时间量、拍摄照片所处的速率、起始时间和结束时间组成的组选择。
24.如权利要求21所述的计算机程序,其中对所述一个或多个人拍照包括利用至少一个感觉输入来识别要拍照的一个或多个人中的每个。
25.如权利要求24所述的计算机程序,其中所述至少一个感觉输入从由听觉输入、视觉输入、触摸输入和远程装置输入组成的组选择。
26.如权利要求21所述的计算机程序,其中对所述一个或多个人拍照包括利用声音位点和面部识别中的至少一个来识别要拍照的所述一个或多个人中的每个。
27.如权利要求21所述的计算机程序,其进一步包括将照片和视频中的至少一个上传到所述云。
28.如权利要求25所述的计算机程序,其进一步包括使用户能够对照片和视频中的至少一个执行动作,所述动作从由删除、编辑和裁剪组成的组选择。
29.如权利要求21所述的计算机程序,其进一步包括将照片和视频中的至少一个上传到社交媒体网站。
30.如权利要求21所述的计算机程序,其进一步包括将照片和视频中的至少一个通过电子邮件发给社交媒体网站。
31.如权利要求21所述的计算机程序,其进一步包括:
观察要拍照的人的情感状态;以及
响应于观察的情感状态发出队列来激起人的优选情感状态。
32.如权利要求31所述的计算机程序,其中所述人的优选情感状态是微笑。
33.如权利要求31所述的计算机程序,其中所述队列至少部分从所述云接收的数据得到。
34.如权利要求21所述的计算机程序,其进一步包括:
从用户接收第二参数;以及
根据所述第二参数对所述一个或多个人拍照。
35.如权利要求34所述的计算机程序,其中所述第二参数是拍摄所述一个或多个人中的每个的至少一个照片的要求。
36.如权利要求34所述的计算机程序,其进一步包括将请求传播到所述一个或多个人中的至少一个来保持静止。
37.如权利要求21所述的计算机程序,其进一步包括:传播对于所述一个或多个人中的至少一个的标识符的请求;
从所述一个或多个人中的至少一个接收标识符;以及
使接收的标识符与所述一个或多个人中的至少一个的照片和视频中的至少一个关联。
38.如权利要求21所述的计算机程序,其中所述指令从所述用户接收。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361788732P | 2013-03-15 | 2013-03-15 | |
| US61/788732 | 2013-03-15 | ||
| PCT/US2014/026815 WO2014152015A1 (en) | 2013-03-15 | 2014-03-13 | Apparatus and methods for providing a persistent companion device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN105409197A true CN105409197A (zh) | 2016-03-16 |
Family
ID=51531442
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201480027482.8A Pending CN105409197A (zh) | 2013-03-15 | 2014-03-13 | 用于提供持久伙伴装置的设备和方法 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US10391636B2 (zh) |
| EP (1) | EP2974273A4 (zh) |
| JP (1) | JP2016522465A (zh) |
| KR (1) | KR20160034243A (zh) |
| CN (1) | CN105409197A (zh) |
| AU (2) | AU2014236686B2 (zh) |
| HK (1) | HK1217847A1 (zh) |
| WO (1) | WO2014152015A1 (zh) |
Cited By (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106489114A (zh) * | 2016-06-29 | 2017-03-08 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| CN106537294A (zh) * | 2016-06-29 | 2017-03-22 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| CN106653027A (zh) * | 2017-02-17 | 2017-05-10 | 安徽金猫数字科技有限公司 | 一种基于NodeJS的智能家居语音控制系统 |
| CN106730234A (zh) * | 2017-01-11 | 2017-05-31 | 上海北辰软件股份有限公司 | 一种智能情绪疏导系统 |
| CN107498553A (zh) * | 2016-06-14 | 2017-12-22 | 富士施乐株式会社 | 机器人控制系统和机器人控制方法 |
| WO2018000261A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| CN108874812A (zh) * | 2017-05-10 | 2018-11-23 | 腾讯科技(北京)有限公司 | 一种数据处理方法及服务器、计算机存储介质 |
| CN108885795A (zh) * | 2016-03-31 | 2018-11-23 | 斯纳普公司 | 自动化头像生成 |
| CN109891357A (zh) * | 2016-10-20 | 2019-06-14 | 阿恩齐达卡士技术私人有限公司 | 情感智能陪伴装置 |
| CN110139732A (zh) * | 2016-11-10 | 2019-08-16 | 华纳兄弟娱乐公司 | 具有环境控制特征的社交机器人 |
| CN112883170A (zh) * | 2021-01-20 | 2021-06-01 | 中国人民大学 | 一种用户反馈引导的自适应对话推荐方法和系统 |
| US20220293100A1 (en) * | 2019-09-04 | 2022-09-15 | Ai Speech Co., Ltd. | Full-duplex voice dialogue method |
| US11843456B2 (en) | 2016-10-24 | 2023-12-12 | Snap Inc. | Generating and displaying customized avatars in media overlays |
| US12363056B2 (en) | 2017-01-23 | 2025-07-15 | Snap Inc. | Customized digital avatar accessories |
| TWI904664B (zh) * | 2024-05-09 | 2025-11-11 | 兆豐國際商業銀行股份有限公司 | 具客戶識別之語音服務系統和其方法 |
Families Citing this family (98)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101358999B1 (ko) * | 2011-11-21 | 2014-02-07 | (주) 퓨처로봇 | 캐릭터의 다국어 발화 시스템 및 방법 |
| US9159313B2 (en) * | 2012-04-03 | 2015-10-13 | Sony Corporation | Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis |
| JP2016522465A (ja) | 2013-03-15 | 2016-07-28 | ジボ インコーポレイテッド | 永続性コンパニオンデバイスを提供するための装置及び方法 |
| US20150314454A1 (en) | 2013-03-15 | 2015-11-05 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
| US9910660B2 (en) * | 2013-08-05 | 2018-03-06 | Harman International Industries, Incorporated | Operating system replacement for in-vehicle computing system |
| US9847082B2 (en) * | 2013-08-23 | 2017-12-19 | Honeywell International Inc. | System for modifying speech recognition and beamforming using a depth image |
| WO2015123658A1 (en) | 2014-02-14 | 2015-08-20 | Sonic Blocks, Inc. | Modular quick-connect a/v system and methods thereof |
| US20150302422A1 (en) * | 2014-04-16 | 2015-10-22 | 2020 Ip Llc | Systems and methods for multi-user behavioral research |
| JP6561433B2 (ja) | 2014-05-15 | 2019-08-21 | ソニー株式会社 | 複数のハードウェアのエレメントを連係動作させることによって機能を実現させるための方法、システム、端末装置、およびサーバ |
| USD746886S1 (en) | 2014-05-23 | 2016-01-05 | JIBO, Inc. | Robot |
| US11294549B1 (en) * | 2014-06-06 | 2022-04-05 | Massachusetts Mutual Life Insurance Company | Systems and methods for customizing sub-applications and dashboards in a digital huddle environment |
| US11270264B1 (en) | 2014-06-06 | 2022-03-08 | Massachusetts Mutual Life Insurance Company | Systems and methods for remote huddle collaboration |
| JP6396463B2 (ja) * | 2014-07-01 | 2018-09-26 | シャープ株式会社 | 姿勢制御装置、ロボット、プログラム、および姿勢制御方法 |
| US9418663B2 (en) | 2014-07-31 | 2016-08-16 | Google Inc. | Conversational agent with a particular spoken style of speech |
| US9630318B2 (en) * | 2014-10-02 | 2017-04-25 | Brain Corporation | Feature detection apparatus and methods for training of robotic navigation |
| US9692867B2 (en) * | 2014-12-05 | 2017-06-27 | Here Global B.V. | Event accessory item location |
| US9529359B1 (en) | 2015-01-08 | 2016-12-27 | Spring Communications Company L.P. | Interactive behavior engagement and management in subordinate airborne robots |
| US10192546B1 (en) * | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
| KR102341144B1 (ko) | 2015-06-01 | 2021-12-21 | 삼성전자주식회사 | 메시지를 출력하는 전자 장치 및 그 제어 방법 |
| DE102015210879A1 (de) * | 2015-06-15 | 2016-12-15 | BSH Hausgeräte GmbH | Vorrichtung zur Unterstützung eines Nutzers in einem Haushalt |
| CN104951077A (zh) * | 2015-06-24 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法、装置和终端设备 |
| US9724824B1 (en) * | 2015-07-08 | 2017-08-08 | Sprint Communications Company L.P. | Sensor use and analysis for dynamic update of interaction in a social robot |
| CN105159111B (zh) * | 2015-08-24 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 基于人工智能的智能交互设备控制方法及系统 |
| CN105108733B (zh) * | 2015-08-25 | 2021-02-23 | 深圳乐行天下科技有限公司 | 机器人 |
| US9652896B1 (en) | 2015-10-30 | 2017-05-16 | Snap Inc. | Image based tracking in augmented reality systems |
| US10839302B2 (en) | 2015-11-24 | 2020-11-17 | The Research Foundation For The State University Of New York | Approximate value iteration with complex returns by bounding |
| US9984499B1 (en) | 2015-11-30 | 2018-05-29 | Snap Inc. | Image and point cloud based tracking and in augmented reality systems |
| KR102573769B1 (ko) | 2015-12-15 | 2023-09-04 | 삼성전자주식회사 | 전자장치 및 그 거치대 |
| KR102546714B1 (ko) | 2015-12-15 | 2023-06-23 | 삼성전자주식회사 | 전자장치 및 그 거치대 |
| CN105425970B (zh) * | 2015-12-29 | 2019-02-26 | 深圳微服机器人科技有限公司 | 一种人机互动的方法、装置及机器人 |
| US10664741B2 (en) | 2016-01-14 | 2020-05-26 | Samsung Electronics Co., Ltd. | Selecting a behavior of a virtual agent |
| US10452816B2 (en) * | 2016-02-08 | 2019-10-22 | Catalia Health Inc. | Method and system for patient engagement |
| US9921574B1 (en) * | 2016-03-03 | 2018-03-20 | Sprint Communications Company L.P. | Dynamic interactive robot dialogue creation incorporating disparate information sources and collective feedback analysis |
| KR102558873B1 (ko) * | 2016-03-23 | 2023-07-25 | 한국전자통신연구원 | 상호 작용 장치 및 그것의 상호 작용 방법 |
| KR102498451B1 (ko) | 2016-03-24 | 2023-02-13 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 정보 제공 방법 |
| KR102537543B1 (ko) | 2016-03-24 | 2023-05-26 | 삼성전자주식회사 | 지능형 전자 장치 및 그 동작 방법 |
| KR102498364B1 (ko) | 2016-03-24 | 2023-02-10 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 정보 제공 방법 |
| KR102306624B1 (ko) * | 2016-03-31 | 2021-09-28 | 엔티티 디스럽션 유에스 | 지속적 컴패니언 디바이스 구성 및 전개 플랫폼 |
| JP2019523714A (ja) * | 2016-04-26 | 2019-08-29 | タキオン ロボティクス コーポレーション | 多重相互作用人格ロボット |
| JP2017204231A (ja) * | 2016-05-13 | 2017-11-16 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
| US10096321B2 (en) * | 2016-08-22 | 2018-10-09 | Intel Corporation | Reverberation compensation for far-field speaker recognition |
| US10192551B2 (en) | 2016-08-30 | 2019-01-29 | Google Llc | Using textual input and user state information to generate reply content to present in response to the textual input |
| DE102016216407A1 (de) * | 2016-08-31 | 2018-03-01 | BSH Hausgeräte GmbH | Individuelle Kommunikationsunterstützung |
| JP6848276B2 (ja) * | 2016-09-05 | 2021-03-24 | カシオ計算機株式会社 | 情報共有装置、情報共有方法、プログラム及び情報共有システム |
| JP6672114B2 (ja) * | 2016-09-13 | 2020-03-25 | 本田技研工業株式会社 | 会話メンバー最適化装置、会話メンバー最適化方法およびプログラム |
| US10942596B2 (en) * | 2016-10-03 | 2021-03-09 | Carnegie Mellon University | Touch-sensing system |
| US10339769B2 (en) | 2016-11-18 | 2019-07-02 | Google Llc | Server-provided visual output at a voice interface device |
| USD832328S1 (en) * | 2016-12-16 | 2018-10-30 | Samsung Electronics Co., Ltd. | Robotic device |
| KR102640420B1 (ko) | 2016-12-22 | 2024-02-26 | 삼성전자주식회사 | 홈 로봇 장치의 동작 운용 방법 및 이를 지원하는 홈 로봇 장치 |
| KR102616403B1 (ko) * | 2016-12-27 | 2023-12-21 | 삼성전자주식회사 | 전자 장치 및 그의 메시지 전달 방법 |
| US10373515B2 (en) | 2017-01-04 | 2019-08-06 | International Business Machines Corporation | System and method for cognitive intervention on human interactions |
| US10235990B2 (en) | 2017-01-04 | 2019-03-19 | International Business Machines Corporation | System and method for cognitive intervention on human interactions |
| US10318639B2 (en) | 2017-02-03 | 2019-06-11 | International Business Machines Corporation | Intelligent action recommendation |
| US10319149B1 (en) | 2017-02-17 | 2019-06-11 | Snap Inc. | Augmented reality anamorphosis system |
| US10074381B1 (en) * | 2017-02-20 | 2018-09-11 | Snap Inc. | Augmented reality speech balloon system |
| CN106956271B (zh) | 2017-02-27 | 2019-11-05 | 华为技术有限公司 | 预测情感状态的方法和机器人 |
| WO2018183812A1 (en) * | 2017-03-30 | 2018-10-04 | JIBO, Inc. | Persistent companion device configuration and deployment platform |
| US20180295317A1 (en) * | 2017-04-11 | 2018-10-11 | Motorola Mobility Llc | Intelligent Dynamic Ambient Scene Construction |
| KR101944777B1 (ko) * | 2017-04-16 | 2019-02-01 | 이상훈 | 시선 인식에 의한 대화 연속성 식별 기반의 휴먼 인터페이스 처리형 인공지능 스피커 |
| US10387730B1 (en) | 2017-04-20 | 2019-08-20 | Snap Inc. | Augmented reality typography personalization system |
| CN117798903A (zh) | 2017-11-13 | 2024-04-02 | 青少年工程公司 | 用于控制机械臂的用户交互电子系统和方法 |
| US11504856B2 (en) | 2017-12-29 | 2022-11-22 | DMAI, Inc. | System and method for selective animatronic peripheral response for human machine dialogue |
| CN112074899B (zh) | 2017-12-29 | 2025-01-10 | 暗物智能科技(广州)有限公司 | 基于多模态传感输入的人机对话的智能发起的系统和方法 |
| US20190206402A1 (en) * | 2017-12-29 | 2019-07-04 | DMAI, Inc. | System and Method for Artificial Intelligence Driven Automated Companion |
| US11024294B2 (en) | 2017-12-29 | 2021-06-01 | DMAI, Inc. | System and method for dialogue management |
| US20190236976A1 (en) * | 2018-01-31 | 2019-08-01 | Rnd64 Limited | Intelligent personal assistant device |
| US11331807B2 (en) | 2018-02-15 | 2022-05-17 | DMAI, Inc. | System and method for dynamic program configuration |
| KR102148031B1 (ko) * | 2018-06-25 | 2020-10-14 | 엘지전자 주식회사 | 로봇 |
| KR102148032B1 (ko) | 2018-06-25 | 2020-08-26 | 엘지전자 주식회사 | 로봇 |
| US11188810B2 (en) | 2018-06-26 | 2021-11-30 | At&T Intellectual Property I, L.P. | Integrated assistance platform |
| CN109214303B (zh) * | 2018-08-14 | 2021-10-01 | 北京工商大学 | 一种基于云端api的多线程动态人脸签到方法 |
| CN113168526B (zh) | 2018-10-09 | 2024-08-27 | 奇跃公司 | 用于虚拟和增强现实的系统和方法 |
| KR102238337B1 (ko) * | 2018-11-28 | 2021-04-12 | 백준흠 | 자세 관찰 스마트 토이 및 이를 이용한 플랫폼 서비스 |
| JP6611972B1 (ja) | 2019-03-05 | 2019-11-27 | 正通 亀井 | アドバイス提示システム |
| CN109807900A (zh) * | 2019-03-19 | 2019-05-28 | 西北工业大学 | 一种工业机器人组件化控制系统的软件架构 |
| US11376743B2 (en) * | 2019-04-04 | 2022-07-05 | Joyhaptics Oy | Systems and methods for providing remote touch |
| US11544594B2 (en) * | 2019-04-11 | 2023-01-03 | Sunghee Woo | Electronic device comprising user interface for providing user-participating-type AI training service, and server and method for providing user-participating-type AI training service using the electronic device |
| WO2020213245A1 (ja) * | 2019-04-16 | 2020-10-22 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| EP3894972B1 (en) * | 2019-04-29 | 2023-11-08 | Google LLC | Motorized computing device that autonomously adjusts device location and/or orientation of interfaces according to automated assistant requests |
| EP3739396A1 (de) * | 2019-05-15 | 2020-11-18 | Siemens Aktiengesellschaft | System zur bewegungsführung eines manipulators aufweisend einen ersten und einen zweiten prozessor |
| KR102807150B1 (ko) * | 2019-08-14 | 2025-05-16 | 엘지전자 주식회사 | 로봇 및 그의 제어 방법 |
| US11263198B2 (en) | 2019-09-05 | 2022-03-01 | Soundhound, Inc. | System and method for detection and correction of a query |
| EP3797938B1 (en) * | 2019-09-27 | 2024-01-03 | Tata Consultancy Services Limited | Attention shifting of a robot in a group conversation using audio-visual perception based speaker localization |
| US11342895B2 (en) * | 2019-10-07 | 2022-05-24 | Bose Corporation | Systems and methods for modifying an audio playback |
| JP7392377B2 (ja) * | 2019-10-10 | 2023-12-06 | 沖電気工業株式会社 | 機器、情報処理方法、プログラム、情報処理システムおよび情報処理システムの方法 |
| US11176357B2 (en) * | 2019-10-30 | 2021-11-16 | Tascent, Inc. | Fast face image capture system |
| US11004284B2 (en) * | 2019-11-09 | 2021-05-11 | Azure Katherine Zilka | Smart home system, method, and computer program |
| US12175399B2 (en) * | 2020-01-10 | 2024-12-24 | Blue Yonder Group, Inc. | Systems and methods of hybrid interfaces utilizing conversational virtual assistants |
| CN112801091B (zh) * | 2021-01-26 | 2023-06-13 | 汕头大学 | 一种基于深度学习的增材制造制件成形质量监控与预测方法 |
| US12412567B1 (en) | 2021-05-05 | 2025-09-09 | Amazon Technologies, Inc. | Low latency audio processing techniques |
| US12032377B2 (en) * | 2021-05-25 | 2024-07-09 | Ubkang (Qingdao) Technology Co., Ltd. | Mobility aid robot navigating method and mobility aid robot using the same |
| USD1030769S1 (en) | 2021-09-04 | 2024-06-11 | Assa Abloy Global Solutions Ab | Wall mountable door access device |
| US11762716B2 (en) * | 2022-01-10 | 2023-09-19 | Jason Michael Rowoldt | Automatic animation system and method |
| CN114565586B (zh) * | 2022-03-02 | 2023-05-30 | 小荷医疗器械(海南)有限公司 | 息肉分割模型的训练方法、息肉分割方法及相关装置 |
| KR102780391B1 (ko) * | 2022-05-19 | 2025-03-13 | 주식회사 코트라스 | 돌봄형 인지재활 로봇 및 그것을 이용한 돌봄형 인지재활 방법 |
| EP4607508A1 (en) * | 2024-02-23 | 2025-08-27 | Tata Consultancy Services Limited | Method and system for expressing telepresence robot internal states using combination of multiple modalities |
| WO2025204836A1 (ja) * | 2024-03-28 | 2025-10-02 | ソニーグループ株式会社 | 情報提供システム、情報提供方法および情報提供プログラム |
| US20250372075A1 (en) * | 2024-05-29 | 2025-12-04 | Fyi.Fyi, Inc. | Artificial intelligence radio |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1318454A (zh) * | 2000-03-31 | 2001-10-24 | 索尼公司 | 机器人装置及机器人装置动作决定方法 |
| CN1835828A (zh) * | 2003-08-12 | 2006-09-20 | 株式会社国际电气通信基础技术研究所 | 用于通信机器人的控制系统 |
| US20070192910A1 (en) * | 2005-09-30 | 2007-08-16 | Clara Vu | Companion robot for personal interaction |
| CN101362334A (zh) * | 2008-09-25 | 2009-02-11 | 塔米智能科技(北京)有限公司 | 一种智能机器人及其运作方法 |
| KR20110129042A (ko) * | 2010-05-25 | 2011-12-01 | 숭실대학교산학협력단 | 표정인식을 이용한 휴대 기기의 상호작용 방법 |
Family Cites Families (57)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SE454250B (sv) | 1984-09-24 | 1988-04-18 | Asea Ab | Industrirobot med linjera drivanordningar |
| JPH07281242A (ja) | 1994-04-06 | 1995-10-27 | Hideaki Tatsumi | カメラのアオリ撮影用アタッチメント |
| US5832189A (en) | 1996-09-26 | 1998-11-03 | Interval Research Corporation | Affect-based robot communication methods and systems |
| US6347261B1 (en) * | 1999-08-04 | 2002-02-12 | Yamaha Hatsudoki Kabushiki Kaisha | User-machine interface system for enhanced interaction |
| JP2002000574A (ja) | 2000-06-22 | 2002-01-08 | Matsushita Electric Ind Co Ltd | 介護支援用ロボットおよび介護支援システム |
| US7478047B2 (en) * | 2000-11-03 | 2009-01-13 | Zoesis, Inc. | Interactive character system |
| JP2003225228A (ja) * | 2002-01-31 | 2003-08-12 | Sanyo Electric Co Ltd | 健康管理端末装置,コンピュータプログラム及び記録媒体 |
| JP2005342862A (ja) * | 2004-06-04 | 2005-12-15 | Nec Corp | ロボット |
| JP4179230B2 (ja) * | 2004-06-07 | 2008-11-12 | ソニー株式会社 | ロボット装置及びその動作制御方法 |
| JP2006123136A (ja) * | 2004-11-01 | 2006-05-18 | Advanced Telecommunication Research Institute International | コミュニケーションロボット |
| JP2007069302A (ja) * | 2005-09-07 | 2007-03-22 | Hitachi Ltd | 動作表出装置 |
| KR101309562B1 (ko) * | 2006-10-25 | 2013-09-17 | 에스케이플래닛 주식회사 | 사용자의 행동을 판단하여 몸을 움직여 감정을 표현하는로봇 및 그 방법 |
| US8265793B2 (en) | 2007-03-20 | 2012-09-11 | Irobot Corporation | Mobile robot for telecommunication |
| US8909370B2 (en) | 2007-05-08 | 2014-12-09 | Massachusetts Institute Of Technology | Interactive systems employing robotic companions |
| KR20090001725A (ko) | 2007-05-14 | 2009-01-09 | 주식회사 유진로봇 | 로봇 구동을 위한 하드웨어 시뮬레이션 방법 및 시스템 |
| JP2009072910A (ja) | 2008-12-22 | 2009-04-09 | Nec Corp | ロボット装置及びその制御方法 |
| CN101774179B (zh) | 2009-01-10 | 2012-09-19 | 鸿富锦精密工业(深圳)有限公司 | 机器人连接轴 |
| US8608398B2 (en) | 2009-06-09 | 2013-12-17 | King Fahd University Of Petroleum And Minerals | Spherical joint with internal brake |
| ES2358139B1 (es) * | 2009-10-21 | 2012-02-09 | Thecorpora, S.L. | Robot social. |
| USD639353S1 (en) | 2009-11-13 | 2011-06-07 | Home Focus Development Limited | Toy figurine |
| KR101119030B1 (ko) | 2010-05-12 | 2012-03-13 | (주) 퓨처로봇 | 지능형 로봇 장치의 서비스 시나리오 편집 방법, 그 방법을 실행하기 위한 프로그램을 기록한 컴퓨터 판독가능한 기록매체, 지능형 로봇 장치 및 지능형 로봇의 서비스 방법 |
| US10343283B2 (en) * | 2010-05-24 | 2019-07-09 | Intouch Technologies, Inc. | Telepresence robot system that can be accessed by a cellular phone |
| CN102259336A (zh) | 2010-05-28 | 2011-11-30 | 鸿富锦精密工业(深圳)有限公司 | 机器人 |
| CN103459099B (zh) * | 2011-01-28 | 2015-08-26 | 英塔茨科技公司 | 与一个可移动的远程机器人相互交流 |
| USD688577S1 (en) | 2012-02-21 | 2013-08-27 | Faro Technologies, Inc. | Laser tracker |
| US20120277914A1 (en) * | 2011-04-29 | 2012-11-01 | Microsoft Corporation | Autonomous and Semi-Autonomous Modes for Robotic Capture of Images and Videos |
| US8996429B1 (en) * | 2011-05-06 | 2015-03-31 | Google Inc. | Methods and systems for robot personality development |
| KR101257896B1 (ko) | 2011-05-25 | 2013-04-24 | (주) 퓨처로봇 | 스마트 서비스 로봇 운영 시스템 및 방법 |
| TW201251445A (en) * | 2011-06-10 | 2012-12-16 | Altek Corp | System and method of driving shutter by an object moving tendency |
| US9259842B2 (en) * | 2011-06-10 | 2016-02-16 | Microsoft Technology Licensing, Llc | Interactive robot initialization |
| USD695345S1 (en) | 2011-07-22 | 2013-12-10 | Kt Corporation | Educational robot |
| CN103085082B (zh) | 2011-11-04 | 2015-10-14 | 鸿富锦精密工业(深圳)有限公司 | 机器人臂部件 |
| US9550299B2 (en) * | 2011-11-29 | 2017-01-24 | Technion Research & Development Foundation Ltd. | Robotic mechanism with two degrees of freedom |
| US20150138333A1 (en) | 2012-02-28 | 2015-05-21 | Google Inc. | Agent Interfaces for Interactive Electronics that Support Social Cues |
| KR102035369B1 (ko) | 2012-03-29 | 2019-10-22 | 가부시키가이샤 아루박 | 다관절 로봇, 반송 장치 |
| US9495129B2 (en) * | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
| USD722281S1 (en) | 2012-07-09 | 2015-02-10 | Adept Technology, Inc. | Mobile robotic platform |
| JP2012192518A (ja) | 2012-07-12 | 2012-10-11 | Kawasaki Heavy Ind Ltd | 冗長関節部を有する冗長ロボットの制御装置および制御方法 |
| KR101190660B1 (ko) | 2012-07-23 | 2012-10-15 | (주) 퓨처로봇 | 로봇 제어 시나리오 생성 방법 및 장치 |
| USD685438S1 (en) | 2012-09-12 | 2013-07-02 | Byd Company Limited | Robot |
| KR101281806B1 (ko) | 2012-12-28 | 2013-07-04 | (주) 퓨처로봇 | 퍼스널 로봇 |
| DE102013204588A1 (de) | 2013-03-15 | 2014-09-18 | Siemens Aktiengesellschaft | Drehmomentübertragungsvorrichtung, Aktor, Roboter |
| JP2016522465A (ja) | 2013-03-15 | 2016-07-28 | ジボ インコーポレイテッド | 永続性コンパニオンデバイスを提供するための装置及び方法 |
| US20150314454A1 (en) | 2013-03-15 | 2015-11-05 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
| US9519495B2 (en) | 2013-06-14 | 2016-12-13 | Microsoft Technology Licensing, Llc | Timed API rules for runtime verification |
| USD733203S1 (en) | 2013-12-17 | 2015-06-30 | Roambotics Inc. | Personal robot |
| DE102014202145A1 (de) | 2014-02-06 | 2015-08-06 | Kuka Roboter Gmbh | Verfahren zum Programmieren eines Industrieroboters und zugehörigerIndustrieroboter |
| USD746886S1 (en) | 2014-05-23 | 2016-01-05 | JIBO, Inc. | Robot |
| US10398275B2 (en) | 2014-05-23 | 2019-09-03 | Lg Electronics Inc. | Robot cleaner |
| JP6440385B2 (ja) | 2014-06-10 | 2018-12-19 | キヤノン株式会社 | ロボットアーム、表示装置およびロボットシステム |
| US9718187B2 (en) | 2014-06-11 | 2017-08-01 | Canon Kabushiki Kaisha | Robot controlling method, robot apparatus, program, recording medium, and method for manufacturing assembly component |
| USD734821S1 (en) | 2014-07-14 | 2015-07-21 | Play-i, Inc. | Robotic toy |
| WO2016011159A1 (en) | 2014-07-15 | 2016-01-21 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
| US9604357B2 (en) | 2014-07-30 | 2017-03-28 | Kabushiki Kaisha Yaskawa Denki | Robot and device having multi-axis motion sensor, and method of use thereof |
| JP6075343B2 (ja) | 2014-09-02 | 2017-02-08 | トヨタ自動車株式会社 | 走行ロボット、その動作計画方法及びプログラム |
| GB2529849B (en) | 2014-09-03 | 2017-06-14 | Dyson Technology Ltd | A robot cleaner |
| GB2529847B (en) | 2014-09-03 | 2018-12-19 | Dyson Technology Ltd | A mobile Robot with Independently Adjustable Light Sources |
-
2014
- 2014-03-13 JP JP2016502253A patent/JP2016522465A/ja active Pending
- 2014-03-13 CN CN201480027482.8A patent/CN105409197A/zh active Pending
- 2014-03-13 US US14/210,037 patent/US10391636B2/en active Active
- 2014-03-13 EP EP14767391.7A patent/EP2974273A4/en not_active Withdrawn
- 2014-03-13 WO PCT/US2014/026815 patent/WO2014152015A1/en not_active Ceased
- 2014-03-13 AU AU2014236686A patent/AU2014236686B2/en active Active
- 2014-03-13 HK HK16105742.2A patent/HK1217847A1/zh unknown
- 2014-03-13 KR KR1020157025366A patent/KR20160034243A/ko not_active Withdrawn
-
2017
- 2017-09-13 AU AU2017228574A patent/AU2017228574A1/en not_active Abandoned
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1318454A (zh) * | 2000-03-31 | 2001-10-24 | 索尼公司 | 机器人装置及机器人装置动作决定方法 |
| CN1835828A (zh) * | 2003-08-12 | 2006-09-20 | 株式会社国际电气通信基础技术研究所 | 用于通信机器人的控制系统 |
| US20070192910A1 (en) * | 2005-09-30 | 2007-08-16 | Clara Vu | Companion robot for personal interaction |
| CN101362334A (zh) * | 2008-09-25 | 2009-02-11 | 塔米智能科技(北京)有限公司 | 一种智能机器人及其运作方法 |
| KR20110129042A (ko) * | 2010-05-25 | 2011-12-01 | 숭실대학교산학협력단 | 표정인식을 이용한 휴대 기기의 상호작용 방법 |
Non-Patent Citations (1)
| Title |
|---|
| JEAN-MARC VALIN ET AL: "Robust localization and tracking of simultaneous moving sound sources using beamforming and particle filtering", 《PREPRINT SUBMITTED TO ELSEVIER SCIENCE》 * |
Cited By (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11631276B2 (en) | 2016-03-31 | 2023-04-18 | Snap Inc. | Automated avatar generation |
| CN108885795A (zh) * | 2016-03-31 | 2018-11-23 | 斯纳普公司 | 自动化头像生成 |
| CN107498553A (zh) * | 2016-06-14 | 2017-12-22 | 富士施乐株式会社 | 机器人控制系统和机器人控制方法 |
| CN107498553B (zh) * | 2016-06-14 | 2021-10-15 | 富士胶片商业创新有限公司 | 机器人控制系统和机器人控制方法 |
| CN106489114A (zh) * | 2016-06-29 | 2017-03-08 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| CN106537294A (zh) * | 2016-06-29 | 2017-03-22 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| WO2018000259A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| WO2018000258A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| WO2018000261A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
| CN109891357A (zh) * | 2016-10-20 | 2019-06-14 | 阿恩齐达卡士技术私人有限公司 | 情感智能陪伴装置 |
| US12316589B2 (en) | 2016-10-24 | 2025-05-27 | Snap Inc. | Generating and displaying customized avatars in media overlays |
| US12113760B2 (en) | 2016-10-24 | 2024-10-08 | Snap Inc. | Generating and displaying customized avatars in media overlays |
| US11876762B1 (en) | 2016-10-24 | 2024-01-16 | Snap Inc. | Generating and displaying customized avatars in media overlays |
| US11843456B2 (en) | 2016-10-24 | 2023-12-12 | Snap Inc. | Generating and displaying customized avatars in media overlays |
| CN110139732A (zh) * | 2016-11-10 | 2019-08-16 | 华纳兄弟娱乐公司 | 具有环境控制特征的社交机器人 |
| US12479109B2 (en) | 2016-11-10 | 2025-11-25 | Warner Bros. Entertainment Inc. | Social robot with environmental control feature |
| CN110139732B (zh) * | 2016-11-10 | 2023-04-04 | 华纳兄弟娱乐公司 | 具有环境控制特征的社交机器人 |
| CN106730234A (zh) * | 2017-01-11 | 2017-05-31 | 上海北辰软件股份有限公司 | 一种智能情绪疏导系统 |
| US12363056B2 (en) | 2017-01-23 | 2025-07-15 | Snap Inc. | Customized digital avatar accessories |
| CN106653027A (zh) * | 2017-02-17 | 2017-05-10 | 安徽金猫数字科技有限公司 | 一种基于NodeJS的智能家居语音控制系统 |
| CN108874812B (zh) * | 2017-05-10 | 2021-12-10 | 腾讯科技(北京)有限公司 | 一种数据处理方法及服务器、计算机存储介质 |
| CN108874812A (zh) * | 2017-05-10 | 2018-11-23 | 腾讯科技(北京)有限公司 | 一种数据处理方法及服务器、计算机存储介质 |
| US20220293100A1 (en) * | 2019-09-04 | 2022-09-15 | Ai Speech Co., Ltd. | Full-duplex voice dialogue method |
| US12118993B2 (en) * | 2019-09-04 | 2024-10-15 | Ai Speech Co., Ltd. | Full-duplex voice dialogue method |
| CN112883170A (zh) * | 2021-01-20 | 2021-06-01 | 中国人民大学 | 一种用户反馈引导的自适应对话推荐方法和系统 |
| CN112883170B (zh) * | 2021-01-20 | 2023-08-18 | 中国人民大学 | 一种用户反馈引导的自适应对话推荐方法和系统 |
| TWI904664B (zh) * | 2024-05-09 | 2025-11-11 | 兆豐國際商業銀行股份有限公司 | 具客戶識別之語音服務系統和其方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2974273A4 (en) | 2018-01-10 |
| AU2014236686B2 (en) | 2017-06-15 |
| HK1217847A1 (zh) | 2017-01-20 |
| WO2014152015A1 (en) | 2014-09-25 |
| AU2017228574A1 (en) | 2017-10-05 |
| AU2014236686A1 (en) | 2015-09-24 |
| KR20160034243A (ko) | 2016-03-29 |
| CA2904359A1 (en) | 2014-09-25 |
| US20140277735A1 (en) | 2014-09-18 |
| JP2016522465A (ja) | 2016-07-28 |
| US10391636B2 (en) | 2019-08-27 |
| EP2974273A1 (en) | 2016-01-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10357881B2 (en) | Multi-segment social robot | |
| US10391636B2 (en) | Apparatus and methods for providing a persistent companion device | |
| KR102306624B1 (ko) | 지속적 컴패니언 디바이스 구성 및 전개 플랫폼 | |
| US20170206064A1 (en) | Persistent companion device configuration and deployment platform | |
| CN107000210A (zh) | 用于提供持久伙伴装置的设备和方法 | |
| KR20250153263A (ko) | 객체 인식 및/또는 음성 인식을 사용하여 사용자에게 개인 및 건강 지원을 제공하는 전자 디바이스 | |
| US20250131609A1 (en) | Generating image scenarios based on events | |
| US20250200825A1 (en) | Content item video generation template | |
| WO2018183812A1 (en) | Persistent companion device configuration and deployment platform | |
| CN120981810A (zh) | 行动控制系统 | |
| CA2904359C (en) | Apparatus and methods for providing a persistent companion device | |
| Saxena et al. | Virtual assistant with facial expession recognition | |
| US20250378616A1 (en) | Pose-Based Facial Expressions | |
| JP7773505B2 (ja) | 制御システム | |
| HK1241803A1 (zh) | 用於提供持久伙伴装置的设备和方法 | |
| WO2025254920A1 (en) | Pose-based facial expressions | |
| CN120981812A (zh) | 行为控制系统、学习用数据的生成方法、显示控制装置和程序 | |
| WO2025028459A1 (ja) | 行動制御システム | |
| CN121100338A (zh) | 行为控制系统 | |
| JP2025000503A (ja) | 行動制御システム | |
| JP2025022746A (ja) | 情報処理システム | |
| WO2025090531A1 (en) | Generating image scenarios based on events | |
| WO2024219336A1 (ja) | 行動制御システム及びロボット | |
| JP2024166143A (ja) | 行動制御システム | |
| JP2025000491A (ja) | 制御システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1217847 Country of ref document: HK |
|
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160316 |
|
| WD01 | Invention patent application deemed withdrawn after publication | ||
| REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1217847 Country of ref document: HK |