CN102141812A - 机器人 - Google Patents
机器人 Download PDFInfo
- Publication number
- CN102141812A CN102141812A CN201010546551XA CN201010546551A CN102141812A CN 102141812 A CN102141812 A CN 102141812A CN 201010546551X A CN201010546551X A CN 201010546551XA CN 201010546551 A CN201010546551 A CN 201010546551A CN 102141812 A CN102141812 A CN 102141812A
- Authority
- CN
- China
- Prior art keywords
- unit
- noise
- storage unit
- information
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种机器人,包括:信息采集单元,用于采集环境中的信息;信息处理单元,用于对信息采集单元采集的信息进行处理并根据处理结果产生任务执行命令;任务执行单元,用于根据信息处理单元生成的任务执行命令执行任务。本发明的机器人具有较高的智能化水平和学习能力。
Description
技术领域
本发明涉及一种机器人。
背景技术
机器人技术有了很大的发展,未来,机器人将会扮演越来越重要的角色。
传统的机器人需要人来控制,它不能自主地根据外部环境的信息来处理外部环境中的事件,也不能针对曾经发生过的事件吸取经验,并且它不能跟人们很好地互动,智能化水平、对各方面的应对能力以及对外界的学习能力不高。
发明内容
本发明的目的是提供一种机器人,其具有较高的智能化水平和学习能力。
根据本发明的一个方面,本发明提供了一种机器人,包括:信息采集单元,用于采集环境中的信息;信息处理单元,用于对信息采集单元采集的信息进行处理并根据处理结果产生任务执行命令;任务执行单元,用于根据信息处理单元生成的任务执行命令执行任务。
优选地,所述信息采集单元包括声音获取单元,信息处理单元包括语音识别单元,任务执行单元包括运动单元和/或发声单元。
优选地,所述语音识别单元包括:语音检测单元,用于从语音数据中检测出人的语音;特征提取单元,用于从语音数据中提取出语音特征;匹配单元,用于将语音特征与分别存储在模型存储单元、字典存储单元、语法存储单元中的模型、字词、语法进行匹配,以得出语音识别结果;模型存储单元,用于存储语音模型;字典存储单元,用于存储跟语音相对应的字词;语法存储单元,用于存储跟语音相对应的语法。
优选地,所述机器人还包括:噪声存储单元,用于存储噪声字数据。
优选地,所述语音检测单元在检测语音的过程中从噪声存储单元中读取噪声字数据以区分噪音。
优选地,所述匹配单元一旦识别出噪声,便将噪声字数据存储在噪声存储单元中。
优选地,所述信息采集单元包括摄像单元,信息处理单元包括人脸识别单元,任务执行单元包括发生单元。
优选地,所述信息采集单元包括传感单元,信息处理单元包括数据分析单元,任务执行单元包括通信单元。
附图说明
图1为本发明的第一个实施例的框图。
图2为本发明第一个实施例的语音识别单元的框图。
图3为本发明的第二个实施例的框图。
图4为本发明的第三个实施例的框图。
图5为本发明的第四个实施例的框图。
具体实施方式
参考图1。在本实施例中,信息采集单元为录音单元101,信息处理单元为语音识别单元102,任务执行单元为运动单元103。录音单元101录入声音信息后对声音信息进行模数转换,然后把转换后的声音数据传到语音识别单元102。参考图2,语音识别单元102包括语音检测单元202、特征提取单元203、匹配单元205、模型存储单元204、字典存储单元206、语法存储单元207和噪声存储单元201,语音检测单元202、特征提取单元203、匹配单元205、模型存储单元204、字典存储单元206、语法存储单元207和噪声存储单元201之间的电连接关系如图2所示。声音数据传到语音检测单元202和特征提取单元203。接收到该声音数据后,特征提取单元203以帧为单位执行该声音数据的MFCC(Mel Frequency Cepstrum Coefficient,麦尔频率对数倒频谱系数)分析,并向匹配单元205输出MFCC分析结果作为特征参数(特征向量)。特征提取单元203提取特性参数,如线性预测系数、对数倒频谱系数、线谱对和在每个预定频带中的功率(滤波器组的输出)。根据从特征提取单元203提供的特性参数,匹配单元205根据一个连续分布HMM(Hidden Markov Model,隐藏马尔科夫)方法通过引用模型存储单元204、字典存储单元206和语法存储单元207执行声音数据的语音识别。模型存储单元204存储用于指示语音中每个音素或每个音节的声音特征的声音模型。语音识别根据连续分布HMM方法执行。HMM被用作声音模型。字典存储单元206存储包含每个字词的发音的信息(音素信息)。语法存储单元207存储语法规则,该语法规则描述在字典存储单元206中记录的字词如何连接和联系。例如,语法规则可以是上下文无关的语法或基于统计单词连接概率的规则。匹配单元205引用字典存储单元206中的字词数据以连接存储在模型存储单元204中的声音模型,因此形成字词的声音模型(字词模型)。匹配单元205也引用存储在语法存储单元207中的语法规则,以连接字词模型,并使用所连接的单词模型,以通过使用连续分布HMM方法和根据特性参数识别声音数据。也就是说,匹配单元205检测特征提取单元203输出的一系列字词模型,输出对应于所述字词模型序列的字词串的音素信息作为语音识别结果。匹配单元205累加对应于所连接的单词模型的单词串的每个特性参数的概率,并将所累加的数值作为分数。匹配单元205输出关于具有最高分数的字词串的音素信息作为语音识别结果。语音检测单元202按照特征提取单元203执行MFCC分析的方式计算每个帧中的功率。语音检测单元202将每个帧中的功率与预定阈值比较,并检测由功率大于或等于预定阈值的一个帧形成的部分作为语音数据。语音检测单元202向特征提取单元203和匹配单元205提供所检测的语音数据。特征提取单元203和匹配单元205执行语音数据的识别处理。噪声存储单元201存储了多个接近要消除的噪声的字。以前曾经被识别为噪声的字以及来自语音环境的与噪声字数据类似的一些字存储在噪声存储单元201中。当语音识别的结果是在噪声存储单元201中的一个字时,匹配单元201将此语音识别结果判定为噪声。当特征提取单元203和匹配单元205无法对声音数据进行语音识别并且噪声存储单元201中也没有存储对应该声音数据的噪声时,匹配单元205将该声音数据判定为噪声并反馈归噪声存储单元201。
任务执行单元还可以是发声单元303,如图3所示,发声单元303根据语音识别单元302对语音数据的识别结果调用语音数据库并发声。
参考图4。在本实施例中,信息采集单元是摄像单元401,信息处理单元是人脸识别单元402,任务执行单元是发声单元403。摄像单元401获取周围环境中的图像,并将拍摄到的人脸图像发送到人脸识别单元402中。人脸识别单元402对人脸图像进行识别并把识别结果发送给发声单元403,发声单元403根据人脸识别的结果从数据库中查找人名并调用语音数据库以将人名说出来。
参考图5。在本实施例中,信息采集单元是传感单元501,信息处理单元是数据分析单元502,任务执行单元是通信单元503。传感单元501探测周围环境中的信息,如温度、气体、湿度,并将模拟信号转换为数字信号,发送到数据分析单元502中。数据分析单元502从传感单元501中接收以数字信号为载体的环境信息并进行分析。通信单元503将分析结果发送给外部设备,如服务器、手机、电脑等。
Claims (8)
1.一种机器人,包括:
信息采集单元,用于采集环境中的信息;
信息处理单元,用于对信息采集单元采集的信息进行处理并根据处理结果产生任务执行命令;
任务执行单元,用于根据信息处理单元生成的任务执行命令执行任务。
2.根据权利要求1所述的机器人,其特征是所述信息采集单元包括声音获取单元,信息处理单元包括语音识别单元,任务执行单元包括运动单元和/或发声单元。
3.根据权利要求2所述的机器人,其特征是所述语音识别单元包括:语音检测单元,用于从语音数据中检测出人的语音;特征提取单元,用于从语音数据中提取出语音特征;匹配单元,用于将语音特征与分别存储在模型存储单元、字典存储单元、语法存储单元中的模型、字词、语法进行匹配,以得出语音识别结果;模型存储单元,用于存储语音模型;字典存储单元,用于存储跟语音相对应的字词;语法存储单元,用于存储跟语音相对应的语法。
4.根据权利要求2或3所述的机器人,其特征是所述机器人还包括:噪声存储单元,用于存储噪声字数据。
5.根据权利要求2至4中任意一项所述的机器人,其特征是所述语音检测单元在检测语音的过程中从噪声存储单元中读取噪声字数据以区分噪音。
6.根据权利要求2至5中任意一项所述的机器人,其特征是所述匹配单元一旦识别出噪声,便将噪声字数据存储在噪声存储单元中。
7.根据权利要求1所述的机器人,其特征是所述信息采集单元包括摄像单元,信息处理单元包括人脸识别单元,任务执行单元包括发生单元。
8.根据权利要求1所述的机器人,其特征是所述信息采集单元包括传感单元,信息处理单元包括数据分析单元,任务执行单元包括通信单元。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201010546551XA CN102141812A (zh) | 2010-11-16 | 2010-11-16 | 机器人 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201010546551XA CN102141812A (zh) | 2010-11-16 | 2010-11-16 | 机器人 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN102141812A true CN102141812A (zh) | 2011-08-03 |
Family
ID=44409392
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201010546551XA Pending CN102141812A (zh) | 2010-11-16 | 2010-11-16 | 机器人 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN102141812A (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014187290A1 (zh) * | 2013-05-24 | 2014-11-27 | Wen Xia | 智能机器人 |
| CN104959985A (zh) * | 2015-07-16 | 2015-10-07 | 深圳狗尾草智能科技有限公司 | 一种机器人的控制系统及其方法 |
| WO2017000774A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
| CN108181899A (zh) * | 2017-12-14 | 2018-06-19 | 北京汽车集团有限公司 | 控制车辆行驶的方法、装置及存储介质 |
| CN110308669A (zh) * | 2019-07-27 | 2019-10-08 | 南京市晨枭软件技术有限公司 | 一种模块机器人自修复仿真系统及方法 |
| CN114841356A (zh) * | 2021-01-14 | 2022-08-02 | 新智数字科技有限公司 | 基于物联网的联合学习引擎整体架构系统 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1235332A (zh) * | 1998-04-02 | 1999-11-17 | 日本电气株式会社 | 语音识别噪声消除系统和语音识别噪声消除方法 |
| CN1302056A (zh) * | 1999-12-28 | 2001-07-04 | 索尼公司 | 信息处理设备,信息处理方法和存储介质 |
| CN101030370A (zh) * | 2003-07-03 | 2007-09-05 | 索尼株式会社 | 信息处理系统和方法、及机器人装置 |
| JP2008282073A (ja) * | 2007-05-08 | 2008-11-20 | Matsushita Electric Ind Co Ltd | ペット誘導ロボットおよびペット誘導方法 |
| CN201163417Y (zh) * | 2007-12-27 | 2008-12-10 | 上海银晨智能识别科技有限公司 | 具有人脸识别的智能机器人 |
| CN201242685Y (zh) * | 2008-08-19 | 2009-05-20 | 中国人民解放军第二炮兵工程学院 | 向导机器人 |
-
2010
- 2010-11-16 CN CN201010546551XA patent/CN102141812A/zh active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1235332A (zh) * | 1998-04-02 | 1999-11-17 | 日本电气株式会社 | 语音识别噪声消除系统和语音识别噪声消除方法 |
| CN1302056A (zh) * | 1999-12-28 | 2001-07-04 | 索尼公司 | 信息处理设备,信息处理方法和存储介质 |
| CN101030370A (zh) * | 2003-07-03 | 2007-09-05 | 索尼株式会社 | 信息处理系统和方法、及机器人装置 |
| JP2008282073A (ja) * | 2007-05-08 | 2008-11-20 | Matsushita Electric Ind Co Ltd | ペット誘導ロボットおよびペット誘導方法 |
| CN201163417Y (zh) * | 2007-12-27 | 2008-12-10 | 上海银晨智能识别科技有限公司 | 具有人脸识别的智能机器人 |
| CN201242685Y (zh) * | 2008-08-19 | 2009-05-20 | 中国人民解放军第二炮兵工程学院 | 向导机器人 |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014187290A1 (zh) * | 2013-05-24 | 2014-11-27 | Wen Xia | 智能机器人 |
| WO2017000774A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
| US10482898B2 (en) | 2015-06-30 | 2019-11-19 | Yutou Technology (Hangzhou) Co., Ltd. | System for robot to eliminate own sound source |
| CN104959985A (zh) * | 2015-07-16 | 2015-10-07 | 深圳狗尾草智能科技有限公司 | 一种机器人的控制系统及其方法 |
| CN108181899A (zh) * | 2017-12-14 | 2018-06-19 | 北京汽车集团有限公司 | 控制车辆行驶的方法、装置及存储介质 |
| CN110308669A (zh) * | 2019-07-27 | 2019-10-08 | 南京市晨枭软件技术有限公司 | 一种模块机器人自修复仿真系统及方法 |
| CN110308669B (zh) * | 2019-07-27 | 2021-07-30 | 南京市晨枭软件技术有限公司 | 一种模块机器人自修复仿真系统及方法 |
| CN114841356A (zh) * | 2021-01-14 | 2022-08-02 | 新智数字科技有限公司 | 基于物联网的联合学习引擎整体架构系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110364143B (zh) | 语音唤醒方法、装置及其智能电子设备 | |
| US8275616B2 (en) | System for detecting speech interval and recognizing continuous speech in a noisy environment through real-time recognition of call commands | |
| CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
| JP3529049B2 (ja) | 学習装置及び学習方法並びにロボット装置 | |
| US11705105B2 (en) | Speech synthesizer for evaluating quality of synthesized speech using artificial intelligence and method of operating the same | |
| CN112102850B (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
| CN108172218A (zh) | 一种语音建模方法及装置 | |
| JP2011191423A (ja) | 発話認識装置、発話認識方法 | |
| CN102141812A (zh) | 机器人 | |
| JP7511374B2 (ja) | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム | |
| Lee et al. | Audio-to-visual conversion using hidden markov models | |
| KR101065188B1 (ko) | 진화 학습에 의한 화자 적응 장치 및 방법과 이를 이용한 음성인식 시스템 | |
| KR20180057970A (ko) | 음성감성 인식 장치 및 방법 | |
| Ramesh et al. | Self-Supervised Phonotactic Representations for Language Identification. | |
| Sun et al. | A novel convolutional neural network voiceprint recognition method based on improved pooling method and dropout idea | |
| Garg et al. | Survey on acoustic modeling and feature extraction for speech recognition | |
| Kuamr et al. | Implementation and performance evaluation of continuous Hindi speech recognition | |
| Chitu et al. | Automatic lip reading in the Dutch language using active appearance models on high speed recordings | |
| Heinrich et al. | Towards robust speech recognition for human-robot interaction | |
| JP7347511B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
| Ktistakis et al. | A multimodal human-machine interaction scheme for an intelligent robotic nurse | |
| CN118351855A (zh) | 基于语音识别的语音信息输入方法及装置 | |
| Aafaq et al. | Convolutional neural networks for deep spoken keyword spotting | |
| JP2004286805A (ja) | 話者識別装置および話者識別方法、並びにプログラム | |
| JP5721445B2 (ja) | 音声認識装置および音声認識方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110803 |