CN109040211A - 一种基于语音识别的内容推送方法及系统 - Google Patents
一种基于语音识别的内容推送方法及系统 Download PDFInfo
- Publication number
- CN109040211A CN109040211A CN201810817481.3A CN201810817481A CN109040211A CN 109040211 A CN109040211 A CN 109040211A CN 201810817481 A CN201810817481 A CN 201810817481A CN 109040211 A CN109040211 A CN 109040211A
- Authority
- CN
- China
- Prior art keywords
- user
- content
- speech recognition
- mode
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 17
- 238000002716 delivery method Methods 0.000 claims description 13
- 230000036651 mood Effects 0.000 claims description 9
- 230000008451 emotion Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 206010048909 Boredom Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- -1 fangle Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种基于语音识别的内容推送方法及系统。该方法包括:获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。该系统包括:语音获取模块、语音识别模块和推送模块。本发明的方法解放了用户双手触摸点击屏幕的步骤,减少了进入更深层次操作的自定义设置,能够依据声音识别用户的性别、年龄段和情绪,并智能推送以及调整合适的内容和切换使用模式。
Description
技术领域
本发明涉及一种基于语音识别的内容推送方法及系统。
背景技术
目前,一些商店的广告机可以先通过人脸检测技术获取顾客的脸部特征信息,然后将用户群体划分为不同的性别和年龄段,按照不同的客户类型智能推送相关的商品广告。该方法可以迎合不同人群的喜好和需求,提高了广告的推送效果,但是由于人脸检测技术存在不确定性,顾客面部的表情、遮挡物以及光照条件等都能影响到人脸识别结果的准确性。
随着语音识别技术的发展,已经广泛应用于消费者设备、安全系统、交通工具、电话和各种技术中。语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文档或命令的高技术。如专利“一种移动终端问候语的输出方法”,该方法根据用户的语音信息中的基因频率获取用户的性别,然后根据预先存储的对应关系,获取与用户的性别对应的问候语及对应的声音类型,最后输出该对应的问候语。这种方案提高了问候语的多样性及适应性,但是只解决了移动终端问候语固定的问题,输出内容单一,智能化程度不能满足用户的需求。而且该方法中只能识别用户的性别,没有对用户的其他特征,如年龄、情绪等进行识别归类,用户体验差。
另外,目前在同一个移动终端上可以由不同的用户选择自己的使用模式,但是都必须要通过一些特殊设定的解锁或者进入条件才可以,操作复杂,且容易误选择为其他人的模式。
发明内容
为了解决上述现有技术中存在的技术缺陷,本发明的目的在于提供一种基于语音识别的内容推送方法及系统。
本发明方法采用的技术方案如下:
一种基于语音识别的内容推送方法,包括:获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。
进一步地,用户的特征包括性别和/或年龄段。
进一步地,用户的特征还包括情绪。
进一步地,用户的类型具体包括:成年男性、成年女性、儿童和/或老人。
进一步地,当用户的类型为儿童时,推送的内容中不包含不良的内容以及游戏。
进一步地,根据用户的特征,切换用户的使用模式。
进一步地,用户的使用模式包括成年男性模式、成年女性模式、儿童模式和/或老人模式。
进一步地,当用户的使用模式为老人模式时,调节显示的字体、音量以及显示亮度。
本发明一种基于语音识别的内容推送系统,包括:语音获取模块,用于获取语音信息;语音识别模块,用于识别用户的特征;推送模块,用于向用户推送内容。
进一步地,内容推送系统还包括模式切换模块,用于切换用户的使用模式。
本发明的方法解放了用户双手触摸点击屏幕的步骤,减少了进入更深层次操作的自定义设置,能够依据声音识别用户的性别、年龄段和情绪,并智能推送以及调整合适的内容和切换使用模式。相比现有技术,本发明具有以下有益效果:
(1)能够提高效率。系统自动推送用户感兴趣的内容,让智能移动终端更懂用户,提高了用户的体验效果。
(2)更加智能。可以为不同年龄段的用户提供更智能合适的场景使用模式,减少了现有选择模式的特殊、复杂的设定。
(3)更加贴心。针对老人群体,可以为用户调节好字体大小、音量及显示亮度。
(4)更加专业。为用户打造和推送合适的应用APP,全方位地读懂用户和提升用户体验,且智能推送的为大多数用户可能会使用的APP。
附图说明
图1是本发明方法的流程图。
图2是本发明实施例中方法的流程图。
图3是本发明实施例的系统框架图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明一种基于语音识别的内容推送方法,包括:获取用户的语音信息,根据语音信息识别用户的特征,针对用户的特征向用户自动推送相关内容及自动切换用户的使用模式。
实施例1
本实施例通过辨别说话声音的音色、音量和语气智能识别出性别、年龄段和情绪,系统给用户智能推荐相关内容和内置APP,如给女生推送居家的、化妆品、美颜APP等内容,给男生推送数码产品和汽车男人装等内容和APP,若是老人自动调整手机字体大小,若是小孩则屏蔽相关不良内容,还可以依据情绪的起伏推送搞笑的内容,以更加人性化的了解使用者,为用户提供一个量身定制的系统。
本实施例的方法流程图如图2所示,具体实现过程为:
用户与智能终端进行语音对话,或者通过语音进行解锁,使得智能终端获取到用户的声音。然后通过辨别声音的音色、音量和语气,识别出用户的性别(男或女)、年龄段(如儿童、成年人和老人)以及情绪(如愉快、伤心、烦躁等)。根据识别的结果,智能切换到符合用户特点的使用模式,以及向用户推荐适合的内容和应用APP。
其中,推荐的内容为用户平时比较关注和感兴趣的,推送方式可以通过网页的形式,也可以通过短信或微信的方式。APP可以推荐一些使用频率较高的、评分较高的APP。
本实施例中,智能识别出用户的性别、年龄段和情绪,是通过提取语音信息中的基音周期来实现的。以语音信号的基音检测为研究对象,采用变换法,将语音信号变换到频域或者倒谱域来估计基音周期,利用同态分析方法将声道的影响消除,得到属于激励部分的信息,进一步求取基音周期。将获得的基音周期分类,分别对应不同的人群。
本实施例几种识别结果的具体示例如下:
(1)当识别的语音信号的基音周期为0-200hz时,将用户的性别和年龄段判定为:成年男性。此时,可自动切换至成年男性模式,该模式下可以采用一些炫酷的界面等。
根据该识别的结果,自动向用户智能推送一些有关高科技的数码产品、汽车信息、金融类内容、股票内容、逻辑思维、健身知识、时事新闻和男人装杂志等等符合现代男性气质的和感兴趣的内容和APP。
(2)当识别的语音信号的基音周期为200—500hz,将用户的性别和年龄段判定为:成年女性。此时,可自动切换至成年女性模式,该模式下可以加载一些轻柔的音乐背景,或者采用色彩绚丽的页面等。
根据该识别的结果,向用户智能推送一些有关情感、时尚、潮流类、人生哲学、居家家具电器和化妆品、新鲜事物、影视作品、日常生活、饮食方面的健身减肥等等相关女生感兴趣的内容和APP。
(3)当识别的语音信号的基音周期为260-880hz,将用户所属群体判定为:儿童。此时,可自动切换至儿童模式,内置各类帮助提高效率的学习内容和APP供用户使用。
根据该识别的结果,向用户智能推送一些学习相关信息,并且屏蔽相关不良网站的内容和各种游戏,给孩子营造一个良好的上网环境。
(4)当识别的语音信号的基音周期为80hz-160hz,将用户所属群体判定为:老人。此时,可自动切换至老人模式,智能调大智能终端的字体,调高智能终端的音量,调节智能终端上适宜的显示亮度,并且简化相关功能,方便老人的正常使用。
根据该识别的结果,向用户智能推送一些具有年代感的歌曲和影视剧、国学国粹、时事新闻、养生类的内容和APP。
(5)当识别出用户处于不开心或者情绪低落时,则自动推送一些积极向上正能量的内容和能让人解压和简单的小游戏,并适时地推送一些幽默的笑话、影视或者小视频,争取与用户进行对话,让用户开心;或者采用显示语调欢快的音乐歌单,提醒用户去外面散心等方式。
实施例2
如图3所示,本实施例提供一种基于语音识别的内容推送系统,可应用在智能终端上。该系统包括:语音获取模块,用于获取用户输入的语音信息;语音识别模块,用于根据语音信息识别用户的特征,如;性别、年龄段或者情绪;推送模块,根据用户的特征,向用户推送符合用户特点的内容;模式切换模块,用于切换用户的使用模式,如:成年男性模式、成年女性模式、儿童模式或者老人模式。
Claims (10)
1.一种基于语音识别的内容推送方法,其特征在于,包括:
获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。
2.根据权利要求1所述的一种基于语音识别的内容推送方法,其特征在于,用户的特征包括性别和/或年龄段。
3.根据权利要求2所述的一种基于语音识别的内容推送方法,其特征在于,用户的特征还包括情绪。
4.根据权利要求2所述的一种基于语音识别的内容推送方法,其特征在于,根据用户的特征,用户的类型具体包括:成年男性、成年女性、儿童和/或老人。
5.根据权利要求4所述的一种基于语音识别的内容推送方法,其特征在于,当用户的类型为儿童时,推送的内容中不包含不良的内容以及游戏。
6.根据权利要求1至5之一所述的一种基于语音识别的内容推送方法,其特征在于,根据用户的特征,切换用户的使用模式。
7.根据权利要求6所述的一种基于语音识别的内容推送方法,其特征在于,用户的使用模式包括成年男性模式、成年女性模式、儿童模式和/或老人模式。
8.根据权利要求7所述的一种基于语音识别的内容推送方法,其特征在于,当用户的使用模式为老人模式时,调节显示的字体、音量以及显示亮度。
9.一种基于语音识别的内容推送系统,其特征在于,包括:
语音获取模块,用于获取语音信息;
语音识别模块,用于识别用户的特征;
推送模块,用于向用户推送内容。
10.根据权利要求9所述的一种基于语音识别的内容推送系统,其特征在于,内容推送系统还包括模式切换模块,用于切换用户的使用模式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810817481.3A CN109040211A (zh) | 2018-07-24 | 2018-07-24 | 一种基于语音识别的内容推送方法及系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810817481.3A CN109040211A (zh) | 2018-07-24 | 2018-07-24 | 一种基于语音识别的内容推送方法及系统 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN109040211A true CN109040211A (zh) | 2018-12-18 |
Family
ID=64645440
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201810817481.3A Pending CN109040211A (zh) | 2018-07-24 | 2018-07-24 | 一种基于语音识别的内容推送方法及系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109040211A (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108900641A (zh) * | 2018-08-16 | 2018-11-27 | 安徽大尺度网络传媒有限公司 | 一种互联网内容的推送方法及装置 |
| CN109947984A (zh) * | 2019-02-28 | 2019-06-28 | 北京奇艺世纪科技有限公司 | 一种针对儿童的内容推送方法及推送装置 |
| CN112151064A (zh) * | 2020-09-25 | 2020-12-29 | 北京捷通华声科技股份有限公司 | 话术播报方法、装置、计算机可读存储介质和处理器 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102300163A (zh) * | 2011-09-22 | 2011-12-28 | 宇龙计算机通信科技(深圳)有限公司 | 信息推送方法、移动终端和系统 |
| CN102930454A (zh) * | 2012-10-07 | 2013-02-13 | 乐配(天津)科技有限公司 | 基于多感知技术的智能3d广告推荐方法 |
| CN105245609A (zh) * | 2015-10-23 | 2016-01-13 | 小米科技有限责任公司 | 推送信息的方法、装置、设备及系统 |
| CN105700682A (zh) * | 2016-01-08 | 2016-06-22 | 北京乐驾科技有限公司 | 基于视觉和语音的智能性别、情绪识别检测系统及方法 |
| CN105895096A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 一种身份识别与语音交互操作的方法及装置 |
| CN107274892A (zh) * | 2017-04-24 | 2017-10-20 | 乐视控股(北京)有限公司 | 说话人识别方法及装置 |
-
2018
- 2018-07-24 CN CN201810817481.3A patent/CN109040211A/zh active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102300163A (zh) * | 2011-09-22 | 2011-12-28 | 宇龙计算机通信科技(深圳)有限公司 | 信息推送方法、移动终端和系统 |
| CN102930454A (zh) * | 2012-10-07 | 2013-02-13 | 乐配(天津)科技有限公司 | 基于多感知技术的智能3d广告推荐方法 |
| CN105245609A (zh) * | 2015-10-23 | 2016-01-13 | 小米科技有限责任公司 | 推送信息的方法、装置、设备及系统 |
| CN105700682A (zh) * | 2016-01-08 | 2016-06-22 | 北京乐驾科技有限公司 | 基于视觉和语音的智能性别、情绪识别检测系统及方法 |
| CN105895096A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 一种身份识别与语音交互操作的方法及装置 |
| CN107274892A (zh) * | 2017-04-24 | 2017-10-20 | 乐视控股(北京)有限公司 | 说话人识别方法及装置 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108900641A (zh) * | 2018-08-16 | 2018-11-27 | 安徽大尺度网络传媒有限公司 | 一种互联网内容的推送方法及装置 |
| CN109947984A (zh) * | 2019-02-28 | 2019-06-28 | 北京奇艺世纪科技有限公司 | 一种针对儿童的内容推送方法及推送装置 |
| CN112151064A (zh) * | 2020-09-25 | 2020-12-29 | 北京捷通华声科技股份有限公司 | 话术播报方法、装置、计算机可读存储介质和处理器 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12131739B2 (en) | Using pattern analysis to provide continuous authentication | |
| US20240079011A1 (en) | Interpreting words prior to vocalization | |
| Martin | Mixing English in French advertising | |
| USRE41002E1 (en) | Telephone for the deaf and method of using same | |
| CN113010138B (zh) | 文章的语音播放方法、装置、设备及计算机可读存储介质 | |
| EP3259754B1 (en) | Method and device for providing information | |
| EP3669264A1 (en) | System and methods for providing unplayed content | |
| CN110519636A (zh) | 语音信息播放方法、装置、计算机设备及存储介质 | |
| CN110459214A (zh) | 语音交互方法及装置 | |
| CN105426404A (zh) | 一种音乐信息推荐方法、装置和终端 | |
| CN109147800A (zh) | 应答方法和装置 | |
| WO2015198716A1 (ja) | 情報処理装置及び情報処理方法並びにプログラム | |
| US20250279100A1 (en) | Using continuous gestures for selectively processing facial movements | |
| CN109040211A (zh) | 一种基于语音识别的内容推送方法及系统 | |
| CN113238654A (zh) | 基于多模态的反应式响应生成 | |
| CN110719521B (zh) | 一种基于用户画像的个性化显示方法及装置 | |
| CN113556603A (zh) | 调整视频播放效果的方法及装置、电子设备 | |
| CN112584238A (zh) | 影视资源匹配方法、装置及智能电视 | |
| CN110491384B (zh) | 一种语音数据处理方法及装置 | |
| CN110781327A (zh) | 图像搜索方法、装置、终端设备及存储介质 | |
| CN115910111A (zh) | 语音交互方法、装置、智能设备及计算机可读存储介质 | |
| CN110162710A (zh) | 输入场景下信息推荐方法及装置 | |
| CN113593582B (zh) | 智能设备的控制方法和装置、存储介质及电子设备 | |
| CN114339418A (zh) | 电视节目的广告播放方法、装置、计算机设备及存储介质 | |
| Knoblauch et al. | Genres and the aesthetics of advertisement spots |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |