KR102813851B1

KR102813851B1 - 전사를 갖는 음성 메시지들

Info

Publication number: KR102813851B1
Application number: KR1020247024830A
Authority: KR
Inventors: 알렉스 에델스버그; 카일 굿리치; 페드람 자비드푸르; 앤드류 제임스 맥피; 다니엘 모레노; 제레미 베이커 보스
Original assignee: 스냅 인코포레이티드
Priority date: 2021-12-28
Filing date: 2022-12-14
Publication date: 2025-05-29
Anticipated expiration: 2042-12-14
Also published as: CN118476205A; US12283276B2; US20230206921A1; US20250210045A1; EP4458001A1; KR20240127431A; WO2023129379A1; KR20250078623A

Abstract

연관된 메시징 클라이언트 애플리케이션에 대한 백엔드 서비스를 호스팅하는 메시징 시스템은, 수신자가 전사로서의 텍스트 포맷으로 된 메시지를 소비하는 것을 허용하는 방식으로 수신자에게 오디오 메시지를 서빙하는 기술적 문제를 해결하는 음성 메모 시스템을 포함한다. 음성 메모 시스템이 제공된 채팅 사용자 인터페이스(UI)는, 사용자가 오디오 메시지를 재생하거나 또는 온 디맨드로 오디오 메시지의 전사를 생성하는 것을 허용하여 UI 실면적의 불필요한 혼란을 방지한다.

Description

전사를 갖는 음성 메시지들

[우선권 출원]

본 출원은 2021년 12월 28일자로 출원된 미국 특허 출원 일련 번호 제17/646,271호의 계속 출원이고 그에 대한 우선권을 주장하며, 이 미국 출원의 내용은 그 전체가 본 명세서에 참고로 포함된다.

[기술 분야]

본 개시내용은 일반적으로 네트워크를 통해 클라이언트 디바이스들 사이의 상호작용을 용이하게 하는 것에 관한 것이다.

사용자들이 콘텐츠 및 다른 사용자들에게 온라인으로 액세스하고 그들과 상호작용하는 것을 허용하는 컴퓨터 구현 도구들의 인기가 계속 증가하고 있다. 예를 들어, 사용자들이 메시징 애플리케이션들을 통해 다른 사용자들과 상호작용하고 콘텐츠를 공유하도록 허용하는 다양한 컴퓨터 구현 도구들이 존재한다. 애플리케이션들 또는 앱들이라고 칭해지는 그러한 컴퓨터 구현 도구들 중 일부는 전화, 태블릿 또는 시계와 같은 모바일 디바이스 상에서 실행되도록 설계될 수 있다.

기존의 메시징 애플리케이션들은 사용자들이 텍스트 메시지들뿐만 아니라 멀티미디어 메시지들을 교환하는 것을 허용한다. 예를 들어, 메시징 앱은, 송신자가 오디오 메시지를 구술한 다음 이것을 수신자에게 전송하는 것을 허용하는 기능성을 포함할 수 있다. 수신자는, 메시지를 수신할 시에, 수신된 오디오 메시지를 나타내는 시각적 제어와 상호작용함으로써 연관된 오디오를 재생할 수 있다.

반드시 축척대로 그려진 것은 아닌 도면들에서, 유사한 번호들은 상이한 도면들에서 유사한 컴포넌트들을 기술할 수 있다. 임의의 특정 요소 또는 액트의 논의를 쉽게 식별하기 위해, 참조 번호의 최상위 숫자 또는 숫자들은 그 요소가 처음 소개되는 도면 번호를 가리킨다. 일부 예들은 첨부 도면들의 그림들에서 제한이 아닌 예로서 예시된다.
도 1은 일부 예들에 따른, 본 개시내용이 배치될 수 있는 네트워킹된 환경의 도식화된 표현이다.
도 2는 일부 예들에 따른, 클라이언트 측 및 서버 측 기능성 둘 다를 가지는 메시징 시스템의 도식화된 표현이다.
도 3은 일부 예들에 따른, 데이터베이스에 유지되는 데이터 구조의 도식화된 표현이다.
도 4는 일부 예들에 따른, 메시지의 도식화된 표현이다.
도 5는 일부 예들에 따른, 액세스-제한 프로세스에 대한 흐름도이다.
도 6은 일부 예들에 따른, 연관된 전사에 대한 액세스를 허용하는 포맷으로 음성 메모를 서빙하기 위한 방법의 흐름도이다.
도 7은 일부 예들에 따른, 음성 메모 및 연관된 전사를 포함하는 예시적인 채팅 UI(user interface)를 예시하는 도면이다.
도 8은 일부 예들에 따른, 음성 메모 트레이를 포함하는 예시적인 채팅 UI를 예시하는 도면이다.
도 9는 일부 예들에 따른, 머신으로 하여금 본 명세서에서 논의된 방법론들 중 임의의 하나 이상을 수행하게 야기하기 위해 명령어들의 세트가 실행될 수 있는 컴퓨터 시스템 형태의 머신의 도식화된 표현이다.

본 개시내용의 예들은 메시지를 구술하여 결과적인 오디오 메시지가 의도된 수신자 디바이스에 통신되도록 하는 옵션과 조합하여 텍스트 메시징을 제공하는 애플리케이션들에 의한 사용자의 경험을 향상시킴으로써 전자 메시징 소프트웨어 및 시스템들의 기능성을 개선한다. 메시지를 구술하는 옵션은 예를 들어, 마이크로폰 아이콘의 형태로 텍스트 메시징 UI(user interface) 상에 표시될 수 있다. 수신자 디바이스에서, 텍스트 메시징 UI 상에서의 연관된 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 수신된 오디오 메시지가 재생될 수 있다. 특정 상황들에서, 메시지를 타이핑하는 대신에 오디오를 녹음하는 것이 송신자를 위한 편리한 옵션이지만, 수신자가 침묵이 요청되는 공간에 또는 시끄러운 장소에 있을 때와 같이, 수신자는 오디오를 청취할 의향이 없을 수 있거나 또는 그들이 오디오를 재생하는 것이 조금도 바람직하지 않은 상황에 처해 있는 자신을 발견할 수 있다. 이러한 상황들에서, 수신자는 자신들이 오디오를 재생하기에 적절한 공간에 있을 때까지 대기해야 할 수 있으며, 이는 좌절감을 주는 경험일 수 있다.

수신자가 오디오로서 캡처되고 통신된 메시지를, 오디오 포맷에 추가하여 또는 그 대신에, 전사(transcription)로서의 텍스트 포맷으로 소비하는 것을 허용하는 방식으로 오디오 메시지를 서빙하기 위한 기술적인 과제는 음성 메모 시스템(voice notes system)을 제공함으로써 해결된다.

음성 메모 시스템은 연관된 메시징 클라이언트를 위한 백엔드 서비스를 호스팅하는 메시징 시스템과 통합될 수 있다. 메시징 클라이언트는 사용자들이 텍스트 메시지들 및 오디오 메시지들을 통해 통신하는 것을 허용하는 채팅 UI(user interface)를 제시하도록 구성된다. 채팅 UI를 이용하여 메시징 시스템에서 생성된 오디오 메시지는 본 설명의 목적을 위해 음성 메모(voice note)라고 지칭될 수 있다. 메시징 시스템의 예가 도 1 내지 도 3과 관련하여 아래에 더 상세히 설명된다. 음성 메모 플랫폼이 메시징 시스템의 정황에서 이하에서 설명되지만, 본 명세서에 설명된 방법론들은 음성 메모를 녹음하고 통신하는 것을 허용하는 다양한 컴퓨터 구현 애플리케이션에서 이롭게 이용될 수 있다.

네트워킹된 컴퓨팅 환경

도 1은 음성 메모 시스템이 그 내에서 구현될 수 있는, 네트워크를 통해 데이터(예를 들어, 메시지 및 연관된 콘텐츠)를 교환하기 위한 예시적인 메시징 시스템(100)을 도시하는 블록도이다. 메시징 시스템(100)은 클라이언트 디바이스(102)의 다중의 인스턴스를 포함하고, 이들 각각은 메시징 클라이언트 애플리케이션(104)을 포함하는 다수의 애플리케이션을 호스팅한다. 각각의 메시징 클라이언트 애플리케이션(104)은 네트워크(106)(예를 들어, 인터넷)를 통해 메시징 클라이언트 애플리케이션(104) 및 메시징 서버 시스템(108)의 다른 인스턴스들에 통신가능하게 결합된다. 메시징 클라이언트 애플리케이션(104)은 클라이언트 디바이스(102)의 하나 이상의 프로세서에 의해 구현되고, 메시징 서버 시스템(108)인 백엔드 시스템에 의해 지원된다.

메시징 클라이언트 애플리케이션(104)은 네트워크(106)를 통해 또 다른 메시징 클라이언트 애플리케이션(104)과 그리고 메시징 서버 시스템(108)과 통신하고 데이터를 교환할 수 있다. 메시징 클라이언트 애플리케이션(104) 사이에 그리고 메시징 클라이언트 애플리케이션(104)과 메시징 서버 시스템(108) 사이에 교환되는 데이터는, 기능들(예를 들어, 기능들을 기동시키는 명령들)뿐만 아니라, 페이로드 데이터(예를 들어, 텍스트, 오디오, 비디오 또는 다른 멀티미디어 데이터)를 포함한다.

메시징 서버 시스템(108)은 네트워크(106)를 통해 특정 메시징 클라이언트 애플리케이션(104)에 서버측 기능성을 제공한다. 메시징 시스템(100)의 특정 기능들이 메시징 클라이언트 애플리케이션(104)에 의해 또는 메시징 서버 시스템(108)에 의해 수행되는 것으로 본 명세서에 설명되지만, 메시징 클라이언트 애플리케이션(104) 또는 메시징 서버 시스템(108) 내에서의 특정 기능성의 로케이션은 설계 선택사항일 수 있다. 예를 들어, 처음에는 특정 기술 및 기능성을 메시징 서버 시스템(108) 내에 배치하지만 나중에 클라이언트 디바이스(102)가 충분한 처리 능력을 갖는 경우 이 기술 및 기능성을 메시징 클라이언트 애플리케이션(104)으로 이주시키는 것이 기술적으로 바람직할 수 있다.

메시징 서버 시스템(108)은 메시징 클라이언트 애플리케이션(104)에 제공되는 다양한 서비스들 및 동작들을 지원한다. 그러한 동작들은 메시징 클라이언트 애플리케이션(104)에 데이터를 송신하고, 그로부터 데이터를 수신하고, 그에 의해 생성된 데이터를 처리하는 것을 포함한다. 이러한 데이터는, 예로서, 메시지 콘텐츠, 클라이언트 디바이스 정보, 지오로케이션 정보, 미디어 증강 및 오버레이, 메시지 콘텐츠 지속 조건, 소셜 네트워크 정보, 및 라이브 이벤트 정보를 포함할 수 있다. 메시징 시스템(100) 내에서의 데이터 교환들은 메시징 클라이언트 애플리케이션(104)의 사용자 인터페이스들(UI들)을 통해 이용가능한 기능들을 통해 기동되고 제어된다.

이제 구체적으로 메시징 서버 시스템(108)을 참조하면, API(Application Program Interface) 서버(110)가 애플리케이션 서버들(112)에 결합되어 프로그램 방식의 인터페이스를 제공한다. 애플리케이션 서버들(112)은 데이터베이스 서버(118)에 통신가능하게 결합되고, 데이터베이스 서버(118)는 애플리케이션 서버들(112)에 의해 처리되는 메시지들과 연관된 데이터를 저장하는 데이터베이스(120)에 대한 액세스를 용이하게 한다. 예를 들어, 데이터베이스(120)는 연관된 텍스트와 함께 또는 연관된 텍스트 없이, 각자의 송신자 식별들과 연관된 음성 채팅 메시지들로부터의 오디오 콘텐츠를 저장한다. 이 설명의 목적을 위하여, 음성 채팅 메시지는 오디오 메시지(또는 오디오 메시지에 대한 참조) 및 오디오의 연관된 텍스트 표현을 포함한다. 음성 채팅 메시지로부터의 오디오 콘텐츠는 음성 채팅 메시지를 삭제하라는 명령이 메시징 시스템(108)에서 수신될 때까지 지속될 수 있다.

유사하게, 웹 서버(124)는 애플리케이션 서버들(112)에 결합되고, 웹 기반 인터페이스들을 애플리케이션 서버들(112)에 제공한다. 이를 위해, 웹 서버(124)는 HTTP(Hypertext Transfer Protocol) 및 여러 다른 관련 프로토콜을 통해 착신 네트워크 요청들을 처리한다.

API(Application Program Interface) 서버(110)는 클라이언트 디바이스(102)와 애플리케이션 서버들(112) 사이에서 메시지 데이터(예를 들어, 명령들 및 메시지 페이로드들)를 수신하고 송신한다. 구체적으로, 애플리케이션 프로그램 인터페이스(API) 서버(110)는 애플리케이션 서버들(112)의 기능성을 기동하기 위해 메시징 클라이언트 애플리케이션(104)에 의해 호출되거나 질의될 수 있는 인터페이스들(예를 들어, 루틴들 및 프로토콜들)의 세트를 제공한다. 애플리케이션 프로그램 인터페이스(API) 서버(110)는, 계정 등록, 로그인 기능성, 특정한 메시징 클라이언트 애플리케이션(104)으로부터 또 다른 메시징 클라이언트 애플리케이션(104)으로의, 애플리케이션 서버(112)를 통한 메시지의 전송, 메시징 클라이언트 애플리케이션(104)으로부터 메시징 서버(114)로의 미디어 파일(예를 들어, 이미지 또는 비디오)의 전송, 및 또 다른 메시징 클라이언트 애플리케이션(104)에 의한 가능한 액세스를 위해, 미디어 데이터의 컬렉션(예를 들어, 스토리)의 설정, 클라이언트 디바이스(102)의 사용자의 친구들의 리스트의 검색, 이러한 컬렉션의 검색, 메시지 및 콘텐츠의 검색, 엔티티 그래프(예를 들어, 소셜 그래프)로의 엔티티(예를 들어, 친구)의 추가 및 삭제, 소셜 그래프 내에서의 친구의 로케이션, 및 (예를 들어, 메시징 클라이언트 애플리케이션(104)에 관련된) 애플리케이션 이벤트를 오픈하는 것을 포함한, 애플리케이션 서버(112)에 의해 지원되는 다양한 기능을 노출시킨다.

애플리케이션 서버들(112)은 예를 들어, 메시징 서버(114), 이미지 처리 서버(116), 및 소셜 네트워크 서버(122)를 포함하는 다수의 서버 애플리케이션 및 서브시스템을 호스팅한다. 메시징 서버(114)는, 특히 메시징 클라이언트 애플리케이션(104)의 다중의 인스턴스로부터 수신된 메시지들에 포함된 콘텐츠(예를 들어, 텍스트 및 멀티미디어 콘텐츠)의 집계(aggregation) 및 다른 처리에 관련된, 다수의 메시지 처리 기술 및 기능을 구현한다. 일부 예들에서, 메시징 서버는, 수신자가, 오디오 포맷에 추가하여 또는 그 대신에, 전사로서의 텍스트 포맷으로, 오디오로서 캡처되고 통신된 메시지를 소비하는 것을 허용하는 방식으로 오디오 메시지를 서빙하는 것을 가능케 하는 전사 기능성을 갖는 음성 메모를 용이하게 한다. 다른 프로세서 및 메모리 집약적 데이터의 처리는 또한, 이러한 처리를 위한 하드웨어 요건을 고려하여, 메시징 서버(114)에 의해 서버 측에서 수행될 수 있다.

애플리케이션 서버들(112)은, 전형적으로 메시징 서버(114)로부터 전송되거나 메시징 서버(114)에서 수신되는 메시지의 페이로드 내의 이미지들 또는 비디오에 대하여, 다양한 이미지 처리 동작들을 수행하는 데 전용되는 이미지 처리 서버(116)를 또한 포함한다.

소셜 네트워크 서버(122)는 다양한 소셜 네트워킹 기능들 및 서비스들을 지원하고 이들 기능 및 서비스를 메시징 서버(114)에 이용가능하게 만든다. 이를 위해, 소셜 네트워크 서버(122)는 데이터베이스(120) 내에 엔티티 그래프(306)(도 3에 도시됨)를 유지하고 그에 액세스한다. 소셜 네트워크 서버(122)에 의해 지원되는 기능들 및 서비스들의 예들은, 특정 사용자가 그와 관계를 가지거나 또는 "팔로우하고 있는" 메시징 시스템(100)의 다른 사용자들의 식별, 및 또한 특정 사용자의 다른 엔티티들 및 관심사항들의 식별을 포함한다.

시스템 아키텍처

도 2는 일부 예들에 따른, 메시징 시스템(100)에 관한 추가 상세사항들을 예시하는 블록도이다. 구체적으로, 메시징 시스템(100)은 메시징 클라이언트 애플리케이션(104) 및 애플리케이션 서버들(112)을 포함하는 것으로 도시되어 있다. 메시징 시스템(100)은 메시징 클라이언트 애플리케이션(104)에 의해 클라이언트측에서 그리고 애플리케이션 서버들(112)에 의해 서버측에서 지원되는 다수의 서브시스템을 구현한다. 이러한 서브시스템들은, 예를 들어, 단기적 타이머 시스템(202), 컬렉션 관리 시스템(204), 증강 시스템(206), 및 게임 시스템(210)을 포함한다. 단기적 타이머 시스템(202)은 메시징 클라이언트 애플리케이션(104) 및 메시징 서버(114)에 의한 콘텐츠에 대한 일시적 또는 시간 제한된 액세스를 시행하는 것을 담당한다. 단기적 타이머 시스템(202)은, 메시지 또는 메시지들의 컬렉션(예를 들어, 스토리)과 연관된 지속시간 및 디스플레이 파라미터들에 기초하여, 메시징 클라이언트 애플리케이션(104)을 통한 메시지들 및 연관된 콘텐츠에 대한 (예를 들어, 프레젠테이션 및 디스플레이를 위한) 액세스를 선택적으로 가능하게 하는 다수의 타이머를 포함한다. 단기적 타이머 시스템(202)의 동작에 관한 추가 상세사항들이 아래에 제공된다. 컬렉션 관리 시스템(204)은 미디어의 세트들 또는 컬렉션들(예를 들어, 텍스트, 이미지 비디오, 및 오디오 데이터의 컬렉션들)을 관리하는 것을 담당한다. 이러한 컬렉션은 콘텐츠가 관련된 이벤트의 지속시간과 같은 특정된 시간 기간 동안 이용가능하게 될 수 있다. 예를 들어, 음악 콘서트에 관련된 콘텐츠는 그 음악 콘서트의 지속시간 동안 "스토리"로서 이용가능하게 될 수 있다. 증강 시스템(206)은 사용자가 메시지와 연관된 미디어 콘텐츠를 증강(예를 들어, 주석부기 또는 다른 방식으로 수정 또는 편집)할 수 있게 하는 다양한 기능들을 제공한다. 예를 들어, 증강 시스템(206)은 메시징 시스템(100)에 의해 처리되는 메시지들에 대한 미디어 오버레이들의 생성 및 게시와 관련된 기능들을 제공한다. 증강 시스템(206)은 클라이언트 디바이스(102)의 지오로케이션에 기초하여 메시징 클라이언트 애플리케이션(104)에 미디어 오버레이 또는 증강(예를 들어, 이미지 필터)을 동작적으로 공급한다. 또 다른 예에서, 증강 시스템(206)은 클라이언트 디바이스(102)의 사용자의 소셜 네트워크 정보와 같은 다른 정보에 기초하여 메시징 클라이언트 애플리케이션(104)에 미디어 오버레이를 동작적으로 공급한다. 미디어 오버레이는 청각적 및 시각적 콘텐츠 및 시각적 효과를 포함할 수 있다. 청각적 및 시각적 콘텐츠의 예들은 사진, 텍스트, 로고, 애니메이션, 및 사운드 효과를 포함한다. 시각적 효과의 예는 컬러 오버레이를 포함한다. 오디오 및 시각적 콘텐츠 또는 시각적 효과는 클라이언트 디바이스(102)에 있는 미디어 콘텐츠 아이템(예를 들어, 사진)에 적용될 수 있다. 예를 들어, 미디어 오버레이는 클라이언트 디바이스(102)에 의해 촬영된 사진 위에 오버레이될 수 있는 텍스트 또는 이미지를 포함할 수 있다. 미디어 오버레이들은 데이터베이스(120)에 저장되고 데이터베이스 서버(118)를 통해 액세스될 수 있다. 게임 시스템(210)은 메시징 클라이언트 애플리케이션(104)의 컨텍스트 내에서 다양한 게임 기능들을 제공한다. 메시징 클라이언트 애플리케이션(104)은 메시징 클라이언트 애플리케이션(104)의 컨텍스트 내에서 사용자에 의해 론칭되고 또한 메시징 시스템(100)의 다른 사용자들과 함께 플레이될 수 있는 이용가능한 게임들의 리스트를 제공하는 게임 인터페이스를 제공한다. 메시징 시스템(100)은 또한, 메시징 클라이언트 애플리케이션(104)으로부터 다른 사용자들에게 초대들을 발행함으로써, 특정 사용자가 특정 게임의 플레이에 참여하도록 이러한 다른 사용자들을 초대할 수 있게 한다. 메시징 클라이언트 애플리케이션(104)은 또한 게임플레이의 컨텍스트 내에서 음성 및 텍스트 메시징(예를 들어, 채팅들) 둘 다를 지원하고, 게임들에 대한 리더보드를 제공하고, 또한 게임 내 보상들의 제공을 지원한다.

또한, 음성 메모 시스템(208)이 도 2에 도시되어 있다. 음성 메모 시스템(208)은 도 1의 메시징 클라이언트 애플리케이션(104)에 의해 제공된 하나 이상의 컴포넌트뿐만 아니라, 도 1의 메시징 서버(114)에서 제공된 하나 이상의 컴포넌트를 포함한다. 음성 메모 시스템(208)은, 수신자가, 오디오 포맷에 추가하여 또는 그 대신에, 전사로서의 텍스트 포맷으로, 오디오로서 캡처되고 통신된 메시지를 소비하는 것을 허용하는 방식으로 오디오 메시지를 서빙하는 것을 용이하게 하도록 구성된다. 일부 예들에서, 음성 메모 시스템(208)은 정상 재생 속도와는 상이한 속도로 오디오 메시지의 재생을 허용하도록 구성된다. 음성 메모 시스템(208)은 ASR(Automatic Speech Recognition) 또는 STT(Speech To Text)와 같은 음성 인식 기술을 활용한다. 음성 인식 기술은 음향 및 언어 모델링의 알고리즘에 기초할 수 있으며, 여기서 음향 모델링은 음성 및 오디오 신호들의 언어 단위들 사이의 관계를 나타내고, 언어 모델링은 사운드들을 단어 시퀀스들과 매칭시킨다.

데이터 아키텍처

도 3은 특정 예들에 따른, 메시징 서버 시스템(108)의 데이터베이스(120)에 저장될 수 있는 데이터 구조들(300)을 예시하는 개략도이다. 데이터베이스(120)의 콘텐츠가 다수의 테이블을 포함하는 것으로 도시되어 있지만, 데이터는 다른 타입의 데이터 구조에(예를 들어, 객체 지향형 데이터베이스로서) 저장될 수 있다는 것을 알 것이다.

데이터베이스(120)는 메시지 테이블(302) 내에 저장된 메시지 데이터를 포함한다. 이 메시지 데이터는, 임의의 특정한 하나의 메시지에 대해, 적어도 메시지 송신자 데이터, 메시지 수신자(또는 수신기) 데이터, 및 페이로드를 포함한다. 페이로드는, 도 8을 참조하여 이하에서 더 설명되는 채팅 UI를 이용하여 생성된 음성 메모를 포함할 수 있다. 메시지에 포함될 수 있고, 및 메시지 테이블(302)에 저장된 메시지 데이터 내에 포함될 수 있는 정보에 관한 추가적인 상세사항들은 도 4를 참조하여 이하에 기술된다.

엔티티 테이블(304)은 엔티티 데이터를 저장하고, 엔티티 그래프(306) 및 프로필 데이터(308)에 (예를 들어, 참조적으로) 링크된다. 엔티티 테이블(304) 내에 레코드들이 유지되는 엔티티들은 개인들, 회사 엔티티들, 조직들, 객체들, 장소들, 이벤트들 등을 포함할 수 있다. 엔티티 타입에 관계없이, 그에 관해 메시징 서버 시스템(108)이 데이터를 저장하는 임의의 엔티티는 인식된 엔티티일 수 있다. 각각의 엔티티에는 고유 식별자뿐만 아니라 엔티티 타입 식별자(도시되지 않음)가 제공된다.

엔티티 그래프(306)는 엔티티들 사이의 관계 및 연관에 관한 정보를 저장한다. 이러한 관계는, 단지 예로서, 사회적, 전문적(예를 들어, 일반 법인 또는 조직에서의 일) 관심 기반 또는 활동 기반일 수 있다.

프로필 데이터(308)는 특정 엔티티에 관한 다중 타입의 프로필 데이터를 저장한다. 프로필 데이터(308)는 특정 엔티티에 의해 특정된 프라이버시 설정들에 기초하여, 선택적으로 사용되고 메시징 시스템(100)의 다른 사용자들에게 제시될 수 있다. 엔티티가 개인인 경우, 프로필 데이터(308)는, 예를 들어, 사용자 이름, 전화 번호, 주소, 설정들(예컨대, 통지 및 프라이버시 설정들)은 물론이고, 사용자 선택 아바타 표현(또는 이러한 아바타 표현들의 컬렉션)을 포함한다. 그 후 특정 사용자는 메시징 시스템(100)을 통해 통신된 메시지들의 콘텐츠 내에, 그리고 메시징 클라이언트 애플리케이션들(104)에 의해 다른 사용자들에게 디스플레이된 맵 인터페이스들 상에 이들 아바타 표현들 중 하나 이상을 선택적으로 포함할 수 있다. 아바타 표현들의 컬렉션은 사용자가 특정 시간에 통신하기 위해 선택할 수 있는 상태 또는 활동의 그래픽 표현을 제시하는 "상태 아바타들"을 포함할 수 있다.

데이터베이스(120)는 또한 오버레이들 또는 필터들과 같은 증강 데이터를 증강 테이블(310)에 저장한다. 증강 데이터는 (그에 대해 데이터가 비디오 테이블(314)에 저장되는) 비디오들 및 (그에 대해 데이터가 이미지 테이블(316)에 저장되는)이미지들과 연관되고 이들에게 적용된다. 이미지 테이블(316) 내에 저장될 수 있는 다른 증강 데이터는 (예를 들어, 렌즈들 또는 증강 현실 경험들을 적용하는 것에 대응하는) 증강 현실 콘텐츠 아이템들을 포함한다. 증강 현실 콘텐츠 아이템은 이미지 또는 비디오에 추가될 수 있는 실시간 특수 효과 및 사운드일 수 있다.

스토리 테이블(312)은, 컬렉션(예를 들어, 스토리 또는 갤러리)이 되도록 편집되는, 메시지들 및 연관된 이미지, 비디오, 또는 오디오 데이터의 컬렉션들에 관한 데이터를 저장한다. 특정 컬렉션의 생성은 특정 사용자(예를 들어, 그에 대해 레코드가 엔티티 테이블(304)에 유지되는 각각의 사용자)에 의해 개시될 수 있다. 사용자는 그 사용자에 의해 생성되고 및 전송/브로드캐스트된 콘텐츠의 컬렉션의 형태로 "개인 스토리"를 생성할 수 있다. 이를 위해, 메시징 클라이언트 애플리케이션(104)의 사용자 인터페이스는, 송신 측 사용자가 자신의 개인 스토리에 특정 콘텐츠를 추가하는 것을 가능하게 하기 위해 사용자 선택가능한 아이콘을 포함할 수 있다.

일부 예들에서, 데이터베이스(120)는 또한 오디오 메시지들의 각자의 전사들을 저장한다.

데이터 통신 아키텍처

도 4는 추가 메시징 클라이언트 애플리케이션(104) 또는 메시징 서버(114)로의 통신을 위해 메시징 클라이언트 애플리케이션(104)에 의해 생성된, 일부 예들에 따른, 메시지(400)의 구조를 예시하는 개략도이다. 특정 메시지(400)의 콘텐츠는 메시징 서버(114)에 의해 액세스 가능한, 데이터베이스(120) 내에 저장된 메시지 테이블(302)을 채우기 위해 사용된다. 유사하게, 메시지(400)의 콘텐츠는 클라이언트 디바이스(102) 또는 애플리케이션 서버들(112)의 "수송 중" 또는 "비행 중" 데이터로서 메모리에 저장된다. 메시지(400)는 다음의 예시적인 컴포넌트들을 포함하는 것으로 도시된다:

· 메시지 식별자(402): 메시지(400)를 식별하는 고유 식별자.

· 메시지 텍스트 페이로드(404): 클라이언트 디바이스(102)의 사용자 인터페이스를 통해 사용자에 의해 생성되고 메시지(400)에 포함되는 텍스트.

· 메시지 오디오 페이로드(410): 마이크로폰에 의해 캡처되거나 또는 클라이언트 디바이스(102)의 메모리 컴포넌트로부터 검색되고, 메시지(400)에 포함되는 오디오 데이터.

· 메시지 오디오 전사 페이로드(418): 마이크로폰에 의해 캡처되거나 또는 클라이언트 디바이스(102)의 메모리 컴포넌트로부터 검색된 오디오로부터 생성되고 메시지(400)에 포함되는 오디오 전사 데이터. 일부 예들에서, 오디오의 전사는 수신자 디바이스에서 사용자에 의해 요청되는 경우에만, 요구에 따라 발생한다는 점에 유의할 것이다.

· 메시지 오디오 톤 페이로드(420): 마이크로폰에 의해 캡처되거나 또는 클라이언트 디바이스(102)의 메모리 컴포넌트로부터 검색된 오디오로부터 추론되고 메시지(400)에 포함되는 오디오 톤 데이터.

· 메시지 송신자 식별자(422): 메시지(400)가 그 상에서 생성되었고 메시지(400)가 그로부터 전송된 클라이언트 디바이스(102)의 사용자를 나타내는 식별자(예를 들어, 메시징 시스템 식별자, 이메일 주소, 또는 디바이스 식별자).

· 메시지 수신자 식별자(424): 메시지(400)가 어드레싱되는 클라이언트 디바이스(102)의 사용자를 나타내는 식별자(예를 들어, 메시징 시스템 식별자, 이메일 주소, 또는 디바이스 식별자).

메시지(400)의 다양한 컴포넌트들의 콘텐츠들(예를 들어, 값들)은 콘텐츠 데이터 값들이 그 내에 저장되는 테이블들에서의 로케이션들에 대한 포인터들일 수 있다. 예를 들어, 메시지 송신자 식별자(422) 및 메시지 수신자 식별자(424) 내에 저장된 값들은 엔티티 테이블(304) 내에 저장된 사용자 레코드들을 가리킬 수 있다. 메시지 오디오 페이로드(410)에 저장된 값은, 오디오 메시지의 녹음을 개시하도록 구성된 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여 클라이언트 디바이스(102)의 마이크로폰에 의해 캡처된 연관된 오디오 콘텐츠를 저장하는 서버 상의 영구 저장소 내에서의 로케이션을 가리킬 수 있다.

시간 기반 액세스 제한 아키텍처

도 5는 그에 관하여 콘텐츠(예를 들어, 단기적 메시지(502), 및 데이터의 연관된 멀티미디어 페이로드) 또는 콘텐츠 컬렉션(예를 들어, 단기적 메시지 그룹(504))에의 액세스가 시간 제한될(예를 들어, 단기적으로 될) 수 있는, 액세스 제한 프로세스(500)를 예시하는 개략도이다.

단기적 메시지(502)는 송신 측 사용자의 식별(도 4의 MSG_SENDER_ID(422))과 연관되고 또한 메시지 지속시간 파라미터(506)와 연관되는 것으로 도시되며, 그 값은 단기적 메시지(502)가 메시징 클라이언트 애플리케이션(104)에 의해 단기적 메시지(502)의 수신 측 사용자에게 디스플레이될 시간량을 결정한다. 일 예에서, 송신 측 사용자가 메시지 지속시간 파라미터(506)를 사용하여 특정하는 시간량에 좌우되어, 최대 10초 동안 수신 측 사용자가 단기적 메시지(502)를 볼 수 있다. 일부 예들에서, 단기적 메시지(502)가 음성 채팅 메시지인 경우, 그것은 연관된 전사를 보기 위해 그리고 24시간과 같은 더 긴 시간 기간 동안 또는 송신측 사용자에 의해 음성 채팅 메시지가 삭제될 때까지 연관된 오디오 클립을 청취하기 위해 수신 측 사용자에게 이용가능할 수 있다. 일부 예들에서, 음성 채팅 메시지로부터의 오디오 클립은 도 1의 데이터베이스(120)에 저장되고 또한 송신 측 사용자가 음성 채팅 메시지를 삭제한 후가 아니라 미리 결정된 시간 기간 동안 청취하기 위해 수신 측 사용자에게 이용가능하다.

메시지 지속시간 파라미터(506) 및 메시지 수신자 식별자(424)는 메시지 타이머(512)에 대한 입력들인 것으로 도시되어 있으며, 메시지 타이머(512)는 단기적 메시지(502)가 메시지 수신자 식별자(424)에 의해 식별된 특정 수신 측 사용자에게 보여지는 시간량을 결정하는 것을 담당한다. 특히, 단기적 메시지(502)는 메시지 지속시간 파라미터(506)의 값에 의해 결정된 시간 기간 동안 관련 수신 측 사용자에게만 보여질 것이다. 메시지 타이머(512)는 수신 측 사용자에게 콘텐츠(예를 들어, 단기적 메시지(502))의 디스플레이의 전체 타이밍을 담당하는 더 일반화된 단기적 타이머 시스템(202)에 출력을 제공하는 것으로 도시된다.

단기적 메시지(502)는 단기적 메시지 그룹(504)(예를 들어, 개인 스토리 또는 이벤트 스토리에서의 메시지들의 컬렉션) 내에 포함되는 것으로 도 5에 도시되어 있다. 단기적 메시지 그룹(504)은 연관된 그룹 지속시간 파라미터(508)를 가지며, 그 값은 단기적 메시지 그룹(504)이 메시징 시스템(100)의 사용자들에게 제시되고 액세스 가능한 시간 지속시간을 결정한다. 그룹 지속시간 파라미터(508)는, 예를 들어, 음악 콘서트의 지속시간일 수 있고, 여기서 단기적 메시지 그룹(504)은 그 콘서트에 관련된 콘텐츠의 컬렉션이다. 대안으로서, 사용자(소유 사용자 또는 큐레이터 사용자)는 단기적 메시지 그룹(504)의 셋업 및 생성을 수행할 때 그룹 지속시간 파라미터(508)에 대한 값을 특정할 수 있다.

추가적으로, 단기적 메시지 그룹(504) 내의 각각의 단기적 메시지(502)는 연관된 그룹 참여 파라미터(510)를 가지며, 그 값은 단기적 메시지(502)가 단기적 메시지 그룹(504)의 컨텍스트 내에서 액세스 가능할 시간의 지속시간을 결정한다. 따라서, 특정 단기적 메시지 그룹(504)은, 단기적 메시지 그룹(504) 자체가 그룹 지속시간 파라미터(508)의 관점에서 만료되기 전에, 단기적 메시지 그룹(504)의 컨텍스트 내에서 "만료"되고 액세스 불가능하게 될 수 있다. 그룹 지속시간 파라미터(508), 그룹 참여 파라미터(510), 및 메시지 수신자 식별자(424) 각각은 그룹 타이머(514)에 입력을 제공하며, 그룹 타이머(514)는, 먼저, 단기적 메시지 그룹(504)의 특정 단기적 메시지(502)가 특정 수신 측 사용자에게 디스플레이될 것인지, 및 만일 그렇다면, 얼마나 오랫동안 디스플레이될 것인지를 동작적으로 결정한다. 단기적 메시지 그룹(504)이 또한, 메시지 수신자 식별자(424)의 결과로서 특정 수신 측 사용자의 신원을 인식한다는 점에 유의한다.

따라서, 그룹 타이머(514)는 연관된 단기적 메시지 그룹(504)뿐만 아니라, 단기적 메시지 그룹(504)에 포함된 개별 단기적 메시지(502)의 전체 수명을 동작적으로 제어한다. 일 예에서, 단기적 메시지 그룹(504) 내의 각각의 및 모든 단기적 메시지(502)는 그룹 지속시간 파라미터(508)에 의해 지정된 시간 기간 동안 시청가능하고 액세스가능하게 유지된다. 추가의 예에서, 특정 단기적 메시지(502)는, 단기적 메시지 그룹(504)의 컨텍스트 내에서, 그룹 참여 파라미터(510)에 기초하여 만료될 수 있다. 메시지 지속시간 파라미터(506)는, 단기적 메시지 그룹(504)의 컨텍스트 내에서도, 특정 단기적 메시지(502)가 수신 측 사용자에게 디스플레이되는 시간의 지속시간을 여전히 결정할 수 있다는 점에 유의한다. 따라서, 메시지 지속시간 파라미터(506)는, 수신 측 사용자가 단기적 메시지 그룹(504)의 컨텍스트 내부 또는 외부에서 그 단기적 메시지(502)를 보고 있는지에 관계없이, 특정 단기적 메시지(502)가 수신 측 사용자에게 디스플레이되는 시간의 지속시간을 결정한다.

단기적 타이머 시스템(202)은 더욱이 이것이 연관된 그룹 참여 파라미터(510)를 초과했다는 결정에 기초하여 단기적 메시지 그룹(504)으로부터 특정 단기적 메시지(502)를 동작적으로 제거할 수 있다. 예를 들어, 전송 측 사용자가 포스팅으로부터 24 시간의 그룹 참여 파라미터(510)를 확립했을 때, 단기적 타이머 시스템(202)은 지정된 24 시간 후에 단기적 메시지 그룹(504)으로부터 관련 단기적 메시지(502)를 제거할 것이다. 단기적 타이머 시스템(202)은 또한 단기적 메시지 그룹(504) 내의 각각의 그리고 모든 단기적 메시지(502)에 대한 그룹 참여 파라미터(510)가 만료되었을 때, 또는 단기적 메시지 그룹(504) 자체가 그룹 지속시간 파라미터(508)의 관점에서 만료되었을 때 단기적 메시지 그룹(504)을 제거하도록 동작한다.

특정 사용 경우들에서, 특정 단기적 메시지 그룹(504)의 생성자는 무한 그룹 지속시간 파라미터(508)를 지정할 수 있다. 이 경우, 단기적 메시지 그룹(504) 내의 마지막 나머지 단기적 메시지(502)에 대한 그룹 참여 파라미터(510)의 만료는 단기적 메시지 그룹(504) 자체가 만료될 때를 결정할 것이다. 이 경우, 단기적 메시지 그룹(504)에 추가된 새로운 단기적 메시지(502)는, 새로운 그룹 참여 파라미터(510)와 함께, 단기적 메시지 그룹(504)의 수명을 그룹 참여 파라미터(510)의 값과 동일하도록 효과적으로 연장한다.

단기적 타이머 시스템(202)이 단기적 메시지 그룹(504)이 만료되었다고(예를 들어, 더 이상 액세스 가능하지 않다고) 결정한 것에 응답하여, 단기적 타이머 시스템(202)은 메시징 시스템(100)(및, 예를 들어, 구체적으로 메시징 클라이언트 애플리케이션(104))과 통신하여, 관련 단기적 메시지 그룹(504)과 연관된 표시(예를 들어, 아이콘)가 더 이상 메시징 클라이언트 애플리케이션(104)의 사용자 인터페이스 내에 디스플레이되지 않도록 야기한다. 유사하게, 단기적 타이머 시스템(202)이 특정 단기적 메시지(502)에 대한 메시지 지속시간 파라미터(506)가 만료되었다고 결정할 때, 단기적 타이머 시스템(202)은 메시징 클라이언트 애플리케이션(104)으로 하여금 단기적 메시지(502)와 연관된 표시(예를 들어, 아이콘 또는 텍스트 식별)를 더 이상 디스플레이하지 않도록 야기한다.

음성 채팅과 같은 콘텐츠에 대한 액세스는 도 1의 메시징 시스템(100)에서 단기적으로 될 수 있거나 그렇지 않을 수 있다는 점에 유의한다. 위에서 언급된 바와 같이, 음성 채팅 메시지와 연관된 오디오 콘텐츠는, 송신 측 사용자가 음성 채팅 메시지를 삭제하지 않는 한, 청취를 위해 수신 측 사용자에게 이용가능할 수 있다. 도 2의 음성 메모 시스템(208)에 의해 수행되는 예시적 동작이 도 6을 참조하여 이하에서 설명된다.

프로세스 흐름 및 사용자 인터페이스들

도 6은 도 1의 메시징 클라이언트 애플리케이션(104)의 사용자들 간의 음성 채팅을 용이하게 하기 위한 방법(600)의 흐름도이다. 일 예에서, 일부 또는 모든 처리 로직은 도 1의 클라이언트 디바이스(102) 및/또는 도 1의 메시징 서버 시스템(108)에 존재한다. 방법(600)은, 오디오 메시지가 클라이언트 디바이스에서 수신될 때, 동작(610)에서 시작한다. 수신된 오디오 메시지를 검출한 것에 응답하여, 동작(620)에서, 음성 메모 시스템은 하나 이상의 연관된 사용자 선택가능 요소와 함께 수신된 오디오 메시지의 표현을 포함하는 채팅 UI를 생성한다. 수신된 오디오 메시지의 표현과 연관된 사용자 선택가능 요소들 중 하나는 오디오 메시지의 재생을 야기하도록 동작가능하다. 수신된 오디오 메시지의 표현과 연관된 또 다른 사용자 선택가능 요소는 수신된 오디오 메시지의 전사의 프레젠테이션을 야기하도록 동작가능하다. 몇 개의 연관된 사용자 선택가능 요소들과 함께 수신된 오디오 메시지의 표현을 영역(710)에 포함하는 예시적인 채팅 UI(700)가 도 7에 도시되어 있다. 영역(710)에 도시된 참조 번호(712)에 의해 식별되는 "Show Transcription"이라는 문구는 연관된 오디오 메시지의 전사의 프레젠테이션을 야기하도록 동작가능한 전사 사용자 선택가능 요소로서 역할한다. 채팅 UI는, 일 예에서, 수신자 클라이언트 디바이스에서 실행 중인 메시징 클라이언트 애플리케이션에 의해 제시된다. 메시징 클라이언트 애플리케이션은 네트워크를 통해 데이터를 교환하기 위한 메시징 시스템의 백엔드 서비스에 의해 지원된다.

동작(630)에서, 전사 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 음성 메모 시스템은 오디오 메시지의 전사를 포함하도록 채팅 UI를 수정한다. 일부 예들에서, 전사는, 전사 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 예를 들어, 음성 메모 시스템에 의해 생성되어, 전사 사용자 선택가능 요소를 활성화함으로써 사용자에 의해 명시적으로 요청되지 않는 한, 전사 생성을 위한 자원 소비는 없도록 한다. 생성된 전사는 도 1의 데이터베이스(120)에 저장될 수 있다. 일부 예들에서, 음성 메모 시스템은 이전에 생성된 전사를 데이터베이스(120)로부터 검색한다. 동작(640)에서, 음성 메모 시스템은, 수신자 클라이언트 디바이스의 디스플레이 상에 채팅 UI의 프레젠테이션을 야기한다. 채팅 UI는 예를 들어 전체 전사가 단일 라인보다 많이 차지하는 경우 오디오 메시지의 부분 전사를 제시할 수 있다. 그 경우, 채팅 UI는 전체 전사의 디스플레이를 요청하고, 요청에 응답하여 전체 전사를 채팅 UI에 디스플레이하도록 동작가능한 사용자 선택가능 요소를 포함한다.

도 7로 돌아가면, 영역(710)은 "2X"로 식별되는 사용자 선택가능 요소를 포함하며, 이것은 정상 재생 속도와 다른 속도로, 이 경우에서는 정상 재생 속도의 2배로 오디오 메시지의 재생을 야기하도록 동작가능할 수 있다. 영역(710)은 또한 본 예에서 4초인 오디오 메시지의 길이의 표시를 포함한다. "Just saying hi"라고 읽는 전사를 포함하는 추가의 오디오 메시지의 표현이 영역(720)에 보여져 있다. 음성 메모 시스템은 또 다른 메시지의 표현과 연관된 액션을 검출한 것에 응답하여, 오디오 메시지의 전사를 채팅 UI로부터 제거하도록 구성될 수 있다.

또한 채팅 UI(700)에는 사용자로부터 텍스트 입력을 획득하기 위한 가상 키보드(730) 및 오디오 메시지를 생성하기 위한 오디오 녹음 프로세스를 개시하도록 동작가능한 마이크로폰 사용자 선택가능 요소(740)가 디스플레이된다. 예를 들어, 오디오 메시지를 생성하기 위한 오디오 녹음 프로세스는 마이크로폰 사용자 선택가능 요소(740)에 대한 프레스 앤드 홀드(press and hold) 제스처에 의해 개시될 수 있고, 이 경우, 홀드 제스처가 계속되는 동안 녹음이 진행 중이고 홀드 제스처가 종료될 때 중단된다.

일부 예들에서, 음성 메모 시스템은, 탭 제스처에 의한 채팅 UI에서의 마이크로폰 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 사용자로부터 오디오 입력을 획득하는 것을 용이하게 하기 위한 하나 이상의 사용자 선택가능 요소를 포함하는 음성 메모 트레이로 가상 키보드를 대체하도록 구성된다. 음성 메모 트레이는, 일부 예들에서, 오디오 메시지의 녹음을 시작하도록 동작가능한 레코드 사용자 선택가능 요소 및 오디오 메시지를 폐기하도록 동작가능한 사용자 선택가능 요소를 포함한다. 레코드 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 음성 메모 시스템은 오디오 입력을 캡처하기 시작한다. 캡처된 오디오 입력에 기초하여, 음성 메모 시스템은 새로운 오디오 메시지를 생성할 수 있고, 이것은 그 후 추가의 클라이언트 디바이스에 통신될 수 있다. 영역(810)에 음성 메모 트레이를 포함하는 예시적인 채팅 UI(800)가 도 8에 도시되어 있다. 음성 메모 트레이는 영역(810)에 도시되며, 좌측 슬라이딩 제스처에 의해 종료될 수 있는 녹음 프로세스를 나타낸다.

머신 아키텍처

도 9는, 머신(900)으로 하여금 본 명세서에 논의된 방법론들 중 임의의 하나 이상을 수행하게 야기하기 위한 명령어(608)(예를 들어, 소프트웨어, 프로그램, 애플리케이션, 애플릿, 앱, 또는 기타의 실행가능 코드)가 실행될 수 있는 머신(900)의 도식화된 표현이다. 예를 들어, 명령어(908)는 머신(900)으로 하여금 본 명세서에 설명된 방법들 중 임의의 하나 이상을 실행하게 야기할 수 있다. 명령어(908)는, 일반적인 비-프로그래밍된 머신(900)을, 설명되고 예시된 기능들을 설명된 방식으로 실행하도록 프로그래밍된 특정한 머신(900)으로 변환한다. 머신(900)은 독립형 디바이스로서 동작하거나 다른 머신에 결합(예를 들어, 네트워킹)될 수 있다. 네트워킹된 배치에서, 머신(900)은 서버-클라이언트 네트워크 환경에서 서버 머신 또는 클라이언트 머신의 자격으로 동작하거나, 피어-투-피어(또는 분산형) 네트워크 환경에서 피어 머신으로서 동작할 수 있다. 머신(900)은, 서버 컴퓨터, 클라이언트 컴퓨터, 개인용 컴퓨터(PC), 태블릿 컴퓨터, 랩톱 컴퓨터, 넷북, STB(set-top box), PDA(personal digital assistant), 엔터테인먼트 미디어 시스템, 셀룰러 전화, 스마트폰, 모바일 디바이스, 웨어러블 디바이스(예를 들어, 스마트 시계), 스마트 홈 디바이스(예를 들어, 스마트 어플라이언스), 다른 스마트 디바이스, 웹 어플라이언스, 네트워크 라우터, 네트워크 스위치, 네트워크 브릿지, 또는 머신(900)에 의해 취해질 동작들을 특정하는 명령어들(908)을 순차적으로 또는 다른 방식으로 실행할 수 있는 임의의 머신을 포함할 수 있지만, 이것들에만 제한되는 것은 아니다. 또한, 단일 머신(900)만이 예시되어 있지만, 용어 "머신"은 또한, 본 명세서에 논의된 방법론들 중 임의의 하나 이상을 수행하기 위해 명령어들(908)을 개별적으로 또는 공동으로 실행하는 머신들의 컬렉션을 포함하는 것으로 간주될 것이다. 머신(900)은, 예를 들어, 클라이언트 디바이스(102) 또는 메시징 서버 시스템(108)의 일부를 형성하는 다수의 서버 디바이스 중 임의의 하나를 포함할 수 있다. 일부 예들에서, 머신(900)은 또한 클라이언트 시스템 및 서버 시스템 둘 다를 포함할 수 있고, 특정 방법 또는 알고리즘의 특정 동작들은 서버 측에서 수행되고 특정 방법 또는 알고리즘의 특정 동작들은 클라이언트 측에서 수행된다.

머신(900)은, 버스(940)를 통해 서로 통신하도록 구성될 수 있는, 프로세서들(902), 메모리(904), 및 입력/출력 I/O 컴포넌트들(938)을 포함할 수 있다. 예에서, 프로세서들(902)(예를 들어, CPU(Central Processing Unit), RISC(Reduced Instruction Set Computing) 프로세서, CISC(Complex Instruction Set Computing) 프로세서, GPU(Graphics Processing Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), RFIC(Radio-Frequency Integrated Circuit), 또 다른 프로세서, 또는 이들의 임의의 적절한 조합)은, 예를 들어, 명령어(908)를 실행하는 프로세서(906) 및 프로세서(910)를 포함할 수 있다. 용어 "프로세서"는, 동시에 명령어들을 실행할 수 있는 2개 이상의 독립된 프로세서(때때로 "코어"로서 지칭됨)를 포함할 수 있는 멀티 코어 프로세서를 포함하도록 의도된다. 도 9는 다중의 프로세서(902)를 도시하고 있지만, 머신(900)은, 단일 코어를 갖는 단일 프로세서, 다중의 코어를 갖는 단일 프로세서(예를 들어, 멀티 코어 프로세서), 단일 코어를 갖는 다중의 프로세서, 다중의 코어를 갖는 다중의 프로세서, 또는 이들의 임의의 조합을 포함할 수 있다.

메모리(904)는, 메인 메모리(912), 정적 메모리(914), 및 저장 유닛(916)을 포함하고, 둘 모두는 버스(940)를 통해 프로세서들(902)에 액세스가능하다. 메인 메모리(904), 정적 메모리(914), 및 저장유닛(916)은, 본 명세서에 설명된 방법론들 또는 기능들 중 임의의 하나 이상을 구체화하는 명령어(908)를 저장한다. 명령어(908)는 또한, 머신(900)에 의한 이것의 실행 동안에, 완전히 또는 부분적으로, 메인 메모리(912) 내에, 정적 메모리(914) 내에, 저장 유닛(916) 내의 머신 판독가능 매체(918) 내에, 프로세서(902)들 중 적어도 하나 내에(예를 들어, 프로세서의 캐시 메모리 내에), 또는 이것들의 임의의 적절한 조합 내에 존재할 수 있다.

I/O 컴포넌트들(938)은 입력을 수신하고, 출력을 제공하고, 출력을 산출하고, 정보를 송신하고, 정보를 교환하고, 측정들을 캡처하는 등을 위한 매우 다양한 컴포넌트들을 포함할 수 있다. 특정 머신에 포함되는 특정 I/O 컴포넌트들(938)은 머신의 타입에 의존할 것이다. 예를 들어, 모바일 폰들과 같은 휴대용 머신들은 터치 입력 디바이스 또는 다른 이러한 입력 메커니즘들을 포함할 수 있는 한편, 헤드리스 서버 머신은 이러한 터치 입력 디바이스를 포함하지 않을 가능성이 크다. I/O 컴포넌트들(938)은 도 9에 도시되지 않은 많은 다른 컴포넌트들을 포함할 수 있다는 점이 이해될 것이다. 다양한 예들에서, I/O 컴포넌트들(938)은 사용자 출력 컴포넌트들(924) 및 사용자 입력 컴포넌트들(926)을 포함할 수 있다. 사용자 출력 컴포넌트들(924)은 시각적 컴포넌트들(예를 들어, PDP(plasma display panel), LED(light-emitting diode) 디스플레이, LCD(liquid crystal display), 프로젝터, 또는 CRT(cathode ray tube)와 같은 디스플레이), 음향 컴포넌트들(예를 들어, 스피커들), 햅틱 컴포넌트들(예를 들어, 진동 모터, 저항 메커니즘들), 다른 신호 생성기들, 및 그와 유사한 것을 포함할 수 있다. 사용자 입력 컴포넌트들(926)은 영숫자 입력 컴포넌트들(예를 들어, 키보드, 영숫자 입력을 수신하도록 구성되는 터치 스크린, 포토-광학 키보드, 또는 다른 영숫자 입력 컴포넌트들), 포인트 기반 입력 컴포넌트들(예를 들어, 마우스, 터치패드, 트랙볼, 조이스틱, 모션 센서, 또는 다른 포인팅 기구), 촉각 입력 컴포넌트들(예를 들어, 물리적 버튼, 터치들 또는 터치 제스처들의 로케이션 및 힘을 제공하는 터치 스크린, 또는 다른 촉각 입력 컴포넌트들), 오디오 입력 컴포넌트들(예를 들어, 마이크로폰), 및 그와 유사한 것을 포함할 수 있다.

추가의 예들에서, I/O 컴포넌트들(938)은, 특히, 바이오메트릭 컴포넌트들(928), 모션 컴포넌트들(930), 환경 컴포넌트들(932), 또는 위치 컴포넌트들(934)을 포함할 수 있다. 예를 들어, 바이오메트릭 컴포넌트들(928)은, 표현들(예를 들어, 손 표현, 얼굴 표정, 음성 표현, 신체 제스처, 또는 눈 추적)을 검출하고, 생체신호들(예를 들어, 혈압, 심박수, 체온, 땀, 또는 뇌파)을 측정하고, 사람을 식별(예를 들어, 음성 식별, 망막 식별, 얼굴 식별, 지문 인식, 또는 뇌파계 기반 식별)하는 컴포넌트들을 포함한다. 모션 컴포넌트들(930)은, 가속도 센서 컴포넌트들(예를 들어, 가속도계), 중력 센서 컴포넌트들, 회전 센서 컴포넌트들(예를 들어, 자이로스코프)을 포함한다.

환경 컴포넌트(932)는, 예를 들어, (정지 이미지/사진 및 비디오 능력을 갖춘) 하나 이상의 카메라, 조명 센서 컴포넌트(예를 들어, 광도계), 온도 센서 컴포넌트(예를 들어, 주변 온도를 검출하는 하나 이상의 온도계), 습도 센서 컴포넌트, 압력 센서 컴포넌트(예를 들어, 기압계), 음향 센서 컴포넌트(예를 들어, 배경 잡음을 검출하는 하나 이상의 마이크로폰), 근접 센서 컴포넌트(예를 들어, 근처의 물체를 검출하는 적외선 센서), 가스 센서(예를 들어, 안전을 위해 유해 가스의 농도를 검출하거나 대기 중 오염물질을 측정하는 가스 검출 센서), 또는 주변의 물리적 환경에 대응하는 표시, 측정치, 또는 신호를 제공할 수 있는 기타의 컴포넌트들을 포함한다.

카메라들과 관련하여, 클라이언트 디바이스(102)는, 예를 들어, 클라이언트 디바이스(102)의 전방 표면 상의 전방 카메라들 및 클라이언트 디바이스(102)의 후방 표면 상의 후방 카메라들을 포함하는 카메라 시스템을 가질 수 있다. 전방 카메라들은, 예를 들어, 클라이언트 디바이스(102)의 사용자의 정지 이미지들 및 비디오(예를 들어, "셀피들")를 캡처하기 위해 사용될 수 있고, 이는 이후 전술된 증강 데이터(예를 들어, 필터들)로 증강될 수 있다. 후방 카메라들은, 예를 들어, 더 전통적인 카메라 모드에서 정지 이미지들 및 비디오들을 캡처하기 위해 사용될 수 있고, 이들 이미지들은 유사하게 증강 데이터에 의해 증강된다. 전방 및 후방 카메라들에 더하여, 클라이언트 디바이스(102)는 360° 사진들 및 비디오들을 캡처하기 위한 360° 카메라를 또한 포함할 수 있다.

또한, 클라이언트 디바이스(102)의 카메라 시스템은 클라이언트 디바이스(102)의 전방 및 후방 측면들 상에 이중 후방 카메라들(예를 들어, 주 카메라뿐만 아니라 깊이 감지 카메라), 또는 심지어 삼중, 사중 또는 오중 후방 카메라 구성들을 포함할 수 있다. 이러한 다중 카메라 시스템은 예를 들어, 와이드 카메라, 울트라 와이드 카메라, 텔레포토 카메라, 매크로 카메라 및 깊이 센서를 포함할 수 있다.

위치 컴포넌트(934)는, 로케이션 센서 컴포넌트(예를 들어, GPS 수신기 컴포넌트), 고도 센서 컴포넌트(고도가 그로부터 도출될 수 있는 기압을 검출하는 고도계 또는 기압계), 오리엔테이션 센서 컴포넌트(예를 들어, 자력계), 및 그와 유사한 것을 포함한다.

통신은 매우 다양한 기술을 이용하여 구현될 수 있다. I/O 컴포넌트(938)는, 머신(900)을 각자의 결합 또는 접속을 통해 네트워크(920) 또는 디바이스(922)에 결합하도록 동작가능한 통신 컴포넌트(936)를 추가로 포함한다. 예를 들어, 통신 컴포넌트(936)는 네트워크 인터페이스 컴포넌트 또는 네트워크(920)와 인터페이스하기 위한 또 다른 적절한 디바이스를 포함할 수 있다. 추가 예에서, 통신 컴포넌트(936)는, 유선 통신 컴포넌트, 무선 통신 컴포넌트, 셀룰러 통신 컴포넌트, NFC(Near Field Communication) 컴포넌트, Bluetooth® 컴포넌트(예를 들어, Bluetooth® Low Energy), Wi-Fi® 컴포넌트, 및 다른 양태를 통해 통신을 제공하는 기타의 통신 컴포넌트를 포함할 수 있다. 디바이스(922)는 또 다른 머신 또는 매우 다양한 주변 디바이스들 중 임의의 것(예를 들어, USB를 통해 결합된 주변 디바이스)일 수 있다.

또한, 통신 컴포넌트들(636)은 식별자들을 검출할 수 있거나 식별자들을 검출하도록 동작가능한 컴포넌트들을 포함할 수 있다. 예를 들어, 통신 컴포넌트들(636)은 RFID(Radio Frequency Identification) 태그 판독기 컴포넌트들, NFC 스마트 태그 검출 컴포넌트들, 광학 판독기 컴포넌트들(예를 들어, UPC(Universal Product Code) 바코드와 같은 1차원 바코드들, QR(Quick Response) 코드, Aztec 코드, Data Matrix, Dataglyph, MaxiCode, PDF417, Ultra Code, UCC RSS-2D 바코드와 같은 다차원 바코드들, 및 다른 광학 코드들을 검출하는 광학 센서), 또는 음향 검출 컴포넌트들(예를 들어, 태깅된 오디오 신호들을 식별하는 마이크로폰들)을 포함할 수 있다. 또한, 인터넷 프로토콜(IP) 지오로케이션을 통한 로케이션, Wi-Fi® 신호 삼각측량을 통한 로케이션, 특정 로케이셔을 나타낼 수 있는 NFC 비컨 신호를 검출하는 것을 통한 로케이션 등과 같은 다양한 정보가 통신 컴포넌트들(936)을 통해 도출될 수 있다.

다양한 메모리들(예를 들어, 메인 메모리(912), 정적 메모리(914), 및 프로세서들(902)의 메모리) 및 저장 유닛(916)은 본 명세서에 설명된 방법론들 또는 기능들 중 임의의 하나 이상을 구체화하거나 그에 의해 사용되는 명령어들 및 데이터 구조들(예를 들어, 소프트웨어)의 하나 이상의 세트를 저장할 수 있다. 이러한 명령어들(예를 들어, 명령어들(908))은, 프로세서들(902)에 의해 실행될 때, 다양한 동작들이 개시된 예들을 구현하게 야기한다.

명령어들(908)은 네트워크 인터페이스 디바이스(예를 들어, 통신 컴포넌트들(936)에 포함된 네트워크 인터페이스 컴포넌트)를 통해, 송신 매체를 이용하여, 그리고 몇몇 잘 알려진 전송 프로토콜들(예를 들어, HTTP(hypertext transfer protocol)) 중 어느 하나를 이용하여, 네트워크(920)를 통해 송신 또는 수신될 수 있다. 유사하게, 명령어들(608)은 디바이스들(922)에 대한 결합(예를 들어, 피어-투-피어 결합)을 통해 송신 매체를 이용하여 송신 또는 수신될 수 있다.

용어집

"캐리어 신호"는 머신에 의한 실행을 위한 명령어들을 저장, 인코딩 또는 운반할 수 있는 임의의 무형 매체를 지칭하며, 디지털 또는 아날로그 통신 신호들 또는 그러한 명령어들의 통신을 용이하게 하기 위한 다른 무형 매체를 포함한다. 명령어들은 네트워크 인터페이스 디바이스를 통해 송신 매체를 사용하여 네트워크를 통해 송신 또는 수신될 수 있다.

"클라이언트 디바이스"는 하나 이상의 서버 시스템 또는 다른 클라이언트 디바이스들로부터 자원들을 획득하기 위해 통신 네트워크에 인터페이싱하는 임의의 머신을 지칭한다. 클라이언트 디바이스는, 모바일 폰, 데스크톱 컴퓨터, 랩톱, PDA들(portable digital assistants), 스마트폰들, 태블릿들, 울트라북들, 넷북들, 랩톱들, 멀티-프로세서 시스템들, 마이크로프로세서-기반 또는 프로그래머블 가전 제품들, 게임 콘솔들, 셋톱 박스들, 또는 사용자가 네트워크에 액세스하기 위해 사용할 수 있는 임의의 다른 통신 디바이스일 수 있지만, 이에 제한되는 것은 아니다.

"통신 네트워크"는 애드혹 네트워크, 인트라넷, 엑스트라넷, VPN(virtual private network), LAN(local area network), 무선 LAN(WLAN), WAN(wide area network), 무선 WAN(WWAN), MAN(metropolitan area network), 인터넷, 인터넷의 일부, PSTN(Public Switched Telephone Network)의 일부, POTS(plain old telephone service) 네트워크, 셀룰러 전화 네트워크, 무선 네트워크, Wi-Fi® 네트워크, 또 다른 타입의 네트워크, 또는 2개 이상의 이러한 네트워크들의 조합일 수 있는 네트워크의 하나 이상의 부분을 지칭한다. 예를 들어, 네트워크 또는 네트워크의 일부는 무선 또는 셀룰러 네트워크를 포함할 수 있고, 결합은 CDMA(Code Division Multiple Access) 접속, GSM(Global System for Mobile communications) 접속, 또는 다른 타입들의 셀룰러 또는 무선 결합을 포함할 수 있다. 이 예에서, 결합은 1xRTT(Single Carrier Radio Transmission Technology), EVDO(Evolution-Data Optimized) 기술, GPRS(General Packet Radio Service) 기술, EDGE(Enhanced Data rates for GSM Evolution) 기술, 3G를 포함하는 3GPP(third Generation Partnership Project), 4G(fourth generation wireless) 네트워크들, UMTS(Universal Mobile Telecommunications System), HSPA(High Speed Packet Access), WiMAX(Worldwide Interoperability for Microwave Access), LTE(Long Term Evolution) 표준, 다양한 표준 설정 조직들에 의해 정의된 다른 것들, 다른 장거리 프로토콜들, 또는 다른 데이터 전송 기술과 같은, 다양한 타입의 데이터 전송 기술들 중 임의의 것을 구현할 수 있다.

"컴포넌트"는 함수 또는 서브루틴 호출들, 분기 포인트들, API들, 또는 특정 처리 또는 제어 기능들의 파티셔닝 또는 모듈화를 제공하는 다른 기술들에 의해 정의된 경계들을 갖는 디바이스, 물리적 엔티티, 또는 로직을 지칭한다. 컴포넌트들은 그들의 인터페이스들을 통해 다른 컴포넌트들과 조합되어 머신 프로세스를 수행할 수 있다. 컴포넌트는 다른 컴포넌트들 및 보통은 관련 기능들 중 특정 기능을 수행하는 프로그램의 일부와 함께 사용하도록 설계된 패키징된 기능 하드웨어 유닛일 수 있다. 컴포넌트들은 소프트웨어 컴포넌트들(예컨대, 머신 판독가능 매체 상에 구체화된 코드) 또는 하드웨어 컴포넌트들 중 어느 하나를 구성할 수 있다. "하드웨어 컴포넌트"는 특정 동작들을 수행할 수 있는 유형의 유닛이고, 특정 물리적 방식으로 구성되거나 배열될 수 있다. 다양한 예들에서, 하나 이상의 컴퓨터 시스템(예를 들어, 독립형 컴퓨터 시스템, 클라이언트 컴퓨터 시스템, 또는 서버 컴퓨터 시스템) 또는 컴퓨터 시스템의 하나 이상의 하드웨어 컴포넌트(예를 들어, 프로세서 또는 프로세서들의 그룹)는 본 명세서에 설명된 바와 같이 특정 동작들을 수행하도록 동작하는 하드웨어 컴포넌트로서 소프트웨어(예를 들어, 애플리케이션 또는 애플리케이션 부분)에 의해 구성될 수 있다. 하드웨어 컴포넌트는 또한, 기계적으로, 전자적으로, 또는 이것들의 임의의 적절한 조합으로 구현될 수 있다. 예를 들어, 하드웨어 컴포넌트는 특정 동작들을 수행하도록 영구적으로 구성되는 전용 회로 또는 로직을 포함할 수 있다. 하드웨어 컴포넌트는 FPGA(field-programmable gate array) 또는 ASIC(application specific integrated circuit)와 같은 특수 목적 프로세서일 수 있다. 하드웨어 컴포넌트는 또한 특정 동작들을 수행하기 위해 소프트웨어에 의해 일시적으로 구성되는 프로그래머블 로직 또는 회로를 포함할 수 있다. 예를 들어, 하드웨어 컴포넌트는 범용 프로세서 또는 다른 프로그래머블 프로세서에 의해 실행되는 소프트웨어를 포함할 수 있다. 일단 이러한 소프트웨어에 의해 구성되면, 하드웨어 컴포넌트들은 구성된 기능들을 수행하도록 고유하게 맞춤화된 특정 머신들(또는 머신의 특정 컴포넌트들)이 되고 더 이상 범용 프로세서들이 아니다. 하드웨어 컴포넌트를 기계적으로, 전용의 영구적으로 구성된 회로에, 또는 일시적으로 구성된 회로(예컨대, 소프트웨어에 의해 구성됨)에 구현하기로 하는 결정이 비용 및 시간 고려사항들에 의해 주도될 수 있다는 것을 알 것이다. 따라서, "하드웨어 컴포넌트"(또는 "하드웨어 구현된 컴포넌트")라는 구문은, 특정 방식으로 동작하거나 본 명세서에 설명된 특정 동작들을 수행하도록 물리적으로 구성되거나, 영구적으로 구성되거나(예를 들어, 하드와이어드), 또는 일시적으로 구성된(예를 들어, 프로그래밍된) 엔티티이기만 하다면, 유형 엔티티를 포괄하는 것으로 이해되어야 한다. 하드웨어 컴포넌트들이 일시적으로 구성되는(예를 들어, 프로그래밍되는) 예들을 고려하면, 하드웨어 컴포넌트들 각각은 임의의 하나의 시간 인스턴스에서 구성되거나 인스턴스화될 필요는 없다. 예를 들어, 하드웨어 컴포넌트가 특수 목적 프로세서가 되도록 소프트웨어에 의해 구성된 범용 프로세서를 포함하는 경우, 범용 프로세서는 상이한 시간들에서 (예를 들어, 상이한 하드웨어 컴포넌트들을 포함하는) 각자의 상이한 특수 목적 프로세서들로서 구성될 수 있다. 소프트웨어는 그에 따라, 예를 들어, 하나의 시간 인스턴스에서는 특정의 하드웨어 컴포넌트를 구성하고 상이한 시간 인스턴스에서는 상이한 하드웨어 컴포넌트를 구성하도록 특정의 프로세서 또는 프로세서들을 구성한다. 하드웨어 컴포넌트들은 다른 하드웨어 컴포넌트들에 정보를 제공하고, 다른 하드웨어 컴포넌트들로부터 정보를 수신할 수 있다. 따라서, 기술된 하드웨어 컴포넌트들은 통신가능하게 결합되는 것으로 간주될 수 있다. 다중의 하드웨어 컴포넌트가 동시에 존재하는 경우, 하드웨어 컴포넌트들 중 2개 이상 사이의 또는 그들 중의(예를 들어, 적절한 회로들 및 버스들을 통한) 신호 송신을 통해 통신이 달성될 수 있다. 다중의 하드웨어 컴포넌트가 상이한 시간들에서 구성되거나 인스턴스화되는 예들에서, 이러한 하드웨어 컴포넌트들 사이의 통신은, 예를 들어, 다중의 하드웨어 컴포넌트가 액세스할 수 있는 메모리 구조들에서의 정보의 저장 및 검색을 통해 달성될 수 있다. 예를 들어, 하나의 하드웨어 컴포넌트는 동작을 수행하고 그 동작의 출력을 이것이 통신가능하게 결합되는 메모리 디바이스에 저장할 수 있다. 그 다음, 추가의 하드웨어 컴포넌트는, 나중에, 메모리 디바이스에 액세스하여 저장된 출력을 검색 및 처리할 수 있다. 하드웨어 컴포넌트들은 또한 입력 또는 출력 디바이스들과의 통신을 개시할 수 있고, 자원(예컨대, 정보의 컬렉션)에 대해 동작할 수 있다. 본 명세서에 설명된 예시적인 방법들의 다양한 동작들은, 관련 동작들을 수행하도록(예를 들어, 소프트웨어에 의해) 일시적으로 구성되거나 영구적으로 구성되는 하나 이상의 프로세서에 의해 적어도 부분적으로 수행될 수 있다. 일시적으로 구성되든 영구적으로 구성되든 간에, 이러한 프로세서들은 본 명세서에 설명된 하나 이상의 동작 또는 기능을 수행하도록 동작하는 프로세서 구현 컴포넌트들을 구성할 수 있다. 본 명세서에서 사용될 때, "프로세서 구현 컴포넌트"는 하나 이상의 프로세서를 이용하여 구현된 하드웨어 컴포넌트를 지칭한다. 유사하게, 본 명세서에 설명된 방법들은, 특정 프로세서 또는 프로세서들이 하드웨어의 예가 되면서, 적어도 부분적으로 프로세서 구현될 수 있다. 예를 들어, 방법의 동작들 중 적어도 일부는 하나 이상의 프로세서(902) 또는 프로세서 구현 컴포넌트에 의해 수행될 수 있다. 더욱이, 하나 이상의 프로세서는 또한 "클라우드 컴퓨팅" 환경에서 또는 "SaaS(software as a service)"로서 관련 동작들의 수행을 지원하도록 동작할 수 있다. 예를 들어, 동작들 중 적어도 일부는, (프로세서들을 포함하는 머신의 예로서의) 컴퓨터들의 그룹에 의해 수행될 수 있고, 이들 동작들은 네트워크(예를 들어, 인터넷)를 통해 및 하나 이상의 적절한 인터페이스(예를 들어, API)를 통해 액세스가능하다. 동작들 중 특정 동작의 수행은 단일 머신 내에 존재할 뿐만 아니라 다수의 머신에 걸쳐 배치되는 프로세서들 사이에 분산될 수 있다. 일부 예들에서, 프로세서들 또는 프로세서 구현 컴포넌트들은 단일의 지리적 로케이션에 (예컨대, 가정 환경, 사무실 환경, 또는 서버 팜 내에) 위치할 수 있다. 다른 예들에서, 프로세서들 또는 프로세서 구현 컴포넌트들은 다수의 지리적 로케이션에 걸쳐 분산될 수 있다.

"컴퓨터 판독가능 저장 매체"는 머신 저장 매체 및 송신 매체 둘 다를 지칭한다. 따라서, 용어들은 저장 디바이스들/매체들 및 캐리어 파들/변조된 데이터 신호들 둘 다를 포함한다. 용어들 "머신 판독가능 매체", "컴퓨터 판독가능 매체" 및 "디바이스 판독가능 매체"는 동일한 것을 의미하고 본 개시내용에서 상호교환가능하게 사용될 수 있다.

"머신 저장 매체"는 실행가능 명령어, 루틴 및 데이터를 저장하는 단일의 또는 다중의 저장 디바이스 및 매체(예를 들어, 중앙집중형 또는 분산형 데이터베이스, 및 연관된 캐시 및 서버)를 지칭한다. 따라서, 이 용어는 고체 상태 메모리, 및 프로세서 내부 또는 외부의 메모리를 포함한 광학 및 자기 매체를 포함하지만 이것으로 제한되지 않는 것으로 간주되어야 한다. 머신 저장 매체들, 컴퓨터 저장 매체들, 및 디바이스 저장 매체들의 특정 예들은 예로서, 반도체 메모리 디바이스들, 예컨대, EPROM(erasable programmable read-only memory), EEPROM(electrically erasable programmable read-only memory), FPGA, 및 플래시 메모리 디바이스들을 포함하는 비-휘발성 메모리; 내부 하드 디스크 및 이동식 디스크와 같은 자기 디스크; 자기-광학 디스크들; 및 CD-ROM과 DVD-ROM 디스크들을 포함한다. 용어들 "머신 저장 매체", "디바이스 저장 매체", "컴퓨터 저장 매체"는 동일한 것을 의미하고 본 개시내용에서 상호교환가능하게 사용될 수 있다. 용어들 "머신 저장 매체들", "컴퓨터 저장 매체들", 및 "디바이스 저장 매체들"은 반송파들, 변조된 데이터 신호들, 및 다른 이러한 매체들을 구체적으로 배제하고, 이들 중 적어도 일부는 용어 "신호 매체" 하에서 커버된다.

"비일시적 컴퓨터 판독가능 저장 매체"는 머신에 의한 실행을 위한 명령어들을 저장, 인코딩, 또는 운반할 수 있는 유형의 매체를 지칭한다.

"신호 매체(signal medium)"는 머신에 의한 실행을 위한 명령어들을 저장, 인코딩, 또는 운반할 수 있는 임의의 무형 매체를 지칭하고, 소프트웨어 또는 데이터의 통신을 용이하게 하는 디지털 또는 아날로그 통신 신호들 또는 다른 무형 매체를 포함한다. "신호 매체"라는 용어는 임의의 형태의 변조된 데이터 신호, 캐리어 파 등을 포함하는 것으로 간주되어야 한다. 용어 "변조된 데이터 신호"는 그 신호의 특성들 중 하나 이상이 신호 내의 정보를 인코딩하는 식으로 설정 또는 변경되게 한 신호를 의미한다. 용어들 "송신 매체" 및 "신호 매체"는 동일한 것을 의미하고 본 개시내용에서 상호교환가능하게 사용될 수 있다.

Claims

방법으로서:
수신자 사용자 디바이스에서 제1 오디오 메시지를 수신하는 단계;
상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 제1 사용자 선택가능 요소 및 상기 제1 오디오 메시지의 전사의 프레젠테이션을 야기하도록 동작 가능한 제2 사용자 선택가능 요소를 포함하는 채팅 UI(user interface)의 프레젠테이션을, 상기 수신자 사용자 디바이스의 디스플레이 상에서, 야기하는 단계 - 상기 제1 사용자 선택가능 요소 및 상기 제2 사용자 선택가능 요소는 상기 채팅 UI에서 동시에 제시됨 -;
상기 제2 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여:
상기 제1 오디오 메시지의 전사를 포함하도록 상기 채팅 UI를 수정하는 단계;
상기 수신자 사용자 디바이스의 디스플레이 상에서 상기 수정된 채팅 UI의 프레젠테이션을 야기하는 단계 - 상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 상기 제1 사용자 선택가능 요소는 상기 제1 오디오 메시지의 전사와 동시에 상기 수정된 채팅 UI에서 제시됨 -; 및
제2 오디오 메시지와 연관된 제3 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 수정된 채팅 UI로부터 상기 제1 오디오 메시지의 전사를 제거하는 단계를 포함하는 방법.
제1항에 있어서, 상기 제2 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 제1 오디오 메시지의 전사를 생성하는 것을 시작하는 단계를 포함하는 방법.
제1항에 있어서, 상기 채팅 UI는 상기 제1 오디오 메시지를 정상 재생 속도와는 상이한 속도로 재생하게 야기하도록 동작 가능한 제4 사용자 선택가능 요소를 포함하는 방법.
제1항에 있어서, 상기 제3 사용자 선택가능 요소는 상기 제2 오디오 메시지의 부분 전사이고, 상기 방법은: 상기 제3 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 제2 오디오 메시지의 전체 전사의 프레젠테이션을 야기하는 단계를 추가로 포함하는 방법.
제1항에 있어서, 상기 채팅 UI는 오디오 녹음 프로세스를 개시하도록 동작 가능한 마이크로폰 사용자 선택가능 요소 및 사용자로부터 텍스트 입력을 획득하기 위한 가상 키보드를 포함하고, 상기 방법은:
상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출하는 단계; 및
상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 채팅 UI 내의 상기 가상 키보드를 음성 메모 트레이로 대체하는 단계 - 상기 음성 메모 트레이는 사용자로부터 오디오 입력을 획득하는 것을 용이하게 하기 위한 하나 이상의 사용자 선택가능 요소를 포함함 - 를 포함하는 방법.
제5항에 있어서, 상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출하는 것은 상기 마이크로폰 사용자 선택가능 요소로 지향되는 탭 제스처를 검출하는 것에 기초하는 방법.
제5항에 있어서, 상기 음성 메모 트레이는 오디오 메시지를 폐기하도록 동작 가능한 사용자 선택가능 요소를 포함하는 방법.
제5항에 있어서, 상기 음성 메모 트레이는 오디오 메시지의 녹음을 시작하도록 동작 가능한 레코드 사용자 선택가능 요소를 포함하는 방법.
제8항에 있어서,
상기 레코드 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 오디오 입력을 캡처하는 것을 시작하는 단계;
상기 오디오 입력에 기초하여 새로운 오디오 메시지를 생성하는 단계; 및
상기 새로운 오디오 메시지를 제2 사용자 디바이스에 통신하는 단계를 포함하는 방법.
제1항에 있어서, 상기 채팅 UI는 상기 수신자 사용자 디바이스에서 실행 중인 메시징 클라이언트 애플리케이션에 의해 제시되고, 상기 메시징 클라이언트 애플리케이션은 네트워크를 통해 데이터를 교환하기 위한 메시징 시스템의 백엔드 서비스에 의해 제공되는 방법.
시스템으로서:
하나 이상의 프로세서; 및
상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 동작들을 수행하게 야기하는 명령어들을 포함하는 비일시적 컴퓨터 판독가능 저장 매체를 포함하고, 상기 동작들은:
수신자 사용자 디바이스에서 제1 오디오 메시지를 수신하는 동작;
상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 제1 사용자 선택가능 요소 및 상기 제1 오디오 메시지의 전사의 프레젠테이션을 야기하도록 동작 가능한 제2 사용자 선택가능 요소를 포함하는 채팅 UI(user interface)의 프레젠테이션을, 상기 수신자 사용자 디바이스의 디스플레이 상에서, 야기하는 동작 - 상기 제1 사용자 선택가능 요소 및 상기 제2 사용자 선택가능 요소는 상기 채팅 UI에서 동시에 제시됨 -;
상기 제2 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여:
상기 제1 오디오 메시지의 전사를 포함하도록 상기 채팅 UI를 수정하는 동작; 및
상기 수신자 사용자 디바이스의 디스플레이 상에서 상기 수정된 채팅 UI의 프레젠테이션을 야기하는 동작 - 상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 상기 제1 사용자 선택가능 요소는 상기 제1 오디오 메시지의 전사와 동시에 상기 수정된 채팅 UI에서 제시됨 -; 및
제2 오디오 메시지와 연관된 제3 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 수정된 채팅 UI로부터 상기 제1 오디오 메시지의 전사를 제거하는 동작을 포함하는 시스템.
제11항에 있어서, 상기 하나 이상의 프로세서에 의해 실행되는 명령어들에 의해 야기되는 동작들은, 상기 제2 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여 상기 제1 오디오 메시지의 전사를 생성하는 것을 시작하는 동작을 포함하는 시스템.
제11항에 있어서, 상기 채팅 UI는 상기 제1 오디오 메시지를 정상 재생 속도와는 상이한 속도로 재생하게 야기하도록 동작 가능한 제4 사용자 선택가능 요소를 포함하는 시스템.
제11항에 있어서, 상기 제3 사용자 선택가능 요소는 상기 제2 오디오 메시지의 부분 전사이고, 상기 동작들은, 상기 제3 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 제2 오디오 메시지의 전체 전사의 프레젠테이션을 야기하는 동작을 추가로 포함하는 시스템.
제11항에 있어서, 상기 채팅 UI는 오디오 녹음 프로세스를 개시하도록 동작 가능한 마이크로폰 사용자 선택가능 요소 및 사용자로부터 텍스트 입력을 획득하기 위한 가상 키보드를 포함하고, 상기 하나 이상의 프로세서에 의해 실행되는 명령어들에 의해 야기되는 동작들은:
상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출하는 동작; 및
상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 채팅 UI 내의 상기 가상 키보드를 음성 메모 트레이로 대체하는 동작 - 상기 음성 메모 트레이는 사용자로부터 오디오 입력을 획득하는 것을 용이하게 하기 위한 하나 이상의 사용자 선택가능 요소를 포함함 - 을 포함하는 시스템.
제15항에 있어서, 상기 마이크로폰 사용자 선택가능 요소의 활성화를 검출하는 것은 상기 마이크로폰 사용자 선택가능 요소로 지향되는 탭 제스처를 검출하는 것에 기초하는 시스템.
제15항에 있어서, 상기 음성 메모 트레이는 오디오 메시지를 폐기하도록 동작 가능한 사용자 선택가능 요소를 포함하는 시스템.
제15항에 있어서, 상기 음성 메모 트레이는 오디오 메시지의 녹음을 시작하도록 동작 가능한 레코드 사용자 선택가능 요소를 포함하는 시스템.
제18항에 있어서, 상기 하나 이상의 프로세서에 의해 실행되는 명령어들에 의해 야기되는 동작들은:
상기 레코드 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 오디오 입력을 캡처하는 것을 시작하는 동작;
상기 오디오 입력에 기초하여 새로운 오디오 메시지를 생성하는 동작; 및
상기 새로운 오디오 메시지를 제2 사용자 디바이스에 통신하는 동작을 추가로 포함하는 시스템.
머신에 의해 실행가능하여 상기 머신으로 하여금 동작들을 수행하게 야기하는 명령어 데이터를 갖는 머신 판독가능 비일시적 저장 매체로서, 상기 동작들은:
수신자 사용자 디바이스에서 제1 오디오 메시지를 수신하는 동작;
상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 제1 사용자 선택가능 요소 및 상기 제1 오디오 메시지의 전사의 프레젠테이션을 야기하도록 동작 가능한 제2 사용자 선택가능 요소를 포함하는 채팅 UI(user interface)의 프레젠테이션을, 상기 수신자 사용자 디바이스의 디스플레이 상에서, 야기하는 동작 - 상기 제1 사용자 선택가능 요소 및 상기 제2 사용자 선택가능 요소는 상기 채팅 UI에서 동시에 제시됨 -;
상기 제2 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여:
상기 제1 오디오 메시지의 전사를 포함하도록 상기 채팅 UI를 수정하는 동작; 및
상기 수신자 사용자 디바이스의 디스플레이 상에서 상기 수정된 채팅 UI의 프레젠테이션을 야기하는 동작 - 상기 제1 오디오 메시지의 재생을 야기하도록 동작 가능한 상기 제1 사용자 선택가능 요소는 상기 제1 오디오 메시지의 전사와 동시에 상기 수정된 채팅 UI에서 제시됨 -; 및
제2 오디오 메시지와 연관된 제3 사용자 선택가능 요소의 활성화를 검출한 것에 응답하여, 상기 수정된 채팅 UI로부터 상기 제1 오디오 메시지의 전사를 제거하는 동작을 포함하는 머신 판독가능 비일시적 저장 매체.