[go: up one dir, main page]

WO2013077000A1 - ボイスリンクシステム - Google Patents

ボイスリンクシステム Download PDF

Info

Publication number
WO2013077000A1
WO2013077000A1 PCT/JP2012/007607 JP2012007607W WO2013077000A1 WO 2013077000 A1 WO2013077000 A1 WO 2013077000A1 JP 2012007607 W JP2012007607 W JP 2012007607W WO 2013077000 A1 WO2013077000 A1 WO 2013077000A1
Authority
WO
WIPO (PCT)
Prior art keywords
room
terminal
virtual room
server
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2012/007607
Other languages
English (en)
French (fr)
Inventor
雄一郎 板倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Synergy Drive Inc
Original Assignee
Synergy Drive Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synergy Drive Inc filed Critical Synergy Drive Inc
Priority to JP2013545804A priority Critical patent/JP6101973B2/ja
Priority to US14/360,642 priority patent/US20140325395A1/en
Priority to KR1020147017143A priority patent/KR101659674B1/ko
Priority to EP12850954.4A priority patent/EP2787718A4/en
Priority to CN201280068171.7A priority patent/CN104067602B/zh
Publication of WO2013077000A1 publication Critical patent/WO2013077000A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2117User registration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4756End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for rating content, e.g. scoring a recommended movie

Definitions

  • the present invention relates to a technology of a voice version social network service system (hereinafter referred to as a voice link system) via a network such as the Internet.
  • a voice link system a voice version social network service system
  • VoIP Voice over IP
  • the audio data signal of each client terminal is transmitted to the server, and the server transmits the audio data signal sent from each client terminal. Synthesize.
  • the synthesized voice data signal is transmitted to each client terminal.
  • the server can transmit the synthesized voice data signal not only to the client terminal participating in the conference but also to the client terminal of the conference listener existing on the network.
  • the listener means a person who only hears a conference call and does not speak.
  • the voice data signal synthesized in the conference call as described above is directly stored in the server computer as a file, and is transmitted to the client terminal as a streaming data file, for example, as necessary.
  • the conventional conference call system does not have a sufficient mechanism to let many listeners hear the content of the conference call.
  • the mechanism for finding out the contents of conference calls in which the listener is interested is not sufficient.
  • the conventional character-based social media there is a limit to its power, and a social media system that can fully exert the power of voice is eagerly desired.
  • the debate program is a popular discussion on TV programs from late night to early morning, rather than a moderator who sits on a round table and speaks freely according to the theme and manages the theme progress.
  • the debate freely speaks about the debate theme, and the listener (first listener) and the TV viewer (second listener) through the television screen are in the place. Listen and share information.
  • the debater gestures, but basically only sits and speaks. There are scenes where slides are used, but they are rarely needed.
  • the listener (first listener) and the TV viewer (second listener) who are present are interested in the content of the debate.
  • an object of the present invention is to provide a social network service system that specializes in audio and allows users to enjoy conversation in a space on the Web.
  • a voice link system of the present invention is a system in which a plurality of client terminals and at least one server are connected via a network
  • the client terminal includes room selecting means for selecting a virtual room, audio data receiving means for receiving audio data associated with the selected virtual room, and audio data output means for outputting audio data.
  • voice data transmitting means for transmitting the collected voice as voice data to the server is further provided.
  • the server also includes room attribute storage means for storing virtual room attribute information, voice data receiving means for receiving voice data from the speaker terminal, and voice data received from the speaker terminal via the network.
  • a voice data distribution unit that sorts the data and transmits the voice data of the same virtual room to the client terminal that has selected the virtual room.
  • the voice link system of the present invention is a system capable of linking (connecting) voices as the name suggests.
  • a virtual room called “room” is constructed on a server that distributes voice data received from a client terminal via a network.
  • the room can be used not only as a conference room for discussions among a plurality of people, but also includes the meaning of a seminar room for giving a lecture alone.
  • Conference calls include lectures and regular conversations as well as discussions and meetings.
  • a plurality of client terminals and at least one server are connected via a network.
  • Client terminals are roughly classified into a listener terminal as a listener who does not speak and a speaker terminal capable of speaking in a room.
  • a list of virtual rooms on the server is displayed and a means for selecting a virtual room on the server (room selection means) and voice data associated with the virtual room on the server are received.
  • Means speech data receiving means
  • means for outputting sound data sound output means
  • the client terminal refers to a computer that can be connected to a network that transfers packets using an Internet protocol, such as a mobile computer, a cellular phone, and a PC (Personal Computer).
  • an Internet protocol such as a mobile computer, a cellular phone, and a PC (Personal Computer).
  • N speakers N is 2 or more
  • the number of client terminals as listeners is from one to an unlimited number (subject to server resource restrictions).
  • the above room display is information about a virtual room, that is, information about a conference or lecture, for example, conference theme, conference start time, conference participant information, conference participant number, monitor number (number of listeners), etc. Are displayed as a list on the browser screen of the client terminal.
  • the above room selection means is for selecting information on the virtual rooms displayed in a list, such as a room number and a room name, by a mouse click operation or a touch panel operation.
  • the voice data receiving means described above receives voice data distributed from a server as streaming data via a network such as the Internet.
  • the voice data to be delivered is delivered to all the client terminals that have selected the same room without processing the voice data transmitted from the individual speaker terminals in the room.
  • the voice synthesis data obtained by synthesizing the voice data transmitted from the individual speaker terminals in the room by the server may be distributed to all the client terminals that select the same room.
  • the above audio output means is a built-in or external speaker or earphone in the client terminal.
  • the client terminal when the client terminal is a room owner terminal that has generated a virtual room, room registration means for transmitting and registering virtual room attribute information to the server, and the collected voice as server data And a terminal attribute switching means for changing a client terminal as a listener to a speaker terminal or switching a speaker terminal to a listener terminal.
  • the room owner terminal is a room manager who can create a room, register room attribute information, and delete a room.
  • the room owner terminal can speak as well as the speaker terminal, and transmits voice data to the server.
  • the client terminal as a listener can be changed to a speaker terminal, or the speaker terminal can be switched to a listener terminal, and plays the role of a conference facilitator.
  • the room owner When a user who desires a room owner creates a room and the user who created the room logs in to the created room, the room owner automatically behaves as a room owner terminal. Further, there is a case where the room owner terminal is absent by automatically generating a room on the server side instead of the room owner terminal.
  • the client terminal includes evaluation data input means for inputting evaluation data for the voice data, evaluation data transmission means for transmitting the input evaluation data to the server, and evaluation data for the virtual room evaluation data.
  • Count value display means The server further includes room evaluation count distribution means for counting the number of evaluation data for each virtual room and transmitting the evaluation data count value for each virtual room to the client terminal.
  • the client terminal further includes a display unit for displaying time transition information of the evaluation data of the virtual room, and the server stores the evaluation data stored along the timeline of the voice data for each virtual room.
  • the room evaluation time transition information distribution means for transmitting the time transition information to the client terminal is further provided.
  • the evaluation data input means is, for example, an evaluation button displayed on the screen of the client terminal. By pressing the button, the evaluation data can be transmitted to the server through the network at predetermined intervals. It can be done.
  • the client terminal presses the evaluation button when the listener or the speaker himself tunes or agrees with the utterance content according to the progress of the conference call.
  • the name of the evaluation button can be set freely such as “good”, “like”, “satisfied”, “interested”, “interested”, and more specifically, “bad”, “nice”, “scary” , “Thrill”, “dislike”, “match”, “do not suit”, “fun”, “good”, “poor”, “impressed”, “want”, “do not want”, “approve”, “ An expression including either “opposite” may be used. What is necessary is just to select suitably according to the content of a conference call, respectively.
  • the evaluation data transmitting means transmits the input evaluation data to the server.
  • the virtual room selection information is, for example, a unique identification number of a virtual room selected from a list.
  • the room information includes a room name, a room owner, a room content, a room start time, and the like.
  • User information is registered for room owners and speakers.
  • User information includes name, age, gender, occupation, hobby, date of birth, zodiac, blood type, marriage history, family composition, birthplace, child age, worries, worries, future dreams, and past evaluation data
  • the above-mentioned user information registration means include name, age, sex, occupation, hobby, date of birth, zodiac, blood type, marriage history, family composition, birthplace, child age, worries, worries, Future dreams, content information that sent past evaluation data, etc. are input from the screen of the client terminal.
  • the voice data transmitting means is a means for voice data being converted into data packets and transmitted to the server.
  • the server includes means for storing virtual room attribute information (room attribute storage means), means for receiving voice data from a speaker terminal (voice data receiving means), and voice data received from a client terminal via a network. Are provided for each virtual room, and voice data in the same virtual room is transmitted as voice data to the client terminal that has selected the virtual room (voice data distribution means).
  • the above-mentioned room attribute storage means refers to, for example, virtual room attribute information (virtual room category, keywords and explanations indicating the contents of the virtual room, the maximum number of people who can participate in the virtual room, etc.) It is stored as a table.
  • the virtual room attribute information includes the virtual room owner information, language, virtual room category, keywords and explanations indicating the contents of the virtual room, the maximum number of people who can participate in the virtual room, and public / private status. Information, live status / recording status information.
  • the virtual room owner information is user information of the client terminal that created the virtual room on the server.
  • the voice data received from the client terminal is classified for each virtual room because the identification number of the currently selected virtual room is sent from the client terminal together with the voice data or first. Based on this, the voice data is associated with the selected virtual room.
  • the audio data associated with the virtual room is transmitted as streaming data to all client terminals that have selected the virtual room based on the received virtual room selection information by the audio data distribution means.
  • the listener terminal does not necessarily have to register user information in the server. Since the user information does not necessarily have to be registered in the server, it is possible to listen to the conference call just like listening to the radio, just as if the listener terminal selects the room as if selecting the radio station with the tuner. However, if the observer terminal registers user information in the server, the user information can be associated with the evaluation data. If the observer terminal registers the user information, the user information can be linked to the inputted evaluation data, and an attribute is added to the evaluation data, thereby increasing the utility value.
  • a participation expression input means that can participate in the room as a speaker terminal, and when the participation expression is transmitted to the server
  • the server sends an inquiry to the room owner terminal of the virtual room by sending the user information stated to participate, and if the room owner terminal of the virtual room permits, the server utters the client terminal of the observer who expressed the participation.
  • Participation permission means for changing to a person terminal.
  • the client terminal is a user information registration means for registering user information in the server.
  • the user information After the user information is registered in the server, when the user selects a virtual room and connects to the server, It further comprises icon display means for displaying icons and user information on the virtual room screens of all client terminals that have selected the room.
  • the icon is a small picture displayed on the screen. Icon designs include user photos and avatars.
  • the user information is displayed in the vicinity of the icon, for example, in the vicinity of the icon, or overlapped with the icon, so that other users can easily recognize that the icon pattern is associated with the user information.
  • the user information is information of name and location, and is displayed in one or two lines with short characters of about 20 characters.
  • the icon and user information of the user who speaks in the virtual room are displayed in the first screen area, and the user who only listens in the virtual room
  • icons and user information are displayed in the second screen area
  • the second screen area is displayed as an area surrounding the first image area.
  • the second screen area is displayed as an area surrounding the first image area.
  • the first screen area is a circle-shaped area in the center of the screen
  • the second screen area is the first area. It is displayed as an area of the entire screen (other than the circle) surrounding the circle of the image area.
  • the server displays the total number of client terminals that are selecting a virtual room and the total number of client terminals that are selecting a virtual room and registered user information to the client terminals connected to the virtual room.
  • a terminal total number transmission means for transmitting is further provided, and the client terminal further includes a terminal total number display means for displaying at least the total number of client terminals currently selecting the virtual room. How many listeners are present is an important factor for the evaluation of conversation content in the room. In the voice link system, since the total number of client terminals that are selecting virtual rooms on the server can be grasped, this information is displayed on the screen of the client terminal. If a room is selected on the client terminal, only the total number of client terminals in the selected room is sufficient. However, if you want to display the room attributes with the number of listeners on the room selection menu, It is necessary to display the number of observers.
  • the client terminal to be operated is When the user is changed to the speaker of the virtual room, the icon of the client terminal in the first screen area is selected, and an operation for moving the icon to the second image area is input, the client terminal to be operated is Changed from a room speaker to a listener.
  • the client terminal to be operated is Changed from a room speaker to a listener.
  • the user of the icon can participate as a speaker.
  • the user of the icon can be changed from a speaker to a listener. Since the room owner has a role of facilitating conversation, the room owner is given authority such as who is to be the speaker.
  • the server when the server selects an icon and inputs evaluation data on the virtual room screen of the client terminal, the integrated number of evaluation data with respect to the user information of the selected icon Is further provided with an evaluation data accumulated number associating means.
  • the number of evaluation data input from a client terminal in which user information is registered is the number of evaluation data input from a client terminal in which user information is not registered.
  • N the number of evaluation data input from a client terminal in which user information is not registered.
  • the voice data collected from the microphone means of the client terminal participating in the virtual room can be muted by an operation input from the client terminal of the virtual room owner.
  • the icon on the client terminal screen is preferably a real-time video or a pre-recorded video from the Web camera of the client terminal. This is because discussions can be made in more realistic situations.
  • the server in the voice link system of the present invention changes at least one of the size, icon shape, and icon frame color of the icon image corresponding to the terminal when receiving voice data from the room owner terminal or the speaker terminal. It is preferable to make it.
  • the listener can grasp which user is speaking.
  • the display means of the evaluation data degree in the client terminal of the voice link system of the present invention when the evaluation data degree is expressed by the size of the drawing object, and the evaluation data input is continuously performed within a predetermined time, It is preferable to increase the size of the drawing object shape. By increasing the size of the drawing object shape according to the degree of evaluation data, the user can visually grasp the evaluation degree.
  • the drawing representing the degree of the evaluation data in the screen display area overlapping or adjacent to the icon of the client terminal for inputting the evaluation data It is preferable that the object becomes larger, the drawing object moves toward the selected icon, the drawing object is absorbed by the selected icon, and displayed so that the drawing object disappears. Thereby, the operator who inputs the evaluation data can give the evaluation data to the specific user, and can visually grasp whether or not the evaluation data is given to the specific user. .
  • the voice link system of the present invention it is possible to construct a new type of social network service system that can specialize in voice and enjoy conversation in a space on the Web.
  • the conversation can be widely distributed by capturing an unspecified number of listeners like television and radio.
  • the conversation evaluation data can be visually shown along the timeline.
  • Example of system configuration diagram of voice link system Room screen List of rooms Illustration of evaluation data along the timeline of audio data
  • Example of room screen Other display examples of the room screen (1) Other display examples of the room screen (2)
  • Other display examples of the room screen (3)
  • Room registration window screen (1)
  • Room registration window screen (2)
  • FIG. 1 shows a configuration diagram of the voice link system of the first embodiment.
  • the voice link system according to the first embodiment includes one server T 0 , five speaker terminals (T 1 to T 5 ), and four listener terminals (M 1 to M 4). ) Is connected to the Internet.
  • the server T 0 then synthesizes the audio data signals D 1 to D 5 sent from the speaker terminals (T 1 to T 5 ).
  • the synthesized voice data signal Dc is transmitted to all five speaker terminals (T 1 to T 5 ) and all four listener terminals (M 1 to M 4 ).
  • the server T 0 does not synthesize the voice data signals D 1 to D 5 sent from the speaker terminals (T 1 to T 5 ), and directly synthesizes the voice data signals D 1 to D 5 for all five utterances. May be transmitted to the listener terminal (T 1 to T 5 ) and all four listener terminals (M 1 to M 4 ).
  • the listener terminals (M 1 to M 4 ) can listen to the conversation after transmitting a listener request (MR 1 to MR 4 ) to the server T 0 .
  • the listener terminals (M 1 to M 4 ) can transmit the evaluation data (S 1 to S 4 ) of the conversation content.
  • the listener terminals (M 1 to M 4 ) are divided into two types: registered users who have registered user information and unregistered users who have not registered user information.
  • Registered user refers to user information (for example, name, age, gender, occupation, hobby, date of birth, zodiac, blood type, marriage history, family structure, birthplace, child age, worries, worries) , Any or all selected from a group of users' own information such as future dreams, etc., but is not limited to this and may be added to any useful information as user information.
  • An unregistered user is a user who has not yet registered user information with the server.
  • a registered user can be a room owner or a speaker if desired. If the user is a registered user, user information can be associated with evaluation data, as will be described later. Furthermore, if it is a registered user, it may be possible to listen to a specific conversation that cannot be observed by an unregistered user. Further, FIG. 1 shows a situation where there are speaker terminals (T 1 to T 5 ), and five speakers T 1 to T 5 talk, but only one speaker speaks. You can give a lecture, rakugo, or speech.
  • a virtual room is constructed on a server.
  • the virtual room is a directory file of a server accessible via a network.
  • One registered user creates a virtual room and becomes the room owner.
  • information on the virtual room that is, information on conversation, conference, lecture, for example, information on the theme, start time, and room owner is registered in the server.
  • Information on these conversations is displayed on the client terminal and displayed on the room list screen.
  • the start time of a room to be observed may be reserved by a calendar function of a client terminal or server.
  • an alarm notification and a message notification are automatically displayed on the client terminal, and the user observes the conference call in real time. be able to.
  • the voice data of the conversation in the room passes through the server, it can be recorded on the server (may be another computer).
  • the server may be another computer.
  • the voice data received from the speaker terminal is sorted for each virtual room, and the voice data of the same virtual room is stored in association with the virtual room.
  • the identification number of the currently selected virtual room is sent from the speaker terminal together with the voice data or first, so the voice data is based on this identification number.
  • the server also distributes the audio data associated with the virtual room as streaming data to all client terminals that have selected the virtual room based on the received virtual room selection information.
  • FIG. 2 shows the configuration of the room screen of the voice link system.
  • the icon image of the speaker is displayed in the first screen area 10 and the icon image of the listener is displayed in the second screen area 12 on the room screen of the client terminal.
  • the number of observers and the total number of input evaluation data are displayed on the screen.
  • the first screen area 10 has a circle shape
  • the second screen area 12 is the entire screen surrounding the first screen area 10.
  • the shape may be a polygon, an ellipse, a rectangle, or any other free shape.
  • the second screen area 12 does not surround the first screen area 10, and the first screen area 10 and the second screen area 12 may be separated from each other.
  • icon images 10a to 10e of five speakers corresponding to the speaker terminals (T 1 to T 5 ) (photos and avatars) ( Figure) is displayed.
  • the number of images displayed changes according to the number of speaker terminals.
  • icon images 12a to 12d (photographs and avatar figures) of the observer corresponding to the observer terminal are displayed.
  • user information is registered for the listener.
  • dots corresponding to the number of unregistered observers are displayed on the ring of the second screen area 12. It may be displayed outside.
  • a participation expression button for expressing participation when the observer wants to speak is displayed (not shown in FIG. 2).
  • the attendance expression button is operated by the observer, the user information that the participation is expressed is transmitted to the room owner terminal of the corresponding virtual room, and only when the room owner permits, the virtual room of the observer who has expressed the participation is sent And the icon displayed in the second screen area 12 is moved and displayed as a speaker in the first image area 10.
  • the icon of the second screen area 12 is selected on the screen of the client terminal of the room owner of the virtual room and an operation for moving to the first image area 10 by mouse dragging or dragging with the touch panel is input,
  • the listener to be operated is changed to a speaker.
  • the operation target speaker is changed to a listener.
  • FIG. 3 is a list of rooms.
  • the list of rooms in addition to the room status (live / recording) 21, the room name 22, the room description 23, the room category 24, the language 25, the number of speakers 26, the number of monitors 27, the number of evaluation data 28, the usage time 29
  • the number of accesses 30 is displayed.
  • information useful for identifying a room such as the name of the room owner, may be added.
  • categories of conference call contents such as conference, conversation, debate, seminar, speech, and the like are displayed.
  • the language 25 displays the language spoken in the conference call, such as Japanese, English, Chinese, Korean.
  • the number of speaker terminals is displayed as the number of speakers 26, and the number of listener terminals is displayed as the number of monitors 27.
  • the server counts the number of speakers and monitors in real time, and sends the count value to the client terminal.
  • the evaluation data number 28 displays the total number of input evaluation data received by the server from the client terminal.
  • the usage time 29 displays the elapsed time from the start of the conversation, or the time from the start to the end when the conversation has already ended.
  • the access count 30 displays the total number of client terminals that have accessed the room.
  • FIG. 5 shows an example of the room screen, and individual display parts will be described below with reference to FIG.
  • reference numeral 41 denotes the above-mentioned first image area, which displays avatars or photographs 45a to 45e of five speakers.
  • the outside of the boundary line 40 around the outside of the first image area 41 is the above-described second image area, and the avatar of the user of the client terminal in which the user information is registered or photographs 48a to 48f are displayed. Yes.
  • an image of an unregistered user whose user information is not registered is displayed in a circle 49.
  • the volume of the number of listeners is displayed according to the number and size of the circles 49.
  • Reference numeral 50 denotes an area for displaying the number of input evaluation data as a line graph along the conversation timeline.
  • 51 represents the time transition of the number of input evaluation data
  • 52 represents the time transition of the number of listeners.
  • Reference numeral 53 represents the usage time of the virtual room as a bar graph. Visually grasp the conversation time used up to now and the remaining conversation time when the total time is known, such as when the maximum usage time of a virtual room is 180 minutes or when a conference call has already been recorded. Can do.
  • 54 is a start button
  • 55 is a stop button
  • 56 is a return button
  • 58 is an elapsed time display
  • 59 is a fast-forward button.
  • Reference numeral 60 indicates whether live or recording, and the number of monitors can be displayed.
  • 61 is the total number of evaluation data.
  • 62 is an e-mail activation button, and 63 is an activation button for another social network application.
  • the URL of the room can be linked to e-mail and social network applications.
  • 65 is a room in front of the list, and 66 is a button for moving to the next room.
  • Reference numeral 67 denotes an area where text can be input or an image can be displayed.
  • 70 to 77 are buttons for moving to the room list screen, notification, sign input, room creation, invitation screen for other users, follow screen, listener information display screen, and user information registration / display screen, respectively.
  • FIG. 6 shows the background in FIG.
  • the background of the room screen can be freely set by the room owner when creating the room.
  • the room screen shown in FIGS. 7 and 8 is partially changed from the room screen of FIG. 5 and the parts constituting the screen.
  • the function buttons at the bottom of the screen are iconified, and the monitor number display area is arranged at the upper right of the screen, not at the upper left of the screen.
  • the room list selects “Room List” on the left side of the screen to display the room list window from the left side of the screen, and the room list selects “Listener List” on the right side of the screen.
  • a listener list window for displaying user information and icons existing in the room registered as a user is displayed.
  • the left half of the screen is divided into “YES” areas and the right half of the screen is divided into “NO” areas.
  • the listener displayed as an icon to approve (YES) or disagree (NO) the utterance content, or to move and sort the icons.
  • the position information of the icon is known on the server side
  • the number of favor (YES) and the number of opposite (NO) can be calculated by the server.
  • the calculation results of the number of approval (YES) and the number of disagreement (NO) can be displayed on the screen by distributing to the client terminal.
  • the screen is divided into four (area A to area D). As a result, it is possible not only to agree (YES) / disagree (NO), but also to prepare up to four selection branches and move the icons to the four divided areas (area A to area D) for sorting. It becomes possible.
  • the necessary information is set in the room registration window.
  • the privacy setting is a setting to make a room public or private (only a specific user can listen to it). Specifically, a password is entered when a room is selected. is there.
  • the room name (Title), the room description (Description), the room start time (Set set your schedule).
  • the language used in the room, the room background (Room Skin), and the room icon (Room icon) are set.
  • FIG. 11 is a functional block diagram of the voice link system.
  • a client terminal 1 and a server 2 are connected by a network 3.
  • the client terminal 1 includes room selection means, voice data reception means, voice data output means, evaluation data input means, evaluation data transmission means, count value display means, evaluation data time transition information display means, user information registration means , Icon display means, terminal total number display means, participation expression input means, voice data transmission means, and room registration means.
  • the voice data transmission means and the room registration means are not provided in the listener terminal 1a.
  • the speaker terminal 1b includes voice data transmitting means.
  • the room owner terminal 1c includes room registration means.
  • the server 2 also includes room attribute storage means, audio data receiving means, audio data distribution means, room evaluation count distribution means, room evaluation time transition information distribution means, terminal total number transmission means, participation permission means, evaluation data integration number association. Means are provided.
  • the present invention is useful as a voice social network system using the Internet.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

 音声に特化し、Web上の空間で会話を楽しめる音声版のソーシャルネットワークサービスシステムを提供する。複数のクライアント端末と少なくとも1台のサーバーがネットワークを介して接続されるシステムである。サーバーは、仮想ルーム属性情報記憶手段と、クライアント端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを仮想ルームに関連付けして、当該仮想ルームを選択している全てのクライアント端末に配信する。

Description

ボイスリンクシステム
 本発明は、インターネットなどネットワークを介した音声版のソーシャルネットワークサービスシステム(以下、ボイスリンクシステムという)の技術に関するものである。
 一般的に、人を説得する力・ニュアンスを正確に伝える力は、文字よりも音声の方が圧倒的に勝っている。それ故、従来の文字主体のソーシャルメディアでは、その力に限界がある。そのため、音声の持つ力を十分に発揮できるWebアプリケーションが求められている。
 音声を主体とする従来の会議通話システムは、複数の通信端末間を接続するネットワークが存在し、それにより通信端末は通話やその他の通信イベントにより相互に情報を送受信できる。このようなデータ伝送に適した代表的なネットワークとして、インターネットが知られている。インターネットにおいて、音声データを伝送するのに利用されるプロトコルは、Voice over IP(VoIP)と呼ばれる。VoIPは、インターネット、あるいはIP(インターネット・プロトコル)ベースのネットワークを介する音声会話のルーティングを行うものである。
 従来の会議通話システムの場合、2台以上のクライアント端末が会議通話を行うとすると、それぞれのクライアント端末の音声データ信号をサーバーに送信し、サーバーがそれぞれのクライアント端末から送られた音声データ信号を合成する。合成された音声データ信号はそれぞれのクライアント端末に送信される。この場合、サーバーは、会議へ参加するクライアント端末以外に、ネットワーク上に存在する会議の傍聴者のクライアント端末に対しても、合成した音声データ信号を送信することができる。ここで、傍聴者とは、会議通話を聞くだけで、発話を行わない者を意味する。
 上記のような会議通話において合成した音声データ信号は、そのままファイルとしてサーバーコンピュータに保存され、必要に応じてクライアント端末に対して例えばストリーミングデータファイルとして送信される。
 しかしながら、従来の会議通話システムでは、会議通話内容を多くの傍聴者に聞かせる仕組みが十分ではない。また、傍聴者が興味ある会議通話内容を見出す仕組みも十分ではない。上述したように、従来の文字主体のソーシャルメディアでは、その力に限界があり、音声の持つ力を十分に発揮できるソーシャルメディアシステムが熱望されている。
 テレビ番組でも人気が高い深夜から朝方まで討論し合う某討論番組などは、討論者は円卓テーブル等に着座してテーマに応じて自由に発言し、テーマ進行を管理する司会者というよりも、討論者の発言を促すような呼びかけを行うための取り纏め役の方が居て、討議内容を盛り上げている。そして、討議内容を聴講する傍聴者が存在し、討議テーブルの周囲の外側の客席に着座している。このような討論番組では、討論テーマについて討論者が自由に発言し、それらの発言内容をその場にいる傍聴者(第1のリスナー)やテレビ画面を通じてのテレビ視聴者(第2のリスナー)が聞いて、情報を共有する形態になっている。討論者は身振り手振りするが、基本的には着座したまま喋るだけである。スライドも使用する場面もあるが、殆ど必要としない。その場にいる傍聴者(第1のリスナー)やテレビ視聴者(第2のリスナー)は討議者の発言内容に興味がある。
 今後、インターネット上で各種の討議テーマについて議論される会議通話の機会(ディベート大会、ファン間の交流会、語学教育、1対1あるいは複数人での公開トーク、1対1あるいは複数人でのシークレットトークなどを含む)が益々増加することが予想される。また、インターネット上で各種の問題やテーマについて自らの考え等を自らの音声で発言していく機会(各種セミナー、講義、アーティストからファンへのメッセージ、落語などを含む)が益々増加することが予想される。それぞれの会議通話の場を、多くの傍聴者が聴講できる環境整備が要求されているのである。
特表2007-507190号公報 特開2005-269347号公報 特開2010-093479号公報
 上記状況に鑑みて、本発明は、音声に特化し、Web上の空間で会話を楽しめるソーシャルネットワークサービスシステムを提供することを目的とする。
 上記目的を達成すべく、本発明のボイスリンクシステムは、複数のクライアント端末と少なくとも1台のサーバーがネットワークを介して接続されるシステムであって、
 クライアント端末は、仮想ルームを選択するルーム選択手段と、選択された仮想ルームに関連付けされた音声データを受信する音声データ受信手段と、音声データを出力する音声データ出力手段とを備える。
 そして、クライアント端末が発話者端末の場合、更に、収音した音声を音声データとしてサーバーに送信する音声データ送信手段、を備える。
 また、サーバーは、仮想ルームの属性情報を記憶するルーム属性記憶手段と、発話者端末からの音声データを受信する音声データ受信手段と、ネットワークを介して発話者端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを、当該仮想ルームを選択したクライアント端末に送信する音声データ配信手段とを備える。
 本発明のボイスリンクシステムは、その名の如く、ボイス(声)をリンクする(繋げる)ことができるシステムである。本発明のボイスリンクシステムでは、ネットワークを介してクライアント端末から受信する音声データを配信するサーバー上に、“ルーム”と呼ばれる仮想的なルームを構築する。ここで、ルームは、複数人で討論する会議を行う会議室として利用できるのみならず、一人で講演を行うセミナールームの意味合いも含まれる。会議通話には、討論や打合せのみならず、講演や通常の会話が含まれる。
 本発明のボイスリンクシステムは、複数のクライアント端末と少なくとも1台のサーバーがネットワークを介して接続される。クライアント端末は、発話を行わない傍聴者としての傍聴者端末と、ルーム内で発話を行うことができる発話者端末に大きく大別される。傍聴者としてのクライアント端末の場合、サーバー上の仮想ルームの一覧を表示して、サーバー上の仮想ルームを選択する手段(ルーム選択手段)と、サーバー上の仮想ルームに関連付けされた音声データを受信する手段(音声データ受信手段)と、音声データを出力する手段(音声出力手段)を少なくとも備える。
 ここで、クライアント端末とは、モバイルコンピュータ、携帯電話、PC(Personal Computer)などインターネット・プロトコルを用いてパケットを転送するネットワークに接続できるコンピュータをいう。講演や演説のように一人の発話内容に複数の傍聴者がいるようなケースでは、発話者端末は1台であるが、通常の会議通話の場合、N台(Nは2以上)の発話者端末が存在する。また、傍聴者としてのクライアント端末は1台から無制限の台数(サーバーのリソースの制約に従う)になる。
 また、上記のルーム表示とは、仮想ルームに関する情報、すなわち、会議や講演に関する情報、例えば、会議テーマ、会議開始時間、会議参加者の情報、会議参加者数、モニター数(傍聴者数)などをクライアント端末のブラウザ画面にリストにして表示するものである。
 また、上記のルーム選択手段とは、一覧表示された仮想ルームに関する情報、例えば、ルーム番号やルーム名称などをマウスクリック操作やタッチパネル操作により選択するものである。
 また、上記の音声データ受信手段とは、サーバーから配信される音声データをストリーミングデータとしてインターネットなどのネットワークを介して受信するものである。ここで、配信される音声データは、ルームの個々の発話者端末から送信される音声データを加工せずにそのまま、同じルームを選択している全てのクライアント端末に配信するものである。また、ルームの個々の発話者端末から送信される音声データをサーバーで合成した音声合成データを同じルームを選択している全てのクライアント端末に配信するものであってもよい。
 また、上記の音声出力手段とは、クライアント端末に内蔵或いは外付けのスピーカーやイヤフォンである。
 本発明のボイスリンクシステムにおいて、クライアント端末が仮想ルームを生成したルームオーナー端末である場合、仮想ルームの属性情報をサーバーに送信して登録するルーム登録手段と、収音した音声を音声データとしてサーバーに送信する音声データ送信手段と、傍聴者としてのクライアント端末を発話者端末に変更、又は発話者端末を傍聴者端末に切替する端末属性切替手段を備える。
 ルームオーナー端末は、ルームの管理者であり、ルームを生成、ルームの属性情報の登録、ルームの削除を行うことができる。ルームオーナー端末は、発話者端末と同様に、発話することができ、音声データをサーバーに送信する。傍聴者としてのクライアント端末を発話者端末に変更、又は発話者端末を傍聴者端末に切替ることができ、会議の進行司会者的な役割を担う。
 ルームオーナーを希望するユーザーがルームを生成し、生成した当該ルームに、ルームを生成したユーザーがログインすると、自動的にルームオーナー端末として振る舞うことになる。
 また、ルームオーナー端末の代わりに、サーバー側でルームを自動生成しておくことにより、ルームオーナー端末が不在というケースも存在する。
 また、本発明のボイスリンクシステムにおいて、クライアント端末は、音声データに対する評価データを入力する評価データ入力手段と、入力された評価データをサーバーに送信する評価データ送信手段と、仮想ルームの評価データのカウント値の表示手段とを更に備える。そして、サーバーは、仮想ルーム毎に評価データの数をカウントして、仮想ルーム毎の評価データのカウント値をクライアント端末に送信するルーム評価カウント配信手段を更に備える。
 また、本発明のボイスリンクシステムにおいて、クライアント端末は、仮想ルームの評価データの時間推移情報の表示手段を更に備え、サーバーは、仮想ルーム毎に音声データのタイムラインに沿って保存された評価データの時間推移情報を、クライアント端末に送信するルーム評価時間推移情報配信手段を更に備える。
 ここで、上記の評価データ入力手段は、例えば、クライアント端末の画面上に表示された評価ボタンであり、該ボタン押下することにより、所定インターバル毎に評価データを、ネットワークを通じてサーバーに送信することができるものである。クライアント端末は会議通話の進行状況に応じて、傍聴者自身あるいは発話者自身が発話内容に同調もしくは賛同する場合、評価ボタンを押下する。評価ボタンの名称は、“良い”、“好き”、“満足”、“関心有り”、“興味有り”など自由に設定可能であり、更に言うと、“悪い”、“素敵”、“怖い”、“スリルがある”、“嫌い”、“似合う”、“似合わない”、“楽しい”、“上手”、“下手”、“感動”、“欲しい”、“欲しくない”、“賛成”、“反対”のいずれかを含む表現でもよい。それぞれ会議通話内容に応じて適宜選択すればよい。
 また、評価度合いが高いほど、評価ボタンの押下回数を多くするようにしてもよい。例えば、所定時間に2回以上、評価データを入力することにより評価合いが大きい評価データを入力できるというものでよい。例えば、15秒に1回しか評価データを入力できない場合、複数回、評価データを入力(例えば、何回もボタン押下)することにより、クライアント端末側で入力回数をカウントして、評価度合いの大きさを区別できるデータをサーバーに送信するものでもよい。また、“非常に良い”、“少しだけ良い”などの評価度合いの大小を区別するような選択ボタンを設けることでもよい。
 また、上記の評価データ送信手段とは、入力された評価データをサーバーに送信するものである。また、仮想ルームの選択情報とは、例えばリストから選択された仮想ルームのユニークな識別番号である。
 ここで、ルーム情報とは、ルームの名称、ルームオーナー、ルームの内容、ルーム開始時間などである。ルームオーナーや発話者にはユーザー情報を登録する。ユーザー情報とは、名前、年齢、性別、職業、趣味、生年月日、干支、血液型、婚歴、家族構成、出身地、子供の年齢、心配ごと、悩みごと、将来の夢、過去の評価データなどであり、上記のユーザー情報登録手段とは、名前、年齢、性別、職業、趣味、生年月日、干支、血液型、婚歴、家族構成、出身地、子供の年齢、心配ごと、悩みごと、将来の夢、過去の評価データを送信したコンテンツ情報などを、クライアント端末の画面から入力するものである。
 また、上記の音声データ送信手段とは、音声データをデータパケット化してサーバーに送信するものである。
 次に、本発明のボイスリンクシステムのサーバーについて説明する。
 サーバーは、仮想ルームの属性情報を記憶する手段(ルーム属性記憶手段)と、発話者端末からの音声データを受信する手段(音声データ受信手段)と、ネットワークを介してクライアント端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを、当該仮想ルームを選択したクライアント端末に音声データとして送信する手段(音声データ配信手段)を備える。
 上記のルーム属性記憶手段とは、例えば、仮想ルームの属性情報(仮想ルームのカテゴリ、仮想ルームの内容を表すキーワードや説明、仮想ルームへの参加可能最大人数など)をハードディスクのデータベースやメモリ上のテーブルとして記憶するものである。
 ここで、仮想ルームの属性情報とは、仮想ルームのオーナー情報、言語、仮想ルームのカテゴリ、仮想ルームの内容を表すキーワードや説明、仮想ルームへの参加可能最大人数、一般公開・非公開のステータス情報、ライブ状態・録音状態のステータス情報である。
 仮想ルームのオーナー情報とは、サーバーに仮想ルームを作成したクライアント端末のユーザー情報である。
 また、クライアント端末から受信する音声データを仮想ルーム毎に仕分けするとは、クライアント端末から現在選択している仮想ルームの識別番号が音声データと共に、あるいは、最初に送られてくるので、この識別番号に基づいて音声データを選択中の仮想ルームに関連付けすることをいう。
 また、上記の音声データ配信手段によって、受信した仮想ルームの選択情報に基づいて、仮想ルームに関連付けされた音声データを、当該仮想ルームを選択した全てのクライアント端末にストリーミングデータとして送信する。
 本発明のボイスリンクシステムにおいて、傍聴者用端末は、必ずしも、ユーザー情報をサーバーに登録する必要はない。必ずしもユーザー情報をサーバーに登録しなくてもよいので、あたかもラジオ局をチューナーで選択するように、傍聴者端末がルーム選択するようにするだけで、ラジオを聴くように、会議通話を傍聴できる。
 しかし、傍聴者端末がユーザー情報をサーバーに登録すれば、評価データにユーザー情報が関連付けできる。傍聴者端末がユーザー情報を登録すれば、入力した評価データにユーザー情報がリンクでき、評価データに属性が付加されて利用価値を高めることができる。
 また、上記のボイスリンクシステムにおいて、ユーザー情報が登録されている場合、傍聴者が発言を望む場合に発話者端末としてルームに参加できる参加表明入力手段を設け、参加表明をサーバーに送信した際に、サーバーは、当該仮想ルームのルームオーナー端末に対して、参加表明したユーザー情報を送信して問合せを行い、仮想ルームのルームオーナー端末が許可した場合に、参加表明した傍聴者のクライアント端末を発話者端末に変更する参加許諾手段を備える。
 これにより、傍聴者用端末は、ユーザー登録すれば、参加表明して一定条件下(例えば、ルームオーナーが許可した場合のみ)、発話者になることが可能になる。
 また、上記のボイスリンクシステムにおいて、クライアント端末は、ユーザー情報をサーバーに登録するユーザー情報登録手段、ユーザー情報がサーバーに登録された後、該ユーザーが仮想ルームを選択してサーバーに接続すると、仮想ルームを選択している全てのクライアント端末の仮想ルーム画面にアイコン及びユーザー情報を表示するアイコン表示手段とを更に備える。
 ここで、アイコンは、画面上に表示される小さな絵柄である。アイコンの図柄には、ユーザーの写真やアバタ―も含まれる。ユーザー情報は、アイコンの下側など近傍、或いは、アイコンと重ねて表示され、アイコンの絵柄とユーザー情報が関連していることが他のユーザーが把握し易いようにする。ユーザー情報は、氏名、地点の情報であり、20文字程度の短い文字で1段あるいは2段で表示する。
 ここで、クライアント端末の仮想ルーム画面にアイコン及びユーザー情報が表示される場合、仮想ルームで発話するユーザーのアイコン及びユーザー情報が第1の画面領域に表示され、仮想ルームで傍聴するだけのユーザーのアイコン及びユーザー情報が第2の画面領域に表示され、第2の画面領域が第1の画像領域の周囲を取り囲むエリアとして表示されることが好ましい。
 発話者の周辺を傍聴者が囲んでいるというイメージに合致するからである。
 第2の画面領域が第1の画像領域の周囲を取り囲むエリアとして表示されるとは、例えば、第1の画面領域が画面中央のサークル形状のエリアであり、第2の画面領域が第1の画像領域のサークルを取り囲む(サークル以外の)画面全体のエリアとして表示されることである。
 また、サーバーは、仮想ルームを選択中のクライアント端末の総数と、仮想ルームを選択中で、かつ、ユーザー情報を登録しているクライアント端末の総数を、当該仮想ルームに接続しているクライアント端末に送信する端末総数送信手段を更に備え、クライアント端末は、少なくとも仮想ルームを選択中のクライアント端末の総数を表示する端末総数表示手段を更に備える。
 何人の聴講者が存在するかは、ルーム内の会話コンテンツの評価にとって重要なファクターである。ボイスリンクシステムでは、サーバーで仮想ルームを選択中のクライアント端末の総数が把握できるので、この情報をクライアント端末の画面に表示させる。
 クライアント端末でルームを選択している場合は、選択しているルームのクライアント端末の総数だけでよいが、ルーム選択メニューにおいてルーム属性に傍聴者の人数を加えて表示させる場合は、個々のルームの傍聴者の人数を表示する必要がある。
 また、ルームオーナー端末の仮想ルーム画面において、第2の画面領域のクライアント端末のアイコンが選択され、第1の画像領域にアイコンを移動させる操作が入力された場合、操作対象のクライアント端末は、傍聴者から仮想ルームの発話者に変更され、第1の画面領域のクライアント端末のアイコンが選択され、第2の画像領域にアイコンを移動させる操作が入力された場合、操作対象のクライアント端末は、仮想ルームの発話者から傍聴者に変更される。
 ルームオーナー端末の仮想ルーム画面において、第2の画像領域のアイコンを第1の画像領域に移動されることで、そのアイコンのユーザーが発話者として参加することができる。また、反対に、第1の画像領域のアイコンを第2の画像領域に移動されることで、そのアイコンのユーザーが発話者から傍聴者に変更することができる。
 ルームオーナーは、会話の進行役の役割があるので、誰をいつ発話者にするかといった権限を付与している。
 また、本発明のボイスリンクシステムにおいて、サーバーは、クライアント端末の仮想ルーム画面において、アイコンを選択して評価データを入力した場合に、選択されたアイコンのユーザー情報に対して、評価データの積算数を関連付けする評価データ積算数関連付け手段を更に備える。
 ここで、評価データの積算数を関連付けする手段において、ユーザー情報が登録されたクライアント端末から入力された評価データの個数は、ユーザー情報が登録されていないクライアント端末から入力された評価データの個数を1とした場合、N(N>1)として重み付けを行うことが好ましい。
 例えば、重み付けのNが10とした場合、ユーザー情報が登録されていない傍聴者端末から受信した評価データの価値より、ユーザー情報が登録されたクライアント端末から受信した評価データの価値は10倍あることになる。
 また、本発明のボイスリンクシステムにおいて、仮想ルームに参加しているクライアント端末のマイク手段から集音した音声データは、仮想ルームのオーナーのクライアント端末からの操作入力によりミュートさせ得ることができる。
 本発明のボイスリンクシステムにおけるクライアント端末の画面上のアイコンは、クライアント端末のWebカメラからのリアルタイム映像若しくは予め録画した映像であることが好ましい。よりリアルな状況で討議が可能になるからである。
 また、本発明のボイスリンクシステムにおけるサーバーは、ルームオーナー端末または発話者端末から音声データを受信した際、当該端末に対応するアイコン画像のサイズ、アイコン形状、アイコン枠の色彩の少なくとも1つを変化させることが好ましい。
 アイコン画像のサイズ、アイコン形状、アイコン枠の色彩を、音声データに合せて動的に変化させることにより、どのユーザーが発言しているかを傍聴者が把握できるようにする。
 また、本発明のボイスリンクシステムのクライアント端末における評価データの度合いの表示手段において、評価データの度合いを描画オブジェクトのサイズで表現し、評価データ入力が所定時間内に連続して行われた場合、描画オブジェクト形状のサイズを大きくすることが好ましい。
 評価データの度合いに応じて、描画オブジェクト形状のサイズを大きくすることで、視覚的に評価度合いをユーザーが把握できるようにする。
 また、本発明のボイスリンクシステムのクライアント端末において、アイコンを選択して評価データを入力した場合、評価データ入力を行うクライアント端末のアイコンに重なる或いは隣接する画面表示エリアで、評価データ度合いを表す描画オブジェクトが大きくなり、選択されたアイコンに向かって描画オブジェクトが移動して、描画オブジェクトが選択されたアイコンに吸収され、描画オブジェクトが消滅するように表示されることが好ましい。
 これにより、評価データの入力操作者が、特定のユーザーに対して、評価データを付与することができ、また、評価データが特定のユーザーに付与されたか否かを視覚的に把握することができる。
 本発明のボイスリンクシステムによれば、音声に特化し、Web上の空間で会話を楽しめる新しいタイプのソーシャルネットワークサービスシステムを構築できる。
 また、テレビやラジオのように、不特定多数の傍聴者を取り込んで、会話を広く配信することができる。
 会話の評価データについて、タイムラインに沿って視覚的に示すことができる。
ボイスリンクシステムのシステム構成図の一例 ルーム画面 ルームの一覧リスト 音声データのタイムラインに沿った評価データの説明図 ルーム画面の一例 ルーム画面の他の表示例(1) ルーム画面の他の表示例(2) ルーム画面の他の表示例(3) ルーム登録ウィンドウ画面(1) ルーム登録ウィンドウ画面(2) ボイスリンクシステムの機能ブロック図
 以下、本発明の実施形態について、図面を参照しながら詳細に説明していく。なお、本発明の範囲は、以下の実施例や図示例に限定されるものではなく、幾多の変更及び変形が可能である。
 図1は、実施例1のボイスリンクシステムの構成図を示している。実施例1のボイスリンクシステムは、図1に示すように、1台のサーバーTと、5台の発話者端末(T~T)と4台の傍聴者端末(M~M)がインターネットで接続されている。会話に参加して発言する発話者端末(T~T)は、それぞれ音声データ信号(D~D)をサーバーTに送信する。そして、サーバーTは、発話者端末(T~T)から送られた音声データ信号D~Dを合成する。合成された音声データ信号Dcは、5台全ての発話者端末(T~T)と4台全ての傍聴者端末(M~M)に送信される。
 ここで、サーバーTは、発話者端末(T~T)から送られた音声データ信号D~Dを合成しないで、そのまま音声データ信号D~Dを5台全ての発話者端末(T~T)と4台全ての傍聴者端末(M~M)に送信してもよい。
 傍聴者端末(M~M)は、サーバーTに対して、リスナー要求(MR~MR)を送信した後で、会話を傍聴することができる。また、傍聴者端末(M~M)は、会話内容の評価データ(S~S)を送信することができる。
 ボイスリンクシステムでは、傍聴者端末(M~M)が、ユーザー情報を登録している登録ユーザーと、ユーザー情報を登録していない未登録ユーザーの2つに分けられる。登録ユーザーとは、サーバーに対してユーザー情報(例えば、名前、年齢、性別、職業、趣味、生年月日、干支、血液型、婚歴、家族構成、出身地、子供の年齢、心配ごと、悩みごと、将来の夢などのユーザー自身の情報の群から選択されるいずれか或いは全てであるが、これに限定されずユーザー情報として有用な情報であればこれらに加えてもよい。)を登録したユーザーであり、未登録ユーザーはサーバーに対して未だユーザー情報を登録していないユーザーである。
 登録ユーザーと未登録ユーザーの違いは、登録ユーザーであれば、ルームオーナーもしくは希望すれば発話者となり得ることである。また、登録ユーザーであれば、後述するように、評価データにユーザー情報を関連付けできる。さらに、登録ユーザーであれば、未登録ユーザーでは傍聴できない特定の会話を傍聴できるようにしてもかまわない。
 また、図1では、発話者端末(T~T)が存在し、T~Tの5名の発話者が会話を行う様子を示しているが、1人の発話者のみ発話する講演や落語やスピーチでもかまわない。
 ボイスリンクシステムでは、サーバー上に仮想ルームを構築する。仮想ルームは、具体的には、ネットワークを介してアクセス可能なサーバーのディレクトリファイルである。登録ユーザーの1人が仮想ルームを生成して、ルームオーナーになる。
 ここで、サーバー上に仮想ルームを構築する際、仮想ルームに関する情報、すなわち、会話、会議、講演に関する情報、例えば、テーマ、開始時間、ルームオーナーの情報をサーバーに登録する。
 これらの会話に関する情報は、クライアント端末に表示され、ルーム一覧画面に表示する。例えば、傍聴したいルームの開始時間をクライアント端末やサーバーのカレンダー機能により予約できるようにしてもよい。その場合、例えば、予約したルームの開始時間前(例えば、開始の5分前)になると、自身のクライアント端末にアラーム告知やメッセージ告知が自動的に表示され、ユーザーは会議通話をリアルタイムに傍聴することができる。
 ルーム内の会話の音声データは、サーバーを経由するので、サーバー(他のコンピュータであってもよい)に録音することができる。ルーム内の会話の音声データを録音することにより、再生して会話を傍聴することが可能になる。
 その際、評価データや発話者の情報も再生することで、会話内容を傍聴すると共に、傍聴者が会話内容に付加した情報も視覚的に情報として知ることができる。
 ボイスリンクシステムのサーバー側では、発話者端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを、仮想ルームに関連付けして保存する。音声データを仮想ルーム毎に仕分けするやり方としては、発話者端末から現在選択している仮想ルームの識別番号が音声データと共に、あるいは、最初に送られてくるので、この識別番号に基づいて音声データを仮想ルームに関連付けする。
 また、サーバーは、受信した仮想ルームの選択情報に基づいて、仮想ルームに関連付けされた音声データを、当該仮想ルームを選択している全てのクライアント端末にストリーミングデータとして配信する。
 図2は、ボイスリンクシステムのルーム画面の構成を示している。
 仮想ルームを選択した場合、クライアント端末のルーム画面上に、発話者のアイコンイメージが第1の画面領域10に表示され、傍聴者のアイコンイメージが第2の画面領域12に表示される。また図示しないが、画面上には傍聴者数、評価データの入力総数が表示される。図2では、第1の画面領域10がサークル形状で、第2の画面領域12が第1の画面領域10を取り囲む画面全体になっているが、これに限定されず、第1の画面領域10の形状は、多角形や楕円形、矩形、その他の自由な形状でもよい。また、第2の画面領域12が第1の画面領域10を取り囲むものではなく、第1の画面領域10と第2の画面領域12が離れていてもよい。
 図2に示すように、第1の画面領域10のサークル領域内には、発話者端末(T~T)に対応した5人の発話者のアイコンイメージ10a~10e(写真やアバタ―の図形)が表示されている。発話者端末の台数に応じて、表示されるイメージの数が変化する。また、第2の画面領域12の領域内には、傍聴者端末に対応した傍聴者のアイコンイメージ12a~12d(写真やアバタ―の図形)が表示されている。この場合、傍聴者は、ユーザー情報が登録されている。図2の画面では表示していないが、ユーザー情報が未登録の傍聴者の数をサーバー側で抽出できることから、未登録の傍聴者の個数に相当したドットを第2の画面領域12のリングの外側に表示させてもかまわない。
 ユーザー情報が登録されている傍聴者端末の画面上では、傍聴者が発言したい際に参加表明する参加表明ボタンが表示される(図2では省略)。傍聴者により、参加表明ボタンが操作された場合、該当する仮想ルームのルームオーナー端末に対して、参加表明したユーザー情報が送信され、ルームオーナーが許可した場合のみ参加表明した傍聴者の仮想ルームへの参加が許可され、第2の画面領域12に表示されたアイコンが、第1の画像領域10に発話者として移動して表示される。
 また、仮想ルームのルームオーナーのクライアント端末の画面上では、第2の画面領域12のアイコンが選択され、第1の画像領域10にマウスドラッグやタッチパネルによるドラッグにより移動させる操作が入力された場合、操作対象の傍聴者は、発話者に変更される。反対に、第1の画面領域10のアイコンが選択され、第2の画像領域12に移動させる操作が行われた場合、操作対象の発話者は傍聴者に変更される。
 図3は、ルームの一覧リストである。仮想ルームは、会話を行っているライブ状態のものと、既に会話が終了し録音されたものが存在する。ルームの一覧リストには、ルームのステータス(ライブ/録音)21に加え、ルーム名称22、ルーム説明23、ルームカテゴリ24、言語25、スピーカー数26、モニター数27、評価データ数28、使用時間29、アクセス数30が表示される。これ以外にルームのオーナー名などルームを判別するのに有用な情報を加えてもよい。
 ルームカテゴリ24には、会議、会話、ディベート、セミナー、スピーチなど会議通話内容のカテゴリが表示される。言語25には、日本語、英語、中国語、韓国語など会議通話で話される言語が表示される。スピーカー数26には発話者端末の台数が表示され、モニター数27には傍聴者端末の台数が表示される。これらのスピーカー数やモニター数はサーバーがリアルタイムにカウントして、そのカウント値をクライアント端末に送っている。評価データ数28には、サーバーがクライアント端末から受信した評価データの入力数の総数が表示される。使用時間29には、会話の開始からの経過時間、既に会話が終了している場合は、開始から終了までの時間が表示される。また、アクセス数30には、ルームにアクセスしたクライアント端末の台数の総和が表示される。
 図4に示すように、仮想ルームの発話の音声データに関して、ルームの開始からのタイムラインに沿った評価データのカウント数の分布があるとする。評価データのピークは1~4の4ヵ所存在し、それぞれ音声データの開始からI,I,I,I時間のポイントにあるとする。参加している傍聴者は、このタイムラインに沿った評価データ数を指標として、発話内容の評価度合いを把握することができる。
 図5はルーム画面の一例を示しており、図5を用いて個々の表示パーツを以下に説明する。図5における41は上述の第1の画像領域であり、5人のスピーカーのアバタ―もしくは写真45a~45eが表示されている。また、第1の画像領域41の外側周囲の境界線40より外側が上述の第2の画像領域であり、ユーザー情報が登録されたクライアント端末のユーザーのアバタ―もしくは写真48a~48fが表示されている。また、ユーザー情報が登録されていない未登録ユーザーのイメージがサークル49で表示されている。サークル49の数や大きさによって傍聴者数のボリュームを表示する。50は評価データの入力数を会話のタイムラインに沿って折れ線グラフで表示するエリアである。51は評価データの入力数の時間推移を表しており、52は傍聴者数の時間推移を表している。53は仮想ルームの使用時間を棒グラフで表している。仮想ルームの使用時間を最大で180分とした場合や既に録音済みの会議通話の場合などトータル時間が分かっている場合に、現在まで使用した会話時間と残りの会話時間を視覚的に把握することができる。録音された会話データに対して、54はスタートボタンであり、55はストップボタン、56は戻しボタン、58は経過時間表示、59は早送りボタンである。また、60はライブか録音かの表示で、モニター数を表示できる。61は評価データ総数である。62は電子メールの起動ボタンであり、63は他のソーシャルネットアプリケーションの起動ボタンである。電子メールやソーシャルネットアプリケーションにルームのURLを渡しで連携できるようになっている。65は一覧リストの前のルーム、66は後のルームへの移動ボタンである。67はテキスト入力できるエリアもしくはイメージを表示できるエリアである。70~77は、それぞれルーム一覧画面への移動ボタン、通知、サイン入力、ルーム作成、他のユーザーへの招待画面、フォロー画面、リスナー情報表示画面、ユーザー情報登録・表示画面のボタンである。
 図6~8は、ルーム画面の他の一例を示している。
 図6は、図5において背景が入れ替わったものである。ルーム画面の背景はルームオーナーがルームの生成時に自由に設定することができる。
 また、図7,8に示すルーム画面は、図5のルーム画面と画面を構成するパーツが一部変更されている。図7,8に示すルーム画面では、画面下部の機能ボタンがアイコン化され、モニター数表示エリアが画面左上ではなく画面右上に配置されている。また、図7,8に示すルーム画面では、ルーム一覧が画面左の「Room List」を選択することで画面左側からルーム一覧ウィンドウが表示され、ルーム一覧が画面右の「Listener List」を選択することで、ユーザー登録されている当該ルーム内に存在するユーザー情報とアイコンを表示するリスナーリストウィンドウが表示される。
 また、図8に示すルーム画面は、画面左半分が「YES」領域、画面右半分が「NO」領域に分れている。これにより、例えば、アイコン表示されている傍聴者が、発話内容に賛成(YES)するか、反対(NO)するか、アイコンを移動させて仕分けることが可能となる。アイコンの位置情報は、サーバー側でわかるので、賛成(YES)の人数、反対(NO)の人数をサーバーで計算することができる。賛成(YES)の人数、反対(NO)の人数の計算結果は、クライアント端末に配信することで、画面上に表示できる。
 さらに、図8に示すルーム画面では、画面を4分割(領域A~領域D)に分けている。これにより、賛成(YES)/反対(NO)だけでなく、4つまでの選択枝を用意して、4分割された個々の領域(領域A~領域D)にアイコンを移動させて仕分けることが可能となる。
 また、図9,10は、ルーム登録ウィンドウの一例を示している。ルームを生成する際は、ルーム登録ウィンドウに必要な情報を設定する。
 例えば、プライバシーに関する設定は、ルームを公開するか非公開(特定のユーザーのみが傍聴可能なもの)にするかの設定であり、具体的には、ルームを選択する際にパスワード入力されるものである。
 また、ルーム名称(Title)、ルーム説明(Description)、ルーム開始時間(Set
your Schedule)を設定する。さらに、図10に示すように、ルーム内で使用する言語、ルームの背景(Room Skin)、ルームアイコン(Room icon)を設定する。
 また、図11は、ボイスリンクシステムの機能ブロック図である。
 クライアント端末1とサーバー2がネットワーク3で接続されている。クライアント端末1には、ルーム選択手段、音声データ受信手段、音声データ出力手段、評価データ入力手段、評価データ送信手段、カウント値の表示手段、評価データの時間推移情報の表示手段、ユーザー情報登録手段、アイコン表示手段、端末総数表示手段、参加表明入力手段、音声データ送信手段、ルーム登録手段が設けられている。
 この内、音声データ送信手段、ルーム登録手段は、傍聴者端末1aには備わっていない。
 発話者端末1bには、傍聴者端末1aの機能に加えて、音声データ送信手段が備わっている。また、ルームオーナー端末1cには、発話者端末1bの機能に加えて、ルーム登録手段が備わっている。
 また、サーバー2には、ルーム属性記憶手段、音声データ受信手段、音声データ配信手段、ルーム評価カウント配信手段、ルーム評価時間推移情報配信手段、端末総数送信手段、参加許諾手段、評価データ積算数関連付け手段が設けられている。
 本発明は、インターネットを利用した音声版ソーシャルネットワークシステムとして有用である。
 1 クライアント端末
 1a 傍聴者端末
 1b 発話者端末
 1c ルームオーナー端末
 2  サーバー
 3  ネットワーク
 T  サーバー
 T~T 発話者端末
 M~M 傍聴者端末
 D~D,Dc 音声データ信号
 S~S  評価データ

Claims (20)

  1.  複数のクライアント端末と少なくとも1台のサーバーがネットワークを介して接続されるシステムであって、
    1)クライアント端末は、
     仮想ルームを選択するルーム選択手段と、
     選択された仮想ルームに関連付けされた音声データを受信する音声データ受信手段と、
     音声データを出力する音声データ出力手段と、
    を備え、
     クライアント端末が発話者端末の場合、更に、
     収音した音声を音声データとしてサーバーに送信する音声データ送信手段、を備え、
    2)サーバーは、
     仮想ルームの属性情報を記憶するルーム属性記憶手段と、
     発話者端末からの音声データを受信する音声データ受信手段と、
     ネットワークを介して発話者端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを、当該仮想ルームを選択したクライアント端末に送信する音声データ配信手段と、
     を備えたことを特徴とするボイスリンクシステム。
  2.  クライアント端末が仮想ルームを生成したルームオーナー端末である場合、
     仮想ルームの属性情報をサーバーに送信して登録するルーム登録手段と、
     収音した音声を音声データとしてサーバーに送信する音声データ送信手段と、
     クライアント端末を発話者端末に変更、又は発話者端末を傍聴者端末に切替する端末属性切替手段と、
     を備えたことを特徴とする請求項1に記載のボイスリンクシステム。
  3.  クライアント端末は、
     音声データに対する評価データを入力する評価データ入力手段と、
     入力された評価データをサーバーに送信する評価データ送信手段と、
     仮想ルームの評価データのカウント値の表示手段と、
     を更に備え、
     サーバーは、
     仮想ルーム毎に評価データの数をカウントして、仮想ルーム毎の評価データのカウント値をクライアント端末に送信するルーム評価カウント配信手段、
     を更に備えたことを特徴とする請求項1又は2に記載のボイスリンクシステム。
  4.  クライアント端末は、
     仮想ルームの評価データの時間推移情報の表示手段、
     を更に備え、
     サーバーは、
     仮想ルーム毎に音声データのタイムラインに沿って保存された評価データの時間推移情報を、クライアント端末に送信するルーム評価時間推移情報配信手段と、
     を更に備えたことを特徴とする請求項3に記載のボイスリンクシステム。
  5.  クライアント端末は、
     ユーザー情報をサーバーに登録するユーザー情報登録手段、
     ユーザー情報がサーバーに登録された後、該ユーザーが仮想ルームを選択してサーバーに接続すると、仮想ルームを選択している全てのクライアント端末の仮想ルーム画面にアイコン及びユーザー情報を表示するアイコン表示手段と、
     を更に備えたことを特徴とする請求項1~4のいずれかに記載のボイスリンクシステム。
  6.  クライアント端末の仮想ルーム画面にアイコン及びユーザー情報が表示される場合、
     仮想ルームで発話するユーザーのアイコン及びユーザー情報が第1の画面領域に表示され、
     仮想ルームで傍聴するだけのユーザーのアイコン及びユーザー情報が第2の画面領域に表示され、
     第2の画面領域が第1の画像領域の周囲を取り囲むエリアとして表示される、
    ことを特徴とする請求項5に記載のボイスリンクシステム。
  7.  サーバーは、
     仮想ルームを選択中のクライアント端末の総数と、
     仮想ルームを選択中で、かつ、ユーザー情報を登録しているクライアント端末の総数を、
     当該仮想ルームに接続しているクライアント端末に送信する端末総数送信手段を更に備え、
     クライアント端末は、
     少なくとも仮想ルームを選択中のクライアント端末の総数を表示する端末総数表示手段を更に備えたことを特徴とする請求項6に記載のボイスリンクシステム。
  8.  ルームオーナー端末の仮想ルーム画面において、
     前記第2の画面領域のクライアント端末のアイコンが選択され、前記第1の画像領域にアイコンを移動させる操作が入力された場合、
     操作対象のクライアント端末は、傍聴者から仮想ルームの発話者に変更され、
     前記第1の画面領域のクライアント端末のアイコンが選択され、前記第2の画像領域にアイコンを移動させる操作が入力された場合、
     操作対象のクライアント端末は、仮想ルームの発話者から傍聴者に変更される、
     ことを特徴とする請求項6に記載のボイスリンクシステム。
  9.  クライアント端末は、
     ユーザー情報が登録されている場合、
     傍聴者が発言を望む場合に発話者端末としてルームに参加できる参加表明入力手段を備え、
     参加表明入力手段は、参加表明をサーバーに送信し、
     サーバーは、当該仮想ルームのルームオーナー端末に対して、参加表明したユーザー情報を送信して問合せを行い、
     仮想ルームのルームオーナー端末が許可した場合に、参加表明した傍聴者のクライアント端末を発話者端末に変更する参加許諾手段、
     を備えたことを特徴とする請求項2に記載のボイスリンクシステム。
  10.  サーバーは、
     クライアント端末の仮想ルーム画面において、アイコンを選択して評価データを入力した場合に、選択されたアイコンのユーザー情報に対して、評価データの積算数を関連付けする評価データ積算数関連付け手段、
     を更に備えた、
     ことを特徴とする請求項5に記載のボイスリンクシステム。
  11.  評価データの積算数を関連付けする手段において、
     ユーザー情報が登録されたクライアント端末から入力された評価データの個数は、
     ユーザー情報が登録されていないクライアント端末から入力された評価データの個数を1とした場合、N(N>1)として重み付けを行う、
     ことを特徴とする請求項10に記載のボイスリンクシステム。
  12.  クライアント端末における評価データ入力手段において、
     評価度合いを入力する手段、
     若しくは、
     所定時間に2回以上、評価データを入力することにより評価度合いが大きい評価データを入力できる、
     ことを特徴とする請求項10又は11に記載のボイスリンクシステム。
  13.  前記ルーム属性記憶手段において、
     仮想ルームの属性情報は、
     仮想ルームのオーナー情報、言語、仮想ルームのカテゴリ、仮想ルームの内容を表すキーワードや説明、仮想ルームへの参加可能最大人数、一般公開・非公開の第1のステータス情報、ライブ状態・録音状態の第2のステータス情報、から選択される何れか或いは全てを含む、
     ことを特徴とする請求項1に記載のボイスリンクシステム。
  14.  前記ルーム選択手段において、
     選択対象の仮想ルームの一覧表示は、
     仮想ルームのルームオーナー情報、言語、仮想ルームのカテゴリ、仮想ルームの内容を表すキーワード、仮想ルームへの参加人数、モニター数、一般公開か非公開の表示、ライブ状態か録音状態の表示、から選択される何れか或いは全てを表示する、
     ことを特徴とする請求項1に記載のボイスリンクシステム。
  15.  仮想ルームの発話者端末から収音した音声データは、
     仮想ルームのルームオーナー端末からの操作入力によりミュートさせ得る、
     ことを特徴とする請求項2に記載のボイスリンクシステム。
     
  16.  前記アイコンは、クライアント端末のWebカメラからのリアルタイム映像若しくは予め録画した映像であることを特徴とする請求項5に記載のボイスリンクシステム。
  17.  サーバーは、ルームオーナー端末または発話者端末から音声データを受信した際、当該端末に対応するアイコン画像のサイズ、アイコン形状、アイコン枠の色彩の少なくとも1つを変化させることを特徴とする請求項5に記載のボイスリンクシステム。
  18.  クライアント端末における評価データの度合いの表示手段において、
     評価データの度合いを描画オブジェクトのサイズで表現し、
     評価データ入力が所定時間内に連続して行われた場合、描画オブジェクト形状のサイズを大きくすることを特徴とする請求項5に記載のボイスリンクシステム。
  19.  クライアント端末において、
     アイコンを選択して評価データを入力した場合、
     評価データ入力を行うクライアント端末のアイコンに重なる或いは隣接する画面表示エリアで、評価データ度合いを表す描画オブジェクトが大きくなり、選択されたアイコンに向かって描画オブジェクトが移動して、描画オブジェクトが選択されたアイコンに吸収され、描画オブジェクトが消滅するように表示されることを特徴とする請求項5に記載のボイスリンクシステム。
  20.  複数のクライアント端末と少なくとも1台のサーバーがネットワークを介して接続されるシステムであって、
    1)クライアント端末が傍聴者端末の場合、
     ユーザー情報をサーバーに登録する手段、
     サーバー上の仮想ルームを選択するルーム選択手段と、
     サーバー上の仮想ルームに関連付けされたストリーミングデータを受信するストリーミングデータ受信手段と、
     前記ストリーミングデータの音声を出力する音声出力手段と、
     前記ストリーミングデータに任意のタイミングで評価データを入力する評価データ入力手段と、
     仮想ルームの選択情報および入力された評価データをサーバーに送信する情報データ送信手段と、
     を備え、
    2)クライアント端末が発話者端末の場合、傍聴者端末が備える上記手段に加えて更に、
     マイク手段と、
     マイク手段から収音した音声データをサーバーに送信する音声データ送信手段と、
     を備え、
    3)クライアント端末がルームオーナー端末の場合、発話者端末が備える上記手段に加えて更に、
     サーバー上の仮想ルーム情報をサーバーに登録するルーム登録手段と、
     傍聴者端末を発話者端末に変更、或いは、発話者端末を傍聴者端末に切替する端末属性切替手段と、
     を備え、
    4)サーバーにおいて、
     仮想ルームの属性情報を記憶するルーム属性記憶手段と、
     発話者端末からの音声データを受信する音声データ受信手段と、
     ネットワークを介してクライアント端末から受信する音声データを仮想ルーム毎に仕分けし、同一仮想ルームの音声データを、当該仮想ルームを選択した全てのクライアント端末にストリーミングデータとして送信するストリーミングデータ送信手段と、
     を備え、
     ユーザー情報がサーバーに登録された後、該ユーザーが仮想ルームを選択してサーバーに接続すると、仮想ルームを選択している全てのクライアント端末の仮想ルーム画面にアイコン及びユーザー情報が表示され、
     仮想ルームにおいて発話者端末及びルームオーナー端末のユーザーのアイコン及びユーザー情報が第1の画面領域に表示され、
     仮想ルームにおいて傍聴者端末のユーザーのアイコン及びユーザー情報が第2の画面領域に表示され、
     第2の画面領域が第1の画像領域の周囲を取り囲むエリアとして表示される、
    ことを特徴とするボイスリンクシステム。
PCT/JP2012/007607 2011-11-27 2012-11-27 ボイスリンクシステム Ceased WO2013077000A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2013545804A JP6101973B2 (ja) 2011-11-27 2012-11-27 ボイスリンクシステム
US14/360,642 US20140325395A1 (en) 2011-11-27 2012-11-27 Voice link system
KR1020147017143A KR101659674B1 (ko) 2011-11-27 2012-11-27 보이스 링크 시스템
EP12850954.4A EP2787718A4 (en) 2011-11-27 2012-11-27 VOICE CONNECT SYSTEM
CN201280068171.7A CN104067602B (zh) 2011-11-27 2012-11-27 语音链接系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-258374 2011-11-27
JP2011258374 2011-11-27

Publications (1)

Publication Number Publication Date
WO2013077000A1 true WO2013077000A1 (ja) 2013-05-30

Family

ID=48469463

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/007607 Ceased WO2013077000A1 (ja) 2011-11-27 2012-11-27 ボイスリンクシステム

Country Status (6)

Country Link
US (1) US20140325395A1 (ja)
EP (1) EP2787718A4 (ja)
JP (1) JP6101973B2 (ja)
KR (1) KR101659674B1 (ja)
CN (1) CN104067602B (ja)
WO (1) WO2013077000A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575265A (zh) * 2014-05-01 2017-04-19 市桥贵弘 直播系统
JP2019036969A (ja) * 2018-09-13 2019-03-07 貴弘 市橋 ライブ放送システム
JP6875628B1 (ja) * 2020-12-25 2021-05-26 Tavern株式会社 Snsサーバ装置、プログラム及びアプリケーションプログラム
JP2022056108A (ja) * 2020-09-29 2022-04-08 ソフトバンク株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP2023183181A (ja) * 2022-06-15 2023-12-27 エヌ・ティ・ティ・コミュニケーションズ株式会社 会議画面表示制御装置、方法およびプログラム

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10164921B2 (en) * 2014-03-12 2018-12-25 Stephen Davies System and method for voice networking
USD753690S1 (en) * 2014-04-04 2016-04-12 Adp, Llc Display screen or portion thereof with graphical user interface
CN104333507B (zh) * 2014-11-11 2018-05-08 广州华多网络科技有限公司 一种基于交互应用的消息传输方法及其系统、服务设备
CN104363475B (zh) * 2014-11-14 2018-11-23 广州华多网络科技有限公司 一种观众分组关联的方法、装置和系统
CN105429771A (zh) * 2015-12-17 2016-03-23 合肥寰景信息技术有限公司 一种网络社区定向语音通信系统
CN105429770A (zh) * 2015-12-17 2016-03-23 合肥寰景信息技术有限公司 一种网络社区定向语音通信方法
CN106210027B (zh) * 2016-07-05 2019-05-31 广州华多网络科技有限公司 一种分布式系统中群语音权限控制方法、服务器及系统
JP6760797B2 (ja) * 2016-08-24 2020-09-23 Line株式会社 プログラム、情報処理方法、及び端末
US9930182B2 (en) * 2016-09-01 2018-03-27 Telekonnectors Limited Media server interaction in conferencing
US20180123986A1 (en) 2016-11-01 2018-05-03 Microsoft Technology Licensing, Llc Notification of a Communication Session in a Different User Experience
US10332523B2 (en) 2016-11-18 2019-06-25 Google Llc Virtual assistant identification of nearby computing devices
CN106648117B (zh) * 2017-01-25 2018-08-28 腾讯科技(深圳)有限公司 虚拟场景交互客户端中语音直播的实现方法和装置
USD877160S1 (en) 2018-01-30 2020-03-03 Magic Leap, Inc. Display panel or portion thereof with a transitional mixed reality graphical user interface
USD874478S1 (en) * 2018-01-30 2020-02-04 Magic Leap, Inc. Display panel or portion thereof with graphical user interface
USD872764S1 (en) 2018-03-16 2020-01-14 Magic Leap, Inc. Display panel or portion thereof with graphical user interface
USD892132S1 (en) * 2018-03-16 2020-08-04 Magic Leap, Inc. Display panel or portion thereof with a graphical user interface
CN109450658B (zh) * 2018-09-26 2021-10-22 谭诚训 基于互联网的研讨方法及系统
CN112202870A (zh) * 2020-09-27 2021-01-08 上汽通用五菱汽车股份有限公司 语音交互方法、车载无屏设备、服务器及存储介质
CN112511851B (zh) * 2020-11-20 2022-06-28 腾讯科技(深圳)有限公司 基于直播间的互动方法、装置、设备及可读存储介质
US12375623B2 (en) 2021-11-15 2025-07-29 Lemon Inc. Methods and systems for facilitating a collaborative work environment
US12166804B2 (en) 2021-11-15 2024-12-10 Lemon Inc. Methods and systems for facilitating a collaborative work environment
US12175431B2 (en) 2021-11-15 2024-12-24 Lemon Inc. Facilitating collaboration in a work environment
US12185026B2 (en) 2021-11-15 2024-12-31 Lemon Inc. Facilitating collaboration in a work environment
USD1082802S1 (en) * 2021-12-29 2025-07-08 Oomii Inc. Display system screen or portion thereof with a graphical user interface for mixed reality
WO2023234861A2 (en) * 2022-06-02 2023-12-07 Lemon Inc. Facilitating collaboration in a work environment
WO2024158070A1 (ko) * 2023-01-27 2024-08-02 주식회사 엔씨소프트 음성 채팅 서비스에서 발화자를 시각화하는 방법, 장치 및 컴퓨터-판독가능 기록매체

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10243110A (ja) * 1997-03-03 1998-09-11 Nec Eng Ltd 電話会議システム
JPH1188339A (ja) * 1997-09-04 1999-03-30 Matsushita Electric Ind Co Ltd Atm−pbxシステム
JP2004248145A (ja) * 2003-02-17 2004-09-02 Megachips System Solutions Inc 多地点通信システム
JP2005269347A (ja) 2004-03-19 2005-09-29 Nec Personal Products Co Ltd Ipネットワークを用いた多地点会議システムとその構成方法
WO2006051624A1 (ja) * 2004-11-10 2006-05-18 Fujitsu Limited コンテンツサーバ及びコンテンツサービスシステム
JP2007507190A (ja) 2003-05-24 2007-03-22 ジーティーエックス グローバル コーポレイション 会議システム
JP2008219297A (ja) * 2007-03-01 2008-09-18 Sharp Corp 1対多通信システム、送信権管理装置、送信権管理装置の制御方法、制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体
JP2010093479A (ja) 2008-10-07 2010-04-22 Panasonic Corp 会議システムおよび会議端末装置
JP2011041248A (ja) * 2009-03-30 2011-02-24 Avaya Inc グラフィカルな呼び接続表示で、コンタクト・センタを管理するシステムと方法。
JP2011066794A (ja) * 2009-09-18 2011-03-31 Sharp Corp 会議管理装置及び会議管理方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594688B2 (en) * 1993-10-01 2003-07-15 Collaboration Properties, Inc. Dedicated echo canceler for a workstation
US20020065635A1 (en) * 1999-12-02 2002-05-30 Joseph Lei Virtual reality room
CA2401106C (en) * 2000-03-03 2013-12-17 Qualcomm Incorporated Method and apparatus for participating in group communication services in an existing communication system
FI20000715A7 (fi) * 2000-03-28 2001-09-29 Creativesco Oy Ryhmätyömenetelmä ja -järjestelmä
US7124164B1 (en) * 2001-04-17 2006-10-17 Chemtob Helen J Method and apparatus for providing group interaction via communications networks
US8117281B2 (en) * 2006-11-02 2012-02-14 Addnclick, Inc. Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content
JP2003256552A (ja) * 2002-03-05 2003-09-12 Yamaha Corp 演奏者情報提供方法、サーバ、プログラムおよび記録媒体
JP2005109928A (ja) * 2003-09-30 2005-04-21 Dowango:Kk 電子会議システム及び電子会議管理方法
US7672864B2 (en) * 2004-01-09 2010-03-02 Ricoh Company Ltd. Generating and displaying level-of-interest values
US7730030B1 (en) * 2004-08-15 2010-06-01 Yongyong Xu Resource based virtual communities
US20060129633A1 (en) * 2004-12-14 2006-06-15 International Business Machines Corporation Mechanism to facilitate customization of real time messaging using mobile devices
KR100706086B1 (ko) * 2005-04-11 2007-04-11 에스케이 텔레콤주식회사 이동 화상 전화를 이용한 화상 회의 시스템 및 방법
WO2007051493A1 (en) * 2005-11-07 2007-05-10 Telecom Italia S.P.A. Method for managing a conference call in a telephone network
US7639672B2 (en) * 2006-07-18 2009-12-29 David Foote System and method for peer-to-peer internet communication
US20080034040A1 (en) * 2006-08-04 2008-02-07 Meebo, Inc. Method and system for embedded group communication
US8001472B2 (en) * 2006-09-21 2011-08-16 Apple Inc. Systems and methods for providing audio and visual cues via a portable electronic device
JP2009129386A (ja) * 2007-11-28 2009-06-11 Hitachi Ltd 配信方法、サーバ及び受信端末
US20100037151A1 (en) * 2008-08-08 2010-02-11 Ginger Ackerman Multi-media conferencing system
WO2010025343A1 (en) * 2008-08-28 2010-03-04 Jonas Lawrence A System for integrating multiple im networks and social networking websites
KR101010187B1 (ko) * 2009-02-04 2011-01-21 유승선 아이피 사설교환기에서 온라인회의를 제공하는 방법, 그를 위한 아이피 사설교환기, 그를 적용한 온라인회의 분산처리방법 및 그 시스템
WO2011038285A2 (en) * 2009-09-24 2011-03-31 etape Partners, LLC Three dimensional digitally rendered environments
US8775948B2 (en) * 2009-12-08 2014-07-08 International Business Machines Corporation Method for capturing collaborative, real-time feedback on socio-technical interactions in a virtual environment and graphically displaying the interaction patterns for later review
US9082106B2 (en) * 2010-04-30 2015-07-14 American Teleconferencing Services, Ltd. Conferencing system with graphical interface for participant survey
US20120017149A1 (en) * 2010-07-15 2012-01-19 Jeffrey Lai Video whisper sessions during online collaborative computing sessions

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10243110A (ja) * 1997-03-03 1998-09-11 Nec Eng Ltd 電話会議システム
JPH1188339A (ja) * 1997-09-04 1999-03-30 Matsushita Electric Ind Co Ltd Atm−pbxシステム
JP2004248145A (ja) * 2003-02-17 2004-09-02 Megachips System Solutions Inc 多地点通信システム
JP2007507190A (ja) 2003-05-24 2007-03-22 ジーティーエックス グローバル コーポレイション 会議システム
JP2005269347A (ja) 2004-03-19 2005-09-29 Nec Personal Products Co Ltd Ipネットワークを用いた多地点会議システムとその構成方法
WO2006051624A1 (ja) * 2004-11-10 2006-05-18 Fujitsu Limited コンテンツサーバ及びコンテンツサービスシステム
JP2008219297A (ja) * 2007-03-01 2008-09-18 Sharp Corp 1対多通信システム、送信権管理装置、送信権管理装置の制御方法、制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体
JP2010093479A (ja) 2008-10-07 2010-04-22 Panasonic Corp 会議システムおよび会議端末装置
JP2011041248A (ja) * 2009-03-30 2011-02-24 Avaya Inc グラフィカルな呼び接続表示で、コンタクト・センタを管理するシステムと方法。
JP2011066794A (ja) * 2009-09-18 2011-03-31 Sharp Corp 会議管理装置及び会議管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2787718A4

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575265A (zh) * 2014-05-01 2017-04-19 市桥贵弘 直播系统
JPWO2015166573A1 (ja) * 2014-05-01 2017-04-20 貴弘 市橋 ライブ放送システム
JP2019036969A (ja) * 2018-09-13 2019-03-07 貴弘 市橋 ライブ放送システム
JP2022056108A (ja) * 2020-09-29 2022-04-08 ソフトバンク株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP7152453B2 (ja) 2020-09-29 2022-10-12 ソフトバンク株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP6875628B1 (ja) * 2020-12-25 2021-05-26 Tavern株式会社 Snsサーバ装置、プログラム及びアプリケーションプログラム
WO2022138089A1 (ja) * 2020-12-25 2022-06-30 Tavern株式会社 Snsサーバ装置、プログラム及びアプリケーションプログラム
JP2022101712A (ja) * 2020-12-25 2022-07-07 Tavern株式会社 Snsサーバ装置、プログラム及びアプリケーションプログラム
JP2023183181A (ja) * 2022-06-15 2023-12-27 エヌ・ティ・ティ・コミュニケーションズ株式会社 会議画面表示制御装置、方法およびプログラム

Also Published As

Publication number Publication date
CN104067602A (zh) 2014-09-24
JPWO2013077000A1 (ja) 2015-04-27
KR20140097432A (ko) 2014-08-06
KR101659674B1 (ko) 2016-09-30
EP2787718A1 (en) 2014-10-08
JP6101973B2 (ja) 2017-03-29
EP2787718A4 (en) 2015-07-22
US20140325395A1 (en) 2014-10-30
CN104067602B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
JP6101973B2 (ja) ボイスリンクシステム
US12010156B1 (en) System and method of enabling a non-host, participant-initiated breakout session in a videoconferencing system, and displaying breakout session participants in a participant-initiated breakout session view
US12262145B2 (en) Integration of remote audio into a performance venue
CN104363476B (zh) 一种基于在线直播的组队活动方法、相关装置及系统
US6839417B2 (en) Method and apparatus for improved conference call management
JP4376525B2 (ja) 多地点通信システム
US20080252637A1 (en) Virtual reality-based teleconferencing
JP2002522998A (ja) インターネットおよびイントラネットを含むローカルおよびグローバルネットワークによるオーディオ会議用のコンピューター・アーキテクチャーおよびプロセス
KR20140138609A (ko) 무제한의 다이내믹한 적극적인 참가자들과의 비디오 회의
TWI222042B (en) Method of providing education services for free talk services
CN109788364B (zh) 视频通话互动方法、装置及电子设备
TW201141226A (en) Virtual conversing method
US9137029B1 (en) State and availability monitoring for customer support services for multimedia conferences
JP2003284018A (ja) テレビ会議システム、方法、および、テレビ会議サーバ
Patrick The human factors of MBone videoconferences: Recommendations for improving sessions and software
WO2013061389A1 (ja) 会議通話システム、コンテンツ表示システム、要約コンテンツ再生方法およびプログラム
JP6610076B2 (ja) 情報処理装置、情報処理システム、プログラム、及び記録媒体
Schatz et al. “What Are You Viewing?” Exploring the Pervasive Social TV Experience
JP2022016424A (ja) ストリーミング配信及びテレビ会議のためのシステム
Meng et al. Improving human connections and audience satisfaction in online concerts and music conferences
CN114629868B (zh) 适用于远程工作的多媒体群聊室通信方法和系统及智能终端
CN116980389A (zh) 会话处理方法、装置、计算机设备和计算机可读存储介质
Wuolio et al. On the potential of spatial audio in enhancing virtual user experiences
KR20250035322A (ko) 참석자의 경험을 개선하기 위한 온오프라인 믹스 영상 제공 장치 및 시스템
Huang et al. Service Scenario Example for Talk-Together TV System

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12850954

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
ENP Entry into the national phase

Ref document number: 2013545804

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14360642

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20147017143

Country of ref document: KR

Kind code of ref document: A