[go: up one dir, main page]

DE602005001940T2 - Verfahren und system zur erzeugung einer für eine menge von benutzern eines kommunikationsnetzes repräsentativen population - Google Patents

Verfahren und system zur erzeugung einer für eine menge von benutzern eines kommunikationsnetzes repräsentativen population Download PDF

Info

Publication number
DE602005001940T2
DE602005001940T2 DE602005001940T DE602005001940T DE602005001940T2 DE 602005001940 T2 DE602005001940 T2 DE 602005001940T2 DE 602005001940 T DE602005001940 T DE 602005001940T DE 602005001940 T DE602005001940 T DE 602005001940T DE 602005001940 T2 DE602005001940 T2 DE 602005001940T2
Authority
DE
Germany
Prior art keywords
users
population
location
during
reference population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602005001940T
Other languages
English (en)
Other versions
DE602005001940D1 (de
Inventor
Sunny Paris
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weborama
Original Assignee
Weborama
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weborama filed Critical Weborama
Publication of DE602005001940D1 publication Critical patent/DE602005001940D1/de
Application granted granted Critical
Publication of DE602005001940T2 publication Critical patent/DE602005001940T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

  • Das Anwendungsgebiet dieser Erfindung ist die Untersuchung von Verhaltensprofilen von Internetbenutzern oder Benutzern eines anderen Kommunikationsnetzwerks.
  • Die Erfindung betrifft im Spezielleren ein Verfahren und System, um zu gewährleisten, dass eine bekannte und qualifizierte Benutzerpopulation repräsentativ ist.
  • Internet-Dienstanbieter (engl.: Serviceprovider) einschließlich von Regierungskörperschaften, Werbetreibenden, elektronischen Händlern (engl.: e-traders), Softwareverlagen und im Allgemeineren Großhändlern für Multimediainhalte würden gerne die Multimediainhalte, die sie anbieten, als Funktion des Profils jedes Internet-Benutzers dynamisch anpassen, um deren Effizienz zu optimieren. Zum Beispiel würden sie gerne in der Lage sein, Werbeeinblendungen so anzuzeigen, dass sie zu dem Profil jedes Internet-Benutzers passen, der eine Stelle (engl.: site) besucht, oder um abhängig vom Typ des Internet-Benutzers unterschiedliche Produkte hervorzuheben.
  • Verfahren, um das Profil eines unbekannten Internet-Benutzers zu ermitteln (oder Profilerstellungsverfahren) sind bekannt, die üblicherweise eine Datenbasis verwenden, die Information über die Internet-Benutzer enthält, die Mitglieder einer sogenannten Referenzpopulation sind.
  • Das Dokument WO 02/33626 liefert ein Beispiel eines solchen Profilerstellungsverfahrens, gemäß dem eine aus Internet-Benutzern mit bekannten soziodemographischen Profilen gebildete Referenzpopulation verwendet wird, um Gruppen von unterscheidenden URL-Adressen für eine Gruppe von Attributen (zum Beispiel einschließlich Alter oder Geschlecht) zu ermitteln. Diese Gruppen von so ermittelten URL-Adressen können dann verwendet werden, um eine jedem Attribut zugeordnete Bewertung für einen unbekannten Internet-Benutzer zu ermitteln, wobei diese Bewertung als Funktion der URL-Adressen berechnet wird, die der unbekannte Internet-Benutzer angesehen hat.
  • Im Allgemeinen umfasst die Referenzpopulation freiwillige Internet-Benutzer, die zustimmen, diese betreffende Profilinformation (wie z.B. Alter, Geschlecht, sozial-berufliche Gruppe, Schwerpunkte des Interesses, Familiensituation, etc.) bereitzustellen.
  • Diese Referenzpopulation wird dann dahingehend qualifiziert, dass jedem ihrer Mitglieder Profildaten zugeordnet werden.
  • Diese Internet-Benutzer können zum Beispiel per Telefon gemäß soziodemographischen Kriterien rekrutiert werden, die als repräsentativ für eine globale Population betrachtet werden (zum Beispiel die Population von Internet-Benutzern in einem Land). Eine Überwachungssoftware (engl.: spyware) und ein Cookie (oder ein Verbindungsstandard) können an der Durchsuchstation (engl.: browsing station) jedes Benutzers der Referenz-Internet-Benutzerpopulation installiert werden.
  • Das Cookie enthält Identifikationsinformation für Internet-Benutzer.
  • Die Funktion der Überwachungssoftware besteht darin, von dem Internet-Benutzer vorgenommenes Suchvorgänge aufzuzeichnen, mit anderen Worten, die unterschiedlichen Stellen (Sites) oder Teile von Stellen (engl.: Parts of sites), die er während einer Zeitdauer auch besucht. Die Überwachungssoftware überträgt regelmäßig Information über den Suchverlauf von Mitgliedern der Referenzpopulation zu einem profilerstellenden System.
  • Es ist zu beachten, dass es auch möglich ist, Benutzer Fragen zu stellen, während sie suchen, um so diese betreffende soziodemographische Information zu erhalten.
  • Abhängig von den unterschiedlichen, von den Mitgliedern der Referenzpopulation besuchten Websites vermag das profilerstellende System dann statistisch das Profil von unbekannten Internet-Benutzern statistisch zu ermitteln, die eine Verbindung mit einer speziellen im Interesse stehenden Stelle (Site) herstellen.
  • Es ist klar verständlich, dass eine Profilerstellung mit hoher Qualität solange unmöglich ist, bis es eine ausreichend große und statistisch repräsentative Population einer Gruppe qualifizierter Internet-Benutzer verfügbar ist (zum Beispiel französische Internet-Benutzer oder Internet-Benutzer, die einen Browser in französisch verwenden, oder in der Nacht Verbindung herstellende Internet-Benutzer etc.).
  • Die Repräsentativität gewährleistet, dass das Verhalten eines bekannten Internet-Benutzers dem Verhalten von unbekannten Internet-Benutzern entspricht, von denen angenommen wird, dass sie von dem bekannten Internet-Benutzer repräsentiert werden.
  • Es ist verständlich, dass es relativ einfach ist, eine qualifizierte Population zu bilden, indem zum Beispiel Internet-Benutzer Fragen gestellt werden, während sie suchen, oder indem erreicht wird, dass sie, wie zuvor erwähnt, Software auf ihrem Computer installieren.
  • Es ist jedoch deutlich schwerer, zu gewährleisten, dass die betroffene Population repräsentativ ist.
  • Es gibt einen Unterschied zwischen der aus freiwilligen Internet-Benutzern zusammengesetzten Referenzpopulation und der realen Population, die sie repräsentieren soll.
  • Es ist darauf zu achten, dass eine Population, die einen Internet-Benutzer unter n Internet-Benutzern repräsentiert, als repräsentativ betrachtet werden kann, wenn im Mittel Internet-Benutzer in dieser repräsentativen Population bei n Besuchen jeder Stelle (Site) in einer Gruppe von im Interesse stehenden Stellen (Sites) einen Besuch macht.
  • Mit anderen Worten, der Anteil von Benutzermitgliedern der repräsentativen Population unter der Gruppe von repräsentierten Benutzern, die die Stelle (Site) während einer vorgegebenen Zeitdauer besucht haben, ist im Mittel für alle berücksichtigen im Interesse stehenden Stellen (Sites) gleich.
  • Ein Zweck der Erfindung besteht darin, ausgehend von einer qualifizierten Population eine repräsentative Population zu bilden.
  • Im Spezielleren besteht ein weiterer Zweck der Erfindung darin, zu gewährleisten, dass eine Referenzpopulation ausgehend von dieser einzelnen Referenzpopulation repräsentativ ist, insbesondere ohne dabei eine Rahmenstudie durchführen oder Profildaten verwenden zu müssen, die bekannte Benutzer in der Referenzpopulation betreffen.
  • Um dies zu erreichen, beschreibt die Erfindung gemäß einem ersten Aspekt der Erfindung ein Verfahren, eine Population, die für das Verhalten einer Gruppe von Benutzern eines Kommunikationsnetzwerks repräsentativ ist, ausgehend von einer Referenzpopulation zu erzeugen, die aus bekannten in einer Datenbasis aufgeführten Netzwerkbenutzern zusammengesetzt ist, welches dadurch gekennzeichnet ist, dass es die Schritte bestehend aus umfasst:
    Ermitteln für jede Stelle oder Teil einer Stelle in einer Gruppe von Stellen von Interesse, die über das Netzwerk verfügbar sind, die Anzahl von Benutzern (N(s)), die mit der Stelle oder dem Teil einer Stelle (s) während einer vorgegebenen Zeitdauer (T) verbunden sind, unter Verwendung eines Datenverkehrsanalysesystems, das zum Analysieren von Datenverkehr an Stellen von Interesse mit dem Netzwerk verbunden ist;
    Ermitteln für jede Stelle oder Teil einer Stelle einer theoretischen Anzahl (q ~(s)) von Benutzern, so dass das Verhältnis zwischen dieser theoretischen Anzahl (q ~(s)) von Benutzern und der Anzahl von Benutzern (N(s)), die mit der Stelle (s) während der vorgegebenen Zeitdauer (T) verbunden sind, an allen Stellen von Interesse gleich ist;
    Verwenden einer Verarbeitungseinrichtung, die mit der Datenbasis verbunden ist, um ausgehend von der Referenzpopulation eine Population bekannter Netzwerkbenutzer zu erzeugen, um an allen Stellen oder Teilen einer Stelle (s) den Unterschied zwischen der theoretischen Anzahl von Benutzern (q ~(s)) und der Anzahl von Benutzern (qn(s)) in der erzeugten Population zu minimieren, die mit der Stelle (s) während der Zeitdauer (T) verbunden sind.
  • Es ist zu beachten, dass der Ausdruck "Teil von Stellen" (engl.: Part of sites) in dieser Beschreibung eine Seite (engl.: Page) oder eine Gruppe von Seiten angibt, die zu der gleichen Stelle gehören und eine thematische Einheit für die Anwendung des Verfahrens bilden.
  • Die folgenden Aspekte sind bevorzugte, aber nicht einschränkende Aspekte der Verfahrens gemäß dem ersten Aspekt der Erfindung:
    eine Wichtung wird jedem bekannten Benutzer in der Referenzpopulation während des Schritts zugeordnet, ausgehend von der Referenzpopulation die Population bekannter Netzwerkbenutzer zu erzeugen;
    der Schritt, die Population zu erzeugen, wird iterativ wie folgt durchgeführt:
    die Benutzern in der Referenzpopulation zugeordneten Wichtungen werden während jeder Iteration variiert;
    für jede Iteration werden die so variierten Wichtungen verwendet, um ausgehend von der Referenzpopulation eine neue Population zu erzeugen;
    und für jede Iteration wird an allen Stellen (s) oder Teilen einer Stelle (s) der Unterschied zwischen der theoretischen Anzahl (q ~(s)) von Benutzern und der Anzahl (qn(s)) von Benutzern in der so erzeugten neuen Population, die während der Zeitdauer (T) mit der Stelle (s) verbunden sind, ermittelt;
    wobei die Iterationen fortgesetzt werden, bis der Unterschied kleiner als ein vorgegebener Grenzwert ist, wobei die während der letzten Iteration erzeugte Population als für das Verhalten der Gruppe von Benutzern repräsentativ betrachtet wird.
    • – Während jeder Iteration ist die neu erzeugte Population eine Unterpopulation der Population, die durch zufälliges Wählen von Benutzern in der Referenzpopulation erhalten wird, wobei die Wahrscheinlichkeit, jeden Benutzer in der Referenzpopulation zu wählen, gleich der diesem zugeordneten Wichtung ist, wobei jeder so gewählte Internet-Benutzer vollständig in der erzeugten Population gezählt wird.
    • – Während jeder Iteration ist die neu erzeugte Population eine Population mit genau der gleichen Größe wie die Referenzpopulation, wobei das Gewicht jedes Internet-Benutzers gleich der diesem zugeordneten Wichtung ist.
    • – Bei jeder Iteration wird die einem Benutzer in der Referenzpopulation zugeordnete Wichtung vergrößert, wenn er für eine vorgegebene Zeitdauer eine Verbindung mit Stellen hergestellt hat, für die die Anzahl von Benutzern in der Referenzpopulation, die mit diesen eine Verbindung hergestellt haben, kleiner als die theoretische Anzahl ist, wobei ansonsten die Wichtung verringert.
    • – Das Verfahren umfasst einen vorgelagerten Schritt, um von dem Datenverkehrsanalysesystem gesammelte Verkehrsdaten zu filtern, um nur die Daten zu berücksichtigen, die alle Benutzer betreffen, für die eine für das Verhalten repräsentative Population erzeugt werden soll.
  • Gemäß einem zweiten Aspekt betrifft die Erfindung auch ein System zum Erzeugen einer Population von Benutzern eines Kommunikationsnetzwerks, die für das Verhalten einer Gruppe von Netzwerkbenutzern repräsentativ ist, ausgehend von einer repräsentativen, aus bekannten Netzwerk-Benutzern zusammengesetzten Referenzpopulation, dadurch gekennzeichnet, dass es umfasst:
    ein Hauptrechner (101), der eine repräsentative Population erzeugt, ist mit dem Netzwerk verbunden und weist eine Verarbeitungseinrichtung auf, die mit einer Datenbasis verbuni den ist, die bekannte Benutzer in der Referenzpopulation aufführt;
    ein mit dem Datenverkehrsanalysenetzwerk verbundenes, Datenverkehr an Stellen von Interesse analysierendes System (600), das für jede Stelle oder Teil einer Stelle von allen Stellen von Interesse, die über das Netzwerk erreichbar sind, die Gesamtanzahl von Benutzern (N(s)), die mit der Stelle oder Teil einer Stelle (s) während einer vorgegebenen Zeitdauer (T) verbunden sind, zu ermitteln und zu unterscheiden vermag, welche dieser Benutzer Mitglieder der Referenzpopulation sind,
    wobei die Verarbeitungseinrichtung vermag:
    für jede Stelle oder Teil einer Stelle eine theoretische Anzahl von Benutzern zu erzeugen, so dass das Verhältnis zwischen dieser theoretischen Anzahl von Benutzern und der Gesamtanzahl von Benutzern, die während der vorgegebenen Zeitdauer (T) mit der Stelle verbunden sind, an allen Stellen von Interesse gleich ist;
    ausgehend von der Referenzpopulation eine Population von bekannten Netzwerkbenutzern zu erzeugen, um den Unterschied zwischen der theoretischen Anzahl von Benutzern und der Anzahl von Benutzern in der erzeugten Population, die während der Zeitdauer mit der Stelle verbunden sind, für alle Stellen oder Teile einer Stelle zu minimieren.
  • Gemäß einem weiteren Aspekt betrifft die Erfindung ein Verfahren, um das Profil eines Benutzers eines Kommunikationsnetzwerks zu ermitteln, das einen Schritt umfasst, ausgehend von einer Referenzpopulation unter Verwendung des Verfahrens gemäß dem ersten Aspekt der Erfindung eine repräsentative Population zu erzeugen.
  • Gemäß einem weiteren Aspekt betrifft die Erfindung ein System zum Ermitteln des Profils eines Benutzers eines Kommunikationsnetzwerks mit einem System, um eine repräsentative Population gemäß dem zweiten Aspekt der Erfindung zu erzeugen.
  • Weitere Eigenschaften, Zwecke und Vorteile der Erfindung werden aus der folgenden Beschreibung ersichtlich, die ausschließlich veranschaulichend und in keiner Weise einschränkend ist und unter Bezugnahme auf die einzelne beigefügte Figur gelesen werden sollte. Diese 1 ist ein Diagramm, das ein System in Übereinstimmung mit einer möglichen Ausführungsform der Erfindung, ausgehend von einer aus bekannten Benutzern zusammengesetzten Referenzpopulation eine für das Verhalten einer Gruppe von Benutzern eines Kommunikationsnetzwerks repräsentative Population zu erzeugen, repräsentiert.
  • In der Figur ist das System 100, das ausgehend von einer Referenzpopulation eine repräsentative Population erzeugt, mit einem Kommunikationsnetzwerk 200 (wie zum Beispiel das Internet) verbunden, mit dem eine Gruppe 300 von Web-Hauptrechnern (engl.: Web-Servers) von Interesse 301, 302, 303 verbunden ist.
  • Jeder Web-Hauptrechner unterhält eine Stelle (Site) oder Multimediainhalte, die Benutzern 400, 500 des Netzwerks 200 (die Internet-Benutzer) über einen Service-Provider verfügbar gemacht werden.
  • Das System 100 zum Erzeugen einer repräsentativen Population umfasst einen Verarbeitungshauptrechner 100, der mit dem Netzwerk 200 und einer Datenbasis 102 verbunden ist, die Mitglieder einer Referenz-Internet-Benutzerpopulation 500 betreffende Information aufführt.
  • Diese Information umfasst Profildaten über den Internet-Benutzer (typischerweise dessen Alter, Geschlecht, sozialberufliche Gruppe, etc.) und den Internet-Benutzeridentifizierende Information (wie zum Beispiel eine eindeutige Identifikation).
  • Der Verarbeitungshauptrechner 101 umfasst eine Verarbeitungsrichtung, die ausgehend von der Referenzpopulation, die aus bekannten und qualifizierten die Referenzpopulation bildenden Internet-Benutzern 500 zusammengesetzt ist, eine Population zu erzeugen vermag, die für das Verhalten einer Gruppe von Inter net-Benutzern repräsentativ ist, die eine Verbindung mit Web-Hauptrechnern von Interesse 301 bis 303 herstellen.
  • Das System 100 zum Erzeugen einer repräsentativen Population umfasst auch ein Datenverkehrsanalysesystem 600, das mit dem Netzwerk 200 verbunden ist und mit einer Datenverkehrserfassungseinrichtung zum Erfassen von Datenverkehr bei allen 300 Stellen von Interesse und einer Datenverkehrsdatenverarbeitungseinrichtung ausgestattet ist.
  • Dieser Typ eines Datenverkehrsanalysesystems 600 kann zum Beispiel ein Seitenmarkierungssystem (engl.: Page marking system) sein, gemäß dem einige von den Web-Hauptrechnern 301 bis 303 versorgte Stellen durch Seitenmarkierungen markiert werden. Diese Markierungen werden von dem Datenverkehrsmesssystem 600 so verwaltet, dass, wenn ein Internet-Benutzer auf eine auf diese Weise markierte Web-Seite zugreift, ein Laden der Markierung das Senden einer Anfrage an das Datenverkehrsanalysesystem auslöst. Diese Anfrage informiert das Datenverkehrsmesssystem darüber, dass der Internet-Benutzer eine vorgegebene Web-Seite lädt.
  • Als Variante kann dieser Typ eines Datenverkehrsanalysesystems 600 auch von den Web-Hauptrechnern 301 bis 303 erzeugte Protokollierungsdateien (oder Verbindungsprotokolle) analysieren, wenn ein Internet-Benutzer eine Web-Seite einer von einem dieser Hauptrechner 301 bis 303 unterhaltenen Stelle betrachtet.
  • Das Datenverkehrsanalysesystem 600 umfasst eine Datenbasis 103, in der Datenverkehrsdaten aufgezeichnet werden, die Information über Internet-Benutzer enthalten, die Interesse stehende, somit während einer vorgegebenen Zeitdauer geprüfte Web-Seiten besuchen.
  • Im Speziellen umfassen diese Datenverkehrsdaten die eindeutige Identifizierung des Internet-Benutzers, die besuchte Stelle, den Zeitpunkt des Besuchs, die IP-Adresse des Internet-Benutzers und seines Proxy's, seine Verbindungsgeschwindigkeit, seine Zeitzone, von seinem Browser verwendete Sprachen und jede weitere Information, die als relevant betrachtet werden könnte.
  • Das Datenverkehrsanalysesystem 600 kann auch eine Einrichtung zum Filtern der gesammelten Daten umfassen, um auf diese Weise nur eine spezielle Gruppe von Netzwerkbenutzern (wie zum Beispiel französische Internet-Benutzer oder einen Browser in französischer Sprache verwendende Internet-Benutzer oder Benutzer, die in der Nacht eine Verbindung herstellen) zu berücksichtigen, für die eine repräsentative Population vorhanden sein soll.
  • Das Datenverkehrsanalysesystem 600 kann auch mit der Internet-Benutzer in der Referenzpopulation aufführenden Datenbasis 102 zusammenarbeiten, insbesondere um zu ermitteln, welcher der Internet-Benutzer, die eine der Stellen (Sites) von Interesse besucht haben, einen Teil der Referenzpopulation bildet.
  • Es ist somit möglich, jede von einem Internet-Benutzer während einer vorgegebenen Zeitdauer mit einer Stelle (Site) hergestellte Verbindung aufzuzeichnen und zu unterscheiden, welche Internet-Benutzer Mitglieder der Referenzpopulation sind.
  • Im Umfang der Erfindung gibt es eine Referenzpopulation, die aus bekannten Internet-Benutzern 500 zusammengesetzt ist, von denen ausgehend es erforderlich ist, eine repräsentative Population einer Gruppe von Benutzern 400, 500 des Netzwerks 200 zu erzeugen.
  • Folglich ermittelt das Datenverkehrsanalysesystem 600 die Anzahl N(s) unterschiedlicher Internet-Benutzer, die während einer vorgegebenen Zeitdauer T eine Stelle (Site) oder einen Teil einer Stelle (engl.: Part of site) (s) innerhalb der 300 Stellen (Sites) von Interesse besucht haben.
  • Die gesamte Anzahl von Internet-Benutzern an allen Stellen (Sites) von Interesse während der betrachteten Zeitdauer T ist mit N angegeben.
  • Gemäß einer speziellen Ausführungsform der Erfindung werden offensichtlich Internet-Benutzer so gefiltert, um den Bereich der Studie einzuschränken, um lediglich Internet-Benutzer in einer speziellen Population zu berücksichtigen, für die eine repräsentative Population vorhanden sein soll (zum Beispiel Internet-Benutzer in einem speziellen Land, bei Nacht Verbindung herstellende Internet-Benutzer etc.).
  • Wie bereits erwähnt, sorgt ein Zusammenwirken des Datenverkehrsanalysesystems 600 mit der Referenz-Internet-Benutzer aufführenden Datenbasis 102 für ein Mittel, um zu unterscheiden, welche dieser N unterschiedlichen Internet-Benutzer einen Teil der Referenzpopulation bilden (die Anzahl ist Q).
  • Das Verhältnis bekannter Internet-Benutzer (Mitglieder der Referenzpopulation) zu allen N Internet-Benutzern, die wenigstens eine im Interesse stehende Stelle (Site) während der Zeitdauer T besuchen, ist mit
    Figure 00110001
    angegeben.
  • Das erforderliche Repräsentativitätsverhältnis R für die zu erzeugende repräsentative Population wird definiert.
  • Dieses Verhältnis kann unter Verwendung der Gleichung
    Figure 00110002
    ausgedrückt werden, mit anderen Worten, als repräsentativ für den Anteil von Internet-Benutzern in der repräsentativen Population (einschließlich Q ~ Internet-Benutzern) unter allen N Internet-Benutzern, die wenigstens eine im Interesse stehende Stelle (Site) während der Zeitdauer T besuchen.
  • Es ist zu beachten, dass es für statistische Zwecke offensichtlich bevorzugbar ist, Datenverkehr für eine große Anzahl von Web-Stellen von Interesse (zum Beispiel 20.000 Stellen) zu erfassen und eine ausreichend große Referenzpopulation (zum Beispiel 300.000 Internet-Benutzer) zu haben.
  • Wie bereits erwähnt, kann eine Population, die einen von n Internet-Benutzern repräsentiert (Repräsentationsverhältnis 1/n), als repräsentativ betrachtet werden kann, wenn im Mittel von einem Internet-Benutzer in der gesamten repräsentativen Population einer von n Besuchen jeder Seite (Site) vorgenommen wird.
  • Wenn eine vorgegebene Population repräsentativ ist, sollte folglich das Verhältnis zwischen der Anzahl bekannter, zu dieser vorgegebenen Population gehörenden Benutzer, die während der vorgegebenen Zeitdauer T eine Verbindung mit jeder Stelle (Site) oder einem Teil einer Stelle/n herstellen, und der gesamten Anzahl von Benutzern, die tatsächlich eine Verbindung mit dieser Stelle (Site) herstellen, für alle im Interesse stehenden Stellen (Sites) gleich sind und dem Repräsentativitätsverhältnis R ~ entsprechen.
  • Ausgehend von dem Repräsentativitätsverhältnis R ~ und der gesamten Anzahl von Benutzer (s), die während der betrachteten Zeitdauer eine Verbindung mit einer speziellen Stelle (Site) n herstellen, wird im Umfang der Erfindung eine theoretische Anzahl q ~(s) von Benutzern jede Stelle (Site) Fs erzeugt, so dass das Verhältnis zwischen dieser theoretischen Zahl q ~(s) von Benutzern und der gesamten Anzahl von Benutzern N(s), die während der vorgegebenen Zeitdauer T eine Verbindung mit der genannten Stelle (Site) s hergestellt haben, an allen im Interesse stehenden Stellen (Sites) gleich ist, mit anderen Worten q ~(s) = R ~·N(s).
  • Die Verarbeitungseinrichtung des Hauptrechners 101, der verwendet wird, um eine repräsentative Population zu erzeugen, vermag eine Population bekannter Netzwerk-Benutzer ausgehend von der Referenzpopulation zu erzeugen, um den Unterschied zwischen der theoretischen Anzahl q ~(s) von Benutzern und der Anzahl q ~n(s) von Benutzern in der erzeugten Population, die während der Zeitdauer (T) eine Verbindung mit der Stelle (Site) (s) hergestellt haben, an allen Stellen (Sites) oder Teilen von Stellen (s) zu minimieren.
  • Gemäß einer möglichen Ausführungsform, ist genauer gesagt die Verarbeitungseinrichtung des Hauptrechners 100 zum Erzeugen einer repräsentativen Population in der Lage:
    • – eine jedem bekannten Benutzer in der Referenzpopulation zuzuordnende Wichtung zu ermitteln und diese Wichtungen zu verwenden, um ausgehend von der Referenzpopulation eine Population von bekannten Netzwerkbenutzern zu erzeugen,
    • – und die Wichtungen zu variieren, um den Unterschied zwischen der Anzahl qn(s) von Benutzern in der erzeugten Population, die während der betrachteten Zeitdauer eine Verbindung mit der Stelle (Site) (s) hergestellt haben, wie von dem Datenverkehrsanalysesystem 600 ermittelt, und der theoretischen Anzahl q ~(s) von Benutzern an allen Stellen (Sites) oder Teilen einer Stelle zu minimieren.
  • Die Variation der Wichtungen und der resultierende Aufbau einer erzeugten Population werden genauer durch Iteration vorgenommen, um den Unterschied zwischen der Anzahl erwarteter qualifizierter Internet-Benutzer (theoretische Anzahl) und der Anzahl von tatsächlich erfassten Internet-Benutzern zu minimieren.
  • Im Folgenden sind Einzelheiten einer möglichen Ausführungsform einer solchen iterativen Erzeugung einer repräsentativen Population angegeben.
  • Das Verfahren zuerst initialisiert, indem jedem bekannten Internet-Benutzer in der Referenzpopulation eine identische anfängliche Wichtung
    Figure 00130001
    zugeordnet wird.
  • Während einer ersten Operation bei der Iteration wird eine Unterpopulation der Referenzpopulation erzeugt, indem eine zufällige Wahl einer Anzahl Q ~ = R ~ × N von Internet-Benutzern unter den Q Internet-Benutzern in der Referenzpopulation getroffen wird, die während der betrachteten Zeitdauer mit wenigstens einer der im Interesse stehenden Stellen (Sites) eine Verbindung hergestellt haben, wobei die Wahrscheinlichkeit, jeden der Internet-Benutzer in der Referenzpopulation zu wählen, der Wichtung pn(i) des Internet-Benutzers entspricht (wobei n die Iterationsstufe angibt). Jeder Internet-Benutzer in dieser Unterpopulation wird voll gezählt.
  • Gemäß einer Variante der zufälligen Wahl und der Erzeugung einer Unterpopulation der Referenzpopulation besteht die erste Operation bei der Iteration darin, eine Population mit genau der gleichen Größe wie die Referenzpopulation von Internet-Benutzern, die während der betrachteten Zeitdauer mit wenigstens einer der im Interesse stehenden Stellen (Sites) eine Verbindung hergestellt haben (daher Q Mitglieder umfassend), zu erzeugen, wobei aber jeder Internet-Benutzer ein spezielles Gewicht hat, das seiner Wichtung pn(i) entspricht.
  • Die zweite Operation bei der Iteration besteht darin, die Anzahl unterschiedlicher Internet-Benutzer in der erzeugten Population, die während der bearbeiteten Zeitdauer eine Verbindung hergestellt haben, für jede Stelle s zu ermitteln.
  • Wenn die erzeugte Population eine Unterpopulation der Referenzpopulation mit Q ~ Internet-Benutzern ist, in der jeder Internet-Benutzer voll gezählt wird, werden somit die qn(s) Internet-Benutzer, die mit der Stelle s eine Verbindung hergestellt haben, aus den Q Internet-Benutzern ermittelt.
  • Wenn die erzeugte Population eine Population von Q ~ Internet-Benutzern ist, in der die Wichtung jedes Internet-Benutzers berücksichtigt wird, entspricht die Anzahl qn(s) unterschiedlicher Internet-Benutzer in der erzeugten Population, die während der vorgegebenen Zeitdauer eine Verbindung mit einer Stelle s hergestellt haben, der Summe von Wichtungen von Internet-Benutzern in der Referenzpopulation, die tatsächlich mit der Stelle s eine Verbindung hergestellt haben.
  • Wie bereits erwähnt besteht die Aufgabe darin, eine erzeugte Population bekannter Internet-Benutzer so aufzubauen, dass der Anteil Internet-Benutzer in dieser erzeugten Population an jeder Stelle oder Teil einer Stelle unter allen im Interesse stehenden Stellen gleich ist und daher der Unterschied zwischen der Anzahl qn(s) von Internet-Benutzern in der erzeugten Population und die theoretische Anzahl q ~ für alle im Interesse stehenden Stellen minimiert wird.
  • Die im Folgenden beschriebene Unterschiedsmessung ist die Varianzberechnung, wobei es aber verständlich ist, dass eine andere Unterschiedsmessung verwendet werden könnte (wie Beispiel das Monte-Carlo-Verfahren).
  • Die dritte Operation bei der Iteration besteht darin, einen gemessenen Wert des Unterschieds aus der Repräsentativität der erzeugten Population zu ermitteln, zum Beispiel die Varianz vn für die Iterationsstufe n, die durch
    Figure 00150001
    ausgedrückt wird, wobei diese Unterschiedsmessung mit einem Grenzwert verglichen wird.
  • Wenn die Unterschiedsmessung größer als der festgelegte Grenzwert ist, wird eine vierte Operation in der Iteration ausgeführt, bei der neue, jedem Internet-Benutzer in der Referenzpopulation (einschließlich der Q bekannten Internet-Benutzer) zuzuordnende Wichtungen ermittelt werden, um eine neue Population bekannter Internet-Benutzer zu erzeugen, für die der Unterschied von der Repräsentativität verringert ist.
  • Im Allgemeinen wird die Wichtung, die einem Internet-Benutzer in der Referenzpopulation zugeordnet ist, wenn dieser Internet-Benutzer Stellen (Sites) besucht hat, für die die Anzahl qualifizierter Internet-Benutzer kleiner als die theoretische Anzahl während der betrachteten Zeitdauer ist, wobei ansonsten die Wichtung verringert wird.
  • Dies wird durchgeführt, indem für jeden qualifizierten Internet-Benutzer i ein "Schwerpunkt" B(i) berechnet wird, indem die Abweichungen b(s) für jede Stelle summiert werden, an denen der Internet-Benutzer i vorbeigekommen ist.
  • Die Abweichung b(s) für eine Stelle s ist abhängig davon wie folgt definiert, ob die Anzahl q(s) bekannter Internet-Benutzer, die die Stelle s während der betrachteten Zeitdauer besucht haben, größer oder kleiner als die theoretische Anzahl q ~(s) von Internet-Benutzern ist:
    Figure 00160001
  • Der Schwerpunkt B(i) wird dann unter Verwendung der Gleichung
    Figure 00160002
    berechnet, wobei s(i) während der betrachteten Zeitdauer von einem Internet-Benutzer i besuchte Stellen angibt.
  • Die einem qualifizierten Internet-Benutzer i bei der Iterationsstufe n zugeordnete Wichtung pn(i) wird dann, wie in den folgenden Gleichungen beschrieben, ermittelt:
    Figure 00160003
    wobei pn- 1(i) die einem qualifizierten Internet-Benutzer i in der Iterationsstufe n – 1 zugeordnete Wichtung ist und Si die Anzahl von während der betrachteten Zeitdauer von dem Internet-Benutzer i besuchter Stellen ist.
  • Die Iterationsoperationen werden unter Verwendung dieser neuen Wichtungen erneut begonnen, und es wird somit eine neue Popula tion erzeugt (wie oben beschrieben, entweder durch zufälliges Wählen einer Unterpopulation, in der jeder Internet-Benutzer vollständig zählt, oder indem die Referenzpopulation insgesamt betrachtet wird, bei der aber die Wichtung jedes Internet-Benutzers berücksichtigt wird), für die der Unterschied von der Repräsentativität evaluiert wird.
  • Das oben beschriebene iterative Verfahren wird daher implementiert, bis eine Population erzeugt ist, für die der Unterschied (in diesem Fall die Varianz) kleiner als der festgelegte Grenzwert ist.
  • Es ist zu beachten, dass es im Zusammenhang einer durch zufälliges Wählen einer Unterpopulation der Referenzpopulation erzeugten Population möglich ist, die zufällige Wahl einige Male mit den Wahlwahrscheinlichkeiten vorzunehmen. Dies ermöglicht es, die Operationen für eine Iteration unter Verwendung einiger Unterpopulationen durchzuführen und dann insbesondere einige Messungen des Unterschieds von der Repräsentativität vorzunehmen. Insbesondere ist es somit möglich, die Unterpopulation mit der kleinsten Unterschiedsmessung als Grundlage für die Berechnung neuer Wichtungen für die nächste Iteration zu verwenden, was zweifellos die Genauigkeit und Geschwindigkeit der Erzeugung der repräsentativen Population verbessert.
  • Offensichtlich ist es klar, dass die gemäß der Erfindung erzeugte repräsentative Population insbesondere zur Verwendung im Zusammenhang mit einem profilerstellenden Verfahren (und des das genannte Profil erstellende Verfahren nutzendes System) vorgesehen ist, bei dem das Profil unbekannter Internet-Benutzer ermittelt wird, indem Suchvorgänge dieser unbekannten Internet-Benutzer an im Interesse stehenden Stellen mit Suchvorgängen von Internet-Benutzern in der repräsentativen Population verglichen werden.
  • Im Zusammenhang eines solchen profilerstellenden Verfahrens kann das Profil eines Internet-Benutzers aus einer Reihe von Werten von diesem Internet-Benutzer zugeordneten Attributen zu sammengesetzt sein. Diese Attribute bestehen aus Information, die jedem Internet-Benutzer zugeordnet ist, der für Dienstleistungsanbieter interessant ist. Beispielsweise können diese Attribute, Geschlecht, Alter und sozial-berufliche Gruppe des Internet-Benutzers betreffen.
  • Das Profil Pi eines vorgegebenen Internet-Benutzers i wird als Folge mit N Werten von Attributen pij ausgedrückt, wobei pij die Wahrscheinlichkeit ist, dass der Internet-Benutzer i das Attribut j aufweist.
  • Das Profil eines Internet-Benutzers i kann somit wie folgt angegeben werden:
    Pi = (Pi1, Pi2, Pi3, Pi4, Pi5, Pi6, Pi7, Pi8, Pi9, Pi10, Pi11, Pi12, Pi13, ... Pin), wobei:
    • – pn die Wahrscheinlichkeit ist, dass der Internet-Benutzer i eine Frau ist (j = 1),
    • – pi2 die Wahrscheinlichkeit ist, dass der Internet-Benutzer i ein Mann ist (j = 2),
    • – pi3, pi4, p15, pi6, pi7 und pi8 Wahrscheinlichkeiten sind, dass der Internet-Benutzer i zwischen 0 und 14 Jahren alt (j = 3), 15 bis 24 Jahre alt (j = 4), 25 bis 34 Jahre alt (j = 5), 35 bis 49 Jahre alt (J = 6), 50 bis 64 Jahre alt (j = 7) oder mehr als 65 Jahre alt (j = 8) ist,
    • – pi9, pi10, pi11, pi12 und pi13 Wahrscheinlichkeiten sind, dass der Internet-Benutzer i zu speziellen Typen sozialberuflicher Gruppen gehört (j = 9, 10, 11, 12 oder 13), weitere Attribute 14 bis N ebenfalls berücksichtigt werden.
  • Das Profil PS einer vorgegebenen Web-Site von Interesse s wird als Folge ausgedrückt, die ebenfalls N Werte von Attributen psj aufweist, wobei psj die Wahrscheinlichkeit ist, dass ein Inter net-Benutzer, der die Stelle s besucht, das Attribut j aufweist.
  • Das Profil einer Stelle (Site) s wird somit angegebenen:
    Ps = (Ps1, Ps2, Ps3, Ps4, Ps5, Ps6, Ps7, Ps8, Ps9, Ps10, Ps11, Ps12, Ps13, ... Psn) wobei die Attributswerte psj des Profils PS als Funktion der Werte von Attributen von Internet-Benutzern in der repräsentativen Population ermittelt werden, die die Stelle s besuchen.
  • Für eine im Interesse stehende Stelle s ist, wenn die repräsentative Population eine durch zufällige Wahl erzeugte Unterpopulation der Referenzpopulation ist, in der jeder Internet-Benutzer vollständig zählt, der Wert psj des Attributs j der Mittelwert der Werte pij, die Internet-Benutzern in der repräsentativen Population zugeordnet sind, die die Stelle s besuchen.
  • Wenn die repräsentative Population die Referenzpopulation ist, in der die jedem Internet-Benutzer zugeordnete Wichtung vollständig berücksichtigt wird, ist alternativ der Wert psj des Attributs j für eine vorgegebene im Interesse stehende Stelle s der Mittelwert der Werte pij, die Internet-Benutzern in der repräsentativen Population zugeordnet sind, die die Stelle s besuchen, wobei in diesem Fall die Werte pij mittels der den genannten Internet-Benutzern zugeordneten Wichtungen gewichtet werden.
  • Offensichtlich ist die Erfindung nicht auf die speziellen Ausführungsformen, die gerade beschrieben worden sind, beschränkt, sondern kann auf jede Variante erweitert werden, die mit ihrem Geist in Übereinstimmung steht.
  • Insbesondere ist die Erfindung nicht auf die Erzeugung einer repräsentativen Population von Internet-Benutzern beschränkt, sondern umfasst die Erzeugung einer repräsentativen Population von Benutzern jedes Typs eines Endgeräts (zum Beispiel Computer, Fernseher, Mobiltelefon), das mit einem Kommunikationsnetzwerk verbunden ist, um eine Verbindung mit jeglichem Typ digitaler Unterstützung (zum Beispiel Wap-Sites, i-Mode- (registrierte Handelsmarke)-Sites etc.). zu ermöglichen.

Claims (16)

  1. Verfahren zum Erzeugen einer Population, die für das Verhalten einer Gruppe von Benutzern eines Kommunikationsnetzwerks repräsentativ ist, ausgehend von einer Referenzpopulation, die aus bekannten, in einer Datenbasis aufgeführten Netzwerkbenutzern zusammengesetzt ist, dadurch gekennzeichnet, dass es die Schritte bestehend aus umfasst: Ermitteln für jede Stelle oder Teil einer Stelle (s) in einer Gruppe von Stellen von Interesse, die über das Netzwerk verfügbar sind, die Anzahl von Benutzern (N(s)), die mit der Stelle oder dem Teil einer Stelle (s) während einer vorgegebenen Zeitdauer (T) verbunden sind, unter Verwendung eines Datenverkehrsanalysesystems, das zum Analysieren von Datenverkehr an Stellen von Interesse mit dem Netzwerk verbunden ist; Ermitteln für jede Stelle oder Teil einer Stelle (s) einer theoretischen Anzahl (q ~(s)) von Benutzern, so dass das Verhältnis zwischen dieser theoretischen Anzahl (q ~(s)) von Benutzern und der Anzahl von Benutzern (N(s)), die mit der Stelle (s) während der vorgegebenen Zeitdauer (T) verbunden sind, an allen Stellen von Interesse gleich ist; Verwenden einer Verarbeitungseinrichtung, die mit der Datenbasis verbunden ist, um eine Population bekannter Netzwerkbenutzer ausgehend von der Referenzpopulation zu erzeugen, um an allen Stellen oder Teilen einer Stelle (s) den Unterschied zwischen der theoretischen Anzahl von Benutzern (q ~(s)) und der Anzahl von Benutzern (qn(s)) in der erzeugten Population zu minimieren, die mit der Stelle (s) während der Zeitdauer (T) verbunden sind.
  2. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass eine Wichtung jedem bekannten Benutzer in der Referenzpopulation während des Schritts zugeordnet wird, die Population bekannter Netzwerkbenutzer ausgehend von der Referenzpopulation zu erzeugen.
  3. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass der Schritt, die Population zu erzeugen, wie folgt iterativ durchgeführt wird: die Benutzern in der Referenzpopulation zugeordneten Wichtungen werden während jeder Iteration variiert; für jede Iteration werden die so variierten Wichtungen verwendet, um ausgehend von der Referenzpopulation eine neue Population zu erzeugen; und für jede Iteration wird an allen Stellen (s) oder Teilen einer Stelle (s) der Unterschied zwischen der theoretischen Anzahl (q ~(s)) von Benutzern und der Anzahl (qn(s)) von Benutzern in der so erzeugten neuen Population, die während der Zeitdauer (T) mit der Stelle (s) verbunden sind, ermittelt; wobei die Iterationen fortgesetzt werden, bis der genannte Unterschied kleiner als ein vorgegebener Grenzwert ist, wobei die während der letzten Iteration erzeugte Population als für das Verhalten der Gruppe von Benutzern repräsentativ betrachtet wird.
  4. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass der Schritt, der aus dem Ermitteln der Anzahl von Benutzern (N(s)) besteht, die mit jeder Stelle oder Teil einer Stelle (s) verbunden sind, auch eine Maßnahme umfasst, die Gesamtanzahl von Benutzern (N) und die Gesamtanzahl von Benutzern in der Referenzpopulation (Q) zu ermitteln, die während der vorgegebenen Zeitdauer (T) mit der Stelle oder dem Teil einer Stelle (s) verbunden sind.
  5. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass es vor dem Schritt, die theoretische Anzahl (q ~(s)) von Benutzern an jeder Stelle (s) zu ermitteln, auch einen Schritt umfasst, das Repräsentativitätsverhältnis (R) für die zu erzeugende repräsentatitive Population zu definieren, wobei die theoretische Anzahl (q ~(s)) von Benutzern für jede Stelle oder Teil einer Stelle (s) so ermittelt wird, dass das Verhältnis zwischen der theoretischen Anzahl von Benutzern und der Gesamtanzahl von Benutzern (N(s)), die während der vorgegebenen Zeitdauer (T) mit der Stelle (s) verbunden sind, für alle Stellen von Interesse gleich sein sollte und dem Repräsentativitätsverhältnis (R) entsprechen sollte.
  6. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass die während jeder Iteration erzeugte neue Population eine Unterpopulation der Referenzpopulation ist, deren Größe dem Repräsentativitätsverhältnis (R) im Verhältnis zu der Gesamtanzahl von Benutzern (N) entspricht, erhalten durch ein zufälliges Wählen von Benutzern in der Referenzpopulation, wobei die Wahrscheinlichkeit, einen Benutzer in der Referenzpopulation zu wählen, gleich der diesem zugeordneten Wichtung ist, wobei jeder so gewählte Internet-Benutzer vollständig in der erzeugten Population gezählt wird.
  7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass während jeder Iteration die neu erzeugte Population eine Population mit genau der gleichen Größe wie die Referenzpopulation ist, wobei das Gewicht jedes Internet-Benutzers gleich der diesem zugeordneten Wichtung ist.
  8. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass bei einer Iterationsstufe n die Anzahl von Benutzern (qn(s)) in der erzeugten Population, die mit der Stelle (s) während der vorgegebenen Zeitdauer (T) verbunden sind, gleich der Summe von Wichtungen ist, die jedem der Benutzer in der Referenzpopulation zugeordnet sind, die tatsächlich während einer vorgegebenen Zeitdauer (T) mit der Stelle (s) verbunden sind.
  9. Verfahren nach Anspruch 6 oder 8, dadurch gekennzeichnet, dass bei einer Iterationsstufe n die Differenzmessung ermittelt wird, indem die Varianz vn an allen Stellen von Interesse unter Verwendung von
    Figure 00230001
    berechnet wird, wobei q ~(s) die theoretische Anzahl von Benutzern für die Stelle s ist und qn(s) die Anzahl von Benutzern in der bei einer Iterationsstufe n erzeugten Population ist, die während der betrachteten Zeitdauer mit der Stelle s verbunden sind.
  10. Verfahren nach einem der Ansprüche 3 bis 9, dadurch gekennzeichnet, dass bei jeder Iteration die einem Benutzer in der Referenzpopulation zugeordnete Wichtung vergrößert wird, wenn der Benutzer für eine vorgegebene Zeitdauer eine Verbindung mit Stellen hergestellt hat, für die die Anzahl an Benutzern (q(s)) in der Referenzpopulation, die mit diesen eine Verbindung hergestellt haben, kleiner als die theoretische Anzahl (q ~(s)) ist, wobei ansonsten die Wichtung verkleinert wird.
  11. Verfahren nach dem vorherigen Anspruch, dadurch gekennzeichnet, dass die einem Benutzer i in der Referenzpopulation bei einer Stufe n der Iteration zugeordnete Wichtung pn(i) dann wie in den folgenden Gleichungen beschrieben ermittelt wird:
    Figure 00240001
    wobei pn-1(1) die in einer Iterationsstufe n – 1 einem qualifizierten Internet-Benutzer i zugeordnete Wichtung ist; Si die Anzahl an Stellen ist, die während der betrachteten Zeitdauer von einem Internet-Benutzer i besucht wird, und
    Figure 00240002
    wobei s(i) von einem Internet-Benutzer i während der betrachteten Dauer besuchte Stellen angibt,
    Figure 00240003
    wobei q(s) die Anzahl von Benutzern in der Referenzpopulation ist, die während der betrachteten Dauer mit der Stelle (s) verbunden sind, q ~(s) die theoretische Anzahl von Benutzern für die Stelle s ist und qn(s) die Anzahl von Benutzern in der erzeugten Population bei einer Iterationsstufe n ist, die während der betrachteten Dauer mit der Stelle (s) verbunden sind.
  12. Verfahren nach einem der Ansprüche 3 bis 11, dadurch gekennzeichnet, dass für die erste Iteration jedem Benutzer in der Referenzpopulation die gleiche Wichtung zugeordnet wird.
  13. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass es einen vorherigen Schritt umfasst, von dem Datenverkehrsanalysesystem gesammelte Datenverkehrsdaten zu filtern, um nur Daten zu berücksichtigen, die alle Benutzer betreffen, für die eine für das Verhalten repräsentative Population erzeugt werden soll.
  14. Verfahren zum Ermitteln des Profils eines Benutzers eines Kommunikationsnetzwerks, dadurch gekennzeichnet, dass es einen Schritt umfasst, eine repräsentative Population ausgehend von einer Referenzpopulation unter Verwendung des Verfahrens gemäß einem der vorherigen Ansprüche zu erzeugen.
  15. System (100) zum Erzeugen einer Population von Benutzern eines Kommunikationsnetzwerks (200), die für das Verhalten einer Gruppe von Netzwerkbenutzern repräsentativ ist, ausgehend von einer aus bekannten Netzwerkbenutzern zusammengesetzten Referenzpopulation, dadurch gekennzeichnet, dass es umfasst: einen Hauptrechner (101), der eine repräsentative Population erzeugt, der mit dem Netzwerk verbunden ist und der eine Verarbeitungseinrichtung aufweist, die mit einer Datenbasis (102) verbunden ist, die bekannte Benutzer in der Referenzpopulation aufführt; ein System (600), das Datenverkehr an Stellen von Interesse analysiert, das mit dem Netzwerk (200) verbunden ist und das die Gesamtanzahl von Benutzern (N(s)), die mit der Stelle oder Teil einer Stelle (s) während einer vorgegebenen Zeitdauer (T) verbunden sind, für jede Stelle oder Teil einer Stelle (s) von allen Stellen (300) von Interesse (301, 302, 303), die über das Netzwerk erreichbar sind, zu ermitteln und zu unterscheiden vermag, welche dieser Benutzer Mitglieder der Referenzpopulation sind, bei dem die Verarbeitungseinrichtung vermag: für jede Stelle oder Teil einer Stelle (s) eine theoretische Anzahl von Benutzern (g ~(s)) zu erzeugen, so dass das Verhältnis zwischen der theoretischen Anzahl von Benutzern q(s) und der Gesamtanzahl von Benutzern (N(s)), die während der vorgegebenen Zeitdauer (T) mit der Stelle verbunden sind, an allen Stellen von Interesse gleich ist; eine Population von bekannten Netzwerkbenutzern ausgehend von der Referenzpopulation zu erzeugen, um den Unterschied zwischen der theoretischen Anzahl von Benutzern (q ~(s) und der Anzahl von Benutzern (q(n(s)) in der erzeugten Population, die während der Zeitdauer (T) mit der Stelle (s) verbunden sind, für alle Stellen oder Teile einer Stelle (s) zu minimieren.
  16. System zum Erstellen eines Profils eines Benutzers eines Kommunikationsnetzwerks, dadurch gekennzeichnet, dass es ein System zum Erzeugen einer repräsentativen Population gemäß dem vorherigen Anspruch aufweist.
DE602005001940T 2004-04-22 2005-04-20 Verfahren und system zur erzeugung einer für eine menge von benutzern eines kommunikationsnetzes repräsentativen population Expired - Lifetime DE602005001940T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0404271A FR2869488B1 (fr) 2004-04-22 2004-04-22 Procede et systeme d'elaboration d'une population representative d'un ensemble d'utilisateurs d'un reseau de communication
FR0404271 2004-04-22
PCT/IB2005/001440 WO2005104436A1 (en) 2004-04-22 2005-04-20 Method and system for generating a population representative of a set of users of a communication network

Publications (2)

Publication Number Publication Date
DE602005001940D1 DE602005001940D1 (de) 2007-09-20
DE602005001940T2 true DE602005001940T2 (de) 2008-05-08

Family

ID=34944556

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602005001940T Expired - Lifetime DE602005001940T2 (de) 2004-04-22 2005-04-20 Verfahren und system zur erzeugung einer für eine menge von benutzern eines kommunikationsnetzes repräsentativen population

Country Status (6)

Country Link
US (1) US20080195609A1 (de)
EP (1) EP1738524B1 (de)
AT (1) ATE369679T1 (de)
DE (1) DE602005001940T2 (de)
FR (1) FR2869488B1 (de)
WO (1) WO2005104436A1 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542690B2 (en) 2006-07-18 2017-01-10 American Express Travel Related Services Company, Inc. System and method for providing international coupon-less discounts
US9430773B2 (en) 2006-07-18 2016-08-30 American Express Travel Related Services Company, Inc. Loyalty incentive program using transaction cards
US9558505B2 (en) 2006-07-18 2017-01-31 American Express Travel Related Services Company, Inc. System and method for prepaid rewards
US7818534B2 (en) * 2007-05-09 2010-10-19 Yahoo! Inc. Determination of sampling characteristics based on available memory
US20090150927A1 (en) * 2007-12-06 2009-06-11 Alcatel Lucent Facilitating interactive advertising in digital television program content through follow-up browsing of selectable advertised offerings presented within such digital television program content
CN101355462B (zh) * 2008-09-02 2011-08-24 中兴通讯股份有限公司 一种网络设备的管理信息库及其监测网站与用户的方法
US8849699B2 (en) * 2011-09-26 2014-09-30 American Express Travel Related Services Company, Inc. Systems and methods for targeting ad impressions
US9672526B2 (en) 2012-03-13 2017-06-06 American Express Travel Related Services Company, Inc. Systems and methods for tailoring marketing
US9195988B2 (en) 2012-03-13 2015-11-24 American Express Travel Related Services Company, Inc. Systems and methods for an analysis cycle to determine interest merchants
US9633362B2 (en) 2012-09-16 2017-04-25 American Express Travel Related Services Company, Inc. System and method for creating reservations
US10664883B2 (en) 2012-09-16 2020-05-26 American Express Travel Related Services Company, Inc. System and method for monitoring activities in a digital channel
US10504132B2 (en) 2012-11-27 2019-12-10 American Express Travel Related Services Company, Inc. Dynamic rewards program
US10395237B2 (en) 2014-05-22 2019-08-27 American Express Travel Related Services Company, Inc. Systems and methods for dynamic proximity based E-commerce transactions
US10740340B2 (en) * 2017-08-21 2020-08-11 Walmart Apollo, Llc Systems for learning and using one or more sub-population features associated with individuals of one or more sub-populations of a gross population and related methods therefor
US11551251B2 (en) 2020-11-12 2023-01-10 Rodney Yates System and method for transactional data acquisition, aggregation, processing, and dissemination in coordination with a preference matching algorithm
WO2023043702A1 (en) 2021-09-14 2023-03-23 Rodney Yates System and method for incentivizing repeat transactions with merchants within a prescribed geographic area using payment processing network data and providing for time distributed payments

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2778520B1 (fr) * 1998-05-06 2000-07-28 France Telecom Procede pour evaluer les consultations de sites accessibles par un reseau de telecommunications, et module utilisable dans la mise en oeuvre de ce procede
US6356531B1 (en) * 1999-06-07 2002-03-12 Qualcomm Incorporated Monitoring of CDMA load and frequency reuse based on reverse link signal-to-noise ratio
US7930285B2 (en) * 2000-03-22 2011-04-19 Comscore, Inc. Systems for and methods of user demographic reporting usable for identifying users and collecting usage data
WO2002033626A1 (en) * 2000-10-16 2002-04-25 Engage Technologies Demographic profiling engine
FR2829258A1 (fr) * 2001-09-03 2003-03-07 Profile For You Ltd Procede et systeme de surveillance et d'analyse de la frequentation d'une ou plusieurs plateformes de mise a disposition d'informations
US7185085B2 (en) * 2002-02-27 2007-02-27 Webtrends, Inc. On-line web traffic sampling

Also Published As

Publication number Publication date
ATE369679T1 (de) 2007-08-15
EP1738524A1 (de) 2007-01-03
US20080195609A1 (en) 2008-08-14
EP1738524B1 (de) 2007-08-08
FR2869488A1 (fr) 2005-10-28
DE602005001940D1 (de) 2007-09-20
WO2005104436A1 (en) 2005-11-03
FR2869488B1 (fr) 2006-07-14

Similar Documents

Publication Publication Date Title
DE602005001940T2 (de) Verfahren und system zur erzeugung einer für eine menge von benutzern eines kommunikationsnetzes repräsentativen population
DE60108861T2 (de) Gerät und verfahren zur überwachung der netzwerkauslastung
DE602004003361T2 (de) System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
DE69723346T2 (de) Verfahren zum auf eine Wahrscheinlichkeitsfunktion basierten Wiederauffinden von Bildern
DE202020005787U1 (de) Ereignisdetektierung in Echtzeit auf sozialen Datenströmen
DE10154656A1 (de) System und Verfahren für Empfehlungen von Artikeln
DE112011101293T5 (de) Dynamische Echtzeit-Berichte basierend auf sozialen Netzwerken
DE10244974A1 (de) Automatische Inserentenbenachrichtigung für ein System zum Bereitstellen eines Platz- und Preisschutzes in einer Suchergebnisliste, die durch eine Computernetzwerksuchmaschine erzeugt wird
DE112012005197T5 (de) Ereignis-Mining in sozialen Netzwerken
DE102011017442A1 (de) Verfahren zum Bestimmen des Kundenwerts und -potenzials aus sozialen Medien und anderen öffentlichen Datenquellen
DE112012003376T5 (de) Seitenberichterstattung
EP1097428A2 (de) System und verfahren zum prüfen von netzwerk-anwendungen
DE202012013427U1 (de) Verknüpfung von Tabellen in einem MapReduce-Verfahren
DE112010004946T5 (de) Dynamisches Verwalten einer sozialen Netzwerkgruppe
DE102012208842A1 (de) Zugangsüberwachungsverfahren, Informationsverarbeitungsvorrichtung und Zugangsüberwachungsprogramm
DE202017107393U1 (de) Vorhersagen eines Suchmaschinen-Einordnungssignalwerts
DE202014010941U1 (de) Einen gegenwärtigen Standort auf Basis einer Standorthistorie ableiten
DE112020000927T5 (de) Verwalten sensibler daten
DE112021003747T5 (de) Erkennen von anomalien in einer netzwerktopologie
DE112012002669B4 (de) Verbessern des Austauschens von Daten in der Social-Network-Umgebung
DE102020129018A1 (de) Tiefe benutzermodellierung durch verhalten
WO2004040850A1 (de) Verfahren und einrichtung zur auswahl eines netzzugangs zu einem oder mehreren datennetzen über ein telekommunikationsendgerät
WO2023222331A1 (de) Verfahren zur anonymisierung von fahrzeugdaten
EP1783633B1 (de) Suchmaschine für eine ortsbezogene Suche
CH698374B1 (de) Verfahren und Vorrichtung zum Einholen von Daten.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition