Tube

tube_th.jpg
Tube (von manchen auch Tobias Herre genannt)


Tube liest einemal die Woche immer mittwoch bei der berliner Lesebühne Surfpoeten Geschichten vor.
kann Computerprogramme in fast jeder x-beliebigen Programmiersprache schreiben, hat mal früher sogar ein Computerspiel gemacht. Das Spiel heißt Atomino. Mit etwas Glück findetst du im Netz eine Raubkopie des Uraltgames. Außerdem testet Tube derzeit in einem aufopferungsvollen Selbstexperiment an einer private University in Berlin, was Lohnarbeit ist.

50/atomfeed.pngFeed



Archiv

3/2013
1/2013
12/2012
7/2012
6/2012
5/2012
4/2012
3/2012
2/2012
1/2012
12/2011
9/2011
8/2011
6/2011
5/2011
3/2011
2/2011
1/2011
6/2010
5/2010
4/2010
3/2010
2/2010
1/2010
12/2009
10/2009
8/2009
7/2009
6/2009
5/2009
4/2009


30.6.2012

Wie wird der Amazon-Verkaufsrang berechnet?

Außer den Autoren selbst und vielleicht noch einigen Verlegern sieht niemand auf den Amazon-Verkaufsrang, ja, die meisten wissen nicht einmal, dass es ihn gibt, diesen Verkaufsrang, der bei jedem Buch auf Amazon in der Detailbeschreibung angezeigt wird.
Unter den Autoren, deren Bücher noch nicht zu Bestsellern geworden sind, sorgt der Verkaufsrang regelmäßig für Verwirrung, da insbesondere die seltener verkauften Bücher starken Schwankungen unterliegen, die vom Betrachter als zufällig und völlig unlogisch empfunden werden.
Dabei funktioniert die Sache ganz einfach und wird logisch, wenn man sich einmal überlegt, wie man selbst bei der Erstellung einer solchen Verkaufsrangliste vorgehen würde. Um etwas Licht ins Dunkle zu bringen, will ich nun anhand eines kleinen Beispiels zeigen, wie ich diese Liste implementieren würde.

Nehmen wir an, wir hätten ein Buchsortiment von 6 Büchern, Buch A bis Buch F, und die Bücher hätten sich in den letzten 12 Stunden wie folgt verkauft: Buch A 10 mal, Buch B 7 mal, die anderen Bücher hat in den letzten 12 Stunden niemand gekauft. Dann können wir eine Rangliste bilden, sortiert nach den Verkäufen der letzten 12 Stunden, die so aussieht:
RangTitelVerkäufe der letzten 12 Stunden
1Buch A10
2Buch B7
3Buch C0
4Buch D0
5Buch E0
6Buch F0

Nun kommt einer daher und kauft das Buch F. Damit ist von Buch F in den letzten 12 Stunden ein Stück verkauft worden. Wenn wir die Rangliste neu berechnenm, springt Buch F schlagartig von Platz 6 auf Platz 3. Es lässt alle Bücher, die in den letzten 12 Stunden gar nicht verkauft worden sind, hinter sich. In unserem Falle sind das die Bücher C,D und E.
RangTitelVerkäufe der letzten 12 Stunden
1Buch A10
2Buch B7
3Buch F1
4Buch C0
5Buch D0
6Buch E0

In der Realität gibt es aber einige Hunderttausend Bücher, die in den letzten 12 Stunden kein Mensch gekauft hat, weshalb der Verkauf eines einzigen Buches bei Amazon einen Sprung um einige Hundertausend Stellen bewirken kann.
Nehmen wir nun an, es kommt jemand und kauft auch noch das Buch E. Folglich wird Buch E ebenfalls mit einem verkauften Examplar in unserer Liste geführt. Buch E steigt nach oben. Die Frage ist nun, ob Buch E vor oder hinter Buch F einsortiert werden soll. Die Anzahl verkaufter Exemplare ist ja für beide identisch. Es liegt nahe, als zweites Kriterium die Zeit des letzten Verkaufs anzuwenden. Wenn also zwei Bücher in den letzten 12 Stunden gleich oft verkauft worden sind, wird jenes höher eingeordnet, das zuletzt verkauft worden ist. Damit springt Buch E von Platz 6 auf Platz 3. Buch F rutscht einen Rang tiefer.
RangTitelVerkäufe der letzten 12 Stunden
1Buch A10
2Buch B7
3Buch E1
4Buch F1
5Buch C0
6Buch D0
Soweit ist die Sache ja noch ganz einfach. Nun zu dem, was vielen die Liste wie ausgewürfelt erscheinen lässt:
Wie kann es geschehen, dass ein Buch in der Rangliste aufsteigt, ohne das nur ein einziges Buch verkauft wird?
Aber auch das ist leicht erklärt, wenn man sich einmal überlegt, wie denn die Verkaufszahlen der letzten 12 Stunden ermittelt werden.
Nehmen wir mal aus unserem kleinen Sortiment die beiden Bestseller, Buch A und Buch B. Um die Verkäufe der letzten 12 Stunden zu ermitteln gehen wir wie folgt vor: Für jedes der Bücher wird vermerkt, zu welcher Zeit wie viel Stück verkauft worden sind. Über diese Verkäufe bilden wir die Summe. Sagen wir, von Buch A wurden vor 12 Stunden 6 Stück verkauft, vor 8 Stunden 3 und vor 5 Stunden 1 Stück. (Macht zusammen 10) Dann erhalten wir für Buch A folgende Tabelle mit der Verkaufshistorie:
Buch A
12h 11h 10h 9h 8h 7h 6h 5h 4h 3h 2h 1h
6 0 0 0 3 0 0 1 0 0 0 0
Für Buch B, von dem in den letzten 12 Stunden nur 7 Stück verkauft worden sind, sieht dagegen die zeitliche Verteilung der Verkäufe etwas anders aus. Sagen wir, so:
Buch B
12h 11h 10h 9h 8h 7h 6h 5h 4h 3h 2h 1h
1 0 2 0 1 0 2 0 0 1 0 0
Und nun vergeht ein Stunde, ohne dass irgendjemand ein Buch kauft. Damit ist es für Buch A 13 Stunden her, dass 6 Stück verkauft wurden, während von Buch B vor 13 Stunden nur ein Buch verkauft worden ist.
Buch A
13h 12h 11h 10h 9h 8h 7h 6h 5h 4h 3h 2h 1h
6 0 0 0 3 0 0 1 0 0 0 0 0
Buch B
13h 12h 11h 10h 9h 8h 7h 6h 5h 4h 3h 2h 1h
1 0 2 0 1 0 2 0 0 1 0 0 0
Da wir aber zur Bildung des Verkaufsrangs nur die Verkäufe der letzten 12 Stunden heranziehen, werden die Verkäufe von vor 13 Stunden (rot markiert) nicht mehr berücksichtigt. Das heißt, in den letzten 12 Stunden hat sich Buch A nur 4 mal verkauft und Buch B aufgrund der anderen zeitlichen Verteilung der Verkäufe 6 mal.
Damit tauschen die Bücher in unserer Rangliste auf wundersame Weise ihre Plätze, obwohl kein einziges Buch verkauft worden ist. Selbst wenn in der letzten Stunde noch ein Exemplar von Buch A verkauft worden wäre, würde es absteigen und in der Rangliste hinter Buch B liegen.
RangTitelVerkäufe der letzten 12 Stunden
1Buch B6
2Buch A4
3Buch E1
4Buch F1
5Buch C0
6Buch D0

So einfach funktioniert der Amazon-Verkaufsrang. Hier wird nichts ausgewürfelt, vom Wetter abhängig gemacht oder mit der Schuhgröße des Programmieres multipliziert. Das Einzige, was schwer vorhersehbar ist, sind die Käufer, die sich zu völlig unterschiedlichen Zeiten entschließen, dieses oder jenes Buch zu kaufen. Und da bei Amazon einige Millionen Titel im Sortiment sind und einige Millionen Käufer mal hier mal da ein Buch kaufen, hüpfen die selten verkauften Bücher dem Anschein nach eher zufällig durch die Ränge.
Amazon verwendet zur Berechnung der Liste natürlich andere Parameter. Dort werden vielleicht die Verkäufe der letzten 48 Stunden oder 5 Tage statt wie in meinem Beispiel 12 Stunden herangezogen. Aber das Prinzip sollte gleich sein. Wichtig ist eben: Es werden nicht die Verkaufszahlen insgesamt abgebildet, sondern nur die Verkäufe über einen bestimmten Zeitraum. Anders wäre es auch langweilig. Dann würde die Bibel ständig auf Platz 1 stehen, dicht gefolgt von Karl Marx.
Kommentar hinzufügen

Kommentare

Jochen Schmidt am 4.7.2012 um 11:46:06 Uhr:
Ich glaube, daß bei Amazon noch die absolute Verkaufszahl mit einfließt, da Bücher, die sich länger nicht verkauft haben, insgesamt aber schon oft, bei einem Verkauf weiter nach oben rutschen als Bücher, die sich insgesamt weniger verkauft haben. Der zeitliche Faktor wird vielleicht in verschiedenen Stufen mit einberechnet, also in Stunden, Tagen und Jahren.
Tube am 4.7.2012 um 14:55:24 Uhr:
@Jochen: Von Büchern, die sich insgesamt schon oft verkauft haben, ist zu erwarten, dass sie auch in Zukunft öfter verkauft werden, als Bücher, die sich insgesamt wenig verkauft haben. Wenn also solch ein gut gelaufenes Buch in der Rangliste mal weit nach hinten rutscht und dann stark hochspringt, könnte es auch daran liegen, dass es mehrere Leute gekauft haben, was, wie geasgt, bei einem bisher gut gelaufenen Buch nicht unwahrscheinlich ist. Man könnte natürlich auch ein Ranking implementieren, das die Verkaufszahlen über mehrere Zeitebenen summiert oder mittelt. Allerdings glaub ich nicht, dass Amazon das macht.
carmina am 5.7.2012 um 11:02:09 Uhr:
Danke Tube , für diese tolle Erklärung. Ich hoffe, die Bücher, die sich bei Amazon anbieten, haben das auch verstanden.
Jochen Schmidt am 25.7.2012 um 09:16:47 Uhr:
@Tube: Ich merke den Unterschied ja bei meinen eigenen Büchern, wo ich die Verkaufszahl kenne. Absolut besser verkaufte Bücher fallen nach einem Verkauf langsamer wieder ab als relativ gut verkaufte. Wieviel in dem Moment verkauft wurden, sehe ich ja bei novelrank. Ich denke, daß Amazon so eine Gewichtung nach Zeitebenen drin hat. Man könnte sich auch zusammentun und mal 1000 Stück von einem absurden Buch bestellen, um zu sehen, was passiert.
Tube am 28.7.2012 um 20:38:25 Uhr:
@Jochen: Ich wäre mir nicht sicher, ob Novelrank sinnvolle Verkaufszahlen anzeigt. Insbesondere bei Büchern, die besser laufen. Aber vielleicht gewichten sie die Verkäufe ja wirklich bei Amazon. Dann würd ich es, meinem obigen Beispiel folgend, so implementieren: Verkäufe der letzten Stunde mal 1 + Verkäufe von vor 2 Stunden mal 1/2 + ... + Verkäufer von vor 12 Stunden mal 1/12. In der Ralität wird das Ganze dann nicht über 12h sondern über ein paar Monate oder so berechnet. Die Idee, zum Test 1000 Bücher zu kaufen, gefällt mir. Ich wüsste ja, mit welchem Buch wir das ausprobieren könnten. Eine andere Frage, die ich mir schon mal gestellt habe: Wird es schon als Verkauf gewertet, wenn man ein Buch nur bestellt? Fließt das schon ins Ranking mit ein? Kann man ein Buch, indem man es 1000 mal bestellt, auf Platz 1 treiben und dann die Bestellungen stornieren?
Jochen Schmidt am 30.7.2012 um 10:18:35 Uhr:
Jedenfalls werden Bestseller so generiert: Die großen Ketten werden von Bertelsmann "gezwungen", ihnen von den potentiellen Bestsellern stapelweise abzunehmen, das gilt dann als verkauft, obwohl 90% zurückgeliefert und anschließend geschreddert werden. Der behauptete Verkauf lohnt sich aber wohl bei genug Titeln, um wirkliche Käufer zu locken. Bei Novelrank kann es sich im oberen Verkaufsbereich ja nur um Schätzungen handeln, weil es ja keine ständigen Ranking-Veränderungen gibt. Aber bei meinen Titeln merkt man noch jeden Ausschlag. Obwohl ich nicht weiß, wie sie merken wollen, wenn 2 auf einmal bestellt wurden.
Stefan M am 17.11.2012 um 10:52:10 Uhr:
es ist alles etwas komplexer als hier dargestellt. denn muss man noch unterscheiden zwischen dem verkaufsrang in den untersch, kategorien und der listung auf den suchseiten.heisst, ein artikel z.b. "vitamin c" kann zwar einen verkaufsrang von sagen wir 10 haben wird aber dennoch hinter einem artikel "vitamin c" gelistet bei der suche, der nur auf verkaufsrang 80 steht. da fliessen noch einige zsuatzfaktor, zeit, menge, also histor. daten, beliebtheit, bewertung mit ein. und ich behaupte auch, dass es produkte mit "versand durch amazon" leichter haben oben zu ranken. einfach weil hier ein eigeninteresse von amazon vorliegt, dass diese artikel eher verkauft werden.