Project

General

Profile

task #8786

Display of mean value with min max

Added by Andreas Kohlbecker 4 months ago. Updated 3 months ago.

Status:
Resolved
Priority:
Highest
Category:
cdm-dataportal
Target version:
Start date:
12/19/2019
Due date:
% Done:

50%

Severity:
normal
Tags:

Description

abgesehen davon, dass die Mittelwertangabe zwischen Min und Max unüblich ist, ... Eine bessere Darstellung wäre ", mean = xx hinter Min+Max .

Wir haben wir diese kompaktere Darstellung implementiert, die zudem auf Angaben zu den TypicalBounds erlaubst. Das Schema hierzu sieht erkklärt anhand eines Beispiels folgendermaßen aus

(1.0)-1.2-2.2-3.1-(3.3)

(1.0)= Min (Extremwert) 
1.2 = TypicalLowerBound
2.2. = Mittelwert
3.1 = TypicalUpperBound
(3.3) = Max (Extremwert)

Ich bin bisher davon ausgegangen, dieses Schema so in Additivity besprochen und beschlossen worden ist.
Vielleicht könnt Ihr das nochmal im Projektteam klären.

Als Ergebnis der unterstehenden Diskussion haben wir uns auf folgendes neues Schema geeinigt:

(1.0–)1.2–3.1(–3.3)[9;x̄=2.2]

(1.0)= Min (Extremwert) 
1.2 = TypicalLowerBound
3.1 = TypicalUpperBound
(3.3) = Max (Extremwert)

Use the n-dash "–" 

in brackets []:

9 = Sample Size
x̄ (x-bar) denotes the mean value

all other values like variance and standard deviation follow the mean value, see #8766

As caption for the aggregated description and for the description table "A single or the first number in square brackets denotes sample size"


Related issues

Related to Edit - bug #8828: statistical values must not show empty brackets Closed 01/24/2020
Related to Edit - bug #8830: add missing spaces to statistical value representations Closed 01/24/2020
Copied from Edit - bug #8739: remaining issues for description detail page Resolved

Associated revisions

Revision 2eb6acb7 (diff)
Added by Andreas Kohlbecker 3 months ago

ref #8786 improved display of min, max, mean and other statistical values

Revision cd3ea2e8 (diff)
Added by Andreas Kohlbecker 3 months ago

ref #8739 updated explanatory text for statistical values

Revision 2f4646e0 (diff)
Added by Andreas Kohlbecker 3 months ago

ref #8786 renaming all min_max_() functions to statistical_values_()

History

#1 Updated by Andreas Kohlbecker 4 months ago

  • Status changed from New to Feedback
  • Assignee changed from Andreas Kohlbecker to Norbert Kilian

#2 Updated by Andreas Kohlbecker 4 months ago

  • Copied from bug #8739: remaining issues for description detail page added

#3 Updated by Andreas Kohlbecker 3 months ago

[Norbert wrote:]

Noch zu der Darstellung der Werte mit Mittelwert. Wenn ich mich richtig erinnere, waren wir uns einig, dass die bevorzugte Darstellung die Quantil (percentile)- Darstellung mit 4 Werten ist. Da wir aber ja die Nutzung von Mittelwerten nicht ausschließen (nehme ich an) sollte wir auch dafür eine verständliche Darstellung haben. Ich würde vorschlagen, den Mittelwert in Klammern nach der range als "(mean = xx)" anzugeben; die jetzige Darstellung nach dem Schema "2-4-5" finde ich unverständlich.

#4 Updated by Andreas Kohlbecker 3 months ago

Hallo,

es kann gut sein, dass die Schreibweise mit dem Mittelwert zwischen den Min und Max Werten nicht abgesprochen war im Projekt (zu solchen Feinheiten sind wir meist noch nicht vorgedrungen). Ich glaube ich hatte das mal irgendwo abgeschaut, vielleicht bei Xper² (oder wo anders) und dachte das wäre so üblich in der Taxonomie.

Aber ich lebe auch gerne mit was anderem: Statt „mean“ würde ich dann aber besser ⌀ https://de.wikipedia.org/wiki/Durchmesserzeichen verwenden. Das ist kürzer, Sprach unabhängig und allgemeinverständlich, denke ich.

Mittelfristig kann man dann die Formatierung auch noch konfigurierbar machen, das hat jetzt aber sicher keine hohe Priorität.

Ähnliches hatte ich irgendwo in einem Ticket oder einer Mail übrigens auch für die Varianz bzw. Standardabweichung vorgeschlagen (also mit Sigma Zeichen). Andreas, hast du das Ticket/die Mail?

Diskutieren müssen wir dann noch, wo das genau stehen soll. Runde Klammern wie von dir vorgeschlagen Norbert, finde ich nicht gut wegen der Verwechslung zu den Perzentilen. Ich fände es eigentlich am sinnigsten, die auch in die eckige Klammern zu tun. Da ständen dann eben die ganzen statistischen Zusatzinformationen. Allerdings müsste man dann wohl doch eher n= schreiben für die Anzahl, statt nur den Wert. Vorteil: man könnte auf die Erklärung verzichten. Nachteil: nimmt mehr Platz ein.

Was denkt ihr?

Viele Grüße,

Andreas M.

#5 Updated by Andreas Kohlbecker 3 months ago

Hallo Andreas,

Mittelwert: ja, solche Details der Darstellung hatte wir noch gar nicht besprechen können.

Klammern: ja du hast recht, eckige sind für derlei besser

Was ⌀ bin ich mir noch etwas unschlüssig ob ich das gut finden soll, mir war das als Zeichen für den Mittelwert bisher gar nicht bekannt, und wird das auch so im englischen Sprachraum verwendet?

Beste Grüße,

Norbert

#6 Updated by Andreas Kohlbecker 3 months ago

Hallo,

vielleicht ist „x bar“ x̄ noch besser. Das sollte mathematisch eindeutig sein.

μ wird wohl auch manchmal verwendet, mir aber nicht so bekannt, und laut https://www.quora.com/What-is-the-symbol-for-average ist x bar das Symbol für sample mean, das sollte passen.

Viele Grüße,

Andreas M.

#7 Updated by Andreas Kohlbecker 3 months ago

Hallo Andreas,

ja, hab ich auch so gefunden, wäre ich auch mit einverstanden. Ich hatte "mean" ausgeschrieben vorgeschlagen, da es auch nur 3 Zeichen länger ist und jeder sofort weiß was gemeint ist.

Beste Grüße,

Norbert

#8 Updated by Andreas Kohlbecker 3 months ago

Hallo Norbert,

wie gesagt, finde ich unschön, dass es sprachabhängig ist (in einem Deutschen Portal müssten wir es übersetzen und da wäre der Name unakzeptabel lang) und insbesondere im Fließtext finde ich 3 weitere Zeichen schon ziemlich viel, wenn das dort häufig vorkommt. Also einigen wir uns auf x bar (x̄) wenn ich es richtig verstanden habe, oder?

Viele Grüße,

Andreas M.

#9 Updated by Andreas Kohlbecker 3 months ago

um sicher zu gehen, dass wir jetzt wirklich vom Selben sprechen.

Das Beispiel aus der Ticket Beschreibung (1.0)-1.2-2.2-3.1-(3.3) wird zu (1.0)-1.2-3.1-(3.3) (x̄ = 2.2)

VG

Andreas

#10 Updated by Andreas Kohlbecker 3 months ago

Achso, ne, wollten wir nicht eckige Klammern um den Mittelwert? Und die Frage steht noch aus, ob in die eckigen Klammern dann alle sonstigen statistischen Werte wie Anzahl und StdAbweichung/Varianz rein sollen, wie diese voneinander getrennt werden und ob dann doch ein n= notwendig wird für die Anzahl.

Viele Grüße,

Andreas M.

#11 Updated by Andreas Kohlbecker 3 months ago

Hallo,

Könnten wir den bis-Strick jeweils in die Klammer hinein nehmen, das ist die gebräuchlichere Variante?

Und: jetzt benutzen wir einen Trennungsstrich (hyphen), typographisch korrekt wäre aber der n-dash (Alt 0150 "–") für alle Bis-Striche.

Ja, ich bin auch für eckige Klammern um den Mittelwert etc. und dafür, eventuelle sonstige statistischen Werte auch in diese eckigen Klammern hineinzunehmen. Die Anzahl sollte zweckmäßigerweise erster Stelle stehen, weil wir sie auch sonst haben, wenn es keine sonstigen Angaben gibt; dann könnten wir wohl auch ohne das n= auskommen. Wir müssen aber den erläuternden Text in der caption abändern, z.B.: "A single or the first number in square brackets denotes sample size). Folgendes am besten wieder durch Semikolon getrennt, also:

(1.0–)1.2–3.1(–3.3) [9; x̄ = 2.2]

Beste Grüße,

Norbert

#12 Updated by Andreas Kohlbecker 3 months ago

Sieht gut aus.

Kleine Anmerkung: ich bin mir nicht sicher, ob wir immer eine Sample Size haben. Gerade bei den Literaturdaten, aber auch sonst wird das nicht unbedingt der Fall sein. Im schlimmsten Fall kann es einen Average aber keinen Count geben. Der Text sollte so gestaltet sein, dass das dann trotzdem noch klar sein. Aber vielleicht wird das aus dem x̄= dann trotzdem ausreichend klar beim jetzigen Text.

Viele Grüße,

Andreas M.

#13 Updated by Andreas Kohlbecker 3 months ago

  • Subject changed from DISCUSS: display of mean value with min max to Display of mean value with min max
  • Description updated (diff)

ich habe in der Ticketbeschreibung nochmals alles zusammengefasst

#14 Updated by Andreas Kohlbecker 3 months ago

  • Description updated (diff)

#15 Updated by Andreas Kohlbecker 3 months ago

  • Description updated (diff)

#16 Updated by Andreas Kohlbecker 3 months ago

  • Description updated (diff)

#17 Updated by Andreas Kohlbecker 3 months ago

  • Status changed from Feedback to Resolved
  • % Done changed from 0 to 50

Done!

The trivial case where only one value exists or when Min = Max or when TypicalLowerBoundary = TypicalUpperBoundary the values are displayed a simpler way:

22[2] instead of 22-22[2;x̄=22] or even [2;x̄=22], standard deviation and variance are suppressed even if they are given.

please review

#18 Updated by Andreas Kohlbecker 2 months ago

  • Related to bug #8828: statistical values must not show empty brackets added

#19 Updated by Andreas Kohlbecker 2 months ago

  • Related to bug #8830: add missing spaces to statistical value representations added

Also available in: Atom PDF

Add picture from clipboard (Maximum size: 40 MB)