Project

General

Profile

bug #4134

feature request #2625: [E+M Overview] Data aggregation functionalities for E+M (TransmissionEngine)

Transmissionengine Distribution seems to miss distributions for higher Taxa

Added by Andreas Kohlbecker about 5 years ago. Updated about 2 years ago.

Status:
Closed
Priority:
New
Category:
cdmlib
Target version:
-
Start date:
08/18/2014
Due date:
09/29/2015
% Done:

100%

Severity:
normal
Found in Version:

Description

reported by Norbert:

wie kommt es eigentlich, dass für das Taxon "Cichorieae" die Transmission Engine Distribution nur so extrem fragmentarischen Inhalt hat ( http://wp6-cichorieae.e-taxonomy.eu/portal/cdm_dataportal/taxon/c34eb662-6bba-4ad7-b84e-dd98f2fd9788)??

Was im Portal angezeigt wird, entspricht dem tatsächlichen INhalt des features "Transmission Engine Distribution ".

This may also affect the euro+med project!

History

#1 Updated by Andreas Kohlbecker almost 5 years ago

  • Keywords set to Euro+Med,Migration

#2 Updated by Andreas Kohlbecker almost 5 years ago

  • Subject changed from Transmissionengine Ditrubution seems to miss distributions for higher Taxa to Transmissionengine Distrubution seems to miss distributions for higher Taxa

#3 Updated by Andreas Kohlbecker almost 4 years ago

  • Subject changed from Transmissionengine Distrubution seems to miss distributions for higher Taxa to Transmissionengine Distribution seems to miss distributions for higher Taxa

#4 Updated by Andreas Kohlbecker almost 4 years ago

  • Status changed from New to In Progress
  • Target version changed from Euro+Med Migration to Release 3.8

#5 Updated by Andreas Kohlbecker over 3 years ago

waiting for #5176 to be solved before starting with this issue.

#6 Updated by Andreas Kohlbecker over 3 years ago

  • Keywords changed from Euro+Med,Migration to Euro+Med,Migration,TransmissionEngineDistribution

#7 Updated by Andreas Kohlbecker over 3 years ago

  • Status changed from In Progress to Worksforme
  • Resolution set to worksforme
  • % Done set to 0
  • Target version deleted (Release 3.8)

wie kommt es eigentlich, dass für das Taxon "Cichorieae" die Transmission Engine Distribution nur so extrem fragmentarischen Inhalt hat (http://wp6-cichorieae.e-taxonomy.eu/portal/cdm_dataportal/taxon/c34eb662-6bba-4ad7-b84e-dd98f2fd9788)

Derzeit gibt es für diese Taxon keinerlei DescriptionElements und insofern auch keine Verbreitungsangaben.

Die Aggregation über die Rangstufen wurde nur für die Rangstufen UNRANKED_INFRASPECIFIC bis GENUS durchgeführt. Dies entspricht exakt dem Verhalten der originalen BerlinModel TransmissionEngine. Hier ein Zitat aus dem Code: "* 6 rank levels to be calculated between microspecies and genus ..._"

Bei der Agregation über die Area-Hierarchie werden dagegen alle Taxa berücksichtigt, Daher hat das Taxon Cichorieae Lam. & DC., eine TransmissionEngineDistribution die aber leer ist da dieses Taxon keine editierten Verbreitungsangaben enthält.

Das original taxon in der BerlinModel datenbank hat ebenfalls keine Verbreitungsangaben http://ww2.bgbm.org/euroPlusMed/PTaxonDetail.asp?NameCache=Cichorieae&PTRefFk=7000000

Insofern ist offensichtlich alles korrekt.

#8 Updated by Andreas Kohlbecker over 3 years ago

  • Status changed from Worksforme to Feedback
  • Resolution deleted (worksforme)
  • % Done changed from 0 to 0

Hallo Andreas,

das verstehe ich nicht ganz: OK, http://cichorieae.e-taxonomy.net/portal/cdm_dataportal/taxon/c34eb662-6bba-4ad7-b84e-dd98f2fd9788 hat keine eigene Distribution, aber die Transmission-Engine-Distribution ist ja nicht leer, sondern hat 8 Einträge, die ja auch angezeigt werden.

Wie auch immer, heißt dies, dass wenn dieses Taxon eine editierte Distribution hat, dann würden die volle Aggregation über die Area-Hierarchie laufen?

Beste Grüße,

Norbert

#9 Updated by Andreas Kohlbecker over 3 years ago

Hi Norbert,

< das verstehe ich nicht ganz: OK, hat keine eigene Distribution, aber die Transmission-Engine-Distribution ist ja nicht leer, sondern hat 8 Einträge, die ja auch angezeigt werden.

das ist tatsächlich etwas seltsam. Ich kann mir das nur so erklären, dass die Transmission-Engine-Distribution für die Cihorieae wohl doch so gestartet worden ist, dass sie über alle Rangstufen läuft. Denn bei Euro+Med, wo der die Standarteinstellung (UNRANKED_INFRASPECIFIC bis GENUS) benutzt worden ist ist alles wie erwartet.

... wenn dieses Taxon eine editierte Distribution hat, dann würden die volle Aggregation über die Area-Hierarchie laufen?

Genau so ist es, die Verbreitungsangaben zu den Arealen werden derzeit für jedes Taxon aufaggregiert, das editierte Verbreitungsangaben hat. Dieser Aggregationsschritt läuft zuerst. Danach startet die Aggregation über die Taxon-Hierarchie. Bei diesem Schritt werden sowohl editierte als auch berechnete Angaben berücksichtigt, wobei die berechneten Vorrang haben.

Der erste Aggregationsschritt über die Areal-Hierachie wird für alle Taxa durchgeführt. Der zweite Schritt kann auf ein bestimmtes Rangintervall beschränkt werden, er bezieht also nur diese Taxa die in diesem Intervall liegen. Dies entspricht exakt dem Verhalten der Transmisison-Engine im Berlin-Model. Ich fände es logischer und auch das Ergebnis der Aggregation wäre konsistenter wenn die Beschränkung auf bestimmte Taxa auch für die Aggregation über die Areal-Hierarchie gelten würde. Ansonsten gibt es Taxa beiden die Verbreitungsangaben der Unter-Taxa mir einbezogen wurde und bei anderen wurde nur die Areal-hierarchie berücksichtigt. Mir leuchtet nicht ein warum man so etwas wollen kann.

Andreas

#10 Updated by Andreas Kohlbecker over 3 years ago

Hallo Andreas,

ich finde es logisch, was Du schreibst und sehe das genauso. Ehrlich gesagt hätte ich auch erwartet, dass sowohl die Areal-Aggregation als auch die Taxa-Aggregation nur bis zu bestimmten Rangstufen durchgeführt werden. Dass dies nicht der Fall ist, wundert mich etwas. Andererseits: in Euro+Med hatten wir editierte Verbreitungsangaben grundsätzlich nur für Unterarten und Arten, da dürfte es also keine Rolle spielen, oder?

Schönen Gruß, Eckhard

#11 Updated by Andreas Kohlbecker over 3 years ago

  • Status changed from Feedback to Closed
  • Resolution set to fixed
  • % Done changed from 0 to 100

Hallo,

ich habe mittlerweile angefangen den code für die Transmissionengine so umzuschreiben, dass alle Aggregationenen nur die Taxa berücksichtigen die vom definierten Rang-Intervals erfasst werden. Dies führ nicht nur zu einer besseren Konsistenz sondern verbessert auch die Performancem, daher sind all diese commits im ticket #5177 (improve perfomance of TransmissionEngineDistribution) zu finden.

Die Frage die zur Eröffnung dieses Tickets geführt hat ist beantwortet, also werde ich das ticket schließen. Die Antwort nochmal in Kurzform: Die TransminssionEngine hat keine Taxa mit höheren Rängen ausgelassen, sondern ein Aggregationsschritt war nicht auf die Taxa im Ranginterval beschränkt, daher die scheinbar unvollständigen Distributions.

Andreas

#12 Updated by Andreas Kohlbecker about 2 years ago

  • Private changed from Yes to No

Also available in: Atom PDF

Add picture from clipboard (Maximum size: 40 MB)