feature request #9500
openAllow removing certain distribution status from distribution publication
10%
Description
from #8858#note-14
An even better solution might be to use a term tree for filtering an ordering the distribution status. Status not in the tree will not be shown/will be filtered out.
An example for distribution data with undefined status is Tanlinum paniculatum ( http://www.europlusmed.org/cdm_dataportal/taxon/3f28aea3-829f-46dc-957a-9991c30050f4 ) on area Madeira archipel and subareas
Files
Related issues
Updated by Andreas Müller almost 2 years ago
- Copied from bug #8858: Ordering of distribution status 'undefined' is not correct in E+M added
Updated by Andreas Müller almost 2 years ago
- Related to bug #8297: Fix condensed distribution string for E+M added
Updated by Andreas Müller almost 2 years ago
- Related to bug #9477: New ordered terms do not have correct order index added
Updated by Andreas Müller almost 2 years ago
- Related to feature request #3816: Create "Undefined" status and choose it for NULL status added
Updated by Andreas Müller almost 2 years ago
- Related to task #9501: Find inconsistent higher area distribution status data in E+M added
Updated by Andreas Müller almost 2 years ago
- Related to task #8671: Distribution in E+M (BM) on different levels added
Updated by Andreas Müller almost 2 years ago
- Related to feature request #9502: Implement subarea preference rule and fallback areas for areas with complex hierarchy added
Updated by Andreas Müller almost 2 years ago
- Related to feature request #3904: EuroMed: Implement filtering rules for distributions added
Updated by Andreas Müller almost 2 years ago
- Blocks feature request #9503: Handle term tree of areas and distribution status for distributionInfo in dataportal added
Updated by Andreas Müller almost 2 years ago
AM:
In einigen Fällen, und insbesondere in den Fällen, bei denen die Unterareale nur eine undefined Verbreitung haben, kommt es zu Ergebnissen, die für mich erstmal nicht optimal aussehen.
Beispiel: Tanlinum paniculatum ( http://www.europlusmed.org/cdm_dataportal/taxon/3f28aea3-829f-46dc-957a-9991c30050f4 ) für Madeira. Dort hat das Unterareal undefined und das Überareal undefined + introduced:reported in error. Die Regel, dass Unterarealdaten bevorzugt werden, führt dann dazu, dass eben nur die undefined Daten für das Unterareal angezeigt werden. Einerseits führt das dazu, dass es mehr undefineds gibt, was nicht per se falsch sein muss, aber natürlich unschön ist. V.a. hört sich das erstmal inkonsistent an, wenn eine Quelle für das gesamte Areal sagt, dass es kein Vorkommen gibt, dann aber die relativ aussagearme undefined Information bevorzugt wird.
Sollten wir hier eventuell besondere Regeln aufstellen für die Behandlung von Subarealen, wenn diese nur undefined Informationen haben? Betroffen sind davon derzeit 407 Fälle (s. Anhang).
... noch ein kleiner Nachtrag: bei der derzeitigen Implementierung kann es auch dazu kommen, dass Daten sowohl im native als auch im introduced Bereich des CondensedDistributionString auftreten, aber mit einem eigentlich nicht passenden Symbol.
Für das Beispiel Talinum paniculatum (http://test.e-taxonomy.eu/dataportal/preview/euromed/cdm_dataportal/taxon/3f28aea3-829f-46dc-957a-9991c30050f4) ergibt sich z.B.
-Md(??M) [aAu(A) pAz(aF aP) aHu -Md]
Updated by Andreas Müller almost 2 years ago
- File picture937-1.png picture937-1.png added
AM:
Und noch etwas bezüglich undefined:
Im alten Portal werden diese Status ja auch grundsätzlich nicht mitbrücksichtigt wie es scheint: http://ww2.bgbm.org/EuroPlusMed/PTaxonDetailOccurrence.asp?NameId=48608&PTRefFk=7300000
Es handelt sich dabei ja wohl weitgehend um die eingeklammerten Status:
Also Informationen, die zwar exisiteren, die aber explizit als weniger glaubwürdig geflaggt sind und somit nicht in die Berechnung der Verbreitung mit einfließen sollen. Dieses Konzept, eine Verbreitung so zu flaggen gibt es im CDM leider noch nicht, aber wir sollten vermutlich darüber nachdenken, sie zu implementieren. Zur Zeit wird die Information ja nur als Annotation gespeichert.
Gut, wenn man alle „undefined“ Verbreitungen grundsätzlich gar nicht berücksichtigt, wird die eigentlich vorhandene Information eben nicht angezeigt, weil falsch oder unsicher.
Derzeit wird sie aber im textuellen als Mouseover noch angezeigt:
was so nicht stimmt. In der Quelle ist der Status ja nicht undefined sondern introduced, lediglich die Quelle ist in diesem Fall nicht glaubwürdig.
Ich werde jetzt auf jeden Fall mal implementieren, dass man die undefined Verbreitungen grundsätzlich komplett rausfiltern kann. Ob wir das dann verwenden oder nicht, können wir ja noch sehen.
Updated by Andreas Müller almost 2 years ago
- File picture851-1.png picture851-1.png added
Updated by Andreas Müller almost 2 years ago
- Status changed from New to In Progress
- % Done changed from 0 to 10
ERS:
Für mich hört es sich plausibel an, für die Behandlung von Subarealen mit dem Status undefined besondere Regeln aufzustellen. Ich vermute, dass der Status ja deswegen undefined ist, weil der ursprüngliche Status vom Bearbeiter verworfen wurde; das müsste man in den Annotationen dazu an einem eingeklammerten Status sehen können. Dann ergibt es keinen Sinn, diesem explizit verworfenen Status eine höhere Priorität über den absence-Status des Hauptareals zu geben, im Gegenteil – in diesem Fall sollte dem Hauptareal-Status der Vorzug gegeben werden. Die Frage ist nur, was man dann mit dem Unterareal-Status undefined macht… weglassen, oder besser in den Daten korrigieren und ihm ebenfalls den absence-status geben, den es ja logischerweise aufweisen muss (was im Hauptareal nicht vorkommt, kann auch in den Unterarealen nicht vorkommen). Ich denke, ein Fall für Data cleaning, händisch oder semi-automatisch.
AM:
Ok, portalseitig lasse ich die undefined Status dann auf jeden Fall weg. Zum Datacleaning: dazu hatte ich dir ja bereits 2 Tabellen (1 Excel) geschickt. Konntest du damit was anfangen? Das sind vermutlich noch nicht alle Fälle, aber auf jeden Fall sind wichtige Fälle dabei. Du kannst ja nochmal überlegen, welche Fälle sonst noch vorkommen können. Für die kann ich das Query dann noch entsprechend anpassen.
Updated by Andreas Müller almost 2 years ago
- Target version changed from Release 5.21 to Release 5.22
Updated by Andreas Müller almost 2 years ago
- Related to task #9524: Use non-model objects in database queries for getDistributionInfoFor added
Updated by Andreas Müller almost 2 years ago
- Target version changed from Release 5.22 to Release 5.38
Updated by Andreas Müller over 1 year ago
- Related to deleted (bug #9477: New ordered terms do not have correct order index)