task #10239
openCaucasus databases and portals available
0%
Description
This is kind of a master ticket for issues related to the 3 caucasus portals and the caucasus project.
Also use the 'caucasus' tag to search for caucasus related issues.
- Import data from caucasus DB to E+M (#10236)
Create 3 portals- Create 3 databases => created but still empty
- Discuss which data to edit in E+M and when/how to fork
- Distribution hierarchy handling in portal (e.g. #5807 and others)
- URLs for the portals
- Discuss:
- which data to show in the slices (only for the country or for the entire caucasus) => see #10239#note-2
- Kew/ILDIS taxa => see #10239#note-3
- WFO-IDs: should we wait until WFO-IDs are imported => see #10239#note-4
- Hybrids: ERS: wahrscheinlich gibt es nicht viele Daten, aber wenn, sollten wir sie mit exportieren. Es ist noch nicht festgelegt, ob Hybriden aufgenommen werden sollen.
- which sec-references to use => see #10239#note-5
- uuids for names, taxa, distribution ..., should they be kept from E+M or created a new => see #10239#note-5
Updated by Andreas Müller about 2 months ago
- Description updated (diff)
NaK:
anbei sind nochmal die drei Proposals. Ich glaube, dass Anton sie kannte, Andreas und Katja aber vermutlich nicht. Es sind drei Anträge (und formell auch drei getrennte Grants) für die drei Länder. Der Einleitungsteil ist immer identisch, die konkreten Arbeitspläne je nach Land leicht unterschiedlich.
Ziel sind Länder-Checklisten und der Aufbau eines Informationssystems in den jeweiligen Ländern, das war die Voraussetzung für die Anträge, es sind Infrastruktur-Proposals für die Partner.
In dem Zusammenhang hatten wir auch ausführlich diskutiert, dass es drei getrennte Datenbanken und Portale sein müssen, sie sind ein konkretes Deliverable des Projektes, nicht etwas, das nur im Antrag steht. Dass das so im Antrag steht, hat ja Gründe. Zum einen werden die Portale vom Inhalt und Auftritt je nach Land unterschiedlich sein, und auch sein müssen, zum Beispiel mit Texten in der Landessprache, Verbreitung in Provinzen oder anderen Einheiten im jeweiligen Land, etc.
Sie sind dann auch nicht inhaltsgleich mit E+M, es sollen zum Beispiel auch Typen enthalten sein, und für Armenien vermutlich auch Flechten.
Es ist außerdem geplant, dass auch die Wissenschaftler*Innen vor Ort editieren und das langfristig auch übernehmen. Schon wegen der bekannten Armenien-Aserbaidschan Problematik kann es keine gemeinsame Datenbank sein, in der Kolleg*Innen aus beiden Ländern editieren. Dieselben Arten heißen in den Ländern manchmal auch anders, die Kolleg*Innen sollen die Möglichkeit haben, das auch so umzusetzen, und das kann auch mal vom Backbone in E+M abweichen.
Maryam kann sicher für einige Wochen erstmal in E+M editieren, aber wir brauchen die getrennten Instanzen und Portale zeitnah, um mit den Partnern über die weiteren Schritte und Inhalte zu sprechen.
ERS:
danke, Nadja, für die ausführliche und zutreffende Darstellung des Hintergrundes. Aus E+M-Sicht und datenbanktechnisch bringt die festgelegte Vorgehensweise sicherlich einige Schwierigkeiten mit sich, die Proposals sind aber eindeutig. Das Ziel ist ja ausdrücklich der Aufbau von Daten-Infrastrukturen für die jeweiligen Länder, die unabhängig voneinander operieren und funktionieren sollen.
Updated by Andreas Müller about 2 months ago
AM:
Verstehe ich es richtig, dass dann im Armenien Slice wirklich nur Taxa landen sollen, die in Armenien vorkommen, und dass auch die Verbreitungsdaten nur aus Armenien stammen sollen, nicht aus dem gesamten Kaukasus.
ERS:
Das hatten wir noch nicht im Detail festgelegt.
Sinnvoll wäre aus meiner Sicht:
1) ja, nur Taxa, die in Armenien vorkommen, aber
2) Verbreitungsdaten werden in Checklisten gerne auch für die Nachbarländer angegeben, sinnvoll wären in dem Fall alle Länder der Ökoregion Kaukasus, für die wir Daten haben (also die drei Südkaukasusländer jeweils mit ihren Unterarealen sowie Nordkaukasus und Türkei., und E+M gesamt zur Angabe über Endemismus).
Welche Daten genau in den Länderchecklisten enthalten sein sollen, ist ja auch in Absprache mit den Partnern noch im Detail festzulegen. Für die Arbeits-Slices sollten wir aber die Daten aus den Nachbarländern behalten.
Updated by Andreas Müller about 2 months ago
- Description updated (diff)
Kew/ILDIS:
ERS:
diese haben ja gar keine Verbreitungsangaben für die Südkaukasusländer, sondern nur für TCS. Sie helfen also in dem Punkt nicht viel weiter.
Eigentlich wollen wir ja auch Originaldaten hier haben.
In unseren Unpublished-Treatments der KEW/Ildis-Familien gibt es dagegen teilweise schon Daten für Armenien, Georgien und Aserbaidschan, die dann im Laufe des Projektes zu ergänzen wären.
Es wäre also sinnvoll, die Länderslices mit unseren unpublished treatments der Kew und Ildis-Famiien zu ergänzen, denke ich. Aber ich muss mir die daten vielleicht nochmal genauer ansehen.
Updated by Andreas Müller about 2 months ago
- Description updated (diff)
WFO-IDs:
NaK:
wäre auf jeden Fall sinnvoll, und das Institut in Baku ist auch Teil des WFO Konsortiums.
Wenn wir die bald von Walter bekommen könnten wir warten, aber wenn nicht, dann könnten die IDs auch später importiert werden, oder auch ganz am Ende wenn die backbones fertig sind, weil in den Slices garantiert Taxa fehlen werden. Vielleicht deshalb besser nicht auf die IDs warten.
ERS:
scheint mir sinnvoll, wenn das zeitnah passieren kann
Updated by Andreas Müller about 2 months ago
- Description updated (diff)
sec-refs:
ERS:
wahrscheinlich gibt es nicht viele Daten, aber wenn, sollten wir sie mit exportieren. Es ist noch nicht festgelegt, ob Hybriden aufgenommen werden sollen.
Updated by Andreas Müller about 2 months ago
- Description updated (diff)
UUIDs:
ERS:
spricht was dagegen, die uuids für Namen gleich zu halten? Da erwarte ich kaum Abweichungen, oder? Bei Taxa oder Verbreitungsdaten könnte ich mir auch vorstellen, dass man teilweise die gleichen IDs hat, aber nicht für alle Fälle...
AM:
it is critical to keep the same uuids if they do not represent the exact same data even if they are stored in 2 different databases. As data will change over time we should not keep the uuids. This is maybe different for names but even there the related data may slightly change and using the same uuids is therefore dangerous. Also on name level we may have WFO-IDs as common identifiers.
At the same time data lineage might be easier if keeping uuids. However, this may not weigh out the disadvantages
Updated by Andreas Müller about 2 months ago
Meeting 2023-01-31:
- Maryam will start entering data from conspectus with E+M areas to complete the taxonomic backbone
- which areas to use needs to be discussed with project partners asap