feature request #6965
Tropicos Import
100%
Description
Auszug Caryophyllales Mail WGB 18.9.2017:
Für den Import brauchen wir dann wohl Deine Hilfe. Wie dargestellt, gehe ich von einem komplett komplementären Namensbestand aus, also kein Abgleich mit vorhandenen Namen (case 1). Ein Check sollte höchstens sein, dass die WFO-ID eindeutig ist, also noch nicht in der Platform Instanz existiert. Wir könnten die Daten im Tropicos Format (aber bereinigt) liefern, wobei mir die unten in der letzten Spalte angegebenen Sachen klar sind (und im Workflow bereinigt werden sollten):
Nochmal zur Erinnerung: Tropicos liefert das folgende Format (hier „transposed“ und mit 2 Beispielen):
Attribute | Example 1 | Example 2 | Note |
---|---|---|---|
FullnameWithAuthors | Ochlopoa annua (L.) H. Scholz | Poa annua L. | Input (eventuell angepasst an Tropicos Abkürzungen (mit Space vor Nachnamen) |
FullnameNoAuthors | Ochlopoa annua | Poa annua | Input |
SourceID | 123 | 124 | Input – die WFO-ID, wo vorhanden |
OutputNameID | 50231428 | 25509881 | Tropicos ID |
OutputHowMatched | FullnameWithAuthors | FullnameWithAuthors | Matching-Meldung (ignorieren) |
OutputFullNameWithAuthors | Ochlopoa annua (L.) H. Scholz | Poa annua L. | Tropicos Name (mit Autor, auch wenn ohne gematcht) |
OutputAbbreviatedTitle | Ber. Inst. Lanschafts- Pflanzenokologie Univ. Hohenheim Beih. | Sp. Pl. | Nom. Titelabkürzung (Buch oder Journal Titel) |
OutputCollation | 16: 58 | 1: 68 | Ignorieren |
OutputVolume | 16 | 1 | Volume ohne Issue – wird mit nächstem beim Bereinigen zusammengefasst. |
OutputIssue | Ignorieren | ||
OutputPage | 58 | 68 | Seite |
OutputTitlePageYear | 2003 | 1753 | Wenn kein Eintrag im nächsten Feld, dann ist das das Year-published, sonst ist es das Jahr in Anführungszeichen (bei meiner Notation) ... |
OutputYearPublished | ... wie soll das für den Import vorbereitet werden? | ||
OutputNomenclatureStatus | No opinion | Legitimate | Nomencl. status – ignorieren, wenn nicht bekannt oder „No opinion“ |
OutputBHLLink | http://www.biodiversitylibrary.org/openurl?pid=title:669&volume=1&issue=&spage=68&date=1753 | Das wäre natürlich Spitze, wenn wir das gleich mit importieren könnten!! Hat mich viel Zeit bei Nepenthes gekostet | |
OutputBatchID | 8191 | 8191 | Ignorieren |
Noch ein Beispiel mit Problemen:
Attribute | Example 1 | Example 2 | Note |
---|---|---|---|
FullnameWithAuthors | Limonium capense L. Bolus | Limonium drepanostachyum Ikonn.-Gal. | |
FullnameNoAuthors | Limonium capense | Limonium drepanostachyum | |
SourceID | 123 | 124 | |
OutputNameID | 25400115 | 25400342 | |
OutputHowMatched | FullnameWithAuthors | FullnameWithAuthors | |
OutputFullNameWithAuthors | Limonium capense L. Bolus | Limonium drepanostachyum Ikonn.-Gal. | |
OutputAbbreviatedTitle | S. African Gard. | Trudy Bot. Inst. Akad. Nauk S.S.S.R., Ser. 1, Fl. Sist. Vyssh. Rast. | |
OutputCollation | 1934, xxiv. 124, in obs., 129, in adnot. | 2: 267, f. 4 | Das muss dann in der Vorbereitung entsprechend auf die folgenden Einträge verteilt werden. im 1. Beispiel: |
OutputVolume | 2 | 1934(24) | |
OutputIssue | |||
OutputPage | 1934 | 267 | 124 in obs., 129 in adnot. |
OutputTitlePageYear | 1936 | ||
OutputYearPublished | 1934 | ||
OutputNomenclatureStatus | No opinion | No opinion | |
OutputBHLLink | |||
OutputBatchID | 8192 | 8192 |
Tropicos gibt beim Bulk matching offenbar keine in-Referenzen zurück. Es bleibt also noch die Kennzeichnung als Artikel oder Buch, das wäre dann eine zusätzliche Spalte.
Open issues¶
- Tests genauer
- Progressmonitor
- "Analyse" vor Import
- Klären, welche Funktionen von Walters Script ins CDM übernommen werden können
- In TaxEditor integrieren
- Welche Feldnamen sollen verwendet werden
- Generischeres Handling von save in Verbindung mit New Records im Importresult, evtl. auch für Source
Related issues
Associated revisions
ref #6965 move CsvImportBase to "in" package
ref #6965 rename static Name Identifier methods
ref #6965 first version of Tropicos import
ref #6965 fix empty TimePeriod matching bug
ref #6965 add PlumbaginaceaeTropicosActivator
ref #6965 fix TropicosNameImportTest
ref #6965 fix compilation issue in ImportDeduplicationHelper
ref #6965 add reference author handling and and reporting for ID duplicates
ref #6965 remove space between initials and name in nomencl. person title
ref #6965 adapt PlumbaginaceaeTropicosActivator to latest changes
ref #6965 revert remove space between initials and name in nomencl. person title as default
History
#1 Updated by Andreas Müller over 3 years ago
Es handelt sich um einen reinen Namensimport. Allerdings sollte es möglich sein, die Namen unter einen definierten Taxonknoten als Taxonliste zu importieren, um sie dann entsprechend einordnen zu können.
#2 Updated by Andreas Müller over 3 years ago
- Description updated (diff)
#3 Updated by Andreas Müller over 3 years ago
- Priority changed from New to Highest
- Severity changed from normal to critical
#4 Updated by Andreas Müller over 3 years ago
- Related to task #6137: Urgent imports added
#5 Updated by Walter Berendsohn over 3 years ago
Ergänzung: Die in der Tabelle mit "Input" bezeichneten Felder sind die, die zu Tropicos hochgeladen wurden. Alle Felder sind "input" für die CDM-Datenbank (wobei OutputFullnameWithAuthors ggf. FullnameWithAuthors dupliziert).
#6 Updated by Andreas Müller over 3 years ago
- Status changed from New to In Progress
- Target version changed from Release 4.11 to Release 4.12
#7 Updated by Andreas Müller over 3 years ago
- Description updated (diff)
#8 Updated by Andreas Müller over 3 years ago
- Related to bug #7094: Remove empty spaces in nomencl. title of persons added
#9 Updated by Andreas Müller 3 months ago
- Copied to feature request #9404: Open issues for Tropicos Import added
#10 Updated by Andreas Müller 3 months ago
- Status changed from In Progress to Closed
- % Done changed from 0 to 100
open issues copied to #9404, close this