Project

General

Profile

feature request #6965

Tropicos Import

Added by Andreas Müller about 1 year ago. Updated about 1 year ago.

Status:
In Progress
Priority:
Highest
Category:
cdmadapter
Target version:
Start date:
09/21/2017
Due date:
% Done:

0%

Severity:
critical
Tags:

Description

Auszug Caryophyllales Mail WGB 18.9.2017:

Für den Import brauchen wir dann wohl Deine Hilfe. Wie dargestellt, gehe ich von einem komplett komplementären Namensbestand aus, also kein Abgleich mit vorhandenen Namen (case 1). Ein Check sollte höchstens sein, dass die WFO-ID eindeutig ist, also noch nicht in der Platform Instanz existiert. Wir könnten die Daten im Tropicos Format (aber bereinigt) liefern, wobei mir die unten in der letzten Spalte angegebenen Sachen klar sind (und im Workflow bereinigt werden sollten):

Nochmal zur Erinnerung: Tropicos liefert das folgende Format (hier „transposed“ und mit 2 Beispielen):

Attribute Example 1 Example 2 Note
FullnameWithAuthors Ochlopoa annua (L.) H. Scholz Poa annua L. Input (eventuell angepasst an Tropicos Abkürzungen (mit Space vor Nachnamen)
FullnameNoAuthors Ochlopoa annua Poa annua Input
SourceID 123 124 Input – die WFO-ID, wo vorhanden
OutputNameID 50231428 25509881 Tropicos ID
OutputHowMatched FullnameWithAuthors FullnameWithAuthors Matching-Meldung (ignorieren)
OutputFullNameWithAuthors Ochlopoa annua (L.) H. Scholz Poa annua L. Tropicos Name (mit Autor, auch wenn ohne gematcht)
OutputAbbreviatedTitle Ber. Inst. Lanschafts- Pflanzenokologie Univ. Hohenheim Beih. Sp. Pl. Nom. Titelabkürzung (Buch oder Journal Titel)
OutputCollation 16: 58 1: 68 Ignorieren
OutputVolume 16 1 Volume ohne Issue – wird mit nächstem beim Bereinigen zusammengefasst.
OutputIssue Ignorieren
OutputPage 58 68 Seite
OutputTitlePageYear 2003 1753 Wenn kein Eintrag im nächsten Feld, dann ist das das Year-published, sonst ist es das Jahr in Anführungszeichen (bei meiner Notation) ...
OutputYearPublished ... wie soll das für den Import vorbereitet werden?
OutputNomenclatureStatus No opinion Legitimate Nomencl. status – ignorieren, wenn nicht bekannt oder „No opinion“
OutputBHLLink http://www.biodiversitylibrary.org/openurl?pid=title:669&volume=1&issue=&spage=68&date=1753 Das wäre natürlich Spitze, wenn wir das gleich mit importieren könnten!! Hat mich viel Zeit bei Nepenthes gekostet
OutputBatchID 8191 8191 Ignorieren

Noch ein Beispiel mit Problemen:

Attribute Example 1 Example 2 Note
FullnameWithAuthors Limonium capense L. Bolus Limonium drepanostachyum Ikonn.-Gal.
FullnameNoAuthors Limonium capense Limonium drepanostachyum
SourceID 123 124
OutputNameID 25400115 25400342
OutputHowMatched FullnameWithAuthors FullnameWithAuthors
OutputFullNameWithAuthors Limonium capense L. Bolus Limonium drepanostachyum Ikonn.-Gal.
OutputAbbreviatedTitle S. African Gard. Trudy Bot. Inst. Akad. Nauk S.S.S.R., Ser. 1, Fl. Sist. Vyssh. Rast.
OutputCollation 1934, xxiv. 124, in obs., 129, in adnot. 2: 267, f. 4 Das muss dann in der Vorbereitung entsprechend auf die folgenden Einträge verteilt werden. im 1. Beispiel:
OutputVolume 2 1934(24)
OutputIssue
OutputPage 1934 267 124 in obs., 129 in adnot.
OutputTitlePageYear 1936
OutputYearPublished 1934
OutputNomenclatureStatus No opinion No opinion
OutputBHLLink
OutputBatchID 8192 8192

Tropicos gibt beim Bulk matching offenbar keine in-Referenzen zurück. Es bleibt also noch die Kennzeichnung als Artikel oder Buch, das wäre dann eine zusätzliche Spalte.

Open issues

  • Tests genauer
  • Progressmonitor
  • "Analyse" vor Import
  • Klären, welche Funktionen von Walters Script ins CDM übernommen werden können
  • In TaxEditor integrieren
  • Welche Feldnamen sollen verwendet werden
  • Generischeres Handling von save in Verbindung mit New Records im Importresult, evtl. auch für Source

Related issues

Related to Edit - task #6137: Urgent imports In Progress 10/19/2016
Related to Edit - bug #7094: Remove empty spaces in nomencl. title of persons Closed 11/24/2017

Associated revisions

Revision 2cc98a0b (diff)
Added by Andreas Müller about 1 year ago

ref #6965 move CsvImportBase to "in" package

Revision 27c167e1 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 rename static Name Identifier methods

Revision 971254b7 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 first version of Tropicos import

Revision bfc6a038 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 fix empty TimePeriod matching bug

Revision 5c67a8b6 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 add PlumbaginaceaeTropicosActivator

Revision c56f0e4a (diff)
Added by Andreas Müller about 1 year ago

ref #6965 fix TropicosNameImportTest

Revision 22fad5e0 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 fix compilation issue in ImportDeduplicationHelper

Revision 69c95165 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 add reference author handling and and reporting for ID duplicates

Revision ecb38d0c (diff)
Added by Andreas Müller about 1 year ago

ref #6965 remove space between initials and name in nomencl. person title

Revision e17185f1 (diff)
Added by Andreas Müller about 1 year ago

ref #6965 adapt PlumbaginaceaeTropicosActivator to latest changes

Revision c578ec73 (diff)
Added by unknown 11 months ago

ref #6965 revert remove space between initials and name in nomencl. person title as default

History

#1 Updated by Andreas Müller about 1 year ago

Es handelt sich um einen reinen Namensimport. Allerdings sollte es möglich sein, die Namen unter einen definierten Taxonknoten als Taxonliste zu importieren, um sie dann entsprechend einordnen zu können.

#2 Updated by Andreas Müller about 1 year ago

  • Description updated (diff)

#3 Updated by Andreas Müller about 1 year ago

  • Priority changed from New to Highest
  • Severity changed from normal to critical

#4 Updated by Andreas Müller about 1 year ago

#5 Updated by Walter Berendsohn about 1 year ago

Ergänzung: Die in der Tabelle mit "Input" bezeichneten Felder sind die, die zu Tropicos hochgeladen wurden. Alle Felder sind "input" für die CDM-Datenbank (wobei OutputFullnameWithAuthors ggf. FullnameWithAuthors dupliziert).

#6 Updated by Andreas Müller about 1 year ago

  • Status changed from New to In Progress
  • Target version changed from Release 4.11 to Release 4.12

#7 Updated by Andreas Müller about 1 year ago

  • Description updated (diff)

#8 Updated by Andreas Müller about 1 year ago

  • Related to bug #7094: Remove empty spaces in nomencl. title of persons added

Also available in: Atom PDF

Add picture from clipboard (Maximum size: 40 MB)