task #6009
closedImport the IAPT database into a cdm instance
100%
Description
Import aller Algen-Namen in 2 CDM Instanzen:
- Eine Instanz als Ersatz für die alte IAPT Anwedung: Komplettimport - DONE http://test.e-taxonomy.eu/cdmserver/iapt/
- Eine Instanz als Basis für die Algenregistrierung: Gefilterer Import, SQL Filter für alle Algennamne:
higherRank='%PHYCEAE%'
- DONE http://test.e-taxonomy.eu/cdmserver/phycobank/portal/classification
Columns in the csv file:
- RegistrationNo_Pk
- HigherTaxon
- FullName
- AuthorsSpelling
- LitString
- Registration
- Type ==> Needs to be parsed, see comment
- Caveats
- FullBasionym
- FullSynSubst
- NotesTxt
- RegDate
- NameString
- BasionymString
- SynSubstStr
- AuthorString
CDM instances:
Files
Updated by Andreas Kohlbecker about 8 years ago
- Tracker changed from bug to task
Updated by Andreas Kohlbecker about 8 years ago
- Description updated (diff)
- Status changed from New to In Progress
Updated by Wolf-Henning Kusber about 8 years ago
Andreas Kohlbecker wrote:
Import aller Algen-Namen in 2 CDM Instanzen:
- Eine Instanz als Ersatz für die alte IAPT Anwedung: Komplettimport
- Eine Instanz als Basis für die Algenregistrierung: Gefilterer Import, SQL Filter für alle Algennamne:
higherRank='%PHYCEAE%'
Columns in the csv file:
- RegistrationNo_Pk
- HigherTaxon
- FullName
- AuthorsSpelling
- LitString
- Registration
- Type
- Caveats
- FullBasionym
- FullSynSubst
- NotesTxt
- RegDate
- NameString
- BasionymString
- SynSubstStr
- AuthorString
siehe auch Subtask
Updated by Andreas Kohlbecker about 8 years ago
- Description updated (diff)
Die Typus informationen liegen nur als Freitext vor und enthalten teilweise recht viel Informationen, darunter auch Holotyp, Isotyp, Location.
Genügt es für den Prototypen diese Daten als Freitext zu übernehmen oder brauchen wir diese in atomisierter Form?
Henning:
Darüber haben Eckhard und ich heute gesprochen. Dort wo ein Holotyp oder Isotyp vorkommt sollte eine Atomisierung möglich sein, beginnend jeweils mit der Sammlung, gefolgt vom Barcode, bzw. der Nummer des Sammlungsobjekts. Dort wo nur "Typus" und "Locality" steht sind Texte aus den Publikationen übernommen, d.h. nicht atomisierbar weil nicht standardisiert eingegeben
Updated by Andreas Kohlbecker almost 8 years ago
- Target version set to IAPT Import ready
Updated by Andreas Kohlbecker almost 8 years ago
- Description updated (diff)
for details on the filtered import, see #6026
Updated by Andreas Kohlbecker almost 8 years ago
- Status changed from In Progress to Resolved
The import is fully implemented and has been successfully run.
Updated by Andreas Kohlbecker about 7 years ago
- Status changed from Resolved to Closed
We will no longer work on the import to improve data quality, so this issue can be closed.
Updated by Andreas Kohlbecker over 6 years ago
- File cdm_algea_registry-import-errors-09-20-16.xls cdm_algea_registry-import-errors-09-20-16.xls added
- File cdm_algea_registry-import-stats-09-20-16.txt cdm_algea_registry-import-stats-09-20-16.txt added
- File cdm_iapt-import-errors-09-20-16.xls cdm_iapt-import-errors-09-20-16.xls added
- File cdm_iapt-import-stats-09-20-16.txt cdm_iapt-import-stats-09-20-16.txt added
- File IAPT_Import-Analyse-Henning-2016-09-12.xls IAPT_Import-Analyse-Henning-2016-09-12.xls added
adding reports on the final imports as attachment