Project

General

Profile

feature request #6314

CDM light (csv) export implemented

Added by Katja Luther almost 2 years ago. Updated over 1 year ago.

Status:
Closed
Priority:
New
Assignee:
Category:
cdmadapter
Target version:
Start date:
03/23/2017
Due date:
% Done:

100%

Severity:
normal

Description

(Editorial Workflow in Platform-Projekten)

Hallo Katja,
wie gesagt, bevor wir ernsthaft anfangen, mit mehreren Leuten den Inhalt der Salvador-Datenbank zu aktualisieren (wir haben z.B. schon eine Menge Korrekturen bei den ersten beiden Bänden) möchte ich sicherstellen, dass ich Veränderungen möglichst einfach verfolgen kann. Das ist mir z.Zt. z.B. bei den Caryophyllales nicht möglich, was mich etwas nervös macht. Ich glaube immer noch, das die für einen Taxonomen als inhaltlich verantwortlichen Editor einfachste Lösung im Textvergleich von Outputdokumenten liegt. Da aber einerseits die Anforderungen hier immer sehr unterschiedlich sein werden, andererseits die Programmierung von Text-Output auf Basis einer Datenbank von vielen Leuten gemacht werden könnte, brauchen wir m.A.n. eine von der eigentlichen Platform-Programmierung entkoppelte generische Lösung als Ausgangspunkt.
Dazu hatte ich ja vor einiger Zeit schon mal einen Aufschlag gemacht (s.u.). Wenn ich so eine – auf Knopfdruck zu aktualisierende oder sogar direkt als View implementierte – Datenbasis hätte, dann könnte ich mir selbst (oder z.B. mit Frank oder mit Entwicklern hier in El Salvador) einen Output basteln, der mir volle Editor-Kontrolle von vorgenommenen Änderungen erlaubt. Auch die Implementierung von speziellen Einzelfallqualitätskontrollen würde ermöglicht.
Das wäre dann auch ein Modellfall für den editorial workflow für andere kooperative Bearbeitungen, die auf uns zukommen bzw. bereits stattfinden (z.B. Einsatz von stud. Hilfskräften bei Euro+Med und Arenaria).
Herzlichen Gruß
Walter

Open smaller Subtasks:

  • Add Ipni Identifier (AM) #6515
  • ExportResult handling
  • move to RootNode Id instead of classification id as startpoint
  • partitioning (use getAllChildNodeIds - a method that returns all Ids of the children of a node)
  • progress monitor

open questions:

  • should we provide the possibility to export several classifications, (non unique parent problem)

Subtasks

feature request #6536: extract name export of outputmodel exportRejectedKatja Luther


Related issues

Related to Edit - feature request #6519: Implement ExportResult Resolved 03/16/2017
Related to Edit - feature request #6516: Add instance name and instance ID to CDM meta data In Progress 03/15/2017
Related to Edit - task #6754: Adapt DwcA Export to CDM light export strategy Closed 06/26/2017
Blocked by Edit - feature request #6515: Add Tropicos and IPNI Name Identifer Closed 03/15/2017
Copied to Edit - bug #6627: Remaining cdm light issues New 05/08/2017

Associated revisions

Revision ff3eac53 (diff)
Added by Katja Luther almost 2 years ago

ref #6314: code cleaning for csv import/export

Revision 2e90726e (diff)
Added by Katja Luther almost 2 years ago

ref #6314: implementation in progress, exportResult adaptions

Revision 4ab4eabe (diff)
Added by Katja Luther almost 2 years ago

ref #6314: add deprecated method setSuccess

Revision 85869da5 (diff)
Added by Andreas Müller almost 2 years ago

ref #6314 Add OutputModelTables

Revision dbcb39fb (diff)
Added by Katja Luther over 1 year ago

ref #6314: further implementation

Revision 13bd503e (diff)
Added by Andreas Müller over 1 year ago

ref #6314: some more changes for the Output Model

Revision c762f336 (diff)
Added by Andreas Müller over 1 year ago

ref #6314: add some parameters to OutputModel table

Revision 29419bb9 (diff)
Added by Andreas Müller over 1 year ago

ref #6314: implement deduplication for OutputModel

Revision d688ff5c (diff)
Added by Katja Luther over 1 year ago

ref #6314: start implementing handleName in outputmodel export

Revision f318c828 (diff)
Added by Katja Luther over 1 year ago

ref #6314: handle homotypical group and further implementation for filling the name table

Revision b3babf1b (diff)
Added by Katja Luther over 1 year ago

ref #6314: add homotypicalgroupNameComparator

Revision 03ebde9e (diff)
Added by Katja Luther over 1 year ago

ref #6314: smaller fixes, creation of tropicos full name string, creation of final result etc

Revision f3e1e1fa (diff)
Added by Katja Luther over 1 year ago

ref #6314: adaption to changes in exports

Revision 11d3f2a9 (diff)
Added by Katja Luther over 1 year ago

ref #6314: smaller changes

Revision 38ac74da (diff)
Added by Katja Luther over 1 year ago

ref #6314: add nomenclatural author table

Revision 191fe468 (diff)
Added by Katja Luther over 1 year ago

ref #6314: add classification in taxon table, smaller fixes

Revision d4bf18c9 (diff)
Added by Katja Luther over 1 year ago

ref #6314: add factual data export to outputmodel export

Revision cb9b1284 (diff)
Added by Katja Luther over 1 year ago

ref #6314: adapt outputmodel export for protected titlecaches and add fact_type to source table

Revision 53eeb3a2 (diff)
Added by Katja Luther over 1 year ago

fix #6314: add homotypicalGroupSequenceNumber

History

#1 Updated by Andreas Müller almost 2 years ago

  • Subject changed from Editorial Workflow in Platform-Projekten to Output model for platform projects
  • Description updated (diff)
  • Category set to cdmadapter

Katja: Ich habe diese und die vorherige Version auch nochmal unter Y:\BDI\EDIT-Plattform_Latest Versions\Output Model abgelegt.

#2 Updated by Katja Luther almost 2 years ago

  • Target version changed from Unassigned CDM tickets to Release 4.7

#3 Updated by Katja Luther almost 2 years ago

  • Status changed from New to In Progress

#4 Updated by Katja Luther almost 2 years ago

  • Description updated (diff)

#5 Updated by Katja Luther almost 2 years ago

  • Description updated (diff)

#6 Updated by Andreas Müller almost 2 years ago

#7 Updated by Andreas Müller almost 2 years ago

  • Description updated (diff)

#8 Updated by Andreas Müller almost 2 years ago

#9 Updated by Andreas Müller almost 2 years ago

#10 Updated by Andreas Müller almost 2 years ago

#11 Updated by Katja Luther over 1 year ago

  • Description updated (diff)

#12 Updated by Katja Luther over 1 year ago

  • Description updated (diff)

#13 Updated by Katja Luther over 1 year ago

  • Description updated (diff)

#14 Updated by Katja Luther over 1 year ago

  • Description updated (diff)

#15 Updated by Katja Luther over 1 year ago

  • Description updated (diff)

#16 Updated by Andreas Müller over 1 year ago

#18 Updated by Andreas Müller over 1 year ago

Formatting of Types is also discussed at #461

#19 Updated by Katja Luther over 1 year ago

added the infraspecific and infrageneric rank abbreviation > Revision 11d3f2a9

#20 Updated by Katja Luther over 1 year ago

missing or not working:

  • protologue uri

  • nomenclatural status

  • die Reference_ID der Nomenklaturreferenz in der Namenstabelle

  • FullNameWithAuthor (Punkt nach den Initialen, andere Tropicos spezifischen Formatierungsregeln?)

  • FullRefAuthor

  • TitlePageYear

  • Collation: Wird nicht ausgegeben. Konkateniert aber auch nur die zwei folgenden (Vol/Issue, Detail) mit Doppelpunkt und Leerzeichen dazwischen

  • HomotypicGroupSequenceNumber

  • in der Reference Tabelle, zum Autorenteam auch die Autorenteam-ID

  • eigene Tabelle für Identifier

  • Facts containing only media data should be moved to an extra table.

  • Discuss whether we should handle the citation facts separate to the other simple facts because it is confusing that the row in the simple fact table is no information.

  • add export of usage data

  • add export of annotations

  • add export of IndividualsAssociations and TaxonInteractions

#21 Updated by Andreas Müller over 1 year ago

WGB:

zu Tropicos Format. Ich wüsste nicht, dass das irgendwo dokumentiert ist. Mir fällt dazu ein:
Für jeden Einzelautor bei Klammer- und Kombinations-Autorenteams plus jeweils ex-Autorenteams

  • Initialen mit Punkten
  • Initialen ohne Leerzeichen gereiht und dann vor dem Nachnamen bzw. der Nachnamenabkürzung ein Leerzeichen
  • der Suffix „f.“ (für filius) mit Leerzeichen davor. Also Hook. f. – nicht Hook.f. wie in IPNI.

Bei der Teambildung

  • Die Standardabkürzungen hintereinander ausgegeben, also ohne Veränderung des Standards
  • Liste mit Komma dazwischen bzw. zwischen den letzten beiden mit „&“.
  • Beim Datenbankoutput über die Name-Check Funktion gibt’s meiner Ansicht nach keine Begrenzung der Anzahl der Autoren.

#22 Updated by Andreas Müller over 1 year ago

WGB: Eine allgemeine Sache noch: Beim Import/Verlinkung in Access wird ein die Zeile abschließendes Semikolon in den Feldtext einbezogen, wenn da nichts mehr kommt. Also das bitte weglassen; das entspricht auch den gängigen Empfehlungen für CSV-artige Formate [rfc4180].

#23 Updated by Katja Luther over 1 year ago

Discuss whether we should handle the citation facts seperate to the other simple facts because it is confusing that the row in the simple fact table is no information.

#24 Updated by Katja Luther over 1 year ago

Facts containing only media data we should move to an extra table.

#25 Updated by Katja Luther over 1 year ago

Katja Luther wrote:

Discuss whether we should handle the citation facts seperate to the other simple facts because it is confusing that the row in the simple fact table is no information.

WGB:
Hallo,
citation facts im Sinne von „das Taxon wurde auch in diesen Quellen genannt“ (wie z.B. in Flora Malesiana? Also eigentlich so etwas wie nicht explizit als Konzeptbeziehung definierte Potential Taxa? Das haben wir auch in der Salvador Datenbank, da als einfaches Textfeld (2 davon) – dort ist es eine Mischung eines Präsenzbelegs (im Fall des Felds „Reported for El Salvador“), der Konzeptrelation (dort im Text angegeben – „included in“ etc.) und einer Literaturreferenz für das Taxon (im Sinne von – „hier gibt’s eine Beschreibung“). Das 3. Feld sind die Illustrationen, die auch als Literaturreferenz gelistet werden.
Ich weiß nicht, ob die Modellierung hier schon ganz klar ist? In jedem Fall würde die von Euch vorgeschlagene Lösung ja immer die Selbstdefinition einer Text-Fact-Category (eines Features) weiterhin erlauben, also habe ich keine prinzipiellen Einwände.
Herzlichen Gruß
Walter

#26 Updated by Katja Luther over 1 year ago

  • Status changed from In Progress to Resolved
  • % Done changed from 100 to 50

#27 Updated by Katja Luther over 1 year ago

close this ticket because the topics from the first definition of the outputmodel is implemented. Create a new ticket with follow up issues. (#6627)

#28 Updated by Katja Luther over 1 year ago

  • Related to bug #6627: Remaining cdm light issues added

#29 Updated by Andreas Müller over 1 year ago

  • Related to deleted (bug #6627: Remaining cdm light issues)

#30 Updated by Andreas Müller over 1 year ago

  • Copied to bug #6627: Remaining cdm light issues added

#31 Updated by Katja Luther over 1 year ago

  • Assignee changed from Katja Luther to Andreas Müller

#32 Updated by Andreas Müller over 1 year ago

  • Subject changed from Output model for platform projects to CDM light (csv) export implemented

#33 Updated by Katja Luther over 1 year ago

  • Assignee changed from Andreas Müller to Katja Luther

#34 Updated by Katja Luther over 1 year ago

  • Private changed from Yes to No

#35 Updated by Andreas Müller over 1 year ago

#36 Updated by Andreas Müller over 1 year ago

#37 Updated by Katja Luther over 1 year ago

  • Status changed from Resolved to Closed

#38 Updated by Andreas Müller over 1 year ago

  • Related to task #6754: Adapt DwcA Export to CDM light export strategy added

Also available in: Atom PDF

Add picture from clipboard (Maximum size: 40 MB)