Project

General

Profile

feature request #9552

Add e-article number to Reference

Added by Andreas Müller 16 days ago. Updated 16 days ago.

Status:
New
Priority:
New
Category:
cdm
Target version:
Start date:
03/25/2021
Due date:
% Done:

0%

Severity:
normal

Description

Journals publishing online have started giving numbers for there electronically published articles which seem to have the format e[0-9]{5,} e.g. e017364.

This number should be stored separately for articles to allow formatting in different ways and also for unieque identification of articles for nomenclatural references.

The field should be part of IArticle.


Related issues

Related to Edit - task #9014: Unparsable name strings In Progress 05/14/2020

History

#1 Updated by Andreas Müller 16 days ago

  • Related to task #9014: Unparsable name strings added

#2 Updated by Andreas Müller 16 days ago

ERS:

... und so etwas ist auch nicht parsable (fascicle > 4 Zeichen): Lepyrodiclis alinihatii Menemen & al. in Nordic J. Bot. 2021(e03037): 2. 2021

AM:

ja, das ist dann schon ein schwierigerer Fall, bei dem zu entscheiden ist, ob der Parser eher sehr viel erkennen können soll oder eher strikter sein soll. Man kann ja in Ausnahmefällen dann immer noch per Hand die Daten eintragen.
Kommt sowas denn öfters vor oder für einen bestimmten Typ von Formaten für das Fascicle?
Werden denn die Felder richtig gefüllt und nur eine Warnung erzeugt?

ERS:

bei rein elektronischen Zeitschriften wie dem Nordic Journal of Botany kommt es nun öfter vor, dass die Angaben nicht mehr dem klassischen Standardschema folgen. Ein Artikel hat dann eine eindeutige Nummer (in diesem Fall e03037, was ich als „Faszikel“ interpretiere) und ist von 1-X paginiert, und auf Seite 2 ist der Name validiert.

Und nein, die Felder werden nicht gefüllt, es erscheint eine Error-Meldung, keine Warnung.

Eine Lösung wäre wohl, dass die Faszikel-Angabe mit einem Buchstaben anfangen und bis zu sechs Zeichen enthalten darf. Ich wüsste nicht, welchen Schaden eine derartige Erweiterung anrichten könnte. Ich bin generell eher für einen weniger strikten Parser.

NK:

"Kommt sowas denn öfters vor oder für einen bestimmten Typ von Formaten für das Fascicle?"

Ja, naheliegenderweise gehen immer mehr journals, die (auch) elektronisch publizieren, dazu über, in einem Band Artikelnummern zu vergeben und jeden Artikel separat zu paginieren, statt heftweise zu paginieren.

Der Band kann aber auch noch in Teilbände unterteilt sein, z.B. ... in PLoS One 8(12), e82692: 17. 2013

Wäre also noch zu überlegen, ob man grundsätzlich Artikelnummern (a) durch Komma von der Band/BandFaszikel-angabe trennt (Nordic J. Bot. 2021, e03037: 2. 2021), oder (b) die Artikelnummer ggf. mit in die Faszikelklammer nimmt, also: 8(12, e82692): 17. 2013 bzw. Nordic J. Bot. 2021(e03037): 2. 2021.

Ist mir eigentlich egal. Nur von der IPNI-Lösung, die Seitenzahl als Klammerzusatz zur Artikelnummer zu zitieren, halte ich nicht so viel : " PLoS ONE 8(12): e82692 (17) (2013)".

AM:

ja, das sollten wir dann versuchen in den Parser aufzunehmen.
Abtrennen mit Komma (Lösung a) hat beim Parsen den (vermutlich lösbaren) Nachteil, das bereits jetzt die Mehrdeutigkeit bei Kommas Probleme bereitet z.B. bei der Unterscheidung zwischen Book Section und Artikel, da das Komma eben den Autor abtrennen kann, oder Teil des Titels oder auch zur Separierung des Series Part sein. Wenn‘s da mehr Kommas gibt macht es das nicht einfacher. Das spricht für Lösung b.
Allerdings hängt es auch davon ab, wie gut diese Artikelnummer erkennbar ist. In den beiden Beispielen war es jeweils e[0-9]{5,} also ein e gefolgt von (mind.) 5 Ziffern, wobei die Zahlen einmal auch mit 0 anfingen, es scheint also diese Mindestanzahl zu geben. Das ist prinzipiell leicht zu erkennen, auch wenn es vielleicht auch Fälle mit nur 3 oder 4 Ziffern gibt. Dadurch können wir es dann fürs Parsen an verschiedenen Stellen akzeptieren.
Vermutlich macht es auch Sinn diese Nummer separat zu speichern, damit man dann je nach Bedarf formattieren kann. Insbesondere bei Verwendung auch als bibliographische Referenz scheint mir das Sinn zu machen, da alle Beispiele die ich da beim Stöbern gefunden habe die Artikelnummer hinter den Doppelpunkt setzen, also entsprechend der Kew-Variante. Z.B. e0225964 auf https://libguides.murdoch.edu.au/apa/ejournal oder „PLoS ONE 8(12): e82692“ https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0082692 und sogar beim BGBM „PLoS One 8(12): e82692“ auf https://www.bgbm.org/de/ausgewaehlte-publikationen-0

Entscheidend wäre nun also zu wissen, ob dieses Format der Artikelnummer allgemeingültig ist, oder ob es letztlich nur häufig, aber eben nicht (fast) immer so aussieht. Wisst ihr dazu was?

Übrigens finde ich es ja sehr vorteilhaft, dass es durch die Artikelnummer jetzt auch möglich ist, nomenklatorische Referenzen auf einen konkreten Artikel zu beziehen und nicht nur auf ein Volume + Autoren, was die Zuordnung ja uneindeutig macht.

NK:

die Position der Artikelnummer hinter dem Doppelpunkt hat etwas Intuitives dann, wenn keine Seitenzahlen angegeben werden, deshalb ist diese Zitierweise weit verbreitet (das BGBM Beispiel stammt von mir selbst).
Diese Form ist aber natürlich nicht allgemeingültig.

Wie lassen sich aber dann intuitiv & gut parsbar Seitenzahlen angeben?

AM:

sorry, mein Absatz „Entscheidend wäre nun also zu wissen, ob dieses Format der Artikelnummer allgemeingültig ist, oder ob es letztlich nur häufig, aber eben nicht (fast) immer so aussieht. Wisst ihr dazu was?“ bezog sich nicht auf das Format nach dem Doppelpunkt sondern NUR auf das Nummernformat, also z.B. e82692 .
Das Gesamtzitat-Format hatte ich nur erwähnt um zu zeigen, dass es Sinn macht die Nummer separat zu speichern und z.B. nicht gemeinsam mit dem Volume String, der übrigens derzeit das Faszikel auch mit beinhaltet, was, wenn ich es mir Recht überlege stark dagegen spricht, die Nummer hier mit aufzunehmen. Damit wäre dann doch Lösung b die bevorzugte, denn die lässt sich zwar evtl. etwas schlechter parsen, aber sie lässt sich leicht aus den geparsten Daten wieder rekonstruieren, auch wenn die Artikelnummer separat gespeichert wird. Ich würde also für b) plädieren, sofern das Format wirklich das eindeutige Format e[0-9]{5,} hat.

WHK:

stimme Norbert zu. Allerdings noch eine kleine Komplikation zu Norberts Beispiel. Auch die elektronischen Artikel sind meist paginiert, häufig zusätzlich angegeben als [1-11], eckige Klammern machen Problme? Die Gesamtseitenzahl könnte interessant sein, wenn z.B. bei Novitäten später ein Detail angegeben wird.

AM:

interessant, allerdings wohl nur für bibliographische Referenzen interessant. Wobei ich

Die Gesamtseitenzahl könnte interessant sein, wenn z.B. bei Novitäten später ein Detail angegeben wird.

nicht ganz verstanden habe. Wenn ein Detail angegeben wird, wird doch sowieso die exakte Seitenzahl angegeben, dann braucht man die Gesamtzahl eigentlich nicht mehr. Oder meinst du, um zu unterscheiden, ob sich das Detail auf den e-print oder die „normale“ Version bezieht?

Gibt es denn noch andere Attribute, die sich ändern können in der e-print Version? Also z.B. Publikations-Ort oder so. Und wie ist es mit der ISSN? Ist die die gleiche für die online-Version?

Also available in: Atom PDF

Add picture from clipboard (Maximum size: 40 MB)