Editionsmodell
Version: 1.0
Publikation: 31.07.2023
Einleitung
Im Folgenden werden einige Grundsätze, die bei der Konzeption des Editionsmodells angestrebt werden, beschrieben. Das Ziel besteht darin, dass die spezifischen Regeln im Zusammenhang mit der Textkonstitution und der Referenzierung möglichst mit diesen Grundsätzen kompatibel sind. Zu diesem Zweck werden die spezifischen Regeln laufend überarbeitet und weiterentwickelt.
Ausrichtung des Editionsmodells
Das Editionsmodell soll eine möglichst grosse Homogenität der Editionen gewährleisten, aber gleichzeitig flexibel und einfach anwendbar sein. Dadurch ist es einerseits für eine angemessene philologische Bearbeitung der Texte und gleichzeitig auch für die Anwendung durch ein breiteres Publikums (Studierende, Gastedierende, Kooperationspartner:innen) geeignet.
Im Umgang mit textspezifischen Eigenheiten (z.B. unregelmässige Interpunktion, unregelmässige Setzung der diakritischen Zeichen und Apostrophs usw.) besteht eine gewisser Spielraum, welcher in der Einleitung definiert werden kann.
Verhältnis von Kodierung und Darstellung
Als Standard für die Kodierung wird TEI-XML verwendet. Dadurch wird im Sinne der FAIR-Data Kriterien eine langfristige Anschlussfähigkeit und Interoperabilität gewährleistet.
Bei der Kodierung wird konsequent zwischen Inhalt und Darstellung (Rendering) unterschieden. Dadurch ist es möglich, unterschiedliche Formen der Ausgabe und Darstellung von Inhalten zu kreieren. Vermischungen semantischer und formaler Ausdrucksformen sind nach Möglichkeit zu vermeiden. Eine solche Vermischung findet beispielsweise statt, wenn textkritische Phänomene allein durch das Rendering ausgedrückt werden.
Bei komplexen textkritischen Erscheinungsformen, die sich nicht mit den bestehenden Kodierungsmöglichkeiten ausdrücken lassen, wird auf eine Auszeichnung verzichtet und stattdessen das Phänomen in einer textkritischen Anmerkung semantisch umschrieben. Dieser Ansatz eignet sich auch für Editionen, die nicht mit dem Oxygen XML Editor (z.B. Editionen in Word) verfasst werden. In den nachfolgenden Ausführungen zum Editionsmodell wird jeweils darauf hingewiesen, wo entweder eine Kodierung oder eine semantische Beschreibung möglich ist.
Verhältnis von Textkritik und Referenzierung
Bei Textstellen, die als Entität (Personen, Orte, Institutionen, Publikationen usw.) referenziert werden können, wird keine Normalisierung in texkritischer Form vorgenommen. Die Normalisierung ergibt sich über die Namensvarianten in der referenzierten Entität. In letter_00068 schrieb Allioni beispielsweise "Nismes". Die heute gebräuchliche Schreibweise "Nîmes" ist in der Referenz auf die Ortschaft ersichtlich. Zudem führt die Suche nach "Nîmes" in der Suchmaschine zum entsprechenden Brief.
Textstruktur
In allen Editionen erfolgt eine Unterteilung der Texte in einzelne Einheiten (z.B. Briefe, Manuskripte, Versammlungen usw.) sowie in Seiten und Absätze, was ohne Kodierungskenntnisse realisiert werden kann. Letzteres gilt auch für Zeilenumbrüche, deren Umsetzung jedoch fakultativ ist.
Darüber hinaus ist es möglich, Texten je nach Entitätsgruppe (z.B. Briefe) eine spezifische Gliederung zu verleihen, was insbesondere für erweiterte Formen der Darstellung und Auswertung zentral ist. Im Weiteren gibt es bestimmte Strukturelemente wie Tabellen oder Listen, die unabhängig von der Entitätsgruppe benutzt werden können. In der Regel erfordern diese beiden Strukturierungsansätze eine Auszeichnung in TEI-XML.
Briefstruktur
Die Struktur eines Briefes umfasst verschiedene Elemente, die in der Regel nach semantischen Kriterien zugewiesen werden. Räumliche Abweichungen werden dabei in Kauf genommen. Die Idealstruktur zeigt folgenden Aufbau:
- Brief gegliedert in Seite(n) |
<pb/>
- Eröffnung |
<opener/>
- Anredeformel |
<salute/>
- Anredeformel |
- Textkörper
- Gegliedert in Paragraphen |
<p/>
- Gegliedert in Zeilen |
<lb/>
- Gegliedert in Paragraphen |
- Abschluss |
<closer/>
- Grussformel |
<salute/>
- Unterschrift |
<signed/>
[Namen/Unterschrift/Spezifikation o.Ä. i.d.R. bis zur dateline] - Datumszeile |
<dateline/>
[Datum/Ort]
- Grussformel |
- Nachschrift
| <postscript/>
- Adressfeld |
<closer/>
- Adresse |
<address/>
- Zeilen in der Adresse |
<addrLine/>
- Adresse |
Mögliche Abweichungen von der Idealstruktur sind:
- Vorhandensein einer Datumszeile oder Unterschrift in der Eröffnung
- Keine Anredeformel in der Eröffnung
- Keine Anredeformel, Unterschrift oder Datumszeile im Adressfeld
- Kein Postscript, kein Adressfeld
Spezialfall: salute und signed
Der Bedeutungsunterschied der Elemente <salute>
und <signed>
ist in den TEI-Guidelines nicht klar definiert. I.d.R. werden Grussformeln mit <salute>
ausgezeichnet und nicht mit <signed>
.
Beispiel der TEI-XML-Kodierung eines Abschlusses mit einer Grussformel
<closer>
<salute>Ich verbleibe alstets<lb/>Ew Hochedelgeb.<lb/>Ergebenster diener</salute>
<signed>Munchhausen</signed>
<signed>Allioni le fils</signed>
</closer>
Allgemeine Strukturelemente
Tabellen und Listen
Tabellenartige Strukturen und Listen werden generell nicht vorlagengetreu nachgebildet, sondern gemäss der Interpretation der Edierenden in einer vereinfachten Form funktional dargestellt. Dabei kann die Struktur entweder mit Hilfe von Absätzen nachgebildet oder mit TEI-XML als Tabelle oder Liste kodiert werden. Einzüge und Einrückungen werden nicht nachgebildet.
Tabellen können mit dem Element <table>
und Listen mit <list>
umschlossen werden. Einträge in Listen werden mit <item>
ausgezeichnet. <table>
und <list>
sollten als Block-Elemente neben <p>
stehen (aber nicht in <p>
).
Beispiel der TEI-XML-Kodierung einer Tabelle (vgl. letter_00287)
<table>
<row>
<cell/>
<cell>44. Unzen, alſ,</cell>
</row>
<row>
<cell>1. Mezen</cell>
<cell>704. Unzen, und</cell>
</row>
<row>
<cell>1. Sra</cell>
<cell>11,264. Unzen.</cell>
</row>
</table>
Beispiel der TEI-XML-Kodierung einer Liste (vgl. letter_00287)
<list>
<item>32. Mezen, und jede dieſer Mez.</item>
<item>18. Maas</item>
</list>
Zitate
Zitate aus literarischen Texten, Briefen, Rezensionen u.ä. können mit dem Element <quote>
ausgezeichnet werden. Wurden die Passagen von den Schreibenden mittels Unterstreichung hervorgehoben, wird dies ebenfalls nachgebildet. Ist die Herkunft eines Zitats aus literarischen Texten, Briefen, Rezensionen u.ä. bekannt, kann dies in einer freien Annotation beschrieben werden. Diese kann wiederum eine Referenz auf den zitierten Text oder das Werk (ggf. nur den Autor) enthalten, wenn ein Datenbankeintrag vorhanden ist.
Kustoden
Kustoden werden gemäss Editionsmodell Standard vereinfacht wiedergegben. Zu diesem Zweck wird der entsprechende Begriff nur auf der Folgeseite (nach dem Seitenumbruch) transkribiert und nicht ausgezeichnet (vgl. letter_03954, letter_03955).
Eine TEI-XML-Auszeichnung von Kustoden wird nur im Rahmen der erweiterten Textkonstitution vorgenommen.
Datumsangaben
Datumsangaben werden im transkribierten Text weder kommentiert noch ausgezeichnet. Falls sie sich auf die edierte Entität als Gesamtheit beziehen, können sie in den Strukturdaten des jeweiligen Objekts aufgenommen werden.
Annotationen
Das Annotationssystem präzisiert das Zusammenspiel zwischen den Editionstexten und den Strukturdaten. Dies bildet ein Kernelement der datenzentrierten Ausrichtung von hallerNet.
Annotationstypen
Auf der Plattform hallerNet werden drei unterschiedliche Annotationstypen verwendet:
- Referenzannotationen
- Freie Annotationen zum Inhalt
- Annotationen zur Textkonstitution
TEI-XML-Kodierung
1. <rs><note type="annotRef"><p/></note></rs>
2. <note type="annotFree" n="1"><p/></note>
3. <note type="annotText" n="1*"><p/></note>
Nummerierung von Annotationen:
Freie Annotationen zum Inhalt sowie Annotationen zur Textkonstitution werden automatisch nummeriert, was im Frontend abgebildet wird. Die Nummerierung beginnt pro Brief und Annotationstyp jeweils bei 1, wobei Annotationen zur Textkonstitution zusätzlich mit einem Stern * versehen sind. Referenzannotationen werden nicht nummeriert. Die Referenz erscheint auf der Plattform als Hyperlink, welcher ein Modal öffnet. Allfällige Anmerkungen zur Referenz werden im Modal angezeigt.
Referenzen innerhalb von Annotationen:
Alle drei Annotationstypen können Referenzen auf Entitäten in der Datenbank enthalten. Die referenzierten Entitäten werden i.d.R. gemäss der Schreibweise ihres Datenbankeintrags (Label) genannt, z.B. *Vorrede GGA (1747). Bei Einzelpublikationen ist die Jahresangabe obligatorisch, überall sonst ist sie fakultativ, z.B. GdW Göttingen oder GGA. Bei Personen gibt es vorangestellte Initialen, z.B. G. A. v. Münchhausen.
Formatierungen innerhalb von Annotationen:
In den Annotationen wird über die typographische Differenz von kursiver und aufrechter Schrift zwischen Editortext und Originaltext der Handschriften oder Drucke unterschieden: Editortext erscheint immer kursiv (inkl. aller zur editorischen Annotation gehörenden Interpunktionen), Originaltext erscheint recte.
Referenzannotationen
Mit Referenzannotationen kann die Beziehung der referenzierten Entität zum Originatext beschrieben werden:
- Unsicherheit der Identifikation: Referenz: GdW Göttingen, Kontextinfo: Evtl. GdW Danzig.
- Abweichung des Quellenbegriffs vom systematischen Begriff für das referenzierte Objekt.
- Information, die über die allgemeine Information im referenzierten Objekt hinaus die spezifische Situation im Originaltext erklärt. Dies ist auch in Form einer Referenz möglich, z.B. Referenz: Göttingen, Kontextinfo: Gemeint ist hier insbesondere GdW Göttingen.
Konventionen zur Schreibweise in Referenzannotationen:
- In einer Referenzannotation wird nur der Name einer referenzierten Person abgekürzt (auf den Anfangsbuchstaben des Nachnamens, z.B.: Wahrscheinlich handelt es sich um T., der damals vor Ort war.). Werden jedoch mehrere Personen mit demselben Anfangsbuchstaben erwähnt, wird der Nachname ausgeschrieben. Werden mehrere Personen mit demselben Nachnamen erwähnt, können die Vornamen ausgeschrieben werden.
- Wird innerhalb der freien Annotationen ein Werk zitiert, geschieht dies nach folgendem Schema: Vgl. [Label der Publikation]: [Seitenzahlen]. (Bsp.:
Vgl. Sonntag (1983): 983.
)
Beispiel der TEI-XML-Kodierung einer Referenzannotation
<rs type="person" key="person_27256" xml:id="hallerNet_letter_00002_ref-1">Johann Scheffield<note n="161" type="annotRef"><p>Wahrscheinlich dieser S.</p></note></rs>
Regeln der TEI-XML-Kodierung von Referenzannotationen
Das <rs>
-Element muss zwingend zwei Attribute enthalten:
@type
. Mögliche Attributwerte (bzw. Entitätstypen) sind person, place, institution, publication, letter, review (zurückgestellt ist plant).@key
. Der Attributwert entspricht der ID des Objekts und setzt sich aus dem Entitätstyp, einem Unterstrich und der fünfstelligen Nummer zusammen, z.B. person_01200. Bezüglich der<note type="annotRef">
sollte beachtet werden, dass
- die
<note>
vor das End-Tag des<rs>
-Elements gestellt wird; - zwischen dem End-Tag der
<note>
und dem End-Tag des<rs>
-Elements keine Leerzeichen enthalten sein dürfen; - die
<note>
genau ein Paragraph-Element<p>
enthält.
Freie Annotation zum Inhalt
Freie Annotationen beziehen sich nicht auf eine bestimmte Referenz, sondern in einem inhaltlichen Sinn auf eine bestimmte Textstelle. Sie stehen «frei» im Text und können z.B. Kommentare enthalten, auf weiterführende Informationen verweisen oder eine Passage im Text erklären. Wenn sich die freie Annotation auf einen ganzen Satz oder eine Phrase bezieht, steht sie nach dem Satzzeichen, ansonsten immer direkt beim Wort, auf das sie sich bezieht.
Beispiel der TEI-XML-Kodierung einer freien Annotation
Pietra di Dair<note n="28" type="annotFree"><p>Pyrit, Schwefelkies.</p></note>
Regeln der TEI-XML-Kodierung von freien Annotationen
Freie Annotationen zum Inhalt bestehen aus einer <note>
vom Typ <annotFree>
. Bei der Kodierung ist zu beachten, dass
- die
<note>
genau ein Paragraph-Element<p>
enthält; - der
<note>
kein Leerzeichen vorangehen darf.
Annotation zur Textkonstitution
Annotationen zur Textkonstitution dienen der semantischen Beschreibung textkritischer Phänomene. Wenn sich die textkritische Annotation auf einen ganzen Satz oder eine Phrase bezieht, steht sie nach dem Satzzeichen, ansonsten immer direkt beim Wort, auf das sie sich bezieht. Die Vorgaben zur semantischen Beschreibung werden im Bereich der Textkonstitution spezifiziert.
Referenzierung
Es wird grundsätzlich zwischen textbasierter und entitätsbasierter Referenzierung unterschieden. Während bei der textbasierten Referenzierung im edierten Text ein bestimmter Quellenbegriff direkt mit einer Referenz zu einer Person, einem Ort, einer Publikation usw. versehen wird (vgl. "Hl. Professor König" in letter_00002), wird in Rezensionen das besprochene Werk ohne direkten Textbezug referenziert, womit es in den Strukturdaten erscheint (vgl. "Artis med. principes (1769-74)" in review_03270).
Alles Folgende bezieht sich auf die textbasierte Referenzierung.
Für alle Dokumenttypen gilt, dass explizite Erwähnungen von Entitäten nur einmal pro Einheit (Brief, Beilage, Einleitung, Rezension, Seite etc.) ausgezeichnet werden, wobei nur die erste Nennung referenziert wird. Eine Ausnahme bilden Briefe mit Beilagen, wo eine Doppelauszeichnung der gleichen Entität möglich ist. Für Briefe gilt zudem, dass in der Eröffnung und im Adressfeld generell keine Entitäten ausgezeichnet sowie Absender, Adressat, Absende- und Adressort in den Strukturdaten hinterlegt werden.
Grundsätzlich sollen verschachtelte Auszeichnungen vermieden werden, weshalb Entitäten, die zueinander in Bezug stehen und im Text unmittelbar aneinandergereiht erscheinen, soweit möglich und aus Quellensicht sinnvoll (z.B. wenn Wortlaut/Formulierung im Zweifelsfall höher zu gewichten ist) unter einer Referenz subsumiert werden:
Richtlinie | Beispiel |
---|---|
Ort subsumieren unter Personennennung | mein Freund in Göttingen |
Ort subsumieren unter Institutionsnennung | Universität Göttingen |
Ort subsumieren unter Ortsnennung | Bümpliz bei Bern |
Person subsumieren unter Werknennung | Hallers Flora |
Person subsumieren unter Briefnennung | Brief von Haller an Caldani |
Person subsumieren unter Personennennung | Hallers Mutter |
Person und Publikation subsumieren unter Rezensionsnennung | ihre Rezension meines Werks in den GGA |
Bei Ambivalenzen, z.B. Institution vs. Ort (X studierte in Göttingen) oder Verlag vs. Person (gedruckt von Vandenhoeck) wird, wenn immer möglich, auf die wörtliche Nennung referenziert. Im Zweifel kann eine Ergänzung in einer Referenzannotation gemacht werden.
Falls sich eine Entität nicht ermitteln bzw. benennen lässt, kann sie dennoch mit einer Referenz versehen werden. Diese enthält die Information, dass es sich um eine unbekannte Entität einer Entitätsgruppe (Personen, Institutionen etc.) handelt.
Beispiele der TEI-XML-Kodierung unbekannter Entitäten
<rs type="person" key="person_unknownReference">Madame Ougsburger</rs>
<rs type="publication" key="publication_unknownReference">ce livre</rs>
<rs type="institution" key="institution_unknownReference">Landes Regierung</rs>
<rs type="place" key="place_unknownReference">montagnes de Vinay</rs>
Je nach Entitätsgruppe gelten unterschiedliche Regeln, inwiefern unbekannte Entitäten referenziert werden, was nachfolgend beschrieben wird.
Erwähnte Personen
Nicht-identifizierte Personen werden i.d.R. nur dann als Objekt neu aufgenommen, wenn mindestens der Nachname vorhanden ist. Ansonsten werden diese als <person_unknownReference>
markiert. Als Spezialfälle werden namenlose Personen, die in ihrer Funktion als Individuen identifiziert werden können, ebenfalls aufgenommen: z.B. Magd der Familie Tscharner (siehe dazu Konventionen Strukturdaten).
Personen werden entweder bei ihrem Namen genannt (z.B. Albrecht von Haller) oder treten indirekt durch eine Bezeichnung (z.B. meine Mutter, unser Freund, der König) auf. Sowohl direkt wie indirekt erwähnte Personen werden im Text ausgezeichnet, jedoch mit folgenden Ausnahmen:
- Sender und Empfänger des Briefs werden in der Transkription nicht ausgezeichnet, sondern nur in den Strukturdaten hinterlegt.
- In der Einleitung einer Briefedition werden die Hauptkorrespondenten (z.B. Haller und Münchhausen in Sonntag 2018) nicht ausgezeichnet.
Bezieht sich eine Bezeichnung auf mehrere Personen (z.B. die Fischers, meine beiden Söhne), werden die Referenzen durch Leerschläge getrennt aufgeführt, aber i.d.R. nicht mehr als zwei Personen. Grössere Gruppen (besonders wenn diffus) werden nicht ausgezeichnet.
Beispiele der TEI-XML-Kodierung von Personen
<!--Eigenname, Vor- und Nachname sowie Prädikat-->
<p>Der berühmte <rs type="person" key="person_01200">Albrecht von Haller</rs> hat mir ein Buch geschickt.</p>
<!--Eigenname, Titel und Nachname-->
<p>Der berühmte <rs type="person" key="person_01200">Dr. Haller</rs> hat mir ein Buch geschickt.</p>
<!--Eigenname, Anrede und Nachname-->
<p>Der berühmte <rs type="person" key="person_01200">Herr Haller</rs> hat mir ein Buch geschickt.</p>
<!--Eigenname, nur Nachname-->
<p>Der berühmte <rs type="person" key="person_01200">Haller</rs> hat mir ein Buch geschickt.</p>
<!--Eigenname, abgekürzter Vorname, Verwandtschaftsbeziehung-->
<p><rs type="person" key="person_09090">Hallers Schwägerin Rosi</rs> hat mir ein Buch geschickt.</p>
<!--Alias/Pseudonym ohne Beziehung zum Eigennamen-->
<p>Unser Freund <rs type="person" key="person_00703">Maecenas</rs> hat mir geschrieben.</p>
<!--Eigennamen in adjektivischer Nutzung-->
<p>c’êst reprocher à l’Ecole <rs type="person" key="person_10394">d’Aristote</rs> de n’avoir pas embrassé la Gravitation <rs type="person" key="person_04708">Neütonniéne</rs></p>
<!--Indirekte Bezeichnung-->
<p>Der <rs type="person" key="person_01200">Dichter der Alpen</rs> hat mir ein Buch geschickt.</p>
<!--Indirekte Bezeichnung, inklusive Ortsnamen-->
<p><rs type="person" key="person_01200">Unser gemeinsamer Freund in Göttingen</rs> hat mir ein Buch geschickt.</p>
<!--Aber: Ort gehört in diesem Beispiel nicht zum Bezeichner-->
<p><rs type="person" key="person_01200">Unser gemeinsamer Freund</rs> fühlt sich wohl in <rs type="place" key="place_00557">Göttingen</rs>.</p>
<!--Indirekte Bezeichnung, nur Amts- bzw. Funktionsbezeichnung-->
<p><rs type="person" key="person_02971">Der König</rs> hat mir ein Buch geschickt.</p>
<!--Aber: Eigenname, inklusive Amts- bzw. Funktionsbezeichnung -->
<p>Unser König <rs type="person" key="person_02971">George II. von England</rs> hat mir ein Buch geschickt.</p>
<!--Indirekte Bezeichnung mehrerer Personen-->
<p>Die <rs type="person" key="person_01200 person_02971">Hallers</rs> haben mir ein Buch geschickt.</p>
Erwähnte Orte
Stadtteile oder Dorfteile werden auf die Stadt bzw. das Dorf bezogen, z.B. Matte-Quartier wird auf die Stadt Bern referenziert und als Namensvariante (Teil von) aufgenommen. Dasselbe gilt für Gemeindeteile wie Bümpliz, das heute zu Bern gehört, bis 1919 aber eine eigenständige Gemeinde war.
Für den Fall, dass in einem Dokument Bümpliz und Bern erwähnt werden, gilt, dass nur die erste Nennung der heutigen Einheit ausgezeichnet wird. Es kann aber bei jeder weiteren Nennung von früher selbstständigen Einheiten, die heute zu einer Gemeinde gehören, eine freie Annotation mit einem entsprechenden Hinweis gesetzt werden.
Beispiel der TEI-XML-Kodierung einer freien Annotation zu einer Ortschaft
Bümpliz ist heute Teil der Gemeinde <rs type="place" key="place_ 00309">Bern</rs>.
Abgeleitete Substantive (z.B. Deutsche) oder Adjektive (z.B. deutsch) werden ebenfalls ausgezeichnet, wenn der geographische Raum gemeint ist.
Beispiele der TEI-XML-Kodierung von Orten
<!--Ortsname-->
<p>Der Text wurde in <rs type="place" key="place_00557">Göttingen</rs> geschrieben, wo er auch gedruckt wurde.</p>
<!--Ort als Adjektiv-->
<p>Die <rs type="place" key="place_00557">Göttinger</rs> Gelehrten sind ruhmsüchtig.</p>
<!--Aber: Adjektiv bezeichnet in diesem Beispiel die Sprache-->
<p>Ich lese oft deutsche Texte.</p>
<!--Lokalisation, Ortsname inklusive Beschreibung der Lage-->
<p>Der Brief stammt aus <rs type="place" key="place_99999">Straussfurt, in Sachsen</rs>.</p>
<p>Der Brief stammt aus <rs type="place" key="place_99999">der grössten Stadt in Sachsen</rs>.</p>
Erwähnte Institutionen
Die verschiedenen Typen von Institutionen sind in den Konventionen zu den Strukturdaten aufgeführt.
Unspezifische Nennungen werden nicht aufgenommen (z.B. die Berner Regierung). Orte, die zu einer Institutionsbezeichnung gehören (z.B. Gesellschaft der Wissenschaften zu Göttingen), werden nicht zusätzlich ausgezeichnet.
Beispiele der TEI-XML-Kodierung von Institutionen
<!--Institutionsname, inklusive Ort-->
<p>Die <rs type="institution" key="institution_00162">Gesellschaft der Wissenschaften zu Göttingen</rs> wurde 1751 gegründet.</p>
<!--Aber: Ort gehört in diesem Beispiel nicht zum Eigennamen-->
<p>In <rs type="place" key="place_00557">Göttingen</rs> wurde 1751 eine <rs type="institution" key="institution_00162">gelehrte Gesellschaft</rs> gegründet.</p>
<!--Institutionsname, inklusive Ort-->
<p>Die <rs type="institution" key="institution_00999">Reformierte Gemeinde in Göttingen</rs> hat viele Mitglieder.</p>
Erwähnte Werke, inkl. Periodika
Die verschiedenen Typen von Publikationen sind in den Konventionen zu den Strukturdaten aufgeführt.
Bei Publikationen werden drei Typen unterschieden:
- Einzelaufnahme (konkrete Ausprägungen)
- Periodikum/Sammelwerk (abstrahiert)
- Einheitssachtitel (abstrahiert)
Unterschieden werden Auszeichnungen im Originaltext und im Metatext:
- Bei im Originaltext referenzierten Publikationen können Band-, Seiten- oder Paragraphenangaben in einer Referenzannotation spezifiziert werden.
- Bei im Metatext referenzierten Publikationen werden allfällige Band- oder Seitenangaben nicht eingeschlossen. Da aber dort keine Referenzannotation möglich ist, werden diese Spezifikationen ausserhalb des Personen-Tags aufgeführt.
Beispiele der TEI-XML-Kodierung von Publikationen
<!--im Originaltext referenzierte Publikation-->
dans le troisième tome des <rs type="publication" key="publication_34638">Gazettes de Gottingue<note type="annotRef"><p>Bd. 3.</p></note></rs>.
<!--im Metatext referenzierte Publikation-->
<rs type="publication" key="publication_99999">Müller (1990)</rs>: 324.
<!--Einkappselung Eigenname-->
<Gessners Flora>
<!--Aber:-->
sende ich dir die <Flora>, welche <Gessner> in jahrelanger Arbeit erschaffen hat
Erwähnte Briefe
Erwähnte Briefe (auch Pro Memoria, Reskripte usw.) werden ausgezeichnet und referenziert, falls sie in der Datenbank schon vorhanden sind. Noch nicht als Entität vorhandene Briefe können mit <letter_unknownReference>
markiert werden.
Kann ein Brief keinem in der Datenbank referenzierten Objekt zugeordnet werden, werden die Personen ausnahmsweise doch ausgezeichnet.
Beispiele der TEI-XML-Kodierung von Briefen
<!--Erwähnung eines Briefs-->
<p>Deinen <rs type="letter" key="letter_00162">Brief vom 1. April</rs> habe ich dankend erhalten.</p>
<!--Erwähnung eines Briefs, inklusive Personennamen-->
<p>In <rs type="letter" key="letter_00162">Hallers Brief an Caldani</rs> ist davon die Rede, dass ...</p>
<!--Erwähnung eines unbekannten Briefs, inklusive Personennamen-->
<p>Mein <rs type="letter" key="letter_unknownReference">Brief </rs> an <rs type="person" key="person_01055">Tscharner</rs> ist ...</p>
Erwähnte Rezensionen
Renzensionen allgemein
Auf hallerNet sind alle von Haller für die GGA verfassten Rezensionen erschlossen und ediert. In den Briefen erwähnte Rezensionen (die nicht von Haller stammen), werden grundsätzlich weder neu aufgenommen noch wird speziell auf diese hingewiesen (auch nicht wenn diese in den GGA erschienen). Es steht aber den Edierenden frei, mittels freier Annotationen weitere Informationen zu Rezensionen anzugeben.
Beispiel der TEI-XML-kodierung von Rezensionen mit freier Annotation
<!--Beispiel aus der Korrespondenz Haller-J.P.Murray (letter_06158)-->
Lönbom hat indessen eine Sammelung von Beyträgen dazu herausgegeben, welche ich für <rs type="publication" key="publication_34638" xml:id="hallerNet_letter_06158_ref-28">unsere gelehrten Anzeigen recensiret<note type="annotRef"><p>See <rs type="review" key="review_unknownReference" xml:id="hallerNet_letter_06158_ref-29">Murray’s review of vol. 1. in <hi rendition="#i">GGA</hi> (21 Jan. 1764)</rs>: 65–70.</p></note></rs>
habe.
Hallers Rezensionen in den GGA
Da Hallers Rezensionen in den GGA auf hallerNet erschlossen und ediert sind, werden sie im Unterschied zu Rezensionen von anderen Personen oder aus anderen Zeitschriften, in den Briefen referenziert. Je nachdem wie explizit in einem Brief von einer Rezension die Rede ist, erfolgt die Referenz auf die Rezension direkt im Text oder über eine Referenzannotation. Zwingend für das Referenzieren einer Rezension ist deren Nennung. Der Umstand allein, dass ein erwähntes Werk später einmal rezensiert wird, reicht nicht aus, um eine Referenz auf die Rezension zu setzen (eine solche Referenz ist redundant, da nicht kontextrelevant).
Explizite Erwähnung der Rezension
Wird die Rezension explizit im Brief erwähnt, wird direkt auf die Rezension referenziert. Explizit heisst, dass im Brief die Worte «Rezension», «Besprechung» und dergl. zu finden sind. Unter die Referenz auf die Rezension dürfen sowohl Haller als Rezensent, die GGA als Rezensionszeitschrift, Verfasserin oder Verfasser des Werks, als auch das Werk selbst subsumiert werden. Um überlange Referenzen zu vermeiden, kann alternativ auch nur die Rezension referenziert werden. Die übrigen Informationen (Publikation, Autorin oder Autor, Ort etc.) sind im Datenbankeintrag der Rezension einsehbar (vgl. zweites Bsp.). Analog den Publikationen können auch Rezensionen, die zum Zeitpunkt der Korrespondenz noch nicht erschienen sind, ausgezeichnet werden. In diesem Fall soll in einer freien Annotation auf den Umstand hingewiesen werden (vgl. drittes Bsp.).
Beispiele der TEI-XML-Kodierung von Rezensionen
<!--Explizite Erwähnung einer Rezension-->
<p>Für <rs type="review" key="review_99999">Ihre Rezension meines Werkes über den Ursprung der Pflanzen in den Göttingischen Zeitungen</rs> danke ich Ihnen herzlich.</p>
<!--Explizite Erwähnung ohne Nennung der Rezension (letter_15537)-->
<p>l’<rs type="publication" key="publication_29278" xml:id="hallerNet_letter_15537_ref-8">ouvrage de M Bergius</rs> que Vous m’avés annoncé. <rs type="review" key="review_02239" xml:id="hallerNet_letter_15537_ref-31">j’en ai parlé</rs> d’aprez une copie.</p>
<!--Explizite Erwähnung einer Rezension - mit nur impliziter Ref. auf public, person und GGA -->
<p>Für <rs type="review" key="review_99999">Ihre Rezension</rs> meines Werkes über den Ursprung der Pflanzen, welche vorletzte Woche in den höchstgelobten und angesehensten Göttingischen Zeitungen erschien, danke ich, Peter Müller, Ihnen herzlich.</p>
<!--Referenz auf eine erst später erscheinende Rezension-->
<p>Ich würde mich <rs type="review" key="review_99999">über eine Rezension meines Werks über den Ursprung der Pflanzen in den GGA mächtig freuen<note n="x" type="annotRef"><p>Haller entsprach dem Wunsch von XY. Die Rezension erschien am 26. Juli 1753 in den GGA.</p></note></rs>.</p>
Nicht-explizite Erwähnung der Rezension
Findet sich im Brief keine explizite Erwähnung der Rezension, erfolgt die Referenzierung über eine Referenzannotation. Die Referenzannotation wird entweder beim rezensierten Werk oder bei den GGA gesetzt. Grundsätzlich wird davon ausgegangen, dass wenn sowohl das rezensierte Werk als auch die GGA im Text erwähnt werden, die Rezension explizit erwähnt wird (Ref. wie oben). Wenn die Referenzannotation nicht gesetzt werden kann, weil die GGA oder das rezensierte Werk bereits früher im Brief ausgezeichnet wurde (Problem der Doppelauszeichnung), erfolgt die Referenzierung der Rezension in einer Freien Annotation. Wichtig: Es muss nicht das gesamte Label der Rezension in die Note geschrieben werden. Hallers Rezension + das Datum reichen aus.
Beispiele der TEI-XML-Kodierung nicht explizit erwähnter Rezensionen
<!--Nicht-explizite Erwähnung mit Referenzannotation-->
<p><rs type="publication" key="publication_99999">Mein Werk über den Ursprung der Pflanzen<note n="x" type="annotRef"><p><rs type="review" key="review_99999">Hallers Rezension</rs> erschien am 1.1.1760 in den GGA.</p></note></rs> erfährt dank Ihnen weite Bekanntheit.</p>
<!--Nicht-explizite Erwähnung mit freier Annotation (letter_15533)-->
Mon intention n’est jamais <lb/>de desobliger perſonne, et moins <rs type="place" key="place_03334" xml:id="hallerNet_letter_15533_ref-2">Votre Nation</rs>, qu’aucune autre, il me semble que cela ne <lb/>sauroit étre douteux.<note type="annotFree" n="1"><p>Gemeint ist <rs type="review" key="review_00948" xml:id="hallerNet_letter_15533_ref-17">Hallers Rezension</rs> in den GGA, 14. Juli 1764.</p></note></p>
Textkonstitution
Während die beschriebene Form der Textstruktur, die Art der Annotation und das Referenzsystem in allen Editionen einheitlich umgesetzt werden, können bei der Textkonstitution Unterschiede auftreten. Ein Grund dafür ist, dass bei der Textkonstitution zwischen Standard und Retroedition unterschieden wird. Bei Retroeditionen wird der Fokus der Überarbeitung auf die Strukturierung, Annotation und Referenzierung nach dem vorliegenden Modell gelegt. Die Transkriptionen und die textkritischen Bemerkungen werden jedoch weitgehend gemäss der publizierten Vorlage übernommen; die Art der Umsetzung wird in der Einleitung zur jeweiligen Edition beschrieben.
Innerhalb des Standard-Modells stehen für besondere philologische Bedürfnisse auch optionale TEI-XML-Kodierungen zur Verfügung. Eine gewisse Flexibilität ist deshalb wichtig, weil die Editionen auf der Plattform eine Vielzahl an Schriftzeugnissen aus einem breiten zeitlichen und geografischen Kontext umfassen. Diese weisen teils spezifische Eigenheiten auf, die in besonderer Weise berücksichtigt werden müssen. In den folgenden Beschreibungen werden deshalb an einigen Stellen die Standardform und eine optionale Variante spezifiziert. Die gewählte Art der Umsetzung ist für die gesamte Einheit (z.B. alle Briefe einer Korrespondenz) anzuwenden und in der Einleitung transparent zu machen.
Nichtedierte Zeichen und Bespurungen der Schriftträger
Nutzungsspuren und spätere Zusätze wie Ordnungsziffern und archivalische Signaturen, die mitunter auch korrigiert und überschrieben wurden, zudem zeitgenössische Zusätze, Siglen oder andere Vermerke werden nicht mittranskribiert. Zusatzinformationen zu den Adressen wie Frankierung, Postwege usw. werden nur dann transkribiert, wenn die Informationen sichtbar vom Schreiber stammen. Vermerke von fremder Hand werden nicht mittranskribiert.
Zeichencodierung und Zeichensetzung
Griechische und hebräische Buchstaben werden griechisch und hebräisch wiedergegeben und nicht lateinisch transliteriert (Vorkommnisse aus anderen Schriftsystemen ebenfalls). Ligaturen und Abkürzungen können stillschweigend normalisiert werden.
Auch bei Transkription von Texten des lateinischen Schriftsystems können Vereinheitlichungen vorgenommen werden. So steht es bei heute nicht mehr gebräuchlichen Zeichen (z.B. Lang-s “ſ”) oder bei zeitgebundenen Unterschieden in deren Verwendung (etwa im Lateinischen bei “u”/“v”) frei, diese entweder vorlagengetreu oder normalisiert wiederzugeben. Die gewählte Art der Umsetzung muss in der jeweiligen Edition konsequent erfolgen und in der Einleitung transparent gemacht werden.
Beispiele von vorlagengetreuer und normalisierter Umsetzung:
Zeichen | vorlagengetreu | normalisiert |
---|---|---|
u/v, U/V | Vniuersitas | Universitas |
i/j | justitia | iustitia |
ij, ÿ | filij/filÿ lachrÿmę | filii lachrymae |
æ/Æ, œ/Œ, ę (Ligaturen, e-caudata) | aulæ, aulę cœpit | aulae coepit |
î, â (Zirkumflex bei Adverbien und Nomen im Ablativ) | hîc (=hīc) mæstitiâ (=maestitiā) | hic maestitia |
è, ò, à (Gravis bei Adverbien und Präpositionen) | beatè verò à è | beate vero a e |
Währungsangaben und andere Sonderzeichen (z.B. mathematische, alchemistische oder astronomische Notationen) werden nach Möglichkeit mit UNICODE-Zeichen nachgebildet. Existiert ein Zeichen nicht, wird stellvertretend die Tilde in eckigen Klammern “[~]” gesetzt und die Bedeutung in einer Annotation zur Textkonstitution erläutert.
Autorspezifische Orthografie
Interpunktion, Gross- und Kleinschreibung sowie Orthografiefehler und Inkonsistenzen werden möglichst vorlagengetreu abgebildet und Eingriffe auf ein Minimum reduziert. Jedoch werden orthografische bzw. graphematische Besonderheiten in den Handschriften bestimmter Schreibender (etwa Weglassung von “i”-Punkten oder von “t”-Querstrichen, von Umlaut-Anzeichen, fehlende “u”-Striche oder -Bögen) grundsätzlich nicht nachgeahmt. Zudem wird das erste Wort eines Satzes ebenso wie Eigennamen immer grossgeschrieben und bei fehlendem Satzzeichen am Satzende ein Punkt ergänzt.
In Zweifelsfällen wird auf Ebene des Dokuments vereinheitlicht, sonst nach den Massstäben des Autors, wo eine Tendenz zu erkennen ist. Bei nichteindeutigen Fällen (etwa Unentscheidbarkeit zwischen “é” und “è”) wird die heutige Orthografie umgesetzt.
Endsilbenverschleifungen, Suspensionen, Nasalstriche und Kontraktionen
Reduplikationsstriche werden durch Verdoppelung des Buchstabens (z.B. “nn” statt “n̄”) ersetzt. Überstriche über Vokalen, die als Nasalstriche “m” oder “n” oder mit Nasal endende Silben anzeigen, werden entsprechend aufgelöst (etwa im Lateinischen “fratrū” zu “fratrum” etc.). Endsilbenverschleifungen (z.B. im Deutschen bei Wortendungen wie “-e”, “-em”, “-en”, “-er”, “-ung” usw.) und Suspensionen bei Wortendungen (wie im Lateinischen “-que” oder “-tur”) werden in der Regel stillschweigend aufgelöst und ausgeschrieben. Ebenso erfolgt bei Kontraktionen, Nasalstrichen oder besonderen Abkürzungszeichen keine Nachahmung von Schleifen, Haken oder anderen Diakritika. Die Auflösungsmöglichkeiten dieser – vor allem in lateinischen Texten häufigen - Phänomene können je nach Kontext variieren.
Beispiele stillschweigender Auflösungen im Lateinischen:
Beispiel | Auflösung | Bemerkung |
---|---|---|
eẻ poẻ | esse posse | - |
.n. | etiam | - |
n̄ sum̅a | non summa | - |
ꝯ | -us, -os | Häufig hoch- oder tiefgestellt: 𝑜𝑖𝑏ꝰ (omnibus), colendꝯ (colendus) |
ꝙ, qꝫ | -que | Häufig nicht unterscheidbar von ꝗ und kann auch für qui, quae, quod etc. stehen |
ꝗ | qui, quae, quod etc. | Häufig in Kombination mit anderen Buchstaben oder Abkürzungen: ꝗi = qui, ꝗa = qua, quia, ꝗd = quid, quod, q͂ = quam, quem, ꝗᵭ = quidem, ꝗꝯ = quibus |
ꝟo | vero | Ein Schrägstrich oder Strich, der einen Konsonanten kreuzt: b = ber, bre, d = der, t = ter, tem, ten, ꝟ = ver, ven |
In Ausnahmefällen können bestimmte redaktionelle Eingriffe in der Transkription in Klammern gesetzt werden. Sie sollen die Lesbarkeit unterstützen, indem sie missverständliche Abkürzungen auflösen oder wenn ein vergessenes Wort, ein Buchstabe oder ein Satzzeichen aus Gründen der Verständlichkeit hinzugefügt wird.
Vor allem bei regelmässigen Abkürzungen wird empfohlen, diese vorlagengetreu zu transkribieren und eine Liste mit Abkürzungen in den Anhang der Edition zu stellen (vgl. bspw. den Anhang der Scheuchzer-Edition). Es ist allerdings auch möglich, die Varianten zu kodieren (siehe unten).
Typografische Auszeichnung
- In den Transkriptionen werden die im Manuskript vorkommenden typographischen Hervorhebungen unterstrichen oder hochgestellt bei der Eingabe ausgezeichnet und im Frontend nachgebildet.
- Die Hervorhebung kursiv wird nicht in der Transkription, sondern ausschliesslich in Annotationen zur Textkonstitution verwendet.
- Nachträgliche Ergänzungen, zum Beispiel in Form eingefügter Wörter zwischen den Zeilen, werden nicht typografisch nachgebildet, sondern mit textkritischen Kommentaren beschrieben (vgl. Kapitel Annotationen zur Textkonstitution).
TEI-XML-Kodierung von typografischen Hervorhebungen
Formatvorgabe | TEI-Kodierung |
---|---|
Unterstrichen (underline) | <hi rendition="#u"/> |
Hochgestellt (superscript) | <hi rendition="#sup"/> |
Kursiv (italic) | <hi rendition="#i"/> |
Textkritik
Die Textkritik kann entweder in Form einer semantisch Beschreibung in einer Annotation zur Textkonstitution oder durch die Kodierung mit TEI-XML ausgedrückt werden. Die gewählte Form ist jeweils für die gesamte Einheit (z.B. alle Briefe einer Korrespondenz) anzuwenden. Eine Ausnahme bilden komplexe Phänomene oder Sonderfälle, für welche die verfügbaren TEI-XML-Elemente nicht ausreichen. In diesem Fall wird auf eine semantische Beschreibung zurückgegriffen.
- Semantische Beschreibung (Standard)
Streichungen, Einfügungen und andere Korrekturen werden mit Annotationen zur Textkonstitution, die einem standardisierten Vokabular folgen, erläutert. Hierbei gilt der Grundsatz, dass über die typographische Differenz von kursiver und aufrechter Schrift zwischen Editortext und Originaltext unterschieden wird. Editortext erscheint immer kursiv (inkl. aller zur editorischen Annotation gehörenden Interpunktion), Originaltext erscheint recte. Bestehen Unsicherheiten bei der Lesung, wird das Wort gemäss der Annahme der oder des Edierenden transkribiert und die Unsicherheit in einer Annotation zur Textkonstitution spezifiziert.
Unleserliche Elemente, bei denen weder Tilgung noch Textverlust vorliegen, werden als “x” zeichenweise transkribiert und in einer Annotation zur Textkonstitution in kursiv als “Nicht lesbar” beschrieben.
Mehrsprachige Übersicht textkritischer Beschreibung
English | Français | Deutsch | |
---|---|---|---|
Unleserlichkeit | Not legible. | Pas lisible. | Nicht lesbar. |
Unsichere Lesung | see doubtful reading. | see lecture incertaine. | see unsichere Lesung. |
Alternative Lesung | alternate reading: werden. | alternative de lecture : werden. | Alternativlesung: werden. |
Unsichere Lesung und Alternative | unreasonable doubtful reading; alternate reading: Unfeasonable. | unreasonable lecture incertaine ; alternative de lecture : Unfeasonable. | unreasonable unsichere Lesung; Alternativlesung: Unfeasonable. |
Streichungen / Löschungen (lesbar) | und follows <auf>. | und après <auf>. | und nach <auf>. |
mathemat above <oeconom>. | mathemat sur <oeconom>. | mathemat über <oeconom>. | |
stärker precedes <geworden>. | stärker avant <geworden>. | stärker vor <geworden>. | |
Streichungen / Löschungen (unlesbar) | die follows <illeg>. | die après <illisible>. | die nach <nicht lesbar>. |
Einfügungen zwischen den Linien | physical[ische] interl. | physical[ische] ajouté. | physical[ische] eingefügt. |
und seine … retractirt interl. | und seine … retractirt ajouté. | und seine … retractirt eingefügt. | |
Einfügungen zwischen Wörtern / am Anfang oder Ende derselben Linie | ja … hält added in margin. | ja … hält ajouté en marge. | ja … hält am Seitenrand eingefügt. |
und alles … reisen added and interl. | und alles … reisen ajouté. | und alles … reisen eingefügt. | |
Einfügungen am Seitenrand | This sentence added sideways in margin. | Phrase ajoutée en marge. | Satz am Seitenrand eingefügt. |
Korrektur (lesbar) | würde changed from würden. | würde remplacé par würden. | würde ersetzt durch würden. |
Korrektur (unlesbar) | fuerit changed from ? | fuerit remplacé par ? | fuerit ersetzt durch ? |
Textverlust | Defect in manuscript. | Manque dans le manuscrit. | Textverlust. |
Berichtigung durch Edierende | Recte fasciculus. | Recte fasciculus. | Recte fasciculus. |
- Basale TEI-XML-Kodierung (optionale Variante)
Die textkritische Kodierung mittels TEI-XML ist auch im Standardmodell möglich. Sie bezieht sich aber ausdrücklich nur auf die häufig vorkommenden, grundlegenden Phänomene wie Streichungen, Korrekturen oder editorische Ergänzungen. Komplexere Fälle, wie beispielsweise Überlagerungen mehrerer Phänomene, werden jedoch nicht kodiert, sondern ausschliesslich in textkritischen Anmerkungen semantisch beschrieben.
TEI-XML-Kodierung textkritischer Phänomene
TEI-XML-Kodierung | Rendering | |
---|---|---|
Streichung | <del rendition="#lt"> | |
Ergänzung | <add/> | \Ergänzung/ |
Korrektur | <del/><add/> | |
Regularisierung | <choice><sic/><reg/></choice> | Mouseover mit Variante |
Abkürzung | <choice><abbr/><expan/></choice> | Mouseover mit Auflösung |
Vervollständing bei Auslassung | <supplied reason="omitted-in-original"/> | Verv[o]llständigung |