Agent-almanac manage-bibliography

install

source · Clone the upstream repo

git clone https://github.com/pjt222/agent-almanac

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/pjt222/agent-almanac "$T" && mkdir -p ~/.claude/skills && cp -r "$T/i18n/de/skills/manage-bibliography" ~/.claude/skills/pjt222-agent-almanac-manage-bibliography-da18a9 && rm -rf "$T"

manifest: i18n/de/skills/manage-bibliography/SKILL.md

source content

Bibliographie verwalten

BibTeX-Bibliographiedateien erstellen, zusammenführen und deduplizieren unter Verwendung des RefManageR-Pakets in R, mit Validierung der Eintragsfelder und sauberem Export für die Dokumentenerstellung.

Wann verwenden

Aufbau einer neuen Bibliographiedatei für ein Forschungsprojekt oder eine Publikation
Zusammenführen mehrerer .bib-Dateien aus verschiedenen Quellen zu einer konsolidierten Bibliographie
Automatische Lösung von DOIs oder URLs zu vollständigen BibTeX-Einträgen
Erkennung und Entfernung doppelter Einträge basierend auf DOI, Titel oder anderen Feldern
Sicherstellung, dass alle Einträge die erforderlichen Felder für ihren Eintragstyp haben
Export einer sauberen Bibliographie zur Verwendung mit Quarto, R Markdown oder LaTeX

Eingaben

Erforderlich: Mindestens eine Quelle von Bibliographiedaten (vorhandene .bib-Datei, DOIs-Liste, manueller Eintrag oder URL)
Erforderlich: Zielausgabepfad für die konsolidierte .bib-Datei
Optional: Bevorzugtes Zitierschlüsselformat (z.B.
```
NachnameJahr
```
,
```
nachname2026
```
)
Optional: Erforderliche Felder über den BibTeX-Standard hinaus
Optional: Zusammenführungsstrategie für Duplikate (erste behalten, vollständigere behalten, manuell entscheiden)

Vorgehensweise

Schritt 1: Vorhandene Bibliographiedaten laden

Alle Quellen in ein einheitliches BibEntry-Objekt laden:

Vorhandene .bib-Dateien laden:
```
RefManageR::ReadBib("refs.bib")
```
für jede Eingabedatei verwenden.
Aus DOIs auflösen:
```
RefManageR::GetBibEntryWithDOI(dois)
```
für eine Liste von DOI-Zeichenketten verwenden.
Aus URLs abrufen: Falls die Quelle Zotero-Übersetzer oder Crossref-Metadaten bereitstellt, DOIs extrahieren und auflösen.
Manuelle Einträge: BibEntry-Objekte direkt mit
```
RefManageR::BibEntry()
```
erstellen, wobei alle erforderlichen Felder für den Eintragstyp angegeben werden.
Zusammenführen: Alle BibEntry-Objekte mit
```
c(bib1, bib2, ...)
```
zusammenführen, um eine einzige Sammlung zu erstellen.

library(RefManageR)
bib_existing <- ReadBib("existing_refs.bib")
bib_from_doi <- GetBibEntryWithDOI(c("10.1234/example1", "10.5678/example2"))
bib_all <- c(bib_existing, bib_from_doi)

Erwartet: Alle Bibliographiequellen werden in ein einziges BibEntry-Objekt geladen, wobei Parsing-Fehler dokumentiert sind.

Bei Fehler: Falls eine .bib-Datei nicht geparst werden kann, auf ungültige Klammern, fehlende Kommas zwischen Feldern oder Nicht-ASCII-Zeichen ohne korrekte LaTeX-Kodierung prüfen. Einzelne problematische Einträge isolieren, indem die Datei in kleinere Teile aufgeteilt wird.

Schritt 2: Zitierschlüssel normalisieren

Alle Zitierschlüssel auf ein konsistentes Format standardisieren:

Schlüssel extrahieren:
```
names(bib_all)
```
verwenden, um die aktuellen Zitierschlüssel zu erhalten.
Schlüsselformat anwenden: Schlüssel basierend auf den Metadaten jedes Eintrags generieren (z.B.
```
paste0(tolower(nachname), jahr)
```
). Kollisionen durch Anfügen von Suffixen behandeln (a, b, c).
Schlüssel ersetzen: Aktualisierte Schlüssel den BibEntry-Objekten zuweisen.
Übersetzungstabelle erstellen: Alte Schlüssel neuen Schlüsseln zuordnen, damit Verweise in Dokumenten aktualisiert werden können.

Erwartet: Alle Zitierschlüssel folgen einem konsistenten Format ohne Duplikate, und eine Zuordnung von alten zu neuen Schlüsseln ist verfügbar.

Bei Fehler: Falls Schlüsselkollisionen auftreten (z.B. zwei Artikel von Smith aus 2024), die Suffixierungsregel anpassen. Häufige Strategien: Buchstabensuffix (smith2024a, smith2024b), Koautorsuffix (smithjones2024) oder Titelschlüsselwort (smith2024neural).

Schritt 3: Duplikate erkennen und auflösen

Doppelte Einträge finden und zusammenführen:

DOI-Abgleich: Einträge mit identischen DOIs gruppieren (nach Zeichenkettenbereinigung: Kleinschreibung, Entfernung von Präfixen).
Titelabgleich: Für Einträge ohne DOI den Titel-Ähnlichkeitsabgleich verwenden (Kleinschreibung, Entfernung von Satzzeichen, Fuzzy-Matching mit einem Schwellenwert).
Duplikate auflösen: Für jede Duplikatgruppe nach Zusammenführungsstrategie:
- Erste behalten: Den chronologisch ersten Eintrag behalten (Reihenfolge des Dateiladens).
- Vollständigere behalten: Den Eintrag mit mehr ausgefüllten Feldern behalten.
- Zusammenführen: Leere Felder eines Eintrags mit Werten eines anderen füllen.
Duplikatbericht: Gefundene Duplikate und durchgeführte Aktionen dokumentieren.

Erwartet: Keine doppelten Einträge verbleiben, und ein Bericht dokumentiert, welche Einträge zusammengeführt oder entfernt wurden.

Bei Fehler: Falls der Titelabgleich falsch-positive Ergebnisse erzeugt (unterschiedliche Artikel mit ähnlichen Titeln), den Fuzzy-Matching-Schwellenwert erhöhen oder eine zusätzliche Überprüfung durch Autorenabgleich hinzufügen.

Schritt 4: Eintragsfelder validieren

Jeden Eintrag auf Vollständigkeit und Korrektheit prüfen:

Erforderliche Felder prüfen: Für jeden Eintragstyp (article, book, inproceedings usw.) sicherstellen, dass alle vom BibTeX-Standard geforderten Felder vorhanden sind.

Eintragstyp	Erforderliche Felder
article	author, title, journal, year
book	author/editor, title, publisher, year
inproceedings	author, title, booktitle, year
phdthesis	author, title, school, year
techreport	author, title, institution, year
misc	author, title, year (empfohlen)

Feldformat validieren: Prüfen, ob die Jahresangabe eine gültige vierstellige Zahl ist, DOIs ein gültiges Format haben und URLs erreichbar sind.
Validierungsbericht: Alle fehlenden oder ungültigen Felder auflisten, geordnet nach Eintragsschlüssel.

Erwartet: Alle Einträge bestehen die Feldvalidierung, oder ein Bericht listet die spezifischen Probleme zur Korrektur auf.

Bei Fehler: Falls erforderliche Felder fehlen und nicht durch DOI-Auflösung ermittelt werden können, die Einträge für manuelle Vervollständigung markieren, anstatt unvollständige Daten zu erfinden.

Schritt 5: Saubere Bibliographie exportieren

Die validierte Bibliographie in eine .bib-Datei schreiben:

Einträge sortieren: Nach Zitierschlüssel (alphabetisch) oder einem anderen angegebenen Kriterium sortieren.

Exportieren:

RefManageR::WriteBib(bib_clean, file = "output.bib")

verwenden.

Ausgabe überprüfen: Die exportierte Datei zurücklesen und bestätigen, dass alle Einträge erhalten sind und das Parsen fehlerfrei erfolgt.
Zusammenfassung erstellen: Die Gesamtzahl der Einträge nach Typ, gelöste Duplikate und verbleibende Warnungen dokumentieren.

WriteBib(bib_clean, file = "output.bib")
bib_verify <- ReadBib("output.bib")
stopifnot(length(bib_verify) == length(bib_clean))

Erwartet: Eine saubere, validierte .bib-Datei wird geschrieben, die sich ohne Fehler parsen lässt und alle erwarteten Einträge enthält.

Bei Fehler: Falls die exportierte Datei nicht geparst werden kann, Nicht-ASCII-Zeichen prüfen, die während des Exports nicht korrekt escaped wurden. Häufige Probleme: geschweifte Klammern innerhalb von Titelfeldern, Sonderzeichen in Autorennamen.

Validierung

Alle Eingabequellen erfolgreich geladen
Zitierschlüssel folgen einem konsistenten Format ohne Duplikate
Doppelte Einträge erkannt und gemäß der Zusammenführungsstrategie aufgelöst
Alle Einträge bestehen die Pflichtfeldvalidierung für ihren Eintragstyp
Die exportierte .bib-Datei lässt sich ohne Fehler parsen
Die Anzahl der exportierten Einträge entspricht der erwarteten Zahl (nach Deduplizierung)

Häufige Fehler

Nicht-ASCII-Zeichen in Autorennamen: BibTeX erwartet LaTeX-Kodierung für Akzente (z.B.
```
{M\"uller}
```
statt
```
Müller
```
). RefManageR verarbeitet dies bei einigen Operationen, aber der Export kann kodierungsabhängig variieren. Den Export immer in einem LaTeX-kompilierenden Workflow überprüfen.
Geschweifte Klammern im Feld title: BibTeX interpretiert Groß-/Kleinschreibung in Titeln stilspezifisch. Um die Schreibweise zu erhalten, das Wort in zusätzliche geschweifte Klammern setzen:
```
title = {The {Bayesian} Approach}
```
.
DOI-Auflösung schlägt leise fehl:
```
GetBibEntryWithDOI
```
kann
```
NULL
```
oder unvollständige Einträge für gültige DOIs zurückgeben, wenn der Crossref-Dienst nicht antwortet. Immer den Rückgabewert vor dem Zusammenführen prüfen.
Duplikaterkennung zu aggressiv: Titel mit Sonderzeichen oder Formatierungsunterschieden können nach der Normalisierung identisch erscheinen. Den Abgleich immer durch Autoren- oder Jahreszahlenvergleich verifizieren, bevor Einträge entfernt werden.