Agent-almanac manage-bibliography
git clone https://github.com/pjt222/agent-almanac
T=$(mktemp -d) && git clone --depth=1 https://github.com/pjt222/agent-almanac "$T" && mkdir -p ~/.claude/skills && cp -r "$T/i18n/de/skills/manage-bibliography" ~/.claude/skills/pjt222-agent-almanac-manage-bibliography-da18a9 && rm -rf "$T"
i18n/de/skills/manage-bibliography/SKILL.mdBibliographie verwalten
BibTeX-Bibliographiedateien erstellen, zusammenführen und deduplizieren unter Verwendung des RefManageR-Pakets in R, mit Validierung der Eintragsfelder und sauberem Export für die Dokumentenerstellung.
Wann verwenden
- Aufbau einer neuen Bibliographiedatei für ein Forschungsprojekt oder eine Publikation
- Zusammenführen mehrerer .bib-Dateien aus verschiedenen Quellen zu einer konsolidierten Bibliographie
- Automatische Lösung von DOIs oder URLs zu vollständigen BibTeX-Einträgen
- Erkennung und Entfernung doppelter Einträge basierend auf DOI, Titel oder anderen Feldern
- Sicherstellung, dass alle Einträge die erforderlichen Felder für ihren Eintragstyp haben
- Export einer sauberen Bibliographie zur Verwendung mit Quarto, R Markdown oder LaTeX
Eingaben
- Erforderlich: Mindestens eine Quelle von Bibliographiedaten (vorhandene .bib-Datei, DOIs-Liste, manueller Eintrag oder URL)
- Erforderlich: Zielausgabepfad für die konsolidierte .bib-Datei
- Optional: Bevorzugtes Zitierschlüsselformat (z.B.
,NachnameJahr
)nachname2026 - Optional: Erforderliche Felder über den BibTeX-Standard hinaus
- Optional: Zusammenführungsstrategie für Duplikate (erste behalten, vollständigere behalten, manuell entscheiden)
Vorgehensweise
Schritt 1: Vorhandene Bibliographiedaten laden
Alle Quellen in ein einheitliches BibEntry-Objekt laden:
- Vorhandene .bib-Dateien laden:
für jede Eingabedatei verwenden.RefManageR::ReadBib("refs.bib") - Aus DOIs auflösen:
für eine Liste von DOI-Zeichenketten verwenden.RefManageR::GetBibEntryWithDOI(dois) - Aus URLs abrufen: Falls die Quelle Zotero-Übersetzer oder Crossref-Metadaten bereitstellt, DOIs extrahieren und auflösen.
- Manuelle Einträge: BibEntry-Objekte direkt mit
erstellen, wobei alle erforderlichen Felder für den Eintragstyp angegeben werden.RefManageR::BibEntry() - Zusammenführen: Alle BibEntry-Objekte mit
zusammenführen, um eine einzige Sammlung zu erstellen.c(bib1, bib2, ...)
library(RefManageR) bib_existing <- ReadBib("existing_refs.bib") bib_from_doi <- GetBibEntryWithDOI(c("10.1234/example1", "10.5678/example2")) bib_all <- c(bib_existing, bib_from_doi)
Erwartet: Alle Bibliographiequellen werden in ein einziges BibEntry-Objekt geladen, wobei Parsing-Fehler dokumentiert sind.
Bei Fehler: Falls eine .bib-Datei nicht geparst werden kann, auf ungültige Klammern, fehlende Kommas zwischen Feldern oder Nicht-ASCII-Zeichen ohne korrekte LaTeX-Kodierung prüfen. Einzelne problematische Einträge isolieren, indem die Datei in kleinere Teile aufgeteilt wird.
Schritt 2: Zitierschlüssel normalisieren
Alle Zitierschlüssel auf ein konsistentes Format standardisieren:
- Schlüssel extrahieren:
verwenden, um die aktuellen Zitierschlüssel zu erhalten.names(bib_all) - Schlüsselformat anwenden: Schlüssel basierend auf den Metadaten jedes Eintrags generieren (z.B.
). Kollisionen durch Anfügen von Suffixen behandeln (a, b, c).paste0(tolower(nachname), jahr) - Schlüssel ersetzen: Aktualisierte Schlüssel den BibEntry-Objekten zuweisen.
- Übersetzungstabelle erstellen: Alte Schlüssel neuen Schlüsseln zuordnen, damit Verweise in Dokumenten aktualisiert werden können.
Erwartet: Alle Zitierschlüssel folgen einem konsistenten Format ohne Duplikate, und eine Zuordnung von alten zu neuen Schlüsseln ist verfügbar.
Bei Fehler: Falls Schlüsselkollisionen auftreten (z.B. zwei Artikel von Smith aus 2024), die Suffixierungsregel anpassen. Häufige Strategien: Buchstabensuffix (smith2024a, smith2024b), Koautorsuffix (smithjones2024) oder Titelschlüsselwort (smith2024neural).
Schritt 3: Duplikate erkennen und auflösen
Doppelte Einträge finden und zusammenführen:
- DOI-Abgleich: Einträge mit identischen DOIs gruppieren (nach Zeichenkettenbereinigung: Kleinschreibung, Entfernung von Präfixen).
- Titelabgleich: Für Einträge ohne DOI den Titel-Ähnlichkeitsabgleich verwenden (Kleinschreibung, Entfernung von Satzzeichen, Fuzzy-Matching mit einem Schwellenwert).
- Duplikate auflösen: Für jede Duplikatgruppe nach Zusammenführungsstrategie:
- Erste behalten: Den chronologisch ersten Eintrag behalten (Reihenfolge des Dateiladens).
- Vollständigere behalten: Den Eintrag mit mehr ausgefüllten Feldern behalten.
- Zusammenführen: Leere Felder eines Eintrags mit Werten eines anderen füllen.
- Duplikatbericht: Gefundene Duplikate und durchgeführte Aktionen dokumentieren.
Erwartet: Keine doppelten Einträge verbleiben, und ein Bericht dokumentiert, welche Einträge zusammengeführt oder entfernt wurden.
Bei Fehler: Falls der Titelabgleich falsch-positive Ergebnisse erzeugt (unterschiedliche Artikel mit ähnlichen Titeln), den Fuzzy-Matching-Schwellenwert erhöhen oder eine zusätzliche Überprüfung durch Autorenabgleich hinzufügen.
Schritt 4: Eintragsfelder validieren
Jeden Eintrag auf Vollständigkeit und Korrektheit prüfen:
- Erforderliche Felder prüfen: Für jeden Eintragstyp (article, book, inproceedings usw.) sicherstellen, dass alle vom BibTeX-Standard geforderten Felder vorhanden sind.
| Eintragstyp | Erforderliche Felder |
|---|---|
| article | author, title, journal, year |
| book | author/editor, title, publisher, year |
| inproceedings | author, title, booktitle, year |
| phdthesis | author, title, school, year |
| techreport | author, title, institution, year |
| misc | author, title, year (empfohlen) |
- Feldformat validieren: Prüfen, ob die Jahresangabe eine gültige vierstellige Zahl ist, DOIs ein gültiges Format haben und URLs erreichbar sind.
- Validierungsbericht: Alle fehlenden oder ungültigen Felder auflisten, geordnet nach Eintragsschlüssel.
Erwartet: Alle Einträge bestehen die Feldvalidierung, oder ein Bericht listet die spezifischen Probleme zur Korrektur auf.
Bei Fehler: Falls erforderliche Felder fehlen und nicht durch DOI-Auflösung ermittelt werden können, die Einträge für manuelle Vervollständigung markieren, anstatt unvollständige Daten zu erfinden.
Schritt 5: Saubere Bibliographie exportieren
Die validierte Bibliographie in eine .bib-Datei schreiben:
- Einträge sortieren: Nach Zitierschlüssel (alphabetisch) oder einem anderen angegebenen Kriterium sortieren.
- Exportieren:
verwenden.RefManageR::WriteBib(bib_clean, file = "output.bib") - Ausgabe überprüfen: Die exportierte Datei zurücklesen und bestätigen, dass alle Einträge erhalten sind und das Parsen fehlerfrei erfolgt.
- Zusammenfassung erstellen: Die Gesamtzahl der Einträge nach Typ, gelöste Duplikate und verbleibende Warnungen dokumentieren.
WriteBib(bib_clean, file = "output.bib") bib_verify <- ReadBib("output.bib") stopifnot(length(bib_verify) == length(bib_clean))
Erwartet: Eine saubere, validierte .bib-Datei wird geschrieben, die sich ohne Fehler parsen lässt und alle erwarteten Einträge enthält.
Bei Fehler: Falls die exportierte Datei nicht geparst werden kann, Nicht-ASCII-Zeichen prüfen, die während des Exports nicht korrekt escaped wurden. Häufige Probleme: geschweifte Klammern innerhalb von Titelfeldern, Sonderzeichen in Autorennamen.
Validierung
- Alle Eingabequellen erfolgreich geladen
- Zitierschlüssel folgen einem konsistenten Format ohne Duplikate
- Doppelte Einträge erkannt und gemäß der Zusammenführungsstrategie aufgelöst
- Alle Einträge bestehen die Pflichtfeldvalidierung für ihren Eintragstyp
- Die exportierte .bib-Datei lässt sich ohne Fehler parsen
- Die Anzahl der exportierten Einträge entspricht der erwarteten Zahl (nach Deduplizierung)
Häufige Fehler
- Nicht-ASCII-Zeichen in Autorennamen: BibTeX erwartet LaTeX-Kodierung für Akzente (z.B.
statt{M\"uller}
). RefManageR verarbeitet dies bei einigen Operationen, aber der Export kann kodierungsabhängig variieren. Den Export immer in einem LaTeX-kompilierenden Workflow überprüfen.Müller - Geschweifte Klammern im Feld title: BibTeX interpretiert Groß-/Kleinschreibung in Titeln stilspezifisch. Um die Schreibweise zu erhalten, das Wort in zusätzliche geschweifte Klammern setzen:
.title = {The {Bayesian} Approach} - DOI-Auflösung schlägt leise fehl:
kannGetBibEntryWithDOI
oder unvollständige Einträge für gültige DOIs zurückgeben, wenn der Crossref-Dienst nicht antwortet. Immer den Rückgabewert vor dem Zusammenführen prüfen.NULL - Duplikaterkennung zu aggressiv: Titel mit Sonderzeichen oder Formatierungsunterschieden können nach der Normalisierung identisch erscheinen. Den Abgleich immer durch Autoren- oder Jahreszahlenvergleich verifizieren, bevor Einträge entfernt werden.
Verwandte Skills
-- Zitate mithilfe der verwalteten Bibliographie in bestimmten Stilen formatierenformat-citations
-- tiefergehende Validierung einschließlich DOI-Auflösung und URL-Prüfungvalidate-references
-- Quarto-Dokumente erstellen, die die Bibliographie konsumierencreate-quarto-report