Volltext-Suche.
Alle Wortbeiträge des Deutschen Bundestages durchsuchen — seit 1949. Quelle: stenografische Berichte aus DIP (§ 5 UrhG). Volltextindex mit FTS5.
So funktioniert die Suche
SQLite-FTS5 über alle 4637 bisher indexierten Sitzungen — Wahlperioden 1949 bis heute. Such-Antwortzeit unter 100 ms.
Wahlperiode wählen oder Datumsbereich angeben. Beide Filter kombinierbar. Suchanfrage wird als Phrase gewertet.
Pro Sitzung der beste Auszug rund um den Treffer mit Hervorhebung, sortiert nach FTS5-BM25-Relevanz. Klick führt zur Sitzungs-Detailseite mit PDF-Link zum Bundestag.
Volltexte werden direkt aus DIP gezogen. Neue Sitzungen erscheinen typischerweise einen Tag nach dem Plenartag im Index.
Methodik
Datengrundlage: stenografische Wortprotokolle des Deutschen Bundestages aus dem Dokumentations- und Informationssystem (DIP). Amtliche Werke nach § 5 UrhG. Der DIP-Endpoint plenarprotokoll-text/{id} wird einmal pro Sitzung abgefragt und in eine SQLite-FTS5-Volltextdatenbank überführt. Aktuell 4637 Sitzungen, 2005 MB Volltext.
Suche: SQLite-FTS5 mit unicode61-Tokenizer und remove_diacritics. Ranking via BM25 — Sitzungen mit häufigen oder konzentrierten Treffern erscheinen oben. Pro Treffer ein Snippet von etwa 32 Tokens um den Match herum.
Reden-spezifische Filter (nach Redner oder Fraktion) sind in Vorbereitung — dafür muss der Bundestag-Stenografische-Bericht in Einzelreden zerteilt werden, was strukturelles Parsing erfordert.
Quelle: Deutscher Bundestag — DIP (dip.bundestag.de). Stenografische Berichte als amtliche Werke nach § 5 UrhG. Daten unter dl-de/by-2-0 wiedergegeben.