!# /usr/bin/env Rscript # Textdatei (Schwäbische Kunde) importieren schwaebische_kunde <- readr::read_lines(file = "schwaebische-kunde.txt") %>% dplyr::as_tibble() %>% dplyr::rename(text = value) %>% tibble::rowid_to_column("zeile") # RE anwenden ## RE in Worten: Ist der erste Buchstabe ein d, so wird nur das d extrahiert [dD]. ## Ist der erste Buchstabe hingegen kein D [^dD] , so werden alle Zeichen ## (außer d), auf die ein d folgt extrahiert [^dD]*(?=[dD]) und als letztes ## Zeichen dann ebendieses d [dD] schwaebische_kunde$bis_zum_ersten_d <- schwaebische_kunde$text %>% stringr::str_extract("[dD]|[^dD]*(?=[dD])[dD]") # Ergebnis ausgeben print(x = schwaebische_kunde, n = Inf)