Поиск в pdf-файлах через #
pdfgrep с использованием всех процессоров/ядер на компе:
find /mnt/docs -name '*.pdf' | parallel pdfgrep -Ri 'искомая подстрока'
Чуть детальнее и полезнее выглядит если:
... | parallel -j15 pdfgrep -HRiF --color=always 'искомая подстрока'
-j15 — работать используя не более 15 ядер/ЦПУ.
-H — выводить таки имя файла где же нашлось искомое.
-F — искать именно подстроку, вместо RegEx выражения.
parallel — это тот, который GNU parallel,
pdfgrep — тот что
https://pdfgrep.orgДля примера, обычный поиск по текстовым файлам:
parallel -j15 grep -HRiF --color=always 'искомая строка' ::: /mnt/docs
#
grep #
pdfgrep #
parallel #
linux #
shell #
lang_ru @
Russia @
ru