Browse Source

vandroucli: дайжест vandrouki

master
Maxim Lihachev 7 years ago
parent
commit
d85597d950
  1. 19
      vandroucli

19
vandroucli

@ -0,0 +1,19 @@ @@ -0,0 +1,19 @@
#!/bin/bash
#Создан: Чт 05 апр 2018 10:26:40
#Изменён: Чт 05 апр 2018 10:41:39
# Получение последних записей с сайта vandrouki.ru
URL="https://vandrouki.ru"
curl -s -q "$URL" \
| sed 's/<html.*xmlns.*$//g' \
| xmllint --html --xpath "//html/body/div[@id='content']/div[@id='primary']/div/*[self::div/span[@class='published'] or self::h2/a]" - \
| tr '\n' '\r' \
| sed -e 's/\r\r/####/g; s/\r/@/g; s/####/\n/g' \
| sed 's/href="/@/; s/" rel=[^>]*>/@/; s/published.>/@/' \
| awk -F'@' '{print $5 "@" $3 "@" $2}' \
| sed -e :a -e 's/<[^>]*>//g;/</N;//ba' \
| column -t -s @
Loading…
Cancel
Save