2008-05-08

Фильтруем RSS — читаем интерес

В информационном веке потоки данных циркулируют не только в компьютерах, но и в головах. Информация пестрит лавинами красок, картинок, замысловатых текстов и прочими атрибутами современного интернета. Вопрос становится ребром для тех, кто хочет отсеять ненужные килобайты и сосредоточиться только на необходимом, интересном и увлекательном. Как далеко меня повело...
Все дороги ведут к RSS. Тут как с добычей — сама в рот стремиться. Так и ленты новостей ежедневно скрашивают минуты досуга. Пользователи Google Reader наверняка желали бы иметь в арсенале мощный инструмент для фильтрации. Но в самом сервисе подобной функции пока нет. Приходится присматриваться к лакированным и крепким костылям. Чем мы сейчас и займемся.
В заметке "6 Ways to Filter Your RSS Feeds" даны описания online-фильтров. Все я не опробовал. Но те, что были рассмотрены не вселили никакого оптимизма.
Так, например, Feed Rinse за красивым оформлением и блестящими кнопочками скрывал нелюбовь к русской кодировке. Все темы представлялись абракадабрами.
Filter My RSS язык не коверкает, но скудные настройки и необходимость возиться с каждой лентой отбивают охоту пользоваться им.
Уже примерно месяца два функции фильтра у меня возложены на Yahoo! Pipes. Если вы не слышали об этом сервисе, но готовы гуглить открыты для всего нового и неизведанного, то нам по пути :)
Со сферой применения труб можно ознакомиться здесь. Данная заметка покажет предназначение основных элементов трубы.
Виджет "Пять популярных сообщений" блога, кстати говоря, тоже использует Pipes.
Теперь непосредственно к фильтрации. Необходимо поместить на холст модули Fetch Feed и Filter.

Yahoo! Pipes

Как видно на скрине, Fetch Feed содержит адреса лент, а Filter — правила отбора. В моем примере пропускаются записи, содержащие одно из ключевых слов. Не все потоки имеют человеческое обличие (UTF-8). Неверных перекует следующая строчка:

http://william.cswiz.org/tool/xmliconv/?ie=windows-1251&url=http://www.onliner.by/rss/news.rss

Как видите, ничего сложного. Зато теперь читаешь только идеологически выдержанные новости и сообщения ;)
А у Вас есть какие-нибудь фильтры либо другие приемы по оптимизации RSS потоков?

8 комментариев: ответить

08.05.2008, 20:04   Юрий комментирует...

В строке с перекодированием фида появился лишний пробел. И этот сервис ведь не только из виндовой кодировки в UTF перегоняет, можно например и из KOI-8.

08.05.2008, 20:07   CTpaHHoe комментирует...

подскажите, а может ли "Yahoo! Pipes" фильтровать дубликаты записей в RSS, которые получаются (не знаю по каким причинам) на некоторых сайтах ?

19.05.2008, 18:05   PhoeniX комментирует...

Operators::Unique?

19.05.2008, 19:05   drakulavich комментирует...

Что называется, слона не заметил.
Большое спасибо за наводку.

19.05.2008, 20:59   CTpaHHoe комментирует...

Большое спасибо за подсказку - теперь смогу привести всё в порядок :)

20.05.2008, 20:38   PhoeniX комментирует...

Нда. Мне вот не хватает API для редактирования труб (а ведь несложно наверное отдавать-принимать их в JSON).
За перекодировщик спасибо.

20.05.2008, 21:10   drakulavich комментирует...

С API можно было бы горы свернуть :) Гибкость ого-го!
Авось расширят арсенал. Постоянно что-то добавляют.

26.05.2008, 18:08   PhoeniX комментирует...

Авторизации не хватает ещё, вот что. Так бы можно было и фиды на базе своего гугльридера создавать.

Отправить комментарий