Tag Archives: rss

RSS si Atom

Lucrand in acest an la lucrarea de licenta, am avut foarte mult de-a face cu feedurile RSS/Atom oferite de site-uri. In momentul in care trebuie sa parsezi un feed de acest gen, ai nevoie de anumite informatii, iar in specificatiile ambelor formate sunt definite anumite reguli ce trebuie respectate. Din pacate, foarte multe site-uri isi formateaza si ofera feedurile dupa reguli numai de ei stiute.

Read More…

Multi nervi cu WordPress si PHP

Am stat astazi cateva ore, asta daca nu pun la socoteaza si orele pierdute in primavara la munca pe cand lucram la Boomr.ro, sa-mi dau seama de ce nu merge sa parsezi anumite feeduri XML (RSS si Atom) din PHP. Acum in sfarsit mi-am dat seama care era problema, dar chestia e ca nu o pot rezolva.

Concluzia: nu poti parsa feedurile generate de WordPress 2.1.3 (posibil si alte versiuni 2.1.*) din PHP. Dupa ce am facut upgrade la un WordPress pe care testam, totul a mers perfect.

Edit:

N-a mers nici cu Python, folosind urllib si minidom. E ciudat ca feedurile cu probleme in PHP cu fopen sau file sunt deschise in 10-15 secunde, dar daca folosesti un socket, trimiti un request  HTTP, iei pagina, totul e mai rapid (si pentru feeduirle fara probleme) singura problema fiind ca, cel putin eu nu reusesc, nu merge sa parsezi datele xml primite.

RSS Feed ProSport

Am observat ca cei de la Prosport au lansat de cateva zile o noua versiune a site-ului, partea buna la prima vedere este ca au inclus si un feed RSS cu ultimele stiri. Din pacate aici se opresc lucrurile bune deoarece au cam dat-o in bara. Au uitat niste chestii destul de importante.

RSS Prosport

Nu uitati sa si deschideti tagurile de titlu si descriere, daca s-ar mai adauga si un titlu si o scurta descriere pentru articol, ar fi perfect.