(PHP) XML_Feed_ParserによるRSSファイルの読み込み (r271-635)

RSSデータファイル（Atom, RSS）をHTTPサーバより取得し、Pear XML_Feed_Parserクラスを用いて要素分解（連想配列に読み込み）を行う手法

次の例では、Atom, RSS0.91, RSS1, RSS2.0が読み込み可能である。

なお、Pearにｈ、XML_RSSというクラスもあるが、こちらはRSS0.91,RSS1, RSS2.0の読み込みは可能だが、Atomの読み込みはサポートしていない。　このクラスの読み込みテストを行ったときの検証コードは次のようなもの。

$rss =& new XML_RSS($uri);
$rss->parse();
print("配列の要素数 = ". count($rss->getItems())."\n");
foreach ($rss->getItems() as $item) { // データの取り出し
print_r($item);
}

今回読み込みの確認を行っているのは…

*Reuters: トップニュース (RSS 2.0) http://feeds.reuters.com/reuters/JPTopNews
*政治 - アサヒ・コム (RSS 1.0) http://rss.asahi.com/f/asahi_politics
*YOMIURI ONLINE（読売新聞）主要ニュース (RSS 2.0) http://rss.yomiuri.co.jp/f/yol_topstories
*毎日ｊｐ-ニュース速報（総合） (RSS 1.0) http://mainichi.pheedo.jp/f/mainichijp_flash
*Yahoo!ニュース - 国内 - J-CASTニュース (RSS 2.0) http://headlines.yahoo.co.jp/rss/jct_dom.xml
*nikkei BPnet 最新記事一覧 (RSS 1.0) http://feed.nikkeibp.co.jp/rss/nikkeibp/index.rdf
*ITpro総合 (RSS 1.0) http://itpro.nikkeibp.co.jp/rss/ITpro.rdf
*ITmedia News 国内記事最新記事一覧 (RSS 2.0) http://rss.rssad.jp/rss/itmnews/2.0/news_domestic.xml
*Enterprise Watch (RSS 1.0) http://www.pheedo.jp/f/enterprise_watch/
*SourceForge.JP Magazine (RSS 1.0) http://www.pheedo.jp/f/sourceforgejp/magazine
*WIRED VISION (Atom 1.0) http://rss.rssad.jp/rss/wiredvision/feed/atom.xml
*スラッシュドット・ジャパン (RSS 1.0) http://www.pheedo.jp/f/slashdot_japan
*ダイヤモンド・オンライン - 新着トピックス (RSS 2.0) http://diamond.jp/feed.xml
*東洋経済オンライン(ビジネス) (RSS 1.0) http://feeds.feedburner.jp/business_all
*帝国データバンク大型倒産速報 (RSS 1.0) http://www.tdb.co.jp/rss/jouhou.rdf

これくらい確認を取っておけば、大体OKそうなんだけどね。

r271-635

An Archive Area

インデックス

10 May 2009

(PHP) XML_Feed_ParserによるRSSファイルの読み込み