地域ホームページのコンテンツ追加ということでWikipediaのAPIを利用する。
ユーザーエージェントを指定しないと取得できない。
$context = stream_context_create(array('http' => array(
'method' => 'GET',
'header' => 'User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)',
)));
$url = "http://ja.wikipedia.org/wiki/%E7%89%B9%E5%88%A5:Export/%E4%B8%AD%E6%B4%A5%E5%B7%9D%E5%B8%82";
$data = file_get_contents($url, false, $context);
取得できるデータがwiki記法のためHTML形式に変換する。
PEARのText_Wiki_Mediawikiをつかって変換する。
Text_Wiki_Mediawikiをインストール
参考)MediaWiki記法で記述されたテキストをHTMLに変換する(PEAR Text_Wiki_Mediawiki)
# pear install Text_Wiki_Mediawiki-alpha
で、実際に変換してみる。
$xml = new SimpleXMLElement($data);
require_once("Text/Wiki/Mediawiki.php");
$wiki=new Text_Wiki_Mediawiki();
// Configuration
$wiki->deleteRule( 'Wikilink' ); // remove a rule for auto-linking
$wiki->setFormatConf( 'Xhtml' , 'translate' , false ) ; // remove HTML_ENTITIES
echo $wiki->transform($xml->page[0]->revision[0]->text,'xhtml');
これでできると思ったらうまくいかない・・。
んー・・・・。
ちょっと時間がかかりそうなので、また今度。。。
その他関連
この投稿への コメント/トラックバック はまだありません...
MICKです。
1983年1月24日生まれ。ウェブの世界にいるのは、偶然のようで必然なのかも。
好きなこと :
国民的人気を誇っている坂本龍馬の人気のきっかけを作った司馬遼太郎の小説「竜馬がゆく」で龍馬の人気の秘密がわかる!?。
[続きを読む!]

龍馬の金策日記―維新の資金をいかにつくったか (祥伝社新書)
よく推理小説とかだと読書を中断するタイミングが掴めない時があるんですが、この本も同じ感覚で読めました。
[続きを読む!]
人生って、一度しかないっていう単純なことに気がついた。
「あぁ、あの時どうして・・・」と悔やみながら人生を終わるのは嫌だと思った。
[続きを読む!]
なんで禁煙本が自己啓発やねん。と思われた方すみませんw
しかし、何を隠そう自分はこの本でタバコをやめたのです!
[続きを読む!]
| 位 | アクセス元 | 数 |
|---|---|---|
| bing.com | 256 | |
| q.hatena.ne.jp | 130 | |
| fdays.blogspot.com | 59 | |
| 4 | d.hatena.ne.jp | 49 |
| 5 | cakephp.blog16.jp | 49 |
| 6 | analytics-ja.blogspot.com | 35 |
| 7 | kosstyle.blog16.fc2.com | 24 |
| 8 | twitter.com | 22 |
| 9 | milds.net | 21 |
| 10 | blog.goo.ne.jp | 21 |
| 11 | cakephp.jp | 20 |
| 12 | b.hatena.ne.jp | 19 |
| 13 | friendfeed.com | 17 |
| 14 | syuhari.jp | 17 |
| 15 | blog.ecworks.jp | 15 |