最終更新:2012-04-10 (火) 05:33:14 (4393d)
MediaWiki/インポート
標準スクリプト
WikipediaのXMLファイルをMySQLデータベースにインポートするには、MediaWiki配布物に含まれるimportDump.phpスクリプトを使用します。 例:
$ bunzip2 -c pages-articles.xml.bz2 | php maintenance/importDump.php
その他ツール
- xml2sql - importDump.phpは遅かったりする(3ページ/秒)のでこちらを使うと便利
- MWDumper - Java製 (400~600ページ/秒)
- http://meta.wikimedia.org/wiki/Data_dumps#mwimport
データベースを空にする
TRUNCATE category; TRUNCATE categorylinks; TRUNCATE externallinks; TRUNCATE image; TRUNCATE imagelinks; TRUNCATE interwiki; TRUNCATE langlinks; TRUNCATE logging; TRUNCATE oldimage; TRUNCATE page_props; TRUNCATE page_restrictions; TRUNCATE pagelinks; TRUNCATE page; TRUNCATE protected_titles; TRUNCATE redirect; TRUNCATE revision; TRUNCATE site_stats; TRUNCATE templatelinks; TRUNCATE text; TRUNCATE user_groups;