最終更新:2009-11-14 (土) 13:16:37 (5268d)
MWDumper
Top / MWDumper
MWDumperはMediaWikiダンプファイルからページのセットを素早く抽出する小さなツールです。
http://www.mediawiki.org/wiki/MWDumper/ja
http://download.wikimedia.org/tools/
インポート
java -jar mwdumper.jar --format=sql:1.5 pages_full.xml.bz2 | mysql -u <username> -p <databasename>
- Hint: The tables 'page', 'revision' and 'text' must be empty for a successful import.
my.cnfの設定
[mysqld] ... max_allowed_packet = 20M innodb_buffer_pool_size = 256M innodb_log_file_size = 64M innodb_data_file_path = ibdata1:100M:autoextend
速度
- 400~700ページ/秒