最終更新:2009-11-14 (土) 13:16:37 (5268d)  

MWDumper
Top / MWDumper

MWDumperはMediaWikiダンプファイルからページのセットを素早く抽出する小さなツールです。

http://www.mediawiki.org/wiki/MWDumper/ja

http://download.wikimedia.org/tools/

インポート

java -jar mwdumper.jar --format=sql:1.5 pages_full.xml.bz2 | mysql -u <username> -p <databasename>
  • Hint: The tables 'page', 'revision' and 'text' must be empty for a successful import.

my.cnfの設定

[mysqld]
...
max_allowed_packet = 20M

innodb_buffer_pool_size = 256M
innodb_log_file_size = 64M
innodb_data_file_path = ibdata1:100M:autoextend

速度

  • 400~700ページ/秒

参考