好像很规律的似的,每半年落园就要大折腾我一次...反正鼓捣wordpress这么长时间了,已然习惯了。
这次是莫名其妙的服务器宕机,然后联系客服无果(昨天才算联系到了一个人...),然后受不了网站一直挂在那里,果断搬家了(最纠结的是当时还在上海到北京的高铁上,3G+翻墙各种不稳定)。转投BlueHost的怀抱,信用卡刷刷的顺便心里小小滴一下血...
然后悲催的发现最新的备份居然是去年10月的,我...只能郁郁的先把这些文章导进去...然后开始漫天的搜,果然还是有解决策略的(隐约记得谁说过可以通过RSS恢复)。
然后第一件事儿就是去装个了备份插件,这次学乖了直接放在Google Drive上,用的是UpdraftPlus - Backup/Restore。
在众多日志中觉得这个"通过Google Reader恢复WordPress日志"还算靠谱,就比着葫芦画瓢了一番。文章是恢复了,但是里面那堆Latex公式就彻底挂了...无奈之下,去看google reader直接导出来的xml(atom格式)文件,发现厚道的是公式居然还在图片的alt里面(需要先decode一下),形如这个:
<span><img src="tex_5117609d4239740f7e4072b9508c4742.gif"
style="vertical-align:middle;border:none;padding-bottom:1px" alt="n_{L}"></span>是网络输出的个数。</li>
这样就可以直接正则表达式提取了...我是用的notepad++(试了一下R的XmltoList,但是中文全给我转成UTF8的样子让我很不爽,果断放弃了),所以输入的是
<img(.*?) alt="(.*?)">
然后替换为:
\
这样一下子就把公式又换成$$的形式了。
上面链接里的php文件有点问题,不能恢复tag。我也懒的整了,依旧是正则表达式提取:
<category term="(.*?)"/>
然后替换为半角逗号分割
\1,
好在日志不是太多,100多篇手动又检查了一遍(主要是有些图片丢了需要重新上传)。这样貌似就正常了。多说有点抽风,没法把评论备份到本地数据库了,不过现在看着还算正常我也就懒得去跟它纠结了。
暂时先这样吧,然后去恢复英文博客去...其实我对英文博客更没底儿,不知道上个备份在哪儿-_-||反正搞独立博客就是一折腾。忍了。