Categories
我的生活状态

文字的风格

一份普通的结果分析报告被我硬生生的写了成一篇标准的实证计量文章,可怜那个给我耐心的一点点解释这东西为什么不work的人……突然间觉得也不过是一两年的时间就被一篇篇学术论文成功的毒害至深了。强迫自己坐下来以一个普通读者的身份重新审阅那份报告,恍然觉得真的是不知所云。

顿时沉寂……本以为自己的文字表达能力一直是很好的,突然间才发现并没有自己想象的那么尽如人意。倘若当时拿出来几分写blog的耐心,或许也不至于写成那么技术化。然后顿时开始怀疑自己的blog是不是也越写越失败,越来越没有耐心静下来好好的分析一个问题,用最最通俗的语言和表达方式。

两日两次往返杭州,顿时感觉自己已然有了“住在上海、工作杭州”的潜质。不过想想,貌似很不划算的样子。大家更愿意住在杭州,反过来吧~每次都躲在一个书店上面的很低调的咖啡厅里面,静静的等待中午的阳光渐渐暗淡。然后突然觉得时间过得好快好快,然而事情再也不象在象牙塔里面那样可以一一的计划着来,各种随意和冲击。突然发现,真正需要集中注意力工作的时候,其实根本不需要什么咖啡来提神。那东西,或许只能用来应付老师上课吧。

越来越觉得自己笔下的文字失去了细腻的感觉,越来越简练和固定,缺乏新意。翻看五六年前那些为了某些节目而写的策划案,顿感一种悲哀——年少时期的创造力和飘扬的文字,难道就这么渐渐被时间沉淀了么?是因为忙碌淹没了创造性,还是越来越没有那种完美的执着。突然觉得,很多事情走的太快,好想稍稍停下来喘口气。

然后心里还压了好些事儿。比如没改完的paper,比如各种许诺了要做的事情。一点点的理顺之后,觉得自己好像在玩一个游戏的endless模式似的。或许,年底的时候我需要一段时间的vacation时间,放逐自己。

去年此时依稀在感慨失去了经济直觉,莫非每个秋天都是一种历练的时节?春去秋来,一切终将回归正常的。

Categories
日常应用

批量多个文件GB转UTF-8编码、批量合并多个文件

这里更多是一种记录了。

最近遇到两个小问题,批量把GB转成UTF-8,因为R里面就算用en.US-UTF8也是不能直接读GB编码的中文文本文件的。所以需要一个转换。由于手头几百个文件,不可能一一打开notepad++之类的文本编辑器然后另存为,于是就开始搜。果然,神奇的软件哪里都有,一搜救有华军软件园的一个小软件:http://www.onlinedown.net/soft/46844.htm。打开之后很方便~只可惜是windows下的,我还得切出ubuntu来回到windows。

同样的还有一件事儿要依赖windows,那就是在读入R之前,我需要批量合并多个文本文件。这个时候就要靠命令行了。键入CMD之后,一路cd进入需要操作的文件夹。然后一个神奇的命令:

copy *.txt target.txt

就可以看到命令行华丽丽的搞定了!真速度啊,赞一个。

就在此记录一下,整理数据会有各种各样稀奇古怪的需求,能在R之外做的也有很多(本来我是在ubuntu下ls所有文件名,然后想用for循环在R里面依次读入并rbind的)。当然相比于命令行的原生操作,还是速度慢一些。所以,各种武器齐上马,就看哪个利索了。不同于以往在学校里接触好的数据,格式都弄好了,业界的数据格式千奇百怪。所以涉及到数据格式的修改,感觉真的离不开R里面的merge、reshape等基础命令。话说还发现一个R包data.table,可以用来做分组求和等很多基于table的工作,大赞一个!

Categories
日常应用

LyX2+XeTeX/LaTeX若干中文问题

最近琢磨着用sweave写一篇中文报告,结果打开LyX 2.0之后华丽丽的发现已然不知道一份中文的文档应该怎么写了。上一次用Latex玩中文的东西怕是要追溯到本科毕业论文了。而后一年的时间,就从来没用latex编译过任何中文的文档,也难免突然不知所措了。

LyX 2.0相比1.6x变化还是蛮大的,折腾了半天我也没弄明白怎么可以调出中文来。原来的时候觉得XeTeX慢,就一直用ctex+pdflatex的解决办法。可是不知道为什么,这一次中文总是乱码,改成UTF-8也是,弄得我好痛苦。于是一边折腾texlive,一边先在LyX里面用英文写报告。往后再慢慢翻译好了。

终于,在这个中秋假期临近尾声的时候,我没理由再拖着不把中文搞定了。于是,先调回到ubuntu去,从简单的linux软柿子捏。装完texlive 2011,找着网上的若干教程一步步走下来,比如这个,却发现我总是遇到一个莫名其妙的错误问题。错误提示大致如下:

! Undefined control sequence. <argument> ExplFileName

网上哗啦啦的搜了一番,发现原因大概是l3kernel, l3package和fontspec这个包之间的兼容问题。然后照着网上的步骤删除掉expl3这个文件夹,华丽丽的错误又出现了:

! LaTeX Error: File `expl3.sty' not found.

只有各种崩溃啊。最后忍无可忍,一个 rm -dR * 命令删掉了texlive文件夹下所有的文件。重新开始!

这一次学乖了,不用基于internet的网络安装texlive,改成ISO镜像安装(我下的是20110705版的),怎么也是打包好的镜像,不会出什么问题吧?吸取教训坚决不去tlmgr update -all了,就这个版本能用就行。话说,在ubuntu下配置环境变量$PATH的方法有许多,我最后发现还是直接改/etc/environment这个文件来的比较快,比改/home/username/.bashrck(看不到这些文件的话请在窗口上面选View -> Show Hidden Files)方便很多。不过ubuntu真的感觉还是离开了terminal寸步难行啊,总得sudo -i一下才能过得比较舒服。

然后打开LyX,什么乱码之类的浮云都不见了,顺利的编译中文文档。我是在language那里直接选择不用任何语言包,很清爽啊。导言区加了几行字来适应中文。看了一下对应的latex源代码,也蛮简单的,

documentclass{article}
makeatletter
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% User specified LaTeX commands.
usepackage {fontspec}
setmainfont {WenQuanYi Micro Hei}
XeTeXlinebreaklocale “zh”%中文断行
XeTeXlinebreakskip = 0pt plus 1pt minus 0.1pt%左右弹性间距
makeatother
usepackage{xunicode}
begin{document}

只是记得要在文档选项那里把output选成xetex就好了。然后华丽丽的文驿泉中文文档出现……好吧,我去研究一下怎么用宋体。

至此,LyX 2 配合Xetex的中文问题就顺利的搞定了,感觉在linux下编译xetex还是蛮快的。先这么凑合着用吧,接下来研究sweave的中文支持问题去。

Categories
我的生活状态

午后阳光

桌子上有和原来一样,放了一盆薄荷。小小的薄荷,绿油油的,勉强可以用来回忆巴塞的日子。

午后的阳光倾洒,几缕阳光卖力的穿透窗帘之间的缝隙,就懒懒的洒在了薄荷的茎梢上。于是,薄荷每天都长一点、又一点,然后渐渐的就都是新的叶子了,根部的叶子开始孤零零的变得枯黄、退落。

昨天和一群资深的UseR在躲着午后的阳光在豪华的会议室里面畅谈R的可视化。我很不争气的,就在不停的吃主办方热情提供的各种水果点心……实在是好吃啊。当然最开心的就是终于见到一群可以无话不谈的好朋友们,上次见面都是一两年以前的事儿了吧。R会议在有条不紊的推进,上海这边也和北京的分工越来越细,专注于应用,这样一年两次的R会议就都值得去听呢!

话说,这个圈子和圈子之间的氛围好不一样啊,果然隔行如隔山。一群学经济金融的、一群学统计计算机的、一群学物理的,完全就是不同的圈子文化嘛!我是断然不知道自己应该站在哪里了。可能还是自己最熟悉的圈子最得心应手吧,比如经济,比如R。话说,昨天被bird领到一个超级低调的Cafe,大大开了眼界,大隐隐于市。原来“小资情调”是这么玩的啊~这才是专家的玩法嘛。

中秋节快到了,也借着回家办一些文档手续的时机和朋友聚聚、和父母撒撒娇。前几天被人批判太像学生,以至于和一个“有钱没学历”的人弄到话不投机半句多。好吧,说真的,有钱有学历的、没钱有学历的、没钱没学历的我都常打交道,还觉得都OK。这个,有钱没学历的、尤其是暴发户,我真的不知道怎么应付啊!讲逻辑讲不通啊。我真不知道这些人要的是什么。算了,惹不起躲得起。有个词儿叫做,“低调的奢华”,嘿嘿。

午后阳光灿烂,难得上海入秋之后不下雨了,阳光灿烂的让人又开始怀念巴塞了。好吧,我只不过是找个理由怀念一下巴塞,更多的是怀念一种渐渐远去的象牙塔中的生活方式吧。或许,我也从未离开。一切都取决于选择的生活态度吧。

Categories
网站建设

301,永久重定向!

我这次彻底被惹火了。真的大感慨:早知如此,何必当初!

落园两个域名、两个服务器分别独立运行的痛苦日子终于要结束了——我也痛下决心,牺牲一部分速度,做出这个抉择——落园国内服务器暂停。接下来的问题就是把.cn的域名做一个301永久重定向,全部指到loyhome.com来。

其实本来是想做一个在MySQL 层面的数据库同步的,但无奈两个服务器之间不给力,同步很难做。wordpress镜像的次选择就是直接在配置文件里面写入远程MySQL服务器地址,但也不是很给力。最后的办法就是全静态同步,自然还是不给力。我实在忍无可忍了,再也不想忍受两个站点手动同步刷新的痛苦,于是决定赶紧的搞定这个事儿。.com转到国内还牵扯一个备案问题,同样是折磨的我实在是受不了的事儿。索性,一了百了,全面转身.com并使用国外的服务器。为了清理这一年来的旧账(两边都有留言),我还写了一天的R代码来一一对应各种文章ID和留言ID,最后终于全面整理了过来。国内的服务器可能还会保留给后花园用。

我不得不唠叨一下这些痛苦的历史。落园从2006年开始运行在独立域名上(落园以前是在blogcn上的,前段时间blogcn删档,落园最早的文章就全部覆灭了,正好,毁尸灭迹,不怕有人追踪什么了),以loyhome.cn作为唯一的域名。后来波折一再,.cn域名从来就没有消停过。先是备案,由于换空间商换了一次,所以前后备案痛苦的备了两次;后是实名认证,直接导致去年不在国内的我无奈的看着域名被封了两个月,这也是当时一怒之下注册loyhome.com取而代之的缘故。这还是域名和空间的事儿。落园所依赖的程序上,本来采用的是Textcube,后来实在是不给力就转到wordpress了。当年那次大搬家费了我好大事儿,不得不手动对应两个MySQL数据库,写了一堆PHP程序来实现了完全的迁移。至于各种小波折小调整就不罗列了……

回顾这差不多7年的落园成长史,就是一部充斥着各种折磨的辛酸血泪史。不堪忍受删文章,就自己掏钱买域名买空间做独立博客;不堪忍受TC的低效,就自己写PHP代码鼓捣MySQL彻底转到Wordpress来;不堪忍受一而再、再而三的实名认证,就忍痛把旧域名转到新域名来。谁说写博客容易的?我真不想骂人,可是哪有强迫人不仅要有文笔、还要有独立思考能力、还要有时间有持之以恒精神、还要不计金钱报酬(落园从未也永远不会挂任何广告)、还要学会写PHP代码查bug弄SEO、还要搞的定国外的域名注册……说真的,落园能走到现在,我已经很满足了,很满足了。有的时候真的想过放弃算了,一个博客而已。但是还是跌跌撞撞的坚持下来了。现在所有人都在微博上玩的不亦乐乎,还有多少人关注博客?在大多数博客沦落为相互复制粘贴、挂满小广告或者半年不更新的今日,还有多少人关注什么原创和持之以恒?

总而言之,当我在阿里巴巴商学院门口看到马云题写的四个有点难看的字“永不放弃”的时候,当时想到落园就有种泪流满面的冲动。如果没有这么多朋友的支持与鼓励、没有一篇篇日志后面那些温馨的让人忘记寒冬的留言,我可能真的坚持不到今天。还有,当我不止一次在网上搜问题搜回到自己的博客的时候,只有会心一笑,稍稍讽刺,却也暗自欢喜。

我很对不起很多国内的、尤其是限制国外流量的教育网的朋友们。我知道这一次301之后,很多人访问落园的速度会慢下来,还有可能打不开。但是,我已经没有其他更好的办法了。如果IPV6可以用的话,还请用Google reader订阅落园的RSS吧!如果你们连留言页面都打不开,那么就给我发邮件吧!我不想失去大家的关怀,也请大家不要忘记落园这么一个越来越孤独的存在。

丢车,是为了保帅。只有暗自的期望落园的未来可以顺畅的走下去,毕竟一个博客的核心是内容——正如301对应的解释,永久重定向,我也不想浪费更多的时间在其他的网站管理等琐事上了。涅磐之后,还请雨过天晴。