Categories
事儿关经济

Academic Day

昨天从杭州回来,顿时感到如释重负,事情做完了,自然心里舒畅一些。

然后,今天列了列这周需要做的事情,终于没有什么说是要几点几点必须做完的了。然后长吁一口气,想起来需要改的paper。其实论文这东西,写不写纯属一种对于学术偏执的热情。我还是很喜欢看到一点点contribution to existing literature的,先不管这个contribution有多大。于是写起来,也便多了几分感觉。顿时感慨,大多是时候做事情的热情真的只是单纯的来源于喜欢和责任感啊——尤其是后者,若不是责任感在那里,真的感觉很多事情都没有必要做。与此同时,发觉自己的完美主义倾向越来越严重,不喜欢把一个不负责任的东西交给别人,那样怎么对得起放在第二行的自己的名字呢?虽然很多时候也没有放自己的名字在那里了……

今天,除了接接电话之外,定位于一个academic day,更多的是指让自己的思维回归学术化一点,用经济的角度重新审视过去几周的事情,再就是准备一下接下来的两个conference。

话说,这次R会议要讲的题目终于定下来了, Experiments in Social Networks and Analysis in R,有点绕口是不是?中文更绕口,我都不知道怎么翻译好了。田野实验的方法在实证研究中的应用越来越广,而随机实验的方法尤其对社会网络这种本来内生性问题很严重的领域提供了一个寻找一些答案的方法。今年上半年的时候前后在这个基础上做了一个实验设计、还有后续的一篇更完整的论文,现在又开始真正的run一些实验,所以觉得这个题目至少有一点话可说。只是不知道多少人会感兴趣了。话说,我应该先把《社会实验的特殊性》一系列感想文章一点点写出来,果然实践出真知啊。

R会议上海会场在一点点前进,不时看着慢慢变长的报名列表心里就有一种莫名其妙的幸福感 ^_^ 能见到很多志同道合的人自然是一件格外开心的事情。现在真的是每天都离不开R了,各种该用R的、其实并不一定非用R的事儿都交给R来处理了,工具依赖啊。发现RStudio这个“编辑器”很好用,很好用……然后又在下Revolutoin了,不知道会不会有新的惊喜。

还有很多东西值得一点点期待吧。心情有张、有落也算正常,不过总体上还是一种满积极的状态,毕竟没有白来的丰收,相信今日的辛苦付出都是会换来在未来的某个时刻回眸时的会心一笑。算作一种小小的希望吧。

Categories
我的生活状态

文字的风格

一份普通的结果分析报告被我硬生生的写了成一篇标准的实证计量文章,可怜那个给我耐心的一点点解释这东西为什么不work的人……突然间觉得也不过是一两年的时间就被一篇篇学术论文成功的毒害至深了。强迫自己坐下来以一个普通读者的身份重新审阅那份报告,恍然觉得真的是不知所云。

顿时沉寂……本以为自己的文字表达能力一直是很好的,突然间才发现并没有自己想象的那么尽如人意。倘若当时拿出来几分写blog的耐心,或许也不至于写成那么技术化。然后顿时开始怀疑自己的blog是不是也越写越失败,越来越没有耐心静下来好好的分析一个问题,用最最通俗的语言和表达方式。

两日两次往返杭州,顿时感觉自己已然有了“住在上海、工作杭州”的潜质。不过想想,貌似很不划算的样子。大家更愿意住在杭州,反过来吧~每次都躲在一个书店上面的很低调的咖啡厅里面,静静的等待中午的阳光渐渐暗淡。然后突然觉得时间过得好快好快,然而事情再也不象在象牙塔里面那样可以一一的计划着来,各种随意和冲击。突然发现,真正需要集中注意力工作的时候,其实根本不需要什么咖啡来提神。那东西,或许只能用来应付老师上课吧。

越来越觉得自己笔下的文字失去了细腻的感觉,越来越简练和固定,缺乏新意。翻看五六年前那些为了某些节目而写的策划案,顿感一种悲哀——年少时期的创造力和飘扬的文字,难道就这么渐渐被时间沉淀了么?是因为忙碌淹没了创造性,还是越来越没有那种完美的执着。突然觉得,很多事情走的太快,好想稍稍停下来喘口气。

然后心里还压了好些事儿。比如没改完的paper,比如各种许诺了要做的事情。一点点的理顺之后,觉得自己好像在玩一个游戏的endless模式似的。或许,年底的时候我需要一段时间的vacation时间,放逐自己。

去年此时依稀在感慨失去了经济直觉,莫非每个秋天都是一种历练的时节?春去秋来,一切终将回归正常的。

Categories
日常应用

批量多个文件GB转UTF-8编码、批量合并多个文件

这里更多是一种记录了。

最近遇到两个小问题,批量把GB转成UTF-8,因为R里面就算用en.US-UTF8也是不能直接读GB编码的中文文本文件的。所以需要一个转换。由于手头几百个文件,不可能一一打开notepad++之类的文本编辑器然后另存为,于是就开始搜。果然,神奇的软件哪里都有,一搜救有华军软件园的一个小软件:http://www.onlinedown.net/soft/46844.htm。打开之后很方便~只可惜是windows下的,我还得切出ubuntu来回到windows。

同样的还有一件事儿要依赖windows,那就是在读入R之前,我需要批量合并多个文本文件。这个时候就要靠命令行了。键入CMD之后,一路cd进入需要操作的文件夹。然后一个神奇的命令:

copy *.txt target.txt

就可以看到命令行华丽丽的搞定了!真速度啊,赞一个。

就在此记录一下,整理数据会有各种各样稀奇古怪的需求,能在R之外做的也有很多(本来我是在ubuntu下ls所有文件名,然后想用for循环在R里面依次读入并rbind的)。当然相比于命令行的原生操作,还是速度慢一些。所以,各种武器齐上马,就看哪个利索了。不同于以往在学校里接触好的数据,格式都弄好了,业界的数据格式千奇百怪。所以涉及到数据格式的修改,感觉真的离不开R里面的merge、reshape等基础命令。话说还发现一个R包data.table,可以用来做分组求和等很多基于table的工作,大赞一个!

Categories
日常应用

LyX2+XeTeX/LaTeX若干中文问题

最近琢磨着用sweave写一篇中文报告,结果打开LyX 2.0之后华丽丽的发现已然不知道一份中文的文档应该怎么写了。上一次用Latex玩中文的东西怕是要追溯到本科毕业论文了。而后一年的时间,就从来没用latex编译过任何中文的文档,也难免突然不知所措了。

LyX 2.0相比1.6x变化还是蛮大的,折腾了半天我也没弄明白怎么可以调出中文来。原来的时候觉得XeTeX慢,就一直用ctex+pdflatex的解决办法。可是不知道为什么,这一次中文总是乱码,改成UTF-8也是,弄得我好痛苦。于是一边折腾texlive,一边先在LyX里面用英文写报告。往后再慢慢翻译好了。

终于,在这个中秋假期临近尾声的时候,我没理由再拖着不把中文搞定了。于是,先调回到ubuntu去,从简单的linux软柿子捏。装完texlive 2011,找着网上的若干教程一步步走下来,比如这个,却发现我总是遇到一个莫名其妙的错误问题。错误提示大致如下:

! Undefined control sequence. <argument> ExplFileName

网上哗啦啦的搜了一番,发现原因大概是l3kernel, l3package和fontspec这个包之间的兼容问题。然后照着网上的步骤删除掉expl3这个文件夹,华丽丽的错误又出现了:

! LaTeX Error: File `expl3.sty' not found.

只有各种崩溃啊。最后忍无可忍,一个 rm -dR * 命令删掉了texlive文件夹下所有的文件。重新开始!

这一次学乖了,不用基于internet的网络安装texlive,改成ISO镜像安装(我下的是20110705版的),怎么也是打包好的镜像,不会出什么问题吧?吸取教训坚决不去tlmgr update -all了,就这个版本能用就行。话说,在ubuntu下配置环境变量$PATH的方法有许多,我最后发现还是直接改/etc/environment这个文件来的比较快,比改/home/username/.bashrck(看不到这些文件的话请在窗口上面选View -> Show Hidden Files)方便很多。不过ubuntu真的感觉还是离开了terminal寸步难行啊,总得sudo -i一下才能过得比较舒服。

然后打开LyX,什么乱码之类的浮云都不见了,顺利的编译中文文档。我是在language那里直接选择不用任何语言包,很清爽啊。导言区加了几行字来适应中文。看了一下对应的latex源代码,也蛮简单的,

documentclass{article}
makeatletter
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% User specified LaTeX commands.
usepackage {fontspec}
setmainfont {WenQuanYi Micro Hei}
XeTeXlinebreaklocale “zh”%中文断行
XeTeXlinebreakskip = 0pt plus 1pt minus 0.1pt%左右弹性间距
makeatother
usepackage{xunicode}
begin{document}

只是记得要在文档选项那里把output选成xetex就好了。然后华丽丽的文驿泉中文文档出现……好吧,我去研究一下怎么用宋体。

至此,LyX 2 配合Xetex的中文问题就顺利的搞定了,感觉在linux下编译xetex还是蛮快的。先这么凑合着用吧,接下来研究sweave的中文支持问题去。

Categories
我的生活状态

午后阳光

桌子上有和原来一样,放了一盆薄荷。小小的薄荷,绿油油的,勉强可以用来回忆巴塞的日子。

午后的阳光倾洒,几缕阳光卖力的穿透窗帘之间的缝隙,就懒懒的洒在了薄荷的茎梢上。于是,薄荷每天都长一点、又一点,然后渐渐的就都是新的叶子了,根部的叶子开始孤零零的变得枯黄、退落。

昨天和一群资深的UseR在躲着午后的阳光在豪华的会议室里面畅谈R的可视化。我很不争气的,就在不停的吃主办方热情提供的各种水果点心……实在是好吃啊。当然最开心的就是终于见到一群可以无话不谈的好朋友们,上次见面都是一两年以前的事儿了吧。R会议在有条不紊的推进,上海这边也和北京的分工越来越细,专注于应用,这样一年两次的R会议就都值得去听呢!

话说,这个圈子和圈子之间的氛围好不一样啊,果然隔行如隔山。一群学经济金融的、一群学统计计算机的、一群学物理的,完全就是不同的圈子文化嘛!我是断然不知道自己应该站在哪里了。可能还是自己最熟悉的圈子最得心应手吧,比如经济,比如R。话说,昨天被bird领到一个超级低调的Cafe,大大开了眼界,大隐隐于市。原来“小资情调”是这么玩的啊~这才是专家的玩法嘛。

中秋节快到了,也借着回家办一些文档手续的时机和朋友聚聚、和父母撒撒娇。前几天被人批判太像学生,以至于和一个“有钱没学历”的人弄到话不投机半句多。好吧,说真的,有钱有学历的、没钱有学历的、没钱没学历的我都常打交道,还觉得都OK。这个,有钱没学历的、尤其是暴发户,我真的不知道怎么应付啊!讲逻辑讲不通啊。我真不知道这些人要的是什么。算了,惹不起躲得起。有个词儿叫做,“低调的奢华”,嘿嘿。

午后阳光灿烂,难得上海入秋之后不下雨了,阳光灿烂的让人又开始怀念巴塞了。好吧,我只不过是找个理由怀念一下巴塞,更多的是怀念一种渐渐远去的象牙塔中的生活方式吧。或许,我也从未离开。一切都取决于选择的生活态度吧。