Categories
事儿关经济

数据库规范与SQL应用[3rd week, July]

以前也说过,这个暑假过得相当的“充实”,每天白天8节课(其实我也是三天打渔,两天晒网),晚上回到家练习练习做饭,然后就打开本本开始忙碌的工作。一边看无尽paper,一边绞尽脑汁的搜数据,遇到问题开始到处请教,日子倒也颇为充实。

记得春天的时候写那篇关于FDI的破文章的时候狠狠的感慨了一番国内统计年鉴质量之差,大部分时间都耗在搜集数据上(尤其是把某些图片格式的数据手动输入到数据库里)了,实在是让人哭笑不得。这次写论文用到一些微观数据,其中一部分是鼎鼎大名的中国营养健康调查(China Health and Nutrition Survey,简写CHNS),虽然下载下来的都是SAS格式,但是借助stat transfer还是很容易就转到stata格式了(我算是被“威逼”+“利诱”彻底背叛SPSS了)。然后接下来,我就无语了,开始面对如山的变量……把问卷下下来,又把变量说明下下来,一个个对照着理解……好痛苦啊。

然后需要筛选变量了。按照欣欣姐屡次的提醒,乖乖的开始写do file。其实我还是习惯直接在命令行里面输入……

郁闷的就是对Stata的命令实在是太陌生了,不得不一次次的help。drop...keep...merge...一个个看下来,花了不少时间。开始残念那个叫做SQL的东西,开始回忆当时老老实实学习数据库的日子……怎么也是标准的计算机学院教材训练出来的,还是对于SQL最熟悉,虽然时日已久开始淡忘……

网上搜了搜,好像SAS支持SQL但是Stata并不支持SQL查询和操作,唉。虽然stata各种简单的函数简化了许多操作,但是至少应该保留一个sql接口供习惯sql的人来使用嘛。SQL多好啊,简单的语句组合就那么万能无敌……标准的数据库操作语言啊~

其实stata终归还是一个统计分析软件,并不是数据库管理软件,也就是说它的任务是“分析”而不是“管理”数据。但是我实在是不知道怎么把数据整理好再交给stata分析,只能在stata里面整理了。实在是为难stata,也为难我了。呜呼!

我想,当初要是考虑留下一个sql窗口,会方便许多吧。不知道是为了简化操作还是什么的,非要单独出来一些函数。唉。

也没什么好办法了,相比于借助其他DMS(Data Management System,数据管理系统)整理好再转到stata格式,我还是直接在stata里面操作好了。或许后者效率还是稍稍高些吧,毕竟原理都一样。只是期待,某些约定俗成的标准和规范,应该更为广泛的传承和延续,节省大家的时间,专注于研究而不是无谓的浪费在过程之中。

无论如何,我还是希望尽快的弄完数据这块,专心于经济分析中。

Categories
事儿关经济

再谈数学

虽然今天是有很重的任务要写完一个summary明天好去跟导师汇报的,但是看到一位朋友在落园的留言和推荐的网址(现在感觉落园能带给我的真的是越来越多了,深深体会到姜太公当年的幸福),随即看看了他所推荐的文章,受益良多,而且正是我所需要的。

到现在,最最欣慰的就是暑假选择了留在学校好好的补习数学,而不是白白浪费时间去闲逛。同样的,越来越感谢让我逐渐意识到数学在经济学中的工具枢纽地位的诸位老师们。工欲善其事,必先利其器。所以,大四一年,我有非常大的必要去好好的补习数学这个工具。

看了看那些很长的文章,总结开来,自己需要弥补的:

  • 数学分析:那点微积分的只是需要很大程度上的弥补
  • 实分析:国内的实变+泛函,坚定了我下学期不自量力的去听数学院的泛函分析的信念
  • 测度论:实变函数的一大部分,打算大四下去听,实在不行就申请延期毕业吧,总之要学完这门课。
  • 傅立叶分析:这个……呃……
  • 复变函数:下学期要去学,呵呵。
  • 常微分方程:下学期去学……
  • 点集拓扑:大四下……
  • 高等数学:还是好好的把北大那本经典教材翻烂吧……
  • 近世代数:呃,这个东西,稍稍考虑一下还可以……
  • 基于测度论的概率论:唉,还是自学吧,买了本北大的书却看不懂……深感自己的无知。
  • 随机过程:呃……先看看数学院开不开吧……
  • 基于测度论的数理统计:天……我那数理统计还是考试前强迫自己看出来的,这东西……唉……
  • 渐进统计:这是什么东东?

看完此文的唯一感觉就是:我真的学过数学么?狂汗之,惭愧!真是浪费了太多时间在太多无谓的事情上面,接下来的一年我还有一些时间去弥补这些不足,这是唯一可以偷偷欣慰的事情。只但愿,亡羊补牢,为时未晚。

关于此文的PDF完全版,请移步:http://sites.google.com/site/loyhome/math (或context重排版:http://sites.google.com/site/views63/context-test)下载。

话说,刚才上Cambridge的网站的时候赫然发现,1209-2009,800年啊!我的神啊,真是“百百年老校”咯!先祝他生日快乐!嘿嘿。刚刚又给他送了1000多大洋,IELTS~一路顺风!

再论,最近总有人来讨教Latex……如果有可能,下学期好好抽空讲讲Latex算了……反正也不是第一次给那群孩子们上课了……

Categories
事儿关经济

送别季先生

今天一醒来,打开电视,习惯性的调到新闻频道,就看到了季羡林先生去世的消息。

季羡林,字希逋,又字齐奘。著名的古文字学家、历史学家、东方学家、思想家、翻译家、佛学家、作家。他精通12国语言。曾任中国科学院哲学社会科学部委员、北京大学副校长、中国社科院南亚研究所所长。1911年8月6日出生于山东省临清市康庄镇,2009年07月11日在北京301医院病逝。。
北京大学教授,中国文化书院院务委员会主席,中科院院士,中国语言学家,文学翻译家,梵文、巴利文专家,作家。对印度语文文学历史的研究建树颇多。

季先生是我颇为敬佩的一位大师。说起来季先生还与济南颇有一些渊源,按照百度百科的记载:

6岁,到济南,投奔叔父季嗣诚。入私塾读书。 7岁后,在山东省立第一师范学校附设新育小学读书。10岁,开始学英文。12 岁,考入正谊中学,半年后转入山东大学附设高中。在高中开始学德文,并对外国文学发生兴趣。18岁,转入省立济南高中,国文老师是董秋芳,他又是翻译家。"我之所以五六十年来舞笔弄墨不辍,至今将过耄耋之年,仍然不能放下笔,全出于董老师之赐,我毕生难忘。"

想到这里,不得不稍加感谢一下我的初中语文老师,一位诗人。从她那里,我练就了稚嫩的文笔和表达的习惯,否则也不会有后来的这个博客。而后成年累月的积淀,大都离不开她在我少年时候的启迪。还记得那个时候抄下了张若虚的《春江花月夜》,然后在她办公室里享受一对一的讲述的美好时光。每念及此,都颇为感动命运的眷顾。

诗是不能翻译的,尤其是不能用现代汉语去解释,解释了反而意境全无,这是此生遵循的最深的教诲。

春江潮水连海平,海上明月共潮生。 滟滟随波千万里,何处春江无月明!

而说到季先生,最深的印象则是今年五一在燕园逗留之时,偶然间淘到的一本“燕园风景”摄影集。其中有季先生的一首题诗,配着如诗如画的未名湖畔佳景,当时令人颇为沉醉其中。

季先生为国学大师,而且是让人颇为敬仰的淡泊名利之士。其品行,值得后人学习。

  • 一辞“国学大师”

“环顾左右,朋友中国学基础胜于自己者,大有人在。在这样的情况下,我竟独占‘国学大师’的尊号,岂不折煞老身!”
现在在某些比较正式的文件中,在我头顶上也出现“国学大师”这一灿烂辉煌的光环。这并非无中生有,其中有一段历史渊源。
约摸十几二十年前,中国的改革开放大见成效,经济飞速发展。文化建设方面也相应地活跃起来。有一次在还没有改建的北京大学大讲堂里开了一个什么会,专门向同学们谈国学。当时主席台上共坐着五位教授,每个人都讲上一通。我是被排在第一位的,说了些什么话,现在已忘得干干净净。一位资深记者是北大校友,在报上写了一篇长文《国学热悄悄在燕园兴起》。从此以后,其中四位教授,包括我在内,就被称为“国学大师”。他们三位的国学基础都比我强得多。他们对这一顶桂冠的想法如何,我不清楚。我自己被戴上了这一顶桂冠,却是浑身起鸡皮疙瘩。
说到国学基础,我从小学起就读经书、古文、诗词。对一些重要的经典著作有所涉猎。但是我对哪一部古典,哪一个作家都没有下过死功夫,因为我从来没想成为一个国学家。后来专治其他的学术,浸淫其中,乐不可支。除了尚能背诵几百首诗词和几十篇古文外;除了尚能在最大的宏观上谈一些与国学有关的自谓是大而有当的问题比如天人合一外,自己的国学知识并没有增加。环顾左右,朋友中国学基础胜于自己者,大有人在。在这样的情况下,我竟独占“国学大师”的尊号,岂不折煞老身(借用京剧女角词)!我连“国学小师”都不够,遑论“大师”!
为此,我在这里昭告天下:请从我头顶上把“国学大师”的桂冠摘下来。

  • 二辞“学界泰斗”

“这样的人,滔滔者天下皆是也。但是,现在却偏偏把我‘打’成泰斗。我这个泰斗又从哪里讲起呢?”
这要分两层来讲:一个是教育界,一个是人文社会科学界。
先要弄清楚什么叫“泰斗”。泰者,泰山也;斗者,北斗也。两者都被认为是至高无上的东西。
光谈教育界。我一生做教书匠,爬格子。在国外教书10年,在国内57年。人们常说:“没有功劳,也有苦劳。”特别是在过去几十年中,天天运动,花样翻新,总的目的就是让你不得安闲,神经时时刻刻都处在万分紧张的情况中。在这样的情况下,我一直担任行政工作,想要做出什么成绩,岂不戛戛乎难矣哉!我这个“泰斗”从哪里讲起呢?
在人文社会科学的研究中,说我做出了极大的成绩,那不是事实。说我一点成绩都没有,那也不符合实际情况。这样的人,滔滔者天下皆是也。但是,现在却偏偏把我“打”成泰斗。我这个泰斗又从哪里讲起呢?
为此,我在这里昭告天下:请从我头顶上把“学界(术)泰斗”的桂冠摘下来。

  • 三辞“国宝”

“ 是不是因为中国只有一个季羡林,所以他就成为‘宝’。但是,中国的赵一钱二孙三李四等等,等等,也都只有一个,难道中国能有13亿‘国宝’吗?”
在中国,一提到“国宝”,人们一定会立刻想到人见人爱憨态可掬的大熊猫。这种动物数量极少,而且只有中国有,称之为“国宝”,它是当之无愧的。可是,大约在八九十来年前,在一次会议上,北京市的一位领导突然称我为“国宝”,我极为惊愕。到了今天,我所到之处,“国宝”之声洋洋乎盈耳矣。我实在是大惑不解。当然,“国宝”这一顶桂冠并没有为我一人所垄断。其他几位书画名家也有此称号。
我浮想联翩,想探寻一下起名的来源。是不是因为中国只有一个季羡林,所以他就成为“宝”。但是,中国的赵一钱二孙三李四等等,等等,也都只有一个,难道中国能有13亿“国宝”吗?
这种事情,痴想无益,也完全没有必要。我来一个急刹车。
为此,我在这里昭告天下:请从我头顶上把“国宝”的桂冠摘下来。
三顶桂冠一摘,还了我一个自由自在身。身上的泡沫洗掉了,露出了真面目,皆大欢喜。

在2006年感动中国颁奖词中,可谓简略的总结了季先生的生平。

2006年感动中国颁奖辞(季羡林)
【颁奖辞】智者乐,仁者寿,长者随心所欲。一介布衣,言有物,行有格,贫贱不移,宠辱不惊。学问铸成大地的风景,他把心汇入传统,把心留在东方。季羡林:最难时也不丢掉良知

此文多数文字都是从百度百科转贴过来,只是因为不知道怎么样的文字配得上季先生的博大精深,生怕稚嫩的文字玷污了季老。此种崇敬之情,埋于心中,流于笔尖,却也无妨。

另,季先生也是爱猫之人(猫是我的最爱),说起来我倒是很喜欢季先生这只猫^_^

Categories
事儿关经济

流连于复杂和简单之间

常常觉得写东西的境界有两种,一种是白居易似的“作诗力求通俗,但并不是率易之作“:

他在《诗解》中自述说:“旧句时时改,无妨悦性情”。他一方面要求文字浅切平易流畅,另一方面追求有意境、有韵味,所以白居易在世时,他的诗就得到广泛的流传。

白居易反对唯尚“淫辞丽藻”的形式主义文风,他学习民歌,作诗广泛运用俗言俚语,博得后人“老妪都解”的称道,形成了我国诗歌史上平易通俗一派。

另一种则是词藻的巧妙堆砌和复杂构造。此类精工巧匠颇多,不必枚举。

今天突然间说起简单和复杂,其实一直觉得两者只是一个事物的两个极端形式,大都我们都是处在其中间的,要么稍偏繁缀,要么稍偏直白。当然,毫无疑问我是强调文字的解释能力的,用简练的语言解释清楚一个事情我认为是最强的能力。然而往往读书之时,会发现很多文字偏于晦涩,往往反复咀嚼多遍而始终难得其要领。或许在这个信息泛滥、崇尚快餐文化的时代,平易近人的文字更有利于降低人们的阅读成本,快速有效的获取信息。但是我始终难以理解,为什么有些文字要故意的构造的颇为深奥,是要铸就一个阅读的壁垒还是非此类语言难以精确表达?

除了诗歌,我真的很少体味到语言简洁背后的神奇。诗歌或许有点被我看的高人一等,往往不太明确的文字之间方能透露出诗词背后的婉转美丽。说个大家都耳熟能详的例子吧,那便是温庭筠载入初中语文课本的一首诗:

望江南

梳洗罢,
独倚望江楼。
过尽千帆皆不是,
斜晖脉脉水悠悠。
肠断白苹洲。(繁体字为草字头下加“频”字----苹)

这首诗乍看或许简洁明了,但是背后可供人联想的地方实在是太多了。

另一位我颇为喜爱的词人秦观,大抵也是有这么一点风格。我是颇为倾向有一点“花间派”的浮华词藻,悠然婉转的表露那一点点心里的戚戚然之情。诚然,这颇有一点小家子气,算不上能广受赞扬的烈士激昂之类的豪壮之情。只是,尚难以逃离那份“为赋新词强说愁”的“多愁善感”之气息。

花开不同赏,花落不同悲。欲问相思处,花开花落时。
揽草结同心,将以遗知音。春愁正断绝,春鸟复哀吟。
风花日将老,佳期犹渺渺。不结同心人,空结同心草。
那堪花满枝,翻作两相思。玉筯垂朝镜,春风知不知?
——《春望词》 [唐] 薛涛

这首诗曾经在后花园贴过,而后也曾多次与人聊天中提及。或许,稍嫌悲凉,却也恰如此景。

前几日还有些“意志消沉”,不知道应该做一点什么为好。看古希腊、古罗马哲学或许不失为一计良策,只是静心阅读或许还需一些时日沉淀。前几日借来的《经济思想的成长》暂时又借给另一位更想了解经济思想发展脉络的同学了,暂时也不知道看什么好了。暂时不想看那些技术化的东西,毕竟好不容易应付完这么多考试终于有时间沉静下来好好的思考一下,而不是继续忙碌的追逐那些技术化的东西(或许诚如导师所言,技术化的是最容易学习的,给你一年半载的时间都能学的差不多,但是思想则是需要长久的培养的)。

还好每次心情浮躁不知道干什么为好的时候总有Google Reader里面的一堆新闻可以让我思考,还有很多名家的言论值得深思。不知为什么,又是汪丁丁老师的文字让我的心沉淀下来。这次不再发邮件问他能否转载,只是做个引用,应该也可以了。

在情感世界里,与其它哺乳动物的情感相比,人性的复杂可谓“登峰造极”。故而,研究复杂性,最简单不过的途径,是如古代儒家那样,或如佛家那样,反求诸己,返观人性。虽然,不可放弃概括——这是任何一门科学的必要条件。

在我们生活的世界里,这就是“社会科学”的处境——既不放弃复杂又不放弃概括,二者是相互批判着的同一。既然如此,社会科学的表达方式,主要地应当是叙事的——recursive,而不是演绎的——deductive,或归纳的——inductive。换句话说,应是苏格拉底式的对话,是“对话的逻各斯”。

与“简约”(reduction)相比,“概括”是一个丰富得多的语词,它似乎没有对应的英文单词呢。概括,是这样一个心理过程:首先,我从经验里回忆事件A1,A2,……,Aq,注意到它们之间的差异性,更注意到它们的共性,我于是用符号A代表它们的共性,A是它们共有的性质。进一步——这一步是怎样在我们头脑里发生的,科学家尚未研究清楚——我可用性质A定义一个概念“A”,这就是内涵式的概念定义。这以后,我不必回忆,甚至不必体验新的事件As,我只需要训练我的认知能力,使我能够认知一切具有性质A的事件,想必它们都在概念A里面。柏格森指出,这就是概念的好处,它节约了时间

可是,上述过程运用于社会事件就很容易发生错误。因为,我们关于社会事件往往带有偏见——与切身利益相关的许多种类的偏见。受了偏见的影响,首先,我们的记忆可以被扭曲——被我们无意识地扭曲。其次,我们对事件的认知可以被扭曲——无意识地或有意识地。这样扭曲的结果是我们对许多事件的概括,以相当高的概率,失真。至于什么是“真”,我在以前的文章里写过,此处不赘。

所以,从事社会科学研究的学者,有必要反复体验类似事件,为了纠正很可能失真的概括。这样的体验,对数学家而言必要性小得多,因为数学概念是人类对非社会事件运用概括能力的结果。社会科学研究者不仅有必要反复体验类似事件,而且有必要倾听其他研究者的体验和概括,这是因为有些偏见太顽固以致我们非通过对话和相互批评而不能觉悟。

此文的标题为《复杂性——其实就是对概括的批判》,载于其博客。有的时候感慨自己很少能静下心来看一些哲学和逻辑的根本问题了,而是迷失在某些技术问题的主观臆断里面,这有时候也是颇为悲哀和不断提醒自己的。诚然,做学问是个严肃的事儿,经常很悲哀的看着计量被滥用,因而有同学说“计量很简单嘛,多讲一点应用就可以了嘛,那么容易上手,何必顾及那些复杂的推断?”之时,我都不自主的感到由衷的寒意。看着那些随便根据统计数据出来的结果,都不能简单的规制为制造垃圾了,而是误人子弟。正所谓“三人成虎”,这样的人多了,难保最后的结果会成为什么样子。

可是,网络始终是浮躁的。

面对电脑屏幕,究竟有多少可以静下心来的机会。面对花花世界诸多诱惑,又有多少人能够清心寡欲的沉心做自己喜欢的事情。

文末,尚有一事值得提及。当时高考志愿选择经济而不是善长的理化,颇有一种逃避的心态。然而虽然逃掉了技术上的复杂,却进入了一个认识真实世界的复杂境地之中。两者之间或许诚然难以对比。有的时候想逃避到数学或者其他简单的用工具就可以放心说话的世界,但是始终或许还是难以抵抗经济学的魅力——不管在这个过程中被多少所知有限的人误导了,走了多少弯路了,我只是相信自己还是可以找到一条迢迢大道的。此情此景,或许真的与分数无关。那些在意分数的孩子,是不是足以把自己逼上天才的境地呢?我不知道最后的结果,只知道他们行走的格外辛苦。或许,唯有敬佩。

Categories
事儿关经济

从信息经济学说起

有的时候有些事儿真是神奇,稍稍可谓殊途同归。记得原来的时候刚刚接触经济学,就对“信息经济学”这个颇为新潮的词儿感兴趣,有点一厢情愿的认为它和计算机、互联网联系紧密。可是真正接触,却发现原来不是那么回事儿,好不容易从那堆复杂的框架中解脱出来明白它在解决什么事儿,又纠结于那些公式中了。

而后,委托-代理框架反倒成为了我分析问题的常态,或者说有严重的路径依赖。有种本末倒置的感觉,毕竟这只是一种工具,而不完全是看待问题的一个方法。这点需要纠正,来源还应是客观的经济运行本身。不过,希望我不是在黑屋里抓黑猫。话说,没有经济学家们,除了升高一点失业率,还说不准整个经济形势会不会变差呢。这群人中太多无知而误导,大量无谓损失,原本经济的反而不经济了,还不知反省洋洋自得的。得失之间,权衡一下,难说。

现在看来,有必要澄清几个概念。信息经济学、网络经济学、以及所谓的wiki经济学/互联网经济学……自己去百科查一下吧。

不过,在范里安的《信息规则》一书中,他所提及的信息经济学大概还是网络运营这块儿的范畴。貌似他是商学院的?