Categories
Uncategorized 事儿关经济

R会议小记

今年的R会又热热闹闹的开了两天,一切进行的还算顺利,没有大的波折。大家玩的很开心,各种旧友重逢相见恨晚按下不表。只说几点我的体会:

1. 数据挖掘越来越热,却越来越觉得泡沫。今年R会议创纪录的收到了接近500人报名,实际到场领取材料350人。会场一直有人需要站着听,这是以前没有的。R这两年越来越热,说明业界的需求上来了,用R的人越来越多毕业了,进入企业了。然而听了很多演讲,却没有感觉有让人“惊喜”。大家在重复的炒有限的东西。不见新意。

2. 工具越来越热,只能说明用的人越来越多,而不见得是用法越来越聪明。大数据热的一塌糊涂,大家关注的却只是怎么能实现计算,而少有从根本思想的角度提出创造性的方法的。这让人不免觉得疲惫。

3. 林大师兄说的有句话让我印象深刻——用复杂的方法解决复杂的问题那是做研究,用简单的方法解决复杂的问题是在业界。一路看来,被业界认可的方法,大都是simple and elegant的,只可惜翻来覆去就那些,看久了就审美疲劳了。

4. 大多数分析只能说是typical的完成任务,有灵性的分析不多。张翔的“短文本分类实践”在这个意义下,是可圈可点的有灵性的分析之一。在现有的算法上,如何聪明的排列组合优化改造,这不仅仅考验的是分析者对于模型的理解,更多是对于业务需求的洞见。再好的模型,也得多少按需定制一下,否则总让人觉得空洞无物。

5. 机器学习是小聪明而不是大智慧。我这么说坐等被骂,不过确实是思喆大哥的一句点评醍醐灌顶——机器学习的人从来不关心假设检验,尤其是对于分布的假设。反正计算机可以算,那么就去算好了。很多算法直觉上过得去,就可以了。我总感觉这东西,要么大家玩够了破灭一下,要么有人从头建造一些夯实的基础,真正繁荣。现在还是一个初生牛犊的混沌阶段吧。比较好的应用,除了google发起的那几类,大概也很难有本质上的突破了。

6. 业界是 short sighted,这个不用多说了。

7. 我对整个数据分析的行业未来持负面预测。有泡沫的感觉。可是,明明自己还在混这口饭吃...不过至少这口饭还能吃个十年二十年吧,不怕不怕。

8. 以前总觉得建模什么的最重要,最刺激,最有成就感。现在感觉,其实很多时候解决问题的能力大家都有,而发现问题却不是每个人都擅长。也劝最近打算从学校里面出来的朋友们,不要一上来就跟招人的企业说“我希望做统计建模”blablabla...其实有的时候那些fancy的模型提高的可能只是最后的5%,而为此牺牲的效率有可能有着更高的成本。至少我现在,有点越来越问题导向了。还有,其实很多时候,在学校里大家对于模型的理解还都是很肤浅的,纸上谈兵的。其实自己根本把握不住那些东西。最近好多次深深感觉,我以前觉得自己熟练把握的很多模型都不见得可以迅速的应用到实际的业务场景中去。在不断的跟同事、老板、partner讨论的过程中,才是真正的去深入的理解那些模型的过程。所以,一句聊以自勉的话:还是从简单的做起吧。

几乎没说几句好话,见谅。好玩的东西就是那么多,天天玩天天看不免觉得疲惫。不过平心而论(与我的工作单位无关),eBay对于数据的理解和应用整体水平绝对是行业前列的。能把一个数据分析的大问题break down到若干几乎独立的小问题,这就说明整体的框架已经成熟并足以支撑业务了。这样的情况下,作为个人可能接触的好玩的事情会越来越少,因为几乎相似背景的人都可以很快的胜任日常的工作(这也是我对大企业最佩服的一方面,分工确实细致,有利于提高整体效率),另一方面也是学习如何化整为零的好去处。每个人都有自己想要的人生,都会选择适合自己的地方。只是这一次很多人一致评价,觉得我来了eBay之后更快乐了——这怕是最好的褒奖了吧。

----对于未来R会议的期许-----

我们号称要做“学术会议里面最文艺的,文艺里面最学术的”,那么总要多多的有些有灵性的分析。R语言基础培训可以淡出R会议的舞台了。

此外,力争联系更多的大牛~要有学术会议范儿嘛 ^_^

Categories
事儿关经济 互联网产业观察

从经济理论到商业模型

宏观经济理论比较难以直接转换为微观的商业模型,就不说了,毕竟关注的问题完全不是一个层面的。那么微观经济学呢?一个什么样的理论可以转换为一个可实践的商业模型呢? 除了金融之外?

这可能是经济学院和商学院最大的区别吧~就像物理和工程的差别。从我的感觉,最普遍的就是各种拍卖理论和模型,但是这个就有点鸡生蛋、蛋生鸡的味道了。比如Groupon,这种互联网时代的团购模式是不是我们以前所未曾闻及的?那么,在每一个传统的商业模式搬迁到互联网这个平台的时候,我们是不是可以利用信息的优势(用户注册资料、购买记录、地理位置等),来针对传统商业模式的弱项有所弥补呢?

电商在过去的2011年为广大群众贡献了无尽的福利,这个看看双11和双12抢购就不用多说什么了吧?各种烧钱烧的没完。从某种程度上,我甚至认为他们对平抑物价做出了杰出贡献……当然这个是暂时的,可是是什么样子的力量让各大电商这么火拼呢?我个人认为,还是信息优势和物流瓶颈突破,带来的电商较之于传统卖场库存、场地租金等等大幅下降的优势和对于顾客的准确感知。

作为一个有羊毛一定要蓐的半家庭主妇,我就很直接的在淘宝商超买掉了柴米油盐酱醋茶……除了肉和蔬菜牛奶等这种暂时没法买的之外。一袋大米,比1号店还便宜,联想起1号店每笔单子都亏,我就更开心的蓐淘宝的羊毛了。真慷慨啊,还暂时只有上海可以享受此等福利,真是送到门口的肥肉啊。其实,好吧,我只是觉得一个人去超市扛一袋5kg的大米太沉了,还是送货上门的好啊。

随着信息流通的加快,不可避免的,各种传统的商业模式都要面临着变革。这个过程中,经济理论可以发挥多少作用呢?我们对于information和noise的分析、我们对于博弈的分析、对于交易成本的分析,一个个是不是都可以重新在信息充分流动的情况下考察是不是可能突破传统的束缚、有一种新的均衡结果的存在。为了达到一个新的均衡,我们又应该如何设计一个对应商业模式,来充分挖掘信息的力量,创造信息租和利用信息差,赚取信息的价值?

最近在一直想这个问题,或许过去对于商业模式的关注太专一的从经济的角度出发了。这里面其实不论是academic research还是business trials应该都是可以有所尝试的。如果说团购燃烧起了传统商业模式在信息时代的第一场变革,那么后续的,应该还有更多的爆发空间——在泡沫破灭之前,需要创造更多的实质性的支撑。

最浅的,从最直接的信息流通的层面、营销,也会经历一场变革吧。只是没有它背后实质性的商业模式的变革那么深刻的有趣。

Categories
事儿关经济

听听讲座 [1st week, April]

最近听了一些讲座。北京的学术交流确实感觉多很多,想听讲座的话基本上天天都有。

昨天听了一个金融的讲座,是我很不熟悉的一个领域。题目为“商品资产中的泡沫: 检验与来源”。听的也是云里雾里的。听完之后对金融更没兴趣了……唉。大致了解了一点关于“泡沫”的检验方面的东西,也知道了一些金融上的故事——大宗商品指数。如斯而已。

今儿又跑去人大听一个IO的,(插曲:又碰到昨天那个prof了,世界真小)题目是:Optimal Privatization in a Mixed Duopoly with Consistent Conjectures。这个还有点意思,混合双寡头垄断+一致性信念。不过突然间发现一些概念既熟悉又陌生,什么two-sides market之类的,觉得似曾相识却又想不起任何一篇文献来,大概是曾经读别的文献的时候出现过这个词儿没怎么在意吧。不过相比于昨天,今天的讨论氛围好的很多。有些东西大致也了解一些了,虽然貌似还是比较遥远。

不过不知道为什么这边的讲座都是老师居多,零零散散的一些学生八成还是老板带过来的。不过也挺好的,空荡荡的一个教室里面就那个十几个人……