Categories
日常应用

用R做过的最无聊的事

有句话怎么说的来着,当你无聊的时候,就去背英语单词吧。

于是乎,曾经特别无聊,直接自己写了个R程序帮自己背单词。基本就是一个伪装在Rstudio里面的gre单词选择器。大致原理就是,死记硬背。每次显示一个单词和对应的四个选项,然后记录一下选没选对。下一次,自动优先没有选对的词,提高其出现的频率。大致就是一个简单的机器学习模型来预测我对于一个单词可能的出错率。

至于为啥要在r里面做这件事...因为我天天上班用r啊,成功地伪装在rstudio的界面里面,就没有人知道我是在摸鱼还是在正经工作了呢。当然,这都是陈年往事了...现在已经不需要背单词了,而且很多单词死记硬背其实没啥效果,最后不会用还是不会用。阅读量上来的词汇才是真的记住了。

不过死记硬背也大概是某个阶段不可避免的吧。不能读一篇文章一直查单词去了。所以这段代码我准备留着,说不定二十年后自己的孩子还能用到呢?谁知道呢对吧。

截图一张留念吧

RStudio里面背GRE单词
Categories
互联网产业观察

NeurIPS 2019的一些观感

前几天有提到,十二月份的时候去NeurIPS 2019晃了一圈。除了开篇那个演讲之外,那周我还去围观了不少其他的东西。NeurIPS开到如今,万人大会,熙熙攘攘地其实挺难甄别信息的。第一次去这种顶级的计算机会议,经验不足,只能按图索骥般地一点点拾遗。

好在,我目标相对明确,并不是一味的去凑热闹的。那些火到爆的GAN之类的,我就只能远远地围观一眼,然后不明觉厉,去找自己相对更能看懂的东西去了。于是,我就很无聊的,去看了两个主题:因果推断相关的,以及隐私相关的。

因果推断这块儿,能到NeurIPS自然是被选择过的,不会是太纯理论的这种。跟机器学习相关的自然是要跳出简单的线性回归了,否则大家写什么呢?其次呢,就是跳出随机试验的框架,否则哪里用得到那么多高深的预测模型呢?七七八八看了不少poster论文,大部分都是各种花样繁杂的算法。努力地去理解他们的做法,然而却哀叹一声,浮沙筑高台,又有多少可以大浪淘沙始见金。(插曲:后面那个causal inference workshop,直接就是Susan-fest...哎,她也算是扛起来一面大旗了。)

隐私相关的,其实是加密+分布式的结合,基本要实现的是在客户端进行计算而不是需要把原始的隐私数据传递到服务器端。于是乎,我们看到了各种基于分布式算法的演化,加一些随机的因素在里面,就得到了一些隐私友好的算法。也挺好玩的,有助于想清楚一些分布式算法的设计。

笔记本身是用英文整理的,直接在这里贴一份好了。

Categories
游来游去

索尼a7r4相机初试

感恩节的时候发现已经服役了8年的sony nex-5n罢工了,各种动不动死机、过曝、对焦不准,让我在回头翻照片的时候略感遗憾。那是我工作后用自己的收入购买的第一个相机(在其之前蹭家里的尼康5700),磕磕绊绊这么多年,陪我翻山越岭,踏过五大洲。虽然舍不得,不过也确实可以考虑换个相机了。

纠结了半天,最后还是入手了a7r4。毕竟可能下一个十年并不会换机子了,于是沿用了“除了贵没啥毛病”,也是激励自己多拍多练习,才能把价值体现出来。

镜头方面,前面的微单习惯了16mm的饼干头(真轻啊),所以这次就准备买个定焦头用用(其实是被索尼的gm系列镜头的价格吓到了,完全不比机身便宜)。想了半天,大概还是以风景为主,就入手了sigma的35mm f1.4 art。其实挺纠结的,因为这个镜头并不轻。a7r4本来就比以前的微单重好多,镜头也重了好多,这爬山真的是要负重了。自从a7r4入手了以后,我已经不怎么挂脖子上了,实在是疼。以前nex5+饼干头、毫无重量的好日子一去不复返了。

到手第一日,正好赶上部门晚间聚餐,在三藩海湾大桥下一家风景秀美的餐厅。我就趁机拎着去拍夜景玩。当时刚刚入手,菜单按钮都没摸熟,说明书也没看,就只能靠着自动模式直接按快门。没想到,自动高iso的情况下,噪点居然控制得那么好,让我这种以前依赖延长曝光的新手泪流满面。大光圈虚化起来简直毫不费力,拍人像真的是美美的。下面这张是jpg直出,什么都没改...大家可能也好久没见我了,也算是趁机放张近照吧。还不算太显老对吧?

夜景人像直出,ISO 12800!

被这个效果惊艳到了,于是乖乖地回家研究起相机手册来。首先,现在的相机已经进化到可以直接连手机了,不仅仅是无线传照片,还可以直接遥控。这就给自拍更大的发挥空间——相机放好,人站在远处,然后手机上可以看构图,还可以调参数,然后在设置一个2秒延时曝光,把手机藏起来,顺利地自拍完成。

然后,设置好蓝牙连接,就可以读取手机的gps位置,然后记录到照片的信息里面。这对于iphone这种搜索相片极其困难的系统来讲,能按照地理位置搜索是很重要的。毕竟不可能随时带着笔记本给人看照片是不?

这两项功能让我极大的满足之后,又体会了一下自动对焦黑科技。果然,以前那种对焦凭运气的时代一去不复返。a7r4自动人眼对焦实在是太强大了...感觉拍出来人物都是炯炯有神的。虽然以前的时候对焦也是可以到脸的,但是眼睛和脸这一点点细微的差别居然还是造成了照片质量的不少提升。

接下来的任务,居然是开始研究lightroom...我已经很久不用照片编辑软件了。nex5摸熟之后,直出的效果已经让我很满意了,就算有需要修修补补的,也可以在手机上简单的编辑完成,我已经很久没用电脑修图了。换到a7r4,我之所以又回到电脑修图,主要是因为raw格式。当然,另外一个原因就是,a7r4的6100万像素造成动不动每张图片都是30m+,手机那点小屏幕确实比较吃力。以前修图的时候常用的是photoshop,但是这两年陆陆续续听大家说起Lightroom,感觉还是可以试一下这个新软件的。上手并不复杂,基本就是photoshop的简化版(主要保留的是调色功能而不是绘图功能),可以很容易地搬运以前的知识来。在b站看了几十个视频之后,顺利地上手了。我一般也不是很喜欢调很夸张的图,真实的记录美丽就好,所以简单的修修补补就让我很满意了。

大致摸熟之后,我就开始扛着它在三藩扫街。拍拍动物园的动物,拍拍夜景,拍拍安静的假日氛围。

虽然用的35mm的类广角镜头,但是6100万像素裁个1/4还是很高清的!
广角原图,拍巨大的长颈鹿完全无压力

下一步,在想要不要陪一点基本的相机滤镜。在bilibili和youtube上学习了一点简单的滤镜效果,比如偏光镜啦渐变镜啦,可以消除上图那种玻璃反光之类的。但是我连三脚架都懒得带出门的人,真的会记得住怎么配滤镜吗....算了,虽然有些后期是没法改出来的,但是带滤镜的成本实在是太高了。

低iso长曝光,拍车河

到现在,已经手动模式无压力了,压低iso,大光圈,长曝光,拍车河真的是简单啊...

入手两周,至今很满意。经常有人问我,花这么多钱买个相机,和最新款的iphone的拍照效果有何区别?我只能说,光线好的时候,怎么拍都好看(把感光看成一个搜集数据的过程的话,数据流量越大,收集起来越容易对吧?),确实可能没区别。光线不好的时候,专业相机毕竟是专业相机....

希望a7r4摸地更熟悉了之后,且适应了35mm这个焦段之后,可以拍出更好看的片子来吧。

Categories
网络新发现

加州的蝉

最近和朋友聊天,突然想到我们好久没有听过蝉鸣了。按说湾区这树林里面混着厂房的样子,不该完全听不到啊。

后面仔细搜了一下,加州其实还是有蝉分布的。搜到一篇2013年的文章,

Biogeography of the Cicadas (Hemiptera: Cicadidae) of North America, North of Mexico, Allen F. Sanborn 1,* and Polly K. Phillips 2

链接

70多页,洋洋洒洒,及其详细。其中,Platypedia、Clidophleps、 Okanagana 这三个属在加州有不少分布。具体到加州,Platypedia putnami 在湾区应该就有,搜了一下,大概和国内的蝉长得差不多。

希望大概只是夏天没有留心的原因吧。2020年了,夏天的时候可以稍稍留意一下。

Categories
读书有感

人生中的随机

最近放假有空看书,就把朋友赠(硬)送(塞)给我的一本书看完了。书名是Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets, 好像是写《黑天鹅》那个作者写的。我虽然对华尔街比较无知,但这本书倒也不仅仅是适用于华尔街。感觉很多事情华尔街只是放大到极端了,而道理可能多少都适用。

这本书啰啰嗦嗦二百多页的英文,我前后看了一周大概才看完。文笔不错,这也是为什么我可以耐着性子读下去的缘故。但是道理其实没有多深,基本都是一些关于人类大脑跟随机性不兼容的发现。嗯,很简单,我们的大脑是0-1机制,只能处理确定性的联系,而对于概率就处理地不那么自然了。

书中最简单的例子就是,“赚钱了是因为聪明,赔钱了是因为运气不好”。包括我自己在内,我发现这确实是大部分人的天性——永远对损失有着一种天然的心里避让。比如,我虽然常年不买卖股票,但经常会进账户看一眼还有多少钱。如果知道某天大盘跌了(比如今天),那么我可能就不会打开股票账户的app。如果看到大盘一片涨势,那么我一定会打开app然后看着增长出来的数目发呆。嗯,你说这信息对我有用吗?其实没啥用,因为我既不会买也不会卖,股票就是被我放在那里当存款的。那么我为什么还这么孜孜不倦的查它呢?不知为啥,赚钱的时候人就是开心啊,虽然知道只是一个瞬时价格,虽然知道这与我的投资决策可能没有半毛钱关系——但是我还是会自我安慰,看我眼光多好,看中的都是长期价值。

学经济学有个好处,在上学的时候已经把乱七八糟的各种理论和文献都读了个七七八八,也有不少行为经济学方面的。这本书其实很多东西都是引用的行为经济学的研究成果,想想作者是2001年写的这本书了,当时应该还是蛮先进的发现吧。只不过有趣的是,作者一路过度强调运气的作用,可能华尔街这种地方,确实大家拼到最后就是运气了。比如他说,华尔街是个生存游戏,你可以幸运几年然后赚得盆满钵满,但是一旦爆仓,就彻底被驱逐出这个游戏了。这在其他行业倒是没那么极端,毕竟很多东西还是实打实的在那里的。

当然,如果你看人生,确实很多事情都是运气积累的。健康地出生已是不易,然后顺利地长大、上学读书,考试,然后职业选择,种种。我每过一段时间会有一次imposter syndrome发作。很多人不理解,觉得我既然选择的是做自己拿捏得住的东西,为什么还会有此表现?我的原因根本上是相同的,就是觉得这一路走来很多节点都是运气的成分,万一做错了选择可能就是南辕北辙——当然也有可能更好就是了。现在的日常虽然是拿捏得住,但是对于人生的其他选择呢?谁又可以一辈子平平安安幸幸运运的呢?有点像爬山,爬的时候一路向前不做多想,爬到山顶才有一种颤颤巍巍的后怕。

然而从某种意义上,随机只对群体有意义。对于个体来说,实现的结果只能是0或者1其中一个,我们并没有办法复制一份平行世界出来。在每一个时刻,我们都活在过去发生的一堆0-1的排列组合中,而这些组合又决定了下一步我们有哪些0-1可能会实现。某种意义上,我倒更希望相信这个世界有随机性,却也相信很多东西是收敛的。就算一件事情小概率,尝试的次数多了,不也有可能实现吗?而如果增加尝试的次数呢?只能是持之以恒的去追求。一旦放弃,那么概率就永远归于0了。所以,我们得到和失去都是不那么容易的。

作者还有一些例子多少有点哗众取宠的味道,来迎合某些人们希望相信的心理。比如他说“爬得越高的人往往是能力一般,只是他们运气好”。人们很多时候都宁愿相信这是事实,或许这样会觉得好受一点。或许在某些程度上这是事实,而有些时候则是在下面的人根本无力识别上层的人具有的其他技能。如果连看都看不出来,总以自己的标准来衡量其他人,那么真真的就是井底观天了。

总体而言这本书还是很好玩的。比如作者最后说,他自从放弃闹钟之后,每天醒来的波动带来的随机感让他感到幸福。我其实已经五六年不用闹钟了。最初也是心惊胆战,后面发现你自己的身体其实比你想象的更为强大。这么多年,我没有误过飞机,没有睡死过重要的会议,而每天不必担心在深度睡眠中被闹钟吵醒的幸福感则是无与伦比的。这也是另一则我选择相信我希望相信的东西吧。看吧,人的心理其实是超级复杂和纠结的。