Saturday, July 7, 2012

Two elementary statistics questions

There are two statistics questions I often use as sanity check


  1. What is p value? What’s its relation with the probability of Type I error?
  2. What is degree of freedom?

Ask yourself from time to time if you can always answer them, with significant confidence:)

Sunday, July 1, 2012

为什么只有"偏执狂"才能生存

我刚刚意识到,对书名中的“偏执狂”理解有误。(事实上,技术英语的中文翻译有很大的改进空间,以后再谈)。

偏执狂paranoid,不是eccentric,更不是lunatic,Merriam-Webster上的解释
  1. characterized by or resembling paranoia
  2. characterized by suspiciousness, persecutory trends, or megalomania
  3. extremely fearful
一篇Review总结得非常不错,Grove说因为技术的快速进步(10X:10倍速指的该是指数增长),工业和企业要面对“Strategic inflection point”。
In the face of such “10X” forces, a company can lose control of its destiny. Things happen to the business that did not before. The business no longer responds to the company’s actions as it used to in the past. What such a transition does to a business is profound, and how the business manages this transition determines its future. Grove describes this phenomenon as a strategic inflection point.
这样理解的话,paranoid指的是那些时刻对未来充满担心,不停准备迎接下一个改变的人。

Friday, June 29, 2012

不愤不启,不悱不发

最近发生里两件事: 

  1. 论文要发表了,老板让我检查下galley proof,我检查的是final draft。老板很生气:你连这都不懂! 
  2. 老板去开会,准备ppt是给我打电话:什么是classification?我也很生气:你这都不懂(没敢用感叹号)。
基于此,我很悲哀于现代的教育制度:“教学相长”是白说了,教学双方都是all men for themselves嘛。


直到今天看到论语这段话: 
不愤不启,不悱不发,举一隅不以三隅反,则不复也。
百度百科的译文:
(孔子说):“不到学生努力想弄明白但仍然想不透的程度时先不要去开导他;不到学生心里明白却又不能完善表达出来的程度时也不要去启发他。如果他不能举一反三,就先不要往下进行了。”

Friday, March 9, 2012

文献管理工具EndNote(以X5版为例)


最近有同学问我查文献,所以决定写点东西,没事大家就别看了,精神正常的人是不会用EndNote的,大家该结婚结婚,该生娃生娃。另外以下不是个逻辑连贯的详细教程,就是一些我常用的tips,很多功能是X5版后加上的,旧版本的可以看热闹,了解二逼青年是如何管理文献的。
1. 最中央的界面很好理解,一行就是一篇文献的条目(如何创建条目下面有说),每一列是一个term,比如作者、年份、题目和Journal。最左侧的clip图标的有无告诉你是否有pdf文档。EndNote提供了很多可以自己定义的term,我一般都是在Research Note里记点笔记,也便于将来搜索。

2. 在左侧,可以建立分组,把文献归类,有点像创建tag。注意最下面的是智能分组,与一个自定义的filter关联,我一般都是监控key words和research notes,如果出现敏感词,就自动归到这里。比如为了节省纸张,我把所以打印过的文献列在这里。
3. 在正上方选Reference菜单,有很多有用的功能,比如
Find Full Text可以帮你自动查找pdf,然后关联到已有文献条目,这样不需要到处找了(需学校网络支持)。
Find Duplicates,常用,把相同的条目列出来,你可以选择保留哪个。在Edit->Preference里可以调整相同的定义,比如只要题目相同,或者作者题目都必须相同。
4. 创建条目1:直接搜索创建条目
在左侧选择数据库(下图a),书选第一个(国会图书馆),生物和工程方面,一般PubMed和Web of Science足够。岔开一句,我认识一个老师,说平时休闲的时候根本不读书,每天到PubMed上看10篇摘要玩,Orz。(需学校网络支持)然后在右侧搜索(下图b),大多数时间就可以直接导入对应条目(需要学校网络支持)。注意:文件名中的标点符号会影响结果,我一般都是删去。
a) 
b) 
5. 创建条目2:导入pdf创建。
很多pdf包含文献信息,所以新建的条目可以自动包含作者、题目、年代等等。如果没有,需要手动改。不过现在有文献更新功能(Reference->Find Reference Updates),如果提供几个基本信息(题目作者年代等),Endnote可以自动帮你补全,省了不少事。
6. 在线数据库导入条目
如果你摸到文献的页面里,注意Export Formats,选EndNote那个,然后点它,点它,点它。
然后双击下载过的文献,就可以自动导入了(EndNote要打开,否则会提示你先选一个library)

Friday, January 13, 2012

要多关爱


据说尼采说过:“That which does not kill us makes us stronger.”相当长的时间里,这句话深深地激励了我,“让暴风雨来得更猛烈些吧”。如果有朋友出现消沉,“加油,坚持下去,曙光已经到上一个时区了,马上就看到了啊”。


人有至少两种倾向:试图解释事情的原因,和相信自己愿意相信的。综合起来就是,在试图解释一件事时,找到一个自己愿意相信的原因。For一个zample,为什么我们分手了?让我想想,哦,因为他是处女座的!(或者解读成:都怪处女座这些变态级别的完美主义,我身上这点小毛病根本不是问题)

经常,许多空间或时间上有一致性的事件并不一定具有因果联系,或者并不互成为充要条件。比如“每个成功男人的背后都有一个女人”,至多说明一夫一妻的现状(必要条件)。在过去一夫多妻的世代,也许这句话就会改成“每个成功男人的背后都平均有2.5个女人”。即使最男权的朝代,有能力纳妾的也不过是那些已经成功的人士。所以有两个半女人的男人,怎么也是富二代吧。

苦难是无法避免的,而成功人士经历了苦难,说明苦难就能造就成功了?经历苦难后就涅磐了?(btw,涅磐好像跟重生的关系也不大)。为什么我们愿意相信这种论调?因为苦难是无法避免的,“战胜不了别人,就加入别人”。反正克服不了挫折,就相信挫折能给我带来点什么吧。

一个似是而非的反例是,抗生素的滥用导致细菌产生了抗药性。其实不尽然。因为大多数情况抗药性并没有“产生”,只是本来就具备抗药性的菌株存活并富集了。(这个例子也说明我们对进化论是多么的不了解)。苦难充其量是在人类社会上加了个进化压力(比如找到配偶),那些本质坚强的人存活下来了,并传播了他们的思想。

原文:“... Mayhem and chaos don't toughen you up, and they don't prepare you well to deal with the terror of this world. Tender love and care toughen you up, because they nurture and strengthen your capacity to learn and adapt, including learning how to fight, and adapting to later hardship.

糙译:苦难不能让你坚强,也不会是你对这阴暗的世界有所准备。(但)体贴的爱和关怀却能使你坚强起来,他们滋养并强健了你学习和适应的能力,让你学会如何奋斗,迎接将来的苦难。

Friday, September 16, 2011

Linux的421权限法则

在Linux中,文件(包括目录)分别针对3种账户,即
用户(owner,或user,简写为u),
群组(group,简写为g)
和他人(others,简写为o)

规定了3种权限,即
读取(read,简写为r),
写入(write,简写为w)
和执行(execute,简写为x)

于是3x3=9个权限的规定,举个栗子,所有账户拥有全部权限时的状态为rwxrwxrwx。

在诸如chmod,这三种权限采用421法则表示,即read->4,write->2,execute->1。所以全部权限为7,只有读和写则为4+2=6。

我原来因为这种规定是math trick,也就是从0到7的任何一个数都表示一种特定的状态。事实也确实如此,
rwx->7
rw_->6
r_ x->5
r_ _->4
_wx->3
_w_->2
_ _x->1
_ _ _->0
但其实,4实际是二进制的100,2是010,1是001,进而

rwx->7->111
rw_->6->110
r_ x->5->101
r_ _->4->100
_wx->3->011
_w_->2->010
_ _x->1->001
_ _ _->0->000

Thursday, September 15, 2011

幽默与冷笑话

幽默(感)是个非常幽默的事情。

我的理解是,听到一笑话,你笑了,于是
1)你感到这个笑话很幽默
2)你有幽默感(可能还要加上“相对这个笑话的幽默级别”)。

查了查关于幽默的理论(theories of humors),wiki上有很多介绍。我比较接受的是surprise理论,简言之当事件的发展出乎意料的时候,你会感到可笑。似乎也有很多例外的时候,但至少对冷笑话来说,这个理论很合适。

今天看到一篇blog,说冷笑话的要点在于:当你期望笑点的时候,冷笑话却没有提供这个笑点。也就是说,我们对笑话形成了思维定势,冷笑话改变定势的走向,于是你感到惊讶。

于是,你笑了。