最早接触数据处理应该是做小学应用题。

10只羊,被狼叼走了3只,还剩几只?

当然这种数字没什么后面隐藏的东西,它很简单。

后来学会了比较大小,计算百分率,比例的比较。

再后来做实验,重复实验之后那么些数据如何进行比较,就是统计学的范畴了。但是学了很久统计学,在处理实际问题时候有些东西让我始终保持怀疑。比如这样一个四格表:

好      坏

A    20      80

B     80      20

我想这样简单的东西其实不用统计计算也可以用眼比出来B组好些。当然我们为了让结果更科学,做下卡方检验。chi2=72 p<0.0001。

卡方检验检验出两组差异,可以说A、B组差异有统计学意义,认为2组不等。可是问题出现了,我们直接看出来的“  B组要比A组好  ”这个结果是如何在统计学上证明的?

 

诸如此类的事情很多,但是论文写进去了,也没有被质疑。比如我一直认为论文里做t检验取双侧检验结果然后却在论文中表述为某组比另一组大这种事情是很不妥当的,但是一样的都发表了。

p1=5.0001 和 p2=4.9999到底有什么可不可接受的区别,实在是说不清楚。

在医学研究中,使用统计学作为估算预测工具,大多数时候,完全不能说p1就是无差异的,亦不能说明p2就是有差异的。
这个时候但是可以去看p值,发现p1>p2,从这里面可以发现2组的差异水平应该是高于1组的。

所以说统计计算出的p值大于或者小于α这个结果不能把它当作开关一样,其中并不是只有阳性和阴性,这是个连续性的变化过程。

 

到这里就得去思考每个人是怎么看待统计学的。

统计学不仅限于这些统计检验方法,其实它是一种数据处理方法学。简单的加减、频率、基础的统计检验方法、复杂的统计模型,都是统计学。这么说其实和比较公认的统计学定义已经很相似:数据收集、整理、分析、表达和解释的普遍原理和方法。

在早期的统计学主要在于数据收集、整理上,后来有了很多分析方法,就是统计检验。
目前统计学有多么需要新的检验方法,我不这么认为。
统计分析之后的表达和解释才是统计学的产出范畴,否则统计学是个没有意义的学科。所以目前统计学的发展也是围绕着更好的去表达和解释结果,这一点,在国内似乎太不够重视了。

所有的教材都会把统计结果的表述写的一致,甚至会被强调一定要这么说:P=0.04<0.05,拒绝H0,接受H1,差异有统计学意义,可以认为两组有差异。

这句话其实是有2部分的。第一部分是结果的表达:P=0.04<0.05,拒绝H0,接受H1,差异有统计学意义。而很重要的一部分,不能被要求如何说:可以认为两组XXXX。这里是解释的部分,出统计结果时候,必须要联系实际用途,再进行解释,否则就是很不负责任的解释。

 

 

现在非常流行视频,什么东西都做个视频来解释。
视频有很大的缺陷,即无法skim,快速浏览。
一个不是很重要又想获得一些信息的关键词,如果是一篇文字,即使文字的排版并不很好,一样可以在1分钟之内获得想获取的信息。如果有恰当的插图那么这个速度会更快。

而一段视频基本上需要3~5分钟。视频的速度不可控,而且并不能依靠x倍快放或者慢放来解决这个问题。用拖动进度条的方式更可能跳过了有用信息。

文字是以面的形式来展示的,而视频是以线的形式来展示的。也就是说,文字展示的是2维,而视频确是1维。从信息量的角度来说,文字要大的多,而视频,带来了太多无用信息。

纸质。与屏幕的区别在于可以随意构建简单的3维空间。可以任意的摆放不同大小的纸,可以同时看。而屏幕,无论字体还是分辨率、屏幕大小、屏幕数量,都限制了这个3维空间的构建。纸可以随意叠放遮盖,即使有很多屏幕,以目前的技术来说, 想把屏幕叠在一起是不现实的。

书写的随意性。目前屏幕的精度已经不错,但比起纸的精度还是差。提高精度就要放大,而放大的后果是屏幕大小限制了信息量。

为什么会有各种“总结”。总结可以压缩信息量,实际意义还是使得更多的信息同时展现在大脑。

过目不忘的天才不知道有多少,但总之是个很小的比例。多数人还是需要恰当的信息连接和重复来记忆和思考。

所以,视频不可替代文字,屏幕不可替代纸。

 

介绍性的文章更是需以文字为重点而非单纯一个视频。单纯视频介绍容易让人不知道看了什么,因为节奏太缓慢,不动脑,无记忆,也得不到总体认识。

想了半天也想不出题目是什么。写日志一大头疼事即题目。看到用编号来表示,可太缺乏特点,写时的状态如何全然不能记下。

这年头写日志的人是越来越少了。尽管好久没写日志,微博一类就更是不发了。日志写了,说不定有空发两篇微博。觉得还是日志好写,只要把意识流打出来就ok。而一篇微博要精炼半天,真是难。

现在来看看目前什么软件是常用到的。

chrome。顺手速度快的浏览器能极大提高效率。至今为止试用过几乎所有被推广的不错的浏览器,最后还是chrome速度最快,优化的最好。快慢的差别可能就是几十毫秒,但是完全能感受到。
就像网络游戏中10延迟和60延迟手感有相当大区别一样。不过如果是用300延迟和400延迟比,可能反而没什么感觉。所以比速度拿chrome比,这基本是最低值了。

百度云同步盘。云管家和同步盘是2个软件,一个更多提供高速上传下载,另一个提供文件夹同步。文件夹同步要更重要一些,因为即使在日本也有可能会发生暂时性的找不到网,就更不用说中国了。此时离线文件就变得异常重要。

有道云笔记。做笔记软件的不少,不过坚持下来又不断完善而且给免费用户活路的也只有这个。尽管众多待完善的部分,不过好歹也算是有个可以用的。

teamviewer。这个东西用的人估计就很少了。可以跨过大多防火墙登录远程桌面的软件,也是个远程会议软件。不过我就是用它的远程桌面功能。

pdf reader。这个比office用的勤,因为读文献比写文献肯定是多的。foxit几次改版之后变得臃肿。目前在用百度阅读器,不过bug实在是多,而且缩放限制的太死。,最小75%,这个很坑,不少高清的扫描50%才能一屏放下。

qq。

ps、office。似乎经常是一起用的。

endnote。这东西使用频率在慢慢上升,读文献变多了之后还文件夹管理变得麻烦,用软件还不错,只是这软件有诸多不让我满意的地方,但同类替代品更烂,只好凑合。

 

可以看出来,前几个都是离了网不行的软件。但是这些软件用起来真的是方便许多,用不到u盘了,也不怕因为系统损坏丢失什么重要数据。安全性问题可以这么考虑:那么多文件自己都看不过来别人如何识别出有用文件,这些文件到底有多不想被别人得到,实在需要保密加密了再存就好了。简单的加密方法,压缩加密。

天地无穷期,光阴有穷期,去一日,便少一日。 富贵有定数,学问无定数,求一分,便得一分。

意思似乎挺明白的。
但针对“定数”这个词的意思,有所疑问。如果将“定数”认为是“天命”一类,这是大概是网上能查到的唯一解释方法。用辩证唯物主义的思想来考虑,这话就很不科学了。

“一个人命如何是天定的”这事情,就不符合唯物主义。连最基本的条件都不符合,这话如何能正确。

但是又有人说了,这个就是教导我们要珍惜时光,不要贪财,要多学习。

这么看来这句话应该是对的。但是,如果如此理解这话,那么也可以理解为富贵既是天命,对学问又没兴趣又不能吃,人生没追求了,可以躺着等死了。

所以需要从如何理解此话的方式入手。

其中所谓“富贵”的定数应该是指,一个人的钱到了一定程度再多就没什么区别了。而学问,多一点是一点。
为什么钱到了一定程度就没什么区别了?这个可以参考射雕英雄传里面郭靖和大汗在最后的对话。

“人死之后,葬在地下,占得多少土地?”成吉思汗一怔,马鞭打个圈儿,道:“那也不过这般大小。”郭靖道:“是啊,那你杀这么多人,流这么多血,占了这么多国土,到头来又有何用?”成吉思汗默然不语。

不知道怎么花钱的话,有钱到了一定程度就没什么意义。
贵同理,不知道如何利用“贵”,地位到了一定程度也就没了意义。

如此看,这句话是有个背景的。并不与“生于忧患死于安乐”同意义。而是一句很现实的话。并不是鼓励舍财求学,而是适度。