日志

点评对韩寒的语言分析

热度 2已有 8216 次阅读2014-12-13 02:27 |个人分类:小学启蒙|系统分类:教育

iMan 的《语言学分析：韩寒与韩仁均作品区分度高达95%》在网友的请求下登出来了。下面是我对 iMan 文章的评语（基于我之前的评语进行补充）与打分。

1）复旦大学苏杰博士提出了韩寒的几个文字习惯（Idiolect）: “谁知-光-这人-没想到-不幸”。iMan 此文运用苏杰的结论，根据韩神童父子作品中这5个字词的出现频率进行统计对比，其原创性相当低下。打个比方，苏杰是发现了韩寒几个DNA的侦探， iMan 只是对采集的样本进行比对的实验员。

2）先不论 iMan 字词频率数据是否准确（这是一个简单编程可以解决的问题），对字词频率数据的分析本来应该是一个高中生根据基本的统计学能够完成的事情。但不幸的是 iMan 不会根据数据计算相关系数。而是采取如下“表格”：【若两者频率差数值较小时，当无差异处理，区分度按0计算；频率差数值中等时，区分度按该词的加权系数的一半计算；频率差数值较大时，区分度按该词的加权系数计算。频率差数值是相对差值不是绝对差值。所以，若5个指纹词的频率差都比较大，则两部比对作品之间的区分度是100%。】从这个描述可以看出，iMan 完全不 understand 什么叫百分比，而仅仅是胡乱套用百分比这样一个小学数学术语，完全没有基本的数学依据、更无从谈起统计学基础。正确计算两组统计数据的相关性 (correlation) 是一个常见的数学问题，有兴趣者可以参考相关的 statistics 教科书。因此，iMan 的所谓数据分析完全不靠谱，借用一句话说，iMan 分析结果 is "not even wrong. "

3) 更为基本的问题是，iMan 的目的是分析韩寒是否源自韩仁均，而不是韩仁均是否源自韩寒；因此，正确的分析是找出韩仁均的某些文字DNA，看韩寒的是否具有同样的DNA；而不是像 iMan 所做的那样，找出韩寒的几个DNA，看他爹是否有这几个DNA。你拿出韩寒的某一半DNA跟韩仁均的比，肯定100%不同，但那不能证明韩寒不是源自韩仁均。苏杰提出的5个韩寒的文字习惯显然不是韩寒的全部语言特征，即使这五个字词在韩仁均作品中出现频率为0，也不能证明韩寒的作品不是来自韩仁均。假设韩仁均写好书稿，让韩寒誊写一遍冒充韩寒的手稿，韩寒完全可以在抄写过程中插入 “谁知-光-这人-没想到-不幸” 等字。比如说，韩仁均可能写的是【后来收到出版社的退稿信函】，完全可能韩寒插入“不幸”二字，变成【后来不幸收到出版社的退稿信函】。在所有遇到不妙的事情的地方，韩寒都可以插入“不幸”二字而不影响原意 --- 这点脑子韩寒还是有的。类似的，如果韩仁均原稿写道【你也太自私了】，韩寒可以inject 自己的习惯语等价 transform 成【你这人也太自私了】。

说句实话，在多次看到 iMan 的 imbecilic 的东西之后，我很希望能从 iMan 那看到哪怕是一丝丝的 intelligence and learning，因为毕竟他还喜欢发表观点、显得有点活力。但iMan 的所谓语言学分析的 monkey logic 让我们再次失望了。You can't fix stupid .

但为了鼓励iMan，也为了避免太 hurt 宛儿等粉丝的 feeling

，给20分（100分满分）。 Grade F.

路过

鸡蛋

鲜花

支持

雷人

难过

搞笑

刚表态过的朋友 (1 人)

中西部人

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (1 个评论)

回复岳东晓 2014-12-14 08:03: iMan: 岳东晓: 苏杰发现了韩寒的五个预言特征。运用这5个特征是你所做的。详细分析参见：《点评对韩寒的语言分析》http://www.zhenzhubay.com/blog-2-27444.html (12- ...
在我的分析面前，你这种低智商只能是暴跳骂街了。

这是你文中写的：【苏杰提出的韩寒文字指纹是从《三重门》中提取的】。

You can't fix stupid.

岳东晓 -- 珍珠湾全球网 ... http://ydx.zzwave.com [收藏] [复制] [分享] [RSS] 岳东晓 -- 珍珠湾全球网

日志

点评对韩寒的语言分析

刚表态过的朋友 (1 人)

全部作者的其他最新日志

发表评论 评论 (1 个评论)

岳东晓

发表评论评论 (1 个评论)