知乎装b文体 典型的知乎体是一种怎样的文体?
本答案禁止任何形式的未经授权转载,任何微信公众号及营销号转载者,均视为同意以500元/千字为标准支付稿费。本声明具有法律效力。
谢邀。
实名反对目前最高票答案,体并不是那样。
体应该是一个以为基础,以清晰的对问题进行阐述,并解决该问题的文体格式;对于不能明确给出答案的回答,给出问题相关的思考。
从规范的角度讲,体会给出相关的,并给出相关的引用链接;从内容讲,体在论证时应该保持情感和道德中立,而采用一种科学化、实证化的分析方法;
我们采用的办法对答案中体的比例做一个统计分析:
(重点结论已用黑体标粗,可以跳跃阅读)
用于训练的样本点来自:可以被称为明显体的答案(6,325份答案),再从百度知道抽取了明显不属于体的答案(4,538份答案)。
在向量机中我们选用的(即的分类函数)为
其中X是对答案本身的描述向量:字数,图片,段落;y,z为答案对应的用户的被关注数和总回答的被收藏数(作为答案本身信息的相关性统计指标),其他为参数;
在使用训练样本之后,我们得到了相关的参数值;
再随机抽样了43,043,285份答案,总共涉及用户数6,432,234位。根据我们已训练的向量机:
中体的答案占28%,也就是体在中占有很大比例,但是并不是主体,相反,仍然有很多其他的类型:
而从答案的时间看,体在答案中是在不断增多的:
图中的虚线分别是线性回归和指数回归;图中的虚线分别是线性回归和指数回归;
在另一方面,如果我们从体占总发布答案的比例看,体的比例并没有增加,而是近乎随机游走的;也就是说体答案增多主要是依赖于答案总体增加的速率不断增大。
就说到这儿吧,总结一下:
体在中的比例并没有我们想象的高,以为名命名稍有偏颇,这一现象的出现可能可以由heckman selection model解释,这一部分的实证研究暂时还没有做;
体的答案越来越多,但实际上在总答案中的比例并未增加,而是近乎随机游走的。
声明一下:
关于向量机核函数形式,是根据westin(1983)中所提到的对通常文本类型的分割方式改进而来,具体缘由可参见参考文献;
集齐百赞再来更新基于heckman selection model,是否可以解释:为什么体并没有占据大量回答,但我们观测到体的大比例出现。
利益相关:偶尔使用体答题的装逼用户。
============2015-6-2更新===========
回答评论区几个问题:
核函数是否合理?
在声明中已经说过了,核函数是根据westin(1983)中所提到的对通常文本类型的分割方式改进而来,具体缘由可参见参考文献;
“体答案增多主要是依赖于答案总体增加的速率不断增大”是否存在因果倒置?是不是因为体答案作为高质量回答引发大家对的关注而引发总体答案增加? 真正的因果关系,我们确实不能通过计量的方式得到,而这种真正的因果在大卫·休谟那里也认为是不可能通过经验事实得到的。
不过我们还是可以用格兰杰因果检验,但只能确定格兰杰因果关系,我的方式是体答案去趋势后对答案去趋势滞后一阶回归,结果是显著的(t值为4.36),这里就不贴stata截图了,如果要数据可以私信我
================================
===========百赞更新==============
在之前的模型中主要有这样一个问题:我们随机抓取的样本会不会存在选择偏误?
答案是可能的,因为在我们实际抽取中,虽然是随机的,但是是依据随机出现在动态页面中的问题得到的。而出现在动态页面中的问题出现频率本身和赞同数是有关的:对于赞同数、收藏数为0且答主没有任何关注的答案,是不会被抓取到的。
不过用heckman selection model 可以解决这个问题:
原来的回归方程不变:
加入selection condition:
用probit模型:
最终得出的结论稍稍变化(比例变为了21.1%),但是大体结论不变,这里就不细讲了。
=============================
再友情打个广告,提了一个问题,但到现在都没有人回答,希望艺术方面爱好&研究者的解答:
参考文献:
B. E. Boser, I. M. Guyon, and V. N. Vapnik. A training algorithm for optimal margin classifiers. In D. Haussler, editor, 5th Annual ACM Workshop on COLT, pages 144-152, Pittsburgh, PA, 1992. ACM Press.Corinna Cortes and V. Vapnik, "Support-Vector Networks, Machine Learning, 20, 1995. Christopher J. C. Burges. "A Tutorial on Support Vector Machines for Pattern Recognition". Data Mining and Knowledge Discovery 2:121 - 167, 1998 (Also available at : )Nello Cristianini and John Shawe-Taylor. An Introduction to Support Vector Machines and other kernel-based learning methods. Cambridge University Press, 2000. ( SVM Book)Harris Drucker, Chris J.C. Burges, Linda Kaufman, Alex Smola and Vladimir Vapnik (1997). "Support Vector Regression Machines". Advances in Neural Information Processing Systems 9, NIPS 1996, 155-161, MIT Press.Huang T.-M., Kecman V., Kopriva I.(2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 pp. 96 illus., Hardcover, Vojislav Kecman: "Learning and Soft Computing - Support Vector Machines, Neural Networks, Fuzzy Logic Systems", The MIT Press, Cambridge, MA, 2001.Tapio Pahikkala, Sampo Pyysalo, Jorma Boberg, Aleksandr Mylläri and Tapio Salakoski. Improving the Performance of Bayesian and Support Vector Classifiers in Word Sense Disambiguation using Positional Information. In Proceedings of the International and Interdisciplinary Conference on Adaptive Knowledge Representation and Reasoning(AKRR'05), Jun 2005.Bernhard Schölkopf and A. J. Smola: Learning with Kernels. MIT Press, Cambridge, MA, 2002. (Partly available on line: .)Bernhard Schölkopf, Christopher J.C. Burges, and Alexander J. Smola (editors). "Advances in Kernel Methods: Support Vector Learning". MIT Press, Cambridge, MA, 1999. . John Shawe-Taylor and Nello Cristianini. Kernel Methods for Pattern Analysis. Cambridge University Press, 2004. ( Kernel Methods Book)P.J. Tan and (2004), , Lecture Notes in Artificial Intelligence (LNAI) 3339, Springer-Verlag, . Links require password.(This paper uses ()and actually incorporates probabilistic support vector machines in the leaves of s.)Vladimir Vapnik. The Nature of Statistical Learning Theory. Springer-Verlag, 1999. Chien-Yi Wang, "The fusion of support vector machine and Multi-layer Fuzzy Neural Network". Machine Learning, Jun, 2012.
涉及数据部分纯属瞎扯,涉及文献部分纯属瞎编,只是为了表明,作为回答的体,就是这样。
回答评论区几个问题也纯属胡诌,因为,评论区,根本没有问题~
以及本文中使用的向量机和heckman二阶段方法,请初学者不要模仿,因为,
都是误用,都是误用,都是误用。
重要的事情说三遍。
以及转载声明来自于评论区和我一样逗比的知友提醒,嗯,感觉也应该算在体大V系列中,实际上,本,文,随,意,转,载。
重要的事情加逗号。
哦还有一句算半个体:求赞求粉求关注ღ(๑╯◡╰๑ღ)
装逼结束,赶紧溜。
等下,还缺一句,
以上。
更多阅读
转载 彭程:寻常日子里的富足——读惠特曼《典型的日子》
原文地址:彭程:寻常日子里的富足——读惠特曼《典型的日子》作者:马永波彭程:寻常日子里的富足——读惠特曼《典型的日子》 2010-11-28 | 北京日报 |说起惠特曼,眼前经常会浮现出一条奔腾不息、一泻千里的大河的画面——诗集《草叶集》
长智齿牙疼怎么办--装假牙后的饮食 智齿牙疼怎么办
【长智齿牙疼怎么办--装假牙后的饮食】智齿疼先分虚实,再对症下药长智齿,有时候也会很痛,有的人就想把它拔掉,其实,从中国人传统的观念来看,智齿是没必要去拔的。长智齿为什么会痛呢?是因为智齿穿破牙床往外生长,容易感染,是身体的薄弱环节
知否知否应是绿肥红瘦 论以貌取人的下场
知否 知否 应是绿肥红瘦文/筇竹 2007.04.10.桃红柳绿、莺飞草长的阳春时节,辽阔的洞庭湖平原一派春意盎然。汽車奔驰在平坦的水泥路上,好似在山水画里穿行。打开车窗,但见田原风光次第展开,車外暖风拂面而来,两边杨柳婆娑起舞,田间野
"致良知"和“知行合一”是什么意思? 知行合一什么意思
"致良知"和“知行合一”是什么意思?致良知中国明代王守仁的心学主旨。语出《孟子· 尽心上》 :“ 人之所不学而能者 ,其良能也 , 所不虑而知者,其良知也。”《大学》有“致知在格物”语。王守仁认为,“致知”就是致吾心内在的良知。这里所
什么是市场定位理论 典型的代用货币是什么
定位理论2900目录1什么是市场定位理论2定位理论产生的背景[2]3市场定位理论的内容4定位的前提5定位的方法6市场定位理论四个阶段[3]1.什么是市场定位理论市场定位理论是市场经济的基本理论。市场定位理论最初是由美国著名营销专家艾