2016-08-09 22:02:43
其實,還想再談談Prosecutor Fallacy 的一點.
有的時候會下意識的說,【如果要是另外一個人幹的這件事情,那麼這個證據就幾乎不可能在這兒瞭】於是乎給出瞭P(Evidence Innocense)的概率(比如說是1/n),於是乎說這個人無罪的可能性是1/n。
這是一個常見的錯誤,錯誤在我們要證明的是Innocense,要找的應該是P(Innocense Evidence),而並不是倒過來。這倆個概率很有可能會是不一樣的,熟悉貝葉斯的朋友就知道。
在生活中其實更會遇到這種情況,其實換一種思路往往能更容易較為全面地鎮定地思考。
比如說有人可能得知自己的男朋友去跟別的女生去音樂節,會很生氣,覺得如果他要是愛自己應該不會去跟別的女生去音樂節,於是就糾結起來。這就是常見的尋找瞭 P(男朋友跟別的女生看音樂節|男朋友愛自己)的概率。不如反過來想,想想 P(男朋友愛自己|男朋友跟別的女生看音樂節),這樣你就更容易地聯想到你的男性朋友也約過你看音樂節,雖然他也很愛他的老婆。就更容易地聯想到可能是你們倆音樂喜好類型不相投,你喜歡搖滾,他喜歡小清新。
再舉個更廣義的例子來講,比如一傢公司現在要執行兩個決策的其中一個,調查瞭先前其他相似的公司的決策,我們可能繪制出來下表
決策X 決策Y
成功 a b
失敗 c d
我們往往可能會這樣講,成功的幾傢公司裡有a傢做瞭決策X,b傢做瞭決策Y,做決策Y的人大於做決策X的人很多(i.e. b/(a+b) 很大),所以我們應該做決策Y。
這樣的描述口頭討論的情況下可能更多,而且也更具有迷惑性。人們往往不去尋找失敗的資料,從而單獨拿a,b來說事情。試想,如果我要跟你說,成功的公司裡有90%都做瞭這個決策而沒有做那個,你是不是就心動瞭?
上述其實找的是P(決策X|成功),P(決策Y|成功)。而我們要找的應該是P(成功|決策X)以及P(成功|決策Y),正確的做法應該是在做瞭決策X公司裡尋找多少成功(a/(a+c))。在做瞭決策Y的公司裡尋找多少成功(b/(b+d))。成功的公司做決策X少,可能隻是做決策X的公司少(不論成功與失敗)而已。相比較之下,如果c遠遠小於d,我們應該更傾向於做決策
失敗的(c與d)總是容易被忽略的,其實他們是非常重要的。
七.莫陽(一個移動互聯網)
讀博士時候是學微電子的,導師是個意大利人,很牛,隻發瞭幾篇文章就拿到瞭教授(與國內是反差啊,霍金也不過發瞭一篇文章,隻不過那篇被譽為70年以來最牛的文章)。
剛開始是讀博選題階段,一次Group喝茶,我趁機問他,老師,您看選什麼題比較好。潛臺詞是“選啥比較好畢業”。他卻說,你不如去研究一下晶體管吧。我一臉苦相說,“晶體管從發明到現在,多少博士教授研究過瞭,Paper都上十萬瞭,我不認為還有什麼可以突破瞭”。導師突然很生氣的當著眾人的面批評到:“你這樣是最不可取的學術態度,你以為我們什麼都搞懂瞭嗎?”
後來我就真的去研究瞭晶體管,運氣不錯,找到一點可研究的東西。論文答辯的時候,裁判教授最後合上我的論文,說,“你這個研究值得發表”。那個內牛滿面啊!
有時候,做研究,不用去刻意追新追奇,可能精彩的就在我們所認為最熟知的地方。
八.孫文亮(筆下雖有千言,胸中實無一策)
數學和計算機編程裡經常用到一種方法叫做分治法。
分治法的設計思想是,將一個難以直接解決的大問題,分割成一些規模較小的相同問題,以便各個擊破,分而治之。
遇到復雜的數學難題,就往往采用延伸、分解的思路,把一個復雜難題分解成為各種小的證明或計算,然後逐一攻克。常見的例如不定積分求解,往往利用分部積分法分解,逐項求解。
計算機排序算法中,分治排序如快速排序、歸並排序也都是非常高效、有用的排序算法。其中的分治思想就是把大的排序問題分散成小的排序。