交叉驗證

對統計,機器學習,數據分析,數據挖掘和數據可視化感興趣的人員進行問答

31
什麼是標準偏差?
什麼是標準偏差,如何計算以及在統計中的用途?...
 

7
非均勻泊松和重尾間到達時間分佈
非均勻泊松過程與到達間隔時間較長的尾巴分佈較大的過程之間有什麼關係?任何能夠闡明該問題的資源的指針都將受到讚賞...
   

4
當分析師繪製不同的,記錄的時間序列時,分析師在尋找什麼?
因此在R中,例如:my_ts_logged_diffed = diff(log(some_ts_object)) plot(my_ts_logged_diffed) 這似乎是每個經驗豐富的分析師/預報員分析工作流程的一部分-特別是對繪製的數據進行視覺檢查。他們正在尋找什麼-即,這種轉換有助於揭示哪些有用...
  

8
自動化"文本"和"數據"之間的統計關聯
我正在收集有關某些公司的產品和性能的新聞稿,博客文章,評論等的文本數據。具體來說,我正在查看這種 文本 內容的某些類型和/或來源與公司股票代碼的市場估值之間是否存在相關性。這種表觀相關性可以很快地被人的大...
   

10
匯總時間序列以使其看起來更有意義是否有效?
另一個有關我的時間序列的問題。我有一個數據集,可以提供三年內精神病醫院暴力事件的每日記錄。在上一個問題的幫助下,我一直在擺弄它,現在對此感到高興。我現在所擁有的是每日系列非常嘈雜。它從0時到20時上下波動...
  

55
數理統計視頻
以前有一個問題尋求關於textbooks on mathematical statistics的建議有人知道關於數學統計的任何在線視頻講座嗎?我找到的最接近的是: Machine Learning Econometrics 更新:下面提到的許多建議都是統計良好的101型視頻。但是,我特別想知...
  

20
始終報告魯棒(白色)標準錯誤?
Angrist和Pischke已建議將穩健性(即對異方差性或不等方差具有魯棒性)報告為標準誤差,這是理所當然的,而不是對其進行測試。兩個問題:存在同方差對標準誤差有何影響?有人真的在工作中這樣做嗎?...
    

40
準備地塊時應遵循哪些最佳實踐?
在準備地塊時,我通常會做出自己獨特的選擇。但是,我想知道是否有用於生成圖的最佳實踐。注意:對此question的答案的Rob's comment在這裡非常相關。...
  

50
有什麼好的算法可以估算巨大的一次讀取數據集的中位數?
我正在尋找一種好的算法(意味著最少的計算,最少的存儲需求)來估計太大而無法存儲的數據集的中值,因此每個值只能被讀取一次(除非您明確存儲了該值)值)。可以假設的數據沒有界限。只要精確度已知,近似值就可以...
    

11
檢驗三位一體的可能性最大:面對矛盾的結論該怎麼辦?
在最大似然估計的上下文中,Wald,似然比和拉格朗日乘數檢驗在漸近上是等價的。但是,對於小樣本,它們往往會有很大的差異,在某些情況下,它們會得出不同的結論。如何根據拒絕空值的可能性對它們進行排名?如果測試...
  


10
Web可視化庫
有什麼好的在線可視化庫?它們易於使用並且有好的文檔嗎?...
  

79
什麼是"隨機變量"?
說 隨機變量 是什麼意思?...
    

33
文字的統計分類
我是一位沒有統計背景的程序員,並且我目前正在為大量不同的文檔尋找不同的分類方法,這些文檔需要分類為預定義的類別。我一直在閱讀有關kNN,SVM和NN的文章。但是,我在入門時遇到了一些麻煩。您推薦什麼資源?我確實...
   

9
解釋數據可視化
您將如何解釋數據可視化以及為什麼它對外行很重要?...
  

100
查找免費可用的數據樣本
我一直在研究一種用於分析和解析數據集的新方法,以識別和隔離總體中的子組,而無需預知任何子組的特徵。儘管該方法對於人工數據樣本(即專門用於識別和隔離總體子集的數據集)足夠有效,但我想嘗試使用實時數據對其...
    

33
什麼是正常現象?
在許多不同的統計方法中,都有一個 正常性假設 。什麼是 正常 ,我怎麼知道是否存在正常?...
  

Next page