交叉驗證

對統計,機器學習,數據分析,數據挖掘和數據可視化感興趣的人員進行問答



6
為什麼Bengio,Goodfellow和Courville深度學習理論書聲稱$ \ hat {y} = x w_1 ... w_i ... w_l $是$ w_i $的非線性函數?
在chapter 8第8.7.1節中,它試圖解釋批處理規範化。在該部分的第二段中,它告訴我們考慮簡單的示例: $$ \ hat {y} = x w_1 ... w_i ... w_l $$ 然後聲明: The output $\hat y$ is a linear function of the input x, but a nonlinear function of the weights $w_i$. ...
    

12
漸近無偏與一致性之間有什麼區別?
彼此暗示嗎?如果不是,是否意味著另一個?為什麼/為什麼不呢?出現此問題是為了回應我對here發布的答案的評論。儘管google搜索相關術語並沒有產生看起來特別有用的東西,但我確實注意到數學stackexchange上的an answer。但是,...
     


1
擬合非線性回歸$ Y = 1-a ^ {-bx} $
我有以下數據集: 其中X:Y 1:0.81 2:0.86 4:0.9 6:0.93 8:0.96 10:0.98 12:0.99 14:0.99 16:1 18:1 20:1 ..:1 由於大X的回歸函數的限制應為1,因此我認為適當的回歸應採用$ Y = 1-a ^ {-bx} $的形式。但是,我很難獲得它。任何想法將不勝感激。注意:函...
     

3
如何比較兩個貝葉斯模型中相同參數的後驗樣本?
我運行了2個貝葉斯回歸模型,並想比較兩個模型共有的參數的後驗樣本。例如,如果模型A為 $ y = \ alpha + \ beta_1x_1 $ 並且模型B是 $ y = \ alpha + \ beta_1x_1 + \ beta_2x_2 $ (這只是模型之間差異的示例,其他差異可能是使用的先驗條件...
    

3
在帶有連續變量的R中使用樸素貝葉斯分類器
我正在嘗試使用數據包中的Naive Bayes分類器,使用主要由連續變量(例如受教育年限,薪水等)組成的數據集來預測類別變量(工作類型,共有三個類別)klaR'。現在的問題是,如果我使用連續變量來訓練Naive Bayes分類器,那麼對...
   

5
小數部分的不確定性
$ N / M $的不確定性(置信度為68%)是多少,其中$ N $是通過切割的條目數,$ M $是條目的總數?($ N $和$ M $都是整數,我對$ N $或$ M-N $是一個小的整數,可能為零的極端值感興趣)。過去,我一直假設Binomial model,其中$ N $是正...
   

0
k表示較大文本字段的聚類
我是數據科學/機器學習的初學者,正嘗試自己解決一些問題我在由 任務陳述 組成的數據集上運行K-均值聚類。這些內容的長度可能介於1-3個段落之間。我想運行一個K-均值算法,嘗試對任務陳述而不是特定的單詞進行分組我正...
    



0
時間序列建模[與建模殘差有關的問題]
我正在做銷售預測。我為時間序列數據手動找到了趨勢和季節性。根據趨勢和季節性回歸時間序列數據,並找到殘差。殘差不具有自相關(這是預期的嗎?)。驗證了ACF和PACF圖,未發現任何顯著變量。什麼模型適合此類殘差數...
   

0
使用glmm中的固定效果進行預測
我有以下通用的線性混合效果模型(R中的mcmcglmm),數據基於this paper。Sex是一個二級因子(M或F),Group是一個二級因子(LL,LO),Mort是一個連續的解釋變量,Life是一個連續的響應。 我想知道的是如何從模型中估計性別和群體...
    


2
R:Box.test vs adf.test vs kpss.test
我堅持通過幾次測試來檢查我的時間序列的平穩性:Box.test(ts, lag = 20, type= Ljung ) adf.test(ts) kpss.test(ts,null= Trend ) kpss.test(diff(ts),null= Trend ) 輸出:Box-Ljung test p-value < 2.2e-16 Augmented Dickey-Fuller Test p-value = 0.4301 KPSS Test for Trend Stationari...
    

1
單純形子集上的概率分佈
我想在單形子集上定義概率分佈。例如,在3-simplex上,我們知道$ x_1 + x_2 + x_3 + x_4 = 1 $和$ X \ sim Dirichlet $。是否可以進一步限制$ X $(例如$ x_1 + x_2 = 0.5 $)?如果可能,怎麼辦?如果不是,該怎麼做才能將約束應用​​於支撐? ...
  

5
Y感知二進制PCA的外觀如何?
我最近偶然發現了支持Y的PCA in the blog of win-vector。它們描述瞭如何調整PCA而不是解釋$ X $的變化,而是解釋$ X $和$ Y $的協變。這對於$ Y $連續的情況進行了說明。在$ Y $是二進制的情況下,該怎麼辦?偏最小二乘(PLS)的功能非...
    

0
新數據的標準化和預測
據我所知,通常的做法是在收縮或PCA之前對變量進行標準化,這是我打算在預測模型的模型選擇中使用的方法。但是問題是,如何在將來的數據上使用標準化係數的模型。我是否只是簡單地假設將來的數據與我當前的數據具有相...
   

1
kNN i.i.d的距離是多少?
想像一組i.i.d觀測值$ D = \ {x_i \} _ {i = 1} ^ N \ subset X ^ n $。讓距離函數$ d \冒號X ^ n \時間X ^ n \ rightarrow \ mathbb {R} $用於查找與查詢$ x_q $最接近的$ k $鄰居。結果,我們的距離為$ d_1,\ dots,d_k $。我的問題實際上分為兩部分: 1)估...
    

Next page