數據科學

針對數據科學專業人員,機器學習專家以及有興趣進一步了解該領域的人員的問答


2
卷積結構之間的差異
我很難理解差異是什麼多頻道CNN:在標題為 用於任務誘發的fMRI數據分類的多通道2D卷積神經網絡模型 (https://www.hindawi.com/journals/cin/2019/5065214/#sec2.1)的論文中,圖1是多通道CNN,其中的作者使用通道來代表輸入圖像類型。圖像是...
    

2
在龐大的數據集上訓練CNN
我正在嘗試在RVL-CDIP Dataset上訓練AlexNet圖像模型。該數據集包括320,000個訓練圖像,40,000個驗證圖像和40,000個測試圖像。由於數據集很大,因此我開始對訓練集中的500個(每個班級)樣本進行訓練。結果如下: 從上圖我們可以看...
    

3
使用任意數字進行標籤編碼是否有用嗎?
根據我在網上閱讀的內容,關於分類法和使用的術語似乎有些困惑,因此為了避免誤解,我將在此處進行定義: 標籤編碼-使用任意數字標籤對名義變量進行編碼。 序數編碼-使用按特定順序排列的數字標籤編碼序數變量。我目...
    

1
GridSearchCrossValidation得分和測試集得分之間有什麼區別?
我正在使用python進行分類。我正在使用類GridSearchCV,該類的屬性best_score_定義為 best_estimator的均值交叉驗證得分 。通過此類,我還可以使用score計算出測試集的分數。現在,我了解了兩個值之間的理論差異(一個值是在交叉驗證...
     

1
如果模型性能不佳,邏輯回歸就不會收斂
我有一個多類分類邏輯回歸模型。我使用一個非常基本的sklearn管道來獲取對象的純文本描述,並將該對象分類為一個類別。logreg = Pipeline([('vect', CountVectorizer()), ('tfidf', TfidfTransformer()), ('clf', LogisticRegression(n_jobs=1, C=cVa...
    

1
數學:梯度下降的導數結果可以僅包含一個值嗎?
我有一個使用梯度下降公式的任務問題: 使用步長為0.1 和初始值為[1],對下面給出的函數進行梯度下降的兩步,1] 我只得到導數 0.4x1 的結果,因為x2不存在。這是正確的還是導數的結果應該為(0.4,0)?注意:對不起,如果...
   


1
支持向量機的軟裕度:求解對偶形式
我目前正在努力尋找 $ \ alpha_k $ 的分析解決方案。我得出了以下約束優化問題: $$L = \ sum_ {i = 1} ^ {N} \ alpha_i-\ frac {1} {2} \ sum_ {i = 1} ^ {N} \ sum_ {j = 1} ^ {N} \ alpha_i \ alpha_jy_i y_j(\ textbf {x} _j ^ T \ textbf {x})$$ $$s.t.\ quad 0 \ leq \ alpha_i \ ...
  

0
我們如何獲得係數並在Logistic回歸中進行攔截?
我正在使用Codecademy來學習邏輯回歸,因此我對這個主題的理解有些空白。import numpy as np hours_studied = np.array([[ 0],[ 1],[ 2],[ 3],[ 4],[ 5],[ 6],[ 7],[ 8],[ 9],[10],[11],[12],[13],[14],[15],[16],[17],[18],[19]]) calculated_coefficients = np.array([[0.20678491]]) inte...
 

0
Kaggle筆記本電腦與Google Colab
Kaggle筆記本和Google Colab筆記本之間的主要區別是什麼?要處理數據集,我的第一步是啟動Kaggle筆記本,但是我不禁思考使用Colab筆記本有什麼好處。我知道一些區別,如果我對任何錯誤有誤,請糾正我: Kaggle有一個控制台,而Co...
    

0
聚類與分類
對此我有點陌生,但是我只是對聚類與分類有一個簡單的問題。我有一堆要分類的文字。我目前有4個班級,但是文本可以屬於多個班級。到目前為止,我看到的是進行4種二進制分類,但是我想知道是否有一種分類算法可以實現...
   

0
蒙特卡洛用於非臨時性任務
在薩頓的教科書(第5章)中,它說: 為了確保有明確定義的收益可用,在這裡,我們僅為情景任務定義蒙特卡洛方法 。有人可以解釋強化學習中蒙特卡洛方法的非臨時性任務到底會造成什麼破壞嗎?...
  


1
AdaBoost.R2某些步驟的說明
我試圖理解AdaBoost.R2以便實施它並將其應用於回歸問題。在這種情況下,我需要完全理解它,但是我實際上並沒有採取一些措施。本文在此處,而Adaboost.R2在第3節中介紹:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.31.314&rep=rep1...
   

0
堆疊的CNN層如何工作?
互聯網上滿是這樣的圖片: 但是當前一層已經提取特徵時,第二/第三/等CNN層如何能夠提取特徵?例如,圖片中的中級功能具有鼻子。當我們應用 鼻子 過濾器時,輸出特徵圖將是一張沒有鼻子的圖像,對嗎?然後,此特徵圖將...
   

0
使用Python進行預測
我的訓練觀察很少(15)。我需要預測未來的6個月。哪種預測模型最適合這種情況?這是我的數據集的樣子月|響應率|%推動者|%反對者|%中性 2019-01-01 |5%| 60%| 30%|10% 2019-02-01 ..... 2020-07-01 我需要預測響應率,發起人百分...
   

0
如何在sklearn的FeatureHasher中選擇n_features?
我應該如何在sklearn的FeatureHasher中選擇n_features?假設我在功能 案例 中有1000個類別,並且我想對它們進行哈希處理...
     

3
如何對具有分類和數字特徵的數據集進行特徵選擇?
我正在處理一個包含30列(29個數字,1個非常規分類)的數據集。我對分類功能進行了熱編碼,並達到了35列。為了提高訓練效率,我想對數據集進行特徵選擇。但是,我對如何處理結合了分類和數字特徵的數據集感到困惑。我...
   

1
圖層權重在keras中不匹配
此問題使用以下代碼:Xtrain = np.random.rand(400,1) ytrain = f(Xtrain) Xval = np.random.rand(200,1) yval = f(Xval) model = tf.keras.models.Sequential([ tf.keras.layers.Dense(10, activation='relu'), #tf.keras.layers.Dense(10, activation='relu'), tf.keras.layers.Dense(1, activation='re...
  

Next page