人工智能

對於在純數字環境下可以模仿"認知"功能的世界中對生活和挑戰的概念性問題感興趣的人進行的問答

0
當我們有Q學習更新規則時,強化學習中的神經網絡的目的是什麼?
對於為增強學習(RL)任務(例如Gridworld)而訓練神經網絡(NN)的目的感到困惑。在RL任務(即q學習)中,我們有一個q學習更新規則,該規則旨在獲取一些狀態和動作併計算該狀態動作對的值。多次執行此過程將最終產生一張...
     

0
有沒有辦法讓神經網絡自動學習地標特徵?
是否有一種方法可以使神經網絡自動學習地標特徵,而不必在要饋入網絡的圖像中手動預先標記它們?...
     

0
我可以在驗證集中使用增強數據嗎?
我正在嘗試使用移動加速度計數據來預測護理活動。我的數據集是一個CSV文件,其中包含加速的x,y,z分量。每幀包含20秒的數據。數據集非常不平衡,因此我執行數據擴充和平衡數據。在數據增強技術中,我僅使用縮放,並且...
   

0
我對反向傳播的理解正確嗎?
我正在嘗試學習反向傳播,這是到目前為止我所知道的。要更新神經網絡的權重,您必須使用鍊式規則找出損失函數上每個參數的偏導數。在列向量中列出所有這些偏導數,並且損失函數上具有當前參數的梯度向量。然後,通過...
     

0
批處理規範化實際上如何工作?
我實際上經歷了Keras的批處理規範化教程,那裡的描述使我更加困惑。以下是我最近閱讀的有關批處理規範化的一些事實,並希望對此進行深入的解釋。 如果將神經網絡的所有層凍結為它們的隨機初始化權重(批處理歸一化層除...
   

0
學習一定數量序列所需的LSTM層數
理論上,按照我的實踐,LSTM層的單位數是隱藏狀態數或序列的最大長度。例如,在Keras中:Lstm1 = LSTM(units=MAX_SEQ_LEN, return_sequences=False); 但是,要要訓練的許多序列,我應該添加更多的LSTM層嗎?因為增加MAX_SEQ_LEN並不可行,因為增...
     

1
可以將完全連接的層用於特徵檢測嗎?
我需要幫助來了解一些基本知識。 Andrew Ng說,在this video中,卷積層比完全連接(FC)層更好,因為它們使用較少的參數。但是我很難確定何時/可以將FC層用於哪些卷積層,特別是特徵檢測。我總是讀到FC層用於CNN的最終分類階段...
    


1
當我們深入到CNN(尺寸急劇減小)時,如何保留輸入內容?
當我們深入CNN時,特徵表示的長度會減少,我的意思是說,水平和垂直長度會減少,而深度(通道)會增加。那麼,如何保存輸入內容,因為在連接多層的網絡端(即多層感知器)上沒有剩餘數據了?...
   

0
為什麼在神經網絡中需要非線性?
為什麼在神經網絡中需要非線性?我在網絡上找不到令人滿意的答案。我通常會得到諸如 現實世界中的問題需要非線性的解決方案,這並非易事。因此,我們使用非線性激活函數來實現非線性 這樣的答案。...
   

3
在DQN中使用softmax而不是epsilon greedy選擇操作時會發生什麼?
我了解RL的兩個主要分支是Q-Learning和Policy Gradient方法。根據我的理解(如果我錯了,請糾正我),策略梯度方法具有內在的探索性,因為它使用概率分佈來選擇動作。另一方面,DQN使用 $ \ epsilon $ -貪婪策略進行探索。選擇最佳...
     

6
如何測量強化學習算法的樣本效率?
我想知道是否有任何度量標準可用於衡量強化學習算法的樣本效率?通過閱讀研究論文,我發現提出的模型具有更高的樣本效率,但是在比較強化學習算法時如何得出這一結論呢?...
  

0
失衡的數據會導致過擬合嗎?
我正在做人類活動識別項目。我總共有12節課。類分佈如下所示: $ \ color {red} {如果\您\注意\,您\就可以\看到\該\我\沒有\數據\點\該\類\11 \和\ class \ 8。} $ 此外,數據集高度不平衡。因此,我為所有類別都花了最少的數據點(...
   

1
根據《綜合梯度》論文,為什麼基線的預測應該接近零?
我試圖理解Intagrated Gradients,但難以理解作者的主張(在第3頁第3節中): For most deep networks, it is possible to choose a baseline such that the prediction at the baseline is near zero ($F(x') \approx 0$). (For image models, the black image baseline indeed satisfies this p...
   

1
在深度Q學習中,目標更新頻率和批量訓練頻率是否相關?
在深度Q學習算法中,我們每train_freq執行一次批量訓練,並且每target_update_freq更新目標網絡的參數。是否需要將train_freq和target_update_freq相關聯,例如,一個應始終大於另一個,還是必鬚根據問題對其進行獨立優化? 編輯,將batch...
  

2
如何在自動編碼器中具有相同的輸入和輸出形狀?
我正在構建一個去噪自動編碼器。我想要具有相同的輸入和輸出形狀圖像。這是我的體系結構:input_img = Input(shape=(IMG_HEIGHT, IMG_WIDTH, 1)) x = Conv2D(32, (3, 3), activation='relu', padding='same')(input_img) x = MaxPooling2D((2, 2), padding='same')(x) x = Con...
    

1
在特徵選擇方面,遺傳算法中的基因,染色體,種群是什麼意思?
我試圖從特徵選擇的角度理解遺傳算法,並使用機器學習算法提取這些特徵。假設我有3分鐘的心率數據,這些數據是從 $ 50 $ 受試者中收集的。從這3分鐘的心率中,我提取了 $ 5 $ 特徵,例如均值,標準差,方差,偏度和峰度。...
   

0
網絡的通道數是什麼意思?
當前,我正在閱讀Rethinking Model Scaling for Convolutional Neural Networks。作者正在討論通過同時縮放所有維度和相對於每個維度來縮放捲積神經網絡的另一種方式。我了解有關網絡深度(#層)和分辨率(輸入圖像的大小)的縮放方法...
 

2
如何處理DQN中不斷變化的目標?
我創建了一個虛擬2D環境,代理商旨在尋找與目標圖像相對應的正確姿勢。我實現了DQN以解決此任務。確定目標後,例如目的是找到位置(1,1)的姿勢,代理成功。我現在想訓練特工尋找正確的姿勢,而目標姿勢在每一集之後都...
  

1
我們為什麼不對輸出神經元使用三角函數?
我們為什麼不使用三角函數,例如 $ \ tan(x)$ ,其中 $ x$ 是間隔 $ [0,pi / 2)$ 的元素,而不是輸出神經元的S形函數(在分類的情況下))?...
   

Next page