近幾年,騰訊優圖不斷迭代數據和模型缺陷情況下神經網絡的有效訓練方法,相關技術已經在眾多業務場景上(行人重識別,內容審核等)落地。本文整理自騰訊優圖、騰訊云大學、AICUG和AI科技評論聯合主辦的「優Tech沙龍」,分享嘉賓為騰訊優圖實驗室高級研究員Louis。
01 定義帶噪學習目標
現實數據中存在的標簽噪音(label noise)根據Feature可以分成兩種:Feature independent noise和 Feature dependent noise。Feature independent noise是與特征無關的,比如將一只狗的圖片誤標記成汽車,狗和汽車沒有什么相似特征,所以屬于這類。Feature independent noise是與特征有關的,比如說狗和狼具有很多相似特征屬性,標注人員可能把狗誤標記成狼,那就屬于這類。其實現實場景更多存在都是feature dependent noise。
噪音普遍存在,所以我們需要訓練神經網絡進行帶噪學習,并且要能實現比較好的性能。那么noise label learning的目標是設計一個loss function,使得在noisy labels下訓練得到的解,在性能上接近在clean labels下訓練得到的解。
資料獲取 | |
新聞資訊 | |
== 資訊 == | |
» 人形機器人未來3-5年能夠實現產業化的方 | |
» 導診服務機器人上崗門診大廳 助力醫院智慧 | |
» 山東省青島市政府辦公廳發布《數字青島20 | |
» 關于印發《青海省支持大數據產業發展政策措 | |
» 全屋無主燈智能化規范 | |
» 微波雷達傳感技術室內照明應用規范 | |
» 人工智能研發運營體系(ML0ps)實踐指 | |
» 四驅四轉移動機器人運動模型及應用分析 | |
» 國內細分賽道企業在 AIGC 各應用場景 | |
» 國內科技大廠布局生成式 AI,未來有望借 | |
» AIGC領域相關初創公司及業務場景梳理 | |
» ChatGPT 以 GPT+RLHF 模 | |
» AIGC提升文字 圖片滲透率,視頻 直播 | |
» AI商業化空間前景廣闊應用場景豐富 | |
» AI 內容創作成本大幅降低且耗時更短 優 | |
== 機器人推薦 == | |
服務機器人(迎賓、講解、導診...) |
|
智能消毒機器人 |
|
機器人底盤 |