超級筍工?︱AI訓練師文科都歡迎 月薪有¥「?」萬最多出16個月糧
發佈時間:18:55 2025-05-04 HKT

AI浪潮來勢洶洶,令許多傳統精英也感受到被取的壓力。不過,AI發展也帶來新「職」機,有專門「馴化」大模型的訓練師崗位,月薪可達4萬人民幣,最多出16個月糧,就算文科出身,同樣有機會獲聘。
小紅書16個月糧搶人才
據《財經天下》報道,研究生剛畢業的萬玉磊2023年初觀察到AI潮流勢不可當,放棄了某互聯網大廠OCR(圖片文字識別)工程師的offer,以提示詞工程師的身份,加盟了一家多模態大模型初創公司。他的任務是訓練AI,讓它更加聰明,不斷提升和人類對話的能力。
相關新聞:廣東首季度GDP僅增4.1%不達標 浙江DeepSeek助力增6%超額完成
智聯招聘數據顯示,今年2月,算法工程師、機器學習、深度學習等崗位招聘量同比大幅增加。其中,承擔「AI訓練」的數據標注崗位,招聘需求同比增長超50%,平均招聘月薪也突破了2萬元。

報道指,近期不少大廠特別為「AI訓練師」開出高薪。如字節跳動給AI訓練崗開出了月薪2萬~4萬元、年薪15個月;小紅書也對「AI標注產品」崗開出了2萬~4萬元、16薪的標準。
報道指,「有良好產品意識、瞭解模型訓練」是這些崗位的基本要求,更令不少求職者心動的是,其中不少大廠職位還對文科生相當友好,不同專業背景都可入行。
「AI訓練師」雖成為職場新貴,但從業員也不是「躺平」收錢,需要與AI和使用者鬥智鬥力。萬玉磊指,「AI訓練師」就像訓練貓抓老鼠,需要不斷試探模型的觸發機制。
訓練師需具持續學習能力
他指,2023年前後,提示詞與大模型的碰撞還充滿「神秘」色彩。萬玉磊團隊曾嘗試通過「情緒激勵」的方式,提升模型表現。「給予大模型小費獎勵」,或者讓工程師扮演「殘障程序員」等人格化設定,竟能讓模型輸出質量大幅提升。
隨著DeepSeek-R1等長序列推理模型問世,思維鏈(Chain-of-Thought)技術普及讓強化學習技術飛速突破,給大模型投餵簡單「咒語」的方法逐漸失效。
相關新聞:美國據報擬禁DeepSeek購本國技術 質疑其6萬輝達晶片來源
「我們現在已經在用母提示詞(預先設計好的、可重複使用的提示詞框架)生成上千條候選指令,通過自動評估系統篩選出最優解。」萬玉磊介紹道。
萬玉磊觀察,不少頭部企業確實正在以人民幣百萬年薪爭奪提示詞優化專家,數據策略崗需求激增。據其透露,字節在瘋狂招各個領域的博士生來幫他們調數據;小紅書則嘗試組建「藝術+代碼」的跨學科人才團隊,試圖更好地解決圖文生成的審美瓶頸。
此外,面對數億用戶千奇百怪的提問,萬玉磊曾因用戶需求「過度發散」而苦惱不已。「C端的用戶場景不明確,你也不知道他到底要什麼,這種提示詞做起來就會很難。」他苦笑道。
萬玉磊強調,當下能勝任AI訓練的人,持續學習的能力是核心門檻。